해외 · 모델 아키텍처
구글 딥마인드, 첫 오픈웨이트 ‘확산형 텍스트 모델’ 디퓨전젬마 공개
구글 딥마인드(Google DeepMind)가 글자를 한 단어씩 차례로 쓰는 대신 ‘한꺼번에 펼쳐내는’ 방식의 새 언어모델 ‘디퓨전젬마(DiffusionGemma)’를 6월 10일 공개하였다. 가중치를 개방한 ‘오픈웨이트(open-weight)’ 모델로, 아파치 2.0 라이선스로 배포된다. 기존 ‘GPT 계열’의 자기회귀(autoregressive) 모델이 토큰(token·단어 조각)을 하나씩 순서대로 생성하는 데 비해, 디퓨전젬마는 영상 생성에 쓰이던 ‘확산(diffusion)’ 기법을 글에 적용해 ‘잡음 상태의 토큰 256개 묶음’을 병렬로 점진적으로 정제(denoise)하며 문장을 완성한다. ‘젬마(Gemma) 4’ 구조를 기반으로 한 260억(26B)급 ‘전문가 혼합(MoE)’ 모델로 총 252억 개 매개변수 중 단계당 약 38억 개만 활성화한다. 엔비디아 H100 한 장에서 초당 1000개 이상의 토큰을 생성해 동급 자기회귀 모델보다 최대 4배 빠르지만, 공개된 모든 벤치마크에서 표준 ‘젬마 4’보다는 점수가 낮다고 회사는 밝혔다.
기술적 의미
이번 공개의 핵심은, 대규모 언어모델의 ‘생성 방식’ 자체에 대한 대안을 ‘오픈웨이트’로 제시했다는 점이다. 거의 모든 주요 언어모델이 토큰을 한 개씩 순차 생성하는 자기회귀 방식을 따르는데, ‘확산형’은 여러 토큰을 병렬로 만들어 속도를 크게 끌어올린다. 속도가 4배 빨라지면 같은 하드웨어로 더 많은 사용자를 처리하거나 개인용 기기에서 빠른 추론이 가능해져, 본 호 ‘온디바이스 AI’ 흐름과도 맞닿는다. 다만 품질이 아직 표준 모델보다 낮다는 점은, ‘속도-정확도’의 맞바꿈이라는 한계를 보여 준다. 그럼에도 검증된 대안 아키텍처를 개방함으로써, 언어모델 연구의 방향을 넓혔다는 의의가 있다.
해외 · AI for Science
‘AI가 수학·물리 발견의 방식을 바꾼다’ — 증명 검증·반례 탐색의 자동화
인공지능(AI)이 수학과 물리학에서 ‘발견’이 이뤄지는 방식 자체를 바꾸고 있다는 분석이 학술지 ‘네이처(Nature)’ 특집으로 정리되었다. 핵심 논지는, 인공지능이 인간의 직관을 ‘대체’하는 것이 아니라 ‘질문을 던지고 탐색하고 이해하는’ 방식을 재구성하고 있다는 것이다. 오늘날의 소프트웨어는 수학적 증명을 한 줄씩 검증해 과거라면 몇 달이 걸렸을 오류를 잡아내고, 어떤 추측(가설)이 실제로 성립하는지 또는 예기치 않은 경우에서 무너지는지를 알아보기 위해 ‘반례(counterexample)’를 체계적으로 탐색할 수 있다. 구글 딥마인드의 인공지능 시스템은 국제수학올림피아드(IMO)에서 은메달 수준의 성적으로 난제를 풀어내는 등, 수학적 문제해결을 진전시키며 물리·공학 연구의 가속 가능성을 보여 주고 있다. 다만 인간의 창의성과 직관은 여전히 발견 과정의 핵심으로 남는다고 특집은 강조하였다.
기술적 의미
이번 정리의 핵심은, 인공지능이 단순한 ‘계산기’를 넘어 ‘발견을 돕는 협력자’로 자리 잡으면서, 가설 생성·검증·반례 탐색이라는 연구의 핵심 단계를 자동화하고 있다는 점이다. 증명을 자동으로 검증하고 방대한 경우의 수를 빠르게 훑는 능력은, 수학·이론물리처럼 ‘탐색 공간이 천문학적으로 넓은’ 분야에서 연구 속도를 비약적으로 끌어올린다. 본 호 컴퓨팅 섹션의 ‘오픈소스 GPU’, 그리고 다음 기사의 ‘전이학습’ 연구와 함께, 인공지능이 과학적 발견의 도구로 빠르게 내재화되고 있음을 보여 준다. 동시에 ‘직관은 인간의 몫’이라는 단서는, 인공지능과 연구자의 ‘역할 분담’이 새로운 과제로 떠오르고 있음을 시사한다.
해외 · 머신러닝 방법론
AI로 ‘새 물리’ 탐색 가속 — 그러나 ‘익숙한 패턴’ 과의존의 함정
인공지능(AI)이 우주에서 ‘새로운 물리’를 찾는 작업을 크게 앞당길 수 있지만, ‘익숙한 패턴’에 지나치게 기대면 오히려 진짜 새로운 발견을 놓칠 수 있다는 연구가 제시되었다. 연구진은 한 분야에서 학습한 모델을 다른 문제에 재활용하는 ‘전이학습(transfer learning)’ 기법을 입자물리 등 데이터 분석에 적용하면, 막대한 비용이 드는 시뮬레이션의 필요를 줄여 탐색 속도를 높일 수 있음을 보였다. 그러나 동시에, 인공지능이 학습 과정에서 익힌 ‘기존 이론의 패턴’에 과도하게 의존할 경우, 이론의 틀을 벗어나는 ‘진정으로 새로운 신호’를 무심코 지나칠 위험이 있다는 점도 함께 확인되었다. 효율을 높이는 바로 그 ‘사전 지식’이, 예상 밖의 발견 앞에서는 ‘색안경’이 될 수 있다는 역설이다.
기술적 의미
이번 연구의 핵심은, 과학에 인공지능을 도입할 때의 ‘속도’와 ‘발견의 개방성’ 사이의 긴장 관계를 정량적으로 드러냈다는 점이다. 전이학습은 적은 데이터·연산으로 높은 성능을 내는 강력한 도구이지만, ‘이미 아는 것’을 잘 맞히도록 최적화된 모델은 ‘아직 모르는 것’에 둔감할 수 있다. 이는 인공지능이 ‘새 물리’를 찾는 도구로 쓰일 때 반드시 ‘편향 점검’과 ‘이상 신호 보존’ 장치를 병행해야 함을 시사한다. 앞 기사(‘AI의 과학 발견’)가 인공지능의 ‘약속’을 보여 준다면, 이 연구는 그 ‘함정’을 경고한다. 두 연구는 ‘AI for Science’가 성능 못지않게 ‘신뢰성과 방법론적 엄밀성’을 요구하는 단계에 들어섰음을 함께 보여 준다.
해외 · 빅테크 · WWDC 2026
애플, ‘시리 AI’ 전면 개편 — 구글 ‘제미나이’ 품고 iOS 27 공개
애플(Apple)이 개발자대회 ‘WWDC 2026’에서 음성비서 ‘시리(Siri)’를 대대적으로 개편한 ‘시리 AI’를 공개하였다. 새 시리는 사용자의 개인 맥락과 화면 상황을 시스템 전반에서 깊이 이해하도록 재설계됐으며, 그 핵심 엔진으로 구글의 거대언어모델 ‘제미나이(Gemini)’를 채택한 것으로 전해졌다. 시리 AI는 기존처럼 여러 앱을 가로질러 작동하는 동시에 ‘독립 앱’으로도 제공되며, 더 자연스럽고 개인화된 음성과 사용자가 말 속도·표현을 조절할 수 있는 대화 경험을 제공한다. 아이폰의 모든 앱·데이터에 접근·연동하되 강력한 개인정보 보호 장치를 둔다. 애플은 이와 함께 운영체제 ‘iOS 27’ 등 차세대 OS와 ‘애플 인텔리전스(Apple Intelligence)’ 업데이트(사파리 탭 정리, 비밀번호 원터치 갱신, 앱 간 맥락 인식, 메시지 답장 제안, 통화 중 메일·메시지 맥락 활용 등)를 선보였다. 다만 시리 AI는 규제 문제로 유럽과 중국에서는 제공되지 않는다.
기술적 의미
이번 발표의 핵심은, ‘폐쇄적 자체 개발’을 고수해 온 애플이 음성비서의 두뇌로 ‘외부 모델(구글 제미나이)’을 채택하며 인공지능 경쟁에서 ‘실용적 협력’으로 선회했다는 점이다. 자체 인공지능 개발이 지연되는 사이, 애플은 검증된 외부 모델을 들여와 ‘기기 위의 비서’를 빠르게 고도화하는 길을 택했다. 시리 AI가 화면 맥락을 이해하고 앱·데이터를 넘나들며 ‘대신 일을 수행하는’ 방향은, 인공지능을 ‘대화 상대’에서 ‘일상의 대행자(에이전트)’로 끌어올리는 산업 흐름과 맞닿는다. 다만 외부 모델 의존은 장기적 종속·데이터 거버넌스 논란을, 유럽·중국 제외는 규제 환경에 따른 ‘기능 분절’의 과제를 남긴다.