IT·AI·컴퓨팅 데일리 — 2026년 6월 4일 (목)

2026년 6월 4일 목요일 제155호 · Vol. 2026 조간 · 기술정보 종합판

오늘의 헤드라인

AI 전선, ‘PC’와 ‘상장’으로 넓어지다 — 엔비디아 ‘RTX 스파크’가 윈도우를 다시 쓰고, 앤스로픽은 1조 달러 IPO 길에 오르다; 코딩·에이전트 모델은 3사 격돌

대만 컴퓨텍스 2026(COMPUTEX 2026)이 막바지에 접어들면서, 인공지능 경쟁의 전선이 데이터센터를 넘어 ‘개인용 컴퓨터(PC)’와 ‘자본시장’으로 동시에 확장되었다. 엔비디아(NVIDIA)는 윈도우 온 Arm(Windows on Arm) 플랫폼 ‘RTX 스파크(RTX Spark)’ 슈퍼칩을 공개하며 20코어 그레이스(Grace) 중앙처리장치(CPU)와 블랙웰(Blackwell) 그래픽처리장치(GPU), 128기가바이트(GB) 통합 메모리를 한 칩에 결합해 “윈도우를 에이전트형 인공지능 운영체제로 재정의하겠다”고 선언하였다. 같은 무대에서 AMD는 2나노급 ‘젠 6(Zen 6)’ 기반 서버 칩 ‘에픽 베니스(EPYC Venice)’와 인공지능 가속기 ‘인스팅트 MI400(Instinct MI400)’·랙 규모 시스템 ‘헬리오스(Helios)’의 2026년 출시 로드맵을 재확인하였고, SK하이닉스는 ‘HBM4’ 16단과 세계 최초의 ‘고대역폭 플래시(HBF)’ 등 차세대 메모리를 엔비디아 ‘베라 루빈(Vera Rubin) 200’ 플랫폼과 함께 전면에 배치하였다. 자본시장에서는 앤스로픽(Anthropic)이 9,650억 달러 가치평가를 토대로 비공개 기업공개(IPO) 신청서 초안(S-1)을 미국 증권거래위원회(SEC)에 제출하며 ‘1조 달러 상장’ 가도에 올랐고, 동시에 ‘서비스 트랙·파트너 허브’를 출범해 기업 시장 침투를 가속하였다. 국내에서는 젠슨 황(Jensen Huang) 엔비디아 최고경영자가 방한해 LG·네이버 등과 ‘피지컬 AI(Physical AI)’ 협력을 논의하며 로봇·자율주행 동맹을 구체화하였다. 인공지능 모델 경쟁은 ‘코딩과 에이전트’를 전장으로 한층 치열해져, 마이크로소프트(Microsoft)는 자체 추론·코딩 모델 ‘MAI-Thinking-1·MAI-Code-1-Flash’를, 구글(Google)은 ‘제미나이 3.5 플래시(Gemini 3.5 Flash)’를, 오픈AI(OpenAI)는 기본 모델 ‘GPT-5.5 인스턴트(Instant)’를 앞세워 정면으로 맞붙었다. 기초과학에서도 의미 있는 성과가 잇따랐다. 호주 ASKAP 전파망원경은 35분 주기로 반복되던 우주 신호의 정체를 ‘격변변광성(cataclysmic variable)’으로 규명하였고, 컬럼비아대학교 연구진은 면역 항암치료(CAR-T)의 효력을 떨어뜨리는 단백질 ‘NFIL3’를 찾아냈으며, 리게티(Rigetti)·리버레인(Riverlane)은 초전도 큐비트에서 ‘실시간 양자오류정정’을 실증하였다. 본 호에서는 ‘인공지능이 PC·자본·물리 세계로 외연을 넓힌 하루’를 네 개 영역으로 나누어 정리한다.

기초 과학 논문

Basic Sciences

천체물리 · ASKAP

35분 주기 ‘우주의 수수께끼 신호’ 정체 규명 — 백색왜성·적색왜성 ‘격변변광성’이었다

오스트레일리아 시드니대학교(University of Sydney) 주도의 국제 연구진이 수년간 천문학계를 곤혹스럽게 한 ‘장주기 전파 일시현상(long-period radio transient)’ 신호의 근원을 처음으로 규명하였다. 연구진은 오스트레일리아 연방과학산업연구기구(CSIRO)의 ASKAP 전파망원경으로 약 35분(1.4시간) 주기로 전파와 엑스선(X-ray)을 반복 방출하는 천체 ‘ASKAP J1745’를 추적하였고, 그 정체가 밀도 높은 백색왜성(white dwarf)이 인접한 적색왜성(red dwarf)으로부터 물질을 빨아들이는 쌍성계, 곧 ‘격변변광성(cataclysmic variable)’임을 확인하였다. 백색왜성으로 끌려 들어간 물질이 나선을 그리며 떨어질 때 두 별의 자기장과 강착열(降着熱)이 상호작용하면서 전파·엑스선 신호가 주기적으로 발생한다는 것이다. 이는 장주기 전파 일시현상으로는 처음 ‘격변변광성’으로 동정(同定)된 사례로, 연구진은 이 천체를 미지의 신호군을 해독할 ‘로제타석(Rosetta Stone)’에 비유하였다. 미국 노스캐롤라이나대학교(UNC-Chapel Hill) 연구진도 분석에 참여하였으며, 성과는 2026년 6월 초 학계에 공개되었다.

기술적 의미

수 분에서 수십 분에 이르는 ‘장주기’ 반복 신호는 기존의 펄서(pulsar) 이론으로는 설명되지 않아 그 정체가 오랜 난제였다. 이번 성과는 적어도 일부 장주기 신호가 ‘격변변광성’이라는 평범한 쌍성계에서 비롯될 수 있음을 보여, 미지의 천체를 외계 신호 등으로 과대 해석할 여지를 줄이고 관측 천문학의 분류 체계를 정교화한다. 다중 파장(전파·엑스선) 동시 관측이 천체의 물리적 기원을 가르는 결정적 단서가 된다는 점도 재확인되었다.

출처: ScienceDaily — A stellar “Rosetta stone” reveals the source of mysterious cosmic signals (2026-06-02) · UNC News — UNC-Chapel Hill astronomers help crack cosmic radio mystery

면역항암 · CAR-T

면역세포 ‘소진’의 범인은 단백질 ‘NFIL3’ — CAR-T 항암치료 지속력의 새 표적

미국 컬럼비아대학교(Columbia University)와 독일 튀빙겐대학병원(University Hospital Tübingen) 공동 연구진은 키메라항원수용체 T세포(CAR-T) 치료의 효력이 시간이 지나면서 떨어지는 핵심 원인으로 단백질 ‘NFIL3’를 지목하였다. CAR-T는 환자의 면역세포(T세포)를 유전적으로 조작해 암세포를 공격하도록 만든 치료법이지만, 조작된 세포가 점차 ‘소진(exhaustion)’ 상태에 빠져 항암 능력을 잃는 한계가 있었다. 연구진은 NFIL3가 이 소진을 촉발하는 분자 스위치임을 규명하고, 이 단백질의 기능을 차단(비활성화)하자 CAR-T 세포가 더 오래 활성을 유지하며 동물 모델에서 종양을 한층 효과적으로 제어함을 확인하였다. 이는 ‘세포가 왜 지치는가’라는 근본 기전을 분자 수준에서 짚어낸 것으로, 다만 동물 실험 단계의 결과로서 임상 적용에는 추가 검증이 필요하다.

기술적 의미

CAR-T는 혈액암에서 극적 효과를 보였으나 ‘지속력 부족’과 ‘고형암 적용의 한계’가 최대 과제로 남아 있었다. NFIL3라는 단일 표적을 제거해 세포의 항암 활성을 연장할 수 있다면, 재발을 줄이고 적용 범위를 넓히는 ‘차세대 CAR-T’ 설계의 새 경로가 열린다. 유전자 편집으로 면역세포를 ‘덜 지치게’ 개량하는 접근은 세포치료의 효능과 경제성을 동시에 끌어올릴 수 있다는 점에서 주목된다.

출처: ScienceDaily — A single protein may be holding back CAR T cancer therapy (2026-06-02)

양자컴퓨팅 · Nature Communications

초전도 큐비트서 ‘실시간’ 양자오류정정 실증 — FPGA 디코더로 라운드당 1μs 미만 달성

양자컴퓨팅 기업 리게티(Rigetti)와 영국 리버레인(Riverlane) 연구진은 초전도 큐비트 기반 양자컴퓨터에서 ‘실시간 양자오류정정(real-time quantum error correction)’을 실증한 결과를 학술지 ‘네이처 커뮤니케이션스(Nature Communications)’에 2026년 6월 1일 발표하였다. 연구진은 현장프로그래밍가능게이트어레이(FPGA)로 구현한 하드웨어 디코더(decoder)를 리게티의 8큐비트 ‘앙카-2(Ankaa-2)’ 장치 제어 시스템에 통합해, 한 정정 라운드당 평균 1마이크로초(μs) 미만의 복호 속도와 9.6μs의 전체 피드백 지연(latency)을 달성하였다. 특히 정정 결과에 따라 연산 경로를 바꾸는 ‘논리 분기(logical branching)’를 실시간으로 처리해, 측정→복호→정정의 폐회로(closed loop)를 큐비트의 짧은 수명 안에서 완결할 수 있음을 보였다. 이 디코더는 리버레인의 ‘델타플로우 2(Deltaflow 2)’에 탑재되어 옥스퍼드 퀀텀 서킷·오크리지 국립연구소 등 여러 시스템에 배치되고 있다.

기술적 의미

양자오류정정은 큐비트가 결잃음(decoherence)으로 정보를 잃기 전에 오류를 ‘제때’ 잡아내야 하므로, 복호 속도가 곧 실용화의 관건이다. 전날 보도된 시드니대·IBM의 ‘게이지 이론’이 정정에 필요한 측정량을 줄이는 ‘이론적’ 진전이었다면, 이번 성과는 그 정정을 큐비트 수명 안에서 수행하는 ‘하드웨어 실시간’ 구현으로 상호 보완된다. 전용 디코더 칩이 상용 양자 제어 스택에 통합되었다는 점에서 결함 허용(fault-tolerant) 양자컴퓨팅의 공학적 병목을 한 단계 해소한 것으로 평가된다.

출처: Rigetti Computing — Demonstrating real-time and low-latency quantum error correction with superconducting qubits · Riverlane — First hardware decoder to deliver real-time, scalable quantum error correction

컴퓨팅 · 반도체

Computing & Semiconductors

엔비디아 · RTX 스파크

엔비디아 ‘RTX 스파크’ 슈퍼칩 공개 — 윈도우 온 Arm으로 PC를 ‘에이전트 OS’로 재정의

엔비디아(NVIDIA)는 컴퓨텍스 2026에서 노트북·데스크톱용 ‘RTX 스파크(RTX Spark)’ 슈퍼칩과 이를 기반으로 한 윈도우 온 Arm(Windows on Arm) 플랫폼을 공개하였다. 이 칩은 20개 코어의 ‘그레이스(Grace)’ Arm 중앙처리장치(CPU)와 6,144개 쿠다(CUDA) 코어 및 4비트 부동소수점(FP4)을 지원하는 5세대 텐서코어(Tensor Core)를 갖춘 ‘블랙웰(Blackwell)’ 그래픽처리장치(GPU)를 ‘NVLink-C2C’ 칩간 인터커넥트로 결합하고, 128기가바이트(GB)의 LPDDR5X 통합 메모리와 최대 초당 300기가바이트(GB/s)의 대역폭을 제공한다. 젠슨 황(Jensen Huang) 최고경영자는 이 플랫폼을 “이제껏 만들어진 가장 효율적인 PC”로 규정하며, 윈도우를 ‘개인용 인공지능 에이전트’ 시대의 운영체제로 재정의하겠다고 밝혔다. 엔비디아는 델(Dell)·HP·레노버(Lenovo)·마이크로소프트(Microsoft)·에이수스(ASUS)·MSI 등을 통해 30종 이상의 노트북과 10여 종의 데스크톱을 2026년 가을부터 출시하며, 차세대 ‘루빈(Rubin, LPDDR6)’과 후속 ‘로사 파인만(Rosa Feynman)’으로 이어지는 3세대 로드맵을 함께 제시하였다.

기술적 의미

그간 데이터센터 가속기에 집중하던 엔비디아가 ‘개인용 컴퓨터’ 칩 시장에 직접 진입한다는 점에서 전략적 의미가 크다. 서버용 ‘그레이스 블랙웰’ 구조를 PC급으로 축소해 ‘대용량 통합 메모리(128GB)’를 무기로 내세운 것은, 거대 인공지능 모델을 단말기에서 직접 구동하는 ‘온디바이스(on-device) 에이전트’를 겨냥한 포석이다. 윈도우 온 Arm 생태계가 본격화되면 인텔·AMD의 x86 진영, 퀄컴의 스냅드래곤, 애플 실리콘과 맞물려 PC 프로세서 경쟁이 다극화될 전망이다.

출처: Tom’s Hardware — NVIDIA unveils RTX Spark Superchip at Computex 2026 · CNBC — Nvidia jumps into PCs with new Arm-based chip

AMD · 데이터센터 로드맵

AMD, 2나노 ‘젠 6 베니스’·‘MI400’·‘헬리오스 랙’ 2026년 출격 재확인 — 엔비디아에 정면 도전

AMD는 컴퓨텍스 2026을 계기로 차세대 데이터센터 로드맵을 재확인하며 엔비디아 주도의 인공지능 인프라 시장에 정면으로 도전하였다. 리사 수(Lisa Su) 최고경영자가 앞서 공개한 계획에 따르면, AMD는 2나노미터(nm)급 ‘젠 6(Zen 6)’ 아키텍처 기반 서버 프로세서 ‘에픽 베니스(EPYC Venice)’를 최대 256코어 규모로, 차세대 인공지능 가속기 ‘인스팅트 MI400(Instinct MI400)’ 시리즈를 2026년 내 출시한다. MI400은 새 연산 엔진과 함께 432기가바이트(GB)의 6세대 고대역폭 메모리(HBM4), 초당 19.6테라바이트(TB/s)의 메모리 대역폭을 갖춘다. AMD는 또한 ‘MI455X’ 가속기 72개와 젠 6 기반 베니스 CPU를 통합한 랙 규모 시스템 ‘헬리오스(Helios)’를 선보였으며, 후속으로 ‘젠 7(Zen 7)’ 기반 ‘에픽 베라노(EPYC Verano)’와 ‘인스팅트 MI500’을 2027년 출시한다는 계획을 제시하였다.

기술적 의미

인공지능 가속기 경쟁의 승부처가 개별 칩 성능을 넘어 ‘랙 규모(rack-scale) 통합 시스템’으로 옮겨가고 있음을 보여준다. 엔비디아가 GPU·CPU·네트워크를 묶은 ‘랙 단위’ 제품으로 시장을 선점한 데 맞서, AMD가 ‘헬리오스’로 동일한 시스템 수준의 경쟁을 시도하는 것이다. 432GB의 대용량 HBM4를 앞세운 MI400은 메모리 용량이 곧 거대 모델 처리 능력을 좌우하는 추론·학습 시장에서 차별점이 될 수 있어, 메모리 협력사인 한국 기업들의 공급 기회로도 이어진다.

출처: Tom’s Hardware — AMD’s enterprise CPU and GPU roadmap: Venice, Verano, Zen 6, Helios · AMD — Expanded AMD Instinct GPU Roadmap (MI400/MI500)

SK하이닉스 · 차세대 메모리

SK하이닉스, 컴퓨텍스서 ‘HBM4·HBM4E·세계 첫 HBF’ 전면 배치 — 엔비디아 ‘베라 루빈’ 동행

SK하이닉스가 6월 2일 컴퓨텍스 2026에서 엔비디아와의 인공지능 메모리 협력 제품을 대거 공개하며 데이터센터용 메모리 기술 리더십을 강조하였다. 전시 제품에는 12단 36기가바이트(GB) ‘HBM3E’(9.2Gbps·1.2TB/s 이상), 16단 48GB ‘HBM4’, 그리고 12단 48GB ‘HBM4E’(최대 16.0Gbps·4.0TB/s)가 포함되었다. 특히 SK하이닉스는 낸드플래시를 적층해 고대역폭과 대용량을 동시에 노린 차세대 메모리 ‘HBF(High Bandwidth Flash, 고대역폭 플래시)’를 처음으로 선보였으며, 3GB ‘GDDR7’과 3차원 적층(3DS) 서버용 D램 모듈(RDIMM) 등도 함께 전시하였다. 전시장 중심에는 엔비디아의 차세대 슈퍼칩 ‘베라 루빈(Vera Rubin) 200’ 모형이 ‘SOCAMM2’ 및 ‘HBM4’와 나란히 배치되어, 인공지능 가속기와 메모리의 ‘원팀’ 협력을 부각하였다. SK하이닉스는 CXL 등 차세대 메모리 기술까지 포트폴리오를 확장하겠다는 전략을 밝혔다.

기술적 의미

인공지능 가속기의 성능이 사실상 ‘메모리 대역폭·용량’에 의해 결정되면서, 메모리 기업의 제품 로드맵이 곧 가속기 업체의 성능 한계를 규정하는 구조가 굳어지고 있다. SK하이닉스가 HBM4·HBM4E에 더해 ‘HBF’라는 신(新)범주를 제시한 것은, D램 기반 HBM의 용량 한계를 낸드 적층으로 보완해 ‘초거대 모델용 대용량 메모리’ 수요를 선점하려는 포석이다. 엔비디아 ‘베라 루빈’과의 공동 전시는 메모리·가속기 동맹이 차세대 플랫폼 단계에서도 이어짐을 시사한다.

출처: 디지털데일리 — 최초 공개 ‘HBF’부터 ‘HBM4E’까지… SK하이닉스 차세대 메모리 [컴퓨텍스 2026] · 뉴스핌 — SK하이닉스, 컴퓨텍스서 HBM4 전면에…엔비디아 파트너십 강조

IT 산업

IT Industry

앤스로픽 · 자본시장

앤스로픽, SEC에 ‘비공개 IPO’ 초안 제출 — 9,650억 달러 가치로 ‘1조 달러 상장’ 가도

인공지능 기업 앤스로픽(Anthropic)이 2026년 6월 1일 미국 증권거래위원회(SEC)에 기업공개(IPO)용 등록신청서 초안(Form S-1)을 비공개로 제출하였다고 공식 발표하였다. ‘비공개 제출(confidential filing)’은 SEC의 사전 심사를 받는 동안 재무 정보를 일반에 공개하지 않는 방식으로, 정식 상장 시점과 규모는 향후 시장 상황에 따라 결정된다. 앤스로픽은 앞서 5월 말 9,650억 달러(약 1,300조 원) 가치평가로 자금 조달을 마무리하며, 3월 8,520억 달러로 평가된 오픈AI(OpenAI)를 앞질렀다. 회사의 연환산 매출(run rate)은 2026년 5월 기준 470억 달러로 직전 연(年) 100억 달러에서 급증하였으며, 대표 제품은 인공지능 모델 ‘클로드(Claude)’와 코딩 도구 ‘클로드 코드(Claude Code)’다. 시장에서는 조건이 맞을 경우 ‘1조 달러’를 웃도는 데뷔가 유력하다는 관측이 나오며, 올해 스페이스X(SpaceX)·오픈AI와 더불어 ‘1조 달러 상장’ 후보로 거론된다.

기술적 의미

거대 인공지능 기업의 상장 추진은, 천문학적 모델 학습·추론 비용을 충당할 자본을 ‘비상장 투자’에서 ‘공개 시장’으로 확대하려는 구조적 전환을 의미한다. 매출이 1년 새 100억→470억 달러로 4배 이상 늘었다는 점은 생성형 인공지능의 ‘수익화’가 실제 매출로 가시화되고 있음을 보여준다. 다만 비공개 제출 단계에서는 손익·마진 등 핵심 재무가 공개되지 않아, 향후 정식 S-1에서 드러날 ‘수익성’이 1조 달러 밸류에이션의 정당성을 가르는 분수령이 될 전망이다.

출처: Anthropic — Anthropic confidentially submits draft S-1 to the SEC · CNBC — Anthropic confidentially files IPO prospectus with SEC

엔비디아 · 젠슨 황 방한

젠슨 황 방한, ‘피지컬 AI 동맹’ 구체화 — LG·네이버·두산로보틱스와 로봇 협력

젠슨 황(Jensen Huang) 엔비디아 최고경영자가 6월 초 한국을 방문해 국내 주요 기업들과 ‘피지컬 AI(Physical AI)’ 협력을 논의하였다. 지난해 10월 아시아태평양경제협력체(APEC) 이후 약 7개월 만의 방한으로, 핵심 의제는 로봇·자율주행 등 ‘물리 세계’에서 작동하는 인공지능 분야의 협력 강화였다. 황 최고경영자는 구광모 LG그룹 회장, 이해진 네이버 의장 등과 회동하며, 최태원 SK 회장·정의선 현대자동차그룹 회장과의 만남도 조율된 것으로 전해졌다. 엔비디아는 로봇 시뮬레이션·학습 플랫폼 ‘코스모스(Cosmos)’와 ‘옴니버스(Omniverse)’를 활용한 협력 사례로 삼성전자·LG전자·두산로보틱스를 공식 소개하였다. 이 같은 소식에 LG그룹 지주사 ㈜LG와 LG전자 등 관련 종목의 주가가 급등하며 ‘피지컬 AI’에 대한 시장의 기대가 반영되었다.

기술적 의미

엔비디아의 관심이 ‘인공지능 메모리·가속기’ 공급망을 넘어 ‘로봇·자율주행’이라는 차세대 응용으로 확장되고 있음을 보여준다. 풍부한 제조업 기반과 로봇 역량을 갖춘 한국 기업들은 엔비디아의 ‘코스모스·옴니버스’ 생태계에서 합성 데이터·시뮬레이션을 활용한 로봇 상용화의 핵심 파트너가 될 수 있다. 반도체 공급에 머물던 한·미 협력이 ‘체화된 지능(embodied intelligence)’ 영역으로 넓어지는 신호로 해석된다.

출처: 머니투데이 — ‘AI 메모리’ 다음은 ‘로봇’…젠슨 황, 삼성·LG·두산 손잡았다 · YTN — 젠슨 황, 이번 주 방한…‘제2의 깐부회동’ 기대감

앤스로픽 · 엔터프라이즈

앤스로픽, ‘서비스 트랙·파트너 허브’ 출범 — 기업 시장 침투 가속, 4만 기업·1만 인증

앤스로픽(Anthropic)은 6월 3일 ‘클로드 파트너 네트워크(Claude Partner Network)’의 ‘서비스 트랙(Services Track)’과 ‘파트너 허브(Partner Hub)’를 출범한다고 발표하였다. 서비스 트랙은 기업이 클로드(Claude)로 실제 구축·납품한 실적에 따라 등급을 부여하는 3단계 체계로, ▲셀렉트(Select, 인증 인력 10명 이상·실전 배포 고객 2곳 이상) ▲프리퍼드(Preferred, 100명 이상·15곳 이상) ▲글로벌 프리미어(Global Premier, 1,000명 이상·3개 지역 100곳 이상)로 나뉜다. ‘파트너 허브’는 파트너사가 자사의 프로그램 요건 충족 현황을 확인하고, 고객은 프로젝트 규모에 맞는 검증된 기업을 찾을 수 있는 포털로 매일 정보가 갱신된다. 앤스로픽은 3월 1억 달러를 투자해 파트너 네트워크를 출범한 이후 4만여 기업이 지원하고 1만여 명의 컨설턴트가 ‘클로드 인증’을 취득했다고 밝혔다.

기술적 의미

이는 인공지능 경쟁의 무게중심이 ‘모델 성능’에서 ‘기업 현장에 누가 더 깊이 이식하느냐’라는 도입·서비스 역량으로 옮겨가고 있음을 보여준다. 실제 배포 실적을 등급화하고 인증 인력 규모를 요건으로 삼은 것은, 컨설팅·시스템통합(SI) 생태계를 모델 공급사 중심으로 결집해 ‘전환 비용(lock-in)’을 높이려는 전략이다. IPO 추진과 맞물려, 앤스로픽이 기술 기업을 넘어 ‘엔터프라이즈 플랫폼 사업자’로 외연을 넓히고 있음을 시사한다.

출처: Anthropic — Introducing the Services Track and Partner Hub of the Claude Partner Network · Quartz — Anthropic launches a Services Track and Partner Hub to push Claude deeper into the enterprise

인공지능 · 머신러닝

AI & Machine Learning

마이크로소프트 · 자체 모델

마이크로소프트, 자체 모델 ‘MAI-Thinking-1·MAI-Code-1-Flash’ 공개 — 오픈AI 의존 축소

마이크로소프트(Microsoft)는 개발자 콘퍼런스 ‘빌드 2026(Build 2026)’에서 자체 개발한 인공지능 모델 ‘MAI-Thinking-1’과 ‘MAI-Code-1-Flash’를 공개하였다. ‘MAI-Thinking-1’은 마이크로소프트의 첫 자체 ‘추론(reasoning)’ 모델로, 외부 모델의 데이터를 증류(distillation)하지 않고 상업적으로 허가된 데이터만으로 학습한 중간 규모의 희소 전문가혼합(sparse MoE) 모델이다. 활성 매개변수 350억 개와 25만 6,000(256K) 토큰 맥락창을 갖추며, 수학·과학 추론 벤치마크 ‘AIME 2025’에서 97.0%, ‘AIME 2026’에서 94.5%를 기록하고, 소프트웨어공학 벤치마크 ‘SWE-Bench Pro’에서 클로드 오푸스 4.6(Claude Opus 4.6)에 필적한다고 회사는 밝혔다. 경량 코딩 모델 ‘MAI-Code-1-Flash’는 50억 매개변수로, ‘SWE-Bench Pro’에서 클로드 하이쿠 4.5(Claude Haiku 4.5)를 16%포인트 앞서면서도 복잡한 작업에서 토큰을 60% 적게 소비한다(51.2% 대 35.2%). 두 모델은 마이크로소프트 ‘파운드리(Foundry)’ 비공개 미리보기와 깃허브 코파일럿(GitHub Copilot)으로 순차 배포된다.

기술적 의미

마이크로소프트가 오픈AI에 대한 의존을 줄이고 ‘자체 모델’ 역량을 본격화했다는 점에서 전략적 함의가 크다. 외부 모델 증류 없이 학습했다는 점은 지식재산·데이터 출처 측면의 독립성을 강조한 것이며, ‘경량·저토큰’ 코딩 모델은 추론 비용이 곧 수익성인 시대에 ‘단위 경제성(unit economics)’을 차별점으로 내세운 행보다. 코딩·에이전트 시장에서 앤스로픽·오픈AI·구글과의 경쟁이 ‘모델 자급(自給)’ 단계로 진입했음을 보여준다.

출처: Microsoft AI — Introducing MAI-Code-1-Flash · CNBC — Microsoft unveils new AI models to lessen reliance on OpenAI

구글 · 제미나이 3.5

구글 ‘제미나이 3.5 플래시’ 정식 출시 — ‘속도·비용’ 앞세워 코딩·에이전트 정조준

구글(Google)은 ‘제미나이 3.5 플래시(Gemini 3.5 Flash)’를 정식 출시하고 자사 개발 플랫폼 ‘안티그래비티(Antigravity)’와 ‘제미나이 API’, ‘안드로이드 스튜디오(Android Studio)’를 통해 일반에 공급한다고 밝혔다. 회사에 따르면 제미나이 3.5 플래시는 까다로운 코딩·에이전트 벤치마크에서 상위 모델 ‘제미나이 3.1 프로(3.1 Pro)’를 능가하면서도 다른 프런티어 모델보다 약 4배 빠르게 동작한다. 구글은 이 모델을 ‘추론 벤치마크 경쟁’보다 ‘지연 없이 실시간으로 작동하는 운영 속도(operational velocity)’에 최적화했다고 설명하며, 종종 경쟁 모델의 절반 이하 비용으로 작업을 수행할 수 있다고 강조하였다. 이는 마이크로소프트·앤스로픽·오픈AI가 격돌하는 코딩·에이전트 시장에서 ‘성능’이 아닌 ‘속도·가격’을 차별 축으로 내세운 전략으로, ‘100가지 발표’로 요약된 ‘구글 I/O 2026’의 핵심 모델군이기도 하다.

기술적 의미

프런티어 모델 경쟁이 ‘최고 정확도’ 일변도에서 ‘속도·비용 대비 충분한 지능’이라는 실용 축으로 분화하고 있음을 보여준다. 에이전트형 작업은 다단계 추론을 반복해 응답 지연과 토큰 비용이 누적되므로, ‘4배 빠르고 절반 비용’이라는 지표는 실제 서비스 배포에서 결정적 경쟁력이 된다. 최상위 모델이 아닌 ‘플래시’ 계열을 코딩·에이전트의 전면에 내세운 점은, 대중적 워크로드의 단가 경쟁이 본격화되고 있음을 시사한다.

출처: Google — I/O 2026 developer highlights: Antigravity, Gemini API, AI Studio · Google Cloud — Innovations from Google I/O 26

오픈AI · 기본 모델 교체

오픈AI ‘GPT-5.5 인스턴트’ 기본 모델로 — 민감 분야 ‘환각’ 줄이고 워크스페이스 에이전트 확장

오픈AI(OpenAI)는 ‘GPT-5.5 인스턴트(GPT-5.5 Instant)’를 챗GPT(ChatGPT)의 새 기본 모델로 적용하며, 기존 ‘GPT-5.3 인스턴트’를 대체하였다. 회사는 새 모델이 법률·의료·금융 등 민감한 영역에서 ‘환각(hallucination)’을 줄이면서도 이전 모델의 낮은 지연(latency)을 유지한다고 설명하였다. 오픈AI는 앞서 코딩 특화 ‘GPT-5.3-codex’의 능력을 통합한 첫 주류 추론 모델 ‘GPT-5.4’를 챗GPT·API·코덱스(Codex) 전반에 배포하였으며, 업무 자동화를 위한 ‘워크스페이스 에이전트(workspace agents)’도 확장하고 있다. 워크스페이스 에이전트는 코덱스 기반으로 보고서 작성·코드 생성·메시지 응대 등 실제 업무를 대신 수행하는 기능으로, 5월 6일부터 크레딧(credit) 기반 과금이 적용되었다. 또한 오픈AI의 소프트웨어공학 에이전트 ‘코덱스’는 아마존웹서비스(AWS) ‘베드록(Bedrock)’에서도 이용할 수 있게 되었다.

기술적 의미

기본 모델을 ‘인스턴트’ 계열로 교체하면서 ‘환각 저감’을 전면에 내세운 것은, 생성형 인공지능이 일상·전문 업무로 깊숙이 들어갈수록 ‘정확성·신뢰성’이 사용성의 핵심 요건이 되고 있음을 보여준다. 워크스페이스 에이전트의 크레딧 과금 전환은 깃허브 코파일럿의 ‘사용량 기반 과금’과 같은 흐름으로, 에이전트형 워크로드의 비용 구조가 ‘정액제’에서 ‘소비량 연동’으로 재편되고 있음을 재확인한다. 코덱스의 ‘베드록’ 탑재는 클라우드 중립적 배포로 개발자 저변을 넓히려는 포석이다.

출처: TechCrunch — OpenAI releases GPT-5.5 Instant, a new default model for ChatGPT · OpenAI — Introducing workspace agents in ChatGPT

종합 평가

전선이 넓어진 하루 — 인공지능이 ‘PC·자본·물리 세계’로 동시에 번지다

오늘의 동향을 관통하는 첫 번째 축은 인공지능 경쟁의 무대가 데이터센터를 넘어 ‘개인용 컴퓨터(PC)’로 확장되었다는 점이다. 엔비디아는 컴퓨텍스 2026 막바지에 윈도우 온 Arm 플랫폼 ‘RTX 스파크’ 슈퍼칩을 공개하며 서버급 ‘그레이스 블랙웰’ 구조를 PC로 끌어내려 ‘온디바이스 에이전트’ 시대를 예고하였고, AMD는 2나노 ‘젠 6 베니스’와 ‘MI400’·‘헬리오스 랙’으로 시스템 수준의 정면 경쟁을 재확인하였다. SK하이닉스는 ‘HBM4·HBM4E’에 더해 세계 첫 ‘HBF’를 제시하며 메모리 로드맵으로 가속기 성능의 천장을 규정하는 위치를 굳혔다. 가속기 중심이던 인공지능 하드웨어 경쟁이 ‘PC 프로세서’와 ‘랙 규모 시스템’, ‘차세대 메모리’로 동시에 다극화되고 있는 것이다.

두 번째 축은 인공지능 산업이 ‘자본시장’과 ‘기업 현장’으로 외연을 넓혔다는 점이다. 앤스로픽은 9,650억 달러 가치로 비공개 IPO 초안을 제출하며 ‘1조 달러 상장’ 가도에 올랐고, 동시에 ‘서비스 트랙·파트너 허브’로 도입·서비스 생태계를 결집해 경쟁의 무게중심을 ‘모델 성능’에서 ‘기업 이식 역량’으로 옮겼다. 모델 경쟁 자체도 ‘코딩과 에이전트’를 전장으로 한층 치열해져, 마이크로소프트는 오픈AI 의존을 줄인 자체 모델 ‘MAI’ 계열로, 구글은 ‘속도·비용’을 앞세운 ‘제미나이 3.5 플래시’로, 오픈AI는 ‘환각’을 줄인 기본 모델 ‘GPT-5.5 인스턴트’로 맞붙었다. 깃허브 코파일럿·워크스페이스 에이전트의 과금 전환에서 보듯, ‘추론 비용과 단위 경제성’이 모델 경쟁의 핵심 변수로 자리 잡았다. 국내에서는 젠슨 황의 방한이 한·미 협력을 반도체에서 ‘로봇·자율주행’으로 넓히는 신호로 읽혔다.

세 번째 축은 기초과학에서 공통적으로 나타난 ‘난제의 실체를 짚어내는’ 성과다. ASKAP 전파망원경은 장주기 우주 신호의 정체를 ‘격변변광성’으로 규명해 관측 천문학의 분류를 정교화하였고, 컬럼비아대 연구진은 면역 항암치료를 가로막는 단백질 ‘NFIL3’를 지목해 ‘덜 지치는 CAR-T’의 설계 경로를 열었으며, 리게티·리버레인은 ‘실시간 양자오류정정’을 실증해 전날의 이론적 진전을 하드웨어로 보완하였다. 향후 주목할 이슈로는 첫째, 엔비디아 ‘RTX 스파크’로 촉발된 윈도우 온 Arm 생태계가 PC 프로세서 구도를 실제로 재편할지, 둘째, 앤스로픽의 정식 S-1에서 드러날 ‘수익성’이 1조 달러 밸류에이션을 정당화할지, 셋째, 코딩·에이전트 모델의 ‘속도·비용’ 경쟁이 산업 전반의 가격 구조를 어떻게 바꿀지가 핵심 변수로 남는다. 기초과학의 ‘실체 규명’ 성과들이 천문·면역·양자 기술의 실용화 일정에 어떻게 반영될지도 중장기 관전 포인트가 될 것이다.