기초과학 · 컴퓨팅 · IT산업 · 인공지능

IT·AI·컴퓨팅 데일리

The Daily Technology Briefing
2026년 7월 4일 토요일 제185호 · Vol. 2026 조간 · 기술정보 종합판
오늘의 헤드라인

‘추론(推論)의 시대’, 칩·모델·자본이 한 방향을 가리키다 — 맞춤형 실리콘·저가 에이전트·인프라로 몰리는 돈

오늘의 기술 지형은 ‘인공지능(AI)을 더 싸고 더 자율적으로 구동하려는 경쟁’과 ‘실험실에서 우주와 양자의 극한을 재현·축소하는 과학’이라는 두 축으로 요약된다. 첫째, 기초과학은 ‘멀리 있는 것을 실험실로 끌어오는 정밀’로 전진하였다. 국제 연구진은 광섬유(光纖維)를 이용한 아날로그 실험으로 블랙홀이 내뿜는 ‘호킹 복사(Hawking radiation)’의 생성 과정과 그 역반응(逆反應)을 학술지 ‘네이처(Nature)’에 규명하였고, 한국과학기술원(KAIST)은 원유를 끓이지 않고 상온에서 막(膜)으로 걸러 내는 차세대 분리막을 같은 학술지에 보고하였으며, 다른 연구진은 자성(磁性) 파동인 ‘마그논(magnon)’의 수명을 약 100배로 늘려 1센트 동전 크기의 초소형 양자컴퓨터 가능성을 제시하였다. 둘째, 컴퓨팅·반도체는 ‘추론용 맞춤형 칩 경쟁’으로 무게중심이 옮겨 갔다. 오픈AI(OpenAI)는 브로드컴(Broadcom)과 함께 추론에 특화한 첫 자체 칩 ‘할라페뇨(Jalapeño)’를 9개월 만에 설계·시제품 단계로 끌어올렸고, 엔비디아(NVIDIA)는 차세대 ‘베라 루빈(Vera Rubin)’ 플랫폼을 전량 양산에 넣으며 2027년까지 1조 달러 규모의 주문을 확인하였으며, 한국의 퓨리오사AI·리벨리온은 국산 신경망처리장치(NPU)를 잇달아 양산해 추론 시장을 겨냥하였다. 셋째, IT산업에서는 ‘AI 인프라로 자본이 몰리는’ 국면이 뚜렷해졌다. 블랙스톤(Blackstone)은 일본 AI 데이터센터에 300억 달러를, 퀄컴(Qualcomm)은 AI 소프트웨어 기업 모듈러(Modular)를 약 39억 달러에 인수하기로 하였으며, 삼성전자·SK하이닉스는 충청권에 총 240조 원 규모의 반도체·AI 투자 계획을 발표하였다. 넷째, 인공지능은 ‘더 싸고, 더 자율적으로’ 진화하였다. 앤스로픽(Anthropic)은 가장 저렴하면서도 가장 자율적인 ‘클로드 소네트 5(Claude Sonnet 5)’를, 구글(Google)은 초저지연·저비용 이미지 모델 ‘나노바나나 2 라이트’를 공개하였고, 네이버·카카오는 ‘에이전트 N’과 ‘카나나’로 국내 에이전틱(자율형) AI 경쟁에 나섰다.
01
기초 과학 논문
Basic Sciences
해외 · 천체·기초물리 · Nature

실험실의 빛으로 블랙홀을 재현하다 — 광섬유 아날로그로 ‘호킹 복사’ 생성·역반응 규명

우주에서 아직 직접 관측되지 않은 블랙홀의 미약한 빛, ‘호킹 복사(Hawking radiation)’의 생성 과정을 실험실의 광섬유(光纖維)로 재현한 연구가 나왔다. 국제 공동연구진(제1저자 로렌초 M. 프로코피오 등)은 광섬유 속에서 빛의 펄스가 만들어 내는 ‘사건의 지평선(event horizon)’ 유사 환경, 곧 아날로그(모사) 계를 이용해 호킹 복사가 발생하는 과정과 그 복사가 원래의 빛(펌프 광)에 되돌려 미치는 ‘역반응(逆反應·backreaction)’을 실험·이론적으로 규명하고, 그 결과를 6월 30일자(온라인 7월 1일) 학술지 ‘네이처(Nature)’에 발표하였다. 호킹 복사는 1974년 스티븐 호킹이 블랙홀도 완전히 검지 않고 양자 효과로 인해 미약한 열복사를 방출한다고 예측한 현상이다. 연구진은 종전에 복잡한 다단계(cascaded) 과정으로 여겨지던 이 복사의 발생이, 실제로는 단순하고 직접적인 과정임을 확인하였다고 밝혔다.

기술적 의미

이번 성과의 핵심은, 중력이 지배하는 극한 천체 현상을 ‘탁상 위 광학 실험’으로 끌어와 정량적으로 검증할 수 있는 길을 넓혔다는 점이다. 실제 블랙홀의 호킹 복사는 너무 미약해 관측이 사실상 불가능한데, 광섬유·유체·초저온 응축체 같은 아날로그 계는 동일한 수학 구조를 실험실에서 재현해 이론을 시험하게 해 준다. 특히 복사가 원래의 빛에 되돌려 미치는 역반응을 포착한 것은, 블랙홀이 복사를 내며 서서히 질량을 잃는 ‘증발(蒸發)’ 과정의 물리를 이해하는 데 실마리를 준다. 다만 아날로그 계에서 얻은 결론을 실제 중력장(重力場)에 그대로 적용하는 데에는 신중한 해석이 필요하며, 양자중력 이론과의 연결은 여전히 열린 과제로 남는다.

국내 · 재료·분리공정 · Nature·KAIST

원유를 끓이지 않고 걸러 낸다 — KAIST, 상온 작동 차세대 분리막 네이처 보고

원유를 뜨겁게 끓여 성분별로 나누는 100년 된 정유(精油) 공정을, 상온에서 ‘막(膜)으로 거르는’ 방식으로 대체할 실마리가 나왔다. 한국과학기술원(KAIST) 고동연 교수팀(최지훈·서혁준 박사 공동 제1저자)은 값싼 다공성 고분자(PAN) 분리막에 별도의 선택층 코팅 없이 원유를 흘려보내면, 무거운 성분이 미세 기공에 흡착되며 2나노미터(㎚·10억분의 1미터) 이하의 정밀한 통로가 ‘자발적으로’ 형성되는 현상을 발견하고, 이를 6월 25일자 학술지 ‘네이처(Nature)’ 온라인판에 보고하였다. 원유를 흘린 지 5분 안에 분리 기능이 생겼고, 10분이 지나자 검은 원유가 옅은 갈색의 투과액으로 바뀌었다. 연구팀은 기존 최고 수준 원유 분리막보다 약 23배 빠른 분리 속도를 얻었으며, 28일 연속 운전에도 성능 저하가 없었다고 밝혔다. 이 방식은 증류(蒸溜) 공정 대비 에너지 소비를 31.6%, 이산화탄소(CO₂) 배출을 37.6% 줄이는 것으로 나타났다.

기술적 의미

이번 연구의 핵심은, 산업계에서 가장 에너지를 많이 쓰는 공정의 하나인 ‘증류’를 상온의 막 분리로 대체할 가능성을 실험으로 보였다는 점이다. 정유·석유화학 공정은 원유를 수백 도로 끓여 성분을 나누기 때문에 막대한 열에너지와 탄소 배출을 수반하는데, 이를 막(membrane)으로 대체하면 에너지·탄소를 근본적으로 줄일 수 있다. 특히 코팅 없이 원유 스스로 정밀한 분리 통로를 만든다는 ‘자발적 기공 수축’ 원리는, 분리막 설계의 통념을 바꾸는 발상으로 평가된다. 다만 실험실 규모의 성과를 대면적·대용량 상용 공정으로 확장할 때의 내구성과 오염(파울링) 문제, 다양한 원유·용매에 대한 적용성 검증은 앞으로의 과제다.

해외 · 양자물성·마그노닉스 · ScienceDaily

사라지던 자성 파동을 붙들다 — 마그논 수명 100배, ‘동전 크기 양자컴퓨터’의 실마리

너무 빨리 사라져 쓸모없다고 여겨지던 미세한 자성(磁性) 파동이, 양자 정보를 실어 나르는 유력한 후보로 떠올랐다. 연구진은 자석 내부 스핀(자기 방향)의 집단적 출렁임을 양자화한 ‘마그논(magnon)’의 수명(壽命)을 기존보다 약 100배 늘려 최대 18마이크로초(㎲·100만분의 1초)까지 끌어올렸다고 밝혔다. 마그논은 전자의 이동 없이 자기적 정보를 전달할 수 있어, 발열과 전력 소모가 적은 정보처리 소자의 재료로 주목받아 왔으나, 신호가 금세 흩어지는 짧은 수명이 실용화의 걸림돌이었다. 연구진은 이 수명 연장이 향후 1센트 동전만 한 크기의 초소형(超小型) 양자컴퓨터를 구현하는 데 기여할 수 있다고 설명하였다. 해당 성과는 과학 전문매체 ‘사이언스데일리(ScienceDaily)’ 등을 통해 6월 말 소개되었다.

기술적 의미

이번 성과의 핵심은, 양자 정보를 담는 물리적 매개체의 선택지를 넓혔다는 점이다. 오늘날 양자컴퓨터는 초전도 회로·이온·중성원자·광자 등 다양한 방식으로 경쟁하는데, 고체 자성체 속의 마그논은 소자를 매우 작게 집적할 수 있다는 잠재적 장점을 지닌다. 문제는 양자 상태가 유지되는 ‘결맞음(coherence) 시간’이 짧다는 것이었는데, 수명을 100배 늘린 이번 결과는 마그논 기반 소자의 실용 가능성을 한층 끌어올린다. 이는 본 브리핑이 앞서 다룬 초전도·광집적회로 등 ‘연산의 물리적 토대를 다양화하려는’ 흐름과 궤를 같이한다. 다만 이번 결과는 실험실 수준의 성취로, 실제 큐비트(qubit) 연산과 대규모 집적으로 이어지기까지는 상당한 후속 연구가 필요하다.

02
컴퓨팅 · 반도체
Computing & Semiconductors
해외 · AI 가속기·맞춤형 실리콘 · OpenAI·Broadcom

추론에 특화한 첫 자체 칩 — 오픈AI·브로드컴, ‘할라페뇨’ 9개월 만에 공개

대규모 언어모델(LLM)을 ‘돌리는’ 단계인 추론(推論·inference)에 특화한 맞춤형 반도체 경쟁이 본격화하였다. 오픈AI(OpenAI)는 반도체 기업 브로드컴(Broadcom)과 함께 자사 첫 자체 설계 가속기 ‘할라페뇨(Jalapeño)’를 공개하였다. 이 칩은 오픈AI 연구진과의 긴밀한 협업을 바탕으로, 최전선(프런티어) AI 모델의 추론에 중요한 연산·메모리 이동·네트워킹·서빙 패턴에 맞춰 밑바닥부터 설계된 주문형 반도체(ASIC)다. 회사는 초기 시험에서 할라페뇨가 현재 최고 수준 제품보다 ‘와트당 성능(성능÷전력)’이 크게 앞선다고 밝혔다. 특히 최초 설계부터 제조용 최종 확정(테이프아웃)까지 단 9개월에 마쳐, 고성능 첨단 반도체로는 가장 빠른 축에 드는 개발 주기를 기록하였다. 시제품(엔지니어링 샘플)은 이미 실험실에서 목표 주파수·전력으로 ‘GPT-5.3-Codex-Spark’ 등 실제 머신러닝 작업을 구동 중이며, 연말부터 초기 배포를 시작해 이후 확대할 계획이다.

기술적 의미

이번 공개의 핵심은, AI 연산의 무게중심이 ‘모델을 학습(training)하는 단계’에서 ‘완성된 모델을 대량으로 서비스하는 추론 단계’로 옮겨 가면서, 추론 비용과 전력효율을 좌우할 ‘맞춤형 칩’ 확보가 프런티어 AI 기업의 핵심 전략이 되었음을 보여 준다는 점이다. 범용 그래픽처리장치(GPU) 대신 자사 모델에 최적화한 ASIC를 쓰면, 같은 전력으로 더 많은 추론을 처리해 원가를 낮출 수 있다. 9개월이라는 이례적 개발 속도는 AI를 활용한 반도체 설계 자동화의 진전을 시사한다. 다만 할라페뇨는 아직 시제품 단계로, 실제 데이터센터 대량 배포에서의 성능·수율·소프트웨어 생태계 완성도는 검증이 필요하다.

해외 · AI 플랫폼·GPU · NVIDIA

‘베라 루빈’ 전량 양산 — 엔비디아, 2027년까지 1조 달러 주문 확인

AI 가속기 시장의 절대 강자 엔비디아(NVIDIA)가 차세대 플랫폼을 본격 양산 궤도에 올렸다. 엔비디아는 차세대 AI 플랫폼 ‘베라 루빈(Vera Rubin)’을 구성하는 신형 칩들을 전량 양산에 넣고, 2026년 3분기부터 대형 고객사에 공급을 확대한다고 밝혔다. 젠슨 황 최고경영자(CEO)는 추론 수요의 급증을 근거로 매출 전망을 2027년까지 ‘1조 달러’ 규모로 상향하였으며, 이는 종전 ‘2026년 말까지 5,000억 달러’ 목표를 크게 웃도는 수치다. 그는 기존 ‘블랙웰(Blackwell)’과 신형 ‘베라 루빈’을 합쳐 2027년까지 1조 달러 규모의 누적 주문을 확보했다고 설명하였다. 베라 루빈은 중앙처리장치(CPU)와 그래픽처리장치(GPU), 네트워킹 칩을 아우르는 여러 개의 신형 반도체로 하나의 ‘AI 슈퍼컴퓨터’를 구성하는 방식으로, 연 1회 신제품을 내놓는 엔비디아의 빠른 제품 주기를 잇는다.

기술적 의미

이번 발표의 핵심은, AI 인프라 수요가 여전히 공급을 압도하고 있으며 그 성장의 동력이 ‘학습’에서 ‘추론’으로 옮겨 가고 있음을 시장 규모로 확인시켰다는 점이다. 1조 달러라는 누적 주문 규모는 데이터센터 투자가 단기 유행이 아니라 구조적 확장 국면에 있음을 보여 준다. 이는 같은 섹션의 ‘오픈AI 할라페뇨’ 같은 맞춤형 칩의 부상과 대비를 이루는데, 엔비디아는 범용성과 ‘쿠다(CUDA)’ 소프트웨어 생태계라는 강점으로 여전히 시장을 주도한다. 다만 중국 시장 제약과 고객사의 자체 칩 개발 확대, 전력·냉각 등 데이터센터 인프라의 물리적 한계는 향후 성장의 변수로 남는다.

국내 · AI 반도체·NPU · 퓨리오사AI·리벨리온

‘구호에서 실물로’ — 국산 NPU, 추론 시장 겨냥해 잇단 양산

해외 거대 기업이 주도하는 AI 반도체 시장에서, 한국 토종 기업들이 자체 신경망처리장치(NPU)를 잇달아 양산하며 존재감을 키우고 있다. 퓨리오사AI는 2026년 초부터 2세대 NPU ‘레니게이드(RNGD)’ 양산을 시작하였는데, 이 칩은 엔비디아의 고성능 GPU인 ‘H100’과 견주어 ‘전력당 초당 토큰 생성량’이 약 2.7배 높은 것으로 알려졌다. 리벨리온은 NPU 칩 ‘리벨’ 4개를 하나의 패키지에 칩렛(chiplet) 형태로 묶은 신제품 ‘리벨쿼드(RebelQuad)’를 상반기 중 양산하고, 고대역폭메모리(HBM)를 탑재해 상위 GPU 시장까지 겨냥하는 차세대 ‘리벨100’ 개발에 힘을 싣고 있다. 두 회사가 공통으로 겨냥하는 영역은 AI 추론(inference)으로, 값비싼 고성능 GPU 대신 저렴하고 전력 소모가 적으면서 일정 수준의 연산력을 갖춘 칩을 찾는 수요에 대응하는 전략이다. NPU는 인공지능 연산에 특화한 반도체를 뜻한다.

기술적 의미

이번 흐름의 핵심은, AI 반도체 경쟁의 무게중심이 ‘추론’으로 이동하면서, 전력효율과 가격을 앞세운 국산 NPU에 실질적 시장 기회가 열리고 있다는 점이다. 학습용 최고성능 GPU 시장은 엔비디아가 사실상 독점하지만, 완성된 모델을 대량 서비스하는 추론 시장은 비용·전력이 관건이어서 특화 칩의 경쟁력이 부각된다. 국산 NPU의 양산은 ‘설계도(구호)’에 머물던 기술이 ‘제품(실물)’과 매출로 전환되는 단계에 들어섰음을 뜻하며, 본 브리핑이 다룬 ‘국가 AI 컴퓨팅 인프라’ 전략과 맞물려 기술 주권의 한 축을 이룰 수 있다. 다만 엔비디아 ‘쿠다’에 견줄 소프트웨어 생태계 확보, 글로벌 고객 검증과 양산 수율은 지속적으로 넘어야 할 과제다.

03
IT 산업
IT Industry
해외 · AI 인프라·데이터센터 · Blackstone

‘AI 인프라로 자본이 몰린다’ — 블랙스톤, 일본 데이터센터에 300억 달러

세계 최대 대체투자 운용사 블랙스톤(Blackstone)이 일본의 인공지능(AI) 데이터센터에 대규모 자본을 투입한다. 블랙스톤은 향후 3~5년에 걸쳐 일본 AI 데이터센터에 약 300억 달러를 투자할 계획이라고, 조너선 그레이 사장 겸 최고운영책임자(COO)가 밝혔다고 니혼게이자이신문(닛케이)이 보도하였다. 회사는 합산 1기가와트(GW)를 넘는 대규모 전력 용량의 프로젝트를 검토하고 있는데, 이는 차세대 AI 서비스를 뒷받침하는 데 필요한 방대한 연산 자원의 규모를 보여 준다. 블랙스톤은 2024년 캐나다연금투자위원회(CPP Investments)와 함께 아시아·태평양 지역 최대 하이퍼스케일 데이터센터 플랫폼의 하나인 에어트렁크(AirTrunk)를 인수하며 이 분야 기반을 다진 바 있다. 데이터센터는 AI 모델의 학습·추론을 수행하는 물리적 토대로, 최근 금융자본이 몰리는 대표적 실물 자산으로 부상하였다.

기술적 의미

이번 투자의 핵심은, AI 경쟁의 승부처가 모델·칩을 넘어 ‘이를 구동할 전력과 데이터센터’로 확장되고 있으며, 그 막대한 자본을 사모펀드 등 금융자본이 공급하는 국면이 뚜렷해졌다는 점이다. 1GW를 넘는 전력 용량 검토는, AI 인프라의 병목이 이제 반도체뿐 아니라 전력·부지·냉각으로 넓어졌음을 시사한다. 일본을 겨냥한 것은 안정적 전력·정치적 안정성과 아시아 수요를 함께 노린 포석으로 읽힌다. 이는 본 호가 다룬 ‘삼성·SK 충청권 240조 투자’ 등 아시아 각국의 인프라 확충 흐름과 맞물린다. 다만 대규모 데이터센터의 전력 확보와 지역사회 수용성, AI 수요가 투자 회수 기간 내내 유지될지에 대한 불확실성은 위험 요인으로 남는다.

해외 · AI 소프트웨어·M&A · Qualcomm

‘쿠다에 도전한다’ — 퀄컴, AI 소프트웨어 기업 모듈러 약 39억 달러 인수

모바일 칩 강자 퀄컴(Qualcomm)이 데이터센터 진출을 위해 AI 소프트웨어 역량을 사들였다. 퀄컴은 AI 플랫폼 개발사 모듈러(Modular)를 약 39억 달러(주식 교환) 규모에 인수하기로 하고, 2026년 하반기 중 거래를 마무리할 예정이라고 밝혔다. 모듈러는 개발자가 서로 다른 칩 구조에서도 코드를 다시 쓰지 않고 AI 소프트웨어를 실행할 수 있게 하는 독자 프로그래밍 언어·플랫폼을 보유하고 있어, 엔비디아의 ‘쿠다(CUDA)’와 AMD의 ‘로캠(ROCm)’ 같은 기존 생태계에 도전하는 세력으로 평가돼 왔다. 퀄컴은 이 인수로 자사 모바일·엣지(단말) 프로세서에 맞춰 AI 작업을 최적화하는 소프트웨어 계층을 확보하게 된다. 모듈러는 인수 발표 9개월 전 16억 달러 기업가치로 2억 5,000만 달러를 조달한 바 있다.

기술적 의미

이번 인수의 핵심은, AI 반도체 경쟁의 승부가 하드웨어 성능만이 아니라 ‘소프트웨어 생태계’에서 갈린다는 인식을 다시 확인시켰다는 점이다. 엔비디아의 강력한 해자(垓子)는 칩 자체보다 개발자들이 오랫동안 쌓아 온 쿠다 소프트웨어 자산에 있는데, 여러 칩에서 코드 수정 없이 돌아가는 모듈러의 기술은 이 종속을 완화할 잠재력을 지닌다. 퀄컴으로서는 이를 확보해 데이터센터·엣지 AI 시장에서 경쟁력을 높이려는 포석이다. 이는 본 섹션의 ‘엔비디아 1조 달러 주문’ ‘오픈AI 할라페뇨’와 함께, 칩·소프트웨어·인프라를 아우르는 AI 반도체 패권 경쟁의 다면성을 보여 준다. 다만 인수 발표가 곧 성공을 뜻하지는 않으며, 이질적 조직·기술의 통합과 규제 승인은 남은 변수다.

국내 · 반도체 투자·클러스터 · 삼성전자·SK하이닉스

충청을 ‘반도체·AI 메카로’ — 삼성·SK하이닉스, 240조 원 투자 발표

한국의 대표 반도체 기업들이 충청권을 첨단산업 거점으로 키우기 위한 대규모 투자 계획을 내놓았다. 삼성전자와 SK하이닉스는 7월 2일 충남 아산 삼성디스플레이 캠퍼스에서 열린 ‘충청권 첨단산업 발전비전 국민보고회’에서 각각 140조 원과 100조 원, 합계 240조 원 규모의 투자 계획을 발표하였다. 삼성전자는 온양·천안에 56조 원을 들여 고대역폭메모리(HBM) 팹(생산 공장)을 구축하고, 유기발광다이오드(OLED)·차세대 디스플레이 라인, AI 서버용 고성능 패키지 기판, 최첨단 배터리 신공법 라인 등에 투자한다. SK하이닉스는 충북 청주에 100조 원을 투입해 80조 원 규모의 신규 낸드플래시 팹 ‘M17’과 20조 원 규모의 첨단 패키징 팹 ‘P&T7’을 짓고, 1기가와트(GW)급 AI 데이터센터까지 검토한다. 이는 충청 지역을 반도체·AI·디스플레이 산업의 글로벌 전초기지로 육성하려는 구상이다.

기술적 의미

이번 발표의 핵심은, 앞서 예고된 국가 차원의 대규모 반도체·AI 투자가 ‘충청권’이라는 구체적 지역 거점과 세부 설비 계획으로 구체화되었다는 점이다. HBM은 AI 가속기에 데이터를 빠르게 공급하는 핵심 부품이고 낸드·첨단 패키징은 AI 데이터센터 수요와 직결되므로, 이번 증설은 폭증하는 AI 메모리 수요에 대응해 생산능력을 선제 확보하려는 행보로 읽힌다. SK하이닉스가 1GW급 데이터센터까지 검토하는 것은, 소자 생산을 넘어 ‘연산 인프라’까지 사업 영역을 넓히려는 시도로 해석된다. 다만 반도체는 호황·불황의 진폭이 큰 사이클 산업인 만큼 대규모 증설의 공급 과잉 위험, 전력·용수·인력 확보, 투자의 실제 집행 속도는 성패를 가를 변수로 남는다.

04
인공지능 · 머신러닝
AI & Machine Learning
해외 · 거대언어모델(LLM)·에이전트 · Anthropic

‘가장 싸고 가장 자율적인 소네트’ — 앤스로픽, 클로드 소네트 5 공개

고성능 AI를 더 낮은 비용으로 자율 구동하려는 흐름이 뚜렷해졌다. 앤스로픽(Anthropic)은 6월 30일 자사에서 가장 ‘에이전트적(자율 작업)’인 중급 모델 ‘클로드 소네트 5(Claude Sonnet 5)’를 공개하였다. 이 모델은 스스로 계획을 세우고 브라우저·터미널 같은 도구를 사용하며 장시간 자율적으로 과업을 수행하는데, 회사는 그 수준이 “불과 몇 달 전만 해도 더 크고 비싼 모델이라야 가능했던 것”이라고 설명하였다. 한 에이전트형 코딩 평가에서 소네트 5는 63.2%를 기록해 상위 모델 ‘오퍼스 4.8’(69.2%)에는 못 미쳤으나 직전 ‘소네트 4.6’(58.1%)을 앞섰고, 지식노동(knowledge work) 평가에서는 오퍼스 4.8을 소폭 웃돌았다. 가격은 8월 31일까지 도입가로 100만 토큰당 입력 2달러·출력 10달러(이후 3달러·15달러)로 책정돼, 자율 에이전트를 저렴하게 돌릴 수 있게 하였다. 안전성 평가에서도 소네트 4.6보다 바람직하지 않은 행동 비율이 낮아 에이전트 환경에서 더 안전하다고 회사는 밝혔다.

기술적 의미

이번 공개의 핵심은, 최전선 AI의 경쟁 축이 ‘질문에 답하는 능력’에서 ‘도구를 써서 장시간 과업을 완수하는 자율성’으로 옮겨 가는 가운데, 그 자율성의 ‘단가(單價)’를 크게 낮췄다는 점이다. 값비싼 최상위 모델에 필적하는 에이전트 성능을 중급 가격에 제공하면, 코딩·업무 자동화 등에서 AI를 대량으로 상시 구동하는 ‘에이전트 경제’가 한층 빠르게 확산될 수 있다. 이는 본 브리핑이 앞서 다룬 오픈AI GPT-5.6의 자율 작업 강화 흐름과 궤를 같이하며, 추론 비용을 낮추려는 ‘맞춤형 추론 칩’ 경쟁(본 호 컴퓨팅 섹션)과도 맞물린다. 다만 벤치마크 수치와 실제 업무 성능의 간극, 자율 에이전트의 오작동·오남용 위험 관리는 정식 확산 과정에서 계속 검증되어야 한다.

해외 · 생성형 미디어·멀티모달 · Google

4초 만에 그리는 이미지 — 구글, 초저지연 ‘나노바나나 2 라이트’ 공개

생성형 AI의 경쟁이 성능뿐 아니라 ‘속도와 단가’로 옮겨 가고 있다. 구글(Google)은 6월 30일 자사 ‘나노바나나(Nano Banana)’ 계열에서 가장 빠르고 비용 효율이 높은 이미지 생성 모델 ‘나노바나나 2 라이트(Nano Banana 2 Lite)’를 공개하였다. 이 모델은 글에서 이미지를 만드는 작업을 약 4초 만에 처리하며, 가격은 이미지 1,000장당 약 0.034달러로 이전 모델의 절반 수준으로 낮추고 지연 시간도 20초에서 4초로 단축하였다. API 모델 식별자는 ‘gemini-3.1-flash-lite-image’이며, 구글 AI 스튜디오·제미나이(Gemini) API·기업용 에이전트 플랫폼 등에서 제공된다. 저지연 이미지 생성과 대량 창작 파이프라인, 광고 시안·시제품 등 반복 작업에 적합하다는 설명이다. 이 모델은 초당 약 0.10달러의 영상 미리보기 모델 ‘제미나이 옴니 플래시(Gemini Omni Flash)’와 함께 공개되어, 이미지에서 영상으로 이어지는 제작 흐름을 겨냥하였다.

기술적 의미

이번 공개의 핵심은, 생성형 AI가 ‘한 장을 더 잘 그리는’ 경쟁에서 ‘대량의 콘텐츠를 값싸고 빠르게 뽑아내는’ 실용·운영 국면으로 넘어가고 있음을 보여 준다는 점이다. 지연 시간을 5분의 1로 줄이고 단가를 절반으로 낮춘 것은, 광고·전자상거래·미디어 등에서 이미지·영상을 상시 자동 생성하는 워크플로를 경제적으로 가능케 한다. 이미지와 영상 모델을 짝지어 내놓은 것은, 텍스트→이미지→영상으로 이어지는 ‘멀티모달 생산 라인’을 선점하려는 전략으로 읽힌다. 이는 본 섹션의 ‘저비용 에이전트’ 흐름과 함께, AI가 연구실 데모를 넘어 산업 현장의 상시 도구로 자리 잡는 추세를 방증한다. 다만 저비용·대량 생성은 저작권·진위(딥페이크) 문제와 콘텐츠 범람이라는 부작용도 키울 수 있어, 출처 표시·워터마크 등 안전장치의 병행이 요구된다.

국내 · 에이전틱 AI·플랫폼 · 네이버·카카오

‘2026년은 에이전트 전쟁’ — 네이버 ‘에이전트 N’·카카오 ‘카나나’ 맞대결

국내 양대 플랫폼 기업이 ‘스스로 행동하는 AI’를 앞세워 2026년을 에이전틱(자율형) AI 경쟁의 원년으로 삼았다. 네이버는 통합 AI 에이전트 ‘에이전트 N’을 중심으로 검색·쇼핑·지도·결제 등 자사 전 서비스의 데이터를 연결해, 이용자의 요청에 따라 탐색에서 예약·결제·일정 관리까지 한 번에 처리하는 구조를 준비 중이다. 카카오는 메신저 기반의 초개인화 AI ‘카나나(Kanana)’를 앞세워, 온디바이스(단말 내장) 모델과 함께 ‘카나나 인 카카오톡’, 생성형 검색 ‘카나나 서치’ 등으로 자체 에이전트 서비스를 확대한다는 구상이다. 에이전틱 AI는 단순히 정보를 제공하는 단계를 넘어, 이용자의 의도를 이해하고 행동을 대신 수행하는 방향으로의 진화를 뜻한다. 두 회사는 각각 커머스(상거래)와 메신저라는 강점을 축으로 관계형·거래형 AI 생태계를 넓히려 하고 있다.

기술적 의미

이번 경쟁의 핵심은, 해외 최전선 모델이 ‘범용 자율 에이전트’를 향해 나아가는 사이, 국내 기업은 ‘자사가 보유한 방대한 서비스·데이터에 결합한 실용 에이전트’로 차별화를 꾀하고 있다는 점이다. 검색·쇼핑·결제·메신저 등 국민 다수가 쓰는 접점에 에이전트를 심으면, 모델 성능의 절대 우위가 아니더라도 데이터·유통망의 강점으로 실사용 가치를 만들 수 있다. 이는 본 브리핑이 앞서 다룬 ‘소버린 AI 파운데이션 모델’ 경쟁과 함께, 한국 AI 전략이 ‘기반 모델’과 ‘응용 서비스’ 양면에서 전개되고 있음을 보여 준다. 다만 에이전트가 결제·예약 등 실제 행동을 대행하는 만큼, 오작동·보안·개인정보 보호와 수익화 모델의 실효성은 성패를 가를 관건으로 남는다.

종합 평가

‘추론의 시대’가 열리다 — 과학은 극한을 실험실로 끌어오고, 산업은 그 연산을 값싸게 만들다

오늘의 동향을 관통하는 첫 번째 흐름은 ‘멀리 있거나 극단적인 것을 실험실로 끌어오는 과학’이다. 국제 연구진은 블랙홀이 내뿜는 미약한 호킹 복사의 생성 과정을 광섬유 아날로그로 재현해 그것이 단순·직접적인 과정임을 ‘네이처’에 보였고, 한국과학기술원(KAIST)은 원유를 끓이지 않고 상온의 막으로 걸러 내는 분리막으로 100년 된 정유 공정을 다시 설계할 실마리를 제시하였으며, 다른 연구진은 사라지기 쉬운 자성 파동 마그논의 수명을 100배로 늘려 동전 크기 양자컴퓨터의 가능성을 열었다. 과학은 ‘관측 불가능한 것을 모사하고, 뜨거운 공정을 상온으로 낮추며, 짧은 것을 길게 붙드는’ 정밀의 방향으로 전진하였다.

두 번째 흐름은 ‘추론(推論)의 시대가 칩과 자본의 배열을 다시 짜는’ 국면이다. AI 연산의 무게중심이 모델 학습에서 완성된 모델의 대량 서비스, 곧 추론으로 옮겨 가면서, 오픈AI는 브로드컴과 추론 특화 맞춤형 칩 ‘할라페뇨’를 9개월 만에 내놓았고, 엔비디아는 ‘베라 루빈’ 전량 양산과 1조 달러 주문으로 시장의 구조적 확장을 확인하였으며, 한국의 퓨리오사AI·리벨리온은 전력효율을 앞세운 국산 NPU로 추론 시장을 파고들었다. 동시에 자본은 ‘연산을 담을 그릇’으로 몰려, 블랙스톤은 일본 데이터센터에 300억 달러를, 퀄컴은 소프트웨어 종속을 흔들 모듈러를 39억 달러에 사들였고, 삼성전자·SK하이닉스는 충청권에 240조 원을 투입해 HBM·낸드·데이터센터를 함께 키우기로 하였다. 칩·소프트웨어·인프라·자본이 모두 ‘추론을 더 싸게’라는 한 방향을 가리켰다.

세 번째 흐름은 ‘더 싸고 더 자율적으로 진화하는 인공지능’이다. 앤스로픽은 최상위 모델에 필적하는 자율 에이전트 성능을 중급 가격에 담은 ‘클로드 소네트 5’를, 구글은 이미지 생성을 4초·절반 단가로 낮춘 ‘나노바나나 2 라이트’를 내놓아 AI를 산업 현장의 상시 도구로 밀어 넣었고, 국내에서는 네이버 ‘에이전트 N’과 카카오 ‘카나나’가 서비스·데이터에 결합한 실용 에이전트로 맞붙었다. 이러한 능력·가격의 동시 개선은 시장 판도에도 영향을 주어, 오픈AI가 구글·앤스로픽의 추격에 직면했다는 관측도 함께 제기된다. 앞으로 주목할 변수는 첫째 추론용 맞춤형 칩과 국산 NPU가 엔비디아의 소프트웨어 생태계 우위를 실제로 잠식할 수 있을지, 둘째 데이터센터로 몰린 대규모 자본이 전력·부지의 물리적 한계와 반도체 사이클 위험을 넘어 성과로 이어질지, 셋째 저비용 자율 에이전트의 확산이 오작동·보안·저작권 문제를 관리하며 신뢰를 얻을지다. ‘추론의 시대’가 문을 연 하루, 과학이 넓힌 가능성과 산업이 낮춘 단가가 어디까지 현실의 가치로 전환되느냐가 모든 영역의 공통 과제로 남았다.