해외 · 프런티어 모델 · OpenAI
차세대 ‘GPT-5.6’ 공개 — ‘솔·테라·루나’ 3종, 에이전트 성능 큰 폭 향상
인공지능 모델 경쟁이 다시 한 단계 도약하였다. 오픈AI(OpenAI)는 6월 26일, 차세대 모델 ‘GPT-5.6’ 계열을 제한적으로 프리뷰(preview)하기 시작하였다. 새 계열은 최상위 ‘솔(Sol)’, 일상 업무용 균형 모델 ‘테라(Terra)’, 빠르고 저렴한 ‘루나(Luna)’의 세 가지로 구성된다. 오픈AI가 공개한 지표에 따르면, 명령줄 환경에서 컴퓨터를 다루는 능력을 측정하는 ‘터미널-벤치(Terminal-Bench)’에서 ‘솔 울트라(Sol Ultra)’는 91.9%, ‘솔’은 88.8%, ‘테라’는 84.3%, ‘루나’는 82.5%를 기록하여, 직전 세대인 GPT-5.5(83.4%)를 전반적으로 앞질렀다. 특히 ‘테라’는 GPT-5.5에 필적하는 성능을 약 2배 저렴한 비용으로 제공하고, ‘루나’는 가장 낮은 비용에서 강력한 능력을 낸다는 점이 강조되었다. 오픈AI는 이들 모델을 “향후 수 주 내” 일반 공개할 계획이라고 밝혔다.
기술적 의미
이번 공개의 핵심은, 모델 경쟁의 척도가 ‘질문에 잘 답하기’에서 ‘도구를 다루고 작업을 끝까지 수행하는 에이전트(agent) 능력’으로 옮겨갔음을, 터미널·코딩 중심의 벤치마크 향상으로 보여 준다는 점이다. 또한 ‘솔·테라·루나’로 성능·비용을 계층화한 것은, 모든 작업에 최고 성능 모델을 쓰기보다 ‘작업 난도에 맞춰 모델을 배분’해 효율을 높이려는 산업 흐름과 맞닿는다. 본 호 ‘구글 제미나이 3.5 플래시’ 항목과 함께 보면, 주요 AI 기업들이 ‘플래그십+경량’의 모델 군(群)을 동시에 운영하며 가격 경쟁과 성능 경쟁을 병행하고 있음이 드러난다. 다만 GPT-5.6은 본 호 다음 항목에서 다루듯 ‘정부 승인 고객’에게만 제한 공개된 상태로, 실제 성능과 범용성은 일반 공개 이후 독립적 벤치마크로 검증되어야 한다.
해외 · AI 거버넌스·국가안보 · 美 정부
가장 강한 모델은 ‘정부의 문’ 앞에 — 美, 프런티어 AI ‘승인 고객’에만 허용
첨단 인공지능의 ‘성능 경쟁’과 ‘국가 통제’가 같은 날 정면으로 마주쳤다. 미국 정부는 6월 26일, 두 미국산 프런티어 모델을 동시에 ‘게이팅(gating)’하였다. 앤트로픽(Anthropic)의 ‘미토스(Mythos) 5’는 신뢰할 수 있는 약 100곳의 미국 기관·기업에 한해 재승인되었고, 오픈AI의 ‘GPT-5.6 솔’은 정부가 개별 승인한 파트너에게만 프리뷰가 허용되었다. 이 조치의 법적 근거는 6월 2일자 ‘AI 행정명령(executive order)’으로, 진보된 사이버 능력을 가진 것으로 판단되는 모델에 대해 출시 전 정부가 최대 30일간 사전 접근권을 갖도록 프런티어 AI 기업에 ‘자발적’ 협조를 요청하는 내용을 담고 있다. 앞서 같은 달 미국 정부는 앤트로픽 모델의 출시를 한때 전면 차단하기도 했는데, 이는 미국 당국이 상용 AI 모델을 ‘오프라인’으로 강제한 첫 사례로 기록되었다. 두 기업은 정부 방침을 따르면서도 공개적으로 이의를 제기하였다.
기술적 의미
이번 사안의 핵심은, 첨단 AI가 반도체·암호처럼 ‘이중 용도(dual-use)’ 기술로 공식 인식되면서, 정부가 ‘출시 여부’와 ‘누구에게·어떤 조건으로 허용할지’를 직접 조율하는 단계에 들어섰음을 보여 준다는 점이다. 이는 ‘직전 호(제180호)’가 다룬 ‘앤트로픽 미토스의 제한적 출시’가 단발성 조치가 아니라, 6·2 행정명령에 기반해 ‘오픈AI·앤트로픽 양대 기업’을 아우르는 ‘체계적 사전 통제’로 확장되었음을 드러낸다. 모델이 강력할수록 산업적 가치와 오·남용 위험이 함께 커지므로, ‘전면 개방’과 ‘전면 차단’ 사이의 ‘제한적·조건부 출시’가 현실적 절충점으로 부상하고 있다. 오픈AI는 “이런 정부 접근 절차가 장기 표준이 되어서는 안 된다”고 했고, 앤트로픽은 “해당 기준이 산업 전반에 일반화되면 치명적일 수 있다”고 경고하였다. 본 호 ‘GPT-5.6’ 항목과 함께 보면, ‘가장 앞선 모델일수록 가장 먼저 정부의 문을 통과해야 하는’ 역설이 AI 산업의 새 상수(常數)로 자리 잡고 있음이 확인된다. 다만 ‘선별적 허용’의 실효성과 형평성은 구체적 기준의 투명성에 달려 있다.
해외 · 모델 경쟁 · Google / Meta
구글은 ‘제미나이 3.5 플래시’ 정식 출시 — 메타는 ‘아보카도’ 지연 끝 라이선스 검토
프런티어 모델 경쟁에서 기업 간 명암이 엇갈렸다. 구글(Google)은 ‘제미나이(Gemini) 3.5 플래시’의 정식 출시(GA) 버전을 공개하였다. 회사 측은 이 모델을 에이전트·코딩 과제에서 지속적인 최전선 성능을 내는 ‘가장 지능적인’ 모델로 소개하였으며, 같은 시기 구형 이미지·영상 생성 모델(제미나이 3.1 플래시 이미지, 3 프로 이미지 프리뷰 등)은 6월 25일과 30일에 걸쳐 단계적으로 종료(deprecation)된다고 안내하였다. 반면 메타(Meta)는 자체 차세대 모델 ‘아보카도(Avocado)’의 출시를 거듭 연기하였다. 당초 2026년 3월로 예정되었던 이 모델은 경쟁사의 선도 모델을 따라잡지 못한다는 이유로 최소 5월 이후로 미뤄졌으며, 일부 보도에 따르면 메타는 자체 개발과 별개로 구글 제미나이의 라이선스(license) 도입까지 검토하는 것으로 전해졌다.
기술적 의미
이번 동향의 핵심은, 프런티어 모델 개발이 ‘자본과 인재를 갖춘 빅테크라도 결코 보장된 성공이 아니다’라는 냉정한 현실을 보여 준다는 점이다. 구글이 ‘플래시’ 계열로 ‘성능 대비 비용’ 경쟁을 주도하는 사이, 메타는 핵심 모델의 지연으로 한때 ‘자체 개발’이라는 노선 자체를 재고하는 처지에 놓였다. 메타가 경쟁사 모델의 라이선스 도입을 검토한다는 점은, ‘모든 빅테크가 최상위 모델을 자체 보유한다’는 가정이 흔들리고 있음을 시사한다. 본 호 ‘오픈AI GPT-5.6’ 항목과 함께 보면, 모델 경쟁이 ‘소수 선두’와 ‘추격 그룹’으로 분화하며, 추격자에게는 ‘직접 개발이냐, 외부 라이선스냐’라는 전략적 선택이 부상하고 있음이 드러난다. 다만 메타의 라이선스 검토는 아직 보도 단계의 사안으로, 확정된 결정으로 보기는 이르다.
국내 · 추론 AI 모델 · 네이버 / LG
국산 AI의 약진 — 네이버 ‘하이퍼클로바X 씽크’·LG ‘엑사원’ 추론 경쟁
국내 인공지능 기업들도 ‘추론(推論·reasoning)’ 능력을 앞세워 글로벌 경쟁에 가세하고 있다. 네이버(NAVER)는 추론에 특화한 인공지능 ‘하이퍼클로바X 씽크(HyperCLOVA X THINK)’의 벤치마크 성적을 공개하였으며, 일부 평가에서 알리바바(Alibaba)·LG의 모델을 앞서는 결과를 제시하였다. LG AI연구원은 자사 ‘엑사원(EXAONE)’ 계열의 ‘K-엑사원’이 13개 벤치마크에서 평균 72.03점을 기록하였다고 밝혔다. 엑사원은 전문가 혼합(MoE)·하이브리드 어텐션 기술로 연산량과 메모리를 약 70% 절감하여, 상대적으로 보급형인 A100 GPU에서도 구동이 가능해 중소기업의 도입 문턱을 낮춘 점이 특징으로 꼽힌다. ‘추론 모델’이란 단계적 사고를 통해 복잡한 문제를 푸는 모델로, 수학·코딩·과학 등 정밀한 논리가 필요한 과제에서 특히 중요하다.
기술적 의미
이번 동향의 핵심은, 국산 AI가 ‘범용 성능’의 정면 승부를 넘어 ‘추론 특화’와 ‘효율(저비용 구동)’이라는 차별화 전략으로 입지를 넓히고 있다는 점이다. 거대 모델의 ‘추론’ 능력은 막대한 연산을 요구하지만, MoE·하이브리드 어텐션처럼 ‘필요한 부분만 계산하는’ 기법으로 비용을 낮추면, 자원이 제한된 기업·기관도 고성능 AI를 활용할 수 있다. 보급형 GPU에서 구동 가능하다는 점은, 본 호 IT 섹션의 ‘K-피지컬 AI 풀스택 전략’이 지향하는 ‘국산 생태계 확산’과도 맞닿는다. ‘직전 호(제180호)’의 ‘네이버 소버린 AI 인프라’와 종합하면, 국내 기업들이 ‘인프라(소버린)–모델(추론·효율)–응용’의 전 계층에서 독자 역량을 쌓아가고 있음이 드러난다. 다만 공개된 벤치마크 점수는 평가 방식에 따라 해석이 달라질 수 있으므로, 실제 경쟁력은 다양한 독립 평가와 실사용 사례로 검증되어야 한다.