해외 · 거대언어모델(LLM) · xAI
스페이스X·테슬라서 먼저 시험 — xAI, 1.5조 매개변수 ‘그록 4.5’ 비공개 베타
일론 머스크가 이끄는 xAI가 차세대 대규모 언어모델 ‘그록 4.5(Grok 4.5)’를 계열사에서 먼저 시험하기 시작하였다. 머스크는 6월 28일 그록 4.5가 스페이스X와 테슬라에서 비공개 베타(private beta)에 들어갔다고 밝혔다. 이 모델은 xAI의 1.5조(1.5T) 매개변수 규모 ‘V9’ 기반 모델 위에 코딩 도구(커서) 데이터를 추가 학습해 구축되었으며, V9의 사전학습은 5월 26일 마무리되었다. 강화학습(RL)은 진행 중이고, 코드 실행을 돕는 ‘그록 빌드(Grok Build)’ 도구도 매일 개선되고 있다고 회사는 설명하였다. 머스크는 초기 평가에서 그록 4.5의 성능이 앤스로픽의 최상위 모델 ‘클로드 오퍼스’에 근접하거나 웃돈다고 주장하였으나, xAI는 아직 벤치마크나 시스템 카드(안전성 문서)를 공개하지 않아 이러한 성능 주장은 검증되지 않은 상태다. 일반 공개 시점과 확대 배포 계획도 아직 제시되지 않았다.
기술적 의미
이번 시험의 핵심은, 프런티어 AI 개발이 ‘거대 기반모델 + 특정 작업 데이터의 추가 학습 + 도구 사용 강화’라는 방식으로 수렴하는 가운데, 자사 계열사를 실사용 시험대로 삼아 빠르게 반복 개선하는 xAI식 개발 전략을 보여 준다는 점이다. 1.5조 매개변수라는 규모는 모델 대형화 경쟁이 이어짐을 시사하지만, 성능은 규모만이 아니라 강화학습·도구 연동의 완성도에 좌우된다. 이는 본 브리핑이 앞서 다룬 앤스로픽·구글·오픈AI의 자율 에이전트·코딩 성능 경쟁과 같은 궤도에 있다. 다만 벤치마크와 안전성 문서가 공개되지 않은 단계의 성능 주장은 신중히 받아들일 필요가 있으며, 실제 공개 후 독립적 평가로 검증되어야 한다.
해외 · 멀티모달·추론모델 · Google
200만 토큰의 문맥 — 구글 ‘제미나이 3.5 프로’, 7월 정식 출시 임박
구글(Google)이 차세대 대표 AI 모델 ‘제미나이 3.5 프로(Gemini 3.5 Pro)’의 정식 출시를 7월로 예고하였다. 이 모델은 지난 5월 19일 개발자 행사 ‘구글 I/O’에서 처음 공개되었으며, 당초 6월 일반 공개(GA)를 목표로 하였으나 기업 대상 초기 시험 이후 ‘품질 보정’을 이유로 7월로 일정을 미뤘다. 6월 29일 보도에 따르면 제미나이 3.5 프로는 7월 출시가 사실상 확정된 상태다. 이 모델의 최대 강점은 한 번에 처리할 수 있는 문맥(컨텍스트) 창이 200만 토큰에 이른다는 점으로, 이는 현재 상용 프런티어 모델 가운데 가장 큰 규모다. 또한 복잡한 다단계 문제를 오래 ‘숙고’하도록 설계된 추론 모드 ‘딥싱크(Deep Think)’를 탑재하였는데, 이는 월 250달러의 최상위 ‘울트라’ 구독에 한해 제공된다. 구글은 아직 공식 벤치마크를 공개하지 않았다.
기술적 의미
이번 출시 예고의 핵심은, AI 모델 경쟁이 ‘얼마나 긴 맥락을 한 번에 다루는가’와 ‘얼마나 깊이 추론하는가’라는 두 축으로 심화되고 있음을 보여 준다는 점이다. 200만 토큰의 문맥 창은 방대한 문서·코드베이스·장시간 대화를 통째로 입력해 처리할 수 있어, 기업용 문서 분석이나 대규모 코딩 작업에서 실용적 이점을 준다. 별도의 추론 모드를 최상위 구독에 배치한 것은, ‘더 깊이 생각하는 연산’을 프리미엄 상품으로 분리하는 가격 전략의 사례다. 이는 본 섹션의 그록 4.5, 그리고 본 브리핑이 앞서 다룬 앤스로픽 클로드 계열과 함께 프런티어 경쟁의 다면성을 드러낸다. 다만 공식 벤치마크 부재와 반복된 출시 연기는, 대형 모델의 품질·안전성 검증이 그만큼 까다로워졌음을 방증한다.
국내 · 소버린 AI·파운데이션 모델 · LG·SKT·업스테이지
‘국가대표 AI’ 경쟁 가속 — LG 엑사원·SKT·업스테이지, 독자 파운데이션 모델 선두
해외 빅테크의 초거대 모델 경쟁 속에서, 한국은 정부 주도의 ‘독자(소버린) AI 파운데이션 모델’ 개발로 기술 주권 확보에 나서고 있다. 과학기술정보통신부는 구조 설계·데이터 구축·가중치 초기화·학습의 전 과정을 국내에서 수행하는 ‘독자 파운데이션 모델’ 사업을 추진하며, 1차 평가에서 LG AI연구원·SK텔레콤·업스테이지를 통과시키고 네이버·엔씨는 탈락시켰다. 각 팀은 규모가 다른 모델을 제시하였는데, SK텔레콤은 약 5,190억 매개변수의 초대형 모델을, LG AI연구원은 2,360억 매개변수 모델을, 업스테이지는 1,000억 매개변수 모델을 내놓았다. LG AI연구원은 이 사업 평가에서 종합 1위를 기록하였으며, 앞서 4월에는 텍스트와 이미지를 함께 이해·추론하는 멀티모달 모델 ‘엑사원(EXAONE) 4.5’를 공개하는 등 국가대표급 성능을 이어 가고 있다. 이 사업은 미·중 빅테크에 대한 의존을 줄이고 국내 산업·공공 부문에 특화한 기반 모델을 확보하려는 전략의 일환이다.
기술적 의미
이번 경쟁의 핵심은, AI 기반 모델을 외국 기업에 의존하지 않고 자체 기술로 확보하려는 ‘소버린 AI’ 전략이 한국에서 정부 사업과 기업 경쟁으로 구체화되고 있다는 점이다. 파운데이션 모델은 검색·문서·상담 등 수많은 응용의 토대가 되므로, 이를 국내 언어·데이터·규제에 맞춰 자립적으로 갖추는 것은 산업 경쟁력과 데이터 주권 양면에서 의미가 크다. 이는 본 브리핑이 앞서 다룬 네이버·카카오의 에이전트 경쟁과 함께, 한국 AI 전략이 ‘기반 모델(주권 확보)’과 ‘응용 서비스(실사용 가치)’ 양면에서 전개되고 있음을 보여 준다. 다만 초거대 모델의 학습 비용과 최고 성능 모델과의 격차, 실제 산업 현장에서의 채택률을 끌어올리는 것은 남은 과제로 지적된다.