엘론 머스크의 xAI, Grok 4 출시 및 가장 스마트한 AI로 선언

엘론 머스크의 AI 회사인 xAI가 최신이자 가장 강력한 인공지능(AI) 모델인 Grok 4를 공개하며, 이제 학문적, 추론 및 코딩 능력에서 이 분야를 선도한다고 주장했습니다.

머스크는 수요일 밤 X(구 트위터)에서 진행된 라이브 스트림 중에 이를 “세계에서 가장 스마트한 AI”라고 부르며 주저하지 않았습니다.

Grok 4 외에도 xAI는 복잡한 작업을 해결하기 위해 가상 “스터디 그룹”처럼 협력하는 여러 AI 에이전트를 사용하는 더 발전된 변형인 Grok 4 Heavy를 출시했습니다. 이 출시에는 이 강력한 모델에 대한 접근을 월 $300에 제공하는 새로운 최고급 구독 계획인 SuperGrok Heavy도 포함됩니다.

벤치마크 전투: Grok과 경쟁자들

xAI에 따르면, Grok 4와 그 향상된 버전인 Grok 4 Heavy는 다양한 주요 AI 성능 벤치마크에서 구글의 Gemini 2.5 Pro 및 OpenAI의 o3-high와 같은 주요 경쟁자들을 능가했습니다:

인류의 마지막 시험(HLE): - Grok 4는 도구 없이 4%를 기록하며, Gemini 2.5 Pro(21.6%) 및 o3-high(21%)를 능가했습니다.
도구를 사용한 Grok 4 Heavy는 4%를 기록하며 Gemini의 26.9%를 크게 앞섰습니다.
ARC-AGI-2(패턴 인식 테스트): - Grok 4는 2%를 기록하며, 다음으로 좋은 모델인 Claude Opus 4의 거의 두 배에 달했습니다.
MMLU(대규모 다중 작업 언어 이해): - Grok 4는 6% 정확도를 달성하고 73의 지능 지수를 기록하며 차트를 선도했습니다.

“Grok 4는 제가 경험한 바로는 AI가 인터넷이나 책 어디에서도 찾을 수 없는 어려운 실제 공학 문제를 해결할 수 있었던 첫 번째 사례입니다. 그리고 훨씬 더 나아질 것입니다.”라고 머스크는 X에 게시했습니다.

STEM 및 코딩 분야에서 이 모델은 더욱 강력해 보입니다:

Grok 4 Heavy는 어려운 고등학교 수준의 수학 시험인 AIME에서 100%를 기록했으며, Grok 4는 98.8%를 기록했습니다.
GPQA에서 Grok 4는 87.5%를 기록했으며, Grok 4 Heavy 변형은 88.9%로 이를 초과했습니다.
코더들을 위해 xAI는 2025년 8월에 출시될 예정인 Grok 4 Code를 예고했으며, 이미 SWE-bench에서 72–75%의 정확도를 보이고 있습니다.

PhD와 Grok 4를 비교하면서 머스크는 “Grok 4는 모든 면에서 박사 수준의 대학원생과 같습니다. 박사보다 더 나은 — 예외 없음. 대부분의 박사는 Grok 4가 통과할 수 있는 곳에서 실패할 것입니다.”라고 말했습니다.

비록 그는 여전히 상식에 어려움을 겪고 있으며 새로운 기술이나 새로운 물리학을 발명하지 못했다고 인정했지만 – “아직” 그것은 단지 시간 문제일 뿐입니다.

새로운 가격

Grok 4 API 가격은 이전 모델과 동일하게 유지됩니다 — 입력 토큰 100만 개당 $3, 출력 토큰 100만 개당 $15($0.75 per 1M 캐시된 입력 토큰).

그러나 더 큰 놀라움은 xAI의 업데이트된 구독 라인업에 있습니다:

무료 티어 는 사용자에게 Grok 3에 대한 제한된 접근을 제공합니다.
SuperGrok 플랜 ($30/월) 은 Grok 3와 새로운 Grok 4 모두에 대한 접근을 해제합니다.
SuperGrok Heavy ($300/월) 는 Grok 4 Heavy, Grok 4 및 Grok 3에 대한 전체 접근을 제공하며, 다가오는 기능의 조기 미리보기도 포함됩니다.

Grok 4가 GPT-5와 경쟁할까?

xAI의 AI 공간 지배를 위한 추진은 OpenAI의 예상되는 GPT-5 출시가 여름 중반에 예정된 것과 맞물려 있습니다. Grok 4의 강력한 성능은 무시하기 어렵지만, 기업과 고객이 최근의 논란을 간과하고 머스크의 플랫폼을 선택할지는 여전히 의문입니다.

새 게시물을 받은 편지함에서 받기