イーロン・マスクのxAIがGrok 4を発表、最も賢いAIと宣言

イーロン・マスクのAI企業xAIが、最新かつ最強の人工知能（AI）モデルGrok 4を発表し、学術、推論、コーディング能力の分野でリーダーであると主張しています。

マスクは、遅い水曜日の夜にX（旧Twitter）でのライブストリーム中に「世界で最も賢いAI」と呼ぶことをためらいませんでした。

Grok 4に加えて、xAIはGrok 4 Heavyを発表しました。これは、複数のAIエージェントが仮想の「スタディグループ」のように協力して複雑なタスクを解決する、より高度なバリアントです。このリリースには、月額300ドルでこの強力なモデルにアクセスできる新しいトップティアのサブスクリプションプラン「SuperGrok Heavy」も含まれています。

ベンチマークバトル：Grok vs. 競合他社

xAIによると、Grok 4とその強化版であるGrok 4 Heavyは、さまざまな主要なAIパフォーマンスベンチマークでGoogleのGemini 2.5 ProやOpenAIのo3-highなどの主要な競合を上回っています：

人類の最後の試験（HLE）： - Grok 4はツールなしで4%を記録し、Gemini 2.5 Pro（21.6%）やo3-high（21%）を上回りました。
Grok 4 Heavyはツールを使用して4%を達成し、Geminiの26.9%を大きく上回りました。
ARC-AGI-2（パターン認識テスト）： - Grok 4は2%を記録し、次に優れたモデルであるClaude Opus 4のほぼ2倍です。
MMLU（大規模マルチタスク言語理解）： - Grok 4は6%の精度と73の知能指数スコアを達成し、チャートのトップに立ちました。

「Grok 4は、私の経験上、AIがインターネットや本のどこにも答えが見つからない難しい現実の工学問題を解決できた初めての例です。そして、さらに良くなるでしょう」とマスクはXに投稿しました。

STEMおよびコーディング分野では、このモデルはさらに強力に見えます：

Grok 4 Heavyは、難しい高校レベルの数学テストAIMEで100%を記録し、Grok 4は98.8%を達成しました。
GPQAでは、Grok 4が87.5%を記録し、Grok 4 Heavyバリアントが88.9%でそれを上回りました。
コーダー向けに、xAIは2025年8月に発売予定のGrok 4 Codeを予告しており、すでにSWE-benchで72–75%の精度を示しています。

マスクは、Grok 4をPhDと比較し、「Grok 4はすべてにおいて大学院レベル、PhDレベルです。PhDよりも優れています — 例外はありません。ほとんどのPhDはGrok 4が合格するところで失敗するでしょう」と述べました。

彼は、Grok 4が常識に苦しんでおり、新しい技術を発明したり新しい物理学を発見したりしていないことを認めましたが、「まだ」それは単なる時間の問題だと述べました。

新しい価格設定

Grok 4 APIの価格は前のモデルと同じで、入力トークン1百万あたり3ドル、出力トークン1百万あたり15ドル（キャッシュされた入力トークン1Mあたり0.75ドル）です。

しかし、より大きな驚きはxAIの更新されたサブスクリプションラインアップにあります：

無料プラン はユーザーにGrok 3への限られた アクセスを提供します。
SuperGrokプラン （月額30ドル） はGrok 3と新しいGrok 4の両方へのアクセスを解除します。
SuperGrok Heavy （月額300ドル） はGrok 4 Heavy、Grok 4、Grok 3への完全アクセスを提供し、今後の機能の早期プレビューも含まれます。

Grok 4はGPT-5と競争するのか？

xAIのAI分野での支配を目指す動きは、OpenAIのGPT-5の発表が今夏の後半に予想される直前に行われました。Grok 4の強力なパフォーマンスは無視できませんが、ビジネスや顧客が最近の論争を見過ごし、マスクのプラットフォームを選ぶかどうかは依然として疑問です。

新しい投稿を受信箱で受け取る