Grok 4 は博士号レベルと呼ばれ、月額 300 ドルのサブスクリプションを提供
マスクは公式に、Grok 4 が 2025 年 7 月 9 日に xAI の公式アカウントで太平洋時間夜 8 時のライブ配信を通じてリリースされることを発表しました。

Grok 4 は Grok 3 の後継として開発され、「3.5」というバージョンをリリースせずに直接飛躍しました。このモデルは主に 2 つのバリエーションで展開されます:通常の Grok 4 と Grok 4 Heavy。 「Heavy」バリエーションはマルチエージェント(multi-agent)バージョンで、高いパフォーマンスを提供すると約束されています。Grok 4 の注目すべき能力の一つはマルチモーダルであり、画像を分析しながらテキストも処理でき、ChatGPT や Gemini のような競合と同様です。
プレゼンテーションにおいて、xAI は Grok 4 が様々な AI ベンチマークで最先端のパフォーマンスを示したと主張しています。例えば、Humanity’s Last Exam という数学、人文科学、科学の能力を測る難しい試験で、Grok 4 は「ツール」なしで 25.4% のスコアを獲得し、Google Gemini 2.5 Pro(21.6%)や OpenAI の o3 モデル(21%)を上回りました。
追加の「ツール」を使った場合でも、Grok 4 Heavy は 44.4% のスコアを達成し、ツールを使った Gemini の 26.9% を大きく上回っています。視覚的パターン解決能力を評価する ARC-AGI-2 のテストでも、Grok 4 は 16.2% のスコアで商用モデルの中で新チャンピオンとなり、次点のモデル(Claude Opus 4)のほぼ倍の成績を収めました。
この進歩をイーロン・マスクは発売イベントで率直にまとめています。「学術問題に関しては、Grok 4 はすべての科目で博士号レベル以上の性能を持っています、例外はありません」と語りました。
マスクは依然として存在する弱点も認めています。例えば時折 Grok は常識的な判断を欠いたり、自ら新しい技術を創出できていないことなどですが、これは時間の問題だと確信しています。知能の向上に加え、xAI の今後の製品ロードマップには 8 月にリリース予定のコーディング特化モデル、9 月のマルチモーダルエージェント、10 月のジェネレーティブ動画モデルが含まれており、マスクの Grok の多様な分野での能力拡大へのヴィジョンを示しています。
Grok 4 の発表と同時に、xAI は SuperGrok Heavy という新しいサブスクリプションパッケージを月額 300 ドルで導入しました。これは xAI が提供するこれまでで最も高額なパッケージであり、他の大手 AI プロバイダー(OpenAI、Google、Anthropic)の最高級プランよりも高額です。SuperGrok Heavy の加入者は Grok 4 Heavy と未公開の実験機能へ早期アクセスが可能で、将来の xAI の AI 製品へのプレビューも含まれます。例えばコーディングモデル、高度なエージェント、または今後の動画モデルへの最初のアクセス権が得られると会社は述べています。
7 月 9 日の Grok 4 発売ライブ配信ではイーロン・マスクと xAI のリーダーが新モデルの性能と能力に焦点を当ててプレゼンテーションを行いました。マスクは前バージョンに比べて Grok 4 の進歩度合いを示し、特に Grok 4 Heavy の高度なベンチマーク突破の成功を強調しました。以前、Grok は政治的バイアスがある回答で注目を集め、マスクはそれを「重大な失敗」と呼びましたが、彼はチームが最新版でその問題を修正済みであることを確約しました。