Grok 4 は博士号レベルと呼ばれ、月額300ドルのサブスクリプションを提供

マスクは公式に、Grok 4が2025年7月9日にxAIの公式アカウントで太平洋時間夜8時のライブ配信を通じてリリースされることを発表しました。

Grok 4 は博士号レベルと呼ばれ、月額300ドルのサブスクリプションを提供

Grok 4はGrok 3の後継として開発され、「3.5」というバージョンをリリースせずに直接飛躍しました。このモデルは主に2つのバリエーションで展開されます:通常のGrok 4とGrok 4 Heavy。 「Heavy」バリエーションはマルチエージェント(multi-agent)バージョンで、高いパフォーマンスを提供すると約束されています。Grok 4の注目すべき能力の一つはマルチモーダルであり、画像を分析しながらテキストも処理でき、ChatGPTやGeminiのような競合と同様です。

Grok 4 は博士号レベルと呼ばれ、月額300ドルのサブスクリプションを提供

プレゼンテーションにおいて、xAIはGrok 4が様々なAIベンチマークで最先端のパフォーマンスを示したと主張しています。例えば、Humanity’s Last Examという数学、人文科学、科学の能力を測る難しい試験で、Grok 4は「ツール」なしで25.4%のスコアを獲得し、Google Gemini 2.5 Pro(21.6%)やOpenAIのo3モデル(21%)を上回りました。

Grok 4 は博士号レベルと呼ばれ、月額300ドルのサブスクリプションを提供

追加の「ツール」を使った場合でも、Grok 4 Heavyは44.4%のスコアを達成し、ツールを使ったGeminiの26.9%を大きく上回っています。視覚的パターン解決能力を評価するARC-AGI-2のテストでも、Grok 4は16.2%のスコアで商用モデルの中で新チャンピオンとなり、次点のモデル(Claude Opus 4)のほぼ倍の成績を収めました。

この進歩をイーロン・マスクは発売イベントで率直にまとめています。「学術問題に関しては、Grok 4はすべての科目で博士号レベル以上の性能を持っています、例外はありません」と語りました。

マスクは依然として存在する弱点も認めています。例えば時折Grokは常識的な判断を欠いたり、自ら新しい技術を創出できていないことなどですが、これは時間の問題だと確信しています。知能の向上に加え、xAIの今後の製品ロードマップには8月にリリース予定のコーディング特化モデル、9月のマルチモーダルエージェント、10月のジェネレーティブ動画モデルが含まれており、マスクのGrokの多様な分野での能力拡大へのヴィジョンを示しています。

Grok 4 は博士号レベルと呼ばれ、月額300ドルのサブスクリプションを提供

Grok 4の発表と同時に、xAIはSuperGrok Heavyという新しいサブスクリプションパッケージを月額300ドルで導入しました。これはxAIが提供するこれまでで最も高額なパッケージであり、他の大手AIプロバイダー(OpenAI、Google、Anthropic)の最高級プランよりも高額です。SuperGrok Heavyの加入者はGrok 4 Heavyと未公開の実験機能へ早期アクセスが可能で、将来のxAIのAI製品へのプレビューも含まれます。例えばコーディングモデル、高度なエージェント、または今後の動画モデルへの最初のアクセス権が得られると会社は述べています。

7月9日のGrok 4発売ライブ配信ではイーロン・マスクとxAIのリーダーが新モデルの性能と能力に焦点を当ててプレゼンテーションを行いました。マスクは前バージョンに比べてGrok 4の進歩度合いを示し、特にGrok 4 Heavyの高度なベンチマーク突破の成功を強調しました。以前、Grokは政治的バイアスがある回答で注目を集め、マスクはそれを「重大な失敗」と呼びましたが、彼はチームが最新版でその問題を修正済みであることを確約しました。

本記事は人工知能(AI)の支援によって翻訳されています。詳細については、当社の利用規約をご確認ください。