イーロン・マスク氏が「Grok 4.5」を内部公開——Claude Opusに迫る性能で「4強入りでは」とX上で話題

shiritomo | AI・SNS・話題のテック情報メディア by Hashout編集部 @shiritomoAI_jp 2026年6月29日更新

2026年6月28日、イーロン・マスク氏がX上で静かに告知しました。
xAI（エックスエーアイ）の最新モデル「Grok 4.5」のプライベートベータが、SpaceXとテスラで始まったというものです。

驚いたのは性能の話でした。
社内評価では「AnthropicのClaude Opusに匹敵するか、上回る」という結果が出ているとされています。
OpenAI・Anthropic・Googleが占めると思われていたAI最上位モデルの「3強」に、Grokが食い込む可能性が出てきたわけです。
X上では「Opus級なら4強入りでは」「Grok祭りが来るかも」といった声が相次ぎました。

これを見かけて、改めてGrok 4.5のことを調べてみました。

Grok 4.5とはどんなモデルか

Grok 4.5は、xAIが開発した「V9」という基盤モデルの上に構築されています。
パラメータ数（AIモデルの規模を示す指標のひとつ）は1.5兆個。
前世代のGrok 4.4が1兆パラメータだったことを考えると、50%増というかなり大きな規模拡大です。

もうひとつ注目されているのが、AIコードエディタ「Cursor（カーソル）」のデータを追加学習に使った点です。
Cursorは多くの開発者が日常的に使うツールで、そのデータをもとに学習することで、コーディング支援の質が高まると期待されています。

マスク氏はX上でGrok v9基盤モデルについてこう述べています。
「特別に画期的なモデルだとは言わないが、実用的な仕事をこなすための確かな基盤になるモデルだ」という趣旨の発言（意訳）で、慎重ながらも期待感をにじませていました。

To be clear, I’m not saying the Grok v9 foundation model will be mind-blowingly better than anything, but it will be a solid workhorse in the same league as Opus.

And the SpaceXAI cadence of model and harness improvement is speeding up tremendously, particularly due to a few…
— Elon Musk (@elonmusk) 2026年6月28日

このツイートは7,900以上のいいねを集め、Grok 4.5への関心の高さを示しています。

「Claude Opusを超える」という主張を確認してみた

報道によれば、Grok 4.5の社内評価では「Claude Opusに匹敵するか、上回るパフォーマンスを示した」とされています。
AI観測者の間では様々な反応が出ています。

予測市場「Polymarket（ポリマーケット）」のアカウントは次のように速報しました。
「Grok 4.5がSpaceXとテスラでプライベートベータを開始。
早期評価ではClaude Opusを超える可能性が示された」（意訳）

NEW: Grok 4.5 is now in private beta at SpaceX & Tesla, with early evals suggesting it may exceed Claude Opus.
— Polymarket (@Polymarket) 2026年6月28日

ただし、「社内評価」という点には注意が必要です。
モデルの性能評価は何を測るかによって結果が大きく変わります。
たとえば、外部の第三者が行うコーディング評価（SWE-bench Verified）では、Claude Opus 4.7が2026年4月時点で87.6%というスコアを記録しており、Grokシリーズがすべての面でこれを超えているわけではないようです。

マスク氏の言う「Opus超え」がどのタスクを指すのかは、一般公開後の第三者評価を待つ必要があります。
「社内評価で最高」という表現はAI各社がよく使う言い回しでもあるため、今後の独立した検証が重要になりそうです。

SpaceXとテスラの実務環境でテストする理由

Grok 4.5のプライベートベータが注目される理由はもうひとつあります。
テスト環境の質の高さです。

SpaceXのロケット開発データや、テスラの自動運転に関わる実務データの上でテストされるということは、単なる「お試し」ではなく、極めて高度な実世界のタスクにさらされるということを意味します。
一般的なベンチマークでは測れない種類の「実用性」が問われる場です。

さらに注目すべき情報もあります。
AI観測者の@scaling01氏は「Grok 4.5が来るだけでなく、今年中にSpaceXがゼロから訓練した新モデルを毎月リリースする計画だ（ただしイーロン時間なので実際は3ヶ月ごとかもしれないが）」と皮肉交じりに投稿し、多くの反響を呼んでいます（意訳）

not only is Grok 4.5 coming, but this year SpaceX is going to release a model EVERY month

(in Elon time this probably means every 3 months) https://t.co/uBu8TKTzEr
— Lisan al Gaib (@scaling01) 2026年6月28日

毎月新モデルをリリースするという計画が事実なら、AIモデル開発のペースはさらに加速することになります。
現在、OpenAIやAnthropicが数ヶ月に一度の大型リリースを行っているのに対し、xAIが月次更新をするとすれば、業界全体の競争リズムが変わるかもしれません。

現在のGrokの立ち位置——「4強」入りは現実的か

現在、AI上位モデルとして広く認知されているのはOpenAI（ChatGPT）・Anthropic（Claude）・Google（Gemini）の3社です。
xAIのGrokは後発ながら急成長を続け、「4強入り」を現実的な目標として見るユーザーが増えてきました。

一方で、モデルの優劣は「何をするか」によって大きく変わります。
コーディング・文章生成・推論・速度・料金と、評価軸は多岐にわたります。
日本語への対応度や、APIの使いやすさなども実務では欠かせない要素です。

現時点でGrok 4.5は一般ユーザーには提供されていません。
プライベートベータが終了し、一般公開されたタイミングで、改めて多角的な評価が行われることになりそうです。
日本のユーザーが実際に試せるようになった段階で、改めて検証したいところです。

さらに深掘りしたい方へ

SocialReport編集部の考察

今回のGrok 4.5の発表で特に注目したいのは、テスト環境の選び方です。
SpaceXとテスラという「極限の実務環境」でテストすることで、一般的なベンチマークでは測れないモデルの実力を、リリース前から磨き上げる戦略に見えます。

SNSマーケティングや企業のコンテンツ運用の視点から考えると、AIモデル選定の判断軸は今後さらに細分化していくでしょう。
「どのモデルが汎用的に賢いか」ではなく「自社の業務にどのモデルが最も合うか」という問いが、より重要になってきます。

また、「月次リリース」という計画が実現するとすれば、ツール選定のタイミングや評価サイクルも変わります。
「半年後にいまのモデルが最適解かどうか」をつねに意識する体制が、これからますます求められるでしょう。

xAIの急成長は、「AI選択肢はOpenAIかAnthropicか」という二択思考を崩しつつあります。
選択肢が増えることはユーザーにとってプラスですが、比較評価のコストも増えます。
自社のユースケースを明確にした上でモデルを選ぶという基本が、これからより一層大切になりそうです。

まとめ

xAIのGrok 4.5がSpaceXとテスラでプライベートベータを開始しました。
1.5兆パラメータと、Claude Opusに匹敵するとされる社内評価が注目を集めています。
月次モデルリリース計画も発表され、AI業界の競争は引き続き激しくなりそうです。
一般公開のタイミングで第三者による評価が待たれます。