GPT-5.5が32ステップのサイバー攻撃シミュレーションを自律クリア——AISI評価でAnthropicモデルと互角

「専門家が20時間かかる攻撃を、AIが独力でクリアした」——そんな報告を見かけて、思わず二度読みしてしまいました。

英国のAISI（AI安全研究所：英国政府が設立したAIリスク評価機関）が2026年4月末に公開した評価レポートに、気になる内容が含まれていました。

OpenAIの最新モデル「GPT-5.5」が、高度なサイバー攻撃シミュレーションを自律的に突破できることが明らかになっています。

さらに、AnthropicのClaude Mythos PreviewとほぼAI攻撃能力が同等であることも示されており、AIのサイバー能力が急速に底上げされている実態が浮き彫りになっています。

X（旧Twitter）で広がった反響

今回の評価結果は、AI・セキュリティ関係者の間でXを中心に大きな話題を呼びました。

特に注目が集まったのは2つの事実です。

ひとつは、32ステップの企業ネットワーク攻撃シミュレーション「The Last Ones（TLO）」を10回中2回クリアしたこと。

もうひとつは、わずか6時間の専門的なレッドチーミング（セキュリティの脆弱性を意図的に探す検証作業）で「万能ジェイルブレイク（安全ガードを迂回する手法）」が開発されてしまったことです。

AISIの公式アカウントは評価結果の公開と同時にXへ投稿し、GPT-5.5がマルチステップ・サイバー攻撃シミュレーションを完走した2番目のモデルになったと報告しています。

OpenAI’s GPT-5.5 is the second model to complete one of our multi-step cyber-attack simulations end-to-end 🧵 pic.twitter.com/eQWYbYaa6w

— AI Security Institute (@AISecurityInst) 2026年4月30日

セキュリティリサーチャーのShakeel氏は、AISIがGPT-5.5を「個別サイバータスクで世界最高レベル」と評価したことを紹介しています。

「専門家が20時間かかる32ステップの企業ネットワーク攻撃シミュレーションを完了できる」という知見に加え、「6時間の専門レッドチーミングで万能ジェイルブレイクが発見された」という安全性の問題についても言及しています。

When @AISecurityInst tested GPT-5.5, it found it's the world’s most capable model on individual cyber tasks, and can complete a “32-step corporate-network attack simulation estimated to take an expert 20 hours.”

It also found “found a universal jailbreak with six hours of expert…

— Shakeel (@ShakeelHashim) 2026年4月24日

OpenAIのSam Altman CEOも自らXに投稿しました。

「GPT-5.5-Cyber（サイバー防衛に特化した派生モデル）を今後数日以内にクリティカル・サイバー・ディフェンダー（重要インフラを守る最前線のセキュリティ専門家）に展開開始する」と述べており、攻撃能力を防御に転用しようという姿勢が伝わってきます。

we're starting rollout of GPT-5.5-Cyber, a frontier cybersecurity model, to critical cyber defenders in the next few days.

we will work with the entire ecosystem and the government to figure out trusted access for cyber; we want to rapidly help secure companies/infrastructure.

— Sam Altman (@sama) 2026年4月30日

一次情報を確認してわかったこと

AISIの公式レポートと複数の一次ソースを確認してみると、いくつかの事実が裏付けられていました。

CTF（キャプチャー・ザ・フラッグ：サイバーセキュリティの技術競技）での成績
AISIが実施した専門家レベルのCTF課題において、GPT-5.5の成功率は71.4%（±8.0%）でした。

比較対象のClaude Mythos Previewが68.6%であり、両者は統計的な誤差範囲内でほぼ同等の水準です。

前世代のGPT-5.4が52.4%だったことを踏まえると、1世代で約20ポイントという急激な能力向上が確認できるのではないでしょうか。

32ステップ・シミュレーションの実態
「The Last Ones」と呼ばれるこの演習は、セキュリティ企業SpecterOpsと共同開発された本格的な企業侵入シナリオです。

4つのサブネットと約20台のホストにまたがり、未パッチのソフトウェア・設定ミス・認証情報の使い回しといった実在の脆弱性を組み合わせた複合的な攻撃チェーンが課題となっています。

GPT-5.5は10回中2回これを完走し、Claude Mythos Previewの3回/10回に迫る結果を残しています。

なお、評価環境には「アクティブな防御機構がない」という前提条件があり、実際の本番環境への直接的な適用可能性は限定的とされているようです。

万能ジェイルブレイクの発見
AISIのレッドチームは、6時間の専門的作業でGPT-5.5の安全ガード全体を突破できるジェイルブレイクを開発しています。

OpenAIが提示したすべての悪意あるサイバークエリに対し、有害なコンテンツを引き出せることが確認されたとのことです。

OpenAIはその後ガードの更新を行っていますが、評価版の設定上の問題により、最終版の有効性がAISIによって完全には検証できていない状態にあります。

防御への転用という戦略
AISIは攻撃的能力を防御側に転用するよう関係者に呼びかけており、OpenAIも一般向けには安全ガードを施した版のみを提供する方針をとっています。

Altman CEOが言及した「GPT-5.5-Cyber」は、認証を受けたサイバーセキュリティ専門家向けに段階的に展開される計画です。

日本国内でも政府が電力・ガス事業者に緊急対応を求める動きが出ています。

最前線のAI評価情報へのアクセス格差が、今後の対応能力に影響するとの懸念も広がっているようです。

さらに深掘りしたい方へ

公式ソース：
– AISI：OpenAIのGPT-5.5サイバー能力評価レポート
– OpenAI GPT-5.5 System Card
– The Decoder：GPT-5.5 matches Claude Mythos in cyber attack tests

まとめ

AISIの評価によって、GPT-5.5はAnthropicのClaude Mythos Previewと並ぶ高度なサイバー攻撃能力を持つことが公式に確認されています。

同時に、6時間で突破された安全ガードの脆弱性も明らかになっており、課題は少なくないようです。

急速に進化するAIのサイバー能力を「攻撃」ではなく「防御」に活かすための国際的な枠組み作りが、これからの重要なテーマになっていくのではないでしょうか。

SNS効果測定サービス hashout は Social Report へ

X（旧Twitter）で広がった反響

一次情報を確認してわかったこと

さらに深掘りしたい方へ

まとめ

AIと仕事が交差する「今」を、
毎日お届けします。

SNS効果測定サービス hashout は Social Report へ

X（旧Twitter）で広がった反響

一次情報を確認してわかったこと

さらに深掘りしたい方へ

まとめ

関連記事

「画像生成AIだけは嫌」の理由——VTuber界隈で広がるAI一貫性議論を深掘りしてみた

役所の仕事が変わる——政府AI「源内」が39機関・18万人への大規模実証を開始

Chromeが勝手に4GBのAIをダウンロードしていた——weights.binの正体とEU法違反の懸念

AIと仕事が交差する「今」を、毎日お届けします。

AIと仕事が交差する「今」を、
毎日お届けします。