AI規制・政策 読了 8 分

GPT-5.5が32ステップのサイバー攻撃シミュレーションを自律クリア——AISI評価でAnthropicモデルと互角

shiritomo | AI・SNS・話題のテック情報メディア by Hashout編集部 @shiritomoAI_jp 2026年5月2日 更新
GPT-5.5が32ステップのサイバー攻撃シミュレーションを自律クリア——AISI評価でAnthropicモデルと互角

「専門家が20時間かかる攻撃を、AIが独力でクリアした」——そんな報告を見かけて、思わず二度読みしてしまいました。

英国のAISI(AI安全研究所:英国政府が設立したAIリスク評価機関)が2026年4月末に公開した評価レポートに、気になる内容が含まれていました。

OpenAIの最新モデル「GPT-5.5」が、高度なサイバー攻撃シミュレーションを自律的に突破できることが明らかになっています。

さらに、AnthropicのClaude Mythos PreviewとほぼAI攻撃能力が同等であることも示されており、AIのサイバー能力が急速に底上げされている実態が浮き彫りになっています。

X(旧Twitter)で広がった反響

今回の評価結果は、AI・セキュリティ関係者の間でXを中心に大きな話題を呼びました。

特に注目が集まったのは2つの事実です。

ひとつは、32ステップの企業ネットワーク攻撃シミュレーション「The Last Ones(TLO)」を10回中2回クリアしたこと。

もうひとつは、わずか6時間の専門的なレッドチーミング(セキュリティの脆弱性を意図的に探す検証作業)で「万能ジェイルブレイク(安全ガードを迂回する手法)」が開発されてしまったことです。

AISIの公式アカウントは評価結果の公開と同時にXへ投稿し、GPT-5.5がマルチステップ・サイバー攻撃シミュレーションを完走した2番目のモデルになったと報告しています。

セキュリティリサーチャーのShakeel氏は、AISIがGPT-5.5を「個別サイバータスクで世界最高レベル」と評価したことを紹介しています。

「専門家が20時間かかる32ステップの企業ネットワーク攻撃シミュレーションを完了できる」という知見に加え、「6時間の専門レッドチーミングで万能ジェイルブレイクが発見された」という安全性の問題についても言及しています。

OpenAIのSam Altman CEOも自らXに投稿しました。

「GPT-5.5-Cyber(サイバー防衛に特化した派生モデル)を今後数日以内にクリティカル・サイバー・ディフェンダー(重要インフラを守る最前線のセキュリティ専門家)に展開開始する」と述べており、攻撃能力を防御に転用しようという姿勢が伝わってきます。

一次情報を確認してわかったこと

AISIの公式レポートと複数の一次ソースを確認してみると、いくつかの事実が裏付けられていました。

CTF(キャプチャー・ザ・フラッグ:サイバーセキュリティの技術競技)での成績
AISIが実施した専門家レベルのCTF課題において、GPT-5.5の成功率は71.4%(±8.0%)でした。

比較対象のClaude Mythos Previewが68.6%であり、両者は統計的な誤差範囲内でほぼ同等の水準です。

前世代のGPT-5.4が52.4%だったことを踏まえると、1世代で約20ポイントという急激な能力向上が確認できるのではないでしょうか。

32ステップ・シミュレーションの実態
「The Last Ones」と呼ばれるこの演習は、セキュリティ企業SpecterOpsと共同開発された本格的な企業侵入シナリオです。

4つのサブネットと約20台のホストにまたがり、未パッチのソフトウェア・設定ミス・認証情報の使い回しといった実在の脆弱性を組み合わせた複合的な攻撃チェーンが課題となっています。

GPT-5.5は10回中2回これを完走し、Claude Mythos Previewの3回/10回に迫る結果を残しています。

なお、評価環境には「アクティブな防御機構がない」という前提条件があり、実際の本番環境への直接的な適用可能性は限定的とされているようです。

万能ジェイルブレイクの発見
AISIのレッドチームは、6時間の専門的作業でGPT-5.5の安全ガード全体を突破できるジェイルブレイクを開発しています。

OpenAIが提示したすべての悪意あるサイバークエリに対し、有害なコンテンツを引き出せることが確認されたとのことです。

OpenAIはその後ガードの更新を行っていますが、評価版の設定上の問題により、最終版の有効性がAISIによって完全には検証できていない状態にあります。

防御への転用という戦略
AISIは攻撃的能力を防御側に転用するよう関係者に呼びかけており、OpenAIも一般向けには安全ガードを施した版のみを提供する方針をとっています。

Altman CEOが言及した「GPT-5.5-Cyber」は、認証を受けたサイバーセキュリティ専門家向けに段階的に展開される計画です。

日本国内でも政府が電力・ガス事業者に緊急対応を求める動きが出ています。

最前線のAI評価情報へのアクセス格差が、今後の対応能力に影響するとの懸念も広がっているようです。

さらに深掘りしたい方へ


片山金融相、高度AIサイバー脅威に警鐘 官民作業部会設置で対策合意

片山金融相、高度AIサイバー脅威に警鐘 官民作業部会設置で対策合意
「今そこにある危機だ」——片山さつき金融担当大臣は2026年4月24日、金融庁で開いた緊急会合でこう強調。AIサイバー攻撃から金融システムを守るため官民連携の作業部会設置に合意した。


「公開禁止」のClaude Mythosに無許可アクセス——Discordグループが発表当日から利用

「公開禁止」のClaude Mythosに無許可アクセス——Discordグループが発表当日から利用
サイバー攻撃リスクが高すぎるとして一般公開を見送ったAnthropicの最新AI「Claude Mythos」が、発表当日からDiscordグループに無許可でアクセスされていた問題を解説する。


自民党が緊急会議——Anthropicの「Claude Mythos」がサイバーセキュリティを塗り替えた

自民党が緊急会議——Anthropicの「Claude Mythos」がサイバーセキュリティを塗り替えた
AIがゼロデイ脆弱性を人間よりも速く大量発見できる時代が到来。Anthropicの「Claude Mythos」が世界のOSやブラウザの未知の欠陥を次々と発見し、自民党が緊急会議を開いた。

公式ソース:
AISI:OpenAIのGPT-5.5サイバー能力評価レポート
OpenAI GPT-5.5 System Card
The Decoder:GPT-5.5 matches Claude Mythos in cyber attack tests

まとめ

AISIの評価によって、GPT-5.5はAnthropicのClaude Mythos Previewと並ぶ高度なサイバー攻撃能力を持つことが公式に確認されています。

同時に、6時間で突破された安全ガードの脆弱性も明らかになっており、課題は少なくないようです。

急速に進化するAIのサイバー能力を「攻撃」ではなく「防御」に活かすための国際的な枠組み作りが、これからの重要なテーマになっていくのではないでしょうか。