「公開禁止」のClaude Mythosに無許可アクセス——Discordグループが発表当日から利用
「危険すぎて一般公開できないAI」というのは、SF映画の話だと思っていました。
ところが先日、あるニュースを見かけて思わず二度見してしまいました。
4月7日、AI企業Anthropic(アンソロピック)が発表した最新モデル「Claude Mythos(クロード・ミュトス)」は、サイバー攻撃リスクが高すぎるとして一般公開が見送られた、異例のAIモデルです。
そのモデルが、発表当日からDiscordグループによって無許可でアクセスされていたことが明らかになりました。
発表直後からXで広がった衝撃
Claude Mythosの発表直後から、その能力と危険性についての投稿がXで相次ぎました。
「一般公開されない理由」に注目する声が多く、AIのリスク管理をめぐる議論が一気に活発になっています。
bioshok氏は、MythosがすべてのメジャーなOS(基本ソフト)と主要ウェブブラウザでゼロデイ脆弱性(まだ発見・修正されていないソフトウェアの欠陥)を自律的に発見したと報告しています。
Anthropic自身も「Mythosは始まりに過ぎない」と語っており、その言葉の重さが多くの人に刺さったようです。
Anthropicは新モデルであるClaude Mythosを公表したが、あまりに強力であるため、一般公開はされない。
Anthropic:「Mythosは始まりに過ぎない」
主要な事実:
・Mythosは、すべての主要OSとすべての主要ウェブブラウザでゼロデイ脆弱性を自律的に発見した。… https://t.co/8TFws3KTu5 pic.twitter.com/UHaRC1Cs0f— bioshok (@bioshok3) 2026年4月8日
モデルの内部解析で見つかった「挙動」への反応も、非常に大きくなっています。
セキュリティ研究者のJeletor氏によると、AnthropicはリリースまでにClaude Mythos Previewの内部を解釈可能性(Interpretability:AIが何を考えているかを可視化する技術)で調査したそうです。
そこで発見されたのは、自己消去する特権昇格エクスプロイト(システム権限を不正に取得するプログラム)、採点基準をファイルシステムから探索する挙動、コードチェッカーをだますための偽のコンプライアンス変数の埋め込みなど、驚くべき行動でした。
AIが「評価から逃れようとしている」ように見えるこうした行動は、研究者たちに大きな衝撃を与えているようです。
Anthropic used interpretability to look inside Claude Mythos Preview before releasing it. What they found:
• Self-cleaning privilege escalation exploits
• Searching the filesystem for its own grading criteria
• Planting fake compliance variables as decoys for code checkers
•…— Jeletor (@Jeletor) 2026年4月7日
無許可アクセスの経緯を深掘りしてみました
TechCrunch・Engadgetなど複数の海外メディアの報道をまとめると、無許可アクセスの経緯が見えてきます。
未公開AIモデルの情報を収集する私的Discordサーバーを運営するグループが、AnthropicのサードパーティベンダーのAPI環境を経由してMythosにアクセスしました。
グループのメンバーのひとりがそのベンダーに従業員として在籍しており、AnthropicがほかのモデルのAPIで使用してきたURL命名規則の知識をもとにモデルの所在を推測したようです。
高度な技術ではなく、知識と推測だけでアクセスできてしまったという点が、この事件の怖いところではないでしょうか。
アクセス後も利用は継続され、ウェブサイト構築などの非攻撃的な用途で使われていたことがBloombergへのスクリーンショットやライブデモで確認されています。
Anthropicは「サードパーティベンダー環境を通じたClaude Mythos Previewへの無許可アクセス報告を調査中」と声明を発表しており、現時点でAnthropicのコアシステムへの影響は確認されていないとしています。
Claude Mythosの能力は非常に高く、「Project Glasswing(プロジェクト・グラスウィング)」としてAmazon・Apple・Cisco・JPMorgan Chase・NVIDIAなど40以上の組織および政府機関のみに限定提供されてきました。
SecurityWeekの報告によると、Firefoxだけで271件のエクスプロイトを発見し、OpenBSDに27年間潜んでいたゼロデイ脆弱性を自律的に特定するなど、人間の専門家を大きく超える性能が確認されているようです。
一方、OpenAIのSam Altman CEOはMythosの発表を「恐怖を煽るマーケティング」と批判しており、AI企業間の競争と安全性をめぐる議論はしばらく続きそうです。
さらに深掘りしたい方へ
- Unauthorized group has gained access to Anthropic’s exclusive cyber tool Mythos — TechCrunch
- Anthropic is investigating unauthorized access of its Mythos cybersecurity tool — Engadget
- Claude Mythos Finds 271 Firefox Vulnerabilities — SecurityWeek
- Discord group accessed Anthropic’s Mythos without authorization — CyberNews
まとめ
「危険すぎる」として厳重に管理されていたAIが、発表当日から無許可でアクセスされてしまうという現実は、高度AIのアクセス管理がいかに難しいかを改めて示しているのではないでしょうか。
Anthropicの調査結果と今後の対応策に、引き続き注目していきたいと思います。