「公開禁止」のClaude Mythosに無許可アクセス——Discordグループが発表当日から利用

shiritomo | AI・SNS・話題のテック情報メディア by Hashout編集部 @shiritomoAI_jp 2026年4月23日更新

「危険すぎて一般公開できないAI」というのは、SF映画の話だと思っていました。

ところが先日、あるニュースを見かけて思わず二度見してしまいました。

4月7日、AI企業Anthropic（アンソロピック）が発表した最新モデル「Claude Mythos（クロード・ミュトス）」は、サイバー攻撃リスクが高すぎるとして一般公開が見送られた、異例のAIモデルです。

そのモデルが、発表当日からDiscordグループによって無許可でアクセスされていたことが明らかになりました。

発表直後からXで広がった衝撃

Claude Mythosの発表直後から、その能力と危険性についての投稿がXで相次ぎました。

「一般公開されない理由」に注目する声が多く、AIのリスク管理をめぐる議論が一気に活発になっています。

bioshok氏は、MythosがすべてのメジャーなOS（基本ソフト）と主要ウェブブラウザでゼロデイ脆弱性（まだ発見・修正されていないソフトウェアの欠陥）を自律的に発見したと報告しています。

Anthropic自身も「Mythosは始まりに過ぎない」と語っており、その言葉の重さが多くの人に刺さったようです。

Anthropicは新モデルであるClaude Mythosを公表したが、あまりに強力であるため、一般公開はされない。
Anthropic：「Mythosは始まりに過ぎない」
主要な事実：
・Mythosは、すべての主要OSとすべての主要ウェブブラウザでゼロデイ脆弱性を自律的に発見した。… https://t.co/8TFws3KTu5 pic.twitter.com/UHaRC1Cs0f

— bioshok (@bioshok3) 2026年4月8日

モデルの内部解析で見つかった「挙動」への反応も、非常に大きくなっています。

セキュリティ研究者のJeletor氏によると、AnthropicはリリースまでにClaude Mythos Previewの内部を解釈可能性（Interpretability：AIが何を考えているかを可視化する技術）で調査したそうです。

そこで発見されたのは、自己消去する特権昇格エクスプロイト（システム権限を不正に取得するプログラム）、採点基準をファイルシステムから探索する挙動、コードチェッカーをだますための偽のコンプライアンス変数の埋め込みなど、驚くべき行動でした。

AIが「評価から逃れようとしている」ように見えるこうした行動は、研究者たちに大きな衝撃を与えているようです。

Anthropic used interpretability to look inside Claude Mythos Preview before releasing it. What they found:

• Self-cleaning privilege escalation exploits
• Searching the filesystem for its own grading criteria
• Planting fake compliance variables as decoys for code checkers
•…

— Jeletor (@Jeletor) 2026年4月7日

無許可アクセスの経緯を深掘りしてみました

TechCrunch・Engadgetなど複数の海外メディアの報道をまとめると、無許可アクセスの経緯が見えてきます。

未公開AIモデルの情報を収集する私的Discordサーバーを運営するグループが、AnthropicのサードパーティベンダーのAPI環境を経由してMythosにアクセスしました。

グループのメンバーのひとりがそのベンダーに従業員として在籍しており、AnthropicがほかのモデルのAPIで使用してきたURL命名規則の知識をもとにモデルの所在を推測したようです。

高度な技術ではなく、知識と推測だけでアクセスできてしまったという点が、この事件の怖いところではないでしょうか。

アクセス後も利用は継続され、ウェブサイト構築などの非攻撃的な用途で使われていたことがBloombergへのスクリーンショットやライブデモで確認されています。

Anthropicは「サードパーティベンダー環境を通じたClaude Mythos Previewへの無許可アクセス報告を調査中」と声明を発表しており、現時点でAnthropicのコアシステムへの影響は確認されていないとしています。

Claude Mythosの能力は非常に高く、「Project Glasswing（プロジェクト・グラスウィング）」としてAmazon・Apple・Cisco・JPMorgan Chase・NVIDIAなど40以上の組織および政府機関のみに限定提供されてきました。

SecurityWeekの報告によると、Firefoxだけで271件のエクスプロイトを発見し、OpenBSDに27年間潜んでいたゼロデイ脆弱性を自律的に特定するなど、人間の専門家を大きく超える性能が確認されているようです。

一方、OpenAIのSam Altman CEOはMythosの発表を「恐怖を煽るマーケティング」と批判しており、AI企業間の競争と安全性をめぐる議論はしばらく続きそうです。

さらに深掘りしたい方へ

まとめ

「危険すぎる」として厳重に管理されていたAIが、発表当日から無許可でアクセスされてしまうという現実は、高度AIのアクセス管理がいかに難しいかを改めて示しているのではないでしょうか。

Anthropicの調査結果と今後の対応策に、引き続き注目していきたいと思います。

SNS効果測定サービス hashout は Social Report へ

「公開禁止」のClaude Mythosに無許可アクセス——Discordグループが発表当日から利用

発表直後からXで広がった衝撃

無許可アクセスの経緯を深掘りしてみました

さらに深掘りしたい方へ

まとめ

AIと仕事が交差する「今」を、
毎日お届けします。

SNS効果測定サービス hashout は Social Report へ

発表直後からXで広がった衝撃

無許可アクセスの経緯を深掘りしてみました

さらに深掘りしたい方へ

まとめ

関連記事

「30秒の4Kがワンショットで出てきた」——バイトダンスのSeedance 2.5が動画AIに仕掛けた”世代飛躍”

RPGツクールでAIを使っていいの？ GGGが公式ガイドラインで「利用OK・学習NG」を明確化

サカナAIの「Fugu Ultra」がFable 5級を主張——輸出規制に揺れるAI業界で日本発オーケストレーションが話題

「指が変」と気づいたら——JAさがみのイベントポスター、AI生成疑惑で850万閲覧の大論争に

いらすとやが最近見かけなくなった理由——生成AIが変えた「ちょうどいいイラスト」の世界

「ClaudeもGPT-5.5も超えた」は本当か——中国Z.aiがGLM-5.2を公開、コーディングAIがオープンソースで世界に挑む

SNSマーケティングの最新記事

AIが飲食店に電話をかけ続ける——「オートリザーブ」問題が再燃し、Xで倫理論争が白熱

知人のXアカウントから「VISA不正利用」のDMが届いたら要注意——偽領収書詐欺が6月下旬に急増中

Xのタイムラインが「息苦しい」と感じるのは気のせいじゃなかった——叩き系・冷笑系コンテンツが溢れる本当の理由と、快適なTLを取り戻す処方箋

SNS分析を実務で進めたい方へ

AIと仕事が交差する「今」を、毎日お届けします。

RPGツクールでAIを使っていいの？　GGGが公式ガイドラインで「利用OK・学習NG」を明確化

AIと仕事が交差する「今」を、
毎日お届けします。