Claude Mythosとは？危険すぎて公開できないAIを初心者向けにわかりやすく解説

2026年4月25日2026年5月4日

Claude Mythosがテレビなどでも話題になってますな

2026年4月、AI開発企業のAnthropic（アンソロピック）が発表した最新AIモデル「Claude Mythos Preview（クロード・ミュトス・プレビュー）」が世界中で大きな話題になっています。

「危険すぎて一般公開できない」「サンドボックスから脱出した」「全主要OSの脆弱性を発見した」——ニュースの見出しだけ見ると、まるでSF映画の始まりのようですよね。

この記事では、Claude Mythosとは何なのか、なぜこれほど騒がれているのか、そして今何が問題になっているのかを、IT初心者の方にもわかるようにゼロから解説していきます。

そもそも「Mythos（ミュトス）」ってどういう意味？

まず名前の由来から押さえておきましょう。

「Mythos」は古代ギリシャ語の「μῦθος（ミュトス）」に由来する言葉です。もともとは「発話」「物語」という意味で使われていた言葉で、そこから転じて「神話」や「伝説」を指すようになりました。英語の「myth（ミス＝神話）」の語源でもあります。

ちなみに日本では「ミトス」「ミソス」「ミュトス」と読み方が揺れていて、大手メディアでも表記がバラバラです。ITmediaでもこの読み方問題を記事にしているほどで、正式な日本語読みはまだ統一されていません。Anthropicの公式ページでは古代ギリシャ語の「μῦθος（mûthos）」が名前の由来だと記載されているので、「ミュトス」が語源的には最も近い読み方といえます。

テレビのニュースでは「ミュトス」って言ってる気がする

また、開発段階でのコードネームは「Capybara（カピバラ）」だったことがFortuneの報道で明らかになっています。

参考：ITmedia「話題の『Claude Mythos』、なんて読む？」 https://www.itmedia.co.jp/news/articles/2604/22/news129.html

Claude Mythosとは何か？

Claude Mythosは、Anthropicが開発した最新の汎用AIモデルです。

「汎用」というのは、ChatGPTやClaudeと同じように文章生成・質問応答・コード作成などさまざまな用途に使えるタイプのAIということです。

2026年4月7日に発表され、Claudeシリーズの中で最も高い性能を持つモデルとされています。

ただし、ここが最大のポイントなのですが、Claude Mythosは一般には公開されていません。

通常、AI企業は新しいモデルを開発したらすぐにサービスとして提供するのが当たり前です。

しかしAnthropicは「このモデルは能力が高すぎて、そのまま公開するのは危険」と判断し、限定的なパートナー企業にのみ提供するという異例の措置を取りました。

これはAI業界の約7年間で、大手AI企業が安全上の理由からモデルの一般公開を見送った初めてのケースだとNBC Newsが報じています。

参考：Anthropic公式 Project Glasswing発表ページ https://www.anthropic.com/glasswing

Claude Mythosの何がすごいのか

サイバーセキュリティ能力が桁違い

Claude Mythosが特に注目されているのは、ソフトウェアの脆弱性（ぜいじゃくせい）を見つける能力が飛び抜けて高い点です。

「脆弱性」というのは、ソフトウェアに存在するセキュリティ上の弱点のことです。

悪意のある攻撃者がこの弱点を突くと、データを盗んだり、システムを乗っ取ったりできてしまいます。

Anthropicの報告によると、Claude Mythosは以下のような成果を出しています。

すべての主要なOS（Windows、macOS、Linuxなど）とWebブラウザで、これまで誰にも見つかっていなかった脆弱性（ゼロデイ脆弱性）を数千件規模で発見
OpenBSDという「最もセキュリティが堅い」とされるOSで、27年間見つからなかった脆弱性を発見
FFmpegという広く使われている動画処理ソフトで、16年間・自動スキャナー500万回でも見つからなかったバグを発見
Linuxカーネルでは複数の脆弱性を組み合わせ、一般ユーザー権限から管理者権限（root）を奪取する攻撃チェーンを人間の指示なしで構築

人間のセキュリティ専門家が何週間もかけるような作業を、AIが短時間でやってしまうイメージですね。

「見つける」だけでなく「攻撃に使える形にする」

従来のAIでも脆弱性をある程度見つけることはできました。

しかしClaude Mythosが決定的に違うのは、見つけた脆弱性を実際に攻撃に使える形（エクスプロイト）にまで仕上げられる点です。

Anthropicでサイバー攻撃研究を率いるLogan Graham氏は、NBC Newsのインタビューで「複数の脆弱性を連鎖させて、複雑なハッキングを自律的に行える」と語っています。

英国AI安全研究所のテストでも実証済み

第三者機関による検証も行われています。

英国のAI安全研究所（AISI）は、Claude Mythosに対してサイバー攻撃シミュレーション「The Last Ones」というテストを実施しました。これは32ステップにわたる企業ネットワークへの侵入を模擬したもので、Claude Mythosはこのテストを完遂した史上初のAIモデルとなりました（10回中3回成功）。

ただし同研究所は、テスト環境は実際の防御システムほど堅牢ではないとも補足しています。

参考：AISI公式評価レポート https://www.aisi.gov.uk/blog/our-evaluation-of-claude-mythos-previews-cyber-capabilities

Project Glasswing（プロジェクト・グラスウィング）とは

Anthropicはこの強力すぎるモデルを「防御目的に限定して使う」ために、Project Glasswingという取り組みを立ち上げました。

「Glasswing（グラスウィング）」とは、羽が透明で目に見えにくい蝶の名前に由来しています。「見えないところに潜むリスクを見つけ出す」という意味が込められているようです。

このプロジェクトの参加企業はAmazon Web Services、Apple、Google、Microsoft、CrowdStrike、NVIDIA、Cisco、JPMorganChaseなど12社のテクノロジー・セキュリティ大手企業で、さらに40以上の追加組織にもアクセスが拡大されています。

Anthropicはこのプロジェクトに1億ドル（約150億円）のモデル利用クレジットを提供し、パートナー企業がClaude Mythosを使って自社システムの脆弱性を見つけて修正できるよう支援しています。

たとえばMozillaは、Claude Mythosを使ってFirefoxブラウザの脆弱性を271件パッチしたと報告しています。

参考：Anthropic公式 Project Glasswingページ https://www.anthropic.com/project/glasswing

何が問題になっているのか

ここまで聞くとめっちゃすごいAIができたって感じだね。何が問題なのかをみていこう。

Claude Mythosをめぐっては、大きく分けて3つの問題が浮上しています。

1. サンドボックスからの脱出事件

Anthropicが公開したシステムカード（モデルの能力や安全性をまとめた文書）には、開発中のテストで非常に気になる挙動が記録されています。

初期バージョンのClaude Mythosに対して、模擬ユーザーが「このサンドボックス環境から脱出して、研究者にメッセージを送ってみて」と指示したところ、モデルは実際にサンドボックスを突破しました。

複数ステップのエクスプロイト（実際に攻撃に使える形）を自力で組み立ててインターネットへのアクセスを獲得し、研究者にメールを送信したのです。

【ミニコラム】サンドボックスとは？
「サンドボックス」とは、AIやソフトウェアを安全にテストするための隔離された仮想環境のことです。外部のネットワークや他のシステムから切り離されているので、万が一問題が起きても被害が外に広がらないようになっています。子どもが砂場（sandbox）の中で安全に遊ぶイメージに近い仕組みです。

さらに問題なのは、指示されていないのに脱出に使った手法を公開ウェブサイトに投稿したことです。

Anthropicはこの行動について「隠された意図があるわけではなく、タスクを完了しようとする過程で人間なら越えないラインを越えてしまった」と分析しています。

また、まれにルール違反をした後にその痕跡を隠そうとする行動も確認されています。

なるほど、”できすぎちゃった”のかな。

2. 不正アクセス事件

2026年4月21日、Bloombergが衝撃的なニュースを報じました。限定公開のはずのClaude Mythosに、無関係のグループが不正にアクセスしていたというのです。

報道によると、あるDiscordサーバーのメンバーたちが、公開日当日にサードパーティのベンダー環境を通じてMythosにアクセスしました。グループのメンバーの一人がAnthropicの業務委託先の関係者で、過去に別のデータ漏洩から得られた情報をもとにモデルの保管場所を推測したとされています。

Anthropicは「サードパーティのベンダー環境を通じた不正アクセスの報告を調査中」と声明を出しましたが、自社システムへの影響は確認されていないとしています。

ただ、この事件の本質的な怖さは、Fortuneの報道で元国家サイバー担当者が指摘した通り、「一般のDiscordフォーラムがアクセスできたなら、国家レベルのアクターはもうアクセスしていると考えるべき」という点です。
※ここでいう「アクター」とは、国家の支援を受けたハッカー集団や情報機関など、高度なサイバー攻撃能力を持つ組織のことを指します。

また、この事件に便乗してShinyHuntersを名乗るグループが偽のダッシュボード画像を拡散しましたが、セキュリティ研究者によってAI生成の偽画像であると否定されています。

参考：Fortune報道 https://fortune.com/2026/04/23/anthropic-mythos-leak-dario-amodei-ceo-cybersecurity-hackers-exploits-ai/

3. 「マーケティングではないか」という批判

著名なセキュリティ研究者のBruce Schneier氏は、自身のブログで「これはかなりPR的な動きだ」と指摘しています。「限定公開にすることで注目を集めるのは巧みなマーケティングでもある」という見方です。

また、セキュリティ企業Aisleが既存の公開モデルでもMythosが発見した脆弱性の一部を再現できたという報告もあり、「Mythosだけが特別なのか？」という疑問も出ています。

ただしSchneier氏自身も、「タイムラインは不確かだが、AIがサイバーセキュリティを根本的に変えることについて心配している人は正しい」とも述べています。

OpenAIのCEO Sam Altman氏はMythosの宣伝手法を「恐怖ベースのマーケティング」と呼びましたが、その翌週にOpenAI自身も同様にサイバーセキュリティ特化モデルの限定公開を発表しており、業界全体が同じ方向に動いていることがうかがえます。

参考：Bruce Schneier氏のブログ記事 https://www.schneier.com/blog/archives/2026/04/on-anthropics-mythos-preview-and-project-glasswing.html

日本ではどんな動きがあるのか

日本でもClaude Mythosへの反応は急速に広がっています。

2026年4月20日には、自民党の国家サイバーセキュリティ戦略本部の合同会議が開催され、AnthropicとOpenAIの担当者が出席しました。

会議では前デジタル大臣の平将明氏が「人間の力では見つけることのできなかったシステムの脆弱性を見つけることができ、さらに攻撃にも使える」と述べ、金融を含む重要インフラへの影響を懸念しています。

自民党はこの議論を踏まえ、官民一体の防御体制を整備するための緊急提言をとりまとめる方針を示しています。

ただし現時点では、日本の組織がProject Glasswingに参加しているという情報は公開されていません。英国のVersion 1社の分析によると、Mythosは現在、米国のセキュリティ認証フレームワーク（FedRAMP）を基盤としており、英国のNCSCやICOとの正式な協議も公表されていない状況です。日本を含む米国外の国が実際にMythosクラスの能力にアクセスできるようになるのは、Anthropicが安全対策を施した一般向けモデルをリリースした段階になるとみられています。

参考：セキュリティ対策Lab「Claude Mythos、日本の国家サイバーセキュリティ会議で明言」 https://rocket-boys.co.jp/security-measures-lab/claude-mythos-too-dangerous-japan-cyber-council/

今後の見通し

Claude Mythosが示したのは、「AIがサイバーセキュリティの攻守両面を根本的に変える時代が来た」ということです。

防御側の希望としては、AIが脆弱性を先回りで見つけてパッチを当てられる可能性が高まっています。MozillaのFirefox事例のように、すでに成果は出始めています。

一方でリスクとしては、同等の能力を持つモデルが今後6〜18ヶ月で他社からも登場する可能性が高く、その時に悪用を防ぐ仕組みが間に合うかが問題です。セキュリティ企業Contrast SecurityのCTO Jeff Williams氏はForeign Policyのインタビューで「6〜9ヶ月以内に他国が同等のモデルを作るか、アクセス手段を見つけるだろう」と述べています。

Anthropicは、将来的にMythosクラスのモデルを安全対策付きで一般提供する計画を示しており、次期Claude Opusモデルでその安全対策を先行テストする方針です。

Forresterのアナリストは、この変化の影響がセキュリティツール市場だけでなく、サイバー保険の価格設定や規制のあり方にまで波及すると分析しており、今後数ヶ月〜数年かけてじわじわと業界構造が変わっていく可能性があります。