AnthropicのClaude Mythos Previewが、英国AIセキュリティ研究所(AISI)の新たな評価により、AIモデルとして初めて企業ネットワークに対するシミュレーション型攻撃を完全に実行した事例となった。
この調査結果は、同モデルが4月7日に発表されてから数日後に公開された。AIのサイバー能力が、世界中のセキュリティチームによる即時対策を要する水準に到達したことを示す内容。
Anthropicは4月7日にClaude Mythos Previewモデルを発表し、大規模な一般公開を見送った。代わりに、同チームは限定的にセキュリティ研究組織へ提供し、その先進的な機能について検証・備えを進めている。
公式Xをフォローすると、最新ニュースをリアルタイムで入手できる
この開発は、テクノロジー業界だけでなく政策決定者の間でもすでに関心を集めている。ロイター通信によれば、事情に詳しい関係者の話として、米国財務長官スコット・ベセント氏およびFRB議長ジェローム・パウエル氏が、大手銀行CEOと緊急会合を開き、本モデルに関連する潜在的なサイバーリスクについて警告を行ったという。
AIセキュリティ研究所(AISI)は、英政府の科学・イノベーション・技術省傘下の研究機関であり、AnthropicのClaude Mythos Previewのサイバーセキュリティ能力について評価を実施した。
まず、「キャプチャー・ザ・フラッグ(CTF)」評価が行われた。これは、システムが脆弱性を見つけ出し、隠された“フラッグ”を獲得するというもの。Mythosは、エキスパート向けタスクにおいて73%の成功率を記録した。これは、2025年4月以前にはどのモデルにも達成できなかった水準。
さらにAISIは、「The Last Ones(TLO)」と名付けた32ステップからなる企業ネットワーク攻撃のシミュレーションを構築した。人間のセキュリティ専門家なら、この課題の完了には約20時間を要するレベル。
Mythos Previewは、この全シミュレーションを10回中3回で最後まで完了した。平均して32ステップ中22ステップを達成。次点のClaude Opus 4.6は平均16ステップにとどまった。
Anthropic自身によるレッドチーム検証でも、Claude Mythos Previewは明示的なユーザー指示があれば、主要な全オペレーティングシステムと主要なWebブラウザにわたるゼロデイ脆弱性の検出および悪用が可能であることが判明した。
AISIは組織に対し、定期的なパッチ適用、厳格なアクセス制御、セキュリティ構成の強化、包括的なログ記録など、基礎的なサイバーセキュリティ対策の徹底を推奨した。
YouTubeチャンネルを登録すると、専門家やジャーナリストによるインサイト動画をご覧いただける

