Claude Mythos résout 73 % des tâches de cybersécurité expertes qu'aucune IA ne pouvait résoudre auparavant

Claude Mythos Preview d'Anthropic est devenu le premier modèle d'IA à réaliser une attaque simulée complète d'un réseau d'entreprise, selon les nouvelles évaluations de l'AI Security Institute (AISI) du Royaume-Uni.

Les résultats, publiés quelques jours après l'annonce du modèle le 7 avril, suggèrent que les capacités cybernétiques de l'IA ont atteint un niveau qui nécessite une attention immédiate des équipes de sécurité du monde entier.

Qu'est-ce que Claude Mythos ?

Anthropic a dévoilé son modèle Claude Mythos Preview le 7 avril, choisissant de ne pas procéder à une publication publique large. L'équipe accorde plutôt un accès limité aux entreprises de recherche en sécurité pour évaluer et se préparer à ses capacités avancées.

Abonnez-vous sur X pour obtenir les dernières nouvelles en temps réel

Le développement a déjà commencé à attirer l'attention dans les cercles technologiques et même politiques. Selon un rapport de Reuters citant des sources familières avec l'affaire, le secrétaire au Trésor américain Scott Bessent et le président de la Réserve fédérale Jerome Powell ont tenu une réunion urgente avec les PDG de grandes banques, avertissant des risques cybernétiques potentiels liés à ce modèle.

Performance de Claude Mythos Preview

L'AI Security Institute (AISI), une organisation de recherche au sein du Département des sciences, de l'innovation et de la technologie du gouvernement britannique, a mené des évaluations cybernétiques de Claude Mythos Preview d'Anthropic pour examiner ses capacités en cybersécurité.

D'abord, il y a eu les évaluations capture-the-flag (CTF), où les systèmes doivent identifier et exploiter les vulnérabilités pour récupérer des "drapeaux" cachés. Mythos a atteint un taux de réussite de 73 % sur les tâches de niveau expert. Cela n'avait été résolu par aucun modèle avant avril 2025.

Capacités d'attaque cybernétique de Claude Mythos. Source : AISI

De plus, l'AISI a construit une simulation d'attaque de réseau d'entreprise en 32 étapes appelée "The Last Ones" (TLO). Les professionnels de la sécurité humains auraient besoin d'environ 20 heures pour la terminer.

Mythos Preview a terminé toute la simulation dans 3 tentatives sur 10. En moyenne, il a complété 22 des 32 étapes d'attaque. Claude Opus 4.6, le deuxième meilleur performeur, n'a fait en moyenne que 16 étapes.

Les propres tests de l'équipe rouge d'Anthropic ont révélé que Claude Mythos Preview peut détecter et exploiter des vulnérabilités zero-day sur tous les principaux systèmes d'exploitation et navigateurs web leaders lorsqu'il en reçoit explicitement l'instruction d'un utilisateur.

L'AISI a noté que les organisations devraient prioriser les mesures fondamentales de cybersécurité. Celles-ci incluent des correctifs réguliers, des contrôles d'accès stricts, le durcissement de la configuration de sécurité et une journalisation complète.

Abonnez-vous à notre YouTube pour regarder les leaders et journalistes fournir des analyses d'experts

L'article Claude Mythos résout 73 % des tâches cybernétiques expertes qu'aucune IA ne pouvait résoudre auparavant est apparu en premier sur BeInCrypto.

Source : https://beincrypto.com/claude-mythos-preview-cyber-capabilities-test/

Claude Mythos résout 73 % des tâches de cybersécurité expertes qu'aucune IA ne pouvait résoudre auparavant

Qu'est-ce que Claude Mythos ?

Performance de Claude Mythos Preview

Vous aimerez peut-être aussi

FX asiatiques : Resserrement de la MAS et points de blocage stratégiques – Rabobank

Visa, Stripe rejoignent Tempo en tant que validateurs initiaux

Les contrats perpétuels Binance Wallet font leurs débuts alors que les flux BNB on-chain et les mouvements de baleines sur Binance Life attirent l'attention

Actualités tendance

Les banques saoudiennes vulnérables aux retombées d'une guerre prolongée

RAPPORT | Les piratages Web3 dépassent 480 millions de dollars de pertes au T1 2026, portés par les attaques d'ingénierie sociale, selon Hacken

Le Bitcoin atteint 76 000 $ après la stabilité de l'inflation PPI aux États-Unis : Le BTC maintiendra-t-il ses gains ?

Les marchés Forex (FX) asiatiques face à un test critique : le resserrement de la MAS et les points d'étranglement stratégiques remodèlent la dynamique des devises régionales

Bitcoin teste la base de coût clé des ETF : mais les baissiers ne se sont pas encore arrêtés

Actualités en direct 24h/24 et 7j/7

Prix des cryptomonnaies