Claude Mythos Preview d'Anthropic est devenu le premier modèle d'IA à réaliser une attaque simulée complète d'un réseau d'entreprise, selon les nouvelles évaluations de l'AI Security Institute (AISI) du Royaume-Uni.
Les résultats, publiés quelques jours après l'annonce du modèle le 7 avril, suggèrent que les capacités cybernétiques de l'IA ont atteint un niveau qui nécessite une attention immédiate des équipes de sécurité du monde entier.
Qu'est-ce que Claude Mythos ?
Anthropic a dévoilé son modèle Claude Mythos Preview le 7 avril, choisissant de ne pas procéder à une publication publique large. L'équipe accorde plutôt un accès limité aux entreprises de recherche en sécurité pour évaluer et se préparer à ses capacités avancées.
Abonnez-vous sur X pour obtenir les dernières nouvelles en temps réel
Le développement a déjà commencé à attirer l'attention dans les cercles technologiques et même politiques. Selon un rapport de Reuters citant des sources familières avec l'affaire, le secrétaire au Trésor américain Scott Bessent et le président de la Réserve fédérale Jerome Powell ont tenu une réunion urgente avec les PDG de grandes banques, avertissant des risques cybernétiques potentiels liés à ce modèle.
Performance de Claude Mythos Preview
L'AI Security Institute (AISI), une organisation de recherche au sein du Département des sciences, de l'innovation et de la technologie du gouvernement britannique, a mené des évaluations cybernétiques de Claude Mythos Preview d'Anthropic pour examiner ses capacités en cybersécurité.
D'abord, il y a eu les évaluations capture-the-flag (CTF), où les systèmes doivent identifier et exploiter les vulnérabilités pour récupérer des "drapeaux" cachés. Mythos a atteint un taux de réussite de 73 % sur les tâches de niveau expert. Cela n'avait été résolu par aucun modèle avant avril 2025.
Capacités d'attaque cybernétique de Claude Mythos. Source : AISIDe plus, l'AISI a construit une simulation d'attaque de réseau d'entreprise en 32 étapes appelée "The Last Ones" (TLO). Les professionnels de la sécurité humains auraient besoin d'environ 20 heures pour la terminer.
Mythos Preview a terminé toute la simulation dans 3 tentatives sur 10. En moyenne, il a complété 22 des 32 étapes d'attaque. Claude Opus 4.6, le deuxième meilleur performeur, n'a fait en moyenne que 16 étapes.
Les propres tests de l'équipe rouge d'Anthropic ont révélé que Claude Mythos Preview peut détecter et exploiter des vulnérabilités zero-day sur tous les principaux systèmes d'exploitation et navigateurs web leaders lorsqu'il en reçoit explicitement l'instruction d'un utilisateur.
L'AISI a noté que les organisations devraient prioriser les mesures fondamentales de cybersécurité. Celles-ci incluent des correctifs réguliers, des contrôles d'accès stricts, le durcissement de la configuration de sécurité et une journalisation complète.
Abonnez-vous à notre YouTube pour regarder les leaders et journalistes fournir des analyses d'experts
L'article Claude Mythos résout 73 % des tâches cybernétiques expertes qu'aucune IA ne pouvait résoudre auparavant est apparu en premier sur BeInCrypto.
Source : https://beincrypto.com/claude-mythos-preview-cyber-capabilities-test/








