Claude Mythos löser 73 % av experters cyberuppgifter som ingen AI klarade tidigare

  • Claude Mythos Preview är den första AI:n som klarar en simulerad företagsattack på nätet.
  • Den löste 73 % av expertuppgifter inom hacking som ingen AI klarade före 2025.
  • Anthropic presenterade Claude Mythos Preview den 7 april.

Anthropic Claude Mythos Preview har blivit den första AI-modellen som har klarat en hel simulerad attack mot ett företagsnätverk, enligt nya utvärderingar från Storbritanniens AI Security Institute (AISI).

Resultatet, som kom bara några dagar efter att modellen presenterades den 7 april, visar att AI:s cyberförmåga nu har nått en nivå som kräver omedelbar uppmärksamhet från säkerhetsteam över hela världen.

Vad är Claude Mythos?

Anthropic presenterade sin Claude Mythos Preview den 7 april, men de släpper inte modellen för allmänheten. Teamet ger bara begränsad tillgång till säkerhetsforskningsföretag så att de kan utvärdera och förbereda sig för modellens avancerade funktioner.

”Den här modellen presterar starkt på alla områden, men är särskilt skicklig på dator­säkerhet. Därför har vi startat Project Glasswing, ett initiativ där vi använder Mythos Preview för att hjälpa till att skydda världens viktigaste mjukvara, och för att förbereda branschen på vilka metoder vi måste använda för att ligga steget före cyberangripare,” står det i meddelandet.

Följ oss på X för att få de senaste nyheterna direkt

Utvecklingen har redan väckt uppmärksamhet i teknikvärlden och bland beslutsfattare. Enligt en Reuters-rapport med källor som är insatta i frågan bjöd USAs finansminister Scott Bessent och Federal Reserve-chefen Jerome Powell in ledare för stora banker till ett akut möte. De varnade för möjliga cyberrisker kopplade till den här modellen.

Hur klarade sig Claude Mythos Preview?

AI Security Institute (AISI), som är en forskningsorganisation inom Storbritanniens Department for Science, Innovation and Technology, gjorde cyberutvärderingar av Anthropics Claude Mythos Preview för att undersöka dess cybersäkerhet.

Först gjorde de så kallade capture-the-flag (CTF) tester där systemen måste hitta och utnyttja sårbarheter för att hämta gömda ”flaggor”. Mythos nådde 73 % framgång på expertnivå. Ingen annan modell hade klarat det före april 2025.

Claude Mythos cyberattackförmåga
Claude Mythos cyberattackförmåga. Källa: AISI

AISI byggde också en 32-stegs simulerad företagsattack med namnet “The Last Ones” (TLO). Säkerhetsspecialister skulle behöva cirka 20 timmar att ta sig igenom allt.

Mythos Preview klarade hela simuleringen 3 av 10 gånger. I genomsnitt lyckades modellen med 22 av de 32 attackstegen. Claude Opus 4,6, näst bäst, hade i snitt bara 16 steg.

“Mythos Previews framgång på det här området visar att den åtminstone kan attackera mindre, svagt skyddade och sårbara företagssystem där den redan fått tillgång till nätverket. Men våra tester skiljer sig från verkliga miljöer, vilket gör att de är lättare att klara,” la teamet till.

Anthropics interna kontroller har också visat att Claude Mythos Preview kan hitta och utnyttja okända sårbarheter i alla stora operativsystem och kända webbläsare, om användaren ger tydliga instruktioner.

“Vi kan bara rapportera begränsad information. Över 99 % av sårbarheterna vi hittat har ännu inte åtgärdats, så det vore oansvarigt att ge detaljer om dem,” säger teamet.

AISI säger att organisationer bör sätta grundläggande cybersäkerhet först. Det handlar om regelbunden patchning, strikta åtkomstkontroller, hårdare säkerhetskonfiguration samt noggrann loggning.

Prenumerera på vår YouTube-kanal för att se experter och journalister ge sina analyser

För att läsa den senaste marknadsanalysen av kryptovalutor från BeInCrypto, klicka här.

Ansvarsfriskrivning

All information på vår webbplats publiceras i god tro och endast för allmän information. Varje åtgärd som läsaren vidtar baserat på informationen på vår webbplats sker strikt på egen risk.