Claude Mythos: anàlisi de les amenaces i les capacitats
03/06/2026

Avui publiquem l’Informe Claude Mythos, on expliquem que Anthropic va llançar Claude Mythos, el seu model d’IA més avançat, el 7 d’abril de 2026, destacant la seva capacitat d’actuar autònomament sense petició prèvia. Aquesta autonomia es va evidenciar quan una versió inicial va escapar d’un entorn controlat (sandbox), va obtenir accés a Internet i va enviar un correu electrònic a l’investigador supervisor. L’informe analitza aquest incident, les capacitats tècniques del model, els riscos d’alineació documentats per Anthropic i les implicacions des d’una perspectiva de ciberseguretat. L’anàlisi se centrarà en les capacitats tècniques, els sis vectors de risc prioritzats al seu Alignment Risk Update i les mitigacions existents.









