Cómo Anthropic descubrió que Mythos era demasiado peligroso

Los propios expertos de la empresa de IA advirtieron que Mythos podría vulnerar los sistemas que sustentan gran parte de la computación moderna. Bancos y agencias gubernamentales se apresuran a evaluar la amenaza.

Read the story in English

Una noche templada de febrero en Bali, Nicholas Carlini se apartó entre eventos de una boda, abrió su computadora portátil y se dispuso a causar problemas. Anthropic PBC acababa de poner a disposición para revisión interna un nuevo modelo de inteligencia artificial, llamado Mythos, y Carlini —un reconocido investigador en IA— quería ver qué tipo de daños podía provocar.