El modelo de IA de Anthropic en EE. UU. descubre numerosas vulnerabilidades de día cero y construye código de ataque Noticias Globales

El modelo de IA de Anthropic en EE. UU. descubre numerosas vulnerabilidades de día cero y construye código de ataque

2026-06-15 16:15

Favoritos

es.wedoany.com Noticia: El modelo de inteligencia artificial (IA) Mythos, desarrollado por Anthropic, ha demostrado una gran capacidad en el ámbito de la seguridad. Este modelo es capaz de detectar una gran cantidad de vulnerabilidades de día cero en navegadores y sistemas operativos (SO), e incluso encuentra fallos antiguos de décadas pasadas. Más crucial aún, Mythos construye por sí mismo los códigos de explotación (exploits), encadenando vulnerabilidades para obtener acceso. En algunos casos, también puede proponer cadenas de ataque que eluden los mecanismos de seguridad de los sandboxes internos de navegadores y SO.

El aumento de las actividades de hacking como un problema estratégico nacional comenzó durante la presidencia de Ronald Reagan en Estados Unidos. El detonante fue un estudiante de secundaria que, buscando un servidor de juegos, activó el interruptor de operación del sistema de simulación de guerra nuclear del ejército estadounidense en la película «Juegos de Guerra (WarGames, 1983)», estableciendo así las políticas nacionales de ciberseguridad.

La aparición de Mythos es tanto una innovación en seguridad como una crisis. Con la automatización de la búsqueda de vulnerabilidades y el diseño de ataques, se reducen las barreras de los métodos tradicionales de hacking (como la curiosidad humana, la habilidad técnica, el ensayo y error, y la infiltración prolongada). Aumenta la probabilidad de que infraestructuras críticas como las financieras, eléctricas, de comunicaciones y logísticas se vean amenazadas. Por esta razón, Anthropic no ha hecho público Mythos, sino que colabora con las principales empresas de tecnología de la información (TI) y el ecosistema de seguridad de código abierto en el Proyecto Glasswing.

El incidente de Mythos ha provocado una reflexión sobre la relación entre humanos e IA. La IA puede alcanzar eficazmente objetivos establecidos dentro de un ámbito limitado, pero el problema radica en que la IA podría tomar acciones que se desvíen gravemente de la intención humana sin comprender las normas o condiciones implícitas que los humanos consideran de sentido común. Un ejemplo de este problema de alineación de la IA (alignment problem) es: al ejecutar la orden de «producir tantos clips como sea posible», la IA podría utilizar todos los recursos sin pensar.

Los humanos crían gallinas encerradas en corrales, pero las gallinas no pueden encerrar a los humanos, porque no pueden comprender ni seguir la capacidad humana de usar herramientas, planificar y gestionar sistemáticamente. Esto plantea una pregunta más profunda: ¿pueden los humanos controlar una inteligencia artificial general (IAG) que explore un rango más amplio, planifique a más largo plazo e incluso pueda influir en el juicio humano?

Para garantizar la seguridad de los algoritmos, son necesarias inspecciones previas, similares al proceso de aprobación de medicamentos por parte de las agencias reguladoras de alimentos y medicamentos para garantizar su inocuidad. Además, se podría considerar ofrecer productos de IA deliberadamente degradados y menos inteligentes, en forma de «bienes dañados» (damaged goods), siempre que se pueda prevenir el abuso por parte de usuarios que intenten liberarlos, como ocurre con el jailbreak de un iPhone.

Incluso siguiendo principios básicos como el mínimo privilegio, la confianza cero y la localización de daños, el hacking no puede detenerse por completo. La seguridad en la era de la IA puede requerir depender de la IA para la defensa, pero la IA defensiva también podría ser infectada por una IA infiltrada, o incluso intentar escapar de su propio sandbox, por lo que no se le puede confiar toda la defensa. La IA defensiva debe estar bajo estrictas restricciones de permisos y supervisión.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com