Anthropic presenta Mythos y avisa: la IA ya puede cambiar la ciberseguridad

Por Alan Sonny

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

Anthropic ha lanzado una de las advertencias más serias que se han escuchado hasta ahora sobre el impacto de la inteligencia artificial en la ciberseguridad. La compañía presentó el 7 de abril Claude Mythos Preview, un nuevo modelo generalista que, según sus propias pruebas, ha dado un salto notable en tareas ofensivas y defensivas de seguridad informática. La firma asegura que el sistema ha sido capaz de encontrar y explotar vulnerabilidades zero-day en todos los grandes sistemas operativos y en todos los grandes navegadores web durante sus evaluaciones internas.

La reacción de Anthropic no ha sido abrir el acceso al modelo, sino justo lo contrario. La empresa ha puesto en marcha Project Glasswing, una iniciativa con socios como Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, la Linux Foundation, Microsoft, NVIDIA y Palo Alto Networks para usar Mythos Preview con fines defensivos sobre software crítico. Anthropic también ha confirmado que no planea hacer este modelo generalmente disponible y que, por ahora, su acceso está restringido a una vista previa de investigación por invitación.

Un modelo que no se presenta como producto masivo, sino como aviso

Lo más llamativo del anuncio no es solo el modelo, sino el tono. Anthropic sostiene que Mythos Preview marca un “watershed moment”, un punto de inflexión para la seguridad, porque las mejoras generales en código, razonamiento y autonomía han desembocado también en una mejora radical para identificar fallos y convertirlos en exploits. La compañía subraya además que no entrenó explícitamente a Mythos para explotar software, sino que esa capacidad habría emergido como consecuencia de su mejora general en tareas de programación y agentes.

Eso obliga a leer el anuncio con una mezcla de interés y cautela. Interés, porque la propia Anthropic acompaña el lanzamiento con una batería de ejemplos técnicos muy concretos. Cautela, porque la mayoría de las afirmaciones más fuertes proceden de pruebas de la propia empresa y no pueden verificarse todavía de forma independiente en detalle. De hecho, el laboratorio admite que más del 99 % de las vulnerabilidades que ha encontrado aún no estaban parcheadas cuando escribió su informe, lo que limita lo que puede hacer público por razones de divulgación responsable.

Aun así, los ejemplos que sí ha decidido contar son lo bastante llamativos como para entender por qué Anthropic ha optado por un despliegue tan controlado. En su blog técnico, el equipo describe un fallo de 27 años en OpenBSD ya corregido, una vulnerabilidad de 16 años en FFmpeg y un remote code execution en el servidor NFS de FreeBSD que terminó registrado como CVE-2026-4747. También afirma que Mythos fue capaz de encadenar vulnerabilidades en el kernel de Linux para lograr elevación local de privilegios, además de encontrar problemas en bibliotecas criptográficas, aplicaciones web y software cerrado mediante técnicas de ingeniería inversa.

Qué dice Anthropic que hace mejor que Opus 4.6

El contraste con su modelo anterior es uno de los puntos clave del anuncio. Anthropic recuerda que hace solo un mes decía que Opus 4.6 era mucho mejor arreglando fallos que explotándolos, con una tasa cercana al 0 % en desarrollo autónomo de exploits. En cambio, asegura que Mythos Preview logró convertir vulnerabilidades encontradas en el motor JavaScript de Firefox 147 en exploits funcionales 181 veces, frente a solo 2 casos de Opus 4.6 en el mismo tipo de experimento. En su corpus interno de pruebas sobre OSS-Fuzz, la empresa añade que Mythos alcanzó 595 fallos de niveles 1 y 2, varios de niveles 3 y 4, y diez casos de control total del flujo de ejecución sobre objetivos completamente parcheados, algo muy por encima de Sonnet 4.6 y Opus 4.6.

Project Glasswing también incluye comparativas de rendimiento en varios benchmarks. En CyberGym, Anthropic sitúa a Mythos Preview en el 83,1 %, frente al 66,6 % de Opus 4.6. En pruebas de desarrollo como SWE-bench Pro, Terminal-Bench 2.0, SWE-bench Verified o SWE-bench Multilingual, el nuevo modelo también aparece por delante. La propia compañía, eso sí, introduce matices: en Humanity’s Last Exam reconoce que Mythos sigue rindiendo muy bien incluso con poco esfuerzo computacional, algo que podría indicar cierto nivel de memorización, y aclara que algunas de sus pruebas multimodales usan implementaciones internas no directamente comparables con rankings públicos.

Ese detalle es importante porque evita caer en una lectura simplista. El mensaje de Anthropic no es solo “hemos construido un modelo más potente”, sino “hemos llegado a un punto en el que mejorar mucho en programación y razonamiento puede traducirse muy rápido en mejorar también en capacidades ofensivas de ciberseguridad”. Esa es la parte que más inquieta del anuncio y la que explica que la empresa hable ya de nuevas salvaguardas para futuros modelos Opus antes siquiera de plantear un acceso abierto a Mythos.

Glasswing: una alianza defensiva con grandes tecnológicas y actores clave

Project Glasswing es la respuesta que Anthropic ha decidido ensayar. El programa da acceso a Mythos Preview a los socios de lanzamiento y a más de 40 organizaciones adicionales que construyen o mantienen infraestructura crítica, para que lo utilicen en tareas como búsqueda local de vulnerabilidades, pruebas sobre binarios cerrados, protección de endpoints y pentesting. Anthropic aportará hasta 100 millones de dólares en créditos de uso del modelo, más 4 millones en donaciones directas a organizaciones de seguridad open source. De ese total, 2,5 millones se canalizarán a Alpha-Omega y OpenSSF a través de la Linux Foundation, y 1,5 millones a la Apache Software Foundation.

La compañía también ha explicado que, tras esta fase inicial, Mythos Preview estará disponible para participantes del programa a 25 dólares por millón de tokens de entrada y 125 dólares por millón de tokens de salida, con acceso a través de la API de Claude, Amazon Bedrock, Google Cloud Vertex AI y Microsoft Foundry. La documentación oficial de Anthropic ya refleja que Mythos Preview es una vista previa de investigación para flujos de trabajo defensivos de ciberseguridad, con acceso solo por invitación, tanto en su plataforma como en Bedrock.

El enfoque tiene una lógica evidente: Anthropic quiere intentar que las capacidades más avanzadas lleguen primero a defensores y mantenedores de infraestructura crítica antes de que modelos parecidos empiecen a circular con menos restricciones. Reuters resumió esta lectura con claridad al presentar Glasswing como un intento de poner a trabajar un modelo no publicado para fines defensivos antes de que las mismas capacidades acaben beneficiando a atacantes.

La gran pregunta no es si esto llegará, sino cuándo

El punto más relevante del anuncio quizá no esté en una vulnerabilidad concreta, sino en la tesis que lo sostiene: el equilibrio histórico de la ciberseguridad puede cambiar si el coste de encontrar y explotar fallos cae mucho gracias a modelos de IA cada vez más autónomos. Anthropic cree que, a largo plazo, estas herramientas beneficiarán más a defensores que a atacantes, del mismo modo que los fuzzers terminaron convirtiéndose en una pieza esencial para asegurar software. Pero también advierte de que el periodo de transición puede ser caótico, especialmente si los laboratorios no son cuidadosos con el modo en que liberan estos sistemas.

Ese diagnóstico ya está siendo asumido por parte del sector. Microsoft, AWS, Google, Cisco, CrowdStrike, Palo Alto Networks, la Linux Foundation o JPMorganChase aparecen en Glasswing precisamente porque entienden que el debate ya no es teórico. Anthropic asegura además que mantiene conversaciones activas con responsables del Gobierno de Estados Unidos sobre las capacidades ofensivas y defensivas de Mythos Preview, y plantea incluso que en el futuro podría ser necesario un organismo independiente que reúna a actores públicos y privados para coordinar este tipo de trabajo a gran escala.

En otras palabras, Mythos Preview no es solo el anuncio de un modelo nuevo. Es también un mensaje político, industrial y técnico: la ciberseguridad empieza a entrar en una fase en la que la ventaja competitiva podría depender tanto de tener buenos equipos humanos como de saber usar antes que nadie modelos capaces de leer, auditar y romper software a una velocidad inédita. Anthropic ha decidido no poner ese poder en el mercado general, al menos de momento. Pero el simple hecho de que haya preferido contenerlo ya dice bastante sobre el punto al que está llegando la IA.

Preguntas frecuentes

¿Qué es exactamente Claude Mythos Preview?
Es un nuevo modelo generalista de Anthropic presentado el 7 de abril de 2026, con un rendimiento especialmente fuerte en tareas de ciberseguridad, como búsqueda de vulnerabilidades, explotación, ingeniería inversa y generación de cadenas de ataque. Anthropic lo mantiene como vista previa restringida y no planea abrirlo al público general por ahora.

¿Qué es Project Glasswing y quién participa?
Es una iniciativa coordinada por Anthropic para usar Mythos Preview con fines defensivos sobre software crítico. Entre los socios de lanzamiento figuran AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, la Linux Foundation, Microsoft, NVIDIA y Palo Alto Networks, además de más de 40 organizaciones adicionales con acceso extendido.

¿Anthropic ha demostrado de forma independiente que Mythos encuentra miles de zero-days?
No de forma independiente y completa por ahora. La compañía sí ha publicado ejemplos técnicos concretos y afirma que más del 99 % de las vulnerabilidades encontradas aún no estaban parcheadas cuando redactó su informe, lo que limita la verificación pública inmediata. Por eso varias de sus afirmaciones más fuertes siguen dependiendo, de momento, de su documentación interna y de futuros procesos de divulgación responsable.

¿Se podrá usar Mythos Preview desde la API o en la nube?
Sí, pero solo dentro del programa y por invitación. Anthropic indica que el modelo está disponible para participantes a través de su API, Amazon Bedrock, Google Cloud Vertex AI y Microsoft Foundry, con una tarificación específica una vez superada la fase inicial cubierta por créditos del programa.

vía: red.anthropic y anthropic