Project Glasswing muestra el nuevo cuello de botella de la ciberseguridad

Por Alan Sonny

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

Anthropic ha publicado una primera actualización de Project Glasswing, su iniciativa para utilizar modelos avanzados de inteligencia artificial en la búsqueda de vulnerabilidades de seguridad en software crítico. El balance inicial es llamativo: el problema ya no parece estar solo en encontrar fallos, sino en verificar, comunicar y corregir a tiempo la enorme cantidad de vulnerabilidades que los modelos empiezan a descubrir.

La compañía asegura que, junto a unos 50 socios, ha utilizado Claude Mythos Preview para identificar más de 10.000 vulnerabilidades de severidad alta o crítica en software considerado esencial para internet y otras infraestructuras. Es una cifra que cambia el tono del debate sobre IA y ciberseguridad. Durante años, una de las limitaciones del sector era la capacidad humana para detectar fallos complejos. Ahora aparece una dificultad distinta: qué hacer cuando una IA encuentra vulnerabilidades más rápido de lo que los equipos pueden reproducirlas, priorizarlas, notificarlas y parchearlas.

El propio gráfico publicado por Anthropic resume bien la magnitud del atasco. De 23.019 hallazgos iniciales en proyectos open source, 1.900 pasaron por revisión de firmas externas de seguridad; 1.726 se confirmaron como válidos, con una tasa de verdaderos positivos del 90,8 %; 1.596 fueron comunicados a mantenedores; 1.451 fueron reconocidos por estos; y, a 22 de mayo de 2026, solo 97 aparecían como parcheados y 88 habían generado avisos de seguridad. La caída en cada etapa no refleja solo falsos positivos, sino el trabajo humano necesario para convertir un hallazgo en una corrección segura y desplegada.

La IA ya encuentra fallos a escala industrial

Project Glasswing se lanzó con un objetivo ambicioso: dar ventaja defensiva a quienes mantienen software crítico antes de que modelos de IA con capacidades similares puedan usarse de forma ofensiva. La actualización de Anthropic indica que varios socios han multiplicado por más de diez su ritmo de detección de bugs. Cloudflare, por ejemplo, habría encontrado 2.000 fallos en sistemas críticos, de los cuales 400 serían de severidad alta o crítica, con una tasa de falsos positivos que su equipo considera mejor que la de testers humanos.

Mozilla también aparece como uno de los casos relevantes: durante las pruebas con Mythos Preview encontró y corrigió 271 vulnerabilidades en Firefox 150, más de diez veces las que había localizado en Firefox 148 con Claude Opus 4.6, según Anthropic. La compañía cita además evaluaciones del AI Security Institute británico, XBOW y benchmarks académicos como ExploitBench y ExploitGym, donde Mythos Preview se habría situado entre los modelos más avanzados para tareas de explotación y análisis de vulnerabilidades.

La lectura es delicada. Desde el punto de vista defensivo, es una buena noticia que herramientas de IA puedan ayudar a localizar fallos antes de que los exploten atacantes. Pero también implica que capacidades similares terminarán disponibles para más actores. Anthropic reconoce que todavía no ha liberado públicamente modelos de la clase Mythos porque no considera que existan salvaguardas suficientes para impedir usos maliciosos de alto impacto.

Métrica de Project Glasswing	Dato comunicado
Socios aproximados del proyecto	50
Vulnerabilidades altas o críticas encontradas con socios	Más de 10.000
Proyectos open source escaneados	Más de 1.000
Hallazgos candidatos en open source	23.019
Hallazgos revisados por firmas externas	1.900
Hallazgos confirmados válidos en el gráfico	1.726
Tasa de verdaderos positivos del gráfico	90,8 %
Hallazgos comunicados a mantenedores	1.596
Hallazgos reconocidos por mantenedores	1.451
Hallazgos parcheados	97
Advisories publicados	88

El cuello de botella está en los mantenedores

El dato más importante no es solo cuántos fallos encuentra la IA, sino cuántos llegan a resolverse. Anthropic explica que su proceso de triage es intensivo: reproducir el problema, revaluar la severidad, comprobar si ya existe un parche, preparar un informe detallado y coordinar la divulgación con los mantenedores. En el caso del software libre, esta fase suele depender de equipos pequeños, voluntarios o proyectos con recursos limitados.

Ese punto es especialmente sensible. Muchos mantenedores ya se enfrentan a una avalancha de informes de baja calidad generados por IA. Si además empiezan a recibir cientos o miles de hallazgos potencialmente reales, el riesgo es que el sistema de divulgación responsable se sature. Anthropic afirma que algunos mantenedores incluso le han pedido reducir el ritmo de comunicaciones porque necesitan más tiempo para diseñar parches.

La situación crea una paradoja. La IA puede hacer el software más seguro si permite detectar vulnerabilidades antes y proponer correcciones. Pero durante una etapa intermedia puede aumentar el riesgo, porque reduce mucho el coste de descubrir y explotar fallos mientras la capacidad de corregirlos y desplegar parches sigue siendo humana, lenta y desigual.

El ejemplo citado de wolfSSL ilustra la gravedad de algunos hallazgos. Anthropic afirma que Mythos Preview detectó una vulnerabilidad en esta biblioteca criptográfica que podía permitir a un atacante falsificar certificados y presentar como legítimo un sitio controlado por él, por ejemplo simulando una web bancaria o de correo. El fallo, ya parcheado, ha sido asignado como CVE-2026-5194, y la compañía ha anunciado un análisis técnico posterior.

Qué deben hacer empresas y equipos de seguridad

La actualización de Project Glasswing deja una recomendación clara para desarrolladores y defensores: acortar los ciclos de parcheo. Si los modelos avanzados reducen el tiempo necesario para descubrir vulnerabilidades, las organizaciones no pueden mantener procesos lentos de validación, pruebas y despliegue. La ventana entre descubrimiento, parche y adopción por parte de los usuarios será cada vez más peligrosa.

Para los desarrolladores, eso significa publicar correcciones con más rapidez, facilitar la actualización a sus usuarios y ser más insistentes con quienes sigan usando versiones vulnerables. Para los equipos de seguridad corporativos, implica reducir tiempos de prueba y despliegue, reforzar configuraciones por defecto, activar autenticación multifactor, mejorar logs, endurecer redes y asumir que no siempre habrá tiempo suficiente para esperar a un parche perfecto.

Anthropic también ha presentado herramientas para trasladar parte de esta capacidad al ámbito defensivo. Claude Security, en beta pública para clientes de Claude Enterprise, permite escanear bases de código y generar propuestas de corrección. Según la compañía, Claude Opus 4.7 se ha usado en tres semanas para parchear más de 2.100 vulnerabilidades en entornos empresariales. La diferencia frente al open source es importante: en una empresa, el equipo que detecta suele tener control sobre el código y puede corregirlo sin pasar por un mantenedor voluntario externo.

Actor	Acción prioritaria
Desarrolladores de software	Reducir ciclos de corrección y publicar parches antes
Mantenedores open source	Priorizar informes verificados y apoyarse en herramientas de triage
Empresas usuarias	Acelerar pruebas y despliegue de actualizaciones críticas
Equipos SOC	Mejorar logs, detección y respuesta ante explotación temprana
Proveedores de IA	Diseñar salvaguardas antes de liberar modelos con capacidad ofensiva
Gobiernos y organismos	Apoyar a proyectos críticos y coordinar divulgación responsable

Un cambio de fase para la ciberseguridad

Project Glasswing apunta a un cambio de fase. La IA aplicada a seguridad no será solo un asistente para redactar informes o resumir alertas. Puede convertirse en una herramienta capaz de analizar código a gran escala, construir exploits, priorizar objetivos, proponer parches y automatizar parte del trabajo de investigación. Eso puede fortalecer enormemente a los defensores, pero también abarata capacidades que antes estaban reservadas a especialistas.

El reto no será únicamente técnico. Será organizativo. Si una IA puede encontrar miles de vulnerabilidades en software crítico, el sector necesitará mejores mecanismos de priorización, más financiación para mantenedores, procesos de divulgación más ágiles y una relación más madura entre laboratorios de IA, empresas, gobiernos y comunidad open source.

También hará falta evitar el ruido. Un modelo que genere informes masivos sin verificación puede perjudicar a los mantenedores y distraer recursos. Por eso Anthropic insiste en la revisión externa y en el cuidado al reportar. La tasa de verdaderos positivos del gráfico es alta, pero llegar a esa cifra exige trabajo humano especializado.

La ciberseguridad siempre ha sido una carrera entre descubrimiento, explotación y corrección. La IA está acelerando la primera parte y, probablemente, también acelerará la ofensiva. La defensa debe responder acelerando la segunda: triage, parcheo, despliegue y mitigación.

Project Glasswing deja una conclusión incómoda para cualquier organización que dependa de software crítico: encontrar vulnerabilidades dejará de ser el principal cuello de botella. El nuevo límite estará en la capacidad de actuar antes de que otros encuentren lo mismo con intenciones distintas.

Preguntas frecuentes

¿Qué es Project Glasswing?
Es una iniciativa de Anthropic para usar modelos avanzados de IA en la detección defensiva de vulnerabilidades en software crítico, junto a socios del sector.

¿Qué es Claude Mythos Preview?
Es un modelo de Anthropic orientado a capacidades avanzadas de ciberseguridad. No se ha liberado públicamente porque la compañía afirma que aún hacen falta salvaguardas más fuertes contra usos maliciosos.

¿Por qué preocupa que la IA encuentre tantas vulnerabilidades?
Porque los equipos humanos pueden no tener capacidad suficiente para verificar, reportar y parchear al mismo ritmo, lo que amplía el riesgo durante la fase de corrección.

¿Qué deben hacer las empresas ahora?
Reducir ciclos de parcheo, reforzar controles básicos, mejorar monitorización, revisar dependencias críticas y prepararse para un volumen mucho mayor de hallazgos de seguridad generados por IA.

vía: anthropic