Anthropic recupera Claude Fable 5 tras levantar EE. UU. los controles de exportación

Anthropic ha restablecido el acceso a Claude Fable 5 y Claude Mythos 5 después de que el Gobierno de Estados Unidos levantara los controles de exportación que habían obligado a suspender ambos modelos. La decisión pone fin, al menos de forma temporal, a uno de los episodios más delicados de la IA de frontera en 2026: un modelo avanzado retirado de golpe por una orden gubernamental, una explicación pública sobre sus salvaguardas y el inicio de una coordinación más estrecha entre empresas tecnológicas y Administración estadounidense.

El caso es importante porque va más allá de Anthropic. Muestra cómo los modelos de IA más capaces empiezan a moverse en un terreno donde producto, ciberseguridad, regulación y política industrial se mezclan. Ya no se trata solo de lanzar un modelo, medirlo frente a competidores y abrirlo a usuarios de pago. Cuando una IA alcanza capacidades sensibles en ciberseguridad, biología, agentes o automatización, los gobiernos quieren mirar antes de que llegue al mercado.

Según Anthropic, el 12 de junio el Gobierno estadounidense aplicó controles de exportación a Claude Fable 5 y Claude Mythos 5. La orden obligaba a restringir el acceso a ciudadanos extranjeros, estuvieran dentro o fuera de Estados Unidos. Como la compañía no podía verificar nacionalidad en tiempo real de forma fiable, optó por suspender ambos modelos para todos los usuarios. El 30 de junio esos controles fueron levantados y Fable 5 vuelve a estar disponible globalmente desde el 1 de julio en Claude Platform, Claude.ai, Claude Code y Claude Cowork.

Fable 5 vuelve para usuarios globales, Mythos 5 sigue más limitado

La reapertura no es igual para los dos modelos. Fable 5 se recupera para usuarios globales, con disponibilidad en los principales productos de Anthropic. Para planes Pro, Max, Team y algunos Enterprise, la compañía indica que Fable 5 estará incluido hasta el 50 % de los límites semanales de uso hasta el 7 de julio; después pasará a estar disponible mediante créditos de uso. Anthropic también afirma que trabajará para reactivar el acceso a través de AWS, Google Cloud y Microsoft Foundry lo antes posible.

Mythos 5, en cambio, sigue bajo un esquema más restringido. Anthropic ha restaurado el acceso para un conjunto de organizaciones estadounidenses tras una aprobación gubernamental del 26 de junio y asegura que continuará coordinándose con el Gobierno para ampliar el acceso a más socios nacionales e internacionales dentro del programa Glasswing.

Esta diferencia es relevante. Fable 5 y Mythos 5 comparten modelo base, pero no el mismo nivel de salvaguardas. Anthropic explica que Fable 5 fue lanzado con protecciones fuertes para uso general, mientras que Mythos 5, con menos restricciones, se orientó a un pequeño grupo de socios de confianza para trabajos defensivos de ciberseguridad.

ModeloEstado comunicado por AnthropicEnfoque
Claude Fable 5Acceso global restaurado desde el 1 de julioUso general con salvaguardas fuertes
Claude Mythos 5Acceso restaurado para algunas organizaciones de EE. UU.Ciberseguridad defensiva con menos salvaguardas
Claude Opus 4.8Modelo de respaldo cuando Fable 5 bloquea una solicitudAlternativa para peticiones filtradas

El incidente se originó tras un informe de investigadores de Amazon que, según Anthropic, identificaron una técnica para sortear algunas salvaguardas de Fable 5. En uno de los casos, el modelo llegó a generar código que demostraba cómo podía explotarse una vulnerabilidad. La compañía sostiene que la técnica no reveló capacidades ofensivas exclusivas de Mythos 5 y que otros modelos menos capaces podían llegar a resultados similares en las pruebas internas comparativas.

Más filtros, más bloqueos y más falsos positivos

La respuesta técnica de Anthropic ha sido reforzar sus clasificadores de seguridad. Estos clasificadores son sistemas automatizados que detectan si una petición o una salida del modelo puede estar relacionada con tareas de ciberseguridad potencialmente dañinas. Cuando se activan, bloquean la respuesta o redirigen la petición. En el caso de Fable 5, Anthropic indica que las solicitudes bloqueadas se enviarán a Opus 4.8.

La compañía afirma que el nuevo clasificador bloquea en más del 99 % de los casos la técnica descrita en el informe de Amazon. También admite el coste de esa decisión: habrá más falsos positivos en tareas legítimas de programación, depuración y ciberseguridad defensiva. Es decir, algunos usuarios verán más bloqueos incluso cuando sus peticiones sean razonables.

Ese punto es clave para entender el dilema. Anthropic explica que ajustó los clasificadores de Fable 5 con un margen de seguridad mucho mayor que en lanzamientos anteriores. La idea es que una petición tenga que parecer claramente segura para pasar. En la práctica, esto reduce el riesgo de usos peligrosos, pero puede hacer que el modelo rechace tareas benignas, especialmente en ámbitos ambiguos como búsqueda de vulnerabilidades, análisis de código o pruebas defensivas.

La empresa defiende un enfoque de defensa en profundidad. No confía en una sola capa, sino en una combinación de entrenamiento del modelo, clasificadores, análisis de patrones de uso, redirecciones y revisión continua. Aun así, reconoce una realidad que la industria lleva tiempo asumiendo: ningún modelo avanzado puede considerarse completamente inmune a jailbreaks.

Una propuesta para medir jailbreaks con criterios comunes

La parte más interesante del comunicado no es solo la reapertura de Fable 5. Anthropic propone, junto con Amazon, Microsoft, Google y otros socios del programa Glasswing, crear un marco común para evaluar la gravedad de los jailbreaks en modelos de IA.

Hoy no existe un estándar compartido para decir si un jailbreak es menor, moderado o grave. Eso genera incertidumbre cada vez que alguien descubre una técnica de evasión. Las empresas no tienen un baremo común para priorizar correcciones, y los gobiernos tampoco cuentan con una regla clara para decidir cuándo intervenir.

Anthropic plantea evaluar cada jailbreak con cuatro criterios. El primero es la ganancia de capacidad: cuánto aporta respecto a herramientas ya disponibles. El segundo es la amplitud: si la técnica solo funciona para un caso muy concreto o permite desbloquear muchas tareas ofensivas. El tercero es la facilidad de convertirlo en un ataque real. El cuarto es su descubribilidad, es decir, si requiere conocimiento especializado o ya circula de forma sencilla por internet.

Criterio propuestoQué mide
Ganancia de capacidadSi el jailbreak permite hacer algo que no era fácil con herramientas existentes
AmplitudSi funciona para una tarea concreta o para muchas técnicas ofensivas
Facilidad de uso ofensivoCuánto esfuerzo humano exige convertirlo en ataque
DescubribilidadSi la técnica es difícil de encontrar o ya está disponible públicamente

La propuesta es imperfecta, como reconoce la propia Anthropic, pero apunta a una necesidad real. La IA de frontera se está moviendo hacia capacidades cada vez más sensibles. Si cada incidente se interpreta con criterios distintos, el resultado puede ser una mezcla de sobrerreacción, bloqueo de herramientas útiles y decisiones gubernamentales poco predecibles.

Anthropic también anuncia un nuevo programa en HackerOne para que investigadores de seguridad puedan enviar posibles jailbreaks cibernéticos de Fable 5. Además, prepara vigilancia 24/7 sobre canales de reporte de jailbreaks, al menos para los casos de mayor gravedad.

Más colaboración con el Gobierno estadounidense

El comunicado deja otro mensaje claro: Anthropic va a profundizar su cooperación con el Gobierno de Estados Unidos. La compañía afirma que durante las diez semanas previas trabajó con distintas áreas de la Administración en el enfoque reflejado en la orden ejecutiva del 2 de junio sobre innovación y seguridad en IA avanzada. Cita, entre otros, la Oficina del Director Nacional de Ciberseguridad, la Oficina de Política Científica y Tecnológica, el Departamento del Tesoro, el Departamento de Comercio y CAISI.

Esa colaboración incluirá acceso previo a modelos y salvaguardas para socios gubernamentales designados cuando el modelo avance de forma relevante la frontera en áreas de seguridad nacional. También prevé compartir información rápida sobre jailbreaks o patrones de abuso, aportar capacidad de cómputo para pruebas e investigación y trabajar con Gobierno e industria hacia un estándar voluntario común.

La compañía intenta equilibrar dos mensajes. Por un lado, defiende que los modelos avanzados deben estar disponibles para usuarios, defensores de ciberseguridad e investigadores. Por otro, acepta que las capacidades de frontera exigen evaluación previa, intercambio de información y reglas más sistemáticas.

La frase más importante llega casi al final: estas reglas deberían codificarse en una regulación fuerte y aplicarse por igual a los desarrolladores de modelos frontera. Es una forma de pedir que el proceso no dependa de decisiones improvisadas, empresa por empresa o modelo por modelo.

La IA de frontera entra en una etapa menos cómoda

La recuperación de Fable 5 puede leerse como una buena noticia para usuarios y desarrolladores. Pero el episodio deja una señal de fondo: los lanzamientos de modelos avanzados ya no serán simples eventos de producto. La combinación de capacidades en ciberseguridad, agentes, código y automatización está empujando a las empresas hacia una relación más estrecha con los gobiernos.

Esto puede aportar más seguridad, mejores pruebas y respuestas más rápidas ante riesgos reales. También puede generar más incertidumbre para usuarios fuera de Estados Unidos, empresas que dependen de APIs cerradas y organizaciones que necesitan continuidad de acceso para sus propios productos.

El caso Fable 5 muestra que la seguridad de la IA no será solo una cuestión técnica. También será una cuestión de gobernanza, jurisdicción, confianza y acceso. Anthropic ha logrado recuperar el modelo, pero el precedente queda sobre la mesa: una orden gubernamental puede afectar de forma inmediata al acceso global a una herramienta de IA.

La industria tendrá que construir algo más sólido que comunicados de emergencia. Si los modelos frontera se convierten en infraestructura crítica para programadores, científicos, analistas, defensores de ciberseguridad y empresas, las reglas de acceso y suspensión deberán ser claras, proporcionales y estables.

Preguntas frecuentes

¿Qué ha pasado con Claude Fable 5?
Anthropic ha restaurado el acceso a Claude Fable 5 después de que el Gobierno de Estados Unidos levantara los controles de exportación que habían obligado a suspenderlo.

¿Por qué se suspendió Fable 5?
Según Anthropic, el 12 de junio Estados Unidos aplicó controles de exportación a Fable 5 y Mythos 5. Al no poder verificar nacionalidad en tiempo real, la compañía suspendió ambos modelos para todos los usuarios.

¿Fable 5 vuelve para todo el mundo?
Anthropic indica que Fable 5 estará disponible globalmente desde el 1 de julio en Claude Platform, Claude.ai, Claude Code y Claude Cowork.

¿Qué ocurre con Mythos 5?
Mythos 5 se ha restaurado para un conjunto de organizaciones estadounidenses tras aprobación gubernamental. Anthropic trabaja para ampliar el acceso dentro del programa Glasswing.

¿Qué propone Anthropic sobre los jailbreaks?
La compañía quiere crear, junto con Amazon, Microsoft, Google y otros socios, un marco común para medir la gravedad de jailbreaks según ganancia de capacidad, amplitud, facilidad de uso ofensivo y descubribilidad.

Scroll al inicio