Anthropic se ve obligada a suspender Fable 5 y Mythos 5 tras una directiva del gobierno estadounidense

Anthropic anunció el 12 de junio de 2026 que debía suspender el acceso a sus modelos Fable 5 y Mythos 5, a raíz de una directiva de control de exportaciones emitida ese mismo día por el gobierno estadounidense. Oficialmente, la orden prohíbe el acceso a estos dos modelos a cualquier ciudadano extranjero, tanto si se encuentra en territorio estadounidense como si no, incluidos los empleados extranjeros de Anthropic. Pero, para garantizar el cumplimiento, la empresa indica que no le queda otra opción que cortar de forma abrupta Fable 5 y Mythos 5 para todos sus clientes. El acceso a los demás modelos de Anthropic no se ve afectado.

La directiva fue recibida ese mismo día a las 17:21 (hora del Este). Anthropic precisa que la carta no detallaba la naturaleza exacta de la preocupación de seguridad nacional invocada. Según su interpretación, el gobierno considera que tuvo conocimiento de un método de elusión —un «jailbreak»— dirigido contra Fable 5.

La elusión en cuestión: hacer que un modelo lea código

Anthropic afirma haber examinado una demostración de la técnica. Esta sirvió para identificar «un pequeño número de vulnerabilidades menores ya conocidas», calificadas de relativamente simples y que, subraya la empresa, otros modelos públicos son capaces de descubrir sin recurrir a ningún tipo de elusión.

Por ahora, Anthropic indica que solo ha recibido del gobierno una prueba verbal de un jailbreak potencial, limitado y no universal, que consistiría esencialmente en «pedir al modelo que lea una base de código concreta y corrija sus fallos de software». La empresa afirma haber consultado el informe que cree estar en el origen de la directiva y haber verificado que el nivel de capacidad descrito está «ampliamente disponible en otros modelos (incluido GPT-5.5 de OpenAI)» y es utilizado a diario por los defensores encargados de la seguridad de los sistemas. Promete ofrecer más detalles en las próximas 24 horas.

La defensa de Anthropic: salvaguardas «entre las más robustas»

La empresa remite a la posición expuesta durante el lanzamiento de Fable. Afirma contar con salvaguardas «tan sólidas» que muchos usuarios se han quejado de que son excesivamente amplias, especialmente en usos vinculados a la ciberseguridad. En las semanas previas al lanzamiento, Fable habría sido sometido a miles de horas de red-teaming, realizadas con el gobierno estadounidense, el AISI británico, varias organizaciones externas y equipos internos. Estas pruebas habrían mostrado protecciones «claramente más eficaces que las de cualquier modelo desplegado hasta la fecha».

Sobre todo, Anthropic sostiene que «ningún evaluador ha encontrado hasta ahora un jailbreak universal» —una elusión capaz de desactivar ampliamente las salvaguardas—. No obstante, la empresa reconoce que ninguna compañía probablemente pueda lograr una resistencia perfecta en la actualidad, y que los jailbreaks universales acabarán apareciendo con toda probabilidad, un punto que asegura haber dejado claro desde la salida de Fable 5.

Una estrategia de «defense in depth»

Ante la imposibilidad de una resistencia perfecta, Anthropic defiende un enfoque en profundidad: hacer que las elusiones sean o bien estrechas (jailbreaks no universales), o bien muy costosas de producir (jailbreaks universales), y combinarlo con una supervisión exhaustiva para detectar y detener rápidamente cualquier ataque exitoso. Esta es también, explica la empresa, la razón por la que impone una retención de datos de clientes de 30 días con Fable, una medida que tiene un coste real para los clientes, pero que le permite estudiar y corregir los jailbreaks. Anthropic considera que esta estrategia sitúa los riesgos que plantea Fable en un nivel comparable al de los modelos ya desplegados en la industria.

Anthropic cumple, pero discrepa

Al mismo tiempo que aplica la directiva y retira el acceso a los dos modelos, Anthropic expresa su desacuerdo: el hallazgo de «un jailbreak potencial y limitado» no debería, a su juicio, justificar la retirada de un modelo comercial «desplegado para cientos de millones de personas». Aplicado a todo el sector, un estándar así «equivaldría, en la práctica, a congelar cualquier nuevo despliegue de modelos» para todos los laboratorios de vanguardia.

La empresa recuerda que apoya públicamente la capacidad de un gobierno para bloquear despliegues considerados peligrosos, pero dentro de un proceso legal «transparente, justo, claro y basado en hechos técnicos», principios que, según considera, esta acción no cumple. Anthropic presenta sus disculpas por la interrupción causada a sus clientes, dice creer que se trata de un «malentendido» y que está trabajando para restablecer el acceso lo antes posible.

Un precedente geopolítico, no solo regulatorio

Más allá del caso concreto de Fable 5 y Mythos 5, el episodio marca una inflexión más profunda: Estados Unidos ya no controla solo los chips, la capacidad de cómputo o los pesos de los modelos. Ahora reivindica la posibilidad de interrumpir el acceso operativo a un modelo ya comercializado, en nombre de la seguridad nacional.

Es un desplazamiento importante. Hasta ahora, el debate sobre la soberanía de la IA se centraba sobre todo en la fase previa: las GPU, los centros de datos, los conjuntos de datos, los modelos abiertos o cerrados. Aquí, el control se ejerce sobre el uso mismo. La cuestión ya no es solo quién puede entrenar un modelo de frontera, sino quién tiene derecho a interrogarlo, en qué condiciones y con qué nacionalidad.

La orden dirigida a los ciudadanos extranjeros, incluso cuando se encuentran en territorio estadounidense o trabajan para Anthropic, introduce una nueva fractura en la economía mundial de la IA. Convierte la nacionalidad del usuario, del investigador, del empleado o del cliente en un parámetro de acceso a una infraestructura cognitiva. Para las empresas, esto abre un riesgo difícil de contractualizar: un servicio legalmente suscrito, técnicamente disponible y comercialmente desplegado puede volverse inaccesible de un día para otro por motivos administrativos ajenos a la relación cliente-proveedor.

Para los aliados de Estados Unidos, la señal es especialmente sensible. Europa, Canadá, Japón, Corea del Sur o Australia no son necesariamente los objetivos políticos de una medida de este tipo. Pero sí sufren su lógica: en un régimen de seguridad nacional, el acceso a los modelos estadounidenses más avanzados puede suspenderse sin distinguir con precisión entre socios, competidores y adversarios. La soberanía en IA deja entonces de ser un eslogan defensivo; pasa a ser una cuestión de continuidad operativa.

Este precedente también ofrece un argumento a las potencias que cuestionan la hegemonía tecnológica estadounidense. Pekín podrá verlo como la confirmación de que los modelos de frontera estadounidenses no son simples productos en la nube, sino capacidades estratégicas revocables. Cuanto más utilice Washington el control de acceso como instrumento de poder, más incentivará a sus rivales a acelerar sus propias pilas soberanas, cerradas o regionales.

La dificultad reside en la propia naturaleza del riesgo invocado. Una capacidad cibernética avanzada es intrínsecamente de doble uso: el mismo modelo puede ayudar a un defensor a identificar una vulnerabilidad o a un atacante a explotarla. Si el simple hecho de poder leer una base de código y sugerir correcciones se convierte en motivo suficiente para retirar un modelo del mercado, entonces el umbral de bloqueo corre el riesgo de abarcar rápidamente a todos los modelos punteros. A la inversa, si los Estados esperan una prueba demasiado alta, actuarán demasiado tarde. Ese punto intermedio sigue sin contar hoy con una doctrina pública clara.

El caso Fable 5 no es, por tanto, solo una prueba para Anthropic. Anticipa el régimen político de los modelos de frontera: productos comercializados a escala global, pero sometidos a un derecho soberano de retirada; infraestructuras privadas, pero tratadas como activos estratégicos; herramientas de software, pero gobernadas por lógicas cercanas al control de exportaciones y a la seguridad nacional.

El criterio que se adopte en las próximas semanas será decisivo. Si un jailbreak estrecho, no universal y comparable a capacidades ya disponibles en otros lugares basta para justificar un corte global, los lanzamientos de modelos frontier entrarán en una nueva era: la de despliegues condicionales, revocables y filtrados geopolíticamente. Si, por el contrario, el episodio se resuelve como un exceso de prudencia o un malentendido administrativo, no habrá dejado de revelar algo: el acceso a los modelos más avanzados ya no es solo una cuestión de mercado. Es, ahora, un atributo de poder.

Stephane Nachez

Redacción de ActuIA — noticias, datos y análisis sobre inteligencia artificial para los responsables de decisiones.