Su fuente de información de referencia sobre la inteligencia artificial

Nuevo modelo

Mismo modelo, diferentes salvaguardas: lo que revela el lanzamiento de Claude Fable 5 y Mythos 5

STStephane Nachez · ·5 min
Mismo modelo, diferentes salvaguardas: lo que revela el lanzamiento de Claude Fable 5 y Mythos 5
Índice

Anthropic lanzó el 9 de junio de 2026 Claude Fable 5 y Claude Mythos 5, dos productos que, según Anthropic, se basan en el mismo modelo subyacente y solo se diferencian por sus salvaguardas: Fable 5 para uso general con clasificadores de seguridad activos, y Mythos 5 reservado a un círculo restringido de defensores cibernéticos a través de Project Glasswing, con esas mismas salvaguardas levantadas en ciertos ámbitos. La capa de confinamiento, que Anthropic describe en su post de ingeniería de Anthropic como una capa de configuración aplicada en el momento de la inferencia («configuration overlay applied at inference time», traducción libre), distinta de los pesos, se convierte así en la frontera comercial entre ambas ofertas.

La novedad, por tanto, no es solo el lanzamiento de un modelo más potente. Reside en la separación explícita entre los pesos del modelo, la configuración aplicada en la inferencia y el régimen de acceso. Fable 5 y Mythos 5 pasan a ser dos productos distintos no porque necesariamente representen dos modelos entrenados por separado, sino porque no exponen el mismo espacio de uso. Esta distinción es estratégica: permite a Anthropic poner a disposición capacidades de tipo “Mythos-class” al tiempo que reserva ciertos usos a actores verificados, especialmente en el marco de Project Glasswing.


Según el anuncio de Anthropic, Fable 5 se factura a 10 $/M tokens de entrada y 50 $/M de salida a través de la API de Anthropic; según LLMReference (actualizado al 9 de junio de 2026), el precio de Mythos Preview era de 25 $/M tokens de entrada.

Un recorte tarifario que se inscribe en una compresión sectorial de los precios de inferencia

DeepSeek lleva más de un año aplicando una estructura de precios sensiblemente inferior a la de los modelos frontera estadounidenses, mientras que GPT-5 de OpenAI muestra 1,25 $/M en entrada y 10 $/M en salida, es decir, respectivamente 8 y 5 veces más barato que Fable 5 en los precios base. El precio de Mythos Preview era de 25 $/M en entrada según LLMReference, es decir, 2,5 veces el precio de entrada de Fable 5. La explicación basada en la configuración de salvaguardas —Anthropic factura el trabajo de confinamiento y no los pesos— coexiste, por tanto, con una explicación competitiva; el anuncio del 9 de junio no resuelve entre ambas y la formulación oficial guarda silencio sobre la descomposición.

Rendimiento en condiciones reales documentado, pero resultados sensibles dejados fuera de la revisión

En el benchmark FrontierCode publicado por Cognition AI el 8 de junio de 2026, Fable 5 se situó a la cabeza de la clasificación según Cognition AI, sin que la puntuación exacta figure en el comunicado de lanzamiento; según Cognition AI, Claude Opus 4.8 lideraba FrontierCode con un pico del 13,5 % antes de la llegada de Fable 5, y más del 50 % de las salidas de SWE-bench seguían sin ser mergeables. Cognition desarrolla Devin y opera, por tanto, en el segmento de los agentes de codificación en el que Anthropic se posiciona, algo que el comunicado de lanzamiento no menciona. En cuanto a los testimonios de clientes, Stripe informó durante las pruebas tempranas de que una migración sobre una base de código Ruby de 50 millones de líneas fue ejecutada por Fable 5 en un día, frente a más de dos meses estimados para un equipo completo. En el terreno sensible, Anthropic indica que 9 de los 14 objetivos proteicos de un estudio interno de diseño de fármacos produjeron candidatos sólidos, pero estos resultados no han sido revisados por pares. El fabricante precisa además que la evaluación automatizada de alineamiento sitúa a Mythos 5 en un nivel de comportamientos desalineados similar al de Opus 4.8, es decir, bajo pero no nulo.

Glasswing, clasificadores y calendario del AI Act: lo que el comprador europeo lee en el anuncio

El resultado más citado por Anthropic para respaldar la clase Mythos precede al lanzamiento de Mythos 5: según el anuncio de expansión de Glasswing del 2 de junio de 2026, los 50 socios iniciales —entre ellos AWS, Apple, Cisco, CrowdStrike, Google, Microsoft, NVIDIA, JPMorganChase o la Linux Foundation— habían identificado más de 10.000 fallos de seguridad de alta o crítica gravedad al escanear sus bases de código mediante Mythos Preview. Por tanto, estos fallos se atribuyen al acceso Preview abierto desde abril de 2026, no a Mythos 5, cuyo despliegue en Glasswing apenas comienza. En cuanto a Fable 5, Anthropic indica que los clasificadores de seguridad se activan de media en menos del 5 % de las sesiones y redirigen entonces la solicitud a Opus 4.8; el fabricante reconoce un ajuste deliberadamente conservador capaz de interceptar solicitudes inocuas. Para un comprador europeo, el calendario regulatorio viene a suavizar la presión de integración: según el acuerdo político provisional alcanzado el 7 de mayo de 2026 sobre el Omnibus del AI Act, las obligaciones de alto riesgo del Anexo III se aplazan hasta el 2 de diciembre de 2027. La configuración de salvaguardas, tal como la factura Anthropic, se convierte en un objeto vendido de forma independiente del modelo; la tasa de falsos positivos de los clasificadores —actualmente señalada como inferior al 5 % de las sesiones, medida únicamente por Anthropic— no se publica por nivel de criticidad de la solicitud interceptada.

ST
Stephane Nachez
subscriber

Redacción de ActuIA — noticias, datos y análisis sobre inteligencia artificial para los responsables de decisiones.