Claude Opus 4.8: Anthropic enfatiza un modelo más honesto frente a sus propios errores

La mejora destacada por Anthropic para Claude Opus 4.8, publicado el 28 de mayo de 2026, se centra en una métrica: el modelo sería, según el editor, cuatro veces menos propenso que su predecesor a dejar pasar sin señalar defectos en el código que ha producido. La cifra es auto-declarada, producida por el equipo Alignment interno y basada en un protocolo no hecho público. El modelo está disponible inmediatamente a través de la API bajo el identificador claude-opus-4-8 y en claude.ai, con una tarifa estándar alineada con la de Opus 4.7 (5 dólares por millón de tokens de entrada, 25 dólares por millón de salida). El 'modo rápido' de Opus 4.8, que funciona a 2,5 veces la velocidad del modo estándar, se cobra a 10 dólares por millón de tokens de entrada y 50 dólares de salida, es decir, según el comunicado oficial, tres veces más barato que el modo rápido de los modelos Opus anteriores.

Claude Opus 4.8 - tarifas API en el lanzamiento (28 de mayo de 2026)

Modo	Entrada ($/M tokens)	Salida ($/M tokens)	Nota
Estándar	5 $	25 $	Sin cambios respecto a Opus 4.7
Modo rápido (2,5×)	10 $	50 $	3× más barato que el modo rápido anterior

Fuente: anuncio oficial Anthropic, anthropic.com/news/claude-opus-4-8

Tres palancas operativas acompañan el lanzamiento

Además del modelo, tres funcionalidades modifican la forma en que Opus 4.8 se integra en un entorno de trabajo agente (diseñado para orquestar tareas de múltiples etapas de manera autónoma). La primera, llamada 'dynamic workflows' y desplegada en acceso anticipado para desarrolladores (research preview), extiende Claude Code a proyectos de gran envergadura: el agente planifica el trabajo, lanza varios cientos de subagentes en paralelo en una misma sesión, y luego verifica sus salidas antes de entregar el resultado. Anthropic cita como caso de uso la migración de una base de código a la escala de varios cientos de miles de líneas, desde el lanzamiento hasta la fusión, con la suite de pruebas existente como referencia. La funcionalidad está reservada para los planes Enterprise, Team y Max de Claude Code. La segunda, el control de esfuerzo ('effort control'), añade junto al selector de modelo en claude.ai un cursor de cuatro niveles: 'low', 'default', 'extra' y 'max', accesible para todas las fórmulas de suscripción. Anthropic recomienda el ajuste 'extra' para tareas pesadas y flujos asincrónicos de larga duración. La tercera, en el lado de Mensajes API, permite ahora la inserción de entradas del sistema dentro de la tabla messages en curso de tarea, sin romper la caché del prompt ni pasar por una ronda de usuario, lo que permite la actualización en caliente de permisos, presupuestos de tokens o contexto ambiental para un agente en ejecución.

Una métrica de metacognición erigida como hito industrial

El factor cuatro reivindicado sobre los defectos no señalados es el elemento más estructurante del anuncio, y el más delicado de manejar para un comprador. La métrica está documentada en la ficha de seguridad del modelo (System Card) publicada el mismo día, pero fue producida por el equipo Alignment de Anthropic, no por un evaluador externo, y el protocolo no es reproducible fuera del entorno del editor. Según este mismo equipo, Opus 4.8 presentaría tasas de comportamientos desalineados, como engaño o cooperación con abusos, sustancialmente inferiores a los de Opus 4.7 y cercanos a los de su modelo mejor alineado, Claude Mythos Preview. Lo que la métrica actúa es menos el hecho - un factor cuatro auto-declarado sobre un protocolo no publicado compromete poco - que el desplazamiento del eje de evaluación: Anthropic propone ahora la metacognición del modelo (saber lo que no sabe hacer, señalar sus incertidumbres sobre sus propias producciones) como criterio central para calificar un modelo agente. Es esta pieza la que falta para avanzar: el editor no publica ni la fórmula de conteo de defectos no señalados, ni el protocolo de generación del corpus de código probado, ni las condiciones de perturbación. Sin embargo, trabajos independientes publicados en el cuaderno de investigación de la Aithos AI Research Foundation el 9 de febrero de 2026 han mostrado, replicando escenarios de evaluación de Anthropic, que 'los escenarios de prueba publicados muestran un alineamiento casi perfecto para los modelos Claude recientes, pero las perturbaciones revelan brechas de conformidad persistentes' (traducción libre de 'Published testing scenarios show near-perfect alignment for newer Claude models, but perturbations reveal persistent compliance gaps'). La observación se refería a Opus 4.6; dibuja el escenario contra el cual la métrica 4× no está, por sí sola, armada.

'Los escenarios de prueba publicados muestran un alineamiento casi perfecto para los modelos Claude recientes, pero las perturbaciones revelan brechas de conformidad persistentes.'
Aithos AI Research Foundation - Daan Henselmans, Arno Libert, Lennard Zwart (febrero 2026, traducido del inglés). Estudio sobre Opus 4.6; los autores aún no han evaluado Opus 4.8.

Un hito de gama antes de la ruptura Mythos

Opus 4.8 se inscribe en un ritmo de iteraciones rápidas de la familia Claude: ActuIA ya documentaba el lanzamiento de Claude Opus 4 en mayo de 2025 como generación centrada en la codificación y la automatización por agentes, trayectoria seguida posteriormente por Claude Sonnet 4.5 en el eje programación. El editor lo presenta además como 'una mejora modesta pero tangible' sobre Opus 4.7, antes de la llegada anunciada de una clase superior. Esta clase es Claude Mythos Preview, ya desplegada en acceso restringido en el marco de Project Glasswing (iniciativa de ciberseguridad defensiva lanzada en abril de 2026). En un mes, Anthropic y 'aproximadamente 50 socios', entre los que se encuentran AWS, Apple, Cisco, Google, Microsoft y NVIDIA, declaran haber identificado con la ayuda de Mythos Preview más de diez mil vulnerabilidades de alta o crítica severidad en software considerado sistémicamente importante. La salida al público de Mythos se anuncia 'en las próximas semanas', sujeta al despliegue de salvaguardias reforzadas. La lectura de las prestaciones de Opus 4.8 sigue dependiendo por ahora de un segundo filtro: de la decena de testimonios cifrados publicados por Anthropic, el único basado en un benchmark académico público es el de Induced AI, que anuncia un 84 % en Online-Mind2Web. Este benchmark, mantenido por el OSU-NLP-Group de la Universidad Estatal de Ohio bajo licencia MIT, tiene precisamente como título de artículo de referencia 'An Illusion of Progress? Assessing the Current State of Web Agents', una elección editorial de los autores académicos que invita a manejar los puntajes triunfantes sobre los agentes web con mesura. Las otras prestaciones reivindicadas (Super-Agent Benchmark de Relevance AI, Legal Agent Benchmark de Harvey, CursorBench de Cursor) se basan en protocolos propietarios no publicados.

Stephane Nachez

Redacción de ActuIA — noticias, datos y análisis sobre inteligencia artificial para los responsables de decisiones.

Claude Opus 4.8: Anthropic enfatiza un modelo más honesto frente a sus propios errores

Tres palancas operativas acompañan el lanzamiento

Una métrica de metacognición erigida como hito industrial

Un hito de gama antes de la ruptura Mythos

Por qué el rumor de una nube de Meta hace caer a los neoclouds

Anthropic se ve obligada a suspender Fable 5 y Mythos 5 tras una directiva del gobierno estadounidense

Siri AI: Gemini como profesor, no como motor — lo que la WWDC no dijo