Claude Opus 4.8 : Anthropic met l’accent sur un modèle plus honnête face à ses propres erreurs

L'amélioration mise en avant par Anthropic pour Claude Opus 4.8, publié le 28 mai 2026, tient en une métrique: le modèle serait, selon l'éditeur, quatre fois moins susceptible que son prédécesseur de laisser passer sans les signaler des défauts dans le code qu'il a produit. Le chiffre est auto-déclaré, produit par l'équipe Alignment maison et reposant sur un protocole non rendu public. Le modèle est disponible immédiatement via l'API sous l'identifiant claude-opus-4-8 et sur claude.ai, avec une tarification standard alignée sur celle d'Opus 4.7 (5 dollars par million de tokens en entrée, 25 dollars par million en sortie). Le «fast mode» d'Opus 4.8, qui tourne à 2,5 fois la vitesse du mode standard, est facturé 10 dollars par million de tokens en entrée et 50 dollars en sortie, soit, selon le communiqué officiel, trois fois moins cher que le fast mode des modèles Opus précédents.

Claude Opus 4.8 - tarifs API au lancement (28 mai 2026)

Mode	Entrée ($/M tokens)	Sortie ($/M tokens)	Note
Standard	5 $	25 $	Inchangé par rapport à Opus 4.7
Fast mode (2,5×)	10 $	50 $	3× moins cher que le fast mode précédent

Source : annonce officielle Anthropic, anthropic.com/news/claude-opus-4-8

Trois leviers opérationnels accompagnent la sortie

Au-delà du modèle, trois fonctionnalités modifient la façon dont Opus 4.8 s'intègre dans un poste de travail agentique (conçu pour orchestrer des tâches multi-étapes en autonomie). La première, baptisée «dynamic workflows» et déployée en accès anticipé développeurs (research preview), étend Claude Code à des chantiers de très grande taille: l'agent planifie le travail, lance plusieurs centaines de sous-agents en parallèle dans une même session, puis vérifie ses sorties avant de rendre le résultat. Anthropic cite comme cas d'usage la migration d'une base de code à l'échelle de plusieurs centaines de milliers de lignes, du lancement à la fusion, avec la suite de tests existante comme référence. La fonctionnalité est réservée aux plans Enterprise, Team et Max de Claude Code. La deuxième, le contrôle d'effort («effort control»), ajoute aux côtés du sélecteur de modèle sur claude.ai un curseur à quatre niveaux: «low», «default», «extra» et «max», accessible à toutes les formules d'abonnement. Anthropic recommande le réglage «extra» pour les tâches lourdes et les flux asynchrones de longue durée. La troisième, côté Messages API, autorise désormais l'insertion d'entrées système à l'intérieur du tableau messages en cours de tâche, sans rompre le cache du prompt ni passer par un tour utilisateur, ce qui ouvre la mise à jour à chaud des permissions, des budgets de tokens ou du contexte d'environnement pour un agent en cours d'exécution.

Une métrique de métacognition érigée en jalon industriel

Le facteur quatre revendiqué sur les défauts non signalés est l'élément le plus structurant de l'annonce, et le plus délicat à manier pour un acheteur. La métrique est documentée dans la fiche de sécurité du modèle (System Card) publiée le même jour, mais elle a été produite par l'équipe Alignment d'Anthropic, pas par un évaluateur tiers, et le protocole n'est pas rejouable en l'état hors de l'environnement de l'éditeur. Selon cette même équipe, Opus 4.8 présenterait des taux de comportements désalignés, comme la tromperie ou la coopération à des abus, substantiellement inférieurs à ceux d'Opus 4.7 et proches de ceux de son modèle le mieux aligné, Claude Mythos Preview. Ce que la métrique acte est moins le fait - un facteur quatre auto-déclaré sur un protocole non publié engage faiblement - que le déplacement de l'axe d'évaluation: Anthropic propose désormais la métacognition du modèle (savoir ce qu'il ne sait pas faire, signaler ses incertitudes sur ses propres productions) comme critère central pour qualifier un modèle agentique. C'est cette pièce-là qui fait défaut pour aller plus loin: l'éditeur ne publie ni la formule de comptage des défauts non signalés, ni le protocole de génération du corpus de code testé, ni les conditions de perturbation. Or des travaux indépendants publiés sur le carnet de recherche de l'Aithos AI Research Foundation le 9 février 2026 ont montré, en répliquant des scénarios d'évaluation d'Anthropic, que des «scénarios de test publiés montrent un alignement quasi parfait pour les modèles Claude récents, mais que des perturbations révèlent des lacunes de conformité persistantes» (traduction libre de «Published testing scenarios show near-perfect alignment for newer Claude models, but perturbations reveal persistent compliance gaps»). L'observation visait Opus 4.6; elle dessine le scénario contre lequel la métrique 4× n'est, à elle seule, pas armée.

« Les scénarios de test publiés montrent un alignement quasi parfait pour les modèles Claude récents, mais des perturbations révèlent des lacunes de conformité persistantes. »

Aithos AI Research Foundation - Daan Henselmans, Arno Libert, Lennard Zwart (février 2026, traduit de l'anglais). Étude portant sur Opus 4.6 ; les auteurs n'ont pas encore évalué Opus 4.8.

Un jalon de gamme avant la rupture Mythos

Opus 4.8 s'inscrit dans une cadence d'itérations rapides de la famille Claude: ActuIA documentait déjà le lancement de Claude Opus 4 en mai 2025 comme génération centrée sur le codage et l'automatisation par agents, trajectoire poursuivie ensuite par Claude Sonnet 4.5 sur l'axe programmation. L'éditeur le présente d'ailleurs lui-même comme «une amélioration modeste mais tangible» sur Opus 4.7, avant l'arrivée annoncée d'une classe supérieure. Cette classe, c'est Claude Mythos Preview, déjà déployé en accès restreint dans le cadre de Project Glasswing (initiative de cybersécurité défensive lancée en avril 2026). En un mois, Anthropic et «approximativement 50 partenaires», parmi lesquels AWS, Apple, Cisco, Google, Microsoft et NVIDIA, déclarent avoir identifié à l'aide de Mythos Preview plus de dix mille vulnérabilités de sévérité haute ou critique sur des logiciels jugés systémiquement importants. La sortie grand public de Mythos est annoncée «dans les prochaines semaines», sous réserve du déploiement de garde-fous renforcés. La lecture des performances d'Opus 4.8 reste pour l'heure tributaire d'un second filtre: sur la dizaine de témoignages chiffrés publiés par Anthropic, le seul à s'appuyer sur un benchmark académique public est celui d'Induced AI, qui annonce 84 % sur Online-Mind2Web. Ce benchmark, maintenu par l'OSU-NLP-Group de l'Ohio State University sous licence MIT, a précisément pour titre de papier de référence «An Illusion of Progress? Assessing the Current State of Web Agents», choix éditorial des auteurs académiques qui invite à manier les scores triomphants sur les agents web avec mesure. Les autres performances revendiquées (Super-Agent Benchmark de Relevance AI, Legal Agent Benchmark de Harvey, CursorBench de Cursor) reposent sur des protocoles propriétaires non publiés.

Stephane Nachez

Rédaction ActuIA — actualités, données et analyses sur l'intelligence artificielle pour les décideurs.

Claude Opus 4.8 : Anthropic met l’accent sur un modèle plus honnête face à ses propres erreurs

Trois leviers opérationnels accompagnent la sortie

Une métrique de métacognition érigée en jalon industriel

Un jalon de gamme avant la rupture Mythos

Anthropic dévoile Claude 4, ses agents optimisés pour la programmation et les tâches complexes

Anthropic dévoile Claude Sonnet 4.5, toujours meilleur en programmation

Cybersécurité : Anthropic ouvre Claude Mythos à l'ENISA