Claude Opus 4.8: Anthropic betont ein ehrlicheres Modell im Umgang mit eigenen Fehlern

Die Verbesserung, die von Anthropic für Claude Opus 4.8 hervorgehoben wird, veröffentlicht am 28. Mai 2026, basiert auf einer Metrik: Das Modell soll laut dem Herausgeber viermal weniger wahrscheinlich als sein Vorgänger Fehler im von ihm produzierten Code übersehen, ohne sie zu melden. Die Zahl ist selbstdeklariert, wurde vom internen Alignment-Team erstellt und basiert auf einem nicht veröffentlichten Protokoll. Das Modell ist sofort über die API unter der Kennung claude-opus-4-8 und auf claude.ai verfügbar, mit einer Standardtarifierung, die auf der von Opus 4.7 basiert (5 Dollar pro Million Tokens im Eingang, 25 Dollar pro Million im Ausgang). Der «Fast Mode» von Opus 4.8, der mit 2,5-facher Geschwindigkeit des Standardmodus läuft, kostet 10 Dollar pro Million Tokens im Eingang und 50 Dollar im Ausgang, also laut offizieller Mitteilung dreimal günstiger als der Fast Mode der vorherigen Opus-Modelle.

Claude Opus 4.8 - API-Preise zum Start (28. Mai 2026)

Modus	Eingang ($/M Tokens)	Ausgang ($/M Tokens)	Anmerkung
Standard	5 $	25 $	Unverändert gegenüber Opus 4.7
Fast Mode (2,5×)	10 $	50 $	3× günstiger als der vorherige Fast Mode

Quelle: Offizielle Ankündigung von Anthropic, anthropic.com/news/claude-opus-4-8

Drei operationelle Hebel begleiten die Einführung

Über das Modell hinaus ändern drei Funktionen die Art und Weise, wie sich Opus 4.8 in einen agentischen Arbeitsplatz integriert (konzipiert, um mehrstufige Aufgaben autonom zu orchestrieren). Die erste, «dynamic workflows» genannt und im Early Access für Entwickler (Research Preview) bereitgestellt, erweitert Claude Code auf sehr große Projekte: Der Agent plant die Arbeit, startet mehrere hundert Unteragenten parallel in derselben Sitzung und überprüft dann seine Ausgaben, bevor er das Ergebnis liefert. Anthropic nennt als Anwendungsfall die Migration einer Codebasis im Umfang von mehreren hunderttausend Zeilen, vom Start bis zur Fusion, mit der bestehenden Testreihe als Referenz. Die Funktion ist auf die Enterprise-, Team- und Max-Pläne von Claude Code beschränkt. Die zweite, die «effort control», fügt neben dem Modellauswahl-Tool auf claude.ai einen Vier-Stufen-Schieberegler hinzu: «low», «default», «extra» und «max», zugänglich für alle Abonnementmodelle. Anthropic empfiehlt die Einstellung «extra» für schwere Aufgaben und asynchrone Langzeitabläufe. Die dritte, auf der API-Seite, erlaubt nun das Einfügen von Systemeingaben innerhalb des messages-Arrays während einer Aufgabe, ohne den Prompt-Cache zu verletzen oder durch eine Benutzerrunde zu gehen, was ein Hot-Update der Berechtigungen, Token-Budgets oder des Umweltkontexts für einen laufenden Agenten ermöglicht.

Eine Metakognitionsmetrik als industrieller Meilenstein

Der beanspruchte Faktor vier bei nicht gemeldeten Fehlern ist der strukturellste Aspekt der Ankündigung und der schwierigste für einen Käufer zu handhaben. Die Metrik ist im Sicherheitsdatenblatt des Modells (System Card) dokumentiert, das am selben Tag veröffentlicht wurde, aber sie wurde vom Alignment-Team von Anthropic erstellt, nicht von einem Drittgutachter, und das Protokoll ist außerhalb der Umgebung des Herausgebers nicht wiederholbar. Laut demselben Team zeigt Opus 4.8 wesentlich geringere Raten von desalignierten Verhaltensweisen, wie Täuschung oder Beihilfe zu Missbrauch, als Opus 4.7 und ähnelt seinem am besten ausgerichteten Modell, Claude Mythos Preview. Was die Metrik feststellt, ist weniger die Tatsache - ein selbstdeklariertes Vierfachergebnis auf einem nicht veröffentlichten Protokoll ist wenig verbindlich - als die Verschiebung der Bewertungsachse: Anthropic bietet nun die Metakognition des Modells (Wissen, was es nicht kann, seine Unsicherheiten über seine eigenen Produktionen melden) als zentrales Kriterium zur Qualifizierung eines agentischen Modells an. Dieses Element fehlt, um weiter zu gehen: Der Herausgeber veröffentlicht weder die Formel zur Zählung der nicht gemeldeten Fehler, noch das Protokoll zur Generierung des getesteten Codekorpus, noch die Störungsbedingungen. Unabhängige Arbeiten, die am Forschungstagebuch der Aithos AI Research Foundation am 9. Februar 2026 veröffentlicht wurden, haben gezeigt, dass «veröffentlichte Testszenarien nahezu perfekte Übereinstimmung für neuere Claude-Modelle zeigen, aber Störungen anhaltende Konformitätslücken offenbaren» (freie Übersetzung von «Published testing scenarios show near-perfect alignment for newer Claude models, but perturbations reveal persistent compliance gaps»). Die Beobachtung bezog sich auf Opus 4.6; sie zeichnet das Szenario, gegen das die 4×-Metrik allein nicht gewappnet ist.

«Veröffentlichte Testszenarien zeigen nahezu perfekte Übereinstimmung für neuere Claude-Modelle, aber Störungen offenbaren anhaltende Konformitätslücken.»

Aithos AI Research Foundation - Daan Henselmans, Arno Libert, Lennard Zwart (Februar 2026, übersetzt aus dem Englischen). Studie über Opus 4.6; die Autoren haben Opus 4.8 noch nicht bewertet.

Ein Meilenstein vor dem Mythos-Durchbruch

Opus 4.8 reiht sich in eine schnelle Iterationsfolge der Claude-Familie ein: ActuIA dokumentierte bereits die Einführung von Claude Opus 4 im Mai 2025 als generationenfokussiert auf Codierung und Automatisierung durch Agenten, eine Entwicklung, die anschließend von Claude Sonnet 4.5 auf der Programmierachse fortgesetzt wurde. Der Herausgeber stellt es selbst als «einen bescheidenen, aber greifbaren Fortschritt» gegenüber Opus 4.7 dar, bevor die Ankunft einer höheren Klasse angekündigt wird. Diese Klasse ist Claude Mythos Preview, bereits im eingeschränkten Zugang im Rahmen von Project Glasswing (eine defensive Cybersicherheitsinitiative, gestartet im April 2026) bereitgestellt. Innerhalb eines Monats haben Anthropic und «etwa 50 Partner», darunter AWS, Apple, Cisco, Google, Microsoft und NVIDIA, erklärt, Mythos Preview zur Identifizierung von über zehntausend hoch- oder kritischen Schwachstellen in als systemisch wichtig erachteter Software genutzt zu haben. Der öffentliche Start von Mythos ist in «den kommenden Wochen» angekündigt, vorbehaltlich der Einführung verstärkter Schutzmaßnahmen. Die Bewertung der Leistungen von Opus 4.8 bleibt vorerst von einem zweiten Filter abhängig: Von den etwa zehn von Anthropic veröffentlichten zahlenmäßigen Zeugnissen stützt sich nur dasjenige von Induced AI auf ein öffentliches akademisches Benchmark und verkündet 84 % auf Online-Mind2Web. Dieses Benchmark, gepflegt von der OSU-NLP-Group der Ohio State University unter MIT-Lizenz, hat genau den Referenztitel «An Illusion of Progress? Assessing the Current State of Web Agents», eine redaktionelle Wahl der akademischen Autoren, die dazu einlädt, triumphale Punktzahlen zu Web-Agenten mit Maß zu betrachten. Die anderen beanspruchten Leistungen (Super-Agent Benchmark von Relevance AI, Legal Agent Benchmark von Harvey, CursorBench von Cursor) beruhen auf nicht veröffentlichten proprietären Protokollen.

Stephane Nachez

ActuIA-Redaktion — Nachrichten, Daten und Analysen zur künstlichen Intelligenz für Entscheidungsträger.

Claude Opus 4.8: Anthropic betont ein ehrlicheres Modell im Umgang mit eigenen Fehlern

Drei operationelle Hebel begleiten die Einführung

Eine Metakognitionsmetrik als industrieller Meilenstein

Ein Meilenstein vor dem Mythos-Durchbruch

Anthropic gezwungen, Fable 5 und Mythos 5 nach einer Anordnung der US-Regierung auszusetzen

Siri AI: Gemini als Lehrer, nicht als Motor – was die WWDC nicht gesagt hat

Dasselbe Modell, unterschiedliche Schutzmechanismen: Was der Start von Claude Fable 5 und Mythos 5 offenbart