Claude Opus 4.8: Anthropic kładzie nacisk na bardziej uczciwy model w obliczu własnych błędów

Claude Opus 4.8: Anthropic kładzie nacisk na bardziej uczciwy model w obliczu własnych błędów

W skrócie : Claude Opus 4.8 wprowadza ulepszenia w wykrywaniu błędów i nowe funkcje integracji z systemami agentowymi. Model jest dostępny natychmiast z nowymi opcjami cenowymi. Metryka metakognicji staje się centralnym kryterium oceny modeli.

Ulepszenie, które Anthropic podkreśla dla Claude Opus 4.8, opublikowanego 28 maja 2026 roku, polega na jednej metryce: model, według wydawcy, jest cztery razy mniej skłonny niż jego poprzednik do przepuszczania błędów w kodzie, który wygenerował, bez ich sygnalizowania. Liczba ta jest auto-deklaratywna, stworzona przez wewnętrzny zespół Alignment i oparta na nieujawnionym protokole. Model jest dostępny natychmiast poprzez API pod identyfikatorem claude-opus-4-8 oraz na claude.ai, z standardową ceną dostosowaną do Opus 4.7 (5 dolarów za milion tokenów na wejściu, 25 dolarów za milion na wyjściu). 'Fast mode' Opus 4.8, który działa 2,5 razy szybciej niż tryb standardowy, jest wyceniony na 10 dolarów za milion tokenów na wejściu i 50 dolarów na wyjściu, co, według oficjalnego komunikatu, jest trzy razy tańsze niż szybki tryb poprzednich modeli Opus.

Claude Opus 4.8 - ceny API przy wprowadzeniu (28 maja 2026)

TrybWejście ($/M tokenów)Wyjście ($/M tokenów)Uwagi
Standardowy5 $25 $Bez zmian w stosunku do Opus 4.7
Fast mode (2,5×)10 $50 $3× tańsze niż poprzedni szybki tryb

Źródło: oficjalne ogłoszenie Anthropic, anthropic.com/news/claude-opus-4-8

Trzy operacyjne dźwignie towarzyszą premierze

Poza modelem, trzy funkcjonalności zmieniają sposób, w jaki Opus 4.8 integruje się w agentowym stanowisku pracy (zaprojektowanym do autonomicznego zarządzania zadaniami wieloetapowymi). Pierwsza, nazwana 'dynamic workflows' i wdrożona w dostępie wczesnym dla deweloperów (research preview), rozszerza Claude Code na bardzo duże projekty: agent planuje pracę, uruchamia kilkaset pod-agentów równocześnie w jednej sesji, a następnie sprawdza swoje wyjścia przed zwróceniem wyniku. Anthropic podaje jako przypadek użycia migrację bazy kodu o wielkości kilkuset tysięcy linii, od uruchomienia do scalania, z istniejącym zestawem testów jako referencją. Funkcjonalność ta jest zarezerwowana dla planów Enterprise, Team i Max Claude Code. Druga, kontrola wysiłku ('effort control'), dodaje do selektora modelu na claude.ai suwak z czterema poziomami: 'low', 'default', 'extra' i 'max', dostępny dla wszystkich planów subskrypcyjnych. Anthropic zaleca ustawienie 'extra' dla ciężkich zadań i asynchronicznych przepływów o długim czasie trwania. Trzecia, po stronie Messages API, pozwala teraz na wstawianie systemowych wejść wewnątrz tabeli messages w trakcie zadania, bez przerywania pamięci podręcznej prompta ani przechodzenia przez turę użytkownika, co otwiera możliwość aktualizacji na żywo uprawnień, budżetów tokenów lub kontekstu środowiska dla agenta w trakcie wykonywania.

Metryka metakognicji ustanowiona jako przemysłowy kamień milowy

Czterokrotny wskaźnik dotyczący niesygnalizowanych błędów jest najbardziej strukturalnym elementem ogłoszenia i najtrudniejszym do obsługi dla kupującego. Metryka jest udokumentowana w karcie bezpieczeństwa modelu (System Card) opublikowanej tego samego dnia, ale została stworzona przez zespół Alignment Anthropic, a nie przez zewnętrznego ewaluatora, a protokół nie jest odtwarzalny poza środowiskiem wydawcy. Według tego samego zespołu, Opus 4.8 prezentuje wskaźniki zachowań niezgodnych, takich jak oszustwo czy współpraca z nadużyciami, znacznie niższe niż Opus 4.7 i zbliżone do jego najlepiej dostosowanego modelu, Claude Mythos Preview. To, co metryka dokumentuje, to mniej fakt - czterokrotny wskaźnik auto-deklaratywny na nieujawnionym protokole wiąże się z niewielkim zobowiązaniem - a bardziej przesunięcie osi oceny: Anthropic proponuje teraz metakognicję modelu (wiedzę o tym, czego nie wie, sygnalizowanie swoich niepewności co do własnych produkcji) jako centralne kryterium kwalifikacji modelu agentowego. To właśnie ten element brakuje, by pójść dalej: wydawca nie publikuje ani formuły liczenia niesygnalizowanych błędów, ani protokołu generowania testowanego korpusu kodu, ani warunków zakłóceń. Niezależne prace opublikowane na blogu badawczym Aithos AI Research Foundation 9 lutego 2026 wykazały, odtwarzając scenariusze oceny Anthropic, że 'opublikowane scenariusze testów pokazują niemal idealne dopasowanie dla nowszych modeli Claude, ale zakłócenia ujawniają trwałe luki w zgodności' (tłumaczenie wolne z 'Published testing scenarios show near-perfect alignment for newer Claude models, but perturbations reveal persistent compliance gaps'). Obserwacja dotyczyła Opus 4.6; rysuje ona scenariusz, przeciwko któremu metryka 4× nie jest sama w sobie uzbrojona.

'Opublikowane scenariusze testów pokazują niemal idealne dopasowanie dla nowszych modeli Claude, ale zakłócenia ujawniają trwałe luki w zgodności.'

Aithos AI Research Foundation - Daan Henselmans, Arno Libert, Lennard Zwart (luty 2026, tłumaczenie z angielskiego). Badanie dotyczące Opus 4.6; autorzy jeszcze nie ocenili Opus 4.8.

Kamień milowy przed przełomem Mythos

Opus 4.8 wpisuje się w szybki rytm iteracji rodziny Claude: ActuIA już dokumentowała wprowadzenie Claude Opus 4 w maju 2025 jako generację skupioną na kodowaniu i automatyzacji przez agentów, trajektoria kontynuowana następnie przez Claude Sonnet 4.5 w kontekście programowania. Wydawca sam przedstawia to jako 'skromne, ale namacalne ulepszenie' w stosunku do Opus 4.7, przed zapowiedzianym wprowadzeniem wyższej klasy. Ta klasa to Claude Mythos Preview, już wdrożona w ograniczonym dostępie w ramach Project Glasswing (defensywna inicjatywa cyberbezpieczeństwa uruchomiona w kwietniu 2026). W ciągu miesiąca Anthropic i 'około 50 partnerów', w tym AWS, Apple, Cisco, Google, Microsoft i NVIDIA, deklarują, że z pomocą Mythos Preview zidentyfikowali ponad dziesięć tysięcy wysokich lub krytycznych luk w zabezpieczeniach w oprogramowaniu uznawanym za systemowo ważne. Publiczne wydanie Mythos jest zapowiedziane 'w najbliższych tygodniach', pod warunkiem wdrożenia wzmocnionych zabezpieczeń. Odczyt wydajności Opus 4.8 pozostaje na razie uzależniony od drugiego filtra: z dziesięciu opublikowanych przez Anthropic świadectw liczbowych, tylko jedno opiera się na publicznie dostępnym benchmarku akademickim, jest to Induced AI, który ogłasza 84% na Online-Mind2Web. Ten benchmark, utrzymywany przez OSU-NLP-Group z Ohio State University na licencji MIT, ma właśnie taki tytuł referencyjnego artykułu 'An Illusion of Progress? Assessing the Current State of Web Agents', co jest wyborem redakcyjnym autorów akademickich zapraszającym do rozważania triumfalnych wyników agentów sieciowych z umiarem. Inne zgłaszane wydajności (Super-Agent Benchmark Relevance AI, Legal Agent Benchmark Harvey, CursorBench Cursor) opierają się na niepublikowanych protokołach właścicielskich.