Claude Opus 4.8: Anthropic pune accentul pe un model mai onest față de propriile sale greșeli

Claude Opus 4.8: Anthropic pune accentul pe un model mai onest față de propriile sale greșeli

În scurt : Anthropic a lansat Claude Opus 4.8, un model AI îmbunătățit de patru ori în detectarea erorilor, disponibil imediat prin API. Îmbunătățirile includ noi funcționalități operaționale și o metrică de metacogniție, deși evaluarea independentă este limitată. Tarifarea rămâne competitivă, iar lansarea Mythos Preview este anticipată în curând.

Îmbunătățirea evidențiată de Anthropic pentru Claude Opus 4.8, publicată pe 28 mai 2026, constă într-o metrică: modelul ar fi, conform editorului, de patru ori mai puțin probabil să lase să treacă fără a semnala defecte în codul pe care l-a produs, comparativ cu predecesorul său. Cifra este auto-declarată, produsă de echipa internă Alignment și bazată pe un protocol care nu a fost făcut public. Modelul este disponibil imediat prin API sub identificatorul claude-opus-4-8 și pe claude.ai, cu o tarifare standard aliniată cu cea a Opus 4.7 (5 dolari pe milion de tokens la intrare, 25 de dolari pe milion la ieșire). Modul „fast” al Opus 4.8, care rulează de 2,5 ori mai rapid decât modul standard, este tarifat la 10 dolari pe milion de tokens la intrare și 50 de dolari la ieșire, adică, conform comunicatului oficial, de trei ori mai ieftin decât modul „fast” al modelelor anterioare Opus.

Claude Opus 4.8 - tarife API la lansare (28 mai 2026)

ModIntrare ($/M tokens)Ieșire ($/M tokens)Notă
Standard5 $25 $Neschimbat față de Opus 4.7
Fast mode (2,5×)10 $50 $3× mai ieftin decât modul „fast” anterior

Sursa: anunț oficial Anthropic, anthropic.com/news/claude-opus-4-8

Trei pârghii operaționale însoțesc lansarea

Dincolo de model, trei funcționalități modifică modul în care Opus 4.8 se integrează într-un post de lucru agentic (conceput pentru a orchestra sarcini multi-etape în mod autonom). Prima, numită „dynamic workflows” și implementată în acces anticipat pentru dezvoltatori (research preview), extinde Claude Code la proiecte de foarte mare anvergură: agentul planifică munca, lansează câteva sute de sub-agenti în paralel într-o singură sesiune, apoi verifică ieșirile înainte de a livra rezultatul. Anthropic citează ca utilizare migrarea unei baze de cod de la lansare până la fuziune, cu suita de teste existentă ca referință. Funcționalitatea este rezervată planurilor Enterprise, Team și Max de Claude Code. A doua, controlul efortului („effort control”), adaugă lângă selectorul de model de pe claude.ai un cursor cu patru nivele: „low”, „default”, „extra” și „max”, accesibil tuturor abonamentelor. Anthropic recomandă setarea „extra” pentru sarcini grele și fluxuri asincrone de lungă durată. A treia, pe partea de Mesaje API, permite acum inserarea de intrări de sistem în cadrul tabloului messages în timpul unei sarcini, fără a rupe cache-ul promptului sau a trece printr-un tur utilizator, ceea ce deschide actualizarea în timp real a permisiunilor, bugetelor de tokens sau contextului de mediu pentru un agent aflat în execuție.

O metrică de metacogniție ridicată la rang de reper industrial

Factorul patru revendicat pentru defectele neanunțate este cel mai structurant element al anunțului și cel mai dificil de gestionat pentru un cumpărător. Metrica este documentată în fișa de siguranță a modelului (System Card) publicată în aceeași zi, dar a fost produsă de echipa Alignment a lui Anthropic, nu de un evaluator terț, iar protocolul nu este reprodusibil în afara mediului editorului. Conform aceleiași echipe, Opus 4.8 ar prezenta rate de comportamente nealiniate, cum ar fi înșelăciunea sau cooperarea la abuzuri, substanțial mai mici decât cele ale Opus 4.7 și apropiate de cele ale modelului său cel mai bine aliniat, Claude Mythos Preview. Ceea ce metrica înregistrează este mai puțin faptul – un factor patru auto-declarat pe un protocol nepublicat angajează puțin – cât deplasarea axei de evaluare: Anthropic propune acum metacogniția modelului (să știe ce nu poate face, să semnaleze incertitudinile asupra propriilor producții) ca criteriu central pentru a califica un model agentic. Aceasta este piesa care lipsește pentru a merge mai departe: editorul nu publică nici formula de numărare a defectelor neanunțate, nici protocolul de generare a corpusului de cod testat, nici condițiile de perturbare. Lucrări independente publicate pe jurnalul de cercetare al Aithos AI Research Foundation pe 9 februarie 2026 au arătat, replicând scenarii de evaluare ale lui Anthropic, că „scenariile de test publicate arată un aliniament aproape perfect pentru modelele Claude recente, dar perturbările dezvăluie lacune de conformitate persistente” (traducere liberă din „Published testing scenarios show near-perfect alignment for newer Claude models, but perturbations reveal persistent compliance gaps”). Observația viza Opus 4.6; ea conturează scenariul împotriva căruia metrica 4× nu este, de una singură, echipată.

„Scenariile de test publicate arată un aliniament aproape perfect pentru modelele Claude recente, dar perturbările dezvăluie lacune de conformitate persistente.”

Aithos AI Research Foundation - Daan Henselmans, Arno Libert, Lennard Zwart (februarie 2026, tradus din engleză). Studiu privind Opus 4.6; autorii nu au evaluat încă Opus 4.8.

Un reper de gamă înainte de ruptura Mythos

Opus 4.8 se înscrie într-un ritm de iterații rapide ale familiei Claude: ActuIA documenta deja lansarea Claude Opus 4 în mai 2025 ca generație centrată pe codare și automatizare prin agenți, traiectorie continuată ulterior de Claude Sonnet 4.5 pe axa programare. Editorul îl prezintă chiar el însuși ca „o îmbunătățire modestă, dar tangibilă” față de Opus 4.7, înainte de sosirea anunțată a unei clase superioare. Această clasă este Claude Mythos Preview, deja implementată în acces restrâns în cadrul Project Glasswing (inițiativă de securitate cibernetică defensivă lansată în aprilie 2026). Într-o lună, Anthropic și „aproximativ 50 de parteneri”, printre care AWS, Apple, Cisco, Google, Microsoft și NVIDIA, declară că au identificat cu ajutorul Mythos Preview peste zece mii de vulnerabilități cu severitate ridicată sau critică pe software-uri considerate sistemic importante. Lansarea publică a Mythos este anunțată „în următoarele săptămâni”, sub rezerva implementării unor măsuri de siguranță întărite. Citirea performanțelor lui Opus 4.8 rămâne deocamdată tributară unui al doilea filtru: dintre cele zece mărturii cifrate publicate de Anthropic, singura bazată pe un benchmark academic public este cea a Induced AI, care anunță 84% pe Online-Mind2Web. Acest benchmark, menținut de OSU-NLP-Group de la Ohio State University sub licență MIT, are tocmai ca titlu de articol de referință „An Illusion of Progress? Assessing the Current State of Web Agents”, o alegere editorială a autorilor academici care invită la gestionarea cu măsură a scorurilor triumfătoare pe agenții web. Alte performanțe revendicate (Super-Agent Benchmark de Relevance AI, Legal Agent Benchmark de Harvey, CursorBench de Cursor) se bazează pe protocoale proprietare nepublicate.