Claude Opus 4.8: Anthropic si concentra su un modello più onesto riguardo ai propri errori

Il miglioramento enfatizzato da Anthropic per Claude Opus 4.8, pubblicato il 28 maggio 2026, si basa su una metrica: il modello sarebbe, secondo l'editore, quattro volte meno incline rispetto al suo predecessore a lasciar passare senza segnalarli difetti nel codice che ha prodotto. La cifra è auto-dichiarata, prodotta dal team Alignment interno e basata su un protocollo non reso pubblico. Il modello è disponibile immediatamente tramite l'API con l'identificativo claude-opus-4-8 e su claude.ai, con una tariffazione standard allineata a quella di Opus 4.7 (5 dollari per milione di token in entrata, 25 dollari per milione in uscita). Il "fast mode" di Opus 4.8, che opera a 2,5 volte la velocità del modo standard, è fatturato 10 dollari per milione di token in entrata e 50 dollari in uscita, ovvero, secondo il comunicato ufficiale, tre volte meno caro rispetto al fast mode dei modelli Opus precedenti.

Claude Opus 4.8 - tariffe API al lancio (28 maggio 2026)

Modo	Entrata ($/M token)	Uscita ($/M token)	Nota
Standard	5 $	25 $	Invariato rispetto a Opus 4.7
Fast mode (2,5×)	10 $	50 $	3× meno caro rispetto al fast mode precedente

Fonte: annuncio ufficiale Anthropic, anthropic.com/news/claude-opus-4-8

Tre leve operative accompagnano il lancio

Oltre al modello, tre funzionalità modificano il modo in cui Opus 4.8 si integra in un posto di lavoro agentico (progettato per orchestrare compiti multi-step in autonomia). La prima, chiamata "dynamic workflows" e distribuita in accesso anticipato sviluppatori (research preview), estende Claude Code a progetti di grandissima scala: l'agente pianifica il lavoro, lancia centinaia di sotto-agenti in parallelo in una stessa sessione, poi verifica le sue uscite prima di restituire il risultato. Anthropic cita come caso d'uso la migrazione di una base di codice a scala di centinaia di migliaia di righe, dal lancio alla fusione, con la suite di test esistente come riferimento. La funzionalità è riservata ai piani Enterprise, Team e Max di Claude Code. La seconda, il controllo di sforzo ("effort control"), aggiunge accanto al selettore di modello su claude.ai un cursore a quattro livelli: "low", "default", "extra" e "max", accessibile a tutti gli abbonamenti. Anthropic raccomanda l'impostazione "extra" per compiti pesanti e flussi asincroni di lunga durata. La terza, lato API Messages, permette ora l'inserimento di voci di sistema all'interno della tabella messages in corso di task, senza rompere il cache del prompt né passare per un turno utente, aprendo così l'aggiornamento a caldo delle autorizzazioni, dei budget di token o del contesto d'ambiente per un agente in esecuzione.

Una metrica di metacognizione eretta a pietra miliare industriale

Il fattore quattro rivendicato sui difetti non segnalati è l'elemento più strutturante dell'annuncio, e il più delicato da gestire per un acquirente. La metrica è documentata nella scheda di sicurezza del modello (System Card) pubblicata lo stesso giorno, ma è stata prodotta dal team Alignment di Anthropic, non da un valutatore terzo, e il protocollo non è riproducibile nello stato attuale fuori dall'ambiente dell'editore. Secondo questo stesso team, Opus 4.8 presenterebbe tassi di comportamenti disallineati, come inganno o cooperazione a abusi, sostanzialmente inferiori a quelli di Opus 4.7 e vicini a quelli del suo modello meglio allineato, Claude Mythos Preview. Ciò che la metrica sancisce è meno il fatto - un fattore quattro auto-dichiarato su un protocollo non pubblicato impegna debolmente - che lo spostamento dell'asse di valutazione: Anthropic propone ora la metacognizione del modello (sapere cosa non sa fare, segnalare le sue incertezze sulle proprie produzioni) come criterio centrale per qualificare un modello agentico. È questo pezzo che manca per andare oltre: l'editore non pubblica né la formula di conteggio dei difetti non segnalati, né il protocollo di generazione del corpus di codice testato, né le condizioni di perturbazione. Lavori indipendenti pubblicati sul diario di ricerca della Aithos AI Research Foundation il 9 febbraio 2026 hanno mostrato, replicando scenari di valutazione di Anthropic, che "scenari di test pubblicati mostrano un allineamento quasi perfetto per i modelli Claude recenti, ma perturbazioni rivelano lacune di conformità persistenti" (traduzione libera di "Published testing scenarios show near-perfect alignment for newer Claude models, but perturbations reveal persistent compliance gaps"). L'osservazione riguardava Opus 4.6; delinea lo scenario contro il quale la metrica 4× non è, da sola, armata.

"Scenari di test pubblicati mostrano un allineamento quasi perfetto per i modelli Claude recenti, ma perturbazioni rivelano lacune di conformità persistenti."
Aithos AI Research Foundation - Daan Henselmans, Arno Libert, Lennard Zwart (febbraio 2026, tradotto dall'inglese). Studio su Opus 4.6; gli autori non hanno ancora valutato Opus 4.8.

Una pietra miliare di gamma prima della rottura Mythos

Opus 4.8 si inserisce in una cadenza di iterazioni rapide della famiglia Claude: ActuIA documentava già il lancio di Claude Opus 4 a maggio 2025 come generazione centrata sulla codifica e l'automazione tramite agenti, traiettoria poi proseguita da Claude Sonnet 4.5 sull'asse programmazione. L'editore lo presenta peraltro come "un miglioramento modesto ma tangibile" su Opus 4.7, prima dell'arrivo annunciato di una classe superiore. Questa classe è Claude Mythos Preview, già distribuito in accesso limitato nell'ambito di Project Glasswing (iniziativa di cybersicurezza difensiva lanciata ad aprile 2026). In un mese, Anthropic e "approssimativamente 50 partner", tra cui AWS, Apple, Cisco, Google, Microsoft e NVIDIA, dichiarano di aver identificato con l'ausilio di Mythos Preview oltre diecimila vulnerabilità di severità elevata o critica su software giudicati sistemicamente importanti. L'uscita al pubblico di Mythos è annunciata "nelle prossime settimane", soggetta al dispiegamento di salvaguardie rinforzate. La lettura delle performance di Opus 4.8 resta per ora soggetta a un secondo filtro: dei dieci circa testimonianze cifrate pubblicate da Anthropic, l'unica a basarsi su un benchmark accademico pubblico è quella di Induced AI, che annuncia l'84% su Online-Mind2Web. Questo benchmark, mantenuto dal OSU-NLP-Group dell'Ohio State University sotto licenza MIT, ha precisamente per titolo di documento di riferimento "An Illusion of Progress? Assessing the Current State of Web Agents", scelta editoriale degli autori accademici che invita a maneggiare i punteggi trionfanti sugli agenti web con misura. Le altre performance rivendicate (Super-Agent Benchmark di Relevance AI, Legal Agent Benchmark di Harvey, CursorBench di Cursor) si basano su protocolli proprietari non pubblicati.

Stephane Nachez

Redazione ActuIA — notizie, dati e analisi sull'intelligenza artificiale per i decisori.

Claude Opus 4.8: Anthropic si concentra su un modello più onesto riguardo ai propri errori

Tre leve operative accompagnano il lancio

Una metrica di metacognizione eretta a pietra miliare industriale

Una pietra miliare di gamma prima della rottura Mythos

Perché la voce di un cloud Meta fa crollare i neocloud

Anthropic costretta a sospendere Fable 5 e Mythos 5 dopo una direttiva del governo statunitense

Siri AI: Gemini come insegnante, non come motore - cosa non ha detto la WWDC