Anthropic ha annunciato lunedì scorso Claude 3.7 Sonnet, descritto come il suo “modello più intelligente fino ad oggi e il primo modello di ragionamento ibrido sul mercato”, insieme a Claude Code, uno strumento di codifica agentica che consente agli sviluppatori di automatizzare compiti complessi direttamente dal loro terminale. 

Claude 3.7 Sonnet: migliorie evidenti nel coding e nello sviluppo web front-end

Anthropic adotta un approccio unificato al ragionamento, combinando velocità e profondità di analisi. A differenza di altri modelli che sviluppano soluzioni distinte per il ragionamento istantaneo e la riflessione approfondita, Claude 3.7 Sonnet integra queste due capacità in un unico sistema.

Il modello offre due modalità operative:

  • Standard, che migliora le prestazioni di Claude 3.5 Sonnet con risposte più precise e naturali.

  • Riflessione estesa, passo dopo passo, visibile dall'utente dove l'IA prende tempo per analizzare un problema prima di formulare una risposta, migliorando così le sue prestazioni in matematica, coding e seguendo istruzioni complesse.

 

Una delle innovazioni chiave di Claude 3.7 Sonnet è la possibilità, per gli utenti dell'API di Anthropic, di definire un budget di riflessione in numero di token. Questo controllo granulare permette di trovare un equilibrio tra la qualità delle risposte e i costi operativi.

 

Una posizione strategica tra prestazioni e sicurezza

Anthropic pone l'accento sulla sicurezza e l'affidabilità dei suoi modelli. Sono stati condotti test approfonditi e collaborazioni con esperti esterni per garantire che il modello distingua efficacemente le richieste nocive da quelle benigne, riducendo del 45% i rifiuti ingiustificati rispetto al suo predecessore. L'azienda ha pubblicato una scheda di sistema dettagliata dei suoi metodi di valutazione, coprendo in particolare i rischi di attacchi da iniezione rapida e le strategie messe in atto per resistervi.

Claude Code: verso un'automazione avanzata dello sviluppo software

Con Claude Code, Anthropic ambisce a trasformare le pratiche di sviluppo offrendo un assistente IA capace di cercare e modificare codice, eseguire test e persino inviare modifiche su GitHub.

I primi test mostrano una riduzione significativa del tempo necessario per completare alcuni compiti, a volte di oltre 45 minuti. Questo miglioramento potrebbe modificare profondamente il quotidiano degli sviluppatori, specialmente nei campi come il debugging, il refactoring su larga scala e lo sviluppo guidato dai test.

Disponibilità 

Claude 3.7 Sonnet è disponibile su tutti i piani Claude, inclusi Free, Pro, Team ed Enterprise, nonché tramite l'API Anthropic, Amazon Bedrock e Vertex AI di Google Cloud. Tuttavia, la modalità di riflessione estesa è riservata agli utenti dei piani a pagamento. Le tariffe rimangono identiche a quelle delle versioni precedenti: 3 $ per milione di token in ingresso e 15 $ per milione di token in uscita, inclusi i token utilizzati per la riflessione.

Al contrario, Claude Code è attualmente disponibile come anteprima di ricerca limitata. In base ai feedback ricevuti, Anthropic migliorerà “l'affidabilità delle chiamate agli strumenti, aggiunta di supporto per comandi di lunga durata, miglioramento del rendering nell'applicazione e ampliamento della comprensione di Claude delle sue capacità.”