OpenAI svela GPT-5

TLDR : Sam Altman ha svelato GPT-5, un modello di intelligenza artificiale presentato come un progresso significativo verso l'intelligenza artificiale generale, offrendo capacità di esperto di livello dottorato. Questo modello, più veloce e più preciso dei suoi predecessori, è ora il modello predefinito di ChatGPT, accessibile gratuitamente.

Come aveva accennato all'inizio della settimana, Sam Altman ha svelato ieri sera GPT-5. Il modello, che presenta come un progresso significativo e un passo importante verso l'AGI (una promessa da maneggiare con cautela), l'intelligenza artificiale generale, avrebbe le capacità di un esperto di livello dottorato. Ciliegina sulla torta: è accessibile agli utenti gratuiti poiché è ora il modello predefinito di ChatGPT.

Nell'uso: più veloce, più contesto e molte meno allucinazioni

Difficile provocare ancora un "effetto wow": in apparenza, le versioni precedenti di GPT sembravano essere in grado di fare tutto, con una certa sicurezza e una capacità di convinzione capace di abbagliare più di uno. Tanto che Sam Altman ha dovuto moltiplicare le dichiarazioni negli ultimi giorni per trasmettere il messaggio che GPT-5 è un nuovo progresso significativo.

La prima evidenza è la velocità di produzione di contenuti di GPT-5, ancora più elevata rispetto alle versioni precedenti. Appena reso disponibile, abbiamo effettuato un test di sviluppo: GPT-5 ha risolto in 1 minuto un problema di conflitto di framework su cui GPT-4o e Claude 4 Sonnet giravano in tondo. Le quote di mercato tra gli sviluppatori sembrano essere una delle priorità di OpenAI, come dimostra la partnership con Cursor e la disponibilità gratuita agli utenti di GPT-5 durante la fase di lancio.

Razionalizzazione: GPT-5, nuovo modello predefinito tutto-in-uno

Sulla carta, GPT-5 combina un modello veloce per le domande semplici, un modello di ragionamento profondo per i problemi complessi e un router intelligente che sceglie quale utilizzare in base al tipo di conversazione. Un buon modo per semplificare le cose per gli utenti e razionalizzare i costi.

Come per GPT-4o, la differenza tra l'accesso gratuito e a pagamento a GPT-5 all'interno di ChatGPT si basa sul volume di utilizzo. Quando gli utenti gratuiti raggiungono il loro limite, vengono automaticamente reindirizzati a GPT-5 mini, un modello alleggerito ma molto performante, secondo OpenAI. Il limite di utilizzo è nettamente più elevato per gli abbonati Plus, mentre quelli Pro hanno accesso illimitato a GPT-5 e possono attivare GPT-5 Pro, una versione le cui capacità di ragionamento sono state ampliate.

GPT-5 è anche disponibile tramite l'API dell'azienda. Tre varianti sono proposte agli sviluppatori: gpt-5, gpt-5-mini e gpt-5-nano, consentendo di bilanciare prestazioni, costi e latenza.

Prestazioni

Il modello beneficia di una finestra di contesto ampliata a 256.000 token, permettendogli di trattare documenti voluminosi o di seguire scambi lunghi senza perdita di coerenza. È non solo più veloce dei suoi predecessori, ma il suo tasso di allucinazione sarebbe stato significativamente ridotto, rafforzando l'affidabilità delle sue risposte.

Secondo OpenAI, stabilisce un nuovo stato dell'arte nei campi della matematica (94,6% su AIME 2025 senza strumenti), della codifica del mondo reale (74,9% su SWE-bench Verified, 88% su Aider Polyglot), della comprensione multimodale (84,2% su MMMU) e della salute (46,2% su HealthBench Hard).

In termini di sicurezza, il modello è stato rigorosamente testato attraverso 5.000 ore di red teaming in collaborazione con organismi specializzati come il CAISI e l'AISI britannico. L'azienda ha messo in atto misure di protezione robuste:

"Sebbene non abbiamo prove definitive che questo modello possa aiutare significativamente un novizio a creare gravi danni biologici, la nostra soglia definita per un'elevata capacità, adottiamo un approccio di precauzione e attiviamo subito le misure di protezione richieste per essere più preparati quando tali capacità saranno disponibili".

Microsoft ha già integrato GPT-5 nella maggior parte dei suoi prodotti: Copilot, Microsoft 365 Copilot (Word, Excel, Outlook...), GitHub Copilot, Visual Studio Code o Azure AI Foundry.

Una affidabilità ancora lontana dall'essere infallibile

Sulla carta, le promesse di riduzione delle allucinazioni sembrano essere uno dei miglioramenti più belli di GPT-5. Ma in pratica, non ci sono voluti 5 minuti per indurre in errore il nuovo modello di punta di OpenAI. Tuttavia, se il modello si sbaglia sul presidente degli Stati Uniti, c'è da scommettere che le risposte siano ancora piene di errori su domande più specifiche.

Tradotto da OpenAI dévoile GPT-5 : plus rapide, plus fiable… mais pas infaillible