TLDR : OpenAI ha migliorato ChatGPT con un computer virtuale per eseguire compiti complessi in autonomia, mantenendo l'utente nel controllo. L'agente offre una maggiore efficienza in ambito professionale e personale, con misure di sicurezza per proteggere i dati.
Sommario
OpenAI introduce una capacità agentica avanzata in ChatGPT, segnando una svolta decisiva: il modello non si limita più a ragionare, agisce. Fondendo le funzionalità di Operator (navigazione web attiva) e di Deep Research (sintesi avanzata), l'agente ChatGPT può gestire compiti da capo a fine. Sceglie in modo autonomo gli strumenti più adatti, browser visivo, API, terminale o editor di codice, e li combina in un unico flusso di lavoro, sotto la supervisione dell'utente.
Ragionare, eseguire, iterare
OpenAI dichiara nella sua presentazione:
"ChatGPT può ora lavorare per voi con il suo proprio computer virtuale, e gestire compiti complessi dall'inizio alla fine operando una transizione fluida tra ragionamento e azione".
L'agente lavora in un ambiente informatico proprio, il che gli consente di mantenere il contesto per tutta la durata del compito. Può così analizzare concorrenti, generare presentazioni, compilare moduli o organizzare viaggi ricordando i passaggi precedenti. L'utente rimane padrone del processo: validazione esplicita prima di ogni azione critica, possibilità di interruzione, di tornare indietro per rivedere la cronologia delle azioni o di aggiustamenti in tempo reale. Se per esempio un compito richiede un'identificazione o una password, l'agente ChatGPT si ferma e chiede all'utente di prendere il controllo del browser virtuale, nessuno screenshot viene allora catturato.
Casi d'uso ampliati e misurati
L'agente mira tanto a casi professionali (aggiornamento automatico di dashboard, modellazione finanziaria, redazione assistita) quanto personali (prenotazioni, pianificazione, assistenza amministrativa). I test su diversi benchmark confermano una performance superiore a quella dei modelli precedenti e persino agli umani in alcuni compiti, con un punteggio notevole di 89,9% su DSBench (analisi dei dati) o 71,3% su SpreadsheetBench (fogli Excel modificabili).
Sicurezza e governance
Il dispiegamento di queste capacità agentiche è accompagnato da misure di sicurezza. ChatGPT rifiuta alcune richieste sensibili, applica una gerarchia rigorosa di istruzioni, e protegge contro attacchi avversari come l'iniezione rapida. L'agente funziona in trasparenza: l'utente visualizza le sue azioni e mantiene il controllo dei propri dati.
Disponibilità
L'Agent ChatGPT ha iniziato a essere distribuito ieri per gli utenti Pro, Plus e Team, e sarà disponibile prossimamente per gli utenti Enterprise ed Education. I limiti di utilizzo per tipo di abbonamento sono i seguenti:
- Pro: 400 messaggi/mese;
- Plus: 40 messaggi/mese;
- Team: 30 crediti/mese.
Solo le azioni attivate dall'utente che modificano il comportamento dell'agente vengono conteggiate in questi limiti: avvio di un compito, interruzione durante il compito o risposta a domande bloccanti. Gli utenti hanno la possibilità di aumentare il loro quota grazie a opzioni flessibili basate su crediti.
Da notare che l'Agent ChatGPT non è al momento disponibile in Svizzera né nello Spazio economico europeo (SEE), a causa di vincoli regolamentari.