ChatGPT Agent di fronte ai suoi limiti: uno strumento promettente, ma ancora lontano da una “workforce on demand”

TLDR : Lanciato recentemente da OpenAI, ChatGPT Agent è un tool di IA che può navigare sul web ed eseguire compiti complessi. Nonostante sia innovativo, la sua efficacia è limitata da una sandbox sicura che ostacola le sue interazioni web. Al contrario, Manus di Future AGI offre un approccio più audace ma rimane poco accessibile.

Lanciato a metà luglio 2025, ChatGPT Agent segna la volontà di OpenAI di fare un passo verso assistenti autonomi in grado di navigare sul web, eseguire script e realizzare compiti complessi da cima a fondo. Presentato come una “workforce on demand”, lo strumento suscita tanto entusiasmo quanto frustrazione, secondo i feedback dei primi utenti.

Capacità reali ma prestazioni contrastanti

Sulla carta, ChatGPT Agent impressiona per la sua capacità di concatenare le fasi di una missione: raccolta di informazioni online, organizzazione e sintesi, generazione di documenti (rapporti, presentazioni, fogli di calcolo), lo strumento combina le funzionalità di Operator e DeepResearch, già disponibili sulla piattaforma da diversi mesi. Per compiti strutturati e poco ambigui, diversi tester segnalano un risparmio di tempo significativo, l'agente riesce a ridurre della metà, o anche di più, il tempo necessario per alcune ricerche e preparazioni di deliverable.
Tuttavia, i limiti emergono rapidamente quando i compiti diventano più complessi. Numerosi feedback su Reddit e LinkedIn evidenziano una lentezza notevole, cicli di azioni ripetitive e un alto tasso di fallimento in alcune interazioni web.

La sandbox: sicurezza o gabbia?

Il funzionamento di ChatGPT Agent si basa su una sandbox: un ambiente virtuale ospitato da OpenAI, che integra un browser e un desktop virtuale. Questo approccio mira a limitare i rischi di sicurezza e a mantenere un controllo sulle azioni dell'agente, ma limita fortemente le sue capacità.

Molti siti bloccano l'accesso o rilevano l'agente come un bot, impedendo prenotazioni, acquisti o interazioni complesse.

L'agente fallisce regolarmente di fronte a form dinamici, siti altamente interattivi, protetti da CAPTCHA o servizi come Cloudflare... rendendolo inutilizzabile per mantenere la maggior parte delle promesse più allettanti sulla carta.

Questo approccio protettivo rende l'agente utilizzabile per ricerche e sintesi, ma poco affidabile per azioni web avanzate o critiche.

Un tentativo di raggiungere Manus

Di fronte a ChatGPT Agent, Manus, sviluppato da Future AGI, propone un approccio più audace. Utilizzando un'architettura multi-agente (pianificazione, esecuzione, validazione) e un ambiente sandbox più completo (browser avanzato, terminale, generazione multimodale), Manus è percepito da alcuni come più performante su compiti complessi e workflow autonomi.

TuttaviaManus rimane poco accessibile (accesso ristretto, costi elevati in crediti, disponibilità limitata), il che limita la sua adozione. I feedback degli utenti riportano bug frequenti e un consumo di crediti importante in caso di fallimento, generando frustrazione. La sua autonomia implica meno controllo in tempo reale, il che può portare a derive quando l'agente prende una direzione inattesa.

Verso agenti integrati nel browser?

Un'altra via potrebbe sollevare alcune delle limitazioni: spostare l'agente nel browser dell'utente, tramite un'estensione o un modulo locale.

Un tale modello offrirebbe:

Un'esecuzione più rapida liberandosi dalla virtualizzazione.
Un'integrazione diretta con gli strumenti e i dati locali (CRM, messaggistica, documenti).
Una migliore compatibilità con i siti moderni, poiché si comporterebbe come un vero browser umano.

Ma questa scelta comporterebbe due sfide principali:

La sicurezza: un agente che ha accesso ai cookie, account e dati locali diventerebbe un bersaglio privilegiato per gli abusi.
Il posizionamento marketing: un agente locale somiglierebbe di più a uno strumento di automazione personale che a una “workforce esternalizzata”, cambiando la promessa commerciale di OpenAI.

Un prodotto ancora in rodaggio

Allo stato attuale, ChatGPT Agent rimane uno strumento innovativo ma immaturo: utile per accelerare alcuni compiti ben definiti, limitato per missioni più ambiziose. La visione di una “forza lavoro IA” rimane più una promessa di marketing che una realtà tecnica.

L'evoluzione del mercato degli agenti IA potrebbe passare per un compromesso ibrido: agenti in grado di lavorare in un ambiente sicuro delegando alcune interazioni al browser locale, con un controllo aumentato e guardiani.

Nel frattempo, gli utenti devono considerare ChatGPT Agent come un assistente intelligente in fase di test, e non come un vero sostituto dei collaboratori umani.

Quale futuro per il web di fronte agli agenti?

Internet ha sempre permesso ai software e sistemi informatici di comunicare tra loro. La maggior parte dei siti internet implementano almeno una o più API, interfacce di comunicazione tra software. Oggi, gli agenti mirano a trasformare la parte emersa del web, utilizzabile dagli umani, in interfacce software in linguaggio naturale.

La domanda non è tanto quella delle capacità tecniche quanto del consenso o meno degli editori a rendere i loro contenuti accessibili ai software. Le promesse teoriche degli agenti si basano su un mondo in cui gli agenti hanno accesso a tutto. Una delle prime conseguenze evidenti sarebbe l'accelerazione del collasso, già in atto, del modello pubblicitario.

Questo può anche sollevare domande sulle mutazioni, in particolare nel contesto dei mercati: come immaginare che le buone occasioni dei siti di annunci destinati ai privati, come Le bon coin o Vinted, non siano totalmente preemptate in modo sistemico da pochi attori?

Cosa ne sarà della concorrenza e della diversità dell'offerta se usiamo tutti lo stesso comparatore di prezzi? Gli editori sono presi in tenaglia tra un aggiramento della loro politica di utilizzo, e una progressiva invisibilità.

Tradotto da ChatGPT Agent face à ses limites : un outil prometteur, mais encore loin de la “workforce à la demande”