ChatGPT Agent tegen zijn grenzen: een veelbelovend hulpmiddel, maar nog ver van een 'on-demand workforce'

ChatGPT Agent tegen zijn grenzen: een veelbelovend hulpmiddel, maar nog ver van een 'on-demand workforce'

In kort : Lancé récemment par OpenAI, ChatGPT Agent est un outil d'IA capable de naviguer sur le web et d'exécuter des tâches complexes. Bien qu'innovant, son efficacité est limitée par une sandbox sécurisée qui entrave ses interactions web. Face à lui, Manus de Future AGI offre une approche plus audacieuse, mais reste peu accessible.

Gelanceerd midden juli 2025, markeert ChatGPT Agent OpenAI's streven naar autonome assistenten die in staat zijn om op het web te surfen, scripts uit te voeren en complexe taken van begin tot eind te volbrengen. Gepresenteerd als een 'on-demand workforce', roept het hulpmiddel zowel enthousiasme als frustratie op, volgens de feedback van de eerste gebruikers.

Echte capaciteiten maar wisselende prestaties

Op papier maakt ChatGPT Agent indruk met zijn vermogen om de stappen van een missie te doorlopen: online informatie verzamelen, organiseren en samenvatten, documenten genereren (rapporten, presentaties, spreadsheets), het hulpmiddel combineert de functionaliteiten van Operator en DeepResearch, die al enkele maanden op het platform beschikbaar zijn. Voor gestructureerde en weinig dubbelzinnige taken melden verschillende testers een significante tijdwinst, waarbij de agent erin slaagt de tijd die nodig is voor bepaalde onderzoeken en voorbereidingen van leveringen te halveren of meer.
Echter, de beperkingen worden snel duidelijk zodra de taken complexer worden. Veel feedback op Reddit en LinkedIn wijst op een opmerkelijke traagheid, herhalende actielussen en een hoog faalpercentage bij bepaalde webinteracties.

De sandbox: veiligheid of belemmering?

Het functioneren van ChatGPT Agent is gebaseerd op een sandbox: een virtuele omgeving gehost door OpenAI, die een browser en een virtueel bureau integreert. Deze aanpak is bedoeld om veiligheidsrisico's te beperken en controle te houden over de acties van de agent, maar het remt zijn capaciteiten aanzienlijk.

Veel sites blokkeren de toegang of detecteren de agent als een bot, waardoor reserveringen, aankopen of complexe interacties worden verhinderd.

De agent faalt regelmatig bij dynamische formulieren, zeer interactieve sites, beschermd door CAPTCHA of diensten zoals Cloudflare...waardoor hij onbruikbaar wordt voor het vervullen van de meeste aantrekkelijkste beloften op papier.

Deze beschermende aanpak maakt de agent bruikbaar voor onderzoek en samenvattingen, maar weinig betrouwbaar voor gevorderde of kritieke webacties.

Een poging om Manus in te halen

Tegenover ChatGPT Agent biedt Manus, ontwikkeld door Future AGI, een gedurfdere aanpak. Met behulp van een multi-agent architectuur (planning, uitvoering, validatie) en een completere sandbox-omgeving (geavanceerde browser, terminal, multimodale generatie) wordt Manus door sommigen gezien als beter presterend bij complexe taken en autonome workflows.

Echter Manus blijft moeilijk toegankelijk (beperkte toegang, hoge kosten in credits, beperkte beschikbaarheid), wat de adoptie beperkt. Feedback van gebruikers wijst op frequente bugs en een aanzienlijk verbruik van credits bij falen, wat tot frustratie leidt. Zijn autonomie impliceert minder realtime controle, wat kan leiden tot afwijkingen wanneer de agent een onverwachte richting inslaat.

Op weg naar geïntegreerde browseragents?

Een andere route zou een deel van de beperkingen kunnen opheffen: de agent verplaatsen naar de browser van de gebruiker, via een extensie of een lokale module.

Een dergelijk model zou bieden:

  • Snellere uitvoering door de virtualisatie te omzeilen.
  • Directe integratie met lokale tools en gegevens (CRM, berichten, documenten).
  • Betere compatibiliteit met moderne sites, aangezien het zich zou gedragen als een echte menselijke browser.

Maar deze keuze zou twee grote uitdagingen met zich meebrengen:

  • Veiligheid: een agent met toegang tot cookies, accounts en lokale gegevens zou een aantrekkelijk doelwit voor misbruik worden.
  • Marketingpositionering: een lokale agent zou meer lijken op een persoonlijk automatiseringshulpmiddel dan op een 'uitbestede workforce', wat de commerciële belofte van OpenAI zou veranderen.

Een product dat nog in ontwikkeling is

In de huidige staat blijft ChatGPT Agent een innovatief maar onvolwassen hulpmiddel: nuttig om bepaalde goed afgebakende taken te versnellen, beperkt voor ambitieuzere missies. De visie van een 'AI-arbeidskracht' blijft meer een marketingbelofte dan een technische realiteit.

De evolutie van de IA-agentenmarkt zou kunnen verlopen via een hybride compromis: agents die in een beveiligde omgeving kunnen werken terwijl ze bepaalde interacties delegeren aan de lokale browser, met meer controle en waarborgen.

In de tussentijd moeten gebruikers ChatGPT Agent beschouwen als een intelligente assistent in de testfase, en niet als een echte vervanger van menselijke medewerkers.

Wat is de toekomst van het web tegenover agents?

Het internet heeft altijd de communicatie tussen software en computersystemen mogelijk gemaakt. De meeste websites implementeren ten minste één of meer API's, interfaces voor communicatie tussen software. Tegenwoordig streven agents ernaar om het zichtbare deel van het web, bruikbaar door mensen, om te zetten in natuurlijke taalsoftware-interfaces.

Het gaat niet zozeer om de technische capaciteiten, maar om de bereidwilligheid of niet van uitgevers om hun inhoud toegankelijk te maken voor software. De theoretische beloften van agents zijn gebaseerd op een wereld waar agents overal toegang toe hebben. Een van de eerste voor de hand liggende gevolgen zou de versnelling zijn van de al ingezette ineenstorting van het advertentiemodel.

Dit kan ook vragen oproepen over veranderingen, met name in de context van marktplaatsen: hoe kunnen we ons voorstellen dat de goede deals van advertentiesites voor particulieren, zoals Le bon coin of Vinted, niet systematisch worden opgeëist door enkele spelers?

Wat zal er gebeuren met de concurrentie en diversiteit van het aanbod als we allemaal dezelfde prijsvergelijker gebruiken? Uitgevers zitten gevangen tussen een omzeiling van hun gebruiksbeleid en een geleidelijke onzichtbaarheid.