ChatGPT Agent face à ses limites : un outil prometteur, mais encore loin de la “workforce à la demande”

ChatGPT Agent face à ses limites : un outil prometteur, mais encore loin de la “workforce à la demande”

En bref : Lancé récemment par OpenAI, ChatGPT Agent est un outil d'IA capable de naviguer sur le web et d'exécuter des tâches complexes. Bien qu'innovant, son efficacité est limitée par une sandbox sécurisée qui entrave ses interactions web. Face à lui, Manus de Future AGI offre une approche plus audacieuse, mais reste peu accessible.

Lancé à la mi-juillet 2025, ChatGPT Agent marque la volonté d’OpenAI de franchir une étape vers des assistants autonomes capables de naviguer sur le web, d’exécuter des scripts et de réaliser des tâches complexes de bout en bout. Présenté comme une “workforce à la demande”, l’outil suscite autant d’enthousiasme que de frustration, si l’on en croit les retours des premiers utilisateurs.

Des capacités réelles mais des performances contrastées

Sur le papier, ChatGPT Agent impressionne par sa capacité à enchaîner les étapes d’une mission : collecte d’informations en ligne, organisation et synthèse, génération de documents (rapports, présentations, feuilles de calcul), l'outil combine les fonctionnalités Operator et DeepResearch, déjà disponibles sur la plateforme depuis plusieurs mois. Pour des tâches structurées et peu ambiguës, plusieurs testeurs rapportent un gain de temps significatif, l’agent parvenant à réduire de moitié, voire davantage, le temps nécessaire à certaines recherches et préparations de livrables.
Cependant, les limites apparaissent rapidement dès que les tâches deviennent plus complexes. De nombreux retours sur Reddit et LinkedIn soulignent une lenteur notable, des boucles d’actions répétitives et un taux d’échec élevé sur certaines interactions web.

La sandbox : sécurité ou carcan ?

Le fonctionnement de ChatGPT Agent repose sur une sandbox : un environnement virtuel hébergé par OpenAI, intégrant un navigateur et un bureau virtuel. Cette approche vise à limiter les risques de sécurité et à maintenir un contrôle sur les actions de l’agent, mais elle freine fortement ses capacités.

De nombreux sites bloquent l’accès ou détectent l’agent comme un bot, empêchant les réservations, achats ou interactions complexes.

L’agent échoue régulièrement face à des formulaires dynamiques, aux sites très interactifs, protégés par CAPTCHA ou des services tels que Cloudflare....le rendant inutilisable pour remplir la plupart des promesses les plus séduisantes sur le papier.

Cette approche, protectrice, rend l’agent utilisable pour des recherches et synthèses, mais peu fiable pour des actions web avancées ou critiques.

Une tentative de rattraper Manus

Face à ChatGPT Agent, Manus, développé par Future AGI, propose une approche plus audacieuse. Utilisant une architecture multi-agents (planification, exécution, validation) et un environnement sandbox plus complet (navigateur avancé, terminal, génération multimodale), Manus est perçu par certains comme plus performant sur des tâches complexes et des workflows autonomes.

Toutefois Manus reste peu accessible (accès restreint, coûts élevés en crédits, disponibilité limitée), ce qui limite son adoption. Les retours d’utilisateurs font état de bugs fréquents et d’une consommation de crédits importante en cas d’échec, générant de la frustration. Son autonomie implique moins de contrôle en temps réel, ce qui peut conduire à des dérives lorsque l’agent part dans une direction inattendue.

Vers des agents intégrés au navigateur ?

Une autre voie pourrait soulever une partie des limitées: déporter l’agent dans le navigateur de l’utilisateur, via une extension ou un module local.

Un tel modèle offrirait :

  • Une exécution plus rapide en s’affranchissant de la virtualisation.
  • Une intégration directe avec les outils et données locales (CRM, messageries, documents).
  • Une meilleure compatibilité avec les sites modernes, puisqu’il se comporterait comme un véritable navigateur humain.

Mais ce choix poserait deux défis majeurs :

  • La sécurité : un agent ayant accès aux cookies, comptes et données locales deviendrait une cible privilégiée pour les abus.
  • Le positionnement marketing : un agent local ressemblerait davantage à un outil d’automatisation personnelle qu’à une “workforce externalisée”, changeant la promesse commerciale d’OpenAI.

Un produit encore en rodage

En l’état, ChatGPT Agent demeure un outil innovant mais immature : utile pour accélérer certaines tâches bien cadrées, limité pour des missions plus ambitieuses. La vision d’une “main‑d’œuvre IA” reste davantage une promesse marketing qu’une réalité technique.

L’évolution du marché des agents IA pourrait passer par un compromis hybride : des agents capables de travailler dans un environnement sécurisé tout en déléguant certaines interactions au navigateur local, avec un contrôle accru et des garde‑fous.

En attendant, les utilisateurs doivent considérer ChatGPT Agent comme un assistant intelligent en phase de test, et non comme un véritable remplaçant de collaborateurs humains.

Quel avenir pour le web face aux agents ?

Internet a toujours permis aux logiciels et systèmes informatiques de communiquer entre eux. La plupart des sites internet implémentent au minimum une ou plusieurs API, interfaces de communication entre logiciels. Aujourd'hui, les agents visent à transformer la partie émergée du web, utilisables par les humains, en interfaces logicielles en langage naturel.

La question n'est pas tant celle des capacités techniques que du consentement ou non des éditeurs à rendre leurs contenus accessibles à des logiciels. Les promesses théoriques des agents se basent sur un monde où les agents ont accès à tout. L'une des premières conséquences évidentes serait l'accélération de l'effondrement, déjà entamé, du modèle publicitaire.

Cela peut également poser des questions sur les mutations, notamment dans le cadre des places de marché : comment envisager que les bonnes affaires des sites d'annonces destinés aux particuliers, comme Le bon coin ou Vinted, ne soient pas totalement préemptés de façon systémique par quelques acteurs ?

Qu'adviendra-t'il de la concurrence et de la diversité de l'offre si nous utilisons tous le même comparateur de prix ? Les éditeurs sont pris en tenaille entre un contournement de leur politique d'utilisation, et une invisibilité progressive.