ChatGPT Agent frente a sus límites: una herramienta prometedora, pero aún lejos de la "fuerza laboral bajo demanda"

TLDR : Lanzado recientemente por OpenAI, ChatGPT Agent es una herramienta de IA capaz de navegar por la web y ejecutar tareas complejas. Aunque innovador, su eficacia está limitada por un entorno seguro que obstaculiza sus interacciones web. Frente a él, Manus de Future AGI ofrece un enfoque más audaz, pero sigue siendo poco accesible.

Lanzado a mediados de julio de 2025, ChatGPT Agent marca la intención de OpenAI de avanzar hacia asistentes autónomos capaces de navegar por la web, ejecutar scripts y realizar tareas complejas de principio a fin. Presentado como una "fuerza laboral bajo demanda", la herramienta genera tanto entusiasmo como frustración, según los comentarios de los primeros usuarios.

Capacidades reales pero rendimientos contrastados

Sobre el papel, ChatGPT Agent impresiona por su capacidad para encadenar las etapas de una misión: recopilación de información en línea, organización y síntesis, generación de documentos (informes, presentaciones, hojas de cálculo), la herramienta combina las funcionalidades Operator y DeepResearch, ya disponibles en la plataforma desde hace varios meses. Para tareas estructuradas y poco ambiguas, varios evaluadores reportan un ahorro de tiempo significativo, logrando el agente reducir a la mitad, o incluso más, el tiempo necesario para ciertas investigaciones y preparaciones de entregables.
Sin embargo, las limitaciones aparecen rápidamente cuando las tareas se vuelven más complejas. Numerosos comentarios en Reddit y LinkedIn destacan una lentitud notable, bucles de acciones repetitivas y una alta tasa de fallos en ciertas interacciones web.

La sandbox: ¿seguridad o limitación?

El funcionamiento de ChatGPT Agent se basa en una sandbox: un entorno virtual alojado por OpenAI, que integra un navegador y un escritorio virtual. Este enfoque busca limitar los riesgos de seguridad y mantener un control sobre las acciones del agente, pero frena fuertemente sus capacidades.

Muchos sitios bloquean el acceso o detectan al agente como un bot, impidiendo reservas, compras o interacciones complejas.

El agente falla regularmente frente a formularios dinámicos, sitios muy interactivos, protegidos por CAPTCHA o servicios como Cloudflare... haciéndolo inutilizable para cumplir con la mayoría de las promesas más atractivas sobre el papel.

Este enfoque, protector, hace que el agente sea utilizable para investigaciones y síntesis, pero poco confiable para acciones web avanzadas o críticas.

Un intento de alcanzar a Manus

Frente a ChatGPT Agent, Manus, desarrollado por Future AGI, propone un enfoque más audaz. Utilizando una arquitectura multi-agente (planificación, ejecución, validación) y un entorno sandbox más completo (navegador avanzado, terminal, generación multimodal), Manus es percibido por algunos como más eficiente en tareas complejas y flujos de trabajo autónomos.

Sin embargo, Manus sigue siendo poco accesible (acceso restringido, altos costos en créditos, disponibilidad limitada), lo que limita su adopción. Los comentarios de los usuarios informan de errores frecuentes y un consumo importante de créditos en caso de fallos, generando frustración. Su autonomía implica menos control en tiempo real, lo que puede llevar a desviaciones cuando el agente toma una dirección inesperada.

¿Hacia agentes integrados en el navegador?

Otro enfoque podría superar algunas de las limitaciones: desplazar el agente al navegador del usuario, a través de una extensión o un módulo local.

Un modelo así ofrecería:

Una ejecución más rápida al liberarse de la virtualización.
Una integración directa con las herramientas y datos locales (CRM, mensajerías, documentos).
Una mejor compatibilidad con los sitios modernos, ya que se comportaría como un verdadero navegador humano.

Pero esta elección presentaría dos desafíos principales:

La seguridad: un agente con acceso a cookies, cuentas y datos locales se convertiría en un objetivo privilegiado para abusos.
El posicionamiento de mercado: un agente local se parecería más a una herramienta de automatización personal que a una "fuerza laboral externalizada", cambiando la promesa comercial de OpenAI.

Un producto aún en desarrollo

En su estado actual, ChatGPT Agent sigue siendo una herramienta innovadora pero inmadura: útil para acelerar ciertas tareas bien definidas, limitado para misiones más ambiciosas. La visión de una "mano de obra IA" sigue siendo más una promesa de marketing que una realidad técnica.

La evolución del mercado de agentes IA podría pasar por un compromiso híbrido: agentes capaces de trabajar en un entorno seguro mientras delegan ciertas interacciones al navegador local, con un control aumentado y salvaguardas.

Mientras tanto, los usuarios deben considerar a ChatGPT Agent como un asistente inteligente en fase de prueba, y no como un verdadero reemplazo de colaboradores humanos.

¿Qué futuro para la web frente a los agentes?

Internet siempre ha permitido que los software y sistemas informáticos se comuniquen entre sí. La mayoría de los sitios web implementan al menos una o varias API, interfaces de comunicación entre software. Hoy en día, los agentes buscan transformar la parte visible de la web, utilizable por los humanos, en interfaces de software en lenguaje natural.

La cuestión no es tanto las capacidades técnicas como el consentimiento o no de los editores para hacer sus contenidos accesibles a software. Las promesas teóricas de los agentes se basan en un mundo donde los agentes tienen acceso a todo. Una de las primeras consecuencias evidentes sería la aceleración del colapso, ya iniciado, del modelo publicitario.

Esto también puede plantear preguntas sobre las mutaciones, especialmente en el marco de los mercados: ¿cómo imaginar que las buenas ofertas de sitios de anuncios destinados a particulares, como Le bon coin o Vinted, no sean totalmente acaparadas de manera sistemática por algunos actores?

¿Qué sucederá con la competencia y la diversidad de la oferta si todos usamos el mismo comparador de precios? Los editores están atrapados entre un rodeo a su política de uso, y una invisibilidad progresiva.

Traducido de ChatGPT Agent face à ses limites : un outil prometteur, mais encore loin de la “workforce à la demande”