Índice
Lançado em meados de julho de 2025, o ChatGPT Agent marca a intenção da OpenAI de avançar em direção a assistentes autônomos capazes de navegar na web, executar scripts e realizar tarefas complexas de ponta a ponta. Apresentado como uma “força de trabalho sob demanda”, a ferramenta desperta tanto entusiasmo quanto frustração, de acordo com os feedbacks dos primeiros usuários.
Capacidades reais, mas desempenho variável
No papel, o ChatGPT Agent impressiona por sua capacidade de encadear as etapas de uma missão: coleta de informações online, organização e síntese, geração de documentos (relatórios, apresentações, planilhas), a ferramenta combina as funcionalidades Operator e DeepResearch, já disponíveis na plataforma há vários meses. Para tarefas estruturadas e pouco ambíguas, vários testadores relatam um ganho de tempo significativo, com o agente conseguindo reduzir pela metade, ou mais, o tempo necessário para certas pesquisas e preparações de entregas.
No entanto, os limites aparecem rapidamente quando as tarefas se tornam mais complexas. Muitos relatos no Reddit e LinkedIn destacam uma notável lentidão, loops de ações repetitivas e uma alta taxa de falhas em algumas interações web.
A sandbox: segurança ou limitação?
O funcionamento do ChatGPT Agent baseia-se em uma sandbox: um ambiente virtual hospedado pela OpenAI, que integra um navegador e uma área de trabalho virtual. Esta abordagem visa limitar os riscos de segurança e manter controle sobre as ações do agente, mas freia fortemente suas capacidades.
Muitos sites bloqueiam o acesso ou detectam o agente como um bot, impedindo reservas, compras ou interações complexas.
O agente falha regularmente diante de formulários dinâmicos, sites muito interativos, protegidos por CAPTCHA ou serviços como Cloudflare... tornando-o inutilizável para cumprir a maioria das promessas mais atraentes no papel.
Esta abordagem, protetora, torna o agente utilizável para pesquisas e sínteses, mas pouco confiável para ações web avançadas ou críticas.
Uma tentativa de alcançar Manus
Em comparação com o ChatGPT Agent, o Manus, desenvolvido pela Future AGI, oferece uma abordagem mais ousada. Usando uma arquitetura multiagente (planejamento, execução, validação) e um ambiente sandbox mais completo (navegador avançado, terminal, geração multimodal), o Manus é visto por alguns como mais eficaz em tarefas complexas e fluxos de trabalho autônomos.
No entanto, o Manus permanece pouco acessível (acesso restrito, altos custos em créditos, disponibilidade limitada), o que limita sua adoção. Os feedbacks dos usuários relatam bugs frequentes e um consumo significativo de créditos em caso de falha, gerando frustração. Sua autonomia implica menos controle em tempo real, o que pode levar a desvios quando o agente segue uma direção inesperada.
Rumo a agentes integrados ao navegador?
Uma outra via poderia levantar parte das limitações: deslocar o agente para o navegador do usuário, via uma extensão ou um módulo local.
Um tal modelo ofereceria:
- Uma execução mais rápida ao se libertar da virtualização.
- Uma integração direta com as ferramentas e dados locais (CRM, mensagens, documentos).
- Uma melhor compatibilidade com os sites modernos, já que se comportaria como um verdadeiro navegador humano.
Mas essa escolha colocaria dois grandes desafios:
- A segurança: um agente com acesso a cookies, contas e dados locais se tornaria um alvo privilegiado para abusos.
- O posicionamento de marketing: um agente local pareceria mais com uma ferramenta de automação pessoal do que uma “força de trabalho terceirizada”, mudando a promessa comercial da OpenAI.
Um produto ainda em desenvolvimento
Na situação atual, o ChatGPT Agent continua sendo uma ferramenta inovadora, mas imatura: útil para acelerar certas tarefas bem definidas, limitado para missões mais ambiciosas. A visão de uma “força de trabalho IA” continua mais como uma promessa de marketing do que uma realidade técnica.
A evolução do mercado de agentes IA pode passar por um compromisso híbrido: agentes capazes de trabalhar em um ambiente seguro enquanto delegam algumas interações ao navegador local, com controle aumentado e salvaguardas.
Enquanto isso, os usuários devem considerar o ChatGPT Agent como um assistente inteligente em fase de teste, e não como um verdadeiro substituto para colaboradores humanos.
Qual o futuro da web frente aos agentes?
A Internet sempre permitiu que softwares e sistemas informáticos se comunicassem entre si. A maioria dos sites da internet implementa pelo menos uma ou várias APIs, interfaces de comunicação entre softwares. Hoje, os agentes visam transformar a parte visível da web, utilizável por humanos, em interfaces de software em linguagem natural.
A questão não é tanto sobre as capacidades técnicas, mas sobre o consentimento ou não dos editores em tornar seus conteúdos acessíveis a softwares. As promessas teóricas dos agentes se baseiam em um mundo onde os agentes têm acesso a tudo. Uma das primeiras consequências óbvias seria a aceleração do colapso, já iniciado, do modelo publicitário.
Isso também pode levantar questões sobre as mudanças, especialmente no âmbito dos mercados: como considerar que as boas ofertas dos sites de anúncios destinados a particulares, como Le bon coin ou Vinted, não sejam totalmente apropriadas de forma sistêmica por alguns atores?
O que acontecerá com a concorrência e a diversidade da oferta se todos usarmos o mesmo comparador de preços? Os editores estão presos entre o desvio de sua política de uso e uma invisibilidade progressiva.