ChatGPT Agent의 한계: 유망하지만 여전히 '요청 기반 인력'에서 멀리 떨어진 도구

TLDR : Lancé récemment par OpenAI, ChatGPT Agent est un outil d'IA capable de naviguer sur le web et d'exécuter des tâches complexes. Bien qu'innovant, son efficacité est limitée par une sandbox sécurisée qui entrave ses interactions web. Face à lui, Manus de Future AGI offre une approche plus audacieuse, mais reste peu accessible.

2025년 7월 중순에 출시된 ChatGPT Agent는 웹을 탐색하고 스크립트를 실행하며 복잡한 작업을 처음부터 끝까지 수행할 수 있는 자율 비서로 나아가려는 OpenAI의 의지를 나타냅니다. '요청 기반 인력'으로 소개된 이 도구는 초기 사용자들의 피드백에 따르면 열광과 좌절을 동시에 불러일으키고 있습니다.

실제 능력과 대조적인 성능

이론상으로 ChatGPT Agent는 임무의 여러 단계를 연속적으로 수행할 수 있는 능력으로 인상적입니다: 온라인 정보 수집, 조직 및 종합, 문서 생성(보고서, 프레젠테이션, 스프레드시트) 등 Operator 및 DeepResearch 기능을 결합하여 이미 몇 달 전부터 플랫폼에서 사용할 수 있습니다. 구조화되고 모호하지 않은 작업에서 여러 테스터들은 시간 절약을 보고하며, 에이전트가 특정 연구 및 준비 작업에 소요되는 시간을 절반 이상 줄일 수 있다고 밝혔습니다.
그러나 작업이 복잡해지면 한계가 빠르게 드러납니다. Reddit과 LinkedIn에서의 많은 피드백은 눈에 띄는 느림, 반복적인 작업 루프, 특정 웹 상호작용에서 높은 실패율을 강조합니다.

샌드박스: 보안 또는 족쇄?

ChatGPT Agent의 작동은 OpenAI가 호스팅하는 가상 환경인 샌드박스에 기반을 둡니다. 이 접근 방식은 보안 위험을 줄이고 에이전트의 행동을 통제하는 것을 목표로 하지만 기능을 크게 제한합니다.

많은 사이트가 접근을 차단하거나 에이전트를 봇으로 감지하여 예약, 구매 또는 복잡한 상호작용을 방해합니다.

에이전트는 CAPTCHA나 Cloudflare와 같은 서비스로 보호되는 동적 양식, 매우 상호작용적인 사이트에서 정기적으로 실패하여...가장 매력적인 약속을 이행하기 위해 거의 사용할 수 없게 만듭니다.

이 보호적 접근은 에이전트를 연구 및 종합에는 사용할 수 있게 하지만 고급 또는 중요한 웹 작업에는 신뢰할 수 없습니다.

Manus를 따라잡으려는 시도

ChatGPT Agent와 비교해 Future AGI가 개발한 Manus는 더 대담한 접근 방식을 제공합니다. 다중 에이전트 아키텍처(계획, 실행, 검증)와 더 완전한 샌드박스 환경(고급 브라우저, 터미널, 멀티모달 생성)을 사용하여 Manus는 일부 사람들에게 복잡한 작업과 자율 워크플로우에서 더 성능이 뛰어난 것으로 평가됩니다.

그러나Manus는 접근이 제한되고 신용 비용이 높으며 사용 가능성이 제한되어 있어 채택이 제한됩니다. 사용자 피드백에 따르면 빈번한 버그와 실패 시 많은 신용 소비가 발생하여 좌절감을 초래합니다. 그 자율성은 실시간 제어를 덜 필요로 하고, 이는 에이전트가 예기치 않은 방향으로 나아갈 때 일탈로 이어질 수 있습니다.

브라우저에 통합된 에이전트로 나아갈 것인가?

다른 경로는 일부 제한을 해소할 수 있습니다: 사용자의 브라우저로 에이전트를 옮겨 확장이나 로컬 모듈을 통해 사용할 수 있게 하는 것.

이 모델은 다음과 같은 이점을 제공할 수 있습니다:

가상화를 벗어나 더 빠른 실행을 제공합니다.
로컬 도구 및 데이터(CRM, 메시지, 문서)와의 직접 통합이 가능합니다.
현대적 사이트와 더 나은 호환성을 제공하여 실제 인간 브라우저처럼 작동합니다.

그러나 이 선택은 두 가지 주요 과제를 제시할 것입니다:

보안: 쿠키, 계정 및 로컬 데이터에 접근할 수 있는 에이전트는 남용의 주요 대상이 될 것입니다.
마케팅 포지셔닝: 로컬 에이전트는 개인 자동화 도구에 더 가까워져 OpenAI의 상업적 약속을 변경할 수 있습니다.

아직 성숙하지 않은 제품

현재 ChatGPT Agent는 혁신적이지만 미성숙한 도구로, 잘 규정된 일부 작업을 가속화하는 데 유용하며 더 야심찬 임무에는 제한적입니다. 'AI 인력'이라는 비전은 여전히 마케팅 약속에 가깝고 기술적 현실은 아닙니다.

AI 에이전트 시장의 발전은 하이브리드 타협을 통해 진행될 수 있습니다: 안전한 환경에서 작업할 수 있는 에이전트가 로컬 브라우저에 일부 상호작용을 위임하여 더 높은 통제와 안전장치를 갖추게 되는 것입니다.

그동안 사용자들은 ChatGPT Agent를 실험 단계의 지능형 비서로 간주해야 하며, 인간 협력자의 진정한 대체자로 간주해서는 안 됩니다.

에이전트에 직면한 웹의 미래는?

인터넷은 항상 소프트웨어와 컴퓨터 시스템이 서로 통신할 수 있게 해주었습니다. 대부분의 웹사이트는 최소한 하나 이상의 API, 소프트웨어 간 통신 인터페이스를 구현합니다. 오늘날 에이전트는 인간이 사용할 수 있는 웹의 노출된 부분을 자연어 소프트웨어 인터페이스로 변환하려고 합니다.

문제는 기술적 능력이 아니라 출판사들이 콘텐츠를 소프트웨어에 접근 가능하게 만드는 것에 대한 동의 여부입니다. 에이전트의 이론적 약속은 에이전트가 모든 것에 접근할 수 있는 세상에 기반을 두고 있습니다. 첫 번째 명백한 결과는 이미 시작된 광고 모델의 붕괴 가속화일 것입니다.

이는 또한 변화에 대한 질문을 제기할 수 있습니다, 특히 시장 장소의 맥락에서: Le bon coin이나 Vinted와 같은 개인용 사이트의 좋은 거래가 어떻게 몇몇 행위자에 의해 체계적으로 선점되지 않을 수 있을까요?

우리가 모두 같은 가격 비교 도구를 사용한다면 경쟁과 다양성은 어떻게 될까요? 출판사들은 이용 정책의 회피와 점진적인 비가시성 사이에 끼어 있습니다.

번역됨 ChatGPT Agent face à ses limites : un outil prometteur, mais encore loin de la “workforce à la demande”