ChatGPT Agent w obliczu swoich ograniczeń: obiecujące narzędzie, ale wciąż dalekie od „workforce na żądanie”

W skrócie : Niedawno wprowadzony przez OpenAI, ChatGPT Agent to narzędzie AI zdolne do przeglądania internetu i wykonywania złożonych zadań. Choć innowacyjne, jego skuteczność jest ograniczona przez bezpieczną sandbox, która ogranicza jego interakcje internetowe. W obliczu tego, Manus od Future AGI oferuje bardziej śmiałe podejście, ale pozostaje mało dostępny.

Wprowadzony w połowie lipca 2025 roku, ChatGPT Agent to krok OpenAI w kierunku autonomicznych asystentów zdolnych do przeglądania internetu, wykonywania skryptów i realizowania złożonych zadań od początku do końca. Prezentowany jako „workforce na żądanie”, narzędzie budzi tyle samo entuzjazmu, co frustracji, sądząc po opiniach pierwszych użytkowników.

Rzeczywiste zdolności, ale zróżnicowane osiągi

Na papierze, ChatGPT Agent imponuje zdolnością do łączenia etapów misji: zbierania informacji online, organizacji i syntezy, generowania dokumentów (raportów, prezentacji, arkuszy kalkulacyjnych), narzędzie łączy funkcje Operatora i DeepResearch, dostępne już na platformie od kilku miesięcy. Dla dobrze zdefiniowanych i mało dwuznacznych zadań, niektórzy testerzy zgłaszają znaczące oszczędności czasu, agent potrafi zmniejszyć o połowę, a nawet więcej, czas potrzebny na niektóre badania i przygotowania dostaw.
Jednak ograniczenia pojawiają się szybko, gdy zadania stają się bardziej złożone. Liczne opinie na Reddit i LinkedIn podkreślają zauważalną powolność, powtarzające się pętle działań i wysoką liczbę niepowodzeń w niektórych interakcjach internetowych.

Sandbox: bezpieczeństwo czy ograniczenie?

Działanie ChatGPT Agent opiera się na sandboxie: wirtualnym środowisku hostowanym przez OpenAI, integrującym przeglądarkę i wirtualne biurko. Podejście to ma na celu zmniejszenie ryzyka bezpieczeństwa i utrzymanie kontroli nad działaniami agenta, ale znacząco ogranicza jego możliwości.

Wiele stron blokuje dostęp lub wykrywa agenta jako bota, uniemożliwiając rezerwacje, zakupy lub złożone interakcje.

Agent regularnie zawodzi w obliczu dynamicznych formularzy, bardzo interaktywnych stron zabezpieczonych przez CAPTCHA lub usługi takie jak Cloudflare.... czyniąc go nieużytecznym do realizacji większości obiecujących obietnic na papierze.

To ochronne podejście czyni agenta użytecznym do badań i syntez, ale mało wiarygodnym do zaawansowanych lub krytycznych działań internetowych.

Próba dogonienia Manus

W obliczu ChatGPT Agent, Manus opracowany przez Future AGI, oferuje bardziej śmiałe podejście. Wykorzystując architekturę multi-agentową (planowanie, wykonanie, walidacja) i bardziej kompletne środowisko sandbox (zaawansowana przeglądarka, terminal, generacja multimodalna), Manus jest postrzegany przez niektórych jako bardziej wydajny w przypadku skomplikowanych zadań i autonomicznych przepływów pracy.

Niemniej jednak Manus pozostaje mało dostępny (ograniczony dostęp, wysokie koszty w kredytach, ograniczona dostępność), co ogranicza jego przyjęcie. Opinie użytkowników wskazują na częste błędy i znaczące zużycie kredytów w przypadku niepowodzenia, co generuje frustrację. Jego autonomia oznacza mniejszą kontrolę w czasie rzeczywistym, co może prowadzić do odchyleń, gdy agent zbacza w nieoczekiwanym kierunku.

W kierunku agentów zintegrowanych z przeglądarką?

Inna droga mogłaby podnieść część ograniczeń: przeniesienie agenta do przeglądarki użytkownika, poprzez rozszerzenie lub lokalny moduł.

Taki model oferowałby:

Szybsze wykonanie dzięki uniezależnieniu się od wirtualizacji.
Bezpośrednią integrację z narzędziami i danymi lokalnymi (CRM, wiadomości, dokumenty).
Lepszą zgodność z nowoczesnymi stronami, ponieważ zachowywałby się jak prawdziwa przeglądarka ludzka.

Jednak ten wybór stwarzałby dwa główne wyzwania:

Bezpieczeństwo: agent mający dostęp do plików cookies, kont i danych lokalnych stałby się uprzywilejowanym celem dla nadużyć.
Pozycjonowanie marketingowe: lokalny agent przypominałby bardziej narzędzie do automatyzacji osobistej niż „workforce zewnętrzną”, zmieniając komercyjną obietnicę OpenAI.

Produkt jeszcze w fazie testów

W obecnym stanie, ChatGPT Agent pozostaje innowacyjnym, ale niedojrzałym narzędziem: użytecznym do przyspieszenia niektórych dobrze zdefiniowanych zadań, ograniczonym dla bardziej ambitnych misji. Wizja „IA workforce” pozostaje bardziej obietnicą marketingową niż rzeczywistością techniczną.

Ewolucja rynku agentów IA może przejść przez hybrydowy kompromis: agenci zdolni do pracy w bezpiecznym środowisku, jednocześnie delegując niektóre interakcje do lokalnej przeglądarki, z większą kontrolą i zabezpieczeniami.

Na razie użytkownicy powinni traktować ChatGPT Agent jako inteligentnego asystenta w fazie testów, a nie jako prawdziwego zastępcę ludzkich pracowników.

Jaka przyszłość internetu w obliczu agentów?

Internet zawsze umożliwiał komunikację między oprogramowaniem a systemami komputerowymi. Większość stron internetowych implementuje co najmniej jedno lub więcej API, interfejsów komunikacyjnych między oprogramowaniem. Obecnie agenci dążą do przekształcenia widocznej części internetu, używanej przez ludzi, w interfejsy programowe w języku naturalnym.

Nie chodzi tu tyle o zdolności techniczne, co o zgodę lub nie wydawców na udostępnienie swoich treści oprogramowaniu. Teoretyczne obietnice agentów opierają się na świecie, w którym agenci mają dostęp do wszystkiego. Jedną z pierwszych oczywistych konsekwencji byłoby przyspieszenie upadku, już rozpoczętego, modelu reklamowego.

Może to również budzić pytania dotyczące przemian, zwłaszcza w kontekście rynków: jak wyobrazić sobie, że dobre oferty stron ogłoszeniowych przeznaczone dla osób prywatnych, takich jak Le bon coin czy Vinted, nie zostaną całkowicie przejęte systematycznie przez kilka podmiotów?

Co stanie się z konkurencją i różnorodnością oferty, jeśli wszyscy będziemy korzystać z tego samego porównywarki cen? Wydawcy są w potrzasku pomiędzy obejściem ich polityki użytkowania a stopniową niewidzialnością.

Tłumaczone z ChatGPT Agent face à ses limites : un outil prometteur, mais encore loin de la “workforce à la demande”