W skrócie : OpenAI wprowadziło zaawansowaną funkcjonalność agencyjną do ChatGPT, umożliwiającą modelowi działanie, a nie tylko rozumowanie, poprzez wykorzystanie wirtualnego komputera do zarządzania kompleksowymi zadaniami.
Podsumowanie
OpenAI wprowadza zaawansowaną zdolność agencyjną w ChatGPT, oznaczającą decydujący przełom: model nie ogranicza się już do rozumowania, lecz działa. Łącząc funkcje Operatora (aktywna nawigacja w sieci) i Deep Research (zaawansowana synteza), agent ChatGPT może zarządzać zadaniami od początku do końca. Samodzielnie wybiera najbardziej odpowiednie narzędzia, takie jak przeglądarka wizualna, API, terminal czy edytor kodu, i łączy je w jednym procesie roboczym, pod nadzorem użytkownika.
Rozumowanie, wykonywanie, iteracja
Open AI ogłasza w swojej prezentacji:
"ChatGPT może teraz pracować dla Ciebie, używając własnego wirtualnego komputera, i zarządzać skomplikowanymi zadaniami od początku do końca, płynnie przechodząc między rozumowaniem a działaniem."
Agent działa w własnym środowisku komputerowym, co pozwala mu zachować kontekst przez cały czas trwania zadania. Może analizować konkurencję, tworzyć prezentacje, wypełniać formularze czy organizować podróże, pamiętając o wcześniejszych etapach. Użytkownik pozostaje panem procesu: wyraźne zatwierdzenie przed każdą krytyczną akcją, możliwość przerwania, cofnięcia się w celu przeglądu historii działań lub dostosowania w czasie rzeczywistym. Na przykład, jeśli zadanie wymaga identyfikatora lub hasła, agent ChatGPT wstrzymuje się i prosi użytkownika o przejęcie kontroli nad wirtualnym przeglądarką, wtedy nie są przechwytywane żadne zrzuty ekranu.
Szersze i mierzalne przypadki użycia
Agent kieruje się zarówno przypadkami profesjonalnymi (automatyczna aktualizacja pulpitów nawigacyjnych, modelowanie finansowe, wspomagane pisanie), jak i osobistymi (rezerwacje, planowanie, pomoc administracyjna). Testy na kilku benchmarkach potwierdzają wyższą wydajność w porównaniu do wcześniejszych modeli, a nawet ludzi w niektórych zadaniach, z godnym uwagi wynikiem 89,9% na DSBench (analiza danych) lub 71,3% na SpreadsheetBench (edytowalne arkusze Excel).
Bezpieczeństwo i zarządzanie
Wdrożenie tych zdolności agencyjnych towarzyszy środkom ochronnym. ChatGPT odmawia niektórych wrażliwych żądań, stosuje ścisłą hierarchię instrukcji i chroni przed atakami przeciwnymi, takimi jak szybkie wstrzykiwanie. Agent działa transparentnie: użytkownik widzi jego działania i zachowuje kontrolę nad swoimi danymi.
Dostępność
Agent ChatGPT zaczął być wdrażany wczoraj dla użytkowników Pro, Plus i Team, a wkrótce będzie dostępny dla użytkowników Enterprise i Education. Limity wykorzystania według rodzaju planu są następujące:
- Pro: 400 wiadomości/miesiąc;
- Plus: 40 wiadomości/miesiąc;
- Team: 30 kredytów/miesiąc.
Jedynie działania wywołane przez użytkownika, które zmieniają zachowanie agenta, są liczone w tych limitach: rozpoczęcie zadania, przerwanie w trakcie zadania lub odpowiedź na blokujące pytania. Użytkownicy mają możliwość zwiększenia swojego limitu dzięki elastycznym opcjom opartym na kredytach.
Należy zauważyć, że Agent ChatGPT nie jest obecnie dostępny w Szwajcarii ani w Europejskim Obszarze Gospodarczym (EEA) z powodu ograniczeń regulacyjnych.