ChatGPT Agent: OpenAI wprowadza wirtualny komputer do swojego asystenta konwersacyjnego

W skrócie : OpenAI wprowadziło zaawansowaną funkcjonalność agencyjną do ChatGPT, umożliwiającą modelowi działanie, a nie tylko rozumowanie, poprzez wykorzystanie wirtualnego komputera do zarządzania kompleksowymi zadaniami.

OpenAI wprowadza zaawansowaną zdolność agencyjną w ChatGPT, oznaczającą decydujący przełom: model nie ogranicza się już do rozumowania, lecz działa. Łącząc funkcje Operatora (aktywna nawigacja w sieci) i Deep Research (zaawansowana synteza), agent ChatGPT może zarządzać zadaniami od początku do końca. Samodzielnie wybiera najbardziej odpowiednie narzędzia, takie jak przeglądarka wizualna, API, terminal czy edytor kodu, i łączy je w jednym procesie roboczym, pod nadzorem użytkownika.

Rozumowanie, wykonywanie, iteracja

Open AI ogłasza w swojej prezentacji:

"ChatGPT może teraz pracować dla Ciebie, używając własnego wirtualnego komputera, i zarządzać skomplikowanymi zadaniami od początku do końca, płynnie przechodząc między rozumowaniem a działaniem."

Agent działa w własnym środowisku komputerowym, co pozwala mu zachować kontekst przez cały czas trwania zadania. Może analizować konkurencję, tworzyć prezentacje, wypełniać formularze czy organizować podróże, pamiętając o wcześniejszych etapach. Użytkownik pozostaje panem procesu: wyraźne zatwierdzenie przed każdą krytyczną akcją, możliwość przerwania, cofnięcia się w celu przeglądu historii działań lub dostosowania w czasie rzeczywistym. Na przykład, jeśli zadanie wymaga identyfikatora lub hasła, agent ChatGPT wstrzymuje się i prosi użytkownika o przejęcie kontroli nad wirtualnym przeglądarką, wtedy nie są przechwytywane żadne zrzuty ekranu.

Szersze i mierzalne przypadki użycia

Agent kieruje się zarówno przypadkami profesjonalnymi (automatyczna aktualizacja pulpitów nawigacyjnych, modelowanie finansowe, wspomagane pisanie), jak i osobistymi (rezerwacje, planowanie, pomoc administracyjna). Testy na kilku benchmarkach potwierdzają wyższą wydajność w porównaniu do wcześniejszych modeli, a nawet ludzi w niektórych zadaniach, z godnym uwagi wynikiem 89,9% na DSBench (analiza danych) lub 71,3% na SpreadsheetBench (edytowalne arkusze Excel).

Bezpieczeństwo i zarządzanie

Wdrożenie tych zdolności agencyjnych towarzyszy środkom ochronnym. ChatGPT odmawia niektórych wrażliwych żądań, stosuje ścisłą hierarchię instrukcji i chroni przed atakami przeciwnymi, takimi jak szybkie wstrzykiwanie. Agent działa transparentnie: użytkownik widzi jego działania i zachowuje kontrolę nad swoimi danymi.

Dostępność

Agent ChatGPT zaczął być wdrażany wczoraj dla użytkowników Pro, Plus i Team, a wkrótce będzie dostępny dla użytkowników Enterprise i Education. Limity wykorzystania według rodzaju planu są następujące:

Pro: 400 wiadomości/miesiąc;
Plus: 40 wiadomości/miesiąc;
Team: 30 kredytów/miesiąc.

Jedynie działania wywołane przez użytkownika, które zmieniają zachowanie agenta, są liczone w tych limitach: rozpoczęcie zadania, przerwanie w trakcie zadania lub odpowiedź na blokujące pytania. Użytkownicy mają możliwość zwiększenia swojego limitu dzięki elastycznym opcjom opartym na kredytach.

Należy zauważyć, że Agent ChatGPT nie jest obecnie dostępny w Szwajcarii ani w Europejskim Obszarze Gospodarczym (EEA) z powodu ograniczeń regulacyjnych.

Tłumaczone z ChatGPT Agent : Open AI dote son assistant conversationnel d'un ordinateur virtuel