ChatGPT Agent: Open AI stattet seinen konversationellen Assistenten mit einem virtuellen Computer aus

ChatGPT Agent: Open AI stattet seinen konversationellen Assistenten mit einem virtuellen Computer aus

TLDR : OpenAI führt neue agentische Fähigkeiten in ChatGPT ein, die es dem Modell ermöglichen, Aufgaben vollständig zu verwalten und dabei selbstständig Werkzeuge zu wählen und zu kombinieren, während der Benutzer die Kontrolle behält.

OpenAI führt eine fortgeschrittene agentische Fähigkeit in ChatGPT ein, was einen entscheidenden Wendepunkt markiert: Das Modell beschränkt sich nicht mehr nur auf das Denken, es handelt. Durch die Fusion der Funktionen von Operator (aktive Webnavigation) und Deep Research (fortgeschrittene Synthese) kann der ChatGPT-Agent Aufgaben von Anfang bis Ende verwalten. Er wählt selbstständig die am besten geeigneten Werkzeuge aus, wie visueller Browser, API, Terminal oder Code-Editor, und kombiniert sie in einem Arbeitsablauf, der von dem Benutzer überwacht wird.

Denken, ausführen, iterieren

Open AI erklärt in seiner Präsentation:
"ChatGPT kann nun für Sie mit seinem eigenen virtuellen Computer arbeiten und komplexe Aufgaben von Anfang bis Ende verwalten, indem es einen fließenden Übergang zwischen Denken und Handeln vollzieht".

Der Agent arbeitet in einer eigenen Computerumgebung, was ihm ermöglicht, den Kontext während der gesamten Aufgabe beizubehalten. So kann er Wettbewerber analysieren, Präsentationen erstellen, Formulare ausfüllen oder Reisen organisieren, während er sich an die vorherigen Schritte erinnert. Der Benutzer bleibt der Herr des Prozesses: explizite Validierung vor jeder kritischen Aktion, Möglichkeit zur Unterbrechung, zum Zurückgehen, um den Aktionsverlauf zu überprüfen, oder zur Anpassung in Echtzeit. Wenn beispielsweise eine Aufgabe eine Kennung oder ein Passwort erfordert, pausiert der ChatGPT-Agent und bittet den Benutzer, die Kontrolle über den virtuellen Browser zu übernehmen, wobei kein Screenshot erfasst wird.

Erweiterte und gemessene Anwendungsfälle

Der Agent zielt sowohl auf berufliche Fälle (automatische Aktualisierung von Dashboards, Finanzmodellierung, unterstütztes Schreiben) als auch auf persönliche (Buchungen, Planung, administrative Unterstützung). Tests auf mehreren Benchmarks bestätigen eine überlegene Leistung im Vergleich zu früheren Modellen und sogar zu Menschen bei bestimmten Aufgaben, mit einer bemerkenswerten Punktzahl von 89,9 % auf DSBench (Datenanalyse) oder 71,3 % auf SpreadsheetBench (bearbeitbare Excel-Tabellen).

Sicherheit und Governance

Die Einführung dieser agentischen Fähigkeiten wird von Schutzmaßnahmen begleitet. ChatGPT lehnt bestimmte sensible Anfragen ab, wendet eine strikte Hierarchie von Anweisungen an und schützt vor gegnerischen Angriffen wie schneller Injektion. Der Agent arbeitet transparent: Der Benutzer sieht seine Aktionen und behält die Kontrolle über seine Daten.

Verfügbarkeit

Der Agent ChatGPT wurde gestern für Pro-, Plus- und Team-Benutzer eingeführt und wird bald für Enterprise- und Education-Benutzer verfügbar sein. Die Nutzungslimits nach Tariftyp sind wie folgt:
  • Pro: 400 Nachrichten/Monat;
  • Plus: 40 Nachrichten/Monat;
  • Team: 30 Credits/Monat.
Nur vom Benutzer ausgelöste Aktionen, die das Verhalten des Agenten verändern, werden in diesen Limits gezählt: Starten einer Aufgabe, Unterbrechung während einer Aufgabe oder Beantwortung blockierender Fragen. Die Benutzer haben die Möglichkeit, ihr Kontingent durch flexible, auf Credits basierende Optionen zu erhöhen.
Es sei darauf hingewiesen, dass der Agent ChatGPT derzeit weder in der Schweiz noch im Europäischen Wirtschaftsraum (EWR) verfügbar ist, aufgrund regulatorischer Einschränkungen.