ChatGPT Agent：OpenAI为其对话助手配备虚拟电脑

TLDR : OpenAI为ChatGPT引入了高级代理能力，使其能够在虚拟电脑上执行复杂任务，从推理到行动。

OpenAI在ChatGPT中引入了高级代理能力，标志着一个决定性的转折点：该模型不仅仅限于推理，它还可以行动。融合了Operator（主动网页浏览）和Deep Research（高级合成）的功能，ChatGPT代理可以管理从头到尾的任务。它自主选择最合适的工具，如可视化浏览器、API、终端或代码编辑器，并在用户的监督下将其结合在同一工作流中。

推理、执行、迭代

OpenAI在其介绍中声明：

“ChatGPT现在可以使用其自带的虚拟电脑为您工作，并在推理与行动之间实现流畅的演变，管理复杂任务从头到尾。”

该代理在一个独立的计算环境中工作，使其在整个任务过程中保持上下文。因此，它能够分析竞争对手、生成演示文稿、填写表格或组织旅行，同时记住先前的步骤。用户始终掌握过程：在每个关键动作前明确验证，可以中断，回顾操作历史或实时调整。例如，当任务需要身份验证信息时，ChatGPT代理会暂停并要求用户接管虚拟浏览器，此时不会捕获屏幕。

扩大和衡量的使用案例

该代理针对专业案例（自动更新仪表板、财务建模、辅助写作）和个人案例（预订、计划、行政协助）。在多个基准测试中，其表现优于前代模型，甚至在某些任务上超过人类，DSBench（数据分析）得分为89.9%，SpreadsheetBench（可编辑Excel表）得分为71.3%。

安全与治理

这些代理能力的部署伴随有保护措施。ChatGPT拒绝某些敏感请求，执行严格的指令层级，并防范如快速注入等对抗性攻击。该代理以透明方式运行：用户可以查看其操作并保持对数据的控制。

可用性

ChatGPT Agent已于昨天开始为Pro、Plus和Team用户部署，并将很快面向Enterprise和Education用户提供。各套餐的使用限制如下：

Pro：每月400条消息；
Plus：每月40条消息；
Team：每月30个信用点。

只有用户触发的改变代理行为的操作才会计入这些限制：启动任务、任务中断或对阻塞性问题的响应。用户可以通过基于信用的灵活选项增加其配额。

需要注意的是，由于监管限制，ChatGPT Agent目前尚未在瑞士和欧洲经济区（EEE）提供。

翻译自 ChatGPT Agent : Open AI dote son assistant conversationnel d'un ordinateur virtuel

ChatGPT Agent：OpenAI为其对话助手配备虚拟电脑

目录

推理、执行、迭代

扩大和衡量的使用案例

安全与治理

可用性