TLDR : OpenAI为ChatGPT引入了高级代理能力,使其能够在虚拟电脑上执行复杂任务,从推理到行动。
目录
OpenAI在ChatGPT中引入了高级代理能力,标志着一个决定性的转折点:该模型不仅仅限于推理,它还可以行动。融合了Operator(主动网页浏览)和Deep Research(高级合成)的功能,ChatGPT代理可以管理从头到尾的任务。它自主选择最合适的工具,如可视化浏览器、API、终端或代码编辑器,并在用户的监督下将其结合在同一工作流中。
推理、执行、迭代
OpenAI在其介绍中声明:
“ChatGPT现在可以使用其自带的虚拟电脑为您工作,并在推理与行动之间实现流畅的演变,管理复杂任务从头到尾。”
该代理在一个独立的计算环境中工作,使其在整个任务过程中保持上下文。因此,它能够分析竞争对手、生成演示文稿、填写表格或组织旅行,同时记住先前的步骤。用户始终掌握过程:在每个关键动作前明确验证,可以中断,回顾操作历史或实时调整。例如,当任务需要身份验证信息时,ChatGPT代理会暂停并要求用户接管虚拟浏览器,此时不会捕获屏幕。
扩大和衡量的使用案例
该代理针对专业案例(自动更新仪表板、财务建模、辅助写作)和个人案例(预订、计划、行政协助)。在多个基准测试中,其表现优于前代模型,甚至在某些任务上超过人类,DSBench(数据分析)得分为89.9%,SpreadsheetBench(可编辑Excel表)得分为71.3%。
安全与治理
这些代理能力的部署伴随有保护措施。ChatGPT拒绝某些敏感请求,执行严格的指令层级,并防范如快速注入等对抗性攻击。该代理以透明方式运行:用户可以查看其操作并保持对数据的控制。
可用性
ChatGPT Agent已于昨天开始为Pro、Plus和Team用户部署,并将很快面向Enterprise和Education用户提供。各套餐的使用限制如下:
- Pro:每月400条消息;
- Plus:每月40条消息;
- Team:每月30个信用点。
只有用户触发的改变代理行为的操作才会计入这些限制:启动任务、任务中断或对阻塞性问题的响应。用户可以通过基于信用的灵活选项增加其配额。
需要注意的是,由于监管限制,ChatGPT Agent目前尚未在瑞士和欧洲经济区(EEE)提供。