继 Operator(网页导航)和 Deep Research(信息综合)之后,OpenAI 于周五宣布了一个专门用于软件工程的新代理的预览:Codex(不要与 2021 年推出的第一版 Codex 混淆)。这个代理集成在 ChatGPT 的界面中,旨在自动化某些编程任务,如代码生成、错误检测与修复、测试编写以及创建拉取请求。
与传统的代码辅助系统不同,这个代理以更自主的方式运行。任务在基于云的隔离环境中执行,并根据用户提供的技术背景(尤其是其代码库的内容)进行配置。这使代理能够以顺序或并行方式执行复杂操作,同时确保一定程度的内部验证:例如,它可以执行代码、分析结果、调整自身的修改,并生成准备好审阅的拉取请求等输出文档。
这种功能依赖于一个名为 codex-1 的模型,这是 GPT-4 推理模型的一个变种(OpenAI 在内部沟通中称其为“o3”)。这个模型通过强化学习在软件开发场景中进行了专门优化,目标是生成可读的、与项目风格一致并符合最佳实践的代码。
功能和可用性
Codex 可以通过 ChatGPT 的侧边栏访问(适用于 Pro、Team 和 Enterprise 用户)。提供了两个主要入口:
-
“代码”用于请求执行任务(实现、修正等)
-
“询问”用于向代理询问现有文件或结构(函数、类、依赖等)
执行所需时间取决于任务的复杂性,根据 OpenAI 的说法,从几分钟到半小时不等。包括 Cisco、Superhuman、Temporal 和 Kodiak 在内的多家公司正在真实用例中试验该工具,如遗留代码维护、自动化测试生成或项目文档编制。
该服务目前仅限于付费订阅用户,并计划在稍后日期扩展到“Plus”用户。
Pour mieux comprendre
在软件工程中使用隔离的云环境在法规和合规方面的潜在监管影响是什么?
使用隔离的云环境会引发监管关注,尤其是在数据安全和遵循类似于GDPR的数据保护标准方面。企业必须确保其云托管实践与这些法规保持一致,以避免法律风险。
如何通过强化学习微调codex-1模型提高其在软件开发中的性能?
通过强化学习微调codex-1模型使模型能够从错误中学习并动态调整。这样增强了其一致生成代码的能力,并符合现代开发实践,同时提高了其理解和执行编程任务的准确性。