OpenAIは金曜日に、ソフトウェアエンジニアリング専用の新しいエージェントCodex(2021年に開始された最初のバージョンのCodexとは異なる)を発表しました。Operator(ウェブナビゲーション)やDeep Research(情報統合)に続くこのエージェントは、コード生成、バグの検出と修正、テストの作成、プルリクエストの作成など、特定のプログラミングタスクを自動化するために設計されています。
従来のコードアシスタンスシステムが提案や補完に留まるのに対し、このエージェントはより自律的に動作します。タスクは、ユーザーから提供された技術的なコンテキスト(特にコードリポジトリの内容)で設定されたクラウドベースの隔離環境で実行されます。これにより、エージェントは複雑な操作を順次または並列に行い、内部検証のレベルを確保します。例えば、コードを実行し、結果を分析し、自身の変更を調整し、プルリクエストのような出力ドキュメントを生成することができます。
この機能はcodex-1というモデルに基づいており、OpenAIの内部コミュニケーションでは「o3」として参照されている推論モデルGPT-4の派生です。このモデルは、読みやすく、プロジェクトのスタイルに一致し、ベストプラクティスに従ったコードを生成することを目的として、ソフトウェア開発のシナリオにおける強化学習を通じて特別に調整されました。
機能と利用可能性
CodexはChatGPTのサイドバーからアクセス可能です(Pro、Team、Enterpriseプランのユーザー向け)。2つの主要なエントリが提供されています:
「Code」はタスク(実装、修正など)の実行を依頼するためのものです
「Ask」は既存のファイルや構造(関数、クラス、依存関係など)についてエージェントに質問するためのものです
実行に必要な時間はタスクの複雑さに依存し、OpenAIによれば数分から30分程度です。Cisco、Superhuman、Temporal、Kodiakを含むいくつかの企業が、レガシーコードのメンテナンス、自動化されたテストの生成、プロジェクトのドキュメント化などの実際の使用例でこのツールを試験しています。
このサービスは現在、支払い済みの加入者に限定されており、「Plus」プランのユーザーへの拡張が後日に予定されています。
