TLDR : ChatGPTが独自の仮想コンピュータを使用して、推論と行動の間をスムーズに進化させ、複雑なタスクを管理できるようになりました。
目次
OpenAIはChatGPTに高度なエージェント機能を導入し、決定的な転機を迎えました:このモデルはもはや推論にとどまらず、行動もします。Operator(アクティブなウェブナビゲーション)とDeep Research(高度な統合)の機能を融合させたChatGPTエージェントは、エンドツーエンドでタスクを管理できます。視覚的なブラウザ、API、ターミナル、またはコードエディタの最も適したツールを自律的に選択し、それらを同じワークフローで組み合わせ、ユーザーの監督の下で動作します。
推論、実行、反復
Open AIはそのプレゼンテーションで述べています:
「ChatGPTは今や独自の仮想コンピュータを使用して、推論と行動の間をスムーズに進化させながら、複雑なタスクを始めから終わりまで管理できます。」
エージェントは独自のコンピュータ環境で作業し、タスク全体を通じてコンテキストを維持できます。そのため、競合分析、プレゼンテーションの生成、フォームの記入、旅行の手配など、前のステップを記憶しながら実行できます。ユーザーはプロセスを制御し続け、重要なアクションごとに明示的な承認を行い、タスクを中断したり、アクションの履歴を見直したり、リアルタイムで調整したりできます。例えば、タスクにIDやパスワードが必要な場合、ChatGPTエージェントは一時停止し、ユーザーに仮想ブラウザの操作を求め、スクリーンショットは撮影されません。
拡張され、慎重に測定された使用ケース
エージェントは、プロフェッショナルなケース(ダッシュボードの自動更新、財務モデリング、支援付きの執筆)だけでなく、個人的なケース(予約、計画、行政支援)も対象としています。複数のベンチマークでのテストでは、以前のモデルや人間を上回る性能が確認されており、DSBench(データ分析)で89.9%、SpreadsheetBench(変更可能なExcelシート)で71.3%の注目すべきスコアを記録しています。
セキュリティとガバナンス
これらのエージェント機能の展開にはセーフガードが伴います。ChatGPTは特定のセンシティブなリクエストを拒否し、厳格な指示の階層を適用し、迅速な注入などの逆攻撃から保護します。エージェントは透明性を保ち、ユーザーはそのアクションを視覚化し、データの制御を維持します。
利用可能性
ChatGPTエージェントは昨日からPro、Plus、Teamユーザー向けに展開が開始されており、EnterpriseおよびEducationユーザー向けには近日中に利用可能となります。プラン別の利用制限は次のとおりです:
- Pro:400メッセージ/月;
- Plus:40メッセージ/月;
- Team:30クレジット/月。
これらの制限には、エージェントの動作を変更するユーザーによってトリガーされるアクションのみが含まれます:タスクの開始、タスクの途中での中断、またはブロックしている質問への回答。ユーザーはクレジットベースの柔軟なオプションを利用して、クォータを増やすことができます。
なお、ChatGPTエージェントは現在、規制上の制約のため、スイスおよび欧州経済領域(EEE)では利用できません。