Après Operator (navigation web) et Deep Research (synthèse d'information), OpenAI a annoncé vendredi l’aperçu d’un nouvel agent dédié à l’ingénierie logicielle : Codex (à ne pas confondre avec la première version de Codex lancée en 2021). Cet agent, intégré à l’interface de ChatGPT, est conçu pour automatiser certaines tâches de programmation telles que la génération de code, la détection et correction de bugs, l’écriture de tests ou encore la création de pull requests.
Contrairement aux systèmes d’assistance au code classiques, qui se contentent de proposer des complétions ou suggestions, cet agent fonctionne de manière plus autonome. Les tâches sont exécutées dans un environnement isolé basé sur le cloud, configuré avec le contexte technique fourni par l’utilisateur (notamment le contenu de son dépôt de code). Cela permet à l’agent de mener des opérations complexes de manière séquentielle ou parallèle, tout en assurant un certain niveau de vérification interne : il peut, par exemple, exécuter du code, analyser les résultats, ajuster ses propres modifications et générer des documents de sortie comme des pull requests prêtes à être relues.
Ce fonctionnement repose sur un modèle nommé codex-1, une déclinaison du modèle de raisonnement O3. Ce modèle a été spécifiquement affiné via apprentissage par renforcement sur des scénarios de développement logiciel, avec pour objectif de produire du code lisible, cohérent avec le style du projet, et respectueux des bonnes pratiques.
Fonctionnement et disponibilité
Codex est accessible depuis la barre latérale de ChatGPT (pour les utilisateurs des formules Pro, Team et Enterprise). Deux entrées principales sont proposées :
-
“Code” pour demander la réalisation d’une tâche (implémentation, correction, etc.)
-
“Ask” pour interroger l’agent sur un fichier ou une structure existante (fonction, classe, dépendance, etc.)
Le temps nécessaire à l’exécution dépend de la complexité de la tâche et varie, selon OpenAI, de quelques minutes à une demi-heure. Plusieurs entreprises, dont Cisco, Superhuman, Temporal et Kodiak, expérimentent l’outil dans des cas d’usage réels tels que la maintenance de code hérité, la génération de tests automatisés ou la documentation de projets.
Le service est pour l’instant limité aux abonnés payants, et son extension aux utilisateurs de l’offre "Plus" est annoncée pour une date ultérieure.
