Tous ceux qui étaient impatients de découvrir le premier modèle à poids ouverts d'Open AI depuis GPT-2 vont devoir s'armer d'un peu de patience : Sam Altman, son PDG, a annoncé le 12 juillet dernier le report de son lancement, prévu cette semaine pour des raisons de sécurité.
Le 31 mars dernier, quelques jours avant qu'OpenAI ne renonce officiellement à son projet de devenir une société entièrement à but lucratif, Sam Altman annonçait un autre revirement stratégique : la publication dans le courant de l'année d’un modèle à poids ouverts (open weights), doté de capacités avancées de raisonnement, une première depuis la mise en ligne de GPT-2 en 2019.
Après un 1er report du lancement en juin dernier "en raison d’une avancée technique “inattendue et remarquable” qui nécessitait encore du temps", le PDG, évoquant la nécessité de tests de sécurité supplémentaires, explique sur X :
"Nous avions prévu de lancer notre modèle à poids ouverts la semaine prochaine. Nous le reportons : nous avons besoin de temps pour effectuer des tests de sécurité supplémentaires et examiner les zones à haut risque. Nous ne savons pas encore combien de temps cela prendra. Bien que nous ayons confiance dans le fait que la communauté créera de belles choses avec ce modèle, une fois les poids diffusés, il n’est plus possible de revenir en arrière".
Ajoutant :
"C’est nouveau pour nous et nous voulons bien faire les choses. désolé d’être porteur de mauvaises nouvelles ; Nous travaillons très dur !"
Ce futur modèle ne sera pas open source au sens strict du terme, dans la mesure où seuls ses poids, c’est-à-dire les paramètres issus de son entraînement, seront rendus publics. Ni les données d’entraînement, ni l’intégralité du code d’origine ne seront ouverts. Toutefois, cette approche open weights autorisera une large réutilisation : les développeurs pourront exécuter le modèle localement, l’adapter à leurs besoins, voire le combiner à d’autres systèmes. D’où la nécessité de mettre en place des garde-fous robustes, afin de prévenir tout usage malveillant.
Ce délai pourrait également offrir à OpenAI l'opportunité de positionner favorablement son modèle face à une concurrence croissante dans le domaine des modèles de raisonnement à poids ouvert ou open source, tels que Magistral de Mistral AI, DeeSeek R1 ou Yi-1.6 développé par 01.AI.
Aidan Clark, vice-président de la recherche et responsable du projet open weight, assure :
"En termes de capacités, nous pensons que le modèle est phénoménal — mais notre exigence pour un modèle open source est élevée, et nous pensons avoir besoin de plus de temps pour nous assurer que nous publions un modèle dont nous sommes fiers sur tous les plans".