En juin dernier, les chercheurs de Microsoft Research avaient démontré avec Phi-1, un LLM de 13 milliards de paramètres pour le code Python, que, la qualité des données d'entraînement prévalait sur leur nombre. Phi-1,5, également de 1,3B, entraîné principalement avec des données synthétiques, affiche ainsi de solides performances dans les tests de bon sens, la compréhension du langage et le raisonnement logique. Il a d'ailleurs surpassé LLAMA-2 7B dans différents benchmarks. L'équipe l'a publié en open-source exclusivement à des fins de recherche.
L'équipe de Microsoft Research travaille depuis quelque temps sur les capacités des LLM de taille réduite. En mai dernier, Ronen Eldan et Yuanzhi Li introduisaient TinyStories, un ensemble de données synthétiques de nouvelles ne contenant que des mots qu’un enfant de 3 à 4 ans comprend, générés par GPT-3.5 et GPT-4. Ils l'ont utilisé pour entraîner un modèle de seulement 10 millions de paramètres mais capable de produire du texte en anglais cohérent.
Rejoints par d'autres chercheurs de Microsoft, ils continuent à explorer les limites des modèles de petite taille et publient en juin dernier le modèle de langage Phi-1, un transformateur de 1,3 milliard de paramètres, spécialisé dans le codage Python de base. Il a été entraîné sur diverses sources de données, notamment des sous-ensembles de codes Python de The Stack v1.2, du contenu de questions-réponses de StackOverflow, du code de compétition de codecontests et des manuels et exercices Python synthétiques générés par gpt-3.5-turbo-0301. Ils ont nommé l'étude qui lui était consacrée : "Les manuels scolaires sont tout ce dont vous avez besoin".
PHI-1.5 : Microsoft Research ouvre la voie à des LLM moins coûteux et plus respectueux de l'environnement

Acteurs cités
Sur le même sujet
Alibaba : l'équipe Qwen annonce l'ajout de deux nouveaux modèles open source à Qwen2.5-1M
29/01/2025
OpenAI dévoile GPT-5 : plus rapide, plus fiable… mais pas infaillible
08/08/2025
Mistral Small 3 : la réponse open source française optimisée pour la latence aux modèles GenAI propriétaires
03/02/2025
L'Hebdo ActuIA
Inscription confirmée, à très vite !