S’ils fournissent régulièrement des résultats fascinants, les grands modèles d’intelligence artificielle sont généralement considérés comme des boîtes noires et de nombreux éléments ne sont pas rendus publics. Le projet BigScience, impliquant un millier de chercheurs et chercheus...
En avril dernier, NLP Cloud, start-up grenobloise lançait son interface de programmation NLP permettant aux entreprises et à leurs développeurs et/ou data scientistes de pouvoir utiliser le NLP dans leurs réalisations. La jeune pousse française annonce l’intégration du modè...
GPT-3, le modèle de langage d’Open AI, disponible depuis juillet 2020, était au moment de son annonce, le plus gros modèle linguistique jamais entrainé avec 175 milliards de paramètres pour une taille de 45 téraoctets. À titre de comparaison, GPT-2, le précédent modèle de l...
Les experts d’Open AI ont annoncé une de leurs dernières découvertes autour du comportement du modèle de langage. Ils ont remarqué qu’ils pouvaient l’améliorer en ajustant avec précision un petit ensemble de données organisé comportant moins d’une centaine dR...