L'IA clé en main : OVHcloud lance AI Endpoints, sa plateforme serverless d’IA open source
OVHcloud annonce le lancement officiel de AI Endpoints, une nouvelle solution cloud serverless destinée à faciliter l’intég...
Meta, géant technologique mondialement reconnu, a récemment élargi sa famille de modèles de langage avec le lancement de Llama 3.1. Ce modèle s'inscrit dans une lignée d'innovations continues en matière d'intelligence artificielle open source. Le modèle phare de cette nouvelle série, Llama 3.1 405B, se distingue par son impressionnant nombre de 405 milliards de paramètres, le plaçant au sommet des modèles open source par sa taille. Cette avancée souligne l'engagement de Meta à fournir des outils puissants et accessibles pour la communauté des développeurs.
Llama 3.1 se distingue par plusieurs capacités clés, notamment sa polyvalence multilingue. Les modèles de la série, comprenant également Llama 3.1 8B et 70B, sont capables de traiter des langues telles que l'anglais, le français, l'allemand, l'espagnol, et bien d'autres, ce qui les rend particulièrement adaptés pour une utilisation globale. En outre, ces modèles disposent d'une fenêtre contextuelle étendue, allant jusqu'à 128 000 jetons, permettant une gestion efficace de longues séquences de texte. Cette fonctionnalité est cruciale pour des applications nécessitant un suivi contextuel sur des interactions complexes ou prolongées.
Avec le lancement de Llama 3.1, Meta a introduit des améliorations significatives dans les processus de post-entraînement. En utilisant des techniques de réglage fin supervisé et d'optimisation directe des préférences, Meta a réussi à produire des modèles avec des performances accrues sur une large gamme de tâches. Cette méthodologie a permis d’affiner le modèle à travers des cycles de développement itératifs, aboutissant à une création de données synthétiques de haute qualité qui enrichissent le modèle sur plusieurs fronts, du traitement linguistique au raisonnement complexe.
Llama 3.1 s'inscrit dans une stratégie plus large de Meta visant à promouvoir l'open source dans le domaine de l'intelligence artificielle. Alors que d'autres acteurs de l'industrie, comme OpenAI et Google, privilégient souvent des approches propriétaires, Meta mise sur l'ouverture et la collaboration. Cette démarche est renforcée par une licence qui permet aux développeurs d'utiliser les sorties des modèles Llama pour améliorer d'autres modèles, contribuant ainsi à un écosystème technologique plus ouvert et interconnecté.
En plus d'étendre les capacités textuelles, Meta envisage d'intégrer des fonctionnalités multimodales à Llama 3.1, incorporant potentiellement des capacités de traitement d'images, de vidéos et d'audio. Cependant, cette expansion pourrait rencontrer des obstacles réglementaires, en particulier en Europe, où Meta a temporairement suspendu le lancement de ses modèles multimodaux en raison d'incertitudes législatives. Cette décision souligne les défis que rencontrent les grandes entreprises technologiques dans l'harmonisation des innovations avec les exigences réglementaires mondiales.
En conclusion, Llama 3.1 représente une avancée majeure dans le domaine des modèles de langage open source. Par ses caractéristiques techniques avancées et sa stratégie d'open source, Meta continue de jouer un rôle clé dans l'évolution de l'intelligence artificielle, tout en naviguant dans les complexités du paysage réglementaire mondial.
19 articles liés à cet acteur
OVHcloud annonce le lancement officiel de AI Endpoints, une nouvelle solution cloud serverless destinée à faciliter l’intég...
Après avoir publié en décembre dernier sa famille de modèles OLMO 2, l’Allen Institute for Artificial Intelligence (AI2) poursuit son engagement enver...
C'est sous la licence MIT, l'une des licences open source les plus permissives, que DeepSeek, acteur chinois de la GenAI, a publié ce jeudi 26 décembr...
Alors que Meta prépare le lancement des premiers modèles Llama 4 pour le début de l'année prochaine, l'entreprise a dévoilé en fin de semaine dernière...
Depuis l'émergence des grands modèles de langage (LLMs), certains ont été qualifiés d'“ouverts”, ce qui a pu prêter à confusion avec le terme “open so...
Lors de l’événement annuel TechXchange d’IBM, la société a annoncé la sortie de Granite 3.0, la dernière version de sa famille de modèles de langage (...
À l'occasion du premier anniversaire du modèle Mistral 7B, Mistral AI a présenté hier une nouvelle famille de modèles, qu'il appelle "Les Ministraux"...
Lors de l'événement Advancing AI 2024, le 10 octobre dernier, Lisa SU a dévoilé les dernières solutions d'AMD conçues pour répondre aux besoins de l'I...
À l’occasion du Sommet de la Francophonie, que la France a accueilli les 4 et 5 octobre derniers, le ministère de la Culture et la Direction intermini...
Meta a dévoilé hier, lors de sa conférence annuelle Meta Connect, la dernière itération de sa famille Llama 3, Llama 3.2. Celle-ci se compose de quatr...
Le 5 septembre dernier, Matt Shumer, PDG d'Hyperside (OthersideAI), a dévoilé Reflection 70B sur X, le présentant comme le LLM open source le plus per...
Les modèles de langage de petite taille (SLM) sont une alternative intéressante aux LLMs pour les entreprises qui peuvent les exploiter à moindre coût...