Aleph Alpha
Créée en 2019, basée à Heidelberg en Allemagne, la start-up Aleph Alpha a été reconnue par l’indice technologique MAD 2021 (Machine Learning, AI and Data Landscape), comme la seule entreprise européenne d’IA à mener des activités de recherche, de développement et de conception d’intelligence artificielle générale (IAG) généralisable. Elle a récemment ouvert Alpha One, un centre de données d'IA commercial sur le GovTech Campus Germany. Son ambition est de faire de l’UE un acteur majeur dans le domaine de l’IA et de consolider sa souveraineté numérique. Aleph Alpha développe des modèles multimodaux originaux, notamment Luminous, combinant la vision par ordinateur avec le traitement du langage naturel (NLP) pour traiter, analyser et produire un large éventail de textes, présenté à l’International Supercomputing Conference (ISC) l'an passé. Ce modèle est basé sur la méthode MAGMA (Multimodal Augmentation of Generative Models through Adapter-based Finetuning) développée par la société. Jonas Andrulis, PDG et fondateur d'Aleph Alpha, déclare :Les deux partenaires ont présenté une variante clairsemée du chatbot commercial Luminous d’Aleph Alpha, au SC22 au Texas. Luminous Base Sparse n’utilise que 20% des FLOPs de traitement et 44% de la mémoire de son équivalent dense. D'autre part, ses paramètres de 2,6 milliards peuvent être entièrement conservés dans la mémoire sur puce ultra-rapide d’un IPU-POD Classic, optimisant ainsi les performances.« Toute la diversité linguistique et culturelle de l’Europe doit se refléter dans les applications modernes de l’IA, car c’est le seul moyen pour chaque pays européen, grand ou petit, de bénéficier du potentiel des nouvelles technologies de l’IA. Cela garantit que le meilleur de l’IA n’est pas réservé à quelques-uns, mais est disponible pour tous de manière égale. Avec LUMINOUS et MAGMA, nous faisons un grand pas dans cette direction. Pour aller de l’avant, nous voulons travailler avec des partenaires pour nous assurer qu’en Europe, nous prenons notre destin numérique en main. »
Réduction des paramètres
Des grands modèles de langage comme GPT-3 d’OpenAI ou Gopher de deepMind reposent sur plus de cent milliards de paramètres, les prochains en compteront encore plus, exigeant une puissance de calcul de plus en plus grande. La plupart utilisent actuellement des modèles denses, où une représentation et un calcul égaux sont donnés à tous les paramètres, qu’ils contribuent ou non au comportement du modèle. Aleph Alpha et Graphcore ont supprimé les 80 % de poids les moins pertinents et réentraîné le modèle Luminous Base Sparse en utilisant uniquement les poids importants. Ceux-ci sont représentés à l’aide du format Compressed Sparse Row (CSR).
Les FLOPS de calcul requis pour l’inférence sont tombés à 20 % du modèle dense, tandis que l’utilisation de la mémoire a été réduite à 44 %, car une capacité supplémentaire est nécessaire pour stocker les informations d’emplacement et de valeur pour les paramètres non nuls restants. Par ailleurs, le modèle obtenu a permis de baisser le besoin énergétique de 38 % par rapport au modèle dense.
