LLM multimodal

Home Tags LLM multimodal

Llama 3.2 : Meta présente ses premiers modèles multimodaux à Meta Connect 2024

26 septembre 2024

Meta a dévoilé hier, lors de sa conférence annuelle Meta Connect, la dernière itération de sa famille Llama 3, Llama 3.2. Celle-ci se compose de quatre modèles : les deux plus grands (11B et 90B), multimodaux, peuvent traiter les images, tandis que les deux plus légers (1B et 3B)...

Actualité

Open source : Mistral AI annonce Pixtral 12B, son premier LLM multimodal

Marie-Claude Benoit -

16 septembre 2024

C’est sur X que Mistral AI a choisi d’annoncer Pixtral 12B, à l’aide d’un lien magnet Torrent. Ce premier LLM multimodal de la jeune licorne qui peut traiter à la fois le texte et les images est disponible sur GitHub et Hugging Face. Il peut être téléchargé, affiné et utilisé sou...

Actualité

GILL, le LLM multimodal de l’Université Carnegie Mellon

Thierry Maubant -

17 janvier 2024

Des chercheurs du département d’apprentissage automatique (MLD) et de l’Institut des technologies linguistiques (LTI) de l’Université Carnegie Mellon ont développé en un modèle de langage multimodal à grande échelle (MLLM) nommé Generating Images With Large Language Models (GILL...