Sorties de modèles d'IA : nouveaux modèles et benchmarks
À la une en ce moment
Qwen-3 Omni : Alibaba accélère dans la course à l’IA multimodale
Voxtral : Mistral AI entre sur le marché des modèles vocaux open source
OpenAI dévoile GPT-5 : plus rapide, plus fiable… mais pas infaillible
Chatterbox : une percée open source dans la synthèse vocale
OpenAI renoue avec l'ouverture avec deux modèles open-weight : GPT-OSS-120B et GPT-OSS-20B
Les intemporels
Mistral AI lance Mistral Small 3.1 : une nouvelle référence pour l'IA open source ?
Manus AI : la Chine ouvre l'ère des agents d'IA totalement autonomes...mais ne nous emballons pas
LightOn lance GTE-ModernColBERT : une avancée pour la recherche d'information augmentée grâce aux modèles multi-vecteurs
Anthropic dévoile Claude 4, ses agents optimisés pour la programmation et les tâches complexes
Meta AI présente DINOv3, sa nouvelle génération de modèles de vision par ordinateur avec apprentissage auto-supervisé
Meta s'impose dans l'IA multimodale avec les premières versions de Llama 4, Scout et Maverick
Alibaba lance Qwen3-235B-A22B-Instruct-2507 et rompt avec le raisonnement hybride
Alibaba a annoncé le 21 juillet dernier sur X la publication de la dernière mise à jour de son LLM Qwen 3 : Qwen3-235B-A22B-Instr...
Hugging Face propose Reachy Mini : un nouveau jalon dans la démocratisation de la robotique IA
La licorne franco-américaine Hugging Face annonce la disponibilité en pré-commande de Reachy Mini, "un robot expressif...
Sortie de Scikit-learn 1.7 : vers une expérience plus fluide et plus efficace
Scikit-learn, bibliothèque open source incontournable du ML en Python, continue d'évoluer avec la version 1.7 publiée le 5 juin...
Mistral AI défie DeepSeek avec Magistral, son premier modèle de raisonnement avancé
Fin janvier dernier, alors que tout le monde avait les yeux rivés sur DeepSeek et son modèle R1, Mistral AI introduisait discrète...
IA et robotique : avec SmolVLA, Hugging Face ouvre les modèles Vision-Langage-Action à la communauté
Hugging Face a introduit le 3 juin dernier SmolVLA, un modèle open-source de robotique Vision-Language-Action. Ce modèle compact qui ne...
DeepSeek-R1-0528 : la start-up chinoise continue à se mesurer aux géants américains avec une mise à jour de son modèle phare
Alors que les spéculations allaient bon train autour du prochain lancement de DeepSeek R2, c'est finalement une mise à jour du mod&egrav...
Watershed lance une version gratuite de sa base de données sur le climat
Watershed, plateforme spécialisée dans la durabilité d’entreprise, a annoncé ce 22 mai l’ouverture au public d...
OpenAI intègre GPT-Image-1 à son API Images
Lancé en mars 2025 dans ChatGPT, le modèle de génération d’images gpt-image-1 a connu un vif engouement : plus de 70...
IBM et l'ESA dévoilent TerraMind, un modèle d'observation de la Terre open source
Hier, à l’occasion du Jour de la Terre, IBM et l’Agence spatiale européenne (ESA) ont annoncé le lancement de Te...
OpenAI annonce le lancement de GPT-4.1 : accent sur le codage, le suivi des instructions et la gestion étendue du contexte
OpenAI vient de lancer trois nouveaux modèles au sein de son API : GPT-4.1, GPT-4.1 mini et GPT-4.1 nano. Ces modèles apportent des am&e...
Tencent lance le modèle de raisonnement Hunyuan-T1, rivalisant avec l'état de l'art
Tout juste un mois après avoir introduit son modèle de raisonnement TurboS, le conglomérat chinois Tencent dévoile celui &...
DecideOm franchit une étape stratégique avec l'acquisition d'EURODECISION
Le Groupe DecideOm, spécialiste des solutions data, annonce l'acquisition d'EURODECISION, une société experte en IA et math&eacut...
Isaac GR00T N1 : NVIDIA ouvre une nouvelle ère de la robotique humanoïde
Lors de son évènement GTC 2025, NVIDIA a dévoilé un portefeuille de technologies destiné à accél...
L'Indre et Loire mise sur l'IA pour lutter contre les feux de forêt
Des moyens naturels de prévention des incendies de forêt existent : débroussaillage, installation de coupe-feu, transplantation d'...
Baidu accélère dans la GenAI avec ERNIE 4.5 et ERNIE X1, deux modèles gratuits
Avec le lancement de R1, DeepSeek a non seulement créé une onde de choc dans la Silicon Valley mais intensifié la concurrence au...
IA et NLP : EuroBert, l'encodeur multilingue au service des langues européennes
Alors que les performances des LLMs font la une des médias, les modèles à encodeur restent des briques fondamentales du NLP et fi...
IBM dévoile Granite 3.2 : une IA multimodale aux capacités de raisonnement avancées
Avec Granite 3.0, IBM entendait fournir aux entreprises fournir une IA plus performante, efficace et accessible. Granite 3.2, lancé ce 27 f&eac...
OpenAI annonce la sortie de GPT-4.5 en version préliminaire dédiée à la recherche
OpenAI a annoncé la sortie d'une version préliminaire de GPT-4.5, une nouvelle évolution de son modèle GPT destinée...
Anthropic présente Claude 3.7 Sonnet, le 1er modèle de raisonnement hybride
Anthropic a annoncé lundi dernier Claude 3.7 Sonnet, qu’il présente comme son “modèle le plus intelligent à ce...
Kyutai dévoile Hibiki : une avancée majeure dans la traduction vocale simultanée
Hier, lors de la conférence scientifique internationale qui s’est tenue à l’Institut Polytechnique de Paris dans le cadre de la Semaine pour l’Action...
OpenEuroLLM, une initiative européenne pour une IA transparente et souveraine
Lancé ce lundi 3 février, OpenEuroLLM est un projet collaboratif réunissant 20 institutions de recherche, entreprises et centres de calcul de premier...
AI2 lance Tülu 3 405B : une avancée vers un nouveau standard de l'IA open source
Après avoir publié en décembre dernier sa famille de modèles OLMO 2, l’Allen Institute for Artificial Intelligence (AI2) poursuit son engagement enver...
Mistral Small 3 : la réponse open source française optimisée pour la latence aux modèles GenAI propriétaires
En fin de semaine dernière, alors que tout le monde avait les yeux rivés sur DeepSeek et son modèle R1, Mistral AI, licorne française de la GenAI, a l...
Les chercheurs de Hugging Face invitent la communauté open source à contribuer au projet Open-R1
Dix jours après son lancement, DeepSeek R1, qui a suscité l'émoi de la Silicon Valley et perturbé le marché de Wall Street, continue d'alimenter la un...
Alibaba : l'équipe Qwen annonce l'ajout de deux nouveaux modèles open source à Qwen2.5-1M
L’avancement des LLMs repose souvent sur leur capacité à traiter des volumes croissants de données dans des contextes plus longs et plus complexes. Av...
DeepSeek-R1, le modèle open source chinois venu déstabiliser NVIDIA et le marché de l'IA
Après avoir suscité l’attention en décembre dernier avec l'annonce de DeepSeek-V3, son modèle open source éponyme, la start-up chinoise DeepSeek est v...
Aleph Alpha dévoile une architecture LLM sans tokenizer : un tournant pour l'IA souveraine ?
Le 22 janvier dernier, lors du Forum de Davos, Aleph Alpha a annoncé une avancée significative dans le domaine des grands modèles de langage : une nou...
DeepSeek-V3 : quand l'open source chinois défie les LLMs américains de pointe
C'est sous la licence MIT, l'une des licences open source les plus permissives, que DeepSeek, acteur chinois de la GenAI, a publié ce jeudi 26 décembr...
o3, le dernier modèle d'OpenAI doté de capacités de raisonnement avancées
Le premier des "12 jours d'OpenAI" a été marqué par l'annonce de ChatGPT Pro et du modèle OpenAI o1, jusqu'alors en preview. Le 20 décembre dernier, l...
LightOn annonce ModernBERT, un modèle conçu pour les entreprises européennes
LightOn, l'un des fleurons français de l'IA, pionnier de l’IA générative pour les entreprises, annonce le lancement de ModernBERT, une version moderni...
Microsoft présente Phi-4, son dernier SLM optimisé pour le raisonnement complexe
Avec Phi-4, Microsoft démontre une nouvelle fois qu’il est possible de concilier performance et compacité. Ce SLM de 14 milliards de paramètres qui se...
Gemini 2.0 Flash, le modèle qui ouvre la voie aux agents d'IA de Google
Google a annoncé ce mercredi 11 décembre le lancement de Gemini 2.0 Flash, le premier modèle de la famille Gemini 2, conçue selon lui pour l'ère agent...
Willow : une étape majeure pour la feuille de route quantique de Google
Ce 9 décembre, l’équipe Quantum AI de Google a dévoilé Willow, une puce d’informatique quantique de pointe qui a démontré sa capacité non seulement à...
Llama 3.3 70B : Meta dévoile son dernier ajout à la famille Llama 3, un modèle particulièrement efficace
Alors que Meta prépare le lancement des premiers modèles Llama 4 pour le début de l'année prochaine, l'entreprise a dévoilé en fin de semaine dernière...
AgentLab, un framework open source pour le développement et l’évaluation des agents Web
Lancé par ServiceNow, AgentLab est un framework open source visant à faciliter le développement et l'évaluation d'agents Web. Son objectif principal e...
Pleias : des modèles de langages ouverts pour une IA éthique et transparente
Pleias, une start-up française, annonce le lancement de sa première famille de grands modèles de langage (LLM), définissant de nouvelles référence...
Amazon dévoile NOVA, sa première famille de modèles de fondation
Le PDG d’Amazon, Andy Jassy, a dévoilé lors de la conférence AWS re:Invent, sa première famille de modèles de fondation : NOVA. Celle-ci comprend plus...
Démission de Pat Gelsinger : Intel à la recherche d'un nouveau PDG
Intel a annoncé ce lundi 2 décembre que son PDG, Pat Gelsinger, avait démissionné du conseil d’administration et pris sa retraite. Malgré toutes ses t...
Fugatto, l'IA générative audio de NVIDIA
Les modèles text-to-audio ont fait parler d’eux avant que les modèles text-to-image ne leur volent la vedette. Les recherches pour améliorer les premi...
Quantum Heron 2 : IBM franchit une nouvelle étape vers l'avantage quantique
Lors de sa conférence inaugurale IBM Quantum Developer Conference, IBM a dévoilé la semaine dernière les dernières avancées de sa feuille de route ver...
X-Ray Recaps : Amazon lance une fonctionnalité de résumés intelligents pour enrichir l'expérience streaming
Amazon a lancé cette semaine la version bêta d'une nouvelle fonctionnalité basée sur la GenAI pour son service de streaming Prime Vidéo. Baptisée X-Ra...
OSAID : l'OSI publie sa définition de l'IA open source
A l’occasion de All Things Open 2024, l'un des événements les plus importants de l'industrie open source en Amérique du Nord, l'Open Source Initiative...
Anthropic annonce une version améliorée de Claude 3.5 Sonnet, une nouvelle fonctionnalité "Computer Use" et le nouveau modèle Claude 3.5 Haiku
En juin dernier, Anthropic lançait Claude 3.5 Sonnet, la première version de sa famille de modèles Claude 3.5. Mardi dernier, l'entreprise a présenté...
BitNet.cpp : le cadre open source de Microsoft pour réduire les coûts d'inférence des LLMs quantifiés à 1 bi
Microsoft a récemment publié BitNet.cpp, un cadre open-source conçu pour optimiser l’inférence des grands modèles de langage (LLM) quantifiés à 1 bit....
Mistral AI annonce la sortie de deux nouveaux modèles : Ministral 3B et Ministral 8B
À l'occasion du premier anniversaire du modèle Mistral 7B, Mistral AI a présenté hier une nouvelle famille de modèles, qu'il appelle "Les Ministraux"...
Llama 3.2 : Meta présente ses premiers modèles multimodaux à Meta Connect 2024
Meta a dévoilé hier, lors de sa conférence annuelle Meta Connect, la dernière itération de sa famille Llama 3, Llama 3.2. Celle-ci se compose de quatr...
Open source : Mistral AI annonce Pixtral 12B, son premier LLM multimodal
C’est sur X que Mistral AI a choisi d’annoncer Pixtral 12B, à l’aide d’un lien magnet Torrent. Ce premier LLM multimodal de la jeune licorne qui peut...
OpenAI o1 : une nouvelle génération de modèles d'IA pour résoudre des problèmes complexes
Ce jeudi 12 septembre, OpenAI a lancé OpenAI o1, une nouvelle série de modèles d’IA dotés de capacités de raisonnement avancées pour résoudre des prob...