Mistral AI défie DeepSeek avec Magistral, son premier modèle de raisonnement avancé
Fin janvier dernier, alors que tout le monde avait les yeux rivés sur DeepSeek et son modèle R1, Mistral AI introduisait discrète...
DeepSeek, start-up chinoise créée en mai 2023 à Hangzhou, s'est rapidement imposée comme un acteur majeur dans le domaine de l'intelligence artificielle (IA) et plus spécifiquement des modèles de langage massifs (LLM). Filiale du fonds spéculatif High-Flyer, DeepSeek est dirigée par Liang Wenfeng et a pour ambition de rivaliser avec les géants américains de l'IA en proposant des solutions open source innovantes et compétitives.
DeepSeek se spécialise dans le développement de modèles de langage massifs capables de réaliser des tâches complexes grâce à des capacités de raisonnement avancées. Depuis son lancement, l'entreprise a introduit plusieurs modèles notables, notamment DeepSeek-V3, un modèle de 671 milliards de paramètres qui a été pré-entraîné sur un vaste ensemble de données et se distingue par sa performance et son coût d’entraînement drastiquement réduit. Ce modèle rivalise avec les meilleurs modèles américains, tels que GPT-4o ou Claude 3.5 Sonnet, malgré des ressources matérielles limitées.
En janvier 2025, DeepSeek a fait sensation avec le lancement de DeepSeek-R1, un modèle de raisonnement de première génération qui a perturbé l'écosystème technologique en raison de ses performances impressionnantes et de son coût d’entraînement réduit. Ce modèle a notamment été adopté rapidement par l'industrie automobile chinoise pour des applications d'assistance à la conduite et d'interaction améliorée entre conducteurs et véhicules.
DeepSeek continue de se mesurer aux géants technologiques avec des mises à jour régulières de ses modèles. En mai 2025, l'entreprise a lancé une mise à jour de son modèle DeepSeek-R1, baptisée DeepSeek-R1-0528, améliorant ainsi ses capacités de raisonnement, de logique, de mathématiques et de programmation. Cette mise à jour permet à DeepSeek de se rapprocher des performances des modèles phares d'OpenAI et de Google tout en renforçant la fiabilité de ses réponses grâce à une réduction significative du taux d'hallucination.
Parallèlement, DeepSeek a entamé une démarche de distillation de ses modèles vers des versions plus légères pour rendre ses solutions accessibles à un plus large public, notamment aux développeurs disposant de ressources matérielles limitées. Cette stratégie vise à démocratiser l'accès à des capacités de raisonnement avancées sans nécessiter une infrastructure coûteuse.
DeepSeek s'est imposée comme une alternative sérieuse aux solutions propriétaires américaines, notamment grâce à son approche open source qui favorise l'innovation collaborative. En publiant ses modèles sous licence MIT, l'entreprise permet à la communauté de chercheurs et développeurs d'accéder librement à ses technologies, stimulants ainsi l'innovation et l'évolution de l'écosystème de l'IA open source.
La start-up bénéficie également du soutien du gouvernement chinois, qui voit en elle un vecteur clé pour atteindre l'autosuffisance technologique face aux restrictions américaines sur les exportations de composants stratégiques. DeepSeek s'inscrit dans la stratégie nationale chinoise visant à devenir le leader mondial de l'IA d'ici 2030.
DeepSeek a récemment été au centre de l'attention avec la suspension temporaire de son chatbot en Corée du Sud en raison de préoccupations liées à la confidentialité des données. Bien que cela ait mis en lumière certains défis réglementaires, cela n'a pas freiné l'enthousiasme autour de ses technologies, notamment en Chine où le modèle DeepSeek-R1 a été massivement adopté dans des secteurs clés tels que la justice, la cybersécurité et l'administration publique.
Alors que les rumeurs s'intensifient autour du lancement imminent de DeepSeek-R2, l'entreprise semble bien positionnée pour continuer à défier les géants américains et à jouer un rôle central dans l'évolution de l'IA à l'échelle mondiale. Ce prochain modèle devrait offrir un support multilingue étendu et des capacités multimodales, ouvrant la voie à de nouvelles applications dans la création de contenu et l'analyse de données.
En conclusion, DeepSeek se distingue par sa capacité à innover rapidement et à proposer des solutions compétitives sur un marché dominé par des géants technologiques, renforçant ainsi la position de la Chine dans la course mondiale à l'intelligence artificielle.
18 articles liés à cet acteur
Fin janvier dernier, alors que tout le monde avait les yeux rivés sur DeepSeek et son modèle R1, Mistral AI introduisait discrète...
Alors que les spéculations allaient bon train autour du prochain lancement de DeepSeek R2, c'est finalement une mise à jour du mod&egrav...
Surfshark, spécialiste en cybersécurité, a récemment publié une mise à jour de son étude comparative...
OVHcloud annonce le lancement officiel de AI Endpoints, une nouvelle solution cloud serverless destinée à faciliter l’intég...
Alors que les restrictions américaines sur les exportations de composants stratégiques se durcissent, la Chine redouble d’efforts...
Sorti en janvier dernier, DeepSeek R1 a rapidement secoué la Silicon Valley et l'écosystème d'IA dont Nvidia, de par ses performa...
Ce 5 avril, Meta a dévoilé les deux premières versions de Llama 4 : Scout et Maverick. Ces modèles ouverts, conçus...
L’IAG (intelligence artificielle générale) est considérée comme le "graal" technologique par des entreprises comme O...
La start-up chinoise DeepSeek a lancé discrètement DeepSeek-V3-0324, une mise à jour de son modèle open source...
La licorne canadienne Cohere a récemment dévoilé “Command A”, la dernière version de son modèle phare....
Avec le lancement de R1, DeepSeek a non seulement créé une onde de choc dans la Silicon Valley mais intensifié la concurrence au...
Après le coup d’éclat de DeepSeek, la Chine crée une nouvelle onde de choc dans le monde de l’intelligence artificiel...