Tencent lance le modèle de raisonnement Hunyuan-T1, rivalisant avec l'état de l'art

Tencent a dévoilé Hunyuan-T1, un grand modèle axé sur le raisonnement reposant sur l'architecture Hybrid-Transformer-Mamba MoE et un post-entraînement RLHF. Selon Tencent, T1 obtient des résultats comparables ou supérieurs sur plusieurs benchmarks (notamment 96,2 sur MATH-500) et vise à concurrencer DeepSeek R1 et OpenAI dans un marché chinois marqué par une forte pression sur les prix.

MAMarie-Claude Benoit ·26 mars 2025 ·Mis à jour le 19 juin 2026 ·2 min

Tout juste un mois après avoir introduit son modèle de raisonnement TurboS, le conglomérat chinois Tencent dévoile celui à qui il a servi de base : Hunyuan-T1. Selon lui, grâce à un post-entraînement à grande échelle, sa capacité de raisonnement a été considérablement élargie et alignée sur les préférences humaines, ce qui lui permet de rivaliser avec DeepSeek R1.

Dès 2024, avec V2, un modèle de langage performant proposé à un coût compétitif, DeepSeek a déclenché une guerre des prix sur le marché chinois de l'IA et amené Tencent et ses principaux concurrents dont Zhipu AI, ByteDance, Alibaba, Baidu, à revoir leurs prix à la baisse. Alors que la guerre technologique autour de l'IA entre les Etats-Unis et la Chine continue de s'intensifier depuis l'apparition de R1, la concurrence dans l'Empire du Milieu atteint également de nouveaux sommets.

Un modèle axé sur le raisonnement profond

Après Baidu et Alibaba, c'est donc le géant Tencent qui tente de s'imposer sur le marché chinois face à DeepSeek.

T1 s'appuie sur l’architecture Hybrid-Transformer-Mamba MoE, qui comme son nom l'indique, combine les avantages des Transformers et des modèles Mamba, tout en intégrant des experts, ce qui permet de limiter le nombre de paramètres actifs. Elle est particulièrement adaptée aux tâches nécessitant un traitement de contexte long et une grande précision. T1 réduit ainsi les pertes de contexte et optimise l'utilisation des ressources informatiques, tout en étant deux fois plus rapide dans le décodage.

Grâce à un post-entraînement basé sur le RLHF (apprentissage par renforcement avec retour humain), Tencent positionne son modèle comme un concurrent sérieux face à OpenAI o1 et DeepSeek R1.

Selon les évaluations partagées par Tencent, Hunyuan-T1 affiche des performances :

Supérieures ou équivalentes sur certains benchmarks (MMLU-pro, CEval, AIME, Zebra Logic) ;
Particulièrement fortes en mathématiques, avec un score impressionnant de 96,2 sur MATH-500 ;
Solides en ingénierie et codage, démontrant une capacité avancée à résoudre des problèmes techniques.

Benchmarks fournis par Tencent

Marie-Claude Benoit

Rédaction ActuIA — actualités, données et analyses sur l'intelligence artificielle pour les décideurs.

Tencent lance le modèle de raisonnement Hunyuan-T1, rivalisant avec l'état de l'art

Un modèle axé sur le raisonnement profond

DeepSeek-R1-0528 : la start-up chinoise continue à se mesurer aux géants américains avec une mise à jour de son modèle phare

DeepSeek-R1, le modèle open source chinois venu déstabiliser NVIDIA et le marché de l'IA

Alibaba lance Qwen3-235B-A22B-Instruct-2507 et rompt avec le raisonnement hybride