Tencent lancia il modello di ragionamento Hunyuan-T1, in competizione con lo stato dell'arte

Appena un mese dopo aver introdotto il suo modello di ragionamento TurboS, Tencent svela Hunyuan-T1, in grado di competere con DeepSeek R1 grazie a miglioramenti nel ragionamento e allineamento con le preferenze umane.

MAMarie-Claude Benoit ·26 mar 2025 ·Aggiornato il 19 apr 2025 ·2 min

Appena un mese dopo aver introdotto il suo modello di ragionamento TurboS, il conglomerato cinese Tencent svela colui che ha servito come base: Hunyuan-T1. Secondo quanto dichiarato, grazie a un post-allenamento su larga scala, la sua capacità di ragionamento è stata considerevolmente ampliata e allineata con le preferenze umane, permettendogli di competere con DeepSeek R1.

Già dal 2024, con V2, un modello di linguaggio performante proposto a un costo competitivo, DeepSeek ha scatenato una guerra dei prezzi nel mercato cinese dell'IA, costringendo Tencent e i suoi principali concorrenti, tra cui Zhipu AI, ByteDance, Alibaba, Baidu, a rivedere al ribasso i loro prezzi. Mentre la guerra tecnologica intorno all'IA tra Stati Uniti e Cina continua a intensificarsi sin dall'apparizione di R1, la concorrenza nell'Impero di Mezzo raggiunge anche nuovi picchi.

Un modello focalizzato sul ragionamento profondo

Dopo Baidu e Alibaba, è quindi il gigante Tencent che cerca di imporsi sul mercato cinese di fronte a DeepSeek.

T1 si basa sull'architettura Hybrid-Transformer-Mamba MoE, che come suggerisce il nome, combina i vantaggi dei Transformers e dei modelli Mamba, integrando esperti, il che consente di limitare il numero di parametri attivi. È particolarmente adatta per compiti che richiedono un trattamento di contesto lungo e grande precisione. T1 riduce così le perdite di contesto e ottimizza l'uso delle risorse informatiche, risultando al contempo due volte più veloce nel decodificare.

Grazie a un post-allenamento basato su RLHF (apprendimento per rinforzo con feedback umano), Tencent posiziona il suo modello come un concorrente serio nei confronti di OpenAI o1 e DeepSeek R1.

Secondo le valutazioni condivise da Tencent, Hunyuan-T1 mostra prestazioni:

Superiori o equivalenti su alcuni benchmark (MMLU-pro, CEval, AIME, Zebra Logic);
Particolarmente forti in matematica, con un punteggio impressionante di 96,2 su MATH-500;
Solide in ingegneria e codifica, dimostrando una capacità avanzata di risolvere problemi tecnici.

Benchmark forniti da Tencent

Marie-Claude Benoit

Redazione ActuIA — notizie, dati e analisi sull'intelligenza artificiale per i decisori.

Tencent lancia il modello di ragionamento Hunyuan-T1, in competizione con lo stato dell'arte

Un modello focalizzato sul ragionamento profondo

Anthropic costretta a sospendere Fable 5 e Mythos 5 dopo una direttiva del governo statunitense

JPMorgan e Goldman Sachs entrano in un round IA pre-revenue da 41 miliardi di dollari

OVHcloud-Gladia: il tassello vocale che mancava al cloud sovrano