Nuevo modelo

Tencent lanza el modelo de razonamiento Hunyuan-T1, rivalizando con el estado del arte

Justo un mes después de haber introducido su modelo de razonamiento TurboS, Tencent revela Hunyuan-T1, un competidor serio frente a DeepSeek R1.

MAMarie-Claude Benoit · · ·2 min
Tencent lanza el modelo de razonamiento Hunyuan-T1, rivalizando con el estado del arte
Índice
Justo un mes después de haber introducido su modelo de razonamiento TurboS, el conglomerado chino Tencent revela aquel para el que sirvió de base: Hunyuan-T1. Según ellos, gracias a un post-entrenamiento a gran escala, su capacidad de razonamiento se ha ampliado considerablemente y se ha alineado con las preferencias humanas, lo que le permite competir con DeepSeek R1.
 
Desde 2024, con V2, un modelo de lenguaje eficiente ofrecido a un costo competitivo, DeepSeek ha desencadenado una guerra de precios en el mercado chino de IA y ha llevado a Tencent y a sus principales competidores como Zhipu AI, ByteDance, Alibaba, Baidu, a revisar sus precios a la baja. Mientras que la guerra tecnológica en torno a la IA entre Estados Unidos y China continúa intensificándose desde la aparición de R1, la competencia en el Imperio del Medio también alcanza nuevos picos. 
 

Un modelo centrado en el razonamiento profundo

 
Después de Baidu y Alibaba, es el gigante Tencent quien intenta imponerse en el mercado chino frente a DeepSeek. 
 
T1 se basa en la arquitectura Hybrid-Transformer-Mamba MoE, que como su nombre indica, combina las ventajas de los Transformadores y los modelos Mamba, al tiempo que integra expertos, lo que permite limitar el número de parámetros activos. Está particularmente adaptado a las tareas que requieren un tratamiento de contexto largo y una gran precisión. T1 reduce así las pérdidas de contexto y optimiza el uso de los recursos informáticos, siendo además dos veces más rápido en el decodificado. 
 
Gracias a un post-entrenamiento basado en el RLHF (aprendizaje por refuerzo con retroalimentación humana), Tencent posiciona su modelo como un serio competidor frente a OpenAI o1 y DeepSeek R1.
 
Según las evaluaciones compartidas por Tencent, Hunyuan-T1 muestra un rendimiento:
  • Superior o equivalente en algunos benchmarks (MMLU-pro, CEval, AIME, Zebra Logic);
  • Particularmente fuerte en matemáticas, con un impresionante puntaje de 96,2 en MATH-500;
  • Sólido en ingeniería y codificación, demostrando una capacidad avanzada para resolver problemas técnicos.
 
Benchmarks proporcionados por Tencent
MA
Marie-Claude Benoit

Redacción de ActuIA — noticias, datos y análisis sobre inteligencia artificial para los responsables de decisiones.

Actores citados
TETencent
BYByteDance
ALAlibaba
OPOpenAI
BABaidu
ZHZhipu.ai
DEDeepSeek
El Semanal ActuIA

Suscripción confirmada, ¡hasta pronto!