Mistral AI desafía a DeepSeek con Magistral, su primer modelo de razonamiento avanzado
Mistral AI ha lanzado Magistral, su primer modelo de razonamiento avanzado, con dos variantes: una de código abierto y otra orientada a empresas.
DeepSeek, start-up china creada en mayo de 2023 en Hangzhou, se ha consolidado rápidamente como un actor principal en el ámbito de la inteligencia artificial (IA) y más específicamente en los modelos de lenguaje masivos (LLM). Subsidiaria del fondo de cobertura High-Flyer, DeepSeek está dirigida por Liang Wenfeng y tiene como objetivo competir con los gigantes estadounidenses de la IA al ofrecer soluciones open source innovadoras y competitivas.
DeepSeek se especializa en el desarrollo de modelos de lenguaje masivos capaces de realizar tareas complejas gracias a sus capacidades de razonamiento avanzadas. Desde su lanzamiento, la empresa ha introducido varios modelos notables, en particular DeepSeek-V3, un modelo de 671 mil millones de parámetros que ha sido preentrenado en un amplio conjunto de datos y se destaca por su rendimiento y su costo de entrenamiento drásticamente reducido. Este modelo compite con los mejores modelos estadounidenses, como GPT-4o o Claude 3.5 Sonnet, a pesar de contar con recursos de hardware limitados.
En enero de 2025, DeepSeek causó sensación con el lanzamiento de DeepSeek-R1, un modelo de razonamiento de primera generación que perturbó el ecosistema tecnológico debido a su impresionante rendimiento y su costo de entrenamiento reducido. Este modelo fue adoptado rápidamente por la industria automotriz china para aplicaciones de asistencia a la conducción y mejora de la interacción entre conductores y vehículos.
DeepSeek sigue enfrentándose a los gigantes tecnológicos con actualizaciones regulares de sus modelos. En mayo de 2025, la empresa lanzó una actualización de su modelo DeepSeek-R1, llamada DeepSeek-R1-0528, mejorando así sus capacidades de razonamiento, lógica, matemáticas y programación. Esta actualización permite a DeepSeek acercarse al rendimiento de los modelos insignia de OpenAI y Google mientras refuerza la fiabilidad de sus respuestas gracias a una reducción significativa de la tasa de alucinaciones.
Paralelamente, DeepSeek ha iniciado un proceso de destilación de sus modelos hacia versiones más ligeras para hacer sus soluciones accesibles a un público más amplio, especialmente a los desarrolladores con recursos de hardware limitados. Esta estrategia busca democratizar el acceso a capacidades de razonamiento avanzadas sin requerir una infraestructura costosa.
DeepSeek se ha consolidado como una alternativa seria a las soluciones propietarias estadounidenses, especialmente gracias a su enfoque open source que favorece la innovación colaborativa. Al publicar sus modelos bajo licencia MIT, la empresa permite a la comunidad de investigadores y desarrolladores acceder libremente a sus tecnologías, estimulando así la innovación y la evolución del ecosistema de IA open source.
La start-up también cuenta con el apoyo del gobierno chino, que la ve como un vector clave para alcanzar la autosuficiencia tecnológica frente a las restricciones estadounidenses sobre la exportación de componentes estratégicos. DeepSeek forma parte de la estrategia nacional china para convertirse en el líder mundial de la IA para 2030.
DeepSeek ha estado recientemente en el centro de atención con la suspensión temporal de su chatbot en Corea del Sur debido a preocupaciones relacionadas con la privacidad de los datos. Aunque esto ha puesto de manifiesto algunos desafíos regulatorios, no ha frenado el entusiasmo en torno a sus tecnologías, especialmente en China, donde el modelo DeepSeek-R1 ha sido adoptado masivamente en sectores clave como la justicia, la ciberseguridad y la administración pública.
A medida que se intensifican los rumores sobre el lanzamiento inminente de DeepSeek-R2, la empresa parece estar bien posicionada para continuar desafiando a los gigantes estadounidenses y desempeñar un papel central en la evolución de la IA a nivel mundial. Este próximo modelo debería ofrecer un soporte multilingüe extendido y capacidades multimodales, abriendo el camino a nuevas aplicaciones en la creación de contenido y el análisis de datos.
En conclusión, DeepSeek se destaca por su capacidad para innovar rápidamente y ofrecer soluciones competitivas en un mercado dominado por gigantes tecnológicos, reforzando así la posición de China en la carrera mundial por la inteligencia artificial.
13 articles liés à cet acteur
Mistral AI ha lanzado Magistral, su primer modelo de razonamiento avanzado, con dos variantes: una de código abierto y otra orientada a empresas.
La start-up china DeepSeek ha actualizado su modelo R1, mejorando su rendimiento en razonamiento, lógica, matemáticas y programación. Esta actualizaci...
Meta AI es el asistente conversacional más intrusivo en cuanto a la recopilación de datos personales, superando a Google Gemini, según un estudio de S...
OVHcloud anuncia el lanzamiento oficial de AI Endpoints, una nueva solución cloud serverless destinada a facilitar la integración de modelos de inteli...
OVHcloud anuncia el lanzamiento de AI Endpoints, una solución cloud serverless para integrar modelos de IA en aplicaciones empresariales, ofreciendo m...
A medida que se endurecen las restricciones estadounidenses sobre las exportaciones de componentes estratégicos, China redobla sus esfuerzos para afir...
DeepSeek R1, lanzado en enero pasado, ha sido suspendido temporalmente en Corea del Sur debido a preocupaciones sobre la privacidad de datos. La inves...
Meta reveló las dos primeras versiones de Llama 4: Scout y Maverick, modelos abiertos y nativamente multimodales, diseñados para procesar texto, imáge...
La IAG (inteligencia artificial general) es considerada como el "grial" tecnológico por empresas como OpenAI o DeepSeek. Presentada como una oportunid...
La startup china DeepSeek ha lanzado discretamente DeepSeek-V3-0324, una actualización de su modelo open source epónimo. Esta nueva versión, cuyas cap...
La unicornio canadiense Cohere ha presentado recientemente “Command A”, la última versión de su modelo insignia. Diseñado específicamente para satisfa...
Con el lanzamiento de R1, DeepSeek no solo creó una onda de choque en Silicon Valley, sino que intensificó la competencia dentro del propio Imperio de...