Mistral AI挑战DeepSeek,推出首个高级推理模型Magistral

Mistral AI挑战DeepSeek,推出首个高级推理模型Magistral

TLDR : Mistral AI推出Magistral模型,挑战DeepSeek。Magistral有开源的Small和企业版的Medium版本,支持多语言,并在推理方面表现优异。

今年一月底,当所有人都在关注DeepSeek及其R1模型时,Mistral AI悄然推出了Small 3,预示着Mistral模型在推理能力上的提升。如今,这一承诺得以兑现:继三月份发布的Small 3.1后,这家独角兽公司刚刚揭开了Magistral的面纱,这是其首个大规模推理模型,有两个版本可供选择,一个是开源的“Magistral Small”,另一个是面向企业的“Magistral Medium”。
通过Magistral,Mistral AI迈出了新的一步,不是追求规模,而是追求更具解释性、更贴近人类推理且更适合企业运营现实的人工智能。新模型建立在Small 3.1的进步基础上,支持包括英语、法语、西班牙语、德语、意大利语、阿拉伯语、俄语和简体中文等多种语言。它实现了一种逐步明确的推理链,可以在用户的语言中被跟踪、询问和审核。

Magistral Small

Mistral AI根据Apache 2.0许可证发布了Magistral Small,让社区可以使用、优化和部署它以适应各种使用场景。它可以在 https://huggingface.co/mistralai/Magistral-Small-2506下载。
该版本通过监督微调(SFT)进行了优化,这基于Magistral Medium在交互中生成的推理轨迹,并通过强化学习(RLHF)进一步提高推理的质量和一致性。
与Small 3模型一样,Magistral Small拥有240亿参数,经过量化后可以在可访问的硬件配置上部署,例如单个RTX 4090 GPU的PC或具有32GB RAM的Mac,这使得开发者可以不依赖于集中式云基础设施而控制其敏感数据。

Magistral Medium

这个版本是Magistral的企业版。更强大,可通过Mistral的Le Chat平台和企业API访问。目前部署在Amazon SageMaker上,并将很快在IBM WatsonX、Azure AI和Google Cloud Marketplace上提供。
据这家独角兽公司称,Chat中的Flash Answers大幅降低了响应延迟。它表示,Magistral Medium的处理速度比许多竞争对手快10倍。

Magistral的性能

Mistral AI将Magistral的性能与Mistral Medium和DeepSeek的竞争模型在不同的推理和理解基准上进行了比较。
Magistral-Medium在所有基准上都超过了Mistral-Medium 3,证明了改进推理的有效性。在AIME 2024基准上,Medium获得了73.6%的得分,90%的多数投票,相比之下,Small的得分为70.7%和83.3%。尽管如此,Deepseek在某些基准上仍然保持领先。

明确的应用场景

Mistral AI瞄准了一些需要逐步推理的应用场景:
  • 战略决策
  • 法律研究
  • 财务预测
  • 多步骤软件开发
  • 叙事写作与内容生成
  • 合规分析
这种多样性表明它希望同时进入受监管行业和高认知密度的技术职业,同时不放弃对更具“创意”用途的开放性。