Mistral AI、初の高度な推論モデルMagistralでDeepSeekに挑戦

Mistral AI、初の高度な推論モデルMagistralでDeepSeekに挑戦

TLDR : Mistral AIは、新しい推論モデルMagistralを発表しました。これはオープンソースと企業向けの2つのバリエーションで提供され、企業の運用現実に適応したAIを目指しています。

1月下旬、全員がDeepSeekとそのモデルR1に注目している中、Mistral AIは密かにSmall 3を発表し、推論能力を強化したMistralモデルの到来を予告しました。それが実現しました。3月に発表されたSmall 3.1の後、ユニコーン企業は初の大規模推論モデルMagistralを発表しました。これはオープンソースの「Magistral Small」と企業向けの「Magistral Medium」の2つのバリエーションで提供されます。
Magistralによって、Mistral AIは新たな段階に進みます。規模の競争ではなく、より説明可能で、人間の推論に基づき、企業の運用現実に適応したAIの追求においてです。この新しいモデルはSmall 3.1の進歩に基づいており、英語、フランス語、スペイン語、ドイツ語、イタリア語、アラビア語、ロシア語、簡体字中国語を含む多くの言語をサポートしています。ユーザーの言語で追跡、質問、監査可能なステップバイステップの明確な推論チェーンを実装しています。

Magistral Small

Mistral AIはMagistral SmallをApache 2.0ライセンスのもとで公開し、コミュニティが様々な利用ケースに使用、調整、展開できるようにしています。これは https://huggingface.co/mistralai/Magistral-Small-2506からダウンロード可能です。
このバージョンは、Magistral Mediumが対話中に生成した推論トレースに基づく監督付きファインチューニング(SFT)と、その後の強化学習(RLHF)による推論の質と一貫性を向上させるために最適化されています。
Small 3モデルと同様に240億のパラメータを持つMagistral Smallは、量子化後、RTX 4090 GPUを搭載したPCや32GB RAMを搭載したMacなどの手頃なハードウェア構成で展開可能で、開発者がクラウドベースのインフラに依存せずに機密データを制御できます。

Magistral Medium

このバリエーションは、企業向けのMagistralです。より強力で、MistralのプラットフォームLe Chatおよび企業のAPIを通じて利用可能です。現在、Amazon SageMakerに展開されており、近くIBM WatsonX、Azure AI、Google Cloud Marketplaceでも利用可能になります。
ユニコーン企業によれば、Chat内のFlash Answersは応答の遅延を劇的に削減でき、Magistral Mediumは多くの競合他社に比べて最大10倍の処理速度を達成しています。

Magistralの性能

Mistral AIは、Magistralの性能をMistral MediumおよびDeepSeekの競合モデルと様々な推論と理解のベンチマークで比較しました。
Magistral-Mediumは、全てのベンチマークでMistral-Medium 3を上回り、改善された推論の効果を証明しました。AIME 2024のベンチマークでは、Mediumは73.6%のスコアと90%の多数決を達成し、Smallの70.7%および83.3%を上回りました。競争力のある結果ですが、DeepSeekはいくつかのベンチマークで依然として優位を保っています。

よくターゲットされた使用例

Mistral AIは、ステップバイステップの思考が決定的な使用例を目指しています:
  • 戦略的意思決定
  • 法務調査
  • 財務予測
  • 多段階のソフトウェア開発
  • 物語の執筆とコンテンツ生成
  • 規制とコンプライアンスの分析
この多様性は、規制されたセクターと高密度の認知的な技術職業の両方に浸透しつつ、より「クリエイティブ」な使用法への開放性を犠牲にしない意向を示唆しています。