Mistral AI يتحدى DeepSeek مع <span dir="ltr">Magistral</span>، نموذجه الأول للتفكير المتقدم

Mistral AI يتحدى DeepSeek مع Magistral، نموذجه الأول للتفكير المتقدم

TLDR : كشفت Mistral AI عن Magistral، أول نموذج تفكير واسع النطاق لها، مع توفره في نسختين: Magistral Small مفتوح المصدر وMagistral Medium الموجه للشركات.

في نهاية يناير الماضي، بينما كانت الأنظار موجهة نحو DeepSeek ونموذجها R1، كانت Mistral AI تقدم بهدوء Small 3، معلنة عن وصول قريب لنماذج Mistral بقدرات تفكير محسّنة. وهذا ما تحقق: بعد Small 3.1 الذي تم تقديمه في مارس الماضي، كشفت الشركة الناشئة عن Magistral، وهو أول نموذج تفكير على نطاق واسع، متاح في نسختين، واحدة open source "Magistral Small", والأخرى موجهة للشركات، "Magistral Medium".
مع Magistral، تتقدم Mistral AI خطوة جديدة. ليس في سباق الحجم، بل في السعي نحو ذكاء اصطناعي أكثر قابلية للفهم، وأكثر ارتباطًا بالتفكير البشري، والأهم، أكثر ملاءمة للواقع العملي للشركات. يعتمد النموذج الجديد على التقدم المحرز في Small 3.1، ويدعم العديد من اللغات، بما في ذلك الإنجليزية، الفرنسية، الإسبانية، الألمانية، الإيطالية، العربية، الروسية والصينية المبسطة. ينفذ سلسلة تفكير واضحة، خطوة بخطوة، يمكن متابعتها، استجوابها وتدقيقها بلغة المستخدم.

Magistral Small

نشرت Mistral AI Magistral Small تحت رخصة Apache 2.0، مما يسمح للمجتمع باستخدامها، تحسينها وتطبيقها لمختلف الحالات. يمكن تنزيله من https://huggingface.co/mistralai/Magistral-Small-2506.
تم تحسين هذا الإصدار من خلال fine-tuning بإشراف SFT بناءً على آثار التفكير التي يولدها Magistral Medium خلال تفاعلاته، ثم تم تعزيزها عبر التعلم المعزز RLHF لتحسين جودة وتماسك التفكير.
يحتوي، مثل نماذج Small 3، على 24 مليار من المعاملات، يمكن لـ Magistral Small، بعد تكميمه، أن يتم نشره على تكوينات أجهزة ميسورة، مثل PC يعمل بGPU RTX 4090 أو Mac بذاكرة RAM بسعة 32 جيجابايت، مما يسمح للمطورين بالحفاظ على السيطرة على بياناتهم الحساسة دون الاعتماد على بنية تحتية cloud مركزية.

Magistral Medium

هذا الإصدار هو النسخة الموجهة للشركات من Magistral. وهو أكثر قوة، متاح عبر منصة Le Chat من Mistral وعبر API الشركة. حاليًا يتم نشره على Amazon SageMaker، وسيكون متاحًا قريبًا على IBM WatsonX، Azure AI وGoogle Cloud Marketplace.
وفقًا للشركة الناشئة، فإن Flash Answers في Chat يسمح بتخفيض كبير في زمن الاستجابة. ووفقًا لها، يصل Magistral Medium إلى سرعة معالجة تصل حتى 10 أضعاف سرعة العديد من المنافسين.

أداء Magistral

قامت Mistral AI بمقارنة أداء Magistral مع أداء Mistral Medium والنماذج المنافسة لـ DeepSeek على مختلف معايير التفكير والفهم.
يتفوق Magistral-Medium على Mistral-Medium 3 في جميع المعايير، مما يثبت فعالية التفكير المحسن. على معايير AIME 2024، يصل Medium إلى درجة 73.6% مع 90% من التصويت بالأغلبية، مقابل 70.7% و83.3% لـ Small، نتائج تنافسية، رغم أن Deepseek لا يزال يحتفظ بتقدم على بعض المعايير.

حالات استخدام مستهدفة بدقة

تستهدف Mistral AI حالات استخدام حيث يكون التفكير خطوة بخطوة حاسمًا:
  • اتخاذ القرار الاستراتيجي
  • البحث القانوني
  • التخطيط المالي
  • تطوير البرمجيات على مراحل متعددة
  • الكتابة السردية وإنشاء المحتوى
  • التحليل التنظيمي والامتثال
تشير هذه التنوعات إلى رغبة في دخول كل من القطاعات المنظمة والمهن التقنية ذات الكثافة العالية من التفكير، دون التضحية بالانفتاح على الاستخدامات الأكثر "إبداعًا".