Mistral AI provoacă DeepSeek cu Magistral, primul său model de raționament avansat

În scurt : Mistral AI a lansat Magistral, un model de raționament avansat disponibil în variante open source și pentru întreprinderi, îmbunătățind explicația și adaptabilitatea pentru utilizatorii de afaceri.

La sfârșitul lunii ianuarie, în timp ce toți ochii erau ațintiți asupra DeepSeek și a modelului său R1, Mistral AI introducea discret Small 3, anunțând sosirea iminentă a modelelor Mistral cu capacități de raționament îmbunătățite. Acum este un fapt împlinit: după Small 3.1 prezentat în martie, unicornul tocmai a dezvăluit Magistral, primul său model de raționament la scară largă, disponibil în două variante, una open source „Magistral Small”, cealaltă orientată către întreprinderi, „Magistral Medium”.

Cu Magistral, Mistral AI face un nou pas. Nu în cursa pentru dimensiune, ci în căutarea unei IA mai explicabile, mai ancorate în raționamentul uman și, mai ales, mai adaptate la realitățile operaționale ale companiilor. Noul model se bazează pe progresele realizate de Small 3.1, suportă numeroase limbi, inclusiv engleza, franceza, spaniola, germana, italiana, araba, rusa și chineza simplificată. Acesta implementează un lanț de raționament explicit, pas cu pas, care poate fi urmărit, interogat și auditat în limba utilizatorului.

Magistral Small

Mistral AI a publicat Magistral Small sub licența Apache 2.0, permițând astfel comunității să-l utilizeze, să-l rafineze și să-l implementeze pentru diverse cazuri de utilizare. Este disponibil pentru descărcare pe https://huggingface.co/mistralai/Magistral-Small-2506.

Această versiune a fost optimizată printr-un fine-tuning supravegheat (SFT) bazat pe urmele de raționament generate de Magistral Medium în timpul interacțiunilor sale, apoi consolidată prin învățare (RLHF) pentru a rafina calitatea și coerența raționamentului.

Având, la fel ca modelele Small 3, 24 de miliarde de parametri, Magistral Small, odată cuantificat, poate fi implementat pe configurații hardware accesibile, cum ar fi un PC care funcționează cu un singur GPU RTX 4090 sau un Mac cu memorie RAM de 32 GB, permițând dezvoltatorilor să păstreze controlul asupra datelor lor sensibile fără a depinde de o infrastructură cloud centralizată.

Magistral Medium

Această variantă este versiunea pentru întreprinderi a Magistral. Mai puternic, este disponibil pe platforma Le Chat de Mistral și prin API-ul companiei. În prezent implementat pe Amazon SageMaker, va fi disponibil în curând pe IBM WatsonX, Azure AI și Google Cloud Marketplace.

Potrivit unicornului, Flash Answers în Le Chat permite reducerea drastică a latenței răspunsurilor. Potrivit acestuia, Magistral Medium atinge o viteză de procesare de până la 10 ori mai mare decât a multor concurenți.

Performanțele Magistral

Mistral AI a comparat performanțele Magistral cu cele ale Mistral Medium și ale modelelor concurente de la DeepSeek pe diferite benchmark-uri de raționament și înțelegere.

Magistral-Medium depășește Mistral-Medium 3 pe toate benchmark-urile, dovedind eficacitatea raționamentului îmbunătățit. Pe benchmark-urile AIME 2024, Medium atinge un scor de 73,6% cu 90% de vot majoritar, comparativ cu 70,7% și 83,3% pentru Small. Rezultate competitive, chiar dacă Deepseek menține un avans pe anumite benchmark-uri.

Cazuri de utilizare bine țintite

Mistral AI vizează cazuri de utilizare unde reflecția pas-cu-pas este determinantă:

Luarea deciziilor strategice
Cercetare juridică
Previziune financiară
Dezvoltare software multi-etape
Redactare narativă și generare de conținuturi
Analiză normativă și conformitate

Această diversitate sugerează o dorință de a pătrunde atât în sectoarele reglementate, cât și în meseriile tehnice cu densitate cognitivă ridicată, fără a sacrifica deschiderea către utilizări mai „creative”.

Tradus de Mistral AI défie DeepSeek avec Magistral, son premier modèle de raisonnement avancé