Наприкінці січня, коли всі зосередили увагу на DeepSeek і його моделі R1, Mistral AI тихо представила Small 3, оголосивши про майбутній вихід моделей Mistral з покращеними можливостями міркування. Це стало реальністю: після Small 3.1, представленої в березні минулого року, компанія-єдиноріг щойно презентувала Magistral, свою першу модель міркування у великому масштабі, доступну у двох варіантах: одна з відкритим вихідним кодом 'Magistral Small', інша орієнтована на бізнес, 'Magistral Medium'.
З Magistral, Mistral AI робить новий крок. Не в гонці за розміром, а в пошуку більш пояснюваного ШІ, більш заснованого на людському мисленні і, головне, краще адаптованого до операційних реалій компаній. Нова модель базується на досягненнях Small 3.1, підтримує численні мови, включаючи англійську, французьку, іспанську, німецьку, італійську, арабську, російську і спрощену китайську. Вона реалізує явний ланцюжок міркування, крок за кроком, який може бути відстежений, запитаний і перевірений на мові користувача.
Magistral Small
Mistral AI опублікувала Magistral Small за ліцензією Apache 2.0, що дозволяє спільноті його використовувати, покращувати і розгортати для різних випадків використання. Його можна завантажити з https://huggingface.co/mistralai/Magistral-Small-2506.
Ця версія була оптимізована завдяки супервізованому тонкому налаштуванню (SFT) на основі слідів міркування, згенерованих Magistral Medium під час його взаємодій, потім підсилена навчанням з підкріпленням (RLHF) для покращення якості та узгодженості міркувань.
Маючи, як і моделі Small 3, 24 мільярди параметрів, Magistral Small, після квантової обробки, може бути розгорнута на доступних апаратних налаштуваннях, таких як ПК з одним GPU RTX 4090 або Mac з 32 ГБ оперативної пам'яті, що дозволяє розробникам зберігати контроль над своїми конфіденційними даними без залежності від централізованої хмарної інфраструктури.
Magistral Medium
Цей варіант є бізнес-версією Magistral. Більш потужний, він доступний на платформі Le Chat de Mistral та через API компанії. Наразі розгорнутий на Amazon SageMaker, незабаром він буде доступний на IBM WatsonX, Azure AI і Google Cloud Marketplace.
За словами компанії-єдинорога, Flash Answers в Chat дозволяє значно зменшити затримку відповідей. За її словами, Magistral Medium досягає швидкості обробки до 10 разів вищої, ніж у багатьох конкурентів.
Продуктивність Magistral
Mistral AI порівняла продуктивність Magistral з Mistral Medium і конкурентними моделями DeepSeek на різних тестах міркування та розуміння.
Magistral-Medium перевершує Mistral-Medium 3 на всіх тестах, доводячи ефективність покращеного міркування. На тестах AIME 2024 Medium досягає результату 73,6% з 90% більшістю голосів, проти 70,7% і 83,3% для Small. Конкурентоспроможні результати, хоча Deepseek зберігає перевагу на деяких тестах.

Добре цільові випадки використання
Mistral AI орієнтується на випадки використання, де етапний підхід до мислення є вирішальним:
- Стратегічне прийняття рішень
- Юридичні дослідження
- Фінансове прогнозування
- Багатоступеневий розробка програмного забезпечення
- Наративне написання та генерація контенту
- Регуляторний аналіз та відповідність
Ця різноманітність свідчить про бажання проникнути як у регульовані сектори, так і у технічні професії з високою когнітивною щільністю, без шкоди для відкритості до більш "творчих" застосувань.