Mistral AI wprowadza Mistral Small 3.1: nowy standard dla open source AI?

30 stycznia Mistral AI, francuski jednorożec w dziedzinie GenAI, wprowadził Small 3, LLM o 24 miliardach parametrów, udowadniając, że aby być wydajnym, LLM nie wymaga astronomicznej liczby parametrów. Jego następca, Small 3.1, zachowuje kompaktową architekturę, wprowadzając jednocześnie znaczące ulepszenia w zakresie wydajności, zrozumienia multimodalnego i zarządzania długimi kontekstami, przewyższając modele takie jak Gemma 3-it 27B od Google i GPT-4o Mini od OpenAI.

Podobnie jak jego poprzednik, Small 3.1 zawiera 24 miliardy parametrów i może być wdrożony na dostępnych konfiguracjach sprzętowych, takich jak PC z jednym GPU RTX 4090 lub Mac z 32 GB pamięci RAM, co pozwala firmom zachować kontrolę nad danymi wrażliwymi bez polegania na scentralizowanej infrastrukturze chmurowej. Szybkość inferencji jest taka sama: 150 tokenów na sekundę, zapewniając minimalną latencję dla aplikacji wymagających natychmiastowych odpowiedzi. Wierny swojemu zobowiązaniu do open source, Mistral AI oferuje oba modele na licencji Apache 2.0, umożliwiając społeczności ich używanie, dostosowywanie i wdrażanie do różnych zastosowań.

Źródło: Mistral AI

Optymalizacja wydajności

Chociaż Small 3.1 opiera się na Small 3, jedną z głównych innowacji jest rozszerzenie okna kontekstowego z 32 000 do 128 000 tokenów, co jest kluczowe dla zadań wymagających rozumowania na długich sekwencjach tekstu. Podczas gdy Mistral Small 3 koncentrował się głównie na tekście, wersja 3.1 poprawia interpretację obrazów i dokumentów, co stawia go korzystnie w porównaniu z niewielkimi modelami własnościowymi i otwiera drogę do różnych zastosowań, od kontroli jakości przemysłowej po rozpoznawanie dokumentów i automatyczną analizę obrazów medycznych.

Mistral Small 3.1 jest dostępny w dwóch formatach:

Wersja instruowana, Mistral Small 3.1 Instruct, gotowa do użycia w zadaniach konwersacyjnych i zrozumienia języka;
Wersja wstępnie wytrenowana, Mistral Small 3.1 Base, idealna do fine-tuningu i specjalizacji w określonych dziedzinach (zdrowie, finanse, prawo itp.).

Wersja Instruct jest jednym z najlepszych modeli w swojej kategorii, przewyższając konkurencję w benchmarkach wymagających rozumowania i zrozumienia kontekstowego. Według benchmarków udostępnionych przez Mistral AI:

Small 3.1 Instruct wykazuje lepszą wydajność niż Gemma 3-it (27B) od Google w zadaniach tekstowych, multimodalnych i wielojęzycznych;
Przewyższa GPT-4o Mini od OpenAI w benchmarkach takich jak MMLU, HumanEval i LongBench v2, szczególnie dzięki rozszerzonemu oknu kontekstowemu do 128 000 tokenów;
Przewyższa także Claude-3.5 Haiku w złożonych zadaniach obejmujących długie konteksty i dane multimodalne;
Przewyższa Cohere Aya-Vision (32B) w benchmarkach multimodalnych takich jak ChartQA i DocVQA, wykazując zaawansowane zrozumienie danych wizualnych i tekstowych;
Small 3.1 wykazuje wysoką wydajność w wielojęzyczności, przewyższając swoich konkurentów w kategoriach takich jak języki europejskie i azjatyckie.

Mistral Small 3.1 można pobrać na platformie Huggingface i testować na platformie Mistral AI. Jest również dostępny na Google Cloud Vertex AI i wkrótce będzie dostępny na NVIDIA NIM.

Marie-Claude Benoit

Redakcja ActuIA — wiadomości, dane i analizy o sztucznej inteligencji dla decydentów.

Mistral AI wprowadza Mistral Small 3.1: nowy standard dla open source AI?

Optymalizacja wydajności

Anthropic zmuszona do zawieszenia Fable 5 i Mythos 5 po dyrektywie rządu USA

Siri AI: Gemini jako nauczyciel, nie jako silnik — czego nie powiedziało WWDC

Ten sam model, różne zabezpieczenia: co ujawnia premiera Claude Fable 5 i Mythos 5