Podczas gdy Francja debatuje o suwerenności AI, Portugalia dostarczyła ją za 7 mln euro

1 lipca 2026 r. rząd Portugalii oficjalnie zaprezentował Amália, określany przez twórców jako pierwszy otwarty duży model językowy (LLM) opracowany w europejskim portugalskim. Wydarzenie, zorganizowane w centrum innowacji Instituto Superior Técnico w Lizbonie, oznacza przejście do open source modelu, którego wersja bazowa została dostarczona we wrześniu 2025 r. Finansowany z Planu Odbudowy i Odporności (PRR), przy publicznej inwestycji sięgającej 7 mln euro do 2027 r., Amália stawia pytanie, które wykracza daleko poza Lizbonę: jak kraj liczący dziesięć milionów mieszkańców dostarcza suwerenny LLM, gdy Francja — mimo większych zasobów i globalnego lidera — nadal nie ma publicznego, narodowego modelu językowego?

Portugalska realizacja w szczegółach

Zgodnie z oficjalnym komunikatem rządu Portugalii, który przedstawia Amália jako pierwszy otwarty model językowy opracowany w europejskim portugalskim, projekt jest efektem pracy konsorcjum portugalskich uniwersytetów i ośrodków badawczych, angażującego ponad sześćdziesięciu badaczy. Koordynację prowadzi NOVA University Lisbon, wspólnie z Instituto Superior Técnico oraz uniwersytetami w Coimbra, Porto i Minho, przy wsparciu Fundacji Nauki i Technologii (FCT). Model został udostępniony jako open source na licencji Apache 2.0 i opublikowany na platformie Hugging Face w organizacji amalia-llm.

Komunikat opisuje model trenowany do rozumienia tekstu, dokumentów, obrazów i mowy, a także dostosowany do języka, kontekstu prawnego i krajowej rzeczywistości Portugalii. W praktyce ta multimodalność jest rozłożona na kilka odrębnych modeli opublikowanych przez zespół (model tekstowy, model wizyjny, komponent rozpoznawania mowy), a nie skupiona w jednym systemie. Rdzeń tekstowy, model o 9 miliardach parametrów, nie został wytrenowany od zera: opiera się na już istniejących modelach bazowych, w tym EuroLLM-9B, otwartym europejskim modelu wielojęzycznym, oraz na GlorIA, wcześniejszym modelu dla języka portugalskiego. Dokumentacja techniczna opublikowanej wersji wskazuje, że projekt rozwija pre-trening EuroLLM, aby lepiej pokryć wiedzę w europejskim portugalskim, oraz rozszerza okno kontekstu do 32 000 tokenów.

Ta precyzja wyjaśnia budżet. Adaptacja istniejącego modelu bazowego kosztuje rząd wielkości mniej niż trenowanie modelu od podstaw, co przy systemach czołówki oznacza wydatki liczone w dziesiątkach, a nawet setkach milionów. Początkowe 5,5 mln euro, uzupełnione o dodatkowe 1,5 mln euro do 2027 r., finansują więc dostosowanie, wzbogacenie danych, dodanie funkcji multimodalnych i inżynierię realizowaną przez kilkadziesiąt osób, na europejskiej infrastrukturze obliczeniowej w dużej mierze współdzielonej. Właśnie to sprawia, że przedsięwzięcie jest realne przy skromnym budżecie publicznym.

Metoda sprawdzona już w innych krajach Europy

Portugalski przypadek wpisuje się w coraz lepiej rozpoznawalny europejski schemat: rozpocząć od istniejącego otwartego fundamentu, dostosować go do języka i kontekstu krajowego, wykorzystać publiczne europejskie superkomputery w ramach programu EuroHPC i opublikować rezultat jako open source. Kraj Basków obrał podobną drogę z Latxa, czyli adaptacją Llama 2 do języka euskara, realizowaną przez ośrodek akademicki. Hiszpania poszła dalej z ALIA, modelem o 40 miliardach parametrów trenowanym w Barcelona Supercomputing Center, podczas gdy Niemcy pod koniec 2024 r. dostarczyły Teuken-7B, efekt publicznego konsorcjum OpenGPT-X finansowanego kwotą około 14 mln euro przez federalne Ministerstwo Gospodarki.

Wspólnym mianownikiem tych inicjatyw jest bardziej architektura instytucjonalna niż sama wydajność: konsorcjum uniwersyteckie, ukierunkowane finansowanie publiczne oraz wspólna europejska baza obliczeniowa i modelowa. W skali Unii projekt OpenEuroLLM, uruchomiony w lutym 2025 r. i skupiający około dwudziestu organizacji, ma na celu stworzenie rodziny modeli obejmujących wszystkie języki urzędowe; uzyskał też strategiczny dostęp do kilku superkomputerów EuroHPC. Europejska suwerenność językowa budowana jest więc z narodowych modułów osadzonych we wspólnej infrastrukturze, a nie przez jeden kontynentalny model.

Francuski kontrast

Na tym tle przypadek Francji wyraźnie kontrastuje. Kraj ten ma lidera światowej klasy, Mistral AI, którego runda C wyceniła spółkę na około 11,7 mld euro we wrześniu 2025 r. Jednak Mistral to podmiot prywatny, publikujący modele z otwartymi wagami, ale nie będący publicznym modelem finansowanym i zarządzanym przez państwo. Po stronie administracji najbliższym odpowiednikiem jest Albert, rozwijany przez Direction interministérielle du numérique: suwerenna infrastruktura, która agreguje i udostępnia modele open source stron trzecich — w tym od Meta i Mistral — na serwerach państwowych, a nie model językowy wytrenowany ze środków publicznych.

Francja ma jednak ważny precedens: BLOOM, duży wielojęzyczny model o 176 miliardach parametrów, wytrenowany latem 2022 r. na publicznym superkomputerze Jean Zay w ramach międzynarodowego projektu BigScience koordynowanego przez Hugging Face. BLOOM pozostawał jednak wysiłkiem międzynarodowym, bez ambicji stworzenia dedykowanego modelu narodowego dla języka francuskiego. Od tego czasu francuska debata o suwerenności była bardzo intensywna (szczyt w Paryżu w lutym 2025 r., zapowiedzi inwestycyjne, trzeci etap strategii narodowej), ale nie doprowadziła do równie oszczędnego i precyzyjnego odpowiednika Amália: publicznego, otwartego modelu dostosowanego do języka narodowego i dostarczonego w cenie projektu badawczego.

Ograniczenia portugalskiego sukcesu

Ten sukces ma jednak swoje ograniczenia. Amália pozostaje adaptacją istniejącego fundamentu, a jego skala odpowiada LLM-owi o 9 miliardach parametrów, daleko od czołowych systemów amerykańskich czy chińskich. Warto też zachować ostrożność wobec niektórych elementów często powielanych w mediach: przedstawianie Amália jako „alternatywy dla amerykańskich gigantów” wynika raczej z narracji medialnej niż z przekazu rządu, który mówi o suwerenności i transparentności.

Najważniejsze pozostaje coś innego: małe państwo pokazało, że suwerenny, otwarty LLM dostosowany do własnego języka można zrealizować przy pomocy konsorcjum akademickiego, ukierunkowania funduszy europejskich i dostępu do współdzielonej infrastruktury obliczeniowej. Demonstracja ta, powielana od Kraju Basków po Niemcy, stawia Francję przed bardzo konkretnym pytaniem. Superkomputer Jean Zay już trenował BLOOM, EuroLLM jest dostępny na otwartej licencji, a Portugalia właśnie wyceniła całe przedsięwzięcie na 7 mln euro: wszystkie składniki publicznego modelu narodowego są na stole.

Stephane Nachez

Redakcja ActuIA — wiadomości, dane i analizy o sztucznej inteligencji dla decydentów.