La 1 iulie 2026, guvernul portughez a prezentat oficial Amália, descris de creatorii săi drept primul mare model lingvistic (LLM) deschis dezvoltat în portugheza europeană. Evenimentul, organizat la centrul de inovație al Instituto Superior Técnico din Lisabona, marchează trecerea în open source a unui model a cărui versiune de bază fusese livrată în septembrie 2025. Finanțat prin Planul de redresare și reziliență (PRR), cu o investiție publică ridicată la 7 milioane de euro până în 2027, Amália ridică o întrebare care depășește cu mult Lisabona: cum reușește o țară cu zece milioane de locuitori să livreze un LLM suveran, în timp ce Franța, în pofida resurselor și a unui campion global, nu dispune încă de niciun model lingvistic public național?
Livrarea portugheză, pe scurt
Potrivit comunicatului oficial al guvernului portughez, care prezintă Amália drept primul model lingvistic deschis dezvoltat în portugheza europeană, proiectul este rezultatul unui consorțiu de universități și centre de cercetare portugheze, mobilizând peste șaizeci de cercetători. Coordonarea revine NOVA University of Lisbon, alături de Instituto Superior Técnico și de universitățile din Coimbra, Porto și Minho, cu sprijinul Foundation for Science and Technology (FCT). Modelul este disponibil în regim open source sub licență Apache 2.0 și a fost publicat pe platforma Hugging Face sub organizația amalia-llm.
Comunicatul descrie un model antrenat să înțeleagă text, documente, imagini și vorbire, adaptat la limbă, la contextul juridic și la realitatea națională a țării. În realitate, această multimodalitate este distribuită între mai multe modele distincte publicate de echipă (un model de text, un model vizual, o componentă de recunoaștere a vorbirii), și nu concentrată într-un singur sistem. Nucleul textual, un model cu 9 miliarde de parametri, nu a fost antrenat de la zero: se bazează pe modele de bază deja dezvoltate, inclusiv EuroLLM-9B, un model multilingv european deschis, precum și pe GlorIA, un model anterior în portugheză. Documentația tehnică a versiunii publicate arată că aceasta extinde pre-antrenarea EuroLLM pentru a acoperi mai bine cunoștințele în portugheza europeană și mărește fereastra de context la 32.000 de tokeni.
Această precizare explică bugetul. Adaptarea unui model de fundație existent costă de ordinul unui multiplu mai mic decât antrenarea unuia de la zero, operațiune care se ridică la zeci sau chiar sute de milioane pentru modelele de vârf. Cei 5,5 milioane de euro inițiali, la care se adaugă 1,5 milioane până în 2027, finanțează, așadar, o adaptare, îmbogățirea cu date, adăugarea capabilităților multimodale și activitatea de inginerie a mai multor zeci de persoane, pe o infrastructură europeană de calcul larg partajată. Tocmai acest lucru face operațiunea sustenabilă pentru un buget public modest.
O metodă deja validată în alte părți ale Europei
Cazul portughez aplică o rețetă deja bine identificată în Europa: plecarea de la o bază deschisă existentă, adaptarea ei la o limbă și la un context național, utilizarea supercalculatoarelor publice europene din programul EuroHPC și publicarea rezultatului în open source. Țara Bascilor a urmat aceeași cale cu Latxa, o adaptare a Llama 2 la euskara, susținută de un centru universitar. Spania a mers mai departe cu ALIA, un model de 40 de miliarde de parametri antrenat la Barcelona Supercomputing Center, în timp ce Germania a livrat la sfârșitul lui 2024 Teuken-7B, rezultatul consorțiului public OpenGPT-X, finanțat cu aproximativ 14 milioane de euro de Ministerul Federal al Economiei.
Aceste inițiative împărtășesc mai degrabă o arhitectură instituțională decât o performanță: un consorțiu universitar, finanțare publică direcționată, o bază și o capacitate de calcul europene comune. La nivelul Uniunii, proiectul OpenEuroLLM, lansat în februarie 2025 și reunind circa douăzeci de organizații, urmărește o familie de modele care să acopere toate limbile oficiale; acesta a obținut acces strategic la mai multe supercalculatoare EuroHPC. Suveranitatea lingvistică europeană se construiește, astfel, prin componente naționale sprijinite de o infrastructură comună, și nu printr-un singur model continental.
Contrastul francez
Exact din această perspectivă cazul francez devine relevant. Franța are un campion de talie mondială, Mistral AI, a cărei rundă C a evaluat compania la aproximativ 11,7 miliarde de euro în septembrie 2025. Însă Mistral este o companie privată care publică modele cu greutăți deschise, fără a fi un model public finanțat și guvernat de autoritățile publice. La nivel de stat, instrumentul cel mai apropiat se numește Albert, dezvoltat de Direction interministérielle du numérique: o infrastructură suverană care agregă și servește modele deschise terțe, inclusiv cele de la Meta și Mistral, pe serverele statului, și nu un model lingvistic antrenat din fonduri publice.
Franța are însă un precedent important: BLOOM, un mare model multilingv cu 176 de miliarde de parametri, antrenat în vara lui 2022 pe supercalculatorul public Jean Zay, în cadrul proiectului internațional BigScience coordonat de Hugging Face. Totuși, BLOOM a rămas un efort colectiv internațional, fără vocația unui model național dedicat limbii franceze. De atunci, dezbaterea hexagonală despre suveranitate a fost intensă (summitul de la Paris din februarie 2025, anunțurile de investiții, a treia etapă a strategiei naționale), fără să conducă la echivalentul sobru și țintit pe care îl reprezintă Amália: un model public, deschis, adaptat limbii naționale, livrat la prețul unui proiect de cercetare.
Limitele reușitei portugheze
Totuși, această reușită are și limitele ei. Amália rămâne o adaptare a unei baze existente, cu anvergura unui LLM de 9 miliarde de parametri, departe de sistemele de vârf din SUA sau China. Unele elemente preluate frecvent în presă merită, de altfel, o anumită prudență: prezentarea lui Amália ca o „alternativă la giganții americani” ține mai degrabă de încadrarea mediatică decât de discursul guvernamental, care vorbește, în schimb, despre suveranitate și transparență.
Esențialul rămâne însă: o țară mică a demonstrat că un LLM suveran, deschis și adaptat limbii sale poate fi obținut printr-un consorțiu universitar, o alocare de fonduri europene și acces la o infrastructură de calcul partajată. Demonstrația, repetată de la Țara Bascilor până în Germania, pune Franța în fața unei întrebări foarte concrete. Supercalculatorul Jean Zay a antrenat deja BLOOM, EuroLLM este disponibil sub licență deschisă, iar Portugalia tocmai a evaluat operațiunea la 7 milioane de euro: toate ingredientele pentru un model public național sunt deja pe masă.
