1 Temmuz 2026’da Portekiz hükümeti, geliştiricilerine göre Avrupa Portekizcesiyle geliştirilen ilk açık büyük dil modeli (LLM) olan Amália’yı resmen tanıttı. Lizbon’daki Instituto Superior Técnico’nun inovasyon merkezinde düzenlenen etkinlik, temel sürümü Eylül 2025’te teslim edilmiş bir modelin açık kodlu hale gelmesini işaret ediyor. PRR (Plan de relance et de résilience) kapsamında finanse edilen ve 2027’ye kadar kamu yatırımı 7 milyon avroya ulaşacak olan Amália, Lizbon’un çok ötesinde yankı uyandıran bir soruyu gündeme getiriyor: On milyon nüfuslu bir ülke nasıl egemen bir LLM sunabiliyor da, Fransa, tüm imkânlarına ve küresel bir şampiyona sahip olmasına rağmen, hâlâ ulusal bir kamu dil modeline sahip değil?
Portekiz teslimatının ayrıntıları
Portekiz hükümetinin resmî açıklamasına göre, Amália Avrupa Portekizcesiyle geliştirilen ilk açık dil modeli olarak sunuluyor ve proje, altmıştan fazla araştırmacıyı harekete geçiren Portekizli üniversiteler ile araştırma merkezlerinden oluşan bir konsorsiyumun ürünü. Koordinasyon, Instituto Superior Técnico ve Coimbra, Porto ile Minho üniversitelerinin desteğiyle NOVA University de Lisboa tarafından yürütülüyor; ayrıca Fundação para a Ciência e a Tecnologia (FCT) de projeye katkı sağlıyor. Model, Apache 2.0 lisansı altında açık kaynak olarak sunuluyor ve Hugging Face platformunda amalia-llm organizasyonu altında yayımlandı.
Açıklamada, metinleri, belgeleri, görüntüleri ve konuşmayı anlayacak şekilde eğitilmiş; ülkenin diline, hukukî bağlamına ve ulusal gerçekliğine uyarlanmış bir modelden söz ediliyor. Ancak bu çok modluluk, aslında ekip tarafından yayımlanan birkaç ayrı modele dağıtılmış durumda (bir metin modeli, bir görsel model, bir konuşma tanıma bileşeni) ve tek bir sistemde toplanmış değil. 9 milyar parametreli metin çekirdeği sıfırdan eğitilmedi: EuroLLM-9B gibi daha önce geliştirilmiş temel modellere ve ayrıca Portekizce bir önceki model olan GlorIA’ya dayanıyor. Yayımlanan sürümün teknik dokümantasyonu, Avrupa Portekizcesindeki bilgileri daha iyi kapsamak için EuroLLM’nin ön-eğitimini genişlettiğini ve bağlam penceresini 32.000 token’a çıkardığını belirtiyor.
Bu ayrıntı bütçeyi de açıklıyor. Mevcut bir temel modeli uyarlamak, bir modeli baştan sona eğitmeye kıyasla kat kat daha ucuzdur; sıfırdan eğitim, en ileri modeller için onlarca, hatta yüz milyonlarca avroyu bulabilir. İlk 5,5 milyon avroya ek olarak 2027’ye kadar sağlanacak 1,5 milyon avro; bu nedenle bir adaptasyonu, veri zenginleştirmesini, çok modlu yeteneklerin eklenmesini ve onlarca kişiden oluşan bir mühendislik sürecini, büyük ölçüde ortak kullanılan Avrupa hesaplama altyapısı üzerinde finanse ediyor. Tam da bu nedenle operasyon, mütevazı bir kamu bütçesi için sürdürülebilir hale geliyor.
Avrupa’nın başka yerlerinde zaten denenmiş bir yöntem
Portekiz vakası, Avrupa’da artık net biçimde tanımlanmış bir reçeteyi uyguluyor: mevcut açık bir temelden yola çıkmak, bunu ulusal bir dil ve bağlama uyarlamak, EuroHPC programının kamuya ait Avrupa süper bilgisayarlarından yararlanmak ve sonucu açık kaynak olarak yayımlamak. Bask Bölgesi de aynı yolu izleyerek, bir üniversite merkezi tarafından yürütülen ve Llama 2’nin euskara uyarlaması olan Latxa’yı geliştirdi. İspanya ise bunu daha da ileri taşıyarak, Barcelona Supercomputing Center’da eğitilen 40 milyar parametreli ALIA modelini ortaya koydu; Almanya ise 2024’ün sonunda, Federal Ekonomi Bakanlığı tarafından yaklaşık 14 milyon avro ile finanse edilen kamu konsorsiyumu OpenGPT-X’in ürünü Teuken-7B’yi teslim etti.
Bu girişimler performanstan çok kurumsal bir mimariyi ortaklaşıyor: üniversite konsorsiyumu, hedefe yönelik kamu finansmanı, paylaşılan Avrupa temeli ve ortak hesaplama gücü. Birlik ölçeğinde, Şubat 2025’te başlatılan ve yaklaşık yirmi kuruluşu bir araya getiren OpenEuroLLM projesi, tüm resmî dilleri kapsayan bir model ailesi hedefliyor; proje, birçok EuroHPC süper bilgisayarına stratejik erişim de elde etti. Böylece Avrupa dil egemenliği, tek bir kıtasal model yerine, ortak bir altyapıya dayanan ulusal yapı taşlarıyla inşa ediliyor.
Fransa ile karşılaştırma
Fransız örneği tam da bu noktada dikkat çekiyor. Fransa’nın küresel ölçekte bir şampiyonu var: Eylül 2025’teki C serisiyle şirket değerlemesi yaklaşık 11,7 milyar avroya ulaşan Mistral AI. Ancak Mistral, kamu gücü tarafından finanse edilip yönetilen bir kamu modeli değil; ağırlıkları açık yayımlanan özel bir şirket. Devlet tarafında ise en yakın araç Albert: Dijital İşler Genel Müdürlüğü (Direction interministérielle du numérique) tarafından geliştirilen bir egemen altyapı; bu altyapı, Meta ve Mistral’in modelleri dâhil üçüncü taraf açık modelleri devlet sunucuları üzerinde bir araya getirip hizmete sunuyor, ancak kamu fonlarıyla eğitilmiş bir dil modeli değil.
Oysa Fransa’nın dikkat çekici bir öncülü var: BigScience projesi kapsamında, Hugging Face tarafından koordine edilen uluslararası bir çalışma olarak, 2022 yazında kamuya ait Jean Zay süper bilgisayarında eğitilen 176 milyar parametreli çok dilli büyük model BLOOM. Yine de BLOOM, Fransızcaya özel bir ulusal model olma amacı taşımayan uluslararası kolektif bir girişim olarak kaldı. O zamandan bu yana, Fransızca dünyasındaki egemenlik tartışmaları oldukça yoğun geçti (Şubat 2025 Paris zirvesi, yatırım duyuruları, ulusal stratejinin üçüncü aşaması), ancak bunlar, Amália’nın temsil ettiği ölçülü ve hedefli eşdeğere dönüşmedi: ulusal dile uyarlanmış, açık, kamuya ait bir model, bir araştırma projesi bedeliyle teslim edildi.
Portekiz başarısının sınırları
Yine de bu başarının sınırları var. Amália, mevcut bir temel modelin uyarlanması olmaya devam ediyor ve kapsamı 9 milyar parametreli bir LLM ile sınırlı; bu da onu Amerikan ya da Çinli ileri sistemlerin oldukça gerisinde bırakıyor. Ayrıca basında sıkça tekrarlanan bazı ifadelerde temkinli olmak gerekiyor: Amália’nın “Amerikan devlerine alternatif” olarak sunulması, hükümetin söyleminden çok medya çerçevesine ait; hükümet ise daha ziyade egemenlik ve şeffaflıktan söz ediyor.
Esas olan şu: küçük bir ülke, bir üniversite konsorsiyumu, Avrupa fonlarının hedefli kullanımı ve ortak bir hesaplama altyapısına erişimle egemen, açık ve kendi diline uyarlanmış bir LLM’in mümkün olduğunu gösterdi. Bask Bölgesi’nden Almanya’ya kadar tekrarlanan bu gösteri, Fransa’yı son derece somut bir soruyla karşı karşıya bırakıyor. Jean Zay süper bilgisayarı daha önce BLOOM’u eğitti, EuroLLM açık lisansla erişilebilir durumda ve Portekiz operasyonun maliyetini 7 milyon avro olarak hesapladı: ulusal bir kamu modelinin tüm bileşenleri masanın üzerinde duruyor.
