신규 모델

프랑스가 AI 주권을 논의하는 동안, 포르투갈은 700만 유로로 자국 모델을 완성했다

2026년 7월 1일, 포르투갈은 유럽 포르투갈어로 개발된 최초의 오픈 대형 언어모델 Amália를 공개했다. 공공 자금 700만 유로로 완성된 이번 출시는, 공공 모델이 없는 프랑스가 민간 선두주자 Mistral에 의존하는 현실과 대비되며 국가별 디지털 주권 전략에 대한 질문을 던진다.

STStephane Nachez · ·4 min
프랑스가 AI 주권을 논의하는 동안, 포르투갈은 700만 유로로 자국 모델을 완성했다
Visuel d'illustration généré par IA - ActuIA
목차

2026년 7월 1일, 포르투갈 정부는 공식적으로 Amália를 공개했다. 개발진은 이를 유럽 포르투갈어로 구축된 최초의 오픈 대형 언어모델(LLM)이라고 소개했다. 리스본의 Instituto Superior Técnico 혁신센터에서 열린 이번 행사는, 2025년 9월 기본 버전이 먼저 공개된 뒤 코드 오픈으로 전환되는 분기점이 됐다. PRR(회복·복원 계획) 자금으로 지원되며 2027년까지 공공 투자액이 700만 유로에 달하는 Amália는 리스본을 넘어 더 넓은 질문을 던진다. 인구 1,000만 명 남짓한 나라가 어떻게 주권형 LLM을 내놓는 반면, 프랑스는 충분한 자원과 세계적 주자인 기업을 보유하고도 여전히 국가 차원의 공공 언어모델을 갖지 못하고 있는가?

포르투갈의 공개 성과를 들여다보다

포르투갈 정부의 공식 보도자료에 따르면, Amália는 유럽 포르투갈어로 개발된 최초의 오픈 언어모델로 소개된다. 이 프로젝트는 포르투갈의 여러 대학과 연구기관이 참여한 컨소시엄의 결과물로, 60명 이상의 연구자가 투입됐다. 총괄은 NOVA University of Lisbon이 맡았고, Instituto Superior Técnico와 Coimbra, Porto, Minho 대학이 함께 참여했으며, Fundação para a Ciência e a Tecnologia(FCT)가 지원했다. 모델은 Apache 2.0 라이선스의 코드 오픈 형태로 제공되며, Hugging Face의 amalia-llm 조직 아래 공개됐다.

보도자료는 이 모델이 텍스트, 문서, 이미지, 음성을 이해하도록 학습됐으며, 해당 국가의 언어·법적 맥락·현실에 맞게 조정됐다고 설명한다. 다만 이 멀티모달 기능은 실제로는 팀이 공개한 여러 개별 모델(텍스트 모델, 비전 모델, 음성 인식 구성요소)로 나뉘어 있으며, 단일 시스템에 통합된 것은 아니다. 핵심 텍스트 모델은 90억 개 파라미터 규모이며, 처음부터 새로 학습된 것이 아니라 EuroLLM-9B 같은 기존 오픈 유럽 다국어 기반 모델과, 이전 포르투갈어 모델인 GlorIA를 바탕으로 구축됐다. 공개된 기술 문서에 따르면, 이번 버전은 EuroLLM의 사전학습을 확장해 유럽 포르투갈어 지식 범위를 넓히고, 컨텍스트 창을 32,000 토큰까지 확장했다.

이 점이 바로 예산의 성격을 설명한다. 이미 존재하는 파운데이션 모델을 조정하는 비용은, 처음부터 끝까지 새로 훈련하는 것보다 한 자릿수 이상 저렴하다. 최첨단 모델의 경우 이 작업은 수천만 유로에서 수억 유로까지 들 수 있다. 따라서 초기 550만 유로에 2027년까지 150만 유로를 추가한 이번 예산은, 기존 모델의 적응, 데이터 보강, 멀티모달 기능 추가, 그리고 수십 명 규모 인력의 엔지니어링 작업과 유럽 내 공동 활용이 가능한 컴퓨팅 인프라를 뒷받침한다. 바로 이 점이 소규모 공공 예산으로도 프로젝트가 가능했던 이유다.

이미 유럽에서 검증된 방식

포르투갈의 사례는 이제 유럽에서 뚜렷해진 공식을 따르고 있다. 즉, 이미 공개된 기반 모델에서 출발해 국가 언어와 맥락에 맞게 조정하고, EuroHPC 프로그램의 공공 슈퍼컴퓨터를 활용하며, 결과물을 오픈소스로 공개하는 방식이다. 바스크 지방은 같은 접근법으로 Llama 2를 바스크어(euskara)에 맞게 조정한 Latxa를 내놓았다. 스페인은 이를 더 확장해 Barcelona Supercomputing Center에서 400억 파라미터 규모의 ALIA를 훈련했으며, 독일은 2024년 말 공공 컨소시엄 OpenGPT-X의 성과물인 Teuken-7B를 공개했다. 이 프로젝트는 독일 연방경제부로부터 약 1,400만 유로의 자금을 지원받았다.

이들 이니셔티브는 성능보다 기관 구조를 공유한다. 즉, 대학 컨소시엄, 목적이 분명한 공공 재원, 그리고 공동 활용되는 유럽 기반과 연산 자원이다. EU 차원에서는 2025년 2월 출범한 OpenEuroLLM 프로젝트가 약 20개 기관과 함께 모든 공식 언어를 포괄하는 모델 패밀리를 목표로 하고 있으며, 여러 EuroHPC 슈퍼컴퓨터에 전략적 접근권을 확보했다. 유럽의 언어 주권은 단일 범유럽 모델이 아니라, 공동 인프라 위에 얹힌 국가별 구성요소들의 조합으로 구축되고 있는 셈이다.

프랑스와의 대비

이 지점에서 프랑스의 상황이 특히 눈에 띈다. 프랑스에는 세계적 수준의 주자인 Mistral AI가 존재하며, 2025년 9월 C 라운드 이후 기업 가치는 약 117억 유로로 평가됐다. 그러나 Mistral은 민간 기업으로, 공개 가중치 모델을 내놓고는 있지만 공공 부문이 자금을 대고 거버넌스를 맡는 공공 모델은 아니다. 국가 차원의 도구로 보면 가장 가까운 것은 Direction interministérielle du numérique가 개발한 Albert다. 이는 Meta와 Mistral을 포함한 외부 오픈 모델을 국가 서버에서 통합·제공하는 주권형 인프라이지, 공공 자금으로 훈련된 언어모델은 아니다.

그럼에도 프랑스에는 중요한 선례가 있다. BLOOM은 2022년 여름, Hugging Face가 조정한 국제 프로젝트 BigScience의 일환으로 공공 슈퍼컴퓨터 Jean Zay에서 훈련된 1,760억 파라미터 규모의 대형 다국어 모델이었다. 다만 BLOOM은 프랑스어 전용 국가 모델이 아니라 국제적 협업 결과물이었다. 이후 프랑스에서는 2025년 2월 파리 정상회의, 투자 발표, 국가 전략의 세 번째 단계 등 주권 논의가 활발했지만, 결국 Amália처럼 간결하고 목표가 분명한 해법으로 이어지지는 못했다. 즉, 국가 언어에 맞춘 공공·오픈 모델을 연구 프로젝트 수준의 비용으로 제공하는 방식 말이다.

포르투갈의 성과가 가지는 한계

물론 이 성과에도 한계는 있다. Amália는 기존 기반 모델을 조정한 것이며, 90억 파라미터급 LLM이라는 범주에서 미국이나 중국의 최상위 시스템과는 여전히 거리가 있다. 또한 언론에서 자주 반복되는 일부 표현은 신중하게 볼 필요가 있다. Amália를 “미국 거대 기업들에 대한 대안”이라고 부르는 것은 정부의 공식 메시지라기보다 미디어 프레이밍에 가깝다. 정부가 강조하는 키워드는 주권과 투명성이다.

그럼에도 핵심은 분명하다. 작은 국가도 대학 컨소시엄, 유럽 재원의 지정 지원, 공동 인프라 접근만으로 자국 언어에 맞춘 오픈 주권형 LLM을 실현할 수 있음을 입증했다. 바스크 지방에서 독일까지 반복된 이 사례는 프랑스에 매우 구체적인 질문을 던진다. Jean Zay 슈퍼컴퓨터는 이미 BLOOM을 학습시켰고, EuroLLM은 오픈 라이선스로 공개돼 있으며, 포르투갈은 이번 프로젝트 비용을 700만 유로로 제시했다. 국가 공공 모델을 만들기 위한 모든 요소는 이미 테이블 위에 놓여 있다.

ST
Stephane Nachez

ActuIA 편집부 — 의사결정자를 위한 인공지능 뉴스, 데이터, 분석.

언급된 참여자
BABarcelona Supercomputing Center
HUHugging Face
OPOpenEuroLLM
MIMistral AI
ALAllemagne
EUEuroHPC
ESEspagne
FRFrance
ActuIA 위클리

구독이 확인되었습니다. 곧 만나요!