어제, 파리 폴리테크닉 연구소에서 열린 국제 과학 회의에서, Kyutai의 총괄 이사 Patrick Perez는 히비키라는 동시 음성 번역 모델을 발표했습니다. 이 시스템은 화자의 목소리를 보존하면서도 원본 연설의 의미적 내용에 맞춰 리듬을 조절하는 능력으로 구별되며, 실시간으로 구두 및 서면 번역을 제공합니다.
Station F에서 Xavier Niel이 설립한 기업 Iliad의 자회사 Scaleway가 주최한 AI Pulse 회의에서 Kyutai는 2023년 11월 17일, 과학 팀 및 세 명의 공동 창립자인 Xavier Niel, CMA CGM 그룹 창립자의 아들이자 현재 이 그룹을 이끄는 Rodolphe Saadé, 그리고 Google의 전 CEO Eric Schmidt와 함께 출범했습니다. 이 비영리 사설 연구소는 Iliad로부터 1억 유로, CMA CGM 그룹으로부터 1억 유로, 그리고 Eric Schmidt와 그의 아내 Wendy가 공동 설립한 자선 기업인 Schmidt Futures로부터 1억 유로로 총 3억 유로의 자금을 확보했습니다.
전적으로 오픈 AI 연구에 전념하는 Kyutai는 "현대 AI의 도전과제"를 해결하기 위한 LLM 개발과 공동의 이익을 위한 유럽 주권 AI 활성화를 목표로 하고 있으며, 이 과정에서 Iliad 그룹의 클라우드 활동에 전념하는 자회사 Scaleway의 컴퓨팅 파워를 활용하고 있습니다. Yann LeCun을 과학 자문으로 두고 있는 이 연구소는 현재 약 15명의 직원이 근무 중입니다.
2024년 7월, Kyutai는 그들의 LLM Helium 7B를 기반으로 한 최초의 오픈 소스 음성 AI인 Moshi를 발표했고, 지난 1월 13일에는 약 20억 개의 매개변수를 가진 경량 버전인 Helium-1의 미리보기를 공개했습니다. 이 버전은 모바일 장치 및 자원이 제한된 환경에서 효과적으로 작동하도록 설계되었으며, 현재 프랑스어, 독일어, 영어, 스페인어, 이탈리아어 및 포르투갈어 등 6개의 유럽 언어를 지원하고 있습니다. 연구소는 이를 향후 몇 달 안에 출판할 계획입니다.
Kyutai, 히비키 공개: 동시 음성 번역의 주요 발전
Kyutai는 히비키라는 동시 음성 번역 모델을 발표했습니다. 이 시스템은 화자의 목소리를 보존하면서도 실시간으로 구두 및 서면 번역을 제공합니다.

관련 주제
ActuIA 위클리
구독이 확인되었습니다. 곧 만나요!