Hier, lors de la conférence scientifique internationale qui s’est tenue à l’Institut Polytechnique de Paris dans le cadre de la Semaine pour l’Action sur l’IA, Patrick Perez, Directeur général de Kyutai, a présenté Hibiki, un modèle de traduction vocale simultanée. Ce système se distingue par sa capacité à préserver la voix du locuteur tout en adaptant son rythme au contenu sémantique du discours source, offrant ainsi une traduction orale et écrite en temps réel.
C’est à Station F, lors de la conférence AI Pulse, organisée par Scaleway, filiale de l’entreprise Iliad fondée par Xavier Niel, que Kyutai a été lancé le 17 novembre 2023 en présence de son équipe scientifique et de ses trois co-fondateurs : Xavier Niel, Rodolphe Saadé, fils du fondateur du groupe CMA CGM dont il assure la direction, et Eric Schmidt, ex-PDG de Google. Ce laboratoire d’initiative privée à but non-lucratif a été financé à hauteur de 300 millions d’euros, 100 millions d’euros d’Iliad, 100 du groupe CMA CGM et les 100 derniers restants via Schmidt Futures, l’entreprise philanthropique cofondée par Eric Schmidt et sa femme Wendy.
Entièrement dédié à la recherche ouverte en IA, Kyutai s’est donné pour objectif de développer des LLMs pour s’attaquer “aux défis de l’IA moderne” et activer une IA européenne souveraine pour le bien commun, et ce, en s’appuyant sur la puissance de calcul de Scaleway, filiale dédiée aux activités cloud du Groupe Iliad. Le laboratoire, qui a pour conseiller scientifique Yann LeCun, compte actuellement une quinzaine de collaborateurs.
Après avoir présenté en juillet 2024 Moshi, la 1ère IA vocale open source, basée sur son LLM Helium 7B, Kyutai a donné un aperçu le 13 janvier dernier d'Helium-1, une version allégée comptant environ 2 milliards de paramètres. Conçue pour fonctionner efficacement sur des appareils mobiles et des environnements à ressources limitées, cette version préliminaire prend actuellement en charge six langues européennes : français, allemand, anglais, espagnol, italien et portugais. Le laboratoire prévoit de le publier dans les mois à venir.
Kyutai dévoile Hibiki : une avancée majeure dans la traduction vocale simultanée
Kyutai a présenté Hibiki, un modèle de traduction vocale simultanée capable de préserver la voix du locuteur tout en adaptant le rythme et en fournissant traduction orale et écrite en temps réel. Publiant code, poids et rapport technique en open source, Kyutai affirme que Hibiki dépasse l’état de l’art pour la paire français→anglais et facilite un déploiement efficace sur cloud et mobile.

Acteurs cités
Sur le même sujet
L'Hebdo ActuIA
Inscription confirmée, à très vite !