BASE TTS : le modèle de synthèse vocale d'Amazon d'un milliard de paramètres
Amazon a récemment introduit BASE TTS (Big Adaptive Streamable TTS with Emergent capabilities), le plus grand modèle de synthèse vocale à ce jour, tan...
arXiv est une archive ouverte de prépublications électroniques d'articles scientifiques dans les domaines de la physique, des mathématiques, de l'informatique, de la biologie quantitative, de la finance quantitative, de la statistique, de l'ingénierie électrique et des systèmes, et de l'économie1, et qui est accessible gratuitement par Internet.
74 articles liés à cet acteur
Amazon a récemment introduit BASE TTS (Big Adaptive Streamable TTS with Emergent capabilities), le plus grand modèle de synthèse vocale à ce jour, tan...
Les grands modèles de langage pré-entraînés, tels que GPT-4 ont révolutionné le domaine du traitement du langage naturel (NLP) en offrant des performa...
Esther Mac Namara, Déléguée à la transformation numérique de la DGFIP, a annoncé récemment la publication de LlaMandement, un LLM développé par la DGI...
Apple semble combler son retard par rapport à Microsoft, Google ou Meta en matière de GenAI. Après le LLM multimodal Ferret open source présenté en oc...
Google Research a annoncé mardi dernier TensorFlow GNN 1.0 (TF-GNN), une bibliothèque testée en production permettant de construire et entraîner des r...
Le modèle de génération de vidéos Lumiere, récemment présenté par des chercheurs de Google Research, utilise un modèle de diffusion probabiliste basé...
La découverte de nouveaux matériaux est un processus long et coûteux, qui repose souvent sur des expériences empiriques et des simulations complexes....
L'AGI, ou Intelligence Artificielle Générale (IAG), fait référence à une forme avancée d'IA qui possèderait la capacité de comprendre, apprendre et ex...
Des chercheurs du département d’apprentissage automatique (MLD) et de l’Institut des technologies linguistiques (LTI) de l’Université Carnegie Mellon...
L’apprentissage par renforcement à partir de la rétroaction humaine (RLHF) est couramment utilisé pour aligner les modèles d'IA sur les préférences hu...
L'apprentissage par imitation à partir de démonstrations humaines a ouvert la voie à des performances impressionnantes en robotique, mais la plupart d...
Les grands modèles de langage (LLM) exigent d'énormes ressources de calcul et d'énergie pour l'entraînement et l'inférence. Les coûts d'entraînement d...