arXiv

arXiv est une archive ouverte de prépublications électroniques d'articles scientifiques dans les domaines de la physique, des mathématiques, de l'informatique, de la biologie quantitative, de la finance quantitative, de la statistique, de l'ingénierie électrique et des systèmes, et de l'économie1, et qui est accessible gratuitement par Internet.

74 articles liés à cet acteur

BASE TTS : le modèle de synthèse vocale d'Amazon d'un milliard de paramètres

Amazon a récemment introduit BASE TTS (Big Adaptive Streamable TTS with Emergent capabilities), le plus grand modèle de synthèse vocale à ce jour, tan...

Recherche en intelligence artificielle

16/02/2024 Lire la suite →

SliceGPT : une nouvelle méthode de compression des LLMs efficace

Les grands modèles de langage pré-entraînés, tels que GPT-4 ont révolutionné le domaine du traitement du langage naturel (NLP) en offrant des performa...

Recherche en intelligence artificielle

14/02/2024 Lire la suite →

LLaMandement, le LLM open source du gouvernement français

Esther Mac Namara, Déléguée à la transformation numérique de la DGFIP, a annoncé récemment la publication de LlaMandement, un LLM développé par la DGI...

Transformation numérique

12/02/2024 Lire la suite →

MGIE, le modèle d'édition d'images à partir d'invites textuelles d'Apple

Apple semble combler son retard par rapport à Microsoft, Google ou Meta en matière de GenAI. Après le LLM multimodal Ferret open source présenté en oc...

Marché de l'IA

09/02/2024 Lire la suite →

Google publie TensorFlow GNN 1.0 : une avancée majeure dans l'apprentissage sur les graphes

Google Research a annoncé mardi dernier TensorFlow GNN 1.0 (TF-GNN), une bibliothèque testée en production permettant de construire et entraîner des r...

08/02/2024 Lire la suite →

Lumiere, la nouvelle IA génératrice de vidéos de Google Research

Le modèle de génération de vidéos Lumiere, récemment présenté par des chercheurs de Google Research, utilise un modèle de diffusion probabiliste basé...

Marché de l'IA

29/01/2024 Lire la suite →

IA, HPC et cloud pour accélérer le développement de la future génération de batteries

La découverte de nouveaux matériaux est un processus long et coûteux, qui repose souvent sur des expériences empiriques et des simulations complexes....

Transformation numérique

26/01/2024 Lire la suite →

Intelligence Artificielle Générale : Google DeepMind propose un cadre pour classer les capacités et le comportement des IAG

L'AGI, ou Intelligence Artificielle Générale (IAG), fait référence à une forme avancée d'IA qui possèderait la capacité de comprendre, apprendre et ex...

Recherche en intelligence artificielle

22/01/2024 Lire la suite →

GILL, le LLM multimodal de l'Université Carnegie Mellon

Des chercheurs du département d’apprentissage automatique (MLD) et de l’Institut des technologies linguistiques (LTI) de l’Université Carnegie Mellon...

Recherche en intelligence artificielle

17/01/2024 Lire la suite →

La DPO, une alternative prometteuse à la RLHF pour l'alignement des modèles de langage sur les préférences humaines

L’apprentissage par renforcement à partir de la rétroaction humaine (RLHF) est couramment utilisé pour aligner les modèles d'IA sur les préférences hu...

Recherche en intelligence artificielle

12/01/2024 Lire la suite →

Robotique : Mobile ALOHA, le robot pour les tâches ménagères de l'Université de Stanford

L'apprentissage par imitation à partir de démonstrations humaines a ouvert la voie à des performances impressionnantes en robotique, mais la plupart d...

Recherche en intelligence artificielle

11/01/2024 Lire la suite →

Recherche MosaicML : comment l’inférence influence les lois d’échelle des modèles linguistiques

Les grands modèles de langage (LLM) exigent d'énormes ressources de calcul et d'énergie pour l'entraînement et l'inférence. Les coûts d'entraînement d...

Marché de l'IA

04/01/2024 Lire la suite →

Tendances

Comprendre l'IA

Applications de l'IA

arXiv

BASE TTS : le modèle de synthèse vocale d'Amazon d'un milliard de paramètres

SliceGPT : une nouvelle méthode de compression des LLMs efficace

LLaMandement, le LLM open source du gouvernement français

MGIE, le modèle d'édition d'images à partir d'invites textuelles d'Apple

Google publie TensorFlow GNN 1.0 : une avancée majeure dans l'apprentissage sur les graphes

Lumiere, la nouvelle IA génératrice de vidéos de Google Research

IA, HPC et cloud pour accélérer le développement de la future génération de batteries

Intelligence Artificielle Générale : Google DeepMind propose un cadre pour classer les capacités et le comportement des IAG

GILL, le LLM multimodal de l'Université Carnegie Mellon

La DPO, une alternative prometteuse à la RLHF pour l'alignement des modèles de langage sur les préférences humaines

Robotique : Mobile ALOHA, le robot pour les tâches ménagères de l'Université de Stanford

Recherche MosaicML : comment l’inférence influence les lois d’échelle des modèles linguistiques