Intelligence artificielle Podcast : "CamemBERT, un savoureux modèle de langue française" dans Le Journal...

Pour approfondir le sujet

Sur le même thème :

“Intelligence artificielle et cognition : Apprentissage naturel et artificiel” : la conférence Olivier Legrain se tiendra à l’ENS les 5 et 6 juillet

Les 5 et 6 juillet prochain, l'intelligence artificielle sera au coeur de la conférence Olivier Legrain organisée à l'ENS. Intitulé "Intelligence artificielle et cognition...

Projet Cap’FALC : l’outil numérique au service d’une société inclusive d’Inria, Facebook Artificial Intelligence Research et l’Unapei

Face à la crise sanitaire et économique actuelle, il est important que pouvoir transmettre à tous les citoyens les informations leur permettant de comprendre...

Une équipe de chercheurs du FAIR et de l’Université de Montréal présente “Talk the Walk”, un projet de traitement automatique du langage naturel

Publié sur arXiv ce 9 juillet, Talk the Walk: Navigating New York City through Grounded Dialogue est un projet de l'équipe de chercheurs du FAIR...

Lanfrica, le TAL appliqué aux langues africaines – Entretien avec Bonaventure Dossou et Chris Emezue

Faire tomber la barrière des langues grâce aux données et à l'IA et renforcer l'accès à l'information dans les langues aux ressources limitées, deux...

Podcast : “CamemBERT, un savoureux modèle de langue française” dans Le Journal des Sciences sur France Culture

Natacha Triou proposait de découvrir l’algorithme linguistique français CamemBERT dans Le Journal des Sciences du 19 novembre 2019 sur France Culture. L’occasion de revenir sur ce modèle informatique, publié gratuitement en ce mois de novembre, avec Laurent Romary, directeur de recherche au sein de l’équipe ALMAnaCH du centre Inria à Paris, qui a participé à l’élaboration de ce modèle en apprentissage profond.

CamemBERT est un modèle linguistique français basé sur l’architecture RoBERTa pré-entraînée sur le subcorpus francophone d’OSCAR, corpus multilingue disponible depuis peu.

L’équipe à l’origine de CamemBERT indique sur son site:

“Nous évaluons CamemBERT dans quatre tâches différentes en aval pour le français : balisage de partie de la parole (POS), analyse de la dépendance, reconnaissance des entités nommées (NER) et inférence de langage naturel (NLI); améliorer l’état de l’art pour la plupart des tâches par rapport aux précédentes approches monolingues et multilingues, ce qui confirme l’efficacité de grands modèles linguistiques pré-entraînés pour le français”.

Ont collaboré au développement et à l’entraînement de cet algorithme Facebook AI Research, Inria et ALMAnaCH et plus précisément Louis Martin, Benjamin Muller, Pedro Javier Ortiz Suárez, Yoann Dupont, Laurent Romary, Éric Villemonte de la Clergerie, Djamé Seddah et Benoît Sagot.

La présentation de France Culture

Un nouveau modèle informatique est capable de manier parfaitement la langue française. Cette intelligence artificielle s’appelle CamemBERT et elle peut identifier et caractériser dans un texte les noms propres, les verbes, les adverbes, les adjectifs, de distinguer toute la grammaire et la syntaxe française, avec un taux de réussite à 99%. CamemBERT est l’application déclinée pour la langue française de BERT, le modèle contextuel de langue le plus courant, issu des laboratoires Google en 2018. Il s’agit d’une avancée car la plupart des modèles linguistiques sont créés à partir de données en anglais. L’Institut national de recherche dédié aux sciences du numérique vient de publier gratuitement le programme, et les détails des travaux “CamemBERT : un savoureux modèle de langue française” sont à retrouver sur le site d’ArXiv.


1ère Marketplace de l'IA et de la transformation numérique vous recommande :
 
Thierry Maubant

Partager l'article

Le groupe Manutan investit dans la Robotic Process Automatisation pour dynamiser son département Finances

Manutan, fournisseur européen de produits et services aux entreprises et aux collectivités et spécialiste du e-commerce BtoB, investit dans la Robotic Process Automatisation (RPA)...

Spice AI veut faciliter l’intégration de l’intelligence artificielle dans les applications

Spice AI, startup basée à Seattle, a pour objectif de faciliter le travail des développeurs lors du développement d'applications intelligentes. Bien que l'IA ait...

Podcast : L’université Paris Dauphine-PSL dévoile le premier épisode de « EX MACHINA, l’ère des algorithmes »

"IA : qui sont les humains derrière la machine ?", c'est le titre du tout premier podcast d'EX MACHINE, lancé par l'université Paris Dauphine-PSL....

Les startups Manitty, PaIRe et Beyond Aero récompensées lors de la 11e édition du prix Jean-Louis Gerondeau – Safran

Manitty, PaIRe et Beyond Aero sont les startups lauréates du prix Jean-Louis Gerondeau - Safran 2021. Leurs innovations dans les domaines de l’aéronautique, des...