Intelligence artificielle Focus sur le LabCom ALAIA et son programme de recherche dans le...

Pour approfondir le sujet

Sur le même thème :

Lanfrica, le TAL appliqué aux langues africaines – Entretien avec Bonaventure Dossou et Chris Emezue

Faire tomber la barrière des langues grâce aux données et à l'IA et renforcer l'accès à l'information dans les langues aux ressources limitées, deux...

Des chercheurs d’Open AI conçoivent un processus pour améliorer le comportement des modèles linguistiques

Les experts d’Open AI ont annoncé une de leurs dernières découvertes autour du comportement du modèle de langage. Ils ont remarqué qu'ils pouvaient l'améliorer...

Chine : l’intelligence artificielle utilisée pour concevoir des bases de données linguistiques

Dans le cadre d'un vaste programme de protection des ressources linguistiques nationales, la Chine a lancé la seconde phase de son projet. Le pays...

Utilisation de l’IA dans les médias : La commission de la culture demande à la Commission européenne un cadre éthique clair

Suite à la publication de son livre blanc sur l'IA, la Commission européenne travaille sur un cadre législatif pour une IA fiable qui devrait...

Focus sur le LabCom ALAIA et son programme de recherche dans le domaine des technologies informatiques pour l’apprentissage des langues étrangères

Le LabCom ALAIA, entre Archean Technologies et l’Institut de Recherche en Informatique de Toulouse (IRIT), travaille sur un programme de recherche et d’innovation dans le domaine des technologies informatiques pour l’apprentissage des langues étrangères, coordonné par Isabelle Ferrané (IRIT). Le projet, soutenu par l’ANR, a débuté en février 2019 pour une durée de 36 mois.

Le LabCom ALAIA, entre Archean Technologies et l’Institut de Recherche en Informatique de Toulouse (IRIT) vise à conduire un programme ambitieux de recherche et d’innovation dans le domaine des technologies informatiques pour l’apprentissage des langues étrangères.

Il explorera les techniques avancées d’intelligence artificielle (IA) pour le travail des compétences orales des apprenants — expression/compréhension orales. Ces techniques permettront de proposer, suivant les profils d’apprenants, les contenus (exercices/corrections) les plus adaptés et les plus efficaces pour l’acquisition de la langue cible.

Archean Technologies pourra, via le LabCom, développer des technologies en totale rupture avec les logiciels actuels d’apprentissage assisté par ordinateur et commercialiser ces solutions sous la forme de didacticiels, en mode B2C. L’IRIT, grâce à son expertise en IA et en analyse automatique de la parole, pourra exploiter les données mises à disposition par l’entreprise (enregistrements, données d’utilisation logicielle) dans le respect de la réglementation européenne sur la protection des données personnelles (RGPD). Ainsi, de nouveaux axes de recherche émergeront des problématiques de terrain. Les méthodes innovantes proposées seront exploitées au travers d’applications destinées aux apprenants, en organismes de formation ou en apprentissage en autonomie.

L’activité du LabCom s’insère parfaitement dans le volet innovation du plan pour la langue française et le plurilinguisme du 20 mars 2018, répondant aux urgences de formation linguistique des populations migrantes en France, pour leur insertion et accès à l’emploi. Initialement centré sur le français, le modèle proposé sera généralisé à d’autres langues cibles. De démonstrateurs en véritables solutions industrielles, les technologies développées suivront des jalons réguliers de développement et de production scientifique.

A court, moyen et long terme, le programme d’innovation du LabCom intégrera les multiples dimensions de l’apprentissage des langues :

  • niveaux linguistiques : de la prononciation (phonétique-phonologie) aux niveaux lexico-grammatical, discursif et pragmatique ;
  • authenticité des exercices : de tâches très contraintes (lecture/répétition) à la production spontanée ;
  • précision visée : d’un travail global à un travail plus ciblé lié aux types d’erreurs détectées, à leur localisation et aux stratégies de remédiation possibles ;
  • systèmes linguistiques source/cible : initiés pour le couple japonais/français et généralisés à d’autres couples de langues ;
  • variété des apprenants et de leur niveau de compétences : interférences entre langue maternelle et langue cible ou difficultés de prononciation propres aux individus ;
  • personnalisation des exercices de remédiation : grâce au potentiel discriminant des algorithmes d’IA et à la notion de profil ;
  • modalités audiovisuelles : ressources complémentaires pour aider les populations non lettrées à se former et à appréhender des aspects plus socio-culturels.

Ces jalons aideront à lever progressivement des verrous technologiques et scientifiques forts :

  1. détection et localisation automatique d’erreurs à différents niveaux linguistiques ;
  2. caractérisation des erreurs en fonction de critères acoustiques, linguistiques, didactiques et choix de la stratégie de remédiation la plus adaptée ;
  3. production de feedback pour permettre à l’apprenant d’estimer sa performance, de mieux comprendre ses erreurs pour mieux les corriger ;
  4. saillance perceptive pour aider à renforcer le travail de production orale ;
  5. profilage automatique pour personnaliser l’apprentissage ;
  6. qualité de la production en situation d’interaction pour mesurer la capacité à communiquer avec un locuteur natif.

Les 4 premiers verrous seront abordés durant les 3 premières années. Au-delà, le profilage automatique et l’évaluation de la production orale en contexte d’interaction ouvriront de nouvelles perspectives innovantes pour le LabCom.

Collaborent à ce projet : Isabelle Ferrané (IRIT – Head LabCom), Lionel Fontan (Archean Labs – Head LabCom), Julien Pinquier (IRIT), Thomas Pellegrini (IRIT), Maxime Le Coz (Archean Labs) et Sylvain Detey (Waseda University – Japan – Expert in L2 didactics)


1ère Marketplace de l'IA et de la transformation numérique vous recommande :
 
Thierry Maubant

Partager l'article

Covid-19 : Focus sur Early Warning System (EWS) développé par BioNTech et InstaDeep pour détecter les variants à haut risque du SARS-CoV-2

En ce moment, nous entendons beaucoup parler de Delta et Omicron, les deux variants circulant le plus en France, mais on est loin d'imaginer...

La CNIL lance une consultation publique sur l’usage des caméras intelligentes dans les espaces publics

Devant la recrudescence des caméras intelligentes ou augmentées dans les espaces publics et les problèmes éthiques ou juridiques que ces dispositifs posent, la CNIL,...

Est-ce que Python est sécurisé ? Etude réalisée par Snyk

Selon une étude réalisée par Snyk, aujourd'hui, 43 % de toutes les fuites de données sont directement liées à des vulnérabilités découvertes au sein...

Bouches-du-Rhône et Var : 12 000 piscines non déclarées détectées grâce à l’Intelligence Artificielle

Il y a et il y aura toujours des fraudeurs... L'intelligence artificielle va permettre de repérer ceux qui ont «omis» de déclarer certains bâtis...
Recevoir une notification en cas d'actualité importante    OK Non merci