Actualité L'intelligence artificielle apprend la traduction de langue sans interférence humaine

Pour approfondir le sujet

Traduction automatique : Focus sur la solution Open Source proposée par Systran, acteur historique de la T.A qui ne cesse de se renouveler

Les progrès de l'intelligence artificielle permettent un véritable essor technologique, notamment en matière de traduction automatique. Après la traduction statistique, le nouveau paradigme dominant...

Découvrez Neural Structured Learning, le nouveau framework TensorFlow pour les données structurées

Google a lancé un nouveau framework pour TensorFlow baptisé NSL (Neural Structured Learning). Open source, cet outil pour les chercheurs et développeurs en machine...

Initiation à l’analyse de texte sur Twitter en Python avec Textblob et Tweepy

Ce tutoriel vidéo réalisé par Nils Schaetti vous permet d'apprendre à analyser des Tweets grâce au module Python Tweepy et au module de TAL...

Les Prix Inria 2018 récompensent notamment Pierre-Yves Oudeyer, pionnier de la « curiosité artificielle »

L'année 2018 marque la 8e édition de la remise des Prix Inria. À cette occasion, Inria, l’Académie des sciences et Dassault Systèmes mettent à...

L’intelligence artificielle apprend la traduction de langue sans interférence humaine

Deux techniques permettant aux réseaux de neurones de traduire sans utilisation de dictionnaire ou d’intervention humaine ont été développées indépendamment. C’est la première fois qu’un système intelligent en est capable sans apprentissage supervisé.

Deux techniques se basant sur la création de dictionnaires propres

Deux équipes de chercheurs en informatique, l’une dirigée par Guillaume Lample de Facebook à Paris, et l’autre par Mikel Artetxe et Eneko Agirre de l’Université du Pays Basque (UPV) à San Sebastian en Espagne, ont réalisé une avancée particulièrement intéressante en matière de traduction. En utilisant l’intelligence artificielle, les chercheurs ont développé des techniques pour permettre aux réseaux de neurones de traduire entre deux langues sans qu’ils aient besoin de recourir à un dictionnaire ou à une intervention humaine.

Jamais une intelligence artificielle n’était parvenue à traduire un texte sans avoir été entraînée à cela au préalable. Pour obtenir un tel résultat, les systèmes identifient tout d’abord des éléments récurrents dans chacune des deux langues. Cela peut être des mots qui vont souvent ensemble comme table et chaise ou chaussures et chaussettes.

Ensuite, les réseaux de neurones relient ces co-occurences dans les deux langues et créent des dictionnaires bilingues sans l’aide de l’homme. Ils vont ensuite se baser sur ces dictionnaires pour traduire des phrases entières. Publiées à quelques jours d’intervalle, ces deux publications utilisent des techniques similaires et donnent des résultats comparables. L’UPV réalise toutefois davantage de traductions inverses tandis que celle de Guillaume Lample a une étape intermédiaire.

De puissants algorithmes de machine learning

Les réseaux de neurones sont de puissants algorithmes de machine learning qui imitent la structure du cerveau humain. Ils sont utilisés pour effectuer une multitude de tâches complexes, de la reconnaissance faciale à la prise de décision. Mais ces algorithmes nécessitent un entraînement et l’accès à d’importants ensembles de données classifiées. Dans le cadre de la traduction, un réseau de neurones a besoin de textes pour apprendre à effectuer la traduction par lui-même. Ce type de textes, dits parallèles, sont constitués de mots et de phrases traduits, placés avec le texte original.

Mais ces deux nouveaux articles de recherche de Facebook et de la UPV ont démontré qu’il était possible pour un réseau de neurones de traduire sans aucun texte parallèle durant son entraînement, grâce à une technique de machine learning non-supervisé.

Deux techniques similaires pour la traduction

On constate dans les deux publications que les réseaux de neurones ont également utilisé d’autres techniques pour parvenir à ces résultats. Il s’agit de la traduction inverse et du débruitage.

  • La traduction inverse : il s’agit de traduire une phrase dans la langue requise puis de la retraduire à partir de là dans sa langue d’origine. Si le réseau de neurones constate des différences entre la phrase traduite en retour et la phrase source, il apprend et s’ajuste lui-même pour faire une traduction plus précise à l’avenir.
  • Le débruitage suit un processus similaire mais ajoute cependant du bruit à la phrase. La traduction est faite d’une langue à l’autre, puis certains mots sont réarrangés ou supprimés avant d’être retraduits dans la langue d’origine. Cela permet essentiellement de supprimer le besoin d’interaction humaine et rend permet une meilleure traduction qu’un simple mot à mot. En effet, ce processus permet au réseau de neurones d’apprendre la syntaxe des deux langues et d’obtenir de meilleurs résultats.

D’après les chercheurs, les traductions sont encore plus précises avec une approche semi-supervisée impliquant des textes parallèles. Ils estiment également qu’ils pourraient améliorer leurs résultats en appliquant les techniques de l’autre.

Replay – SophiaConf 2020 : Open Source, Intelligence Artificielle et Containers

Ces 29 et 30 juin étaient organisée SophiaConf, la grande manifestation annuelle de l'animateur azuréen du numérique de Telecom Valley, en version 100% numérique cette...

Appel à propositions : La Commission européenne investit 1 milliard d’€ dans des projets axés sur les technologies propres

La Commission européenne a ouvert ce vendredi le premier appel à propositions au titre du Fonds pour l'innovation. Il s'agit de l'un des plus...

Toulouse is AI lance une cartographie des TPE et PME IA toulousaines avec le soutien d’Aerospace Valley

Très dynamique en Occitanie, le collectif d'experts Toulouse is AI a annoncé le lancement d'une cartographie de l'écosystème IA des TPE et PME toulousaines en...

Transcription : comment Bertin IT accompagne Crédit Agricole CIB pour renforcer la conformité de ses salles de marché

Des solutions de traitement automatique du langage sont actuellement utilisées dans de nombreux secteurs dont le trading. C'est notamment le cas de MediaSpeech® de...