Intelligence artificielle L'intelligence artificielle apprend la traduction de langue sans interférence humaine

Pour approfondir le sujet

Sur le même thème :

Yandex lance le NeurIPS 2021 Shifts Challenge, un concours ouvert aux experts du machine learning

Dans le cadre de la conférence NeurIPS sur le machine learning, le groupe internet russe Yandex a annoncé le lancement du "Shifts Challenge". La...

Hackathon IA4AI : utiliser toutes les capacités de l’IA et du machine learning au service de l’industrie 4.0

Organisé par ArianeGroup, Atos et SKF Magnetic Mechatronics, avec Techniques de l'Ingénieur et le soutien de Mathworks, le Hackathon IA4AI souhaite proposer aux candidats...

PFIA 2021 : Annonce de la quatorzième édition de la plate-forme intelligence artificielle

L’AFIA, Bordeaux INP, l'Université de Bordeaux et INRIA Bordeaux Sud-Ouest s’associent pour organiser du 28 juin au 02 juillet 2021 la quatorzième Plate-forme Intelligence...

Focus sur trois projets de recherches pour mieux comprendre le comportement animal

Les projets impliquant l'intelligence artificielle et les animaux semblent se développer progressivement. Que ce soit pour lutter contre l'extinction des éléphants d'Afrique, reconnaitre les...

L’intelligence artificielle apprend la traduction de langue sans interférence humaine

Deux techniques permettant aux réseaux de neurones de traduire sans utilisation de dictionnaire ou d’intervention humaine ont été développées indépendamment. C’est la première fois qu’un système intelligent en est capable sans apprentissage supervisé.

Deux techniques se basant sur la création de dictionnaires propres

Deux équipes de chercheurs en informatique, l’une dirigée par Guillaume Lample de Facebook à Paris, et l’autre par Mikel Artetxe et Eneko Agirre de l’Université du Pays Basque (UPV) à San Sebastian en Espagne, ont réalisé une avancée particulièrement intéressante en matière de traduction. En utilisant l’intelligence artificielle, les chercheurs ont développé des techniques pour permettre aux réseaux de neurones de traduire entre deux langues sans qu’ils aient besoin de recourir à un dictionnaire ou à une intervention humaine.

Jamais une intelligence artificielle n’était parvenue à traduire un texte sans avoir été entraînée à cela au préalable. Pour obtenir un tel résultat, les systèmes identifient tout d’abord des éléments récurrents dans chacune des deux langues. Cela peut être des mots qui vont souvent ensemble comme table et chaise ou chaussures et chaussettes.

Ensuite, les réseaux de neurones relient ces co-occurences dans les deux langues et créent des dictionnaires bilingues sans l’aide de l’homme. Ils vont ensuite se baser sur ces dictionnaires pour traduire des phrases entières. Publiées à quelques jours d’intervalle, ces deux publications utilisent des techniques similaires et donnent des résultats comparables. L’UPV réalise toutefois davantage de traductions inverses tandis que celle de Guillaume Lample a une étape intermédiaire.

De puissants algorithmes de machine learning

Les réseaux de neurones sont de puissants algorithmes de machine learning qui imitent la structure du cerveau humain. Ils sont utilisés pour effectuer une multitude de tâches complexes, de la reconnaissance faciale à la prise de décision. Mais ces algorithmes nécessitent un entraînement et l’accès à d’importants ensembles de données classifiées. Dans le cadre de la traduction, un réseau de neurones a besoin de textes pour apprendre à effectuer la traduction par lui-même. Ce type de textes, dits parallèles, sont constitués de mots et de phrases traduits, placés avec le texte original.

Mais ces deux nouveaux articles de recherche de Facebook et de la UPV ont démontré qu’il était possible pour un réseau de neurones de traduire sans aucun texte parallèle durant son entraînement, grâce à une technique de machine learning non-supervisé.

Deux techniques similaires pour la traduction

On constate dans les deux publications que les réseaux de neurones ont également utilisé d’autres techniques pour parvenir à ces résultats. Il s’agit de la traduction inverse et du débruitage.

  • La traduction inverse : il s’agit de traduire une phrase dans la langue requise puis de la retraduire à partir de là dans sa langue d’origine. Si le réseau de neurones constate des différences entre la phrase traduite en retour et la phrase source, il apprend et s’ajuste lui-même pour faire une traduction plus précise à l’avenir.
  • Le débruitage suit un processus similaire mais ajoute cependant du bruit à la phrase. La traduction est faite d’une langue à l’autre, puis certains mots sont réarrangés ou supprimés avant d’être retraduits dans la langue d’origine. Cela permet essentiellement de supprimer le besoin d’interaction humaine et rend permet une meilleure traduction qu’un simple mot à mot. En effet, ce processus permet au réseau de neurones d’apprendre la syntaxe des deux langues et d’obtenir de meilleurs résultats.

D’après les chercheurs, les traductions sont encore plus précises avec une approche semi-supervisée impliquant des textes parallèles. Ils estiment également qu’ils pourraient améliorer leurs résultats en appliquant les techniques de l’autre.


1ère Marketplace de l'IA et de la transformation numérique vous recommande :
 
Johanna Diaz

Partager l'article

Laurent Félix devient Directeur Général France d’Ekimetrics

Ekimetrics, spécialiste européen en data science et intelligence artificielle au service des entreprises, a annoncé cette semaine la nomination de Laurent Félix au poste...

Forum de l’évaluation de l’intelligence artificielle : Créer la confiance et valider les performances, ou comment définir un environnement favorable au développement de...

Le Laboratoire national de métrologie et d’essais (LNE) organise le premier forum d'évaluation de l'intelligence artificielle (IA). Cet événement sera l'occasion d'échanger autour du développement de...

Zoom sur l’automatisation des rapports COVID-19 de Santé Publique France par Dynacentrix

L'agence Santé publique France, en charge de la surveillance épidémiologique du covid-19, pilote le système national de veille et d’alerte et de surveillance sanitaire...

Retour sur le lancement de MAESTRIA, plateforme numérique de diagnostic intégratif de la cardiomyopathie auriculaire

Le projet de recherche MAESTRIA (Machine Learning and Artificial Intelligence for Early Detection of Stroke and Atrial Fibrillation) a été officiellement lancé fin septembre....