Intelligence artificielle L'intelligence artificielle apprend la traduction de langue sans interférence humaine

Pour approfondir le sujet

Sur le même thème :

Yandex lance le NeurIPS 2021 Shifts Challenge, un concours ouvert aux experts du machine learning

Dans le cadre de la conférence NeurIPS sur le machine learning, le groupe internet russe Yandex a annoncé le lancement du "Shifts Challenge". La...

Hackathon IA4AI : utiliser toutes les capacités de l’IA et du machine learning au service de l’industrie 4.0

Organisé par ArianeGroup, Atos et SKF Magnetic Mechatronics, avec Techniques de l'Ingénieur et le soutien de Mathworks, le Hackathon IA4AI souhaite proposer aux candidats...

PFIA 2021 : Annonce de la quatorzième édition de la plate-forme intelligence artificielle

L’AFIA, Bordeaux INP, l'Université de Bordeaux et INRIA Bordeaux Sud-Ouest s’associent pour organiser du 28 juin au 02 juillet 2021 la quatorzième Plate-forme Intelligence...

Focus sur trois projets de recherches pour mieux comprendre le comportement animal

Les projets impliquant l'intelligence artificielle et les animaux semblent se développer progressivement. Que ce soit pour lutter contre l'extinction des éléphants d'Afrique, reconnaitre les...

L’intelligence artificielle apprend la traduction de langue sans interférence humaine

Deux techniques permettant aux réseaux de neurones de traduire sans utilisation de dictionnaire ou d’intervention humaine ont été développées indépendamment. C’est la première fois qu’un système intelligent en est capable sans apprentissage supervisé.

Deux techniques se basant sur la création de dictionnaires propres

Deux équipes de chercheurs en informatique, l’une dirigée par Guillaume Lample de Facebook à Paris, et l’autre par Mikel Artetxe et Eneko Agirre de l’Université du Pays Basque (UPV) à San Sebastian en Espagne, ont réalisé une avancée particulièrement intéressante en matière de traduction. En utilisant l’intelligence artificielle, les chercheurs ont développé des techniques pour permettre aux réseaux de neurones de traduire entre deux langues sans qu’ils aient besoin de recourir à un dictionnaire ou à une intervention humaine.

Jamais une intelligence artificielle n’était parvenue à traduire un texte sans avoir été entraînée à cela au préalable. Pour obtenir un tel résultat, les systèmes identifient tout d’abord des éléments récurrents dans chacune des deux langues. Cela peut être des mots qui vont souvent ensemble comme table et chaise ou chaussures et chaussettes.

Ensuite, les réseaux de neurones relient ces co-occurences dans les deux langues et créent des dictionnaires bilingues sans l’aide de l’homme. Ils vont ensuite se baser sur ces dictionnaires pour traduire des phrases entières. Publiées à quelques jours d’intervalle, ces deux publications utilisent des techniques similaires et donnent des résultats comparables. L’UPV réalise toutefois davantage de traductions inverses tandis que celle de Guillaume Lample a une étape intermédiaire.

De puissants algorithmes de machine learning

Les réseaux de neurones sont de puissants algorithmes de machine learning qui imitent la structure du cerveau humain. Ils sont utilisés pour effectuer une multitude de tâches complexes, de la reconnaissance faciale à la prise de décision. Mais ces algorithmes nécessitent un entraînement et l’accès à d’importants ensembles de données classifiées. Dans le cadre de la traduction, un réseau de neurones a besoin de textes pour apprendre à effectuer la traduction par lui-même. Ce type de textes, dits parallèles, sont constitués de mots et de phrases traduits, placés avec le texte original.

Mais ces deux nouveaux articles de recherche de Facebook et de la UPV ont démontré qu’il était possible pour un réseau de neurones de traduire sans aucun texte parallèle durant son entraînement, grâce à une technique de machine learning non-supervisé.

Deux techniques similaires pour la traduction

On constate dans les deux publications que les réseaux de neurones ont également utilisé d’autres techniques pour parvenir à ces résultats. Il s’agit de la traduction inverse et du débruitage.

  • La traduction inverse : il s’agit de traduire une phrase dans la langue requise puis de la retraduire à partir de là dans sa langue d’origine. Si le réseau de neurones constate des différences entre la phrase traduite en retour et la phrase source, il apprend et s’ajuste lui-même pour faire une traduction plus précise à l’avenir.
  • Le débruitage suit un processus similaire mais ajoute cependant du bruit à la phrase. La traduction est faite d’une langue à l’autre, puis certains mots sont réarrangés ou supprimés avant d’être retraduits dans la langue d’origine. Cela permet essentiellement de supprimer le besoin d’interaction humaine et rend permet une meilleure traduction qu’un simple mot à mot. En effet, ce processus permet au réseau de neurones d’apprendre la syntaxe des deux langues et d’obtenir de meilleurs résultats.

D’après les chercheurs, les traductions sont encore plus précises avec une approche semi-supervisée impliquant des textes parallèles. Ils estiment également qu’ils pourraient améliorer leurs résultats en appliquant les techniques de l’autre.


1ère Marketplace de l'IA et de la transformation numérique vous recommande :
 
Johanna Diaz

Partager l'article

Enquête Premier emploi 2022 de Telecom Paris : des ingénieurs recherchés et bien rémunérés

Télécom Paris, école de l'Institut Mines-Télécom et membre fondateur de l'Institut Polytechnique de Paris, forme des ingénieurs généralistes du numérique. Elle a récemment publié...

Canada : l’utilisation de l’intelligence artificielle reste faible au sein des entreprises selon les RH

Les ressources humaines (RH) ont un rôle important au sein des entreprises. Au Canada, l’Ordre des conseillers en ressources humaines agréés (CHRA) a mené...

Focus sur le projet de recherche européen HosmartAI « Hospital Smart development based on AI »

Le projet de recherche européen HosmartAI a pour objectif de doter l'Europe d'un système de santé fort, efficient, durable et résilient, bénéficiant des capacités...

Prédire la mortalité et la durée du séjour en unité de soins intensifs grâce au machine learning

Les unités de soins intensifs (USI) assurent une continuité des soins et une surveillance continue aux patients atteints de maladies graves. Une équipe de...
Recevoir une notification en cas d'actualité importante    OK Non merci