Intelligence artificielle L'intelligence artificielle apprend la traduction de langue sans interférence humaine

Pour approfondir le sujet

Sur le même thème :

Yandex lance le NeurIPS 2021 Shifts Challenge, un concours ouvert aux experts du machine learning

Dans le cadre de la conférence NeurIPS sur le machine learning, le groupe internet russe Yandex a annoncé le lancement du "Shifts Challenge". La...

Hackathon IA4AI : utiliser toutes les capacités de l’IA et du machine learning au service de l’industrie 4.0

Organisé par ArianeGroup, Atos et SKF Magnetic Mechatronics, avec Techniques de l'Ingénieur et le soutien de Mathworks, le Hackathon IA4AI souhaite proposer aux candidats...

PFIA 2021 : Annonce de la quatorzième édition de la plate-forme intelligence artificielle

L’AFIA, Bordeaux INP, l'Université de Bordeaux et INRIA Bordeaux Sud-Ouest s’associent pour organiser du 28 juin au 02 juillet 2021 la quatorzième Plate-forme Intelligence...

Focus sur trois projets de recherches pour mieux comprendre le comportement animal

Les projets impliquant l'intelligence artificielle et les animaux semblent se développer progressivement. Que ce soit pour lutter contre l'extinction des éléphants d'Afrique, reconnaitre les...

L’intelligence artificielle apprend la traduction de langue sans interférence humaine

Deux techniques permettant aux réseaux de neurones de traduire sans utilisation de dictionnaire ou d’intervention humaine ont été développées indépendamment. C’est la première fois qu’un système intelligent en est capable sans apprentissage supervisé.

Deux techniques se basant sur la création de dictionnaires propres

Deux équipes de chercheurs en informatique, l’une dirigée par Guillaume Lample de Facebook à Paris, et l’autre par Mikel Artetxe et Eneko Agirre de l’Université du Pays Basque (UPV) à San Sebastian en Espagne, ont réalisé une avancée particulièrement intéressante en matière de traduction. En utilisant l’intelligence artificielle, les chercheurs ont développé des techniques pour permettre aux réseaux de neurones de traduire entre deux langues sans qu’ils aient besoin de recourir à un dictionnaire ou à une intervention humaine.

Jamais une intelligence artificielle n’était parvenue à traduire un texte sans avoir été entraînée à cela au préalable. Pour obtenir un tel résultat, les systèmes identifient tout d’abord des éléments récurrents dans chacune des deux langues. Cela peut être des mots qui vont souvent ensemble comme table et chaise ou chaussures et chaussettes.

Ensuite, les réseaux de neurones relient ces co-occurences dans les deux langues et créent des dictionnaires bilingues sans l’aide de l’homme. Ils vont ensuite se baser sur ces dictionnaires pour traduire des phrases entières. Publiées à quelques jours d’intervalle, ces deux publications utilisent des techniques similaires et donnent des résultats comparables. L’UPV réalise toutefois davantage de traductions inverses tandis que celle de Guillaume Lample a une étape intermédiaire.

De puissants algorithmes de machine learning

Les réseaux de neurones sont de puissants algorithmes de machine learning qui imitent la structure du cerveau humain. Ils sont utilisés pour effectuer une multitude de tâches complexes, de la reconnaissance faciale à la prise de décision. Mais ces algorithmes nécessitent un entraînement et l’accès à d’importants ensembles de données classifiées. Dans le cadre de la traduction, un réseau de neurones a besoin de textes pour apprendre à effectuer la traduction par lui-même. Ce type de textes, dits parallèles, sont constitués de mots et de phrases traduits, placés avec le texte original.

Mais ces deux nouveaux articles de recherche de Facebook et de la UPV ont démontré qu’il était possible pour un réseau de neurones de traduire sans aucun texte parallèle durant son entraînement, grâce à une technique de machine learning non-supervisé.

Deux techniques similaires pour la traduction

On constate dans les deux publications que les réseaux de neurones ont également utilisé d’autres techniques pour parvenir à ces résultats. Il s’agit de la traduction inverse et du débruitage.

  • La traduction inverse : il s’agit de traduire une phrase dans la langue requise puis de la retraduire à partir de là dans sa langue d’origine. Si le réseau de neurones constate des différences entre la phrase traduite en retour et la phrase source, il apprend et s’ajuste lui-même pour faire une traduction plus précise à l’avenir.
  • Le débruitage suit un processus similaire mais ajoute cependant du bruit à la phrase. La traduction est faite d’une langue à l’autre, puis certains mots sont réarrangés ou supprimés avant d’être retraduits dans la langue d’origine. Cela permet essentiellement de supprimer le besoin d’interaction humaine et rend permet une meilleure traduction qu’un simple mot à mot. En effet, ce processus permet au réseau de neurones d’apprendre la syntaxe des deux langues et d’obtenir de meilleurs résultats.

D’après les chercheurs, les traductions sont encore plus précises avec une approche semi-supervisée impliquant des textes parallèles. Ils estiment également qu’ils pourraient améliorer leurs résultats en appliquant les techniques de l’autre.

 
Johanna Diaz

Partager l'article

Covid-19 : Focus sur Early Warning System (EWS) développé par BioNTech et InstaDeep pour détecter les variants à haut risque du SARS-CoV-2

En ce moment, nous entendons beaucoup parler de Delta et Omicron, les deux variants circulant le plus en France, mais on est loin d'imaginer...

La CNIL lance une consultation publique sur l’usage des caméras intelligentes dans les espaces publics

Devant la recrudescence des caméras intelligentes ou augmentées dans les espaces publics et les problèmes éthiques ou juridiques que ces dispositifs posent, la CNIL,...

Est-ce que Python est sécurisé ? Etude réalisée par Snyk

Selon une étude réalisée par Snyk, aujourd'hui, 43 % de toutes les fuites de données sont directement liées à des vulnérabilités découvertes au sein...

Bouches-du-Rhône et Var : 12 000 piscines non déclarées détectées grâce à l’Intelligence Artificielle

Il y a et il y aura toujours des fraudeurs... L'intelligence artificielle va permettre de repérer ceux qui ont «omis» de déclarer certains bâtis...
Recevoir une notification en cas d'actualité importante    OK Non merci