Actualité Un modèle deep learning d’Alibaba fait ses preuves dans le Global Machine...

Pour approfondir le sujet

Atos et Google Cloud présentent leur laboratoire d’intelligence artificielle nord-américain

Atos et Google Cloud inaugurent aujourd’hui le laboratoire d’intelligence artificielle de Google Cloud au siège texan d’Atos. Ce nouveau centre de recherche s'inscrit dans...

Pluribus, l’IA développée par l’Université Carnegie Mellon et Facebook devient la 1re à battre l’homme au Hold’em no-limit à six joueurs

Pluribus, un bot IA développé par des chercheurs de l'Université Carnegie Mellon et de Facebook, est parvenu à battre des joueurs professionnels de haut niveau...

Appel à projets synchronisé 2020 EURIPIDES²-PENTA sur l’intégration des systèmes intelligents

Le 5e appel à projets PENTA a été ouvert le 19 novembre dernier. PENTA et EURIPIDES² invitent les industriels à formuler des propositions dans...

Des chercheurs de Samsung présentent une méthode pour animer un visage à partir d’une seule image

Egor Zakharov, Aliaksandra Shysheya, Egor Burkov et Victor Lempitsky, chercheurs au centre de recherche de Samsung AI ont présenté une méthode permettant d'animer un...

Un modèle deep learning d’Alibaba fait ses preuves dans le Global Machine Understanding Test

Alibaba Group a annoncé ce jour que l’Alibaba DAMO Academy Language Technology Lab, avait obtenu un excellent résultat dans le test de compréhension en lecture automatique MS MARCO de Microsoft. Le laboratoire, spécialisé dans le traitement du langage naturel, a développé un modèle de deep learning ayant obtenu de meilleurs résultats qu’un être humain lors d’une séance de questions/réponses. Le modèle a également surclassé d’autres concurrents sur le Passage Retrieval Task dans le même test.

Ce succès met en lumière le potentiel des machines dans la compréhension d’un grand volume de matériaux complexes ainsi que leur capacité à répondre à des questions complexes dans la vie réelle. Les champs d’application concret de cette technologie sont vastes, du chatbot intelligent au moteur de recherche qui peut revenir avec des réponses directes plutôt que des liens de pages web.

Dr Luo Si, Leader du Alibaba DAMO Academy Language Technology Lab commente :

« La compréhension du langage naturel (NLP) se développe rapidement. Au cours de l’année écoulée et des perspectives passionnantes en matière d’applications réelles de cette technologie. La NLP est une technologie de base qui sous-tend les activités d’Alibaba pour servir des centaines de millions de clients sur nos plateformes d’e-commerce, notamment Taobao, Tmall et Lazada. »

« À l’avenir, nous prévoyons de porter nos technologies de NLP sur notre plateforme de cloud computing Alibaba Cloud, de sorte que plus de clients, en particulier les acteurs du retail, du tourisme et des services publics qui s’appuient sur des tâches d’assurance qualité, puissent en bénéficier. Nous explorons également un modèle multimodules qui combine les fonctionnalités de la NLP, de l’IA vocale et de la traduction automatique. Avec un tel modèle, les utilisateurs de différentes langues peuvent communiquer plus librement entre eux et interagir avec une machine en temps réel sans barrières linguistiques. »

C’était la deuxième fois que l’équipe de recherche linguistique d’Alibaba prenait la première place dans un test de compréhension machine. L’an dernier, le modèle de l’équipe a également obtenu de meilleurs résultats qu’un être humain au test de compréhension et de lecture SQuAD de l’Université Stanford.

Contrairement au SQuAD, le test MS MARCO intégrait plus de défis : les participants doivent parcourir environ 1 000 documents basés sur un ensemble de données de recherche Bing de Microsoft pour récupérer d’abord les passages pertinents, puis découvrir ou même développer eux-mêmes les bonnes réponses pour répondre aux questions désignées. En comparaison, la SQuAD exige des participants qu’ils recherchent des réponses à partir d’un seul document. Cela signifie que le test MS MARCO est en fait plus proche de scénarios réels où les décisions sont généralement prises à partir de sources multiples et d’une grande quantité d’informations.

La technologie NLP a déjà été utilisée quotidiennement sur les plateformes d’e-commerce d’Alibaba. Par exemple, lors d’un événement de promotion en ligne sur Lazada l’an dernier, le système de chatbot supporté par la technologie a atteint un taux de précision de 96 % pour répondre aux questions des clients. Avant les ventes, il ne fallait que 30 millisecondes au chatbot pour apprendre toutes les règles relatives à 25 ventes d’objets promotionnels en indonésien.

Le modèle utilisé dans le test MS MARCO a d’abord été développé sur un modèle de deep learning en cascade par les chercheurs d’Alibaba. Il a ensuite été mis à l’essai dans le système Alibaba AliMe Chatbot pour répondre aux demandes de renseignements en ligne de plus de 2 millions de visiteurs quotidiens sur les plateformes de vente au détail de l’entreprise. Plus tard, un modèle BERT enrichi a été développé pour améliorer à la fois la précision et l’efficacité de la compréhension par la machine. Actuellement, le modèle BERT se situe dans le top 3 d’un autre test de compréhension des langues de classe mondiale, GLUE Benchmark, dont DeepMind est l’un des organisateurs.

L’équipe de recherche d’Alibaba a également remporté des prix dans cinq catégories de traduction automatique — dont l’anglais vers le chinois, l’anglais vers le russe, le russe vers l’anglais, l’anglais vers le turc et le turc vers l’anglais — au WMT2018, un important évènement dédié à la traduction automatique organisé par des instituts universitaires et de recherche européens.

Thomas Calvi

Partager l'article

Industrie 4.0 : Partenariat entre Renault et Google Cloud sur la digitalisation des usines et de la chaîne logistique

Aller plus loin dans l'industrie 4.0 grâce au machine learning et à l'intelligence artificielle, c'est l'objectif du Groupe Renault. Pour ce faire, le constructeur...

Ethique de l’intelligence artificielle : Participez à la consultation de l’UNESCO pour l’élaboration d’une recommandation

Dans le cadre de la décision de la Conférence générale de l'UNESCO lors de sa 40e session en novembre 2019, l'UNESCO s'est engagée dans...

L’OTESIA lance ses 4 premiers projets IA dans la santé, la prévention du cyber-harcèlement, l’éducation

En novembre dernier était lancé l’Observatoire des impacts Technologiques Economiques et Sociétaux de l’Intelligence Artificielle (OTESIA) dans les Alpes-Maritimes. Une première en France et...

Replay Dataquitaine : Processus de Décision Markovien et Apprentissage par Renforcement

Dataquitaine propose en replay son Atelier-Webinaire Data Science, organisé par Digital Aquitaine, le 30 juin 2020. Ce séminaire était dédié à la thématique "Processus...