Un modèle deep learning d’Alibaba fait ses preuves dans le Global Machine Understanding Test

Un modèle deep learning d’Alibaba fait ses preuves dans le Global Machine Understanding Test
Actu IA
DAMO alibaba

Alibaba Group a annoncé ce jour que l’Alibaba DAMO Academy Language Technology Lab, avait obtenu un excellent résultat dans le test de compréhension en lecture automatique MS MARCO de Microsoft. Le laboratoire, spécialisé dans le traitement du langage naturel, a développé un modèle de deep learning ayant obtenu de meilleurs résultats qu’un être humain lors d’une séance de questions/réponses. Le modèle a également surclassé d’autres concurrents sur le Passage Retrieval Task dans le même test.

Ce succès met en lumière le potentiel des machines dans la compréhension d’un grand volume de matériaux complexes ainsi que leur capacité à répondre à des questions complexes dans la vie réelle. Les champs d’application concret de cette technologie sont vastes, du chatbot intelligent au moteur de recherche qui peut revenir avec des réponses directes plutôt que des liens de pages web.

Dr Luo Si, Leader du Alibaba DAMO Academy Language Technology Lab commente :

« La compréhension du langage naturel (NLP) se développe rapidement. Au cours de l’année écoulée et des perspectives passionnantes en matière d’applications réelles de cette technologie. La NLP est une technologie de base qui sous-tend les activités d’Alibaba pour servir des centaines de millions de clients sur nos plateformes d’e-commerce, notamment Taobao, Tmall et Lazada. »

« À l’avenir, nous prévoyons de porter nos technologies de NLP sur notre plateforme de cloud computing Alibaba Cloud, de sorte que plus de clients, en particulier les acteurs du retail, du tourisme et des services publics qui s’appuient sur des tâches d’assurance qualité, puissent en bénéficier. Nous explorons également un modèle multimodules qui combine les fonctionnalités de la NLP, de l’IA vocale et de la traduction automatique. Avec un tel modèle, les utilisateurs de différentes langues peuvent communiquer plus librement entre eux et interagir avec une machine en temps réel sans barrières linguistiques. »

C’était la deuxième fois que l’équipe de recherche linguistique d’Alibaba prenait la première place dans un test de compréhension machine. L’an dernier, le modèle de l’équipe a également obtenu de meilleurs résultats qu’un être humain au test de compréhension et de lecture SQuAD de l’Université Stanford.

Contrairement au SQuAD, le test MS MARCO intégrait plus de défis : les participants doivent parcourir environ 1 000 documents basés sur un ensemble de données de recherche Bing de Microsoft pour récupérer d’abord les passages pertinents, puis découvrir ou même développer eux-mêmes les bonnes réponses pour répondre aux questions désignées. En comparaison, la SQuAD exige des participants qu’ils recherchent des réponses à partir d’un seul document. Cela signifie que le test MS MARCO est en fait plus proche de scénarios réels où les décisions sont généralement prises à partir de sources multiples et d’une grande quantité d’informations.

La technologie NLP a déjà été utilisée quotidiennement sur les plateformes d’e-commerce d’Alibaba. Par exemple, lors d’un événement de promotion en ligne sur Lazada l’an dernier, le système de chatbot supporté par la technologie a atteint un taux de précision de 96 % pour répondre aux questions des clients. Avant les ventes, il ne fallait que 30 millisecondes au chatbot pour apprendre toutes les règles relatives à 25 ventes d’objets promotionnels en indonésien.

Le modèle utilisé dans le test MS MARCO a d’abord été développé sur un modèle de deep learning en cascade par les chercheurs d’Alibaba. Il a ensuite été mis à l’essai dans le système Alibaba AliMe Chatbot pour répondre aux demandes de renseignements en ligne de plus de 2 millions de visiteurs quotidiens sur les plateformes de vente au détail de l’entreprise. Plus tard, un modèle BERT enrichi a été développé pour améliorer à la fois la précision et l’efficacité de la compréhension par la machine. Actuellement, le modèle BERT se situe dans le top 3 d’un autre test de compréhension des langues de classe mondiale, GLUE Benchmark, dont DeepMind est l’un des organisateurs.

L’équipe de recherche d’Alibaba a également remporté des prix dans cinq catégories de traduction automatique — dont l’anglais vers le chinois, l’anglais vers le russe, le russe vers l’anglais, l’anglais vers le turc et le turc vers l’anglais — au WMT2018, un important évènement dédié à la traduction automatique organisé par des instituts universitaires et de recherche européens.