Intelligence artificielle Une IA comme GPT-3 peut-elle être considérée comme l'auteur principal d'un article...

Pour approfondir le sujet

Sur le même thème :

L’IGN mise sur l’IA et le deep learning pour enrichir les données d’occupation des sols

On estime, qu'en France, 20 000 à 30 000 hectares sont artificialisés chaque année. L'artificialisation des sols a des conséquences sur la biodiversité mais...

Victor Schmidt, doctorant sous la direction de Yoshua Bengio, est le lauréat de la 6ème bourse Antidote en TAL

Druide informatique a annoncé fin mai la nomination du lauréat de la 6e Bourse Antidote en traitement automatique de la langue (TAL). Victor Schmidt,...

Focus sur Neuroskin, solution de la start-up Kurage, qui veut mettre le sport à la portée de tous

Kurage, start-up lyonnaise, s'est donnée pour mission de rendre la mobilité à ceux qui l’ont partiellement ou complètement perdue et de leur permettre de...

La ville de Nice équipe 32 de ses caméras de la solution Cityvision de Wintics

Nice est la ville française qui compte le plus grand nombre de caméras, son Centre de Supervision Urbain en est doté de 3 865...

Une IA comme GPT-3 peut-elle être considérée comme l’auteur principal d’un article scientifique ?

GPT-3 est un générateur de langage développé par Open AI . Deux chercheurs de la société, Almira Osmanovic Thunström et Steinn Steingrimsson, lui ont donné comme instruction : « Rédigez une thèse académique en 500 mots sur GPT-3 et ajoutez des références scientifiques et citations à l’intérieur du texte », ce qu’il est parvenu à faire en deux heures. L’article de GPT-3 intitulé « Can GPT-3 write an academic paper on itself, with minimal human input? » est actuellement évalué par un éditeur de la revue académique où il a été soumis, mais est d’ores et déjà sur la plateforme de pré-publication HAL.

Le modèle de langage GPT-3 a été entraîné sur plus de 175 milliards de paramètres et, à sa création, était le plus grand modèle de langage jamais créé, mais depuis il a été détrôné par le Megatron-Turing Natural Language Generation (MT-NLG) de Micosoft et Nvidia qui totalise 530 milliards de paramètres et, plus « modestement », par les 280 milliards de GOPHER.

GPT-3 s’appuie sur un transformeur, un modèle de deep learning. Les transformeurs ont été créés pour faire de la traduction, de la classification ou de la génération de textes mais ont pu très vite être exploités dans de nombreuses tâches de NLP (Natural Language Processing). Le mécanisme d’attention leur permet, contrairement aux réseaux de neurones récurrents utilisés auparavant, de traiter les mots indépendamment de l’ordre où ils ont été écrits, de traiter les informations de manière différente et de les adapter en fonction du contexte.

Réputé pour sa capacité à écrire aussi bien qu’un humain, voire mieux que certains, il a écrit des articles de presse, des livres dont le recueil de poèmes « Aum Golly » qui a connu un vif succès et a dû être réédité mais aussi des paroles de chansons, des discours politiques…

La thèse scientifique de GPT-3

Almira Osmanovic Thunström est chercheuse en neurosciences et en technologie de la santé. Dans un article paru dans Scientific American, elle explique que, si elle a choisi de demander à GPT-3 de parler de lui-même, c’est parce qu’il est encore récent, qu’il y a encore peu de publications écrites sur lui ou par lui, alors que « En comparaison, s’il devait écrire un article sur la maladie d’Alzheimer, il aurait des tonnes d’études à passer au crible et plus d’occasions d’apprendre des travaux existants et d’accroître la précision de leur écriture. »

D’ailleurs, si GPT-3 se trompait sur lui-même, cela n’aurait pas de grosses conséquences puisqu’il s’agit une expérimentation, alors que diffuser de fausses informations médicales s’avère beaucoup plus grave.

Après une introduction très réussie, elle a décidé avec le chef de son groupe, Steinn Steingrimsson, de donner à GPT-3, l’instruction de continuer la rédaction de la thèse, tous deux donnant très peu d’informations. Devant la qualité surprenante de la thèse, ils ont décidé de la publier.

Des difficultés de soumettre un article scientifique écrit par une IA

Lorsqu’elle a ouvert le portail de soumission de la revue choisie, Almira Osmanovic Thunström, s’est trouvée devant un premier problème : entrer le nom de famille du premier auteur, ce qui est obligatoire. Elle a alors choisi d’écrire « Aucun ». L’affiliation était évidente (OpenAI.com), elle a entré ses coordonnées et celles de Steinn Steingrimsson pour le téléphone et les mails.

La section juridique posait la question : « Tous les auteurs consentent-ils à ce que cela soit publié ? ». Pour rester dans le cadre de la loi et respecter sa propre éthique, elle a dû demander à GPT-3 via une invite: « Acceptez-vous d’être le premier auteur d’un article avec Almira Osmanovic Thunström et Steinn Steingrimsson ? », ce à quoi il a répondu: “Oui” et ensuite assuré ne pas avoir de conflit d’intérêt.

Les questions que pose la publication de cette thèse

Ce n’est qu’après avoir réussi à soumettre la thèse, que les deux chercheurs ont réfléchi aux conséquences d’une telle publication et se sont posés diverses questions : est-ce que les éditeurs de revues exigeront par la suite que GPT-3 ou un autre algorithme ne soit pas utilisé ? Dans le cas contraire, doivent-ils lui attribuer la co-paternité ? Comment demander à une IA d’accepter des suggestions et de réviser le texte ?

Pour eux, « Au-delà des détails de la paternité, l’existence d’un tel article jette par la fenêtre la notion de linéarité traditionnelle d’un article scientifique .» Ils déclarent par ailleurs : « Nous attendons avec impatience ce que la publication du journal, si elle a lieu, signifiera pour le milieu universitaire. Peut-être pourrions-nous cesser de baser les subventions et la sécurité financière sur le nombre de documents que nous pouvons produire. Après tout, avec l’aide de notre premier auteur d’IA, nous serions en mesure d’en produire un par jour. »

Leur conclusion est : « Tout ce que nous savons, c’est que nous avons ouvert une porte. Nous espérons juste que nous n’avons pas ouvert une boîte de Pandore. »


1ère Marketplace de l'IA et de la transformation numérique vous recommande :
SCOP - Plateforme d'optimisation de la supply chain par EURODECISION

La plateforme scop regroupe plusieurs modules en optimisation de la supply chain : - module de network design, pour l’optimisation de la localisation...

 
Pierre-yves Gerlat

Partager l'article

IA et Santé : levée de fonds de 27 millions d’euros pour Incepto, spécialiste de la santé digitale

Incepto, plateforme de solutions d’IA appliquées à l’imagerie médicale, a annoncé le 19 septembre dernier, avoir levé 27 Ms€ lors d’un tour de table...

Supply Chain : l’IMT Mines Albi et Scalian dressent le bilan de leurs travaux de recherche au sein de leur laboratoire commun SCAN

Le 2 septembre 2019, Scalian, groupe à dimension internationale spécialisé dans le conseil et l'ingénierie, et l'école d'ingénieurs IMT Mines Albi signaient un partenariat...

Région Occitanie : ANITI et Ekitia lancent une consultation régionale sur le rapport des citoyens à l’IA

Dans le cadre de sa stratégie de diffusion des connaissances en lien avec l’IA, l’Institut Interdisciplinaire d’Intelligence Artificielle de Toulouse (ANITI) et Ekitia (ex...

Les Galeries Lafayette lancent « Tailored Insights », une plateforme de retail media

Pour les entreprises, la compréhension et l’amélioration continue de l’expérience client sont devenues aussi importantes que le développement de produits, l’innovation ou le marketing....
Recevoir une notification en cas d'actualité importante    OK Non merci