Intelligence artificielle Pour Google, le contenu généré automatiquement est contraire aux consignes qu'il a...

Pour approfondir le sujet

Sur le même thème :

DGFiP : les contrôles fiscaux s’appuient de plus en plus sur l’Intelligence Artificielle et le data-mining

En 2017, le projet CFVR (ciblage de la fraude et valorisation des requêtes) faisait l’objet, d’un financement par le FTAP (Fonds de Transformation de...

Deep learning : des chercheurs de l’Université Johns Hopkins présentent une nouvelle approche pour la prédiction des crises cardiaques dues à l’arythmie cardiaque

Les applications d'intelligence artificielle dans le domaine de la santé sont nombreuses, la prévention des crises cardiaques est notamment au cœur de nombreuses recherches. Une...

L’Anap annonce le lancement d’une plateforme pour partager les solutions d’IA déployées dans les maisons de santé

IA Santé : L'Agence nationale d'appui à la performance des établissements de santé et médico-sociaux (Anap), a annoncé le mois dernier le lancement d'une...

Adoption de l’IA, données et souveraineté : Entretien avec Antoine Couret (ALEIA)

Si l’adoption de solutions basées sur l’intelligence artificielle progresse à travers le monde, la question des données, de leur collecte, de leur qualité et...

Pour Google, le contenu généré automatiquement est contraire aux consignes qu’il a données aux webmasters et considéré comme du spam

Google Search Central propose régulièrement des heures de bureau sur YouTube où tout le monde peut poser des questions aux experts Google lors d’un appel vidéo, concernant le référencement ou la recherche Google (crawling, indexation, contenu dupliqué, pagination…). Lors d’une récente heure de bureau Google SEO, John Mueller, Search Advocate, Web Trends Analyst chez Google, a affirmé que le contenu généré automatiquement à l’aide d’outils d’écriture d’intelligence artificielle est contraire aux consignes données aux webmasters par Google et considéré comme du spam.

Les heures de bureau de Google SEO (English Google SEO office-hours hangouts) sont publiques et enregistrées, afin que chacun tire profit des informations partagées. Toute personne travaillant sur un site Web (propriétaire de site, développeur, référenceur) qu’elle soit débutante au confirmée, peut y poser des questions, les soumettre à l’avance ou rejoindre la session en direct. Les vidéos sont ensuite disponibles sur la chaîne YouTube de Google Search Central.

John Mueller, recruté en 2007 par Google, Senior Webmaster Trends Analyst à Zurich, anime ces heures de bureau et y répond aux questions posées. L’une d’elles a récemment concerné les outils d’écriture GPT-3 d’Open AI.

GPT-3 d’OpenAI

GPT-3 (Generative Pre-trained Transformer 3) est, comme son nom l’indique, la 3ème version du modèle d’OpenAI, capable générer du texte à l’aide d’algorithmes préformés. L’équipe OpenAI a entraîné les algorithmes avec 570 Go de données de texte collectées sur Internet, notamment les données en libre accès de Common Crawl et les textes de Wikipédia. Le GPT-3 peut effectuer un grand nombre de tâches comme la recherche sémantique, traduire ou résumer des textes, en écrire ou encore générer du code informatique. Annoncé en mai 2020, ce modèle de langage autorégressif de 175 milliards de paramètres était alors le plus grand réseau de neurones qu’on n’ait jamais créé. Depuis, il a été dépassé par Gopher de Deepmind, annoncé en décembre dernier, qui compte 280 milliards de paramètres.

Il y a des discussions au sein de la communauté SEO (Search Engine Optimization) ou référencement naturel, sur la pertinence de l’utilisation des outils GPT-3 et d’autre part, si elle peut être acceptée du point de vue de Google. Pour John Mueller, tout contenu écrit par l’IA entre dans la catégorie du contenu généré automatiquement et pourrait entraîner une pénalité manuelle.

Le contenu généré automatiquement est contraire aux consignes de Google aux webmasters et considéré comme du spam

Quels que soient les outils utilisés pour le créer, le contenu écrit par des machines est considéré comme généré automatiquement et comme John Mueller l’a souligné, la position de Google sur le contenu généré automatiquement a toujours été claire.

Dans les consignes de Google aux webmasters, il est stipulé « d’éviter d’utiliser la génération automatique de contenu dans le but de manipuler les classements dans la recherche Google. »

John Mueller explique :

« Pour nous, ceux-ci tomberaient essentiellement dans la catégorie du contenu généré automatiquement, ce que nous avons dans les consignes aux webmasters depuis presque le début. Les gens génèrent automatiquement du contenu de différentes manières. Et pour nous, si vous utilisez des outils d’apprentissage automatique pour générer votre contenu, c’est essentiellement la même chose que si vous ne faisiez que mélanger des mots, ou rechercher des synonymes, ou faire appel à des astuces de traduction que les gens avaient l’habitude de faire. Ce genre de choses. »

Il ajoute :

« Je soupçonne que la qualité du contenu est peut-être un peu meilleure que celle des outils de la très vieille école, mais pour nous, il s’agit toujours de contenu généré automatiquement, ce qui signifie que pour nous, il est toujours contraire aux directives aux webmasters. Nous considérons donc qu’il s’agit de spam. »

A la question suivante qui était de savoir si Google peut détecter le contenu généré par l’IA, John Mueller a répondu :

« Je ne peux pas prétendre cela. Mais pour nous, si nous voyons que quelque chose est généré automatiquement, alors l’équipe webspam peut certainement prendre des mesures à ce sujet. »

Il conclut :

« Et peut-être qu’avec le temps, ces outils d’intelligence artificielle évolueront dans le sens où vous les utiliserez pour être plus efficaces dans votre écriture ou pour vous assurer que vous écrivez correctement, comme les outils de vérification de l’orthographe et de la grammaire, qui sont également basés sur apprentissage automatique. Mais je ne sais pas ce que l’avenir nous réserve. »

 
Marie-Claude Benoit

Partager l'article

Découvrez ActuIA n°8, le nouveau numéro du magazine de l’intelligence artificielle

L’été est bien là et c’est déjà l’heure du nouveau numéro d’ActuIA, votre magazine de l’intelligence artificielle ! Pour ce n°8 d’ActuIA, disponible dès...

Victor Schmidt, doctorant sous la direction de Yoshua Bengio, est le lauréat de la 6ème bourse Antidote en TAL

Druide informatique a annoncé fin mai la nomination du lauréat de la 6e Bourse Antidote en traitement automatique de la langue (TAL). Victor Schmidt,...

Retour sur le lauréat du Prix CNIL-INRIA pour la protection de la vie privée

Fin mai, François Pelligrini et Mathieu Cunche, co-présidents du Jury du Prix CNIL-Inria, ont remis le prix pour la protection de la vie privée...

La Lufthansa s’appuie sur le logiciel « Virtual Aviation Training » de NMY pour former ses équipes de cabine

La pandémie a fortement impacté les compagnies aériennes. Depuis la levée des restrictions sanitaires, elles doivent affronter un autre problème : malgré une forte...
Recevoir une notification en cas d'actualité importante    OK Non merci