Intelligence artificielle Google cherche à lutter contre les contenus indésirables grâce à l'intelligence artificielle

Pour approfondir le sujet

Sur le même thème :

Astek et Craft AI présentent leur solution de machine learning dans le domaine de la cybersécurité

Dans le cadre de leur partenariat, Astek et Craft AI ont présenté leur première solution dans le domaine de la cybersécurité. L'entreprise spécialisée en...

Thalès intègre deux solutions dans Google Workspace pour protéger les données des utilisateurs

Grâce à un partenariat avec Google, Thalès annonce l'intégration de ses solutions CipherTrust Manager et SafeNet Trusted Access pour chiffrer des documents Google Workspace....

Data Legal Drive enquête autour de la digitalisation des entreprises et de l’application de la RGPD

L'entreprise Data Legal Drive, spécialiste dans l'édition de logiciels de conformité avec le règlement général sur la protection des données (RGPD), a réalisé une...

Lancement de DRONES4SEC, une fédération de souveraineté européenne pour les drones de sécurité

Ce 22 juin 2021 voit le lancement officiel de la Fédération européenne - Action Tank - DRONES4SEC. Cet action tank européen a pour objectif...

Google cherche à lutter contre les contenus indésirables grâce à l’intelligence artificielle

En 2020, Google a annoncé l’introduction de nouveaux outils d’intelligence artificielle dans ses services afin de lutter contre le spam. Selon les équipes de la firme de Mountain View, ces solutions peuvent bloquer jusqu’à 99% de contenus indésirables. Environ 40 milliards de pages de spam sont découvertes chaque jour parmi les milliards de sites ou mails explorés et indexés. Faisons un point sur les techniques employées par Google afin d’éradiquer le spam et les contenus malveillants. 

Plusieurs systèmes d’indexation pour lutter contre le spam

Dans un premier temps, la multinationale a conçu des systèmes basés sur l’IA capable de détecter un contenu indésirable lorsqu’un utilisateur explore des pages web ou d’autres contenus (comme des mails par exemple). S’ils détectent un contenu qui semble indésirable, ils ne l’incluent pas dans l’index avec lequel ils fournissent des résultats de recherche.

Ensuite, le modèle d’indexation analyse le contenu qui a été inclus dans cet index et vérifie s’il peut bel et bien être considéré comme du spam. Si tel est le cas, ce contenu n’apparaitra pas dans les résultats de recherche ou dans la boîte mail de l’utilisateur. Les différentes étapes de détection du spam fonctionnent en fait comme un entonnoir :

Spam entonnoir index internet schéma

Plus on s’approche du bas de l’entonnoir, plus il existe des systèmes pour contrer les spams. La première technologie utilisée est celle du crawler GoogleBot. Il s’agit d’un robot qui parcourt les sites web lien par lien, dans un but d’indexation. C’est ainsi que l’on passe du “crawled spam” au “indexed spam”. Cette deuxième phase utilise le modèle précédemment évoqué. Après cela, il n’existe plus que l’action manuelle pour détecter un potentiel spam.

Au-delà du spam, une question de sécurité

Google indique avoir souhaité aller plus loin en entrant dans le domaine de la protection des données de l’utilisateur dans le cadre d’escroqueries ou de fraudes en ligne. Ces dernières existent sous de nombreuses formes, très souvent signalées par des utilisateurs. Grâce à ces signalements, les systèmes développés par Google ont pu s’entrainer à détecter des sites potentiellement frauduleux pour ensuite analyser leur véritable nature de la même manière que pour les spams comme le montre l’illustration ci-dessous :

google algorithme blocage sites frauduleux

Par ailleurs, le spam est de plus en plus répandu à cause du piratage de sites web. Les spammeurs utilisent le contenu volé pour y ajouter des pages supplémentaires contenant des liens frauduleux pouvant vous rediriger vers de faux sites demandant des coordonnées bancaires, des informations de connexion ou des données personnelles. Plus grave encore, les pirates peuvent pousser à télécharger un logiciel malveillant prenant le contrôle d’un ordinateur ou d’un compte Google.

Les systèmes de Google ont été conçus dans le but de supprimer le plus rapidement possible tout contenu lié à ce genre d’arnaques. En luttant contre ce genre de pratiques, la firme de Mountain View a développé ses technologies d’IA et précise avoir amélioré certaines de ses prestations, notamment dans le classement et l’indexation d’informations liées à l’achat d’un produit par exemple.

 


1ère Marketplace de l'IA et de la transformation numérique vous recommande :
 
Zacharie Tazrout

Partager l'article

Rendez-vous du 17 au 19 novembre 2021 pour la 4ème édition du Soph.I.A. Summit

Cette année, le Soph.I.A. Summit se tiendra du 17 au 19 novembre 2021. Organisé par Université Côte d’Azur, la Communauté d’Agglomération de Sophia Antipolis et...

France Num publie le 1er Baromètre sur la transformation numérique des TPE/PME réalisé par le CREDOC

France Num, initiative pilotée par la Direction Générale des entreprises (DGE) a remis à Alain Griset, ministre délégué chargé des petites et moyennes entreprises,...

Retour sur l’adoption de la première stratégie de l’OTAN en matière d’Intelligence Artificielle

Les 30 pays de l'OTAN ont pour objectif de garantir la liberté et la sécurité aux membres de leur alliance. Créé en 1949, l'OTAN...

Changement climatique : Mila permet de vivre l’expérience de catastrophes naturelles pour sensibiliser l’opinion

Ces dernières années, les catastrophes naturelles semblent s'amplifier et se succéder à un rythme exponentiel. Que ce soient les incendies dévastateurs comme en Californie,...