Actualité Trois chercheurs du MIT ont découvert que des bases de données comportaient...

Pour approfondir le sujet

Kyndryl, la nouvelle société distincte d’IBM qui proposera des services managés d’infrastructure

IBM a annoncé cette semaine le nom de la nouvelle entité en charge des services gérés d'infrastructure qui fonctionnera en tant que société indépendante....

Focus sur Car Thing, le dispositif doté d’une commande vocale pour les véhicules lancé par Spotify

La technologie Bluetooth est une des options non présentes dans certaines voitures, ce qui n'est pas pratique pour écouter la musique que l'on souhaite...

Généthon et WhiteLab Genomics vont collaborer afin d’utiliser l’IA dans le cadre de la thérapie génique

Généthon, le centre de recherche et de développement de l'AFM-Téléthon a annoncé le mois dernier sa collaboration avec WhiteLab Genomics. Ce partenariat a pour...

Systancia créé Neomia, filiale spécialisée dans la conception de produits dédiés à l’IA

Neomia est la toute nouvelle filiale de l'éditeur français spécialisé dans la cybersécurité, Systancia. Elle œuvrera à la conception de produits dédiés à l'IA...

Trois chercheurs du MIT ont découvert que des bases de données comportaient certaines erreurs d’appréciation

Dans le cadre de recherche sur les intelligences artificielles, une équipe de trois chercheurs du Massachussetts Institute of Technology (MIT) a publié un article fin mars, montrant que les bases de données utilisées par les algorithmes afin d’analyser une requête n’étaient pas vraiment fiables. 

C’est en réalisant des tests sur des algorithmes de reconnaissances d’objets et d’animaux que Curtis Northcutt, Jonas Mueller et Anish Athalye, tous trois chercheurs au MIT, ont remarqué que ces bases de données comportaient beaucoup d’erreurs. Ces algorithmes, en fonctionnant correctement, doivent à partir de n’importe quelle image envoyée, reconnaitre l’objet ou l’animal et en donner sa nature à l’utilisateur. Mais durant les tests, certains résultats semblaient être hors sujet : c’est ainsi qu’une image de crabe fut décrite comme un homard, qu’une grenouille fut reconnue par l’algorithme comme un chat et qu’un ouvre-boîte après analyse, est devenu un casse-noix.

Les chercheurs ont donc décidé d’examiner une dizaine de bases de données en concevant justement un algorithme basé sur leurs propres bases de données et de la comparer avec les bases de données testées. Le résultat fut sans appel, les taux d’erreur peuvent osciller entre 0,54% d’erreur pour la base de données CIFAR-10 jusqu’à plus de 10% pour Quick!Draw! avec un taux d’erreur moyen de 3,4%. Ce qui est sûr, c’est que le zéro absolu dans l’erreur n’existe pas. Or, faire perdurer le mauvais étiquetage de données visuelles, audio, vidéo ou textuelles pourrait potentiellement faire ralentir les recherches dans le domaine de la reconnaissance automatique.

Zacharie Tazrout

Partager l'article

Kyndryl, la nouvelle société distincte d’IBM qui proposera des services managés d’infrastructure

IBM a annoncé cette semaine le nom de la nouvelle entité en charge des services gérés d'infrastructure qui fonctionnera en tant que société indépendante....

Focus sur Car Thing, le dispositif doté d’une commande vocale pour les véhicules lancé par Spotify

La technologie Bluetooth est une des options non présentes dans certaines voitures, ce qui n'est pas pratique pour écouter la musique que l'on souhaite...

Généthon et WhiteLab Genomics vont collaborer afin d’utiliser l’IA dans le cadre de la thérapie génique

Généthon, le centre de recherche et de développement de l'AFM-Téléthon a annoncé le mois dernier sa collaboration avec WhiteLab Genomics. Ce partenariat a pour...

Systancia créé Neomia, filiale spécialisée dans la conception de produits dédiés à l’IA

Neomia est la toute nouvelle filiale de l'éditeur français spécialisé dans la cybersécurité, Systancia. Elle œuvrera à la conception de produits dédiés à l'IA...