Actualité Google a sorti en version officielle Dataset Search, un moteur de recherche...

Pour approfondir le sujet

CS2 2018 : Intelligence artificielle, pour qui et avec quelles données ?

Le 11 avril dernier se tenait sur le Campus de Paris-Saclay le Colloque Scientifique CentraleSupélec CS². À cette occasion se sont tenues plusieurs conférences et...

Détourer des images rapidement sur Adobe Photoshop grâce à l’intelligence artificielle c’est possible

L'an dernier, Adobe Photoshop avait annoncé l'arrivée d'une nouvelle fonctionnalité : Select Subject. Présentée notamment dans la vidéo ci-dessus, elle permettait de détourer rapidement,...

La start-up Corti.ai a developpé un système d’intelligence artificielle pour diagnostiquer une situation médicale d’urgence

La start-up danoise Corti.ai a dévoilé un système intelligent, capable d'identifier lors d'un appel d'urgence si la personne est en situation de détresse grave....

Le projet européen MAGIA ouvre de nouvelles portes vers la Chine et les Etats-Unis pour les PME du pôle de compétitivité Lyonbiopôle

8 accords de partenariats (dits MoU – Memorandum of Understanding) – un avec les Etats-Unis et 7 avec la Chine - ont été signés...

Google a sorti en version officielle Dataset Search, un moteur de recherche de jeu de données

En septembre 2018, Google annonçait le lancement de Dataset Search, un moteur de recherche de jeux de données destiné aux data scientists en version bêta. Ce 23 janvier, le géant américain a annoncé que la phase de test était finalisée. La version officielle est donc d’ores et déjà disponible.

Comme l’indique Natasha Noy, Research Scientist chez Google Research, dans l’article publié sur le blog de Google, Dataset Search a indexé près de 25 millions de ces ensembles de données. Depuis son lancement en version bêta, le moteur de recherche a été testé et l’équipe travaillant sur le projet a pu analyser de nombreux commentaires et retours d’utilisation. De nouvelles fonctionnalités ont été ajoutées pour le lancement de la version officielle.

Les utilisateurs pourront désormais filtrer les résultats en fonction des types d’ensembles de données (par exemple, tableaux, images, texte), ou selon que l’ensemble de données est disponible gratuitement auprès du fournisseur. Si un ensemble de données concerne une zone géographique, il est possible de le visualiser sur une carte.

Parallèlement, la qualité des descriptions des jeux de données a été améliorée et Dataset Search est également disponible sur mobile. Les utilisateurs de ce moteur de recherche sont très divers : chercheurs universitaires, étudiants, analystes business ou encore data scientists. À partir d’une recherche, ils peuvent obtenir des fichiers CSV, des tableaux mais également des informations et informations relatives au machine learning, créer des écosystèmes de partage de données afin de partager leur travail.

Pour cela, les fournisseurs de données doivent obligatoirement documenter le sitemap et préciser pour les ensembles de données le nom et la description. Il est également conseillé d’ajouter des mots clés, citations, format de téléchargements, etc.

Dataset Search est d’ores et déjà disponible et rassemble selon Google déjà plus de 25 millions d’ensembles de données. Les thématiques le plus présentes sont les géo-sciences, la biologie et l’agriculture. Les recherches les plus courantes varient entre ‘éducation’, ‘météo’, ‘cancer’ et ‘chien’.

Thomas Calvi

Partager l'article

Synapse AI : Entretien avec Julian Lucchesi, directeur des partenariats du CenTech à Montréal

L'adoption de l'intelligence artificielle en entreprise nécessite bien souvent un accompagnement. Dans ce numéro 3 de Synapse AI, Mathieu Barreau rencontre Julian Lucchesi, Directeur...

Un modèle de deep learning pour repérer plus facilement les tumeurs métastasiques complexes

Nous vous présentions récemment un système mis au point par des scientifiques écossais permettant de repérer plus facilement les mésothéliomes, une forme rare de cancer....

Trois start-up, spécialisées data et intelligence artificielle, finalistes du LVMH Innovation Award

Dans le cadre de la cinquième édition du LVMH Innovation Award, 28 start-up ont été sélectionnées. Grâce à ce prix dédié à l'innovation, les...

Quelle fiabilité pour la reconnaissance vocale utilisée pour le diagnostic du COVID-19 ?

Savoir si des patients sont atteints du COVID-19 grâce à leur voix ? C'est le défi que se sont lancé plusieurs équipes de recherche....