Intelligence artificielle Google a sorti en version officielle Dataset Search, un moteur de recherche...

Pour approfondir le sujet

Sur le même thème :

Les intelligences artificielles peuvent désormais reconnaitre des objets qu’elles n’ont jamais vus en utilisant les probabilités

Les intelligences artificielles semblent progresser toujours plus vite et dépasser certaines barrières que les scientifiques pensaient difficiles, ou presque impossibles, à franchir. Gamalon Machine...

Constructeurs automobiles, intelligence artificielle et véhicule autonome: une course acharnée

Après les annonces, la semaine dernière, de Daimler-Benz et de Baidu concernant le développement de leurs projets en intelligence artificielle, il semble plus qu'évident...

Google dévoile Google Landmarks v2 avec plus de 5 millions d’images et lance deux nouveaux défis sur Kaggle

La semaine dernière, Google AI a annoncé sur son blog la mise à disposition, en open source, de la nouvelle version de sa base...

Google Sheet évolue et intègre du machine learning et du big data

Google a fait évoluer son tableur Google Sheet et propose de nouvelles fonctionnalités. Le géant y a intégré des graphiques, du machine learning et...

Google a sorti en version officielle Dataset Search, un moteur de recherche de jeu de données

En septembre 2018, Google annonçait le lancement de Dataset Search, un moteur de recherche de jeux de données destiné aux data scientists en version bêta. Ce 23 janvier, le géant américain a annoncé que la phase de test était finalisée. La version officielle est donc d’ores et déjà disponible.

Comme l’indique Natasha Noy, Research Scientist chez Google Research, dans l’article publié sur le blog de Google, Dataset Search a indexé près de 25 millions de ces ensembles de données. Depuis son lancement en version bêta, le moteur de recherche a été testé et l’équipe travaillant sur le projet a pu analyser de nombreux commentaires et retours d’utilisation. De nouvelles fonctionnalités ont été ajoutées pour le lancement de la version officielle.

Les utilisateurs pourront désormais filtrer les résultats en fonction des types d’ensembles de données (par exemple, tableaux, images, texte), ou selon que l’ensemble de données est disponible gratuitement auprès du fournisseur. Si un ensemble de données concerne une zone géographique, il est possible de le visualiser sur une carte.

Parallèlement, la qualité des descriptions des jeux de données a été améliorée et Dataset Search est également disponible sur mobile. Les utilisateurs de ce moteur de recherche sont très divers : chercheurs universitaires, étudiants, analystes business ou encore data scientists. À partir d’une recherche, ils peuvent obtenir des fichiers CSV, des tableaux mais également des informations et informations relatives au machine learning, créer des écosystèmes de partage de données afin de partager leur travail.

Pour cela, les fournisseurs de données doivent obligatoirement documenter le sitemap et préciser pour les ensembles de données le nom et la description. Il est également conseillé d’ajouter des mots clés, citations, format de téléchargements, etc.

Dataset Search est d’ores et déjà disponible et rassemble selon Google déjà plus de 25 millions d’ensembles de données. Les thématiques le plus présentes sont les géo-sciences, la biologie et l’agriculture. Les recherches les plus courantes varient entre ‘éducation’, ‘météo’, ‘cancer’ et ‘chien’.


1ère Marketplace de l'IA et de la transformation numérique vous recommande :
 
Thomas Calvi

Partager l'article

Le groupe Manutan investit dans la Robotic Process Automatisation pour dynamiser son département Finances

Manutan, fournisseur européen de produits et services aux entreprises et aux collectivités et spécialiste du e-commerce BtoB, investit dans la Robotic Process Automatisation (RPA)...

Spice AI veut faciliter l’intégration de l’intelligence artificielle dans les applications

Spice AI, startup basée à Seattle, a pour objectif de faciliter le travail des développeurs lors du développement d'applications intelligentes. Bien que l'IA ait...

Podcast : L’université Paris Dauphine-PSL dévoile le premier épisode de « EX MACHINA, l’ère des algorithmes »

"IA : qui sont les humains derrière la machine ?", c'est le titre du tout premier podcast d'EX MACHINE, lancé par l'université Paris Dauphine-PSL....

Les startups Manitty, PaIRe et Beyond Aero récompensées lors de la 11e édition du prix Jean-Louis Gerondeau – Safran

Manitty, PaIRe et Beyond Aero sont les startups lauréates du prix Jean-Louis Gerondeau - Safran 2021. Leurs innovations dans les domaines de l’aéronautique, des...