On peut ainsi y trouver le séquençage ADN d’une protéine, la collection des photos prises par le robot Mars Curiosity ou les relevés historiques de température de la surface de l'océan. Pour chaque résultat, Google Dataset Search affiche une description détaillée du jeu de données avec le producteur, la licence, le format et un résumé du contenu. de 6 à 15 ans.
Elle rassemble :
L’objectif de ce site est de présenter ces documents, généralement inédits, qui permettent d’éclairer les pratiques et les métiers des créateurs et de leurs éditeurs au fil du temps, et de voir la création en action. Les archives racontent aussi l’histoire de la mise en place et du fonctionnement de cette « coopérative des créateurs » qu’est une société de gestion collective, et de ses évolutions.
L'objectif de Google est de rendre les données scientifiques « aussi accessibles que les recettes de cuisine, les offres d'emplois... ». Dans un premier temps, Google va surtout répertorier les données sur l'environnement, les sciences sociales et celles issues des services publics. Cette démarche s'inscrit dans une volonté générale de Google de simplifier l'accès aux données scientifiques. En 2004, il avait ainsi lancé Google Scholar, un moteur de recherche inventoriant les publications scientifiques (articles, livres, thèses...).
Mais, pour le moment, le moteur de recherche semble encore très incomplet. En tapant « réchauffement climatique », on obtient à peine une dizaine de résultats, avec, par exemple, les scénarios de température mondiale du gouvernement canadien ou les zones d'enneigement en Haute-Savoie (données publiées par la Direction départementale de Haute-Savoie). Le seul document mentionnant le Giec est un jeu de données... vide.
Site internet : https://toolbox.google.com/datasetsearch
Vérification du lien > 16/10/2018
Informations supplémentaires
RESSOURCES
pour le moment, le moteur de recherche semble encore très incomplet. En tapant « réchauffement climatique », on obtient à peine une dizaine de résultats, avec, par exemple, les scénarios de température mondiale du gouvernement canadien ou les zones d'enneigement en Haute-Savoie (données publiées par la Direction départementale de Haute-Savoie). Le seul document mentionnant le Giec est un jeu de données... vide.
D'une part, la plupart des producteurs de données indexés sont américains. D'autre part, Dataset Search ne scanne pas le contenu des données comme pour une page Web classique ou un livre, mais s'appuie sur les métadonnées fournies par les producteurs. Pour être accessible, le jeu de données doit donc être indexé selon la méthode standardisée schema.org développée par les principaux moteurs de recherche (Google, Bing, Yahoo! et Yandex). Pour améliorer le référencement, Google encourage donc tous les producteurs de données à se plier à ce standard, ce qui ne devrait pas tarder tant la dominance de Google sur la recherche Internet, y compris scientifique, est forte.
CONSEILS
Faire une recherche de type Google car celui-ci indexe des contenus publics issus d’institutions, d'universités et d'organismes publics.