Google vuole tentare di mettere un po’ d’ordine nel frammentato mondo dei dati ad accesso aperto e presenta quest’oggi Dataset Search, uno strumento che facilita l’individuazione di dataset provenienti da fonti in tutto il mondo come enti governativi, enti pubblici, università, laboratori e così via.
Inserendo uno o più termini d’interesse nella casella Dataset Search, Google permette di attingere a quasi 25 milioni di archivi di dati. Si possono individuare informazioni sulla popolazione residente nei vari Paesi e nelle singole città o regioni, dati sulle eruzioni vulcaniche, gli infortuni in montagna o sulle popolazioni di pinguini.
Lanciato a settembre 2018 e appena uscito dal programma di beta testing, Dataset Search è la porta di accesso a una vasta mole di informazioni pronte per l’uso.
Secondo Google la reazione della comunità scientifica e dei ricercatori, ai quali i dati sono principalmente diretti, è stata positiva. Non solo. Il lancio del nuovo motore di ricerca ha fatto sì che i vari soggetti i cui dati sono stati automaticamente indicizzati prendessero più seriamente la pubblicazione delle informazioni aggiornando le versioni più vecchie di ciascun archivio.
Tra le funzionalità aggiunte a Dataset Search vi è la possibilità di filtrare i dati per tipo (tabelle, immagini, testo,…), la compatibilità con i dispositivi mobili e l’aggiunta di descrizioni per i vari archivi.
Google precisa che la porzione di dati attualmente coperta dal motore di ricerca rappresenta soltanto una frazione dei dataset complessivamente disponibili sul web ma è comunque una raccolta più che significativa. Le tematiche maggiormente rappresentate in Dataset Search sono le geoscienze, la biologia e l’agricoltura mentre tra i termini maggiormente ricercati vi sono “educazione”, “tempo”, “cancro”, “crimine”, “calcio” e “cani”. Gli Stati Uniti sono al momento al primo posto per numero di dataset governativi condivisi in forma aperta.