Publicado em: 12/09/2018 16:53:56
Google lança novo mecanismo de busca para ajudar os cientistas a encontrar os conjuntos de dados que precisam
Em entrevista à The Verge , Natasha Noy, pesquisadora do Google AI que ajudou a criar a Pesquisa de Dados, diz que o objetivo é
unificar as dezenas de milhares de repositórios diferentes para conjuntos de dados online. "Queremos tornar esses dados detectáveis,
mas mantê-los onde estão", diz Noy.
No momento, a publicação de conjuntos de dados é extremamente fragmentada. Diferentes domínios científicos têm seus próprios
repositórios preferidos, assim como diferentes governos e autoridades locais. “Os cientistas dizem: 'Eu sei onde preciso ir para
encontrar meusconjuntos de dados, mas não é isso que eu sempre quero'”, diz Noy. "Uma vez que eles saem de sua comunidade
única, é quando fica difícil."
Noy dá o exemplo de uma cientista climática com quem conversou recentemente, que lhe disse que procurava um conjunto de dados
específico sobre a temperatura dos oceanos para um próximo estudo, mas não conseguiu encontrá-lo em lugar nenhum. Ela não
rastreou até encontrar uma colega em uma conferência que reconheceu o conjunto de dados e disse a ela onde ele estava
hospedado. Só então ela poderia continuar com seu trabalho. “E isso não era nem mesmo um depósito particular de boutiques”, diz
Noy. "O conjunto de dados foi bem escrito em um lugar bastante proeminente, mas ainda era difícil de encontrar."
O lançamento inicial da Pesquisa de Conjunto de Dados cobrirá as ciências ambientais e sociais, os dados do governo e os conjuntos
de dados de organizações de notícias como a ProPublica . No entanto, se o serviço se tornar popular, a quantidade de dados que ele
indexa deve rapidamente se tornar uma bola de neve, à medida que instituições e cientistas se esforçam para tornar suas informações
acessíveis.
Isso deve ser ajudado pelo recente florescimento de iniciativas de dados abertos em todo o mundo. “Eu acho que nos últimos anos o
número de repositórios explodiu”, diz Noy. Ela credita isso à crescente importância dos dados na literatura científica, o que significa
que os periódicos pedem aos autores que publiquem conjuntos de dados, bem como “regulamentações governamentais nos EUA e na
Europa e a ascensão geral do movimento de dados abertos”.
Fonte: Postado por Biblioteca Unifesp Campus Osasco às 13:52