Grupos avançam para resgatar dados públicos em risco


Grupos avançam para resgatar dados públicos em risco

(Shuttersev/Shutterstock)

Os dados públicos são a força important da pesquisa aberta e da investigação científica. Mas a possibilidade de perder conjuntos de dados públicos – incluindo dados acadêmicos, governamentais e científicos gerados como parte da pesquisa – agora está estimulando vários grupos para agir para salvá -los.

No início de fevereiro, o New York Instances relatado Que mais de 8.000 páginas da Net foram retiradas em mais de uma dúzia de websites como parte dos ordens do presidente Trump para eliminar os programas controversos da diversidade, equidade e inclusão (DEI).

Infelizmente, os cortes foram mais profundos que o gênero e a ideologia racial. Por Vezeseles duraram 3.000 páginas de websites do CDC, incluindo 1.000 artigos de pesquisa sobre tudo, desde a prevenção de doenças crônicas até os sinais de aviso da doença de Alzheimer.

Um dos grupos que corre para documentar os dados antes de desaparecer é o FIM DO TERNO ARQUIVO DE WEBque se dedica a documentar websites do governo a cada quatro anos, quando as rédeas de poder são entregues ao próximo presidente. O grupo trabalha para documentar todas as transições desde 2008.

Grupos estão trabalhando para preservar conjuntos de dados do governo (Greenbutterfly/Shutterstock)

Outro grupo que trabalha para salvar dados é o Iniciativa de Dados Ambientais e Governançaque se cobra como uma pesquisa colaborativa e na rede de profissionais que trabalham para promover dados científicos. O grupo se formou após a primeira eleição do presidente Trump em 2016, o grupo diz que ajudou a salvar 200 terabytes de dados de websites governamentais que administram sob o governo Obama.

Um novo grupo que trabalha para salvar dados é chamado de Projeto de resgate de dados. Fundado por membros do Associação Internacional de Serviço e Tecnologia da Informação de Ciências Sociais (Iassist), o Pesquisa Acesso de Dados e Preservação (RDAP) e membros do Rede de curadoria de dadoso projeto de resgate de dados se cobra como “uma câmara de compensação para esforços relacionados ao resgate de dados e pontos de acesso a dados para dados governamentais públicos dos EUA que estão atualmente em risco”.

Projeto de resgate de dados incentiva os voluntários a documentar conjuntos de dados em risco usando Information Lumos. Information Lumos foi criado pelo Consórcio Inter-Universidade para Pesquisa Política e Social (ICPSR) da Universidade de Michigan para servir como um repositório de crowdsourcing para dados do governo.

Uma falha temporária enviou o website do PubMed offline em Earch March, 2025 (TADA Pictures/Shutterstock)

Harvard College’s Laboratório de Inovação da Biblioteca também está trabalhando para ajudar a proteger os dados. No mês passado, o grupo lançou um novo projeto chamado Information.gov Archive, projetado para preservar conjuntos de dados que foram vinculados a Information.govo lar do governo federal para dados abertos. O grupo universitário diz que “colheu” mais de 310.000 conjuntos de dados vinculados através do Information.gov, para um whole de 15 terabytes de dados.

“Construímos este projeto em nosso compromisso de longa information em preservar os registros do governo e disponibilizar informações públicas a todos. As bibliotecas desempenham um papel essencial na proteção da integridade das informações digitais ”. O grupo diz. “Ao preservar metadados detalhados e estabelecer assinaturas digitais para autenticidade e proveniência, facilitamos para os pesquisadores e o público citar e acessar as informações de que precisam ao longo do tempo”.

Não é incomum que os dados se percaem no curso regular dos negócios. Qualquer organização grande com um website considerável terá documentos ausentes e URLs quebrados para lidar. O que está acontecendo atualmente sob o governo Trump é diferente, de acordo com Lynda Kellam, do Information Rescue Mission.

“A diferença é que estamos vendo dados sendo removidos de estudos que não combinam com a ideologia da administração”, Kellam disse ao Revisão do jornalismo de Columbia. “Esse ritmo de queda tem sido muito mais rápido do que no passado.”

Philip Bourne é o reitor da Escola de Ciência de Dados da Universidade da Virgínia

Quando os Institutos Nacionais de Saúde são populares PubMed O website caiu no fim de semana no início de março, muitos pesquisadores e cientistas temiam o pior. O repositório de mais de 37 milhões de artigos, que é mantido pelo Centro Nacional de Informações de Biotecnologia (NCBI) do NIH, é uma fonte important de dados para pesquisa biomédica.

O pior cenário de repente parecia possível. “OMG fez PubMed Go Darkish”, escreveu o pesquisador de saúde da UCLA Thanh Neville em Bluesky, conforme documentado em um Natureza artigo. Felizmente, period apenas uma falha de TI, e o PubMed estava de volta, enviando um suspiro coletivo de alívio através da comunidade de pesquisa biomédica.

Mas o episódio do PubMed é um lembrete de que o futuro acessível de dados não é uma garantia. Para Philip Bourne, o reitor da Escola de Ciência de Dados da Universidade da Virgínia, o breve térreo do PubMed enviou “um sinal preocupante”.

“Como reitores e líderes universitários, precisamos deixar claro para os governos que ser uma universidade pública significa acessibilidade pública a toda a bolsa de estudos que produzimos, incluindo os dados dos quais essa bolsa é derivada”, escreveu Bourne em uma postagem no weblog.

Cientista sênior, mentores e estudantes também podem desempenhar um papel em lembrar outros da importância dos dados, escreveu o Dean de Uofa Stephenson e incentivar todas as partes interessadas a tomar as medidas necessárias para garantir o acesso.

“No caso de minha própria universidade, a Universidade da Virgínia, isso é particularmente comovente como seu fundador, Thomas Jefferson, um dos pais fundadores originais deste país disse:” O projeto de lei mais importante em todo o nosso código é a difusão do conhecimento entre o povo “.”

Itens relacionados:

O tecido de dados financiado pelo NSF toma voo

Prolific coloca pessoas, ética no centro da plataforma de curadoria de dados

ADSA para manter os seres humanos no circuito na reunião anual

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *