Este documento discute os desafios e estratégias da gestão de dados científicos nas instituições. Aborda a relevância e benefícios da gestão de dados, os processos e áreas de ação, o diagnóstico e planeamento da intervenção, a associação com os ciclos de vida da investigação, o papel dos financiadores, e as competências e formação necessárias.
SciELO: Acesso Aberto em alinhamento com a Ciência Aberta
Gestão de Dados Científicos: Desafios e Estratégias
1. GESTÃO DE DADOS CIENTÍFICOS
desafios e estratégias nas instituições
Pedro Príncipe
pedroprincipe@sdum.uminho.pt
2. Tópicos (uma tentativa de simplificar info)
1. A Gestão de Dados Científicos: relevância
e benefícios.
2. Os processos e áreas de ação nas
instituições e nas bibliotecas.
3. O diagnóstico e planeamento da
intervenção nas instituições
4. A associação dos ciclos de vida da
investigação e dos dados.
5. O papel dos financiadores de ciência.
6. As competências e a formação.
3. 3
because good research needs good dataOs Conjuntos de Dados Científicos de HOJE
são as coleções das Bibliotecas de AMANHÃ…
4. A GESTÃO DE DADOS
CIENTÍFICOS: RELEVÂNCIA E
BENEFÍCIOS
4
1/6
5. GESTÃO DE DADOS CIENTÍFICOS
Gestão de dados científicos ou curadoria de dados é a
atividade de organização e utilização de dados desde o
momento da sua criação, com a finalidade de garantir o seu
armazenamento, a sua pesquisa e respetiva reutilização.
Na Gestão de Dados Científicos estão envolvidos vários
processos:
Planeamento de dados > Criação de dados > Documentação
dos dados > Acesso e utilização dos dados > Armazenamento
e backups > Partilha dos dados > Preservação dos dados.
6. Relevância da GDC para a Ciência Aberta:
dados com + qualidade e + abertos
Assegurar que os dados produzidos são pesquisáveis e reutilizáveis aumenta a
qualidade da investigação, promove a eficiência e pode permitir a redução de custos…
Aumentar o potencial de reutilização dos dados… Muitas vezes os dados contam
histórias que as publicações não mostram...
Expor os dados devidamente documentados possibilita a verificação desses
dados, podendo aumentar o rigor dos resultados, e conferir maior credibilidade…
A disponibilização dos dados promove a rapidez da investigação, tão necessária
em determinados campos científicos ou momentos da história da humanidade.
Os dados são um bem público... devolver à sociedade os resultados do financiamento
público cumprindo requisitos de financiadores de ciência e inovação.
7. A GESTÃO DE DADOS CIENTÍFICOS
ADEQUADA IRÁ:
1. Aumentar o
impacto da
investigação
2. Melhorar a
acessibilidade
3. Prevenir o uso
inadequado
4. Salvaguardar os
dados produzidos
5. Assegurar
compatibilidade
8. OS PROCESSOS E ÁREAS DE
AÇÃO NAS INSTITUIÇÕES
E NAS BIBLIOTECAS.
8
2/6
9. PROCESSOS E ÁREAS DE AÇÃO NAS INSTITUIÇÕES
CICLO DE VIDA DA
INVESTIGAÇÃO
DMPs, dados existentes,
documentação, metadados,
datasets, depositar, partilhar
INFRAESTRUTURA
Arquivos de dados,
repositórios, acesso,
licenças, preservação, cloud,
DOI
GOVERNAÇÃO
Financiadores,
Universidades, Instituições
de Investigação, Políticas,
Protocolos
10. PROCESSOS E ÁREAS DE AÇÃO NAS INSTITUIÇÕES
CICLO DE VIDA DA
INVESTIGAÇÃO
DMPs, dados existentes,
documentação,
metadados, datasets,
depositar, partilhar
CollaborateConceber Design Experiment Publish DivulgarAnalyseProjetar ColaborarTestar PublicarAnalisar
Plataformas para
armazenamento, descrição e
de gestão dados
Aplicações para
Planeamento
Repositórios e
Revistas científicas
11. PROCESSOS E ÁREAS DE AÇÃO NAS INSTITUIÇÕES
Planeamento
da gestão de
dados
Gestão de
active data
Seleção de
dados e
utilização
Repositórios
de dados
Catálogos de
dadosINFRAESTRUTURA
Arquivos de dados,
repositórios, acesso,
licenças, preservação,
cloud, DOI
Política e estratégia de
GDC
Planos de negócio e
sustentabilidade
.
suporte
.
guias
.
formação
12. PROCESSOS E ÁREAS DE AÇÃO NAS INSTITUIÇÕES
Roadmaps, planos e estratégias de intervenção.
Definição de requisitos técnicos e diagnósticos.
Desenvolvimento da política de dados científicos.
Implementação de formação, ferramentas e
serviços piloto.
Protocolos para utilização e partilha de recursos.
Small is beautiful - Pouca hierarquia - fácil aprovação.
Escala + pequena - facilita envolvimento com a
comunidade de investigadores.
Gestão sénior mais "mãos na massa“ – fase inicial.
GOVERNAÇÃO
Financiadores,
Universidades,
Instituições de
Investigação, Políticas,
Protocolos
13. Quem está envolvido na instituição?
Bibliotecas
Serviços de
TIC
Gabinetes
de
investigação
14. O que é que a GDC oferece às Bibliotecas…
Possibilidade:
De estabelecer credibilidade numa nova área de envolvimento.
De explorar e aprender novas competências técnicas.
Oportunidade:
De aproximação à comunidade de investigadores e seus
processos de investigação (relações de trabalho mais próximas).
De ‘sujar as mãos’ com dados não publicados ou dados em bruto
que são os blocos de construção do conhecimento.
15. Áreas de envolvimento das Bibliotecas
Serviços de
Suporte
Infraestrutura e
normalização
Políticas e
prática por
disciplinas
Competências e
recursos
humanos
16. Ligue des Bibliothèques Européennes de Recherche
Association of European Research Libraries
League of European Research Universities
17. 10 Recommendations for libraries to get
started with research data management
Regrouping the recommendations – Areas of engagement
Support services
#1 Offer research data management support, including data management plans for grant applications, intellectual
property rights advice and information materials. Assist faculty with data management plans and the integration of
data management into the curriculum.
#6 Support the lifecycle for research data by providing services for storage, discovery and permanent access.
Infrastructure & standards
#2 Engage in the development of metadata and data standards and provide metadata services for research data.
#5 Liaise and partner with researchers, research groups, data archives and data centers to foster an
interoperable infrastructure for data access, discovery and data sharing.
#7 Promote research data citation by applying persistent identifiers to research data.
#8 Provide an institutional Data Catalogue or Data Repository, depending on available infrastructure.
#10 Offer or mediate secure storage for dynamic and static research data in co-operation with institutional IT
units and/or seek exploitation of appropriate cloud services.
Policy & disciplinary practices
#4 Actively participate in institutional research data policy development, including resource plans. Encourage
and adopt open data policies where appropriate in the research data life cycle.
#7 ... (with some disciplinary views on data citation)
Skills & staffing
#3 Create Data Librarian posts and develop professional staff skills for data librarianship.
#1 … and the integration of data management into the curriculum.
17
18. O DIAGNÓSTICO E PLANEAMENTO
DA INTERVENÇÃO NAS
INSTITUIÇÕES
18
3/6
19. 6 regras para as Universidades
1. Compreender como a instituição lida com dados científicos.
2. Conceber um caso para Gestão de Dados e reunir apoios.
3. Definir o posicionamento da sua instituição sobre a GDC
para instituir uma política e estratégia.
4. Assegurar que os investigadores estão conscientes sobre os
dados que existem disponíveis.
5. Providenciar serviços robustos de armazenamento de dados
e fáceis de utilizar.
6. Tornar mais fácil aos outros encontrarem e citarem dados
de investigação.
19
20. Áreas estratégicas do plano de
intervenção 2014-2015 dos SDUM:
Diagnóstico & política
Serviços de suporte &
informação
Infraestruturas &
normalização
Competências &
recursos humanos
ConfOA 2014
22. UniversidadedoMinho Serviços de Documentação
Tem conhecimento
do projeto-piloto de
dados abertos da
Comissão Europeia
no âmbito do
programa quadro
H2020?
Possui algum plano
para a gestão de
dados resultantes
da sua investigação
(por exemplo, política de
preservação de dados,
política de gestão de
registos, estratégia de
eliminação de dados)?
80% NÃO
84% NÃO
16% SIM
Que tipo de serviços
gostaria que a
UMinho fornecesse
para garantir o
acesso aos dados?
73% sistema de backup
65% serviços de
armazenamento e
preservação
40% apoio técnico na
elaboração de Planos de
Gestão de dados
Diagnóstico: 1) passo - Inquérito sobre Dados
Científicos na Uminho (destaques)
23. Diagnóstico: 2) passo – comunidades piloto
Identificação, observação e descrição de 3 a 5 casos para estudo:
Trabalho baseado no DAF (Data Asset Framework) -
http://www.data-audit.eu
Questionários que identifica dados existentes e responsabilidades.
Com utilização adicional do CARDIO - http://cardio.dcc.ac.uk
Ferramenta para grupos de investigação avaliarem as suas capacidades de
gestão dos dados produzidos.
Preparar a informação das comunidades selecionadas de
acordo do guião DAF.
24. Dicas…
Discutir barreiras e fragilidades.
Identificar os principais parceiros para
embarcar nesta aventura.
Considerar a cultura institucional e o
ambiente interno.
25. A ASSOCIAÇÃO DOS CICLOS
DE VIDA DA INVESTIGAÇÃO
E DOS DADOS.
25
4/6
26. Digital Curation Centre - UK
Um visão integrada:
Gestão de Dados Científicos @ Seminário
BAD, 16 de setembro de 2014
26
27. PROCESSOS E ÁREAS DE AÇÃO NAS INSTITUIÇÕES
CICLO DE VIDA DA
INVESTIGAÇÃO
DMPs, dados existentes,
documentação,
metadados, datasets,
depositar, partilhar
CollaborateConceber Design Experiment Publish DivulgarAnalyseProjetar ColaborarTestar PublicarAnalisar
DOCUMENTAÇÃOCRIAÇÃOPLANEAMENTO
PARTILHAARMAZENAMENTOACESSO
Plataformas para
armazenamento, descrição e
de gestão dados
Aplicações para
Planeamento
Repositórios e
Revistas científicas
28. PROCESSOS E ÁREAS DE AÇÃO NAS INSTITUIÇÕES
CICLO DE VIDA DA
INVESTIGAÇÃO
DMPs, dados existentes,
documentação,
metadados, datasets,
depositar, partilhar
CollaborateConceber Design Experiment Publish DivulgarAnalyseProjetar ColaborarTestar PublicarAnalisar
Plataformas para
armazenamento, descrição e
de gestão dados
Aplicações para
Planeamento
Repositórios e
Revistas científicas
32. Projeto-piloto de Dados Abertos da CE
Linhas de orientação:
Projeto-piloto que visa melhorar e maximizar o
acesso e a reutilização dos dados de
investigação gerados por projetos.
Nos projeto participantes no piloto é requerido o deposito
de dados de investigação:
Outros dados, incluindo metadados associados,
necessários para validar os resultados apresentados em
publicações científicas, logo que possível;
dados associados, conforme especificado e dentro dos
prazos estabelecidos no plano de gestão de dados.
32
33. REQUISITOS NA PRÁTICA (simplificados)
Projeto-piloto de Dados Científicos Abertos
Criar um plano de gestão dos dados
Assegurar o depósito num repositório
Associar licenças CC
Providenciar ferramentas
O foco deve ser o planeamento >> para a disponibilização dos dados,
facilitando o depósito e a licença para permitir a reutilização.
34. Papel da biblioteca – na prática
34
National Science Foundation
http://youtu.be/Lc82pxxRkMo
37. Temas comuns da Formação GDC
nos programas de referências europeus
O que são dados?
Papéis de
responsabilidades
Políticas
Gestão de dados
Partilha de dados
DMPs
Ferramentas e
serviços
Armazenamento
Acesso
Questões éticas
Publicação
Preservação
Citação
Licenças
…
45. Precisamos de
Adquirir confiança!
E compreender as diferentes questões
técnicas e estratégicas.
Adquirir Formação! Arriscar fazer.
45
46. NÃO PODEMOS USAR A DESCULPA DA
INEXISTÊNCIA DE INFRAESTRUTURAS
TÉCNICAS PARA NADA FAZER…
Lição aprendida!
46
47. COM O FOCO NAQUILO QUE PODEMOS
TRAZER DE VALOR ACRESCENTADO
Vamos ser nós a apoiar a Gestão dos dados científicos
produzidos nas nossas instituições de ensino e investigação…
47
Notas do Editor
Assumption/overview
More opportunities to show significance/relevance
Have a vote first for all recommendations – show the color which fits best for you
What is the main color of all votes (for each of the 10 recommendations)
Resulta de um trabalho de análise da equipa de projetos Open Access
Define 10 eixos de intervenção
Enquadrados em 4 áreas estratégicas
33 ações programadas para 2014 e 2015
Analyzing several training resources we find some common themes (institutional level or national or border level)
An Open Educational Resource on RDM tailored for information professionals
Provided by EDINA and Data Library, University of Edinburgh in association with the UK Data Archive, Digital Curation Centre (DCC), and Distributed Data Curation Center at the Purdue University Libraries.
RDM Support is a basic training course in research data management (support) for information specialists. The training course was developed by Mariëtte van Selm for the information specialists of the Library of the University of Amsterdam (UvA), within the framework of the RDM Support project (2013-2015). The training course was held from January to April 2014.