Gestão de Dados Científicos

O  acesso aos dados abertos da ciência (open science, e-research, big data) abrem novas questões que estão sendo discutidas no tocante à infraestrutura, novas concepções de bancos de dados abertos onde os pesquisadores avaliam a qualidade, procedência e confiabilidade dos dados. Consequentemente, torna-se mandatório o estabelecimento de infraestrutura eletrônica (e-infrastructure) e de informação para fazer face aos desafios existentes. A complexidade do tema remete ao desenvolvimento de ferramentas e sistemas de informação que proporcionam uma identificação comum sobre a descoberta dos dados em todas as disciplinas, reduzindo a curva de aprendizado. O desenvolvimento de infraestruturas é influenciado por dimensões sociais, econômicas e tecnológicas. 

Diferentemente das publicações científicas, os dados de pesquisas exigem cuidados especiais na articulação de uma agenda comum, envolvendo agentes púbicos e privados, entidades financiadoras da pesquisa, pesquisadores e instituições produtoras de dados. Observa-se nos documentos referenciados como essas questões vêm sendo tratadas na União Europeia, em especial, no Reino Unido, Canadá e Estados Unidos onde são identificadas as principais tendências quanto ao formato organizacional. Pesquisadores acadêmicos, financiadores e instituições de pesquisa têm respondido às possibilidades de exploração dos dados de pesquisa, em nível nacional e internacional, apoiando uma série de centros de dados – organizações de regime jurídico público-privada, com responsabilidade de fornecimento de dados de pesquisa para a comunidade acadêmica – ocupando-se, na sua maior parte, da coleta, armazenamento e curadoria desses dados. Embora os pesquisadores possam optar por armazenar e compartilhar seus dados em diversas formas, os centros de dados têm evoluído na última década para prestação de serviços de consultoria na preparação e preservação dos dados com alta qualidade, atuando em redes de informação dentro e fora dos países onde foram criados. Na sua maior parte os centros são especializados no domínio dos conjuntos de dados (dataset), portanto são capazes de garantir que as coleções depositadas tenham alta visibilidade e estejam disponíveis para o maior número possível de interessados.

A literatura da Gestão de dados científicos está divida em três partes. Veja abaixo:

_______________________________________________________________________________________________________________________

Literatura de Gestão de Dados

Programas e Projetos de e- infraestrutura Global 

_______________________________________________________________________________________________________________________

Autor: DUTTON, W.

Título: Collaborative network organizations: new technical, managerial and social infrastructures to capture the value of distributed intelligence. Oxford Internet Institute DPSN Working Paper Series, n. 5, 17 Nov. 2008.

Local: Disponível em:< http://dx.doi.org/10.2139/ssrn.1302893 > pdf. Acesso em: 14 jun. 2012.

Descrição: O autor argumenta que os DSPNs (Distributed Problem-Solving Networks) reconfiguram os fluxos de informação e comunicação, de tal forma que possam melhorar o poder comunicativo de indivíduos em rede, atravessando fronteiras geográficas e organizacionais de modo a criar desafios para as empresas e organizações que buscam ser valoradas através de  DSPNs.

_______________________________________________________________________________________________________________________

Autor: FOSTER, I.; KESSELMAN, C.

Título: Computational grids. In: ______ (Ed.). The Grid: blueprint for a new computing infrastructure. Los Altos, CA: Morgan Kaufmann, 1999. p. 15-51. cap. 2.

Local:Disponível em: <http://www.elsevierdirect.com/companions/9781558609334/appendices/Chapter_02.pdf>. Acesso em: 29 jun. 2014.

Descrição: Neste capítulo introdutório, o autor lança as bases para um livro, fornecendo um quadro mais detalhado do objetivo esperado, forma e arquitetura de futuros sistemas de grade. O capítulo se estrutura em seis questões consideradas fundamentais para essa discussão: Por que precisamos de grades computacionais? Em que tipos de aplicativos as grades vão ser utilizadas? Quem usará grades? Como as grades serão usadas? O que é envolvido na construção de uma grade? E, que problemas devem ser resolvidos para fazer das grades um lugar comum? Fornecemos uma visão geral de cada uma dessas questões, referindo capítulos subsequentes para discussão mais detalhada.

_______________________________________________________________________________________________________________________

Autor: KROES, Neelie

Título: Open Science for the 21st century: A declaration of ALL European Academies. Rome, Accademia Nazionale dei Lincei, 11-12 April 2012.

Local: Disponível em:< http://cordis.europa.eu/fp7/ict/e-infrastructure/docs/allea-declaration-1.pdf >. Acesso em: 20 jun. 2014.

Descrição: Declaração de Neelie Kroes, Vice-Presidente da Comissão Europeia e Presidente da Agenda Digital por ocasião da Assembleia Geral de todas as academias da Federação Europeia de Academias Nacionais de Ciências e Humanidades. “A União Europeia tem liderado o movimento do Acesso Livre que continuará no programa Horizonte 2020, começando em 2014 com o e- infraestrutura, incluindo o desenvolvimento de sistemas de helpdesk regulares e interfaces web para tornar as redes de repositórios mais amigáveis e transparentes, como também incluir serviços avançados para buscar informações, vincular publicações e dados experimentais, processar e visualizar dados em ambientes virtuais, e para manter e atualizar aplicativos de armazenamento e softwares de preservação em longo prazo”.

_______________________________________________________________________________________________________________________

Autor:  MENDES, L. F. C.

Título: Uma Arquitetura orientada a agentes para gerenciamento, busca e recuperação de artefatos científicos. Dissertação (Mestrado em Modelagem Computacional)  Faculdade de Engenharia Civil, Universidade Federal de Juiz de Fora, Juiz de Fora, 2009. Biblioteca Digital Brasileira de Teses e Dissertações (BDTD).

Local: Disponível em: <http://www.ufjf.br/pgmc/files/2011/05/dissertacao_luiz_felipe_mendes.pdf?file=2011/05/dissertacao_luiz_felipe_mendes.pdf> . Acesso em: 30 maio 2014.

Descrição: A Computação Científica é uma área multidisciplinar que extrapola o uso do computador como simples máquina onde pesquisadores escrevem textos, apresentações ou guardam resultados de experimentos e análises. Com a evolução das pesquisas, e o uso cada vez maior de recursos computacionais aplicados aos experimentos e simulações realizados pelos grupos de pesquisa, é notório que os grupos de pesquisa se encontram em um novo patamar da computação científica representada através do conceito de e-Science. A e-Science está intimamente ligada ao processo de modelagem computacional.

_______________________________________________________________________________________________________________________

Autor:  MORAIS PIRES, C. ; HUDSON R. L.

Título: Open Infrastructures for Ciência Aberta; Horizon 2020 - consultation report. 

Local: Disponível em: <http://cordis.europa.eu/fp7/ict/e-infrastructure/docs/open-infrastructure-for-open-science.pdf>. Acesso em: 14 jul. 2014.

Descrição: Este documento é um roteiro sobre como e onde a Comissão considera e- Infraestrutura para Ciência Aberta, em especial, as infraestruturas de dados científicos, previstas na Agenda Digital da UE para a próxima década. Este documento de apoio à pesquisa e inovação foi elaborado a partir de uma série de comunicações, relatórios, oficinas e consultorias de especialistas - contratados na Europa e em outros países, refletindo uma perspectiva global. Apresenta diretrizes para o que será uma série de iniciativas de infraestrutura de dados, apoio a ações de alcance internacional, como parte do programa Horizonte 2020 (2014-2020). A Comissão propôs que cerca de € 1 bilhão em fundos devem ser alocados no Horizonte 2020 para e- Infraestruturas sob o título de "Excelência da Ciência”.

_______________________________________________________________________________________________________________________

Autor:  NARDI, A. R.

Título: Uma arquitetura de baixo acoplamento para execução de padrões de controle de fluxo em grades.  2009. Tese (Doutorado em Ciência da Computação) - Instituto de Matemática e Estatística, Universidade de São Paulo, São Paulo, 2009. Biblioteca Digital Brasileira de Teses e Dissertações (BDTD).

Local: Disponível em: http://www.teses.usp.br/teses/disponiveis/45/45134/tde-29052009-143125/pt-br.php .   Acesso em: 08 jun. 2014..

Descrição: O uso de padrões de workflow para controle de fluxo em aplicações de e-Science resulta em maior produtividade por parte do cientista, permitindo que se concentre em sua área de especialização. Todavia, o uso de padrões de workflow para paralelização em grades permanece uma questão em aberto. Este texto apresenta uma arquitetura de baixo acoplamento e extensível, para permitir a execução de padrões com ou sem a presença de grade, de modo transparente ao cientista. Descreve também o Padrão Junção Combinada, que atende a diversos cenários de paralelização comumente encontrados em aplicações de e-Science. Com isso, espera-se auxiliar o trabalho do cientista, oferecendo maior flexibilidade na utilização de grades e na representação de cenários de paralelização .(Resumo do autor)

_______________________________________________________________________________________________________________________

Autor:  PRINZ, W.; MARTINEZ-CARRERAS, M. A.; PALLOT, M.

Título: From Collaborative Tools to Collaborative Working Environments. International Journal of e-Collaboration, v. 6, n. 1, p. 1-13, Jan.-Mar. 2010. ISSN: 1548-3673.

Local: Disponível em:  <http://www.igi-global.com/article/collaborative-tools-collaborative-working-environments/40251> . Acesso em: 08 jun. 2014.

Descrição: Neste artigo são apresentadas as principais linhas de pesquisa sobre CSCW e groupware, que estão constituindo a fundação do núcleo de ambientes de trabalho colaborativo (CWE). Além disso, foram introduzidos os aspectos problemáticos em CWE e as características e recomendações para a integração de CWE nas organizações. Através dessa questão leitores vão aprender novos paradigmas para a construção de CWE, bem como indicações para medir e planejar a implementação de colaboração dentro das empresas, com o objetivo de obter o melhor desempenho. Por fim, apresenta-se uma breve introdução dos três artigos desta edição especial sobre CWE. Adaptado do documento de origem.

_______________________________________________________________________________________________________________________

Título: RIDING the Wave: high level expert group on scientific data: how Europe can gain from the rising tide of scientific data; European Union, 2010.

Local: Disponível em:  <http://cordis.europa.eu/fp7/ict/e-infrastructure/docs/hlg-sdi-report.pdf>.  Acesso em: 08 jun. 2014.

Descrição: Este relatório propõe a criação de infraestrutura de dados colaborativa para benefício da pesquisa e da sociedade acadêmica a partir de investimentos na capacitação de pesquisadores e formação de novos perfis profissionais para gerenciar dados de pesquisa. Visa à obtenção do máximo de benefícios a serem usufruídos pela sociedade e florescimento de novos negócios  no uso, reutilização e exploração dos dados de pesquisa. Nessa perspectiva, os dados da pesquisa são vistos como parte integrante da infraestrutura de pesquisa e são tão importantes e necessários como as redes e instalações de computação. Essa visão é amplamente aceita e apoiada por muitas organizações científicas, tornando-se parte de outros programas e projetos que estão em curso na Europa.

_______________________________________________________________________________________________________________________

Autor:  SCHOPF, J. M.; NEWHOUSE, S.

Título: User Priorities for Data: Results from SUPER. International Journal of Digital Curation, 2, n. 1, 2007.

Local: Disponível em:  <http://www.ijdc.net/index.php/ijdc/article/view/34>Acesso em: 30 jun. 2014.

Descrição: SUPER (Study of User Priorities for e-infrastructure for Research), um estudo de prioridades do usuário para e-infraestrutura de pesquisa, foi um esforço de seis meses financiado pelo Programa Básico de e-Ciência do Reino Unido (UK e-Science Core Programme) e JISC. Seu objetivo era informar sobre o investimento a ser feito, para prover e-infraestrutura utilizável, útil e acessível para todos os pesquisadores e um conjunto coerente de serviços de e-infraestrutura que cujo uso aumentasse por pelo menos um fator de dez em 2010. Através de uma série de entrevistas face-a-face não estruturadas com mais de 45 participantes de 30 projetos diferentes, um levantamento on-line, juntamente com um workshop de um dia inteiro no NeSC (National e-Science Centre), observamos a presença de problemas recorrentes relativos à provisão de e-infraestrutura. Este artigo trata de questões relacionadas a dados que froam identificadas durante essas interações. Concluímos com uma lista de prioridades de futuras atividades para pesquisa, desenvolvimento, e adoção no domínio dos dados.

_______________________________________________________________________________________________________________________

Autor:  SANTOS, I. F.

Título: Observatório solar virtual do CRAAM: compartilhamento de informações e conhecimentos em ambientes virtuais.  Dissertação (Programa Pós-Graduação em Engenharia Elétrica) – Universidade Presbiteriana Mackenzie - São Paulo, 2012. Biblioteca Digital Brasileira de Teses e Dissertações (BDTD).

Local: Disponível em: <http://tede.mackenzie.com.br//tde_busca/arquivo.php?codArquivo=2724>. Acesso em: 30 maio 2014.

Descrição: Este trabalho descreve os processos de análise e construção de um observatório solar virtual para o compartilhamento de informações e conhecimentos em ambientes virtuais na era da e-Science. Atualmente, diferentes observatórios, contando com profissionais especializados, capturam imagens com o uso de equipamentos, porém, esses dados nem sempre estão disponíveis para a comunidade científica mundial. Por exemplo, pode-se citar o caso do Complexo Astronômico El Leoncito - CASLEO, San Juan, Argentina, que gera dados solares que são encaminhados e armazenados em mídias óticas no Centro de Rádio Astronomia e Astrofísica Mackenzie...

_______________________________________________________________________________________________________________________

Autor:  SIMONETTE, M. J.

Título: Engenharia de sistemas em sistemas sociotécnicos. 2010. Dissertação (Mestrado em Sistemas Digitais) - Escola Politécnica, Universidade de São Paulo, São Paulo, 2010. Biblioteca Digital Brasileira de Teses e Dissertações (BDTD).

Local: Disponível em: <http://www.teses.usp.br/teses/disponiveis/3/3141/tde-16082010-170837/ >. Acesso em: 30 maio 2014.

Descrição: Este trabalho apresenta os métodos consensuais como uma proposta para reduzir as insatisfações das pessoas envolvidas no processo de levantamento de requisitos e respeitar as dimensões humanas e sociais já no inicio do ciclo de vida de um sistema sociotécnico, considerando a aderência desses métodos às demais fases do ciclo de vida.

_______________________________________________________________________________________________________________________

Título: A SURFBOARD  For Riding the wave: towards a four country action programme on research data. Relatório apresentado no workshop Knowledge Exchange “Research Data Management – Activities and Challenges” Bonn.

Local: Disponível em: <http://www.knowledge-exchange.info/Default.aspx?ID=469> . Acesso em: 12 jun. 2014.

Descrição: Este relatório é uma resposta à Riding the Wave, publicado pelo Grupo de Peritos de Alto Nível em dados científicos, tendo como consultores Maurits Van Der Graaff - Pleiade Management and Consultancy; O endereço de e-mail address está sendo protegido de spambots. Você precisa ativar o JavaScript enabled para vê-lo.e Leo Waaijers (ed) Open Access consultant; O endereço de e-mail address está sendo protegido de spambots. Você precisa ativar o JavaScript enabled para vê-lo.. Apresenta uma visão geral da situação atual em matéria de dados de pesquisa na Dinamarca, Alemanha, Países Baixos e Reino Unido. Elaboram as linhas gerais do programa de ação para os quatro países que estão desenvolvendo infraestrutura de dados colaborativa. Assinala que o programa de ação precisa do envolvimento de todos os intervenientes da comunidade científica, destacando quatro fatores-chave: (ı) incentivos e (ıı) formação dos pesquisadores tanto em seu papel de produtores de dados como de usuários de infraestruturas de informação, (ııı) infraestrutura organizacional e técnica (ıv) financiamento da infraestrutura em relação a novos desenvolvimentos na área de logística de dados.  O relatório oferece recomendações para cada um dos países parceiros. Com base na visão geral da situação o relatório formula três objetivos estratégicos em longo prazo: 1. A partilha de dados fará parte da cultura acadêmica; 2.A logística dos dados será um componente integral da vida profissional acadêmica; 3. A infraestrutura dará o tom, tanto operacional quanto financeiramente.

_______________________________________________________________________________________________________________________

Autor:  TECH, A. R. B.

Título: Desenvolvimento de uma ferramenta computacional para monitoramento e coleta de dados, baseado em conceitos de e-Science e Data Warehouse para aplicação na pecuária. 2008. Tese (Doutorado em Qualidade e Produtividade Animal) - Faculdade de Zootecnia e Engenharia de Alimentos, Universidade de São Paulo, Pirassununga, 2008. Biblioteca Digital Brasileira de Teses e Dissertações (BDTD).

Local: Disponível em: <http://www.teses.usp.br/teses/disponiveis/74/74131/tde-25032008-094134/pt-br.php>.  Acesso em: 30 maio 2014.

Descrição: Este trabalho estuda a viabilidade de um sistema de monitoramento e de coleta de dados através da WEB, com a construção de um e-Science Zootécnico. Foram desenvolvidos os sistemas, os meios de comunicação e monitoramento, além de um simulador de deslocamento, para otimização da distribuição de antenas e identificação dos animais. Os modelos Random Walk e Pseudo-Browniano foram utilizados para a implementação do simulador. O sistema de comunicação e o sistema gestor foram desenvolvidos e testados através de experimentos que permitiram a análise e a verificação de desempenho do sistema completo, intitulado de "e-LAFAC", que permite o controle integral do sistema, como a comunicação das estações fixas, com as estações móveis, através de uma rede de sensores sem fio. A metodologia utilizada no projeto, bem como os resultados obtidos, permite concluir que, o objetivo de acompanhar e monitorar o animal durante um experimento, com coleta de dados telemétricos em tempo real e à distância, foi alcançado.(Resumo do autor)

_______________________________________________________________________________________________________________________

Autor: URE, J.; IRSHAD, T.; HANLEY, Janet, et al.

Título: Complex, dynamic and distributed data: telehealth as a laboratory for strategy. International Journal of Digital Curation, v.6, n. 2, p. 128-145, 2011.

Local: Disponível  em: <http://www.ijdc.net/index.php/ijdc/article/view/187>. pdf. Acesso em: 11 jun. 2014.

Descrição: Dados de monitoramento do Telesaúde estão sendo coletados em grandes populações de pacientes com doenças crônicas, como acidente vascular cerebral, hipertensão, DPOC (doença pulmonar obstrutiva crônica) e demência. Esses grandes conjuntos de dados complexos e heterogêneos, incluindo sensor distribuído e conjuntos de dados móveis, apresentam oportunidades reais para descoberta de conhecimento e re-uso, no entanto, eles também geram novos desafios para curadoria. Este trabalho utiliza pesquisa qualitativa com os agentes intervenientes em dois projetos de telessaúde nacionalmente financiados para delinear as percepções, práticas e preferências dos diferentes agentes em relação a curadoria de dados. Telessaúde proporciona um laboratório vivo para os desafios muito diferentes implícitos na concepção e gestão de infraestrutura de dados para computação embarcada e pervarsiva. 

_______________________________________________________________________________________________________________________

Autor: VALENTE, W. A. G.

Título: SciProv: uma Arquitetura para a Busca Semântica em Metadados de Proveniência no Contexto de e-Science. Dissertação (Mestrado em Modelagem Computacional) — Universidade Federal de Juiz de Fora, Juiz de Fora, 2011. Biblioteca Digital Brasileira de Teses e Dissertações (BDTD).

Local: Disponível em: <http://www.ufjf.br/pgmc/files/2011/05/dissertacao_wander_antunes1.pdf?file=2011/05/dissertacao_wander_antunes1.pdf>. Acesso em: 30 maio 2014.

Descrição: A e-Science se caracteriza pela manipulação de um vasto volume de dados e utilização de recursos computacionais em larga escala, muitas vezes localizados em ambientes distribuídos. Nesse cenário, representado por alta complexidade e heterogeneidade, torna-se relevante o tratamento da proveniência de dados, que tem por objetivo descrever os dados que foram gerados ao longo da execução de um experimento científico e apresentar os processos de transformação pelos quais foram submetidos. Assim, a proveniência auxilia a formar uma visão da qualidade, da validade e da atualidade dos dados produzidos em um ambiente de pesquisa científica. O SciProv consiste em uma arquitetura cujo objetivo é interagir com sistemas de gerenciamento de workflows científicos para promover a captura e a gerência dos metadados de proveniência gerados.

_______________________________________________________________________________________________________________________

Autor: VOSS, A.; ASGARI-TARGHI, M.; PROCTER, R.; FERGUSSON, D.

Título: Adoption of e-Infrastructure services: configurations of practice. Philosophical Transactions of Royal Society A., v. 368, n. 1926, p. 4161-4176, 2 Aug. 2010.

Local: Disponível em: <http://dx.doi.org/10.1098/rsta.2010.0162> . pdf. Acesso em: 05 jun. 2014.

Descrição: Este artigo relata os resultados de um estudo de pesquisadores e pessoal de apoio em pesquisa de computação. Ele explora resultados de um estudo das relações sociais de apoio à adoção, adaptação e domesticação das tecnologias de e-pesquisa e as e-infraestruturas e faz recomendações para as agências financiadoras, fornecedores de tecnologia, prestadores de serviços e instituições.

_______________________________________________________________________________________________________________________

Autor: WILSON, J. A. J.; MARTINEZ-URIBE,  L.; FRASER,  M. A. ; JEFFREYS, Paul.

Título: An Institutional Approach to Developing Research Data Management Infrastructure. International Journal of Digital Curation, v. 6, no. 2, p. 274-287, 2011.

Local: Disponível em:< http://www.ijdc.net/index.php/ijdc/article/view/198%20%20pdf >. Acesso em: 11 jun. 2014.

Descrição: Este artigo descreve o trabalho que a Universidade de Oxford está realizando para implementar uma infraestrutura de gerenciamento de dados coordenada. A justificativa para a abordagem a ser feita por Oxford é apresentada, com especial atenção para o papel de cada divisão de serviço. Isso é seguido por uma reflexão sobre as vantagens e desvantagens relativas de repositórios de dados institucionais, ao contrário de centros de dados nacionais ou internacionais. O artigo foca em dois projetos em andamento financiados pelo JISC, ‘Embedding Institutional Data Curation Services in Research’ (Eidcsr, Serviços de Curadoria de Dados Institucionais Embutidos em Pesquisa) e ‘Supporting Data Management Infrastructure for the Humanities’ (Sudamih, Apoiando Infraestrutura de Gestão de Dados para as Humanidades).

_______________________________________________________________________________________________________________________

Autor: WHYTE, A.; JOB, D.; GILES, S.; LAWRIE, S.

Título: Meeting curation challenges in a neuroimaging group. International Journal of Digital Curation, v.3, n. 1, p. 171-181, 2008.

Local: Disponível  em:   <http://www.ijdc.net/index.php/ijdc/article/view/74>. pdf. Acesso em: 11 jun. 2014.

Descrição: O projeto SCARP consiste em uma série de estudos pequenos, com dois objetivos; em primeiro lugar descobrir mais sobre as abordagens disciplinares e atitudes em relação à curadoria digital através de 'imersão' em casos selecionados; em segundo lugar, para aplicar boas práticas conhecidas e, quando possível, identificar novas lições de prática em áreas disciplinares selecionadas. O estudo resumido aqui é do Grupo de Neuroimagem da Divisão de Psiquiatria da Universidade de Edimburgo, que desempenha um papel de liderança em colaborações em eScience para melhorar a infraestrutura para a integração e reutilização de dados de neuroimagem. O estudo analisa brevemente o contexto político e os desafios atuais para a integração e compartilhamento de dados na área de neuroimagem. Em seguida, ele descreve como riscos e oportunidades para a mudança em curadoria e preservação foram identificados ao longo do ciclo de vida de curadoria; e seu contexto apreciado através de um estudo de campo no local da pesquisa. 

_______________________________________________________________________________________________________________________

 Redes e Centros de Dados

______________________________________________________________________________________________________________________

Autor: ARCHAEOLOGY DATA SERVICE (ADS).University of York.

Local: Disponível em:  <http://archaeologydataservice.ac.uk>. Acesso em: 27 jun. 2014.

Descrição: ADS foi criada em 1997 pelo Conselho de Pesquisa de Artes e Humanidades como arquivo central de dados arqueológicos, na Universidade de York. Dispõe de renda própria gerada pela prestação de serviços e projetos desenvolvidos em consórcio com outras organizações, possuindo estrutura dedicada à coleta, descrição, catalogação e preservação dos dados. Oferece suporte aos pesquisadores sobre como disponibilizar produtos da pesquisa arqueológica em diferentes mídias digitais. É responsável pela divulgação de normas e padrões bem como pelo registro de melhores práticas sobre criação, descrição e preservação de dados para esta área. Atende pesquisadores, professores, profissionais e público em geral.

_______________________________________________________________________________________________________________________

Autor: BRITISH ATMOSPHERIC DATA CENTRE(BADC).

Local: Disponível em: <https://badc.nerc.ac.uk/home/index.html Acesso em 27 jun.2014>. Acesso em: 27 jun. 2014. 

Descrição: O Centro Britânico de Dados Atmosféricos (BADC) foi designado pelo conselho de pesquisa do Meio Ambiente (Natural Environment Research Council -NERC) como Centro de Dados para as ciências atmosféricas, provendo serviços de catalogação e acesso aos dados. O papel do BADC é auxiliar pesquisadores do Reino Unido a localizar, acessar e interpretar os dados atmosféricos bem como garantir a integridade em longo prazo de dados atmosféricos produzidos por projetos NERC.

_______________________________________________________________________________________________________________________

Autor: COMMITTEE ON DATA FOR SCIENCE AND TECHNOLOGY(CODATA).

Local: Disponível em: <http://www.codata.org/>. Acesso em: 15 jun. 2014.

Descrição: Foi fundado em 1966 como um comitê interdisciplinar do Conselho Internacional de Ciência (International Council of Science – ICSU), conhecido anteriormente como Conselho Internacional de Uniões Científicas. Busca melhorar a compilação, avaliação crítica, armazenamento e recuperação de dados de importância à ciência e tecnologia. Os valores das constantes físicas fundamentais recomendadas pelo CODATA são publicados no NIST - Reference on Constants, Units, and Uncertainty. O primeiro relatório CODATA foi publicado em 1973, o segundo em 1986 e o quarto em 2002, o quinto em 2006, e, finalmente, o último em 2010, conhecido como "CODATA 2010".

_______________________________________________________________________________________________________________________

Autor: CODATA Strategic Plan 2013-2018.

Local: Disponível em: <http://www.codata.org/>. Acesso em: 15 jun. 2014.

Descrição: O Comitê ad hoc de Coordenação Estratégica de Informação e Dados formado em 2009, criou os seguintes Termos de Referência para um periodo de 3 anos: • Estabelecer e afirmar um papel de liderança estratégica visível e eficaz, em nome da comunidade científica global, em relação à política, gestão e administração de dados científicos e informações; • Dar parecer sobre as necessidades de dados e possíveis soluções para novos e existentes programas ICSU e de outras iniciativas internacionais:

♦ Desenvolver uma estratégia coordenada para a formação, reforço da capacidade de manejo de dados e informações comum foco particular em países menos desenvolvidos,envolvendo as atividades da CODATA, ICSUWDS e outros organismos interdisciplinares relevantes; ♦ Promover discussões internacionais sobre os principais temas atuais e em evolução referentes a dados e questões de informação, incluindo o acesso global.

_______________________________________________________________________________________________________________________

Autor: CENTRO DE REFERÊNCIA EM INFORMAÇÃO AMBIENTAL- CRIA.  Campinas.

Local:Disponível em:  <http://www.cria.org.br/projetos>. Acesso em 05 jun. 2014.

Descrição:Associação civil, sem fins lucrativos tem por objetivo disseminar o conhecimento científico e tecnológico e promover a educação, visando a conservação e a utilização sustentável dos recursos naturais e a formação da cidadania. O CRIA tem como meta e estratégia a disseminação de informação eletrônica, como ferramenta na organização da comunidade científica e tecnológica do país. Atua especificamente na área de informação biológica, de interesse industrial e ambiental, e pretende, através de sua atuação, contribuir diretamente para a conservação e utilização racional da biodiversidade no Brasil. O projeto "Ampliação, Integração e Disseminação Digital de Dados Repatriados da Flora Brasileira" coordenado pelo Herbário Virtual da Flora e dos Fungos (INCT-HVFF) foi desenvolvido como parte do Programa Reflora do CNPq. O sistema integra um serviço de imagens de alta resolução com as informações textuais da rede species Link, de modo que cada espécime pode ter imagens associadas, seja da exsicata depositada no herbário ou de fotos em campo, enquanto ainda vivo, dentre outras possibilidades.

_______________________________________________________________________________________________________________________

Autor: DATA CENTRES: their use, value and impact. A Research Information Network report. Londres, Sept, 2011.

Local: Disponível em:< http://www.rin.ac.uk/our-work/data-management-and-curation/benefits-research-data-centres>. Acesso em: 12 jun.2014.

Descrição: No Reino Unido, pesquisadores acadêmicos, financiadores e  instituições têm apoiado uma série de centros de dados - organizações com responsabilidade para o fornecimento de dados de pesquisa para a comunidade acadêmica, dentro e fora do pais - atendendo  empresas interessadas na reutilização dos dados. Embora os pesquisadores possam optar por armazenar e compartilhar seus dados em diversas formas, os centros de dados, muitas vezes aparece como a melhor forma de garantir que os dados sejam preservados e apresentados com alta qualidade. A principal vantagem oferecida pelos centros de dados é a especialização no conjunto de dados (dataset), enquanto locais dedicados ao tratamento e, em muitos casos, garantem que os dados estejam prontos para reutilização, ajudando pesquisadores a prepará-los para o depósito.

_______________________________________________________________________________________________________________________

Autor: ECONOMIC AND SOCIAL DATA SERVICE (ESDS), Essex, UK.

Local: Disponível em: <http://ukdataservice.ac.uk/ >. Acesso em: 01 julho 2014.

Descrição: O ESDS (Economic and Social Data Service) é o principal serviço de fornecimento de dados dentro do UK Data Archive (UKDA, Arquivo de Dados do Reino Unido), e baseia-se numa colaboração entre o UKDA e o Institute for Social and Economic Research (ISER, Instituto de Pesquisa Social e Econômica) da Essex University (Universidade de Essex), e o Cathie Marsh Centre for Census and Survey Research (CCSR, Centro Cathie Marsh para Censo e Pesquisas de Levantamentos) e Mimas da University of Manchester (Universidade de Manchester). Destina-se a adquirir, promover curadoria e fornecer acesso a maior coleção de dados sociais e econômicos do Reino Unido. O catálogo principal do ESDS tem cerca de 5 mil 'coleções', cada uma das quais pode conter uma série de conjuntos de dados que variam de um a vários milhares. Ele mantém dados de, entre outros, levantamentos governamentais de grande escala, bancos de dados multinacionais agregados e dados de levantamentos, principais levantamentos do Reino Unido que seguem indivíduos ao longo do tempo e estudos de coorte. A ESDS é financiada principalmente pelo Economic and Social Research Council (ESRC, Conselho de Pesquisa Econômica e Social), juntamente com o Joint Information Systems Committee (JISC, Comitê Conjunto de Sistemas de Informação) fazendo uma contribuição significativa (390 mil libras de um total de cerca de 2 milhões). Seus principais públicos são acadêmicos, profissionais, decisores políticos e o público em geral.

_______________________________________________________________________________________________________________________

Autor: EDINA. UNIVERSITY DATA LIBRARY.

Local: Disponível em: <http://edina.ac.uk/ >. Acesso em: 01 julho 2014.

Descrição: EDINA é o Centro de Dados Nacional do Reino Unido designado pelo Jisc funcionando na University of Edinburgh.

_______________________________________________________________________________________________________________________

Autor: EUROPEAN BIOINFORMATICS INSTITUTE (EBI)

Local: Disponível em: <http://www.ebi.ac.uk/>. Acesso em: 04 jun.2014.

Descrição: O Instituto Europeu de Bioinformatica é uma das organizações componentes do Laboratório Europeu de Biologia Molecular (European Molecular Biology Laboratory – EBML). Foi criado em 1994 como parte do Programa  Genoma (Wellcome Trust Genome) no Campus da Universidade de Cambridge. É responsável pela mais completa coleção de bases de dados  de biologia molecular e coordena os esforços de disseminação de informações da comunidade europeia nesse campo de atuação. Provê acesso a 64 conjunto de dados, todos eles disponíveis para download no seu site. Cobre várias áreas incluindo sequenciamento de DNA e RNA, genomas, dados micro-matrizes, sequenciamento de proteínas, estruturas macromoleculares, interações proteina-proteina. Fornece literatura cientifica através do portal. A maior parte do financiamento do EBI vem dos governos dos 20 Estados membros do EMBL. No entanto, outros financiadores incluem a Comissão Europeia, Wellcome Trust, EUA Institue Nacional de Saúde, Conselhos de Pesquisa do Reino Unido, parceiros da indústria e do governo do Reino Unido. O público principal do EBI é a comunidade acadêmica, embora seus produtos estejam disponíveis gratuitamente para todos os usuários.

_______________________________________________________________________________________________________________________

Autor: INSTITUTO MAX PLANCK DE PSICOLINGUÍSTICA . O Arquivo Idioma - Arquivo de Dados.

Local: Disponível em: <http://www.mpi.nl/research/research-projects/the-language-archive/data-archive>. Acesso em: 04 jun.2014.

Descrição: JISC - criado como  Comitê de Sistemas de Informação, mas ao longo da última década evoluiu para uma empresa sendo então conhecido como JISC.

_______________________________________________________________________________________________________________________

Autor: OPEN KNOWLEDGE FOUNDATION (OKF).  Cambridge, UK. 

Local: Disponível em: <http://www.okfn.org>.  Acesso em: 04 jun.2014.

Descrição: Criada em 24 de Maio de 2004 esta organização sem fins lucrativos promove o acesso a conteúdos e dados abertos designados pela fundação como open knowledge. Oferece serviços de pesquisa, consultoria e análise para governo, instituições de pesquisa, sociedade civil e empresas na definição de suas necessidades em torno de dados abertos, desenvolvimento de políticas e melhores práticas através de ferramentas de código aberto, oferecendo gerenciamento e guarda de dados, operável  em rede. Software com ferramentas de visualização. Experiência com ONGs para análise dos dados usando ferramenta em estudos de impacto e soluções para avaliações de projeto. Programas de treinamento para governos, organizações da sociedade civil e outros grupos de interesse em colaborações diversas para organização de consórcios ou redes.

_______________________________________________________________________________________________________________________

Autor: NATIONAL GEOSCIENCE DATA CENTRE (NGDC) Nottingham, UK.

Local: Disponível em: <http://www.bgs.ac.uk/services/ngdc/ >. Acesso em: 01 jul. 2014.

Descrição: O NGDC foi criado em 1983, e está localizado na sede do British Geological Survey (BGS, Levantamento Geológico Britânico). Destina-se a manter, linkar e fornecer acesso aos dados gerados pelo BGS, além de dados fornecidos por organizações externas. O NGDC detém mais de 9 milhões de itens, alguns dos quais datam de mais de 200 anos. Os dados incluem conjuntos de dados de ciências da terra, coleções físicas, registros e outras informações reunidas ou criadas pelo BGS, e informações semelhantes de organizações, incluindo empresas petrolíferas e a Coal Authority (Agência do Carvão). O NGDC é financiado pelo BGS, ele próprio financiado pelo Natural Environment Research Council (NERC, Conselho de Pesquisa em Ambiente Natural), e seus principais públicos é acadêmicos, decisores políticos, as empresas e o público em geral.

_______________________________________________________________________________________________________________________

Autor: OPPORTUNITIES FOR DATA EXCHANGE (ODE).

Local: Disponível em:<http://www.ode-project.eu> . Acesso em: 01 jul. 2014.

Descrição: Projeto financiado pela Comissão Européia (FP7). ODE identifica, recolhe, interpreta e fornece evidências de melhores práticas emergentes no compartilhamento, reutilização, curadoria e citação dados. Documenta fatores de mudança e barreiras para o progresso nesta área. Parceiros ODE são membros da Aliança para o Acesso permanente (APA) e representados por instituições com influência significativa em suas comunidades, como: European Organization for Nuclear Research (CERN), Alliance for Permanent Access (APA), Finnish IT Center for Science (CSC), Helmotz Association of German Research Centres (HA, represented by Alfred Wegener Institute), Science and Technology Facilities Council (STFC), British Library (BL), Deutsche Nationalbibliothek (DNB), The Stichting LIBER Foundation (LIBER),The International Association of STM Publishers (STM).

_______________________________________________________________________________________________________________________

Autor OPPORTUNITIES FOR DATA EXCHANGE (ODE).  Sharing data: the ODE Project 3– Ten tales of Drivers & Barriers in Data Sharing.

Local: Disponível em: <http://www.ode-project.eu>.  Acesso em: 3 jun. 2014

Descrição: Relatório apresentado ao Parlamento Europeu em 20 de outubro de 2011 sobre casos de sucesso e lições aprendidas na área de  compartilhamento, reuso e preservação de dados, descrevendo o desempenho de projetos nesta área. Destinam-se a ajudar os interessados ​​a apreciar o grande potencial de inovação, bem como barreiras para o sucesso nesse campo. Esses dez relatos de experiências, selecionados pelo projeto Oportunidades para Intercâmbio de Dados (Opportunities dor Data Exchange  - ODE), são baseados em entrevistas pessoais com líderes da comunidade científica, de estruturas de pesquisa, de gestão e de iniciativas para estabelecimento de políticas.

_______________________________________________________________________________________________________________________

Autor: RDA RESEARCH ALLIANCE DATA (RDA).

Local: Disponível em: <https://rd-alliance.org/sites/default/files/attachment/RDA%20Organisational%20Membership%20Application_0.docx> <https://rd-alliance.org/about/organisation.html >.  Acesso em 3 jun. 2014

Descrição: As atividades da Aliança de Dados de Pesquısa (Research Alliance Data -RDA) começaram efetivamente em agosto de 2012 a partir do estabelecimento de um Grupo internacional de agências de financiamento nos Estados Unidos, União Européia e Austrália. O Grupo Diretor foi encarregado de desenvolver a RDA, definir seu estatuto e estrutura organizacional, bem como, promover seus objetivos, buscando recursos para desenvolvimento suas atividades. Esta iniciativa está em andamento, tendo apresentado uma primeira proposta na reunião plenária RDA, em Gotemburgo em março de 2013. Os grupos que compõem a RDA estão sendo estabelecidos, sob a forma de Grupos de Trabalho, tendo sido criado um Conselho e uma secretaria para iniciar as atividades. A intenção é eleger progressivamente ou nomear membros para todos os grupos organizacionais que comporão a RDA enquanto esta avança para seu pleno funcionamento. Questões de governança foram também discutidas durante o lançamento da Sessão Plenária da RDA em março. Os Grupos de Coordenação cuidam da gestão diária, apoiam e incentivam os grupos de trabalho de interesse da RDA. Os grupos de coordenação são elementos-chave para a sua governança, incluindo os principais órgãos administrativos como Conselho, Colóquio, Secretariado, Assessoria Técnica, Estrutura de Gestão não Governamental (NGS).

_______________________________________________________________________________________________________________________

Autor RESEARCH DATA CANADA (RDC). Vision for Research Data in Canada.

Local: Disponível em: <http://rds-sdr.cisti-icist.nrc-cnrc.gc.ca/eng/about/index.html >. Acesso em: 04 jun. 2014.

Descrição: Noticia veiculada na web mostrando o Canadá como um país que organiza e disponibiliza dados abertos para a ciência cidadã, elabora políticas baseadas em evidências, buscando  amplo envolvimento público com os dados da pesquisa onde a ciência floresce com possibilidades de criação de escalas de valor no setor econômico. Os dados da pesquisa são considerados um bem público e existe reconhecimento do valor da informação para além da comunidade de pesquisa. O objetivo é que todos os setores da sociedade, incluindo a indústria, os pesquisadores, produtores de dados e o público em geral explorem ativamente dados de pesquisa para fins  comercial, saúde, política, e outros propósitos criativos.  Enfatiza que os dados de pesquisa no Canadá são sistematicamente geridos, preservados, e reutilizados para avançar na liderança e inovação do Canadá na economia digital global.

_______________________________________________________________________________________________________________________

Autor RESEARCH INFORMATION NETWORK (RİN), Londres, UK.

Local: Disponível em: <www.rin.ac.uk/data-centres>. Acesso em: 07 jul. 2014.

Descrição: Em dezembro de 2011 esta rede de informação para a pesquisa, completou sua missão enquanto instituição pública de financiamento e política da pesquisa cientifica com a extinção do consórcio de fundadores  que lhe deu origem, formado por conselhos de educação superior,  sete conselhos de pesquisa e três bibliotecas nacionais do Reino Unido. Em janeiro de 2012 saiu do escritório da Britsh Library e se tornou uma empresa público-privada provendo serviços sobre fontes de informação, políticas e estratégias de negócios para pesquisadores e empresas interessadas na utilização de dados de pesquisa. Operando diretamente com um portifólio de serviços colocados na web apresenta  também uma lista de publicações de pesquisas e estudos de casos em texto integral de acesso livre. Disponível em: <www.researchinfonet.org>. Acesso em: 20 jul. 2014.

_______________________________________________________________________________________________________________________

Autor UK DATA ARCHIVE.

Local: Disponível em: <http://www.data-archive.ac.uk/ >. Acesso em: 20 jul. 2014.

Descrição: Contém a maior coleção de dados digitais de pesquisas econômicas e sociais no Reino Unido. Ele adquire, faz curadoria, e permite o acesso a bases de dados, fornecendo o suporte e infraestrutura técnica para a comunidade cumprir as exigências das políticas definidas pelos órgãos de financiamento e conselhos de pesquisa. Atualmente abriga vários milhares de conjuntos de dados. O arquivo é em grande parte financiado pelo ESRC, o JISC e abrigado pela Universidade de Essex.

_______________________________________________________________________________________________________________________

Autor UK SOLAR SYSTEM DATA CENTRE (UKSSDC. Oxfordshire, UK.

Local: Disponível em: <http://www.ukssdc.ac.uk/ >. Acesso em: 01 jul. 2014.

Descrição: UKSSDC (UK SOLAR SYSTEM DATA CENTRE) está em operação há mais de 50 anos, embora em uma escala relativamente pequena. Seu objetivo é fornecer um portal, e arquivos adequadamente mantidos de dados internacionais do sistema solar, para uso pela comunidade de sistema solar do Reino Unido. Seu ponto forte é a série de dados temporais, e permite também, em tempo real, acesso a dados provenientes de várias fontes internacionais. O principal financiador do UKSSDC é o Science and Technology Facilities Council (STFC, Conselho de Instalações de Ciência e Tecnologia), e seu público principal são acadêmicos, embora os dados também sejam utilizados pela indústria, em particular os do setor das comunicações.

_______________________________________________________________________________________________________________________

Ferramentas para Publicação e Citação de Dados de Pesquisa e Objetos Digitais

______________________________________________________________________________________________________________________

Autor: AALBERSBERG,  IJ. J.; KÄHLER,  O. 

Título: Supporting Science through the Interoperability of Data and Articles. D-Lib Magazine, v. 17, n. 1 / 2, 2011. doi:10.1045/january2011-aalbersberg.  

Local: Disponível em: <http://www.dlib.org/dlib/january11/aalbersberg/01aalbersberg.html> . Acesso em: 16 jun. 2014.

Descrição: Embora seja prática estabelecida publicar resultados relevantes de um projeto de pesquisa em um artigo científico ainda  não existem normas sobre se e como tornar os dados subjacentes da pesquisa acessíveis ao público. De acordo com o recente estudo PARSE. Insight da União Européia, mais de 84% dos cientistas acham que é útil ligar dados de pesquisas digitais subjacentes com literatura revisada por pares. Essa tendência é reforçada por organismos de financiamento, os quais - em larga extensão - exigem que os pesquisadores financiados depositem seus conjuntos de dados brutos em repositórios de acesso gratuito. E também a indústria editorial acredita que conjuntos de dados brutos devem se tornar livremente acessível. Este artigo apresenta uma visão geral de como a Elsevier, como editora científica com mais de 2 mil revistas, contextualiza artigos que estão disponíveis em texto completo em sua plataforma SciVerse ScienceDirect, linkando dados no nível do artigo, no nível da entidade, e de uma maneira totalmente integrada, que estejam hospedados externamente. Com esse panorama, Elsevier convida repositórios de conjuntos de dados para colaborar com as editoras para criar uma interoperabilidade ideal entre a literatura científica formal e os dados da pesquisa associados – para melhorar o fluxo de trabalho científico e, finalmente, para apoiar a ciência.

 _______________________________________________________________________________________________________________________

Autor: ALTMAN, M.

Título: A fingerprint method for verification of scientific data. In: Advances in Systems, Computing Sciences and Software Engineering (Proceedings of the International Conference on Systems, Computing Sciences and Software Engineering 2007). Springer Verlag, 2008.

Local: Disponível em: <http://thedata.org/publications/fingerprint-method-verification-scientific-data>. Acesso em: 14 jun. 2014.

Descrição: Este artigo discute um algoritmo (chamado de "UNF") para verificar matrizes de dados digitais. Esse algoritmo é agora usado em uma série de pacotes de software e projetos de bibliotecas digitais. Discutem-se os detalhes do algoritmo, e se oferece uma extensão para a normalização do tempo e duração de dados.

_______________________________________________________________________________________________________________________

Autor: ALTMAN, M.; KING, G.

Título: A Proposed Standard for the Scholarly Citation of Quantitative Data. D-Lib Magazine,  v.13, n. 3/4, 2007. doi:10.1045/march2007-altman.

Local: Disponível  em: <http://thedata.org/publications/proposed-standard-scholarly-citation-quantitative-data>. Acesso em: 14 jun. 2014.

Descrição: Um aspecto essencial da ciência é uma comunidade de estudiosos cooperando e competindo na busca de objetivos comuns. Um componente crítico dessa comunidade é a língua comum e as normas universais para citação acadêmica, atribuição de crédito, localização e recuperação de artigos e livros. Propomos um padrão universal semelhante para citar dados quantitativos que retém as vantagens de citações aos impressos, adiciona outros componentes graças à forma digital e à natureza sistemática de conjuntos de dados quantitativos, e é consistente com a maioria de abordagens do subcampo específicas existentes. Embora o campo da biblioteca digital inclua numerosas idéias criativas, nós nos limitamos apenas aos elementos que parecem prontos para uso prático e fácil por cientistas, editores de revistas, editoras, bibliotecários e arquivistas.

_______________________________________________________________________________________________________________________

Autor: BRASE, J.; FARQUHAR, A. (Ed.).

Título: Introduction. Access to Research Data . D-Lib Magazine, v.17, n. 1/2, Jan./Feb. 2011.  

Local: Disponível em: <http://www.dlib.org/dlib/january11/brase/01brase.html>.  Acesso em: 14 jun. 2014.

Descrição: Cientistas de todo o mundo estão abordando a necessidade de aumentar o acesso aos dados de pesquisa. A ciência é internacional e cooperação global é um imperativo. DataCite, lançado em dezembro de 2009, é uma associação de mais de uma dúzia de membros de 10 países, e em crescimento, que permite aos pesquisadores localizar, identificar e citar os conjuntos de dados de pesquisa com confiança, e desempenha um papel de liderança global na promoção do uso de identificadores permanentes para conjuntos de dados. Em junho de 2010, a primeira reunião de verão do DataCite ocorreu em Hannover, Alemanha, e proporcionou um fórum para 25 palestrantes de cerca de 100 participantes da Europa, América do Norte e Austrália, para troca de informações para manipulação de dados de pesquisa. Esta edição especial do D-Lib Magazine inclui oito artigos derivados das palestras proferidas na reunião de verão e um artigo adicional sobre a qualidade dos dados de pesquisa. Juntos, esses artigos fornecem um instantâneo do estado-da-arte sobre esses temas.

_______________________________________________________________________________________________________________________

Autor: CROSAS, M.

Título: A data sharing story. Journal of eScience Librarianship, Vol. 1 Iss. 3 (2012).

Local: Disponível em: <http://escholarship.umassmed.edu/jeslib/vol1/iss3/7/ >. Acesso em: 14 jun. 2014.

Descrição: Desde os primeiros dias da ciência moderna até este século de Big Data, o compartilhamento de dados tem permitido alguns dos maiores avanços na ciência. Na era digital, a tecnologia pode facilitar práticas mais eficazes e eficientes de compartilhamento de dados e de preservação, e fornecer incentivos para tornar os dados mais accesíveis entre os pesquisadores. No Instituto de Ciências Sociais Quantitativa da Universidade de Harvard foi desenvolvido um software de código aberto para compartilhar, citar, preservar, descobrir e analisar os dados, chamado Dataverse Network. Compartilha-se aqui a motivação do projeto, o seu crescimento e sucesso, e evolução provável.

______________________________________________________________________________________________________________________

Autor: CROSAS, M.

Título: The Dataverse Network®: An Open-Source Application for Sharing, Discovering and Preserving Data. D-Lib Magazine, v.. 17, n. 1 / 2, 2011. doi:10.1045/january2011-crosas.

Local: Disponível em: <http://www.dlib.org/dlib/january11/crosas/01crosas.html>. Acesso em: 14 jun. 2014.

Descrição: A Rede Dataverse é um aplicativo de fonte aberta para publicar, referenciar, extrair e analisar dados de pesquisa. O principal objetivo da Rede Dataverse é resolver os problemas de compartilhamento de dados através do desenvolvimento de tecnologias que permitam que as instituições reduzam a carga para pesquisadores e editores de dados para incentivá-los a compartilhar seus dados. Ao instalar o software Dataverse Network, uma instituição é capaz de hospedar vários arquivos virtuais individuais, chamados de "dataverses" para acadêmicos, grupos de pesquisa, ou revistas, proporcionando uma estrutura de publicação de dados que suporta reconhecimento do autor, citação permanente, descoberta de dados e preservação. Dataverse não requer custos de hardware ou software, nem de manutenção ou backups pelo proprietário dos dados, mas ainda permite visibilidade completa na web e créditos ao proprietário dos dados.

_______________________________________________________________________________________________________________________

Autor: FENNER, M.: LIN, J.

Título: Novel research impact indicators.Liber Quarterly,v.23, n. 4, 2014 p.237. URN:NBN:NL:UI:10-1-116067 Special Issue on “Research data and new forms of scholarly communication”.

Local: Disponível em: <http://liber.library.uu.nl/>.  <http://liber.library.uu.nl/index.php/lq/article/view/8427 >.Acesso em: 19 jun. 2014

Descrição: Contagens de citações e, mais recentemente, de estatísticas de uso fornecem informações valiosas sobre a atenção e o impacto da pesquisa associada a publicações acadêmicas. A editora de acesso livre da Public Library of Science (PLoS) foi pioneira no conceito de métricas em nível de artigo, onde essas métricas são coletadas por artigo e não  por revista, e são complementadas por dados em tempo real extraídos  da web social ou altmetrics: blogs, bookmarks sociais, mídia social e outros.

_______________________________________________________________________________________________________________________

Autor: HENSE, A.; QUADT, F.

Título: Acquiring high quality research data. D-Lib Magazine, v. 17, n. 1/2, 2011. doi:10.1045/january2011-hense. 

Local: Disponível em: <http://www.dlib.org/dlib/january11/hense/01hense.html>. Acesso em: 14 jun. 2014.

Descrição: No momento, a publicação de dados é um dos temas mais dinâmicos na e-Pesquisa. Enquanto os problemas fundamentais da publicação do texto eletrônico foram resolvidos na última década, as normas para a organização interna e externa de repositórios de dados estão avançadas em algumas disciplinas de pesquisa, mas subdesenvolvidas em outras. Nós discutimos as diferenças entre uma publicação de texto eletrônico e uma publicação de dados e os desafios que resultam dessas diferenças para o processo de publicação de dados. Colocamos o processo de publicação de dados no contexto da espiral do conhecimento humano e discutimos fatores chave para a aquisição bem sucedida de dados de pesquisa do ponto de vista de um repositório de dados. Para as atividades relevantes do processo de publicação, listamos algumas das medidas e as melhores práticas de repositórios de dados bem sucedidos.

_______________________________________________________________________________________________________________________

Autor: KLUMP, J.

Título: Criteria for the Trustworthiness of Data Centres. D -Lib Magazine, v. 17, n. 1/2, 2011. doi:10.1045/january2011-klump.

Local: Disponível em: <http://www.dlib.org/dlib/january11/klump/01klump.html>.  Acesso em: 14 jun. 2014.

Descrição: A utilização de identificadores permanentes para identificar conjuntos de dados como parte do registro da ciência implica que os objetos de dados são eles mesmos permanentes. Descobertas científicas, documentos históricos e realizações culturais são cada vez mais apresentados em formato eletrônico, e em muitos casos apenas nele. No entanto, além das vantagens inestimáveis oferecidas por esse meio, ele também traz sérias desvantagens. A rápida obsolescência da tecnologia necessária para ler a informação, combinada com a decadência física frequentemente imperceptível dos próprios meios, representa uma séria ameaça para a preservação do conteúdo da informação. Já que projetos de pesquisa são executados apenas por um período relativamente curto de tempo, é aconselhável passar o ônus da responsabilidade pela curadoria de dados, em longo prazo, do pesquisador individual para um repositório de dados confiável ou arquivo. Mas o que torna confiável um repositório de dados? A confiabilidade de um repositório digital pode ser testada e avaliada com base em um catálogo de critérios. Esses catálogos também podem ser usados ​​como base para desenvolver um procedimento de auditoria e certificação da confiabilidade do repositório digital.

_______________________________________________________________________________________________________________________ 

Autor: PIWOWAR, H.A; DAY, R.S; FRIDSMA, D.B.

Título: Sharing Detailed Research Data Is Associated with Increased Citation Rate. PLoS ONE, v. 2, n. 3, p. 308, 2007. doi:10.1371/journal.pone.0000308.

Local: Disponível em:  <http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0000308>. Acesso em: 14 jun. 2014.

Descrição: Compartilhar dados de pesquisa é benefício para a comunidade científica em geral, mas a vantagem é menos evidente para o pesquisador que torna seus dados disponíveis. Foram examinadas as histórias de citação de 85 publicações de ensaios clínicos de microarray de câncer, no que diz respeito à disponibilidade de seus dados. Os 48% dos ensaios com dados de microarrays disponíveis publicamente receberam 85% das citações agregadas. Dados publicamente disponíveis foram significativamente (p = 0,006) associado com um aumento de 69% nas citações, independentemente do fator de impacto da revista, data de publicação e país de origem do autor, por meio de regressão linear. Essa correlação entre os dados disponíveis publicamente e maior impacto da literatura pode motivar ainda mais os pesquisadores a compartilhar seus dados detalhados da pesquisa.

_______________________________________________________________________________________________________________________ 

Autor: SMIT, E.

Título: Abelard and Héloise: why data and publications belong togetherD -Lib Magazine, v. 17, n. 1/2, 2011. doi:10.1045/january2011-smit.

Local: Disponível em: <http://www.dlib.org/dlib/january11/smit/01smit.html>.  Acesso em: 14 jun. 2014.

Descrição: Este artigo explora o estado atual da integração entre dados e publicações. Os resultados estatísticos são baseados no PARSE.Insight, projeto que foi realizado com financiamento da UE em 2008 – 2010. A principal conclusão tirada a partir desses resultados é que, atualmente, existem muito poucas convenções e boas práticas entre pesquisadores e editores em como manipular dados. Existe forte preferência entre pesquisadores e editores igualmente para que dados e publicações sejam ligados de uma forma persistente. Para isso ser alcançado, espera-se boa colaboração em toda a cadeia de informação de autores, institutos de pesquisa, centros de dados, bibliotecas e editoras. DataCite é um excelente exemplo de como isso pode funcionar.

_______________________________________________________________________________________________________________________ 

Autor: STARR, J.; GASTL,  A.

Título: isCitedBy: a metadata scheme for datacite. D-Lib Magazine, v. 17, no. 1 / 2, 2011. doi:10.1045/january2011-starr.

Local: Disponível em:<http://www.dlib.org/dlib/january11/starr/01starr.html>. Acesso em: 16 jun. 2014.

Descrição: O Esquema de Metadados DataCite está sendo projetado para suportar citação de conjunto de dados e descoberta. Dispõe de um pequeno conjunto de propriedades obrigatórias, e um conjunto adicional de propriedades opcionais para descrição mais detalhada. Entre essas está um mecanismo poderoso para descrever relações entre o conjunto de dados registrado e outros objetos. O esquema é suportado organizacionalmente e permitirá a entrada de dados pela comunidade em uma base contínua.

_______________________________________________________________________________________________________________________ 

Autor: WAAIJERS, L.; VAN DER GRAAF, M.

Título: Quality of Research Data, an Operational Approach. D-Lib Magazine, v. 17, n. 1 / 2, 2011. doi:10.1045/january2011-waaijers.

Local: Disponível em: <http://www.dlib.org/dlib/january11/waaijers/01waaijers.html>. Acesso em: 14 jun. 2014.

Descrição: Este artigo relata um estudo, encomendado pela SURFfoundation, sobre os aspectos operacionais do conceito de qualidade para as várias fases do ciclo de vida de dados de pesquisa: produção, gestão e uso/reutilização. Recomendações em potencail para melhoria da qualidade foram obtidas a partir de entrevistas e um estudo da literatura. Essas recomendações foram testadas através de uma pesquisa acadêmica nacional de três domínios disciplinares, conforme designado pela Fundação Europeia da Ciência: Ciências Físicas e Engenharia, Ciências Sociais e Humanas e Ciências da Vida. A "popularidade" de cada recomendação foi determinada através da comparação da sua importância percebida contra as objeções a ela. Nessa base, foi possível a elaboração de recomendações genéricas e específicas para cada disciplina para ambos os prós e os contras.

_______________________________________________________________________________________________________________________