As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As...

154
Paulo Fernando Pereira da Silva As Políticas de Open Data em Portugal: análise da sua implementação e impacto Dissertação de Mestrado em Ciência da Informação, orientada pela Doutora Maria Manuel Borges e coorientada pela Doutora Daniela de Filippo, apresentada ao Departamento de Filosofia, Comunicação e Informação da Faculdade de Letras da Universidade de Coimbra 2017

Transcript of As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As...

Page 1: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação

Paulo Fernando Pereira da Silva

As Poliacuteticas de Open Data em Portugal anaacutelise da sua implementaccedilatildeo e impacto

Dissertaccedilatildeo de Mestrado em Ciecircncia da Informaccedilatildeo orientada pela Doutora Maria Manuel Borges e coorientada pela Doutora Daniela de Filippo

apresentada ao Departamento de Filosofia Comunicaccedilatildeo e Informaccedilatildeo da Faculdade de Letras da Universidade de Coimbra

2017

Imagem Open Data CC BY-NC-ND httpwwwchefuturoit

Faculdade de Letras

As poliacuteticas de Open Data em Portugal

Anaacutelise da sua implementaccedilatildeo e impacto

Ficha Teacutecnica

Tipo de trabalho Dissertaccedilatildeo de Mestrado Tiacutetulo As poliacuteticas de Open Data em Portugal anaacutelise da sua

implementaccedilatildeo e impacto Autores Paulo Fernando Pereira da Silva

Orientador Prof Doutora Maria Manuel Borges Coorientador Prof Doutora Daniela de Filippo

Identificaccedilatildeo do Curso 2ordm Ciclo em Ciecircncia da Informaccedilatildeo Data da entrega

Data de realizaccedilatildeo das provas

Membros do Juacuteri Presidente

Vogais

Classificaccedilatildeo

14-06-2017 28-07-2017 Prof Doutora Maria da Graccedila Melo Simotildees Prof Doutora Maria Manuel Lopes Figueiredo Costa Marques Borges Prof Doutor Andreacutes Pandiella Dominique 19

ii

iii

Aos meus pais Gracinda e Fernando

Agrave Sara namorada companheira e amiga

iv

v

AGRADECIMENTOS

O sucesso neste percurso acadeacutemico deve-se tambeacutem a todos os que me apoiaram incentivaram e inspiraram nos melhores e nos piores momentos tornando o caminho mais faacutecil de percorrer Espero que as palavras seguintes faccedilam justiccedila ao sentimento de agradecimento que pretendo transmitir

Agrave Professora Doutora Maria Manuel Borges a quem devo a introduccedilatildeo a este tema pela total disponibilidade pelo aconselhamento acadeacutemico e profissional espiacuterito criacutetico pela confianccedila depositada pela sua amizade e pelo privileacutegio de poder trabalhar com algueacutem por quem se nutre admiraccedilatildeo

Agrave Professora Doutora Daniela de Filippo pelo aconselhamento orientaccedilatildeo espiacuterito criacutetico e amizade que foram importantes durante o uacuteltimo ano

Agrave Sara cujo apoio paciecircncia e amor foram fundamentais ao longo deste percurso

Aos meus pais que nunca me deixaram desistir deste sonho

Agrave Ana Luiacutesa Ribeiro colega e amiga cujo esforccedilo me permitiu assistir a todas as aulas do mestrado

Agrave Cristina Caetano colega de mestrado e amiga pelo apoio incentivo partilha de ideias e espiacuterito criacutetico

Aos colegas Daniel Gonccedilalves Rosa Gomes e Quele pelo companheirismo amizade boa energia e pelas trocas de ideias ao almoccedilo agraves quintas-feiras

A todos os professores deste ciclo acadeacutemico pela mestria e paixatildeo com que transmitiram conhecimentos e me tornaram melhor profissional da informaccedilatildeo

vi

vii

A mente que se abre a uma nova ideia jamais volta ao seu tamanho inicial

Albert Einstein

viii

ix

RESUMO

A abertura de dados cientiacuteficos e de dados do setor puacuteblico eacute garantida por poliacuteticas de Dados Abertos que na sua constituiccedilatildeo recomendam ou mandatam a livre disponibilizaccedilatildeo de dados A um niacutevel macro a Uniatildeo Europeia atraveacutes do seu programa de financiamento de investigaccedilatildeo implementou um piloto de Dados Abertos que atualmente abrange todas as aacutereas de investigaccedilatildeo financiadas O acordo de financiamento mandata a abertura de todos os dados de investigaccedilatildeo subjacentes agraves publicaccedilotildees cientiacuteficas A Uniatildeo Europeia tem tambeacutem publicado legislaccedilatildeo referente agrave abertura de dados do setor puacuteblico que eacute transposta para as normas juriacutedicas de cada estado-membro onde Portugal natildeo eacute exceccedilatildeo Foram tambeacutem observadas as diversas iniciativas que visam medir a abertura de dados puacuteblicos a niacutevel europeu e mundial

O objetivo geral do trabalho eacute analisar a implementaccedilatildeo de poliacuteticas de Dados Abertos em Portugal Dado o diferente enquadramento legislativo relativamente aos dados de investigaccedilatildeo e aos dados do setor puacuteblico foram elencadas as poliacuteticas existentes para os diferentes tipos de dados A abertura de dados de investigaccedilatildeo situa-se ainda numa fase prematura natildeo sendo ainda visiacuteveis resultados da implementaccedilatildeo da Resoluccedilatildeo do Conselho de Ministros nordm212016 Ao niacutevel dos dados do setor puacuteblico abertura processou-se atraveacutes da transposiccedilatildeo da Diretiva 200398CE para as normas juriacutedicas portuguesas em 2007 e novamente em 2016 Usando o modelo de Zuiderwijk e Janssen (2014) foi elaborada uma estrutura para a avaliaccedilatildeo do conteuacutedo contexto e indicadores de desempenho da poliacutetica de abertura de dados do setor puacuteblico permitindo obter uma visatildeo geral do valor puacuteblico alcanccedilado Foram confrontados os resultados obtidos por esta anaacutelise com os indicadores de abertura provenientes de algumas iniciativas de avaliaccedilatildeo de impacto da abertura de dados do setor puacuteblico e com a informaccedilatildeo prestada pela AMA O ecossistema portuguecircs de Dados Governamentais Abertos encontra-se jaacute numa fase mais avanccedilada revelando a existecircncia do portal de dados nacional (dadosgov) e de diversos portais de entidades puacuteblicas e ateacute do setor privado que disponibilizam dados de forma aberta Esses portais foram analisados para se perceber se os conjuntos de dados cumpriam os requisitos de abertura definidos pela Open Knowledge International

Palavras-chave Dados Abertos Dados Governamentais Abertos poliacuteticas de Dados Abertos impacto avaliaccedilatildeo

x

xi

ABSTRACT

The openness of scientific data and public sector data is granted by Open Data policies which recommend or mandate free availability of data At a macro level the European Union through its research funding program implemented an Open Data pilot that now is extended to all the funded research areas The model agreement sets the openness of all the data underlying scientific publications The European Union has also published legislation referring to the openness of public sector information which is transposed to the legal system of each state member where Portugal is no exception We also analysed the different initiatives that aim to measure the openness of public data at European and global level

The main goal of this academic work is to analyse the implementation of Open Data policies in Portugal Given the different legal framework between scientific data and public sector data wersquove considered and listed the policies regarding both type of data The openness of scientific data is still in a premature phase which means that the results of the implementation of Resoluccedilatildeo do Conselho de Ministros nordm212016 are not visible yet In terms of public sector data the openness has started with the transposition of the EU Directive 200398EC to the Portuguese juridical system in 2007 and again in 2016 Using Zuiderwijk e Janssenrsquos (2014) model it was elaborated a structure to assess the context content and performance indicators of public sector open data policies which allows to obtain a general vision of public value achieved The results produce by this analysis were confronted with the openness indicators generated by some public sector data impact assessment initiatives and also with the information disclosed by AMA The Portuguese ecosystem of Open Governmental Data is in a more advanced phase disclosing the existence of a national data portal (dadosgov) and data portals from public institutions and even from the private sector which made data available in an open manner These data portals were analysed to understand if they fulfil all the openness requirements defined by Open Knowledge International

Keywords Open Data Open Government Data Open Data policies impact assessment

xii

xiii

Sumaacuterio

AGRADECIMENTOS v

RESUMO ix

ABSTRACT xi

Introduccedilatildeo 1

Indicaccedilotildees Metodoloacutegicas 6

1 Do Acesso Aberto aos Dados Abertos 8

11 Acesso Aberto 8

111 Via Dourada 14

112 Via Verde 15

12 A Ciecircncia Aberta 17

13 Big Data ou dados massivos 24

14 Dados Abertos 29

15 Dados Abertos Governamentais 40

2 As poliacuteticas de Dados Abertos 53

21 Poliacuteticas Macro 70

22 O caso portuguecircs 78

Conclusatildeo 103

Referecircncias Bibliograacuteficas 115

LISTA DE SIGLAS 134

IacuteNDICE DE FIGURAS 136

IacuteNDICE DE QUADROS 137

IacuteNDICE DE GRAacuteFICOS 138

xiv

1

Introduccedilatildeo

Uma marca distintiva da nossa eacutepoca eacute o crescimento exponencial da produccedilatildeo de informaccedilatildeo com a proliferaccedilatildeo de novas tecnologias de informaccedilatildeo e comunicaccedilatildeo que permitiram o aumento de troca de informaccedilatildeo de nuacutemero de artigos cientiacuteficos publicados e a produccedilatildeo massiva de dados O acesso generalizado agrave internet propiciou uma alteraccedilatildeo no paradigma do acesso e publicaccedilatildeo de conteuacutedos cientiacuteficos Eacute com o intuito de promover o livre acesso agrave informaccedilatildeo cientiacutefica que nasce o movimento de Acesso Aberto (AA) apoiado em trecircs declaraccedilotildees de princiacutepios de abertura Budapeste Bethesda e Berlim

Segundo a Budapest Open Access Initiative (BOAI) entende-se por AA a disponibilizaccedilatildeo na Internet de literatura cientiacutefica permitindo que os utilizadores possam ler copiar distribuir imprimir e pesquisar esta literatura sem barreiras legais teacutecnicas ou financeiras que natildeo o proacuteprio acesso agrave Internet (Budapest Open Access Iniciative [BOAI] 2002 traduccedilatildeo livre) O AA possuiu dois modelos de abertura a via dourada que remete para a publicaccedilatildeo em revistas cientiacuteficas de AA e a via verde que pressupotildee o auto arquivo num repositoacuterio adequado Subjacente a este movimento estaacute a abertura sem qualquer tipo de discriminaccedilatildeo de toda a literatura de investigaccedilatildeo cientiacutefica revista por pares no caso dos postprints como artigos dissertaccedilotildees e teses e mais recentemente dados de investigaccedilatildeo e livros cientiacuteficos (Swan 2012) Existem dois tipos de AA o AA graacutetis que se refere agrave remoccedilatildeo de barreiras de preccedilo e o AA livre que se refere agrave remoccedilatildeo de barreiras de preccedilo e de pelo menos algumas barreiras de permissatildeo (Suber 2012)

O AA enquadra-se num contexto cientiacutefico mais vasto o da Ciecircncia Aberta (CA) O conceito de CA eacute definido como o esforccedilo para disponibilizar todos os resultados da investigaccedilatildeo cientiacutefica que sejam financiados pelo setor puacuteblico (Organizaccedilatildeo para a Cooperaccedilatildeo e Desenvolvimento Econoacutemico [OECD] 2015a) Nesse sentido a Ciecircncia Aberta surge como um termo guarda-chuva referente agrave abertura de todos os resultados da investigaccedilatildeo financiada e que assenta em vaacuterios pilares remoccedilatildeo das barreiras de partilha construccedilatildeo da infraestrutura para a sua concretizaccedilatildeo e como desambiguaccedilatildeo de autores instituiccedilotildees e produccedilatildeo cientiacutefica A CA eacute um meio para garantir um sistema de investigaccedilatildeo mais eficiente atraveacutes da reduccedilatildeo de custos no processo de coleta transferecircncia e reutilizaccedilatildeo de dados do aumento da transparecircncia e qualidade do processo de investigaccedilatildeo da maior rapidez na transferecircncia de conhecimento do aumento do impacto econoacutemico e aproximaccedilatildeo entre ciecircncia e cidadatildeos (OECD 2015a)

A complexidade da abertura dos resultados de investigaccedilatildeo reside no fator cultural na implementaccedilatildeo de um ambiente de partilha Leonelli Spichtinger e Prainsack

2

(201513) defendem que ldquoin addition to the stick of compulsatory mandates carrots are therefore also neededrdquo As recompensas satildeo definidas em trecircs eixos reconhecimento das praacuteticas de partilha nas estruturas de incentivos reconhecimento do papel das meacutetricas alternativas na avaliaccedilatildeo dos investigadores e a criaccedilatildeo de incentivos mais significativos para envolver os investigadores na CA Fecher e Friesike (2013) sintetizaram as mudanccedilas operadas pela CA em cinco escolas de pensamento ao niacutevel da infraestrutura da acessibilidade puacuteblica da avaliaccedilatildeo de impacto do acesso gratuito e da melhoria da eficiecircncia

A Uniatildeo Europeia (EU) tem desempenhado um papel central na promoccedilatildeo da CA quer atraveacutes da criaccedilatildeo de legislaccedilatildeo adequada aos princiacutepios de abertura que defende quer ao niacutevel de financiamento para o AA agraves publicaccedilotildees cientiacuteficas criaccedilatildeo de e-infraestruturas de alojamento de recursos de informaccedilatildeo e programas de treino e apoio Em Portugal apesar da jaacute existecircncia de e-infraestruturas cientiacuteficas como o Repositoacuterio Cientiacutefico de Acesso Aberto de Portugal (RCAAP) e o Serviccedilo de Alojamento de Repositoacuterio de Dados Cientiacuteficos (SARDC) apenas em 2016 se veio a definir os princiacutepios da implementaccedilatildeo da poliacutetica nacional de CA atraveacutes da Resoluccedilatildeo do Conselho de Ministros nordm212016 A estrateacutegia assenta em quatros eixos AA e Dados Abertos infraestruturas e preservaccedilatildeo digital avaliaccedilatildeo cientiacutefica e responsabilidade social cientiacutefica (Comissatildeo Executiva GT-PNCA 2016)

O crescimento exponencial da produccedilatildeo de dados estimado em 40 ao ano (Manyika et al 2011) levou agrave emergecircncia do fenoacutemeno Big Data ou dados massivos atraveacutes do incremento da disponibilizaccedilatildeo de conjuntos de dados e tambeacutem do reconhecimento do potencial valor da combinaccedilatildeo e ligaccedilatildeo de diferentes datasets (Ubaldi 2013) Os dados digitais estatildeo presentes em todos os setores econoacutemicos existindo diversas ferramentas que coletam dados de forma massiva que depois podem ser reutilizados para desenvolver novas investigaccedilotildees ou aplicaccedilotildees1 para benefiacutecio da sociedade O crescimento da disponibilidade de dados originou mudanccedilas no paradigma da investigaccedilatildeo cientiacutefica sendo que Jim Gray considera que vivemos atualmente no 4ordm paradigma caracterizado pelo uso massivo de dados na investigaccedilatildeo cientiacutefica (Lynch 2009) Esta nova ciecircncia assenta em trecircs pilares captura curadoria e anaacutelise de dados (Bell 2009 Royal Society 2012) A influecircncia do Big Data na sociedade manifesta-se a diversos niacuteveis destacando-se o desenvolvimento de projetos na aacuterea da sauacutede transportes agricultura ambiente induacutestria ganho de competecircncias cientiacuteficas mercado de dados e dados abertos

Os dados que produzimos satildeo globais diversificados complexos e sobretudo podem representar um enorme valor cientiacutefico econoacutemico social ou cultural Neste

1 O termo aplicaccedilotildees deve ser aqui entendido de duas formas como aplicaccedilatildeo na inovaccedilatildeo cientiacutefica produzindo por exemplo um avanccedilo meacutedico e tambeacutem como aplicaccedilatildeo no sentido de software fornecendo um serviccedilo com o recurso agrave reutilizaccedilatildeo de dados

3

sentido o AA a dados torna-se um dos pilares da investigaccedilatildeo cientiacutefica do seacuteculo XXI mas tambeacutem um dos pilares do desenvolvimento econoacutemico do envolvimento dos cidadatildeos na ciecircncia atraveacutes da denominada ciecircncia cidadatilde e tambeacutem na auscultaccedilatildeo da transparecircncia governativa com a disponibilizaccedilatildeo em AA de dados governamentais

O mundo acadeacutemico tem vindo a ser pressionado para apoiar a abertura atraveacutes das imposiccedilotildees das entidades de financiamento e do aumento de benefiacutecios dos Dados Abertos embora nem todos os domiacutenios evoluam com a mesma rapidez (Hahnel amp Hook 2016) A Royal Society (2012) sublinha que os dados devem ser geridos de modo proficiente para as instituiccedilotildees obterem os benefiacutecios proporcionados pela abertura de dados e entenderem a enorme mudanccedila cultural necessaacuteria para atingir este objetivo

Existem vaacuterias definiccedilotildees de Dados Abertos apresentando algumas diferenccedilas entre elas embora focando o mesmo objetivo A Royal Society (2012) entende por Open Data os dados que devem ser acessiacuteveis utilizaacuteveis avaliados ou certificados e inteligiacuteveis Contudo ldquoOpenness is not however enough Data must be intelligently openrdquo (Science International 20154) Segundo a Open Definition os Dados Abertos englobam dois tipos diferentes de abertura teacutecnica e legal (Open Knowledge International [a])

Com o objetivo de contribuir para a adoccedilatildeo de padrotildees e poliacuteticas de Dados Abertos de investigaccedilatildeo algumas organizaccedilotildees lanccedilaram iniciativas e princiacutepios de Open Data destinadas agrave recomendaccedilatildeo de boas praacuteticas na publicaccedilatildeo de dados de investigaccedilatildeo obtidos atraveacutes de financiamento puacuteblico Estes princiacutepios foram comparados de forma a obter-se uma visatildeo geral da abertura teacutecnica e legal recomendada

A abertura dos dados governamentais teve a sua origem nas leis de ldquoFreedom of Informationrdquo Os Governos e as sociedades tecircm vindo de forma crescente a apoiar o acesso agrave informaccedilatildeo do setor puacuteblico como forma de aumentar a transparecircncia governativa e o crescimento econoacutemico A abertura de dados assume a preparaccedilatildeo das entidades puacuteblicas para o processo de abertura e que o governo estaacute disposto a efetuar mudanccedilas consideraacuteveis no setor puacuteblico devendo atuar como um sistema aberto que interage com o seu ambiente (Jansen Charalabidis amp Zuiderwijk 2012)

Os Dados Governamentais Abertos (DGA) referem-se agrave informaccedilatildeo coletada produzida ou paga pelo setor puacuteblico guardada em formato que possa ser lido por maacutequina e tornada acessiacutevel de forma livre para reutilizaccedilatildeo para qualquer propoacutesito atraveacutes da publicaccedilatildeo sob uma licenccedila aberta que permite a livre reutilizaccedilatildeo dentro do domiacutenio puacuteblico e privado (Koski 2015 Carrara Oudkerk Steenbergen Tinholt 2016) A Open Knowledge International (OKI) (2012a) identificou as componentes chave da abertura de dados puacuteblicos disponibilidade e acesso reutilizaccedilatildeo e redistribuiccedilatildeo e a participaccedilatildeo universal A abertura dos dados governamentais foi apoiada por vaacuterias iniciativas com o objetivo de estabelecer padrotildees e princiacutepios para a

4

disponibilizaccedilatildeo aberta de dados as quais foram comparadas para obter uma visatildeo geral da abertura teacutecnica e legal recomendada

Para gerar valor ldquodata must be reusable but more importantly actually used (Open Data for Development [OD4D] 20168) O acesso e a reutilizaccedilatildeo dos dados governamentais tecircm um potencial significativo no aumento da eficiecircncia e transparecircncia do setor puacuteblico alavancando atividades de ciecircncia cidadatilde com os dados governamentais aumentando assim o seu valor econoacutemico e social (OECD 2015a) Segundo Ubaldi (2013 traduccedilatildeo livre) podem ser identificadas quatro grandes fases na cadeia de valor dos Dados DGA geraccedilatildeo de dados coleta agregaccedilatildeo e processamento de dados distribuiccedilatildeo e fornecimento de dados e reutilizaccedilatildeo de dados Existem trecircs tipos de valor associados aos DGA valor econoacutemico valor social e transparecircncia puacuteblica (Ubaldi 2013 OECD 2015a)

O acesso a dados sem restriccedilotildees de acesso deve ser garantido por uma poliacutetica de Dados Abertos pois ldquoOpen Data is politicalrdquo (World Wide Web Foundation 201638) Existem poliacuteticas diferenciadas para a abertura de dados governamentais e para a abertura de dados cientiacuteficos sendo que a expressatildeo ldquoPoliacutetica de Dados Abertosrdquo surge frequentemente associada a termos como estrateacutegias programas ou iniciativas de abertura de dados e ainda a poliacuteticas de gestatildeo de dados A contextualizaccedilatildeo das poliacuteticas natildeo eacute clara mas foca-se preferencialmente apenas nos dados provenientes do setor puacuteblico Satildeo associadas poliacuteticas de Dados Abertos de vaacuterios niacuteveis desde o governamental em termos de dados puacuteblicos agraves poliacuteticas editoriais de abertura de dados cientiacuteficos

A niacutevel de dados cientiacuteficos salienta-se a existecircncia de vaacuterias recomendaccedilotildees no sentido de balizar indicadores fundamentais para o desenvolvimento de poliacuteticas de abertura de dados cientiacuteficos e a importacircncia da gestatildeo de dados no seio dessa abertura A mudanccedila cultural a necessidade de treino dos investigadores e a abertura de dados mediante os princiacutepios FAIR que pretendem facilitar o acesso a interoperabilidade e a reutilizaccedilatildeo de dados satildeo outros desafios focados A abertura dos dados de investigaccedilatildeo eacute incluiacuteda no programa de investimento Horizonte 2020 (H2020) da EU com a criaccedilatildeo um projeto-piloto de Dados Abertos para sete aacutereas com opccedilatildeo de natildeo participaccedilatildeo tendo sido alargado a todas as aacutereas cientiacuteficas em projetos iniciados a partir de 2017 O artigo 293 do acordo modelo de financiamento requer o depoacutesito de todos os dados e metadados associados aos resultados finais da investigaccedilatildeo num repositoacuterio devendo estes cumprir os princiacutepios FAIR A este model grant agreement estaacute associada tambeacutem a necessidade obrigatoacuteria de desenvolver um plano de gestatildeo de dados que descreva os dados que seratildeo produzidos e como e quando seratildeo publicados O AA a dados cientiacuteficos possui um contexto legislativo diferenciado dos dados puacuteblicos apresentando-se em Portugal numa fase ainda pouca maturada A primeira poliacutetica de Dados Abertos surge em 2014 atraveacutes da Fundaccedilatildeo

5

para a Ciecircncia e Tecnologia (FCT) com o objetivo de encorajar e promover a disponibilizaccedilatildeo de dados em AA O acesso a dados foi incluiacutedo na poliacutetica cientiacutefica atraveacutes da Resoluccedilatildeo do Conselho de Ministros nordm212016 que integrada na poliacutetica nacional de CA instaura a obrigatoriedade da abertura dos dados cientiacuteficos resultantes de projetos financiados por fundos puacuteblicos

O desenvolvimento de uma poliacutetica de abertura de dados governamentais deve considerar algumas questotildees como a definiccedilatildeo da sua aplicaccedilatildeo e os objetivos dados publicados condiccedilotildees de publicaccedilatildeo de dados local frequecircncia e razatildeo da publicaccedilatildeo devendo ainda ser calculado o impacto e os benefiacutecios da abertura de dados (Carrara et al 2016a) Os objetivos das poliacuteticas de Dados Abertos podem ser sintetizados em trecircs aacutereas principais fomentar a inovaccedilatildeo social e crescimento econoacutemico melhorar a eficiecircncia dos serviccedilos do setor puacuteblico e fortalecer a democracia e aumentar a transparecircncia (Zuiderwijk Gasco Parycek amp Janssen 2014)

A EU e a Comissatildeo Europeia tecircm promovido os DGA atraveacutes da publicaccedilatildeo de Diretivas Europeias (2003 e 2013) que estabeleceram regulamentos para permitir o livre acesso e reutilizaccedilatildeo dos dados produzidos pelas entidades europeias e governamentais Esta legislaccedilatildeo eacute de cariz obrigatoacuterio para todos os estados-membros Foram tambeacutem estabelecidas diversas e-infraestruturas para alojar e apoiar toda a produccedilatildeo de dados produzidos na EU e que indexam os dados existentes nos portais nacionais de cada paiacutes Satildeo abordadas as vaacuterias iniciativas europeias e internacionais de avaliaccedilatildeo de abertura de dados que permitem obter uma vista geral ainda que desfocada do estado de abertura de dados puacuteblicos a niacutevel nacional e europeu

Portugal confere o direito ao acesso agrave informaccedilatildeo puacuteblica desde 1993 As poliacuteticas de abertura de dados governamentais mais recentes foram publicadas em 2007 e 2016 e assentam na transposiccedilatildeo da Diretiva 200398CE para a lei nacional Assinala-se a existecircncia de duas poliacuteticas municipais a criaccedilatildeo do portal nacional e de vaacuterios portais regionais e institucionais Para avaliar a abertura dos dados governamentais em Portugal foi usada a estrutura elencada por Zuiderwijk e Janssen (2014) Atraveacutes da anaacutelise de vaacuterios indicadores esta estrutura fornece uma perspetiva do contexto e ambiente da poliacutetica do seu conteuacutedo e dos indicadores de desempenho permitindo assim inferir o valor puacuteblico alcanccedilado Foi tambeacutem analisada a abertura de dados alojados nos portais de dados portugueses com o recurso agraves caracteriacutesticas de abertura enunciadas na Open Definition

O objetivo geral deste trabalho eacute identificar as poliacuteticas de Dados Abertos em Portugal bem como a analisar a sua implementaccedilatildeo e impacto Neste sentido foram delineados os seguintes objetivos especiacuteficos

6

a) Contextualizar o movimento de Dados Abertos como continuaccedilatildeo do AA e tambeacutem dentro de um modelo mais amplo a CA focando ainda a produccedilatildeo massiva de dados

b) Identificar princiacutepios de abertura de dados cientiacuteficos e dados puacuteblicos c) Contextualizar os modelos de poliacuteticas de Dados Abertos e formas de avaliaccedilatildeo

de impacto das mesmas d) Identificar a constituiccedilatildeo e implementaccedilatildeo de poliacuteticas de abertura de dados

cientiacuteficos e dados puacuteblicos a niacutevel da EU e) Identificar a constituiccedilatildeo de poliacuteticas de abertura de dados cientiacuteficos e dados

puacuteblicos a niacutevel portuguecircs f) Avaliaccedilatildeo da implementaccedilatildeo e do impacto das poliacuteticas de Dados Abertos em

Portugal em termos de dados cientiacuteficos e de dados puacuteblicos

Indicaccedilotildees Metodoloacutegicas

Para cumprir os objetivos estipulados seguiu-se uma abordagem qualitativa baseada na revisatildeo bibliograacutefica de artigos cientiacuteficos recuperados em bases de dados especializadas disponiacuteveis na Universidade de Coimbra articulando a recuperaccedilatildeo de documentos com os documentos mais citados da aacuterea da Ciecircncia Aberta Acesso Aberto e Dados Abertos indexados na Web of Science Foram usados os termos de pesquisa em liacutengua inglesa open science open access open data open government data e scientific open data para situar o tema seguindo-se a pesquisa por open data policies government open data policies e open data impact A base da literatura revista para analisar o desenvolvimento e impacto das poliacuteticas de Dados Abertos em Portugal foi obtida em grande parte com o recurso ao motor de busca Google derivado agrave especificidade da legislaccedilatildeo das comunicaccedilotildees poliacuteticas e institucionais dos portais de dados e tambeacutem agrave escassez de literatura cientiacutefica nesse campo Foi ainda solicitado um esclarecimento de duacutevidas agrave Agecircncia para a Modernizaccedilatildeo Administrativa (AMA) por correio eletroacutenico em termos de conteuacutedos e funcionalidades do portal de dados nacional tendo as respostas do gestor de projeto Andreacute Lapa sido incluiacutedas como contraposiccedilatildeo a algumas afirmaccedilotildees da literatura ou das iniciativas de avaliaccedilatildeo Os Dados Abertos enquanto alvo do nosso estudo satildeo enquadrados na dimensatildeo da Ciecircncia Aberta que defende a abertura de todos os resultados cientiacuteficos e na dimensatildeo de abertura da informaccedilatildeo do setor puacuteblico que defende o acesso do cidadatildeo agrave informaccedilatildeo dos oacutergatildeos puacuteblicos e governativos

Em termos de Dados Abertos e as suas poliacuteticas a oferta de literatura eacute consideravelmente mais curta sendo que apenas os documentos mais antigos apresentam nuacutemero de citaccedilotildees com algum relevo Sempre que necessaacuterio recorreu-se a trabalhos citados nas publicaccedilotildees em estudo A singularidade da aacuterea e o seu raacutepido crescimento levou agrave opccedilatildeo por autores e artigos menos cotados mas

7

diretamente relacionados com o mundo dos Dados Abertos A recolha de literatura para investigaccedilatildeo visou identificar legislaccedilatildeo referente a poliacuteticas de Dados Abertos publicaccedilotildees de organizaccedilotildees internacionais documentos oficiais relacionados com a abertura de dados e tambeacutem comunicaccedilotildees poliacuteticas quer para o caso portuguecircs quer ao niacutevel macro da EU Foi identificado o contexto social e poliacutetico dos Dados Abertos destacando-se as iniciativas com potencial impacto na abertura de dados Foram pesquisados documentos de investigaccedilatildeo relativos a poliacuteticas de dados abertos e formas de anaacutelise das mesmas

A avaliaccedilatildeo de impacto das poliacuteticas de Dados Abertos em Portugal foi feita com base na estrutura elencada por Zuiderwijk e Janssen (2014) A identificaccedilatildeo das respostas aos 27 indicadores foi feita com o recurso agrave literatura legislaccedilatildeo e agraves respostas obtidas a partir da AMA

Para determinar a quantidade de conjuntos de dados existentes em cada portal internacional analisado quando natildeo estava disponiacutevel a possibilidade de pesquisar por paiacutes foi introduzido o termo Portugal na caixa de pesquisa Deste modo recuperaram-se os conjuntos de dados relacionados com o paiacutes embora nem todos os datasets tenham autoria portuguesa A determinaccedilatildeo das caracteriacutesticas dos portais de dados portugueses analisados foi efetuada com base na informaccedilatildeo inscrita no proacuteprio siacutetio web Quando natildeo disponiacuteveis na paacutegina principal dos cataacutelogos de dados procedeu-se agrave pesquisa nas paacuteginas descritivas dos datasets ou no setor dos avisos legais

Procurou-se aqui tambeacutem definir alguns dos termos que iratildeo ser utilizados com frequecircncia na liacutengua inglesa e tambeacutem o seu acircmbito de aplicaccedilatildeo Segundo Borgman (2015) dados satildeo representaccedilotildees de observaccedilotildees objetos ou outras entidades usadas como prova de um fenoacutemeno para fins de investigaccedilatildeo ou acadeacutemicos

O termo dataset designa um conjunto ou coleccedilatildeo de dados publicados ou preservados por um agente uacutenico estando disponiacutevel para acesso ou download em um ou mais formatos (World Wide Web Consortium [W3C] 2014)

Para a contextualizaccedilatildeo e avaliaccedilatildeo de poliacuteticas foi tida em consideraccedilatildeo a definiccedilatildeo do Dicionaacuterio de Cambridge que define poliacutetica como ldquoa set of ideas or a plan of what to do in particular situations that has been agreed to officially by a group of people a business organization a government or a political partyrdquo (Cambridge University Press 2017)

8

1 Do Acesso Aberto aos Dados Abertos

O processo de abertura do conhecimento cientiacutefico comeccedilou em 2002 com o movimento do Acesso Aberto (AA) culminando na abertura da literatura cientiacutefica financiada por fundo puacuteblicos O avanccedilar da tecnologia a produccedilatildeo massiva de dados as redes sociais cientiacuteficas a ciecircncia cidadatilde os recursos educacionais e o coacutedigo aberto em conjunto gerou uma ciecircncia diferente Este conceito mais amplo de ciecircncia definido como Ciecircncia Aberta pretende abrir toda a panoacuteplia de formatos e recursos onde constem resultados cientiacuteficos com destaque para os dados de investigaccedilatildeo financiados publicamente A abertura de dados processa-se tambeacutem a niacutevel puacuteblico com o Governo e vaacuterias instituiccedilotildees puacuteblicas empenhadas em disponibilizar de forma aberta a informaccedilatildeo do setor puacuteblico

11 Acesso Aberto

O acesso ao conhecimento eacute a base do processo cientiacutefico motor do desenvolvimento social econoacutemico e humano O acesso generalizado agrave Internet alterou o paradigma da comunicaccedilatildeo acadeacutemica pela introduccedilatildeo experimental de novas formas de publicaccedilatildeo e disseminaccedilatildeo da ciecircncia Os primoacuterdios do Acesso Aberto (AA) agrave informaccedilatildeo cientiacutefica remontam a iniciativas como o ArXiv2 um servidor de preprints3 e o EPrints um dos softwares usados para a constituiccedilatildeo de repositoacuterios

O movimento de AA surgiu como resposta ao problema conhecido como lsquoCrise dos Perioacutedicosrsquo Na verdade a escalada de preccedilos das assinaturas de revistas cientiacuteficas e as restriccedilotildees colocadas pelas editoras limitando de forma seacuteria o acesso aos resultados de investigaccedilatildeo teve duas consequecircncias limitaccedilatildeo severa no acesso agrave informaccedilatildeo e colateral diminuiccedilatildeo do potencial de impacto de citaccedilatildeo Eacute neste contexto que em 2002 surge a declaraccedilatildeo fundadora do AA a Budapeste Open Access Initiative (BOAI) Segundo a BOAI entende-se por AA a disponibilizaccedilatildeo na Internet de literatura cientiacutefica permitindo que os utilizadores possam ler copiar distribuir imprimir e pesquisar esta literatura sem barreiras legais teacutecnicas ou financeiras que natildeo o proacuteprio acesso agrave Internet (Budapest Open Access Iniciative [BOAI] 2002 traduccedilatildeo livre) A BOAI estabeleceu duas vias para concretizar o AA a publicaccedilatildeo em revistas cientiacuteficas de AA conhecida como a via dourada e o auto arquivo em repositoacuterios cientiacuteficos conhecido como a via verde de AA Para atingir a abertura dos artigos a BOAI sublinha que devem ser cumpridas duas estrateacutegias complementares

2 O arXiv surgiu em 1991 com o intuito de alojar preprints de artigos cientiacuteficos da aacuterea da fiacutesica tendo sido expandido para integrar aacutereas como a matemaacutetica astronomia ciecircncias da computaccedilatildeo biologia e financcedila quantitativa e estatiacutestica Disponiacutevel na WWW httpsarxivorg 3 O preprint eacute uma versatildeo de um artigo cientiacutefico natildeo publicado e ainda natildeo sujeito a revisatildeo por pares

9

Os investigadores devem proceder ao Auto arquivo da versatildeo completa das suas publicaccedilotildees Necessidade de desenvolver uma nova geraccedilatildeo de revistas cientiacuteficas cujo foco seja a publicaccedilatildeo em AA (BOAI 2002)

Seguiram-se mais duas declaraccedilotildees de elevada importacircncia para o estabelecimento do AA a Declaraccedilatildeo de Bethesda sobre a Publicaccedilatildeo em Acesso Aberto e a Declaraccedilatildeo de Berlim sobre Acesso Livre ao Conhecimento nas Ciecircncias e Humanidades ambas em 2003 A Declaraccedilatildeo de Bethesda define o AA agraves publicaccedilotildees quando eacute autorizado o livre acesso uso e redistribuiccedilatildeo e tambeacutem quando eacute fornecida a versatildeo completa incluindo materiais suplementares e respetiva licenccedila de utilizaccedilatildeo em formato digital num repositoacuterio adequado (Declaraccedilatildeo de Bethesda sobre a Publicaccedilatildeo em Acesso Aberto 2003) A Declaraccedilatildeo de Berlim impotildee o cumprimento de duas condiccedilotildees os autoresdetentores dos direitos de autor devem autorizar sob a forma de uma licenccedila qualquer tipo de coacutepia reutilizaccedilatildeo redistribuiccedilatildeo e transmissatildeo sujeito apenas agrave menccedilatildeo de atribuiccedilatildeo de creacutedito e os autores devem depositar uma coacutepia completa do seu trabalho num repositoacuterio que assegure a sua preservaccedilatildeo a longo prazo (Declaraccedilatildeo de Berlim sobre Acesso Livre ao Conhecimento nas Ciecircncias e Humanidades 2003 traduccedilatildeo livre)

Borges (200692) sintetizou outros exemplos de iniciativas de AA desencadeadas a niacutevel global como o Open Archives Forum em 2001 a International Scholarly Communications Alliance ao niacutevel das ldquobibliotecas especializadas de investigaccedilatildeordquo listando ainda princiacutepios editoriais dos Estados Unidos da Ameacuterica (EUA)4 e europeus5 e assinalando tambeacutem a existecircncia do ldquoDAREnet a rede dos Digital Academic Repositoriesrdquo

Em 2012 a BOAI declarou que ldquoNothing in the last ten years makes OA less necessary or less opportunerdquo renovando e definindo recomendaccedilotildees para os proacuteximos 10 anos ao niacutevel de poliacuteticas licenciamento e reutilizaccedilatildeo infraestrutura e sustentabilidade e por fim sobre promoccedilatildeo e coordenaccedilatildeo

A abertura requerida por estas declaraccedilotildees tem por objetivo disponibilizar o AA a todos os que manifestem interesse nele sem distinccedilotildees discriminatoacuterias Suber (2012) um dos promotores do Movimento de Acesso Aberto agrave informaccedilatildeo cientiacutefica afirma que temos de ver o conhecimento como um bem puacuteblico e natildeo como uma mercadoria O AA deve incluir tambeacutem o processamento da informaccedilatildeo por maacutequinas que atraveacutes de teacutecnicas de extraccedilatildeo indexaccedilatildeo ou mistura permitem obter novas inferecircncias de

4 Os princiacutepios foram denominados Washington DC Principles For Free Access to Science em 2004 tendo sido assinados ldquopor uma seacuterie de editores natildeo lucrativos de sociedades cientiacuteficasrdquo (Borges 200692) 5 Borges (2006) indica que a Association of Learned and Professional Society Publishers emitiu princiacutepios semelhantes aos princiacutepios anunciados nos EUA

10

conhecimento (Suber 2012 Swan 2012) Os conteuacutedos comummente abrangidos pelo AA satildeo a literatura de investigaccedilatildeo cientiacutefica revista por pares dissertaccedilotildees teses e mais recentemente os dados de investigaccedilatildeo e livros cientiacuteficos (Swan 2012) aleacutem de manuais software modelos tridimensionais plantas mapas entre outros

As barreiras de preccedilo e de direitos de autor causam danos aos autores por limitarem a audiecircncia e impacto do seu trabalho ao condicionarem o que pode ser lido usado e citado (Suber 2012 traduccedilatildeo livre) O movimento de AA veio ameaccedilar o modelo dominante de publicaccedilatildeo cientiacutefica baseado ateacute entatildeo em subscriccedilotildees de revistas cientiacuteficas de elevado custo mudando o paradigma em termos de pagamento isentando o leitor e cobrando ao autor O AA natildeo eacute acesso sem custos (OECD 2015a) Em 2008 Stevan Harnad e Peter Suber propuseram termos para descrever os dois tipos de livre acesso agrave informaccedilatildeo cientiacutefica que se impuseram como fundamentais e reconhecidos O termo Graacutetis refere-se agrave remoccedilatildeo das barreiras de preccedilo enquanto o termo Livre refere-se agrave retirada das barreiras de preccedilo e de pelo menos algumas barreiras de permissatildeo (Suber 2008 traduccedilatildeo livre)

A viabilidade econoacutemica das infraestruturas de suporte ao AA pode constituir outro obstaacuteculo Contudo as revistas de AA podem optar por vaacuterios modelos de financiamento que lhes garanta a sustentabilidade econoacutemica como ldquosubsiacutedios publicidade taxas de poacutes-processamento do artigo impressotildees outros serviccedilos de publicaccedilatildeo taxas de associado ou combinaccedilotildees destas accedilotildeesrdquo (Universidade do Minho 2017) Jaacute os repositoacuterios de AA satildeo mais limitados em termos de sustentabilidade no entanto tecircm menos custos de manutenccedilatildeo e estatildeo jaacute em grande parte construiacutedos (OECD 2015a) O retorno do investimento que cada instituiccedilatildeo faz num repositoacuterio tem sempre garantia de retorno atraveacutes do conhecimento que aloja atraindo desta forma alunos investigadores e outros potenciais interessados

A complexidade do AA reside na transiccedilatildeo entre o modelo tradicional e o novo modelo de abertura natildeo pelos obstaacuteculos legais teacutecnicos ou financeiros mas sobretudo pelo fator cultural (Suber 2012 traduccedilatildeo livre) O mesmo autor defende que o AA natildeo eacute acesso universal pois mesmo removendo as barreiras de preccedilos e de permissotildees continuam a existir outras barreiras como filtros e censura barreiras de linguagem de acesso a incapacitados e de conectividade

A escolha do local de publicaccedilatildeo por parte do investigador eacute muitas vezes influenciada pelo prestiacutegio da revista na procura da melhor visibilidade para a sua investigaccedilatildeo O prestiacutegio das revistas eacute conseguido atraveacutes do Fator de Impacto (FI) uma medida de avaliaccedilatildeo criada por Eugene Garfield e Irving H Sher ldquoIn addition to helping libraries decide which journals to purchase JIFs are also used by aithors to decide where to submit their articles As a general rule the journals with high impact factors include the most prestigious Some would equate prestige with high impactrdquo (Garfield 200692) O FI do ano de uma revista cientiacutefica eacute calculado atraveacutes da divisatildeo

11

entre o nuacutemero de citaccedilotildees total que os artigos dessa revista receberam nos dois anos anteriores e o nuacutemero total de artigos publicados no mesmo periacuteodo (Garfield 2006) Suber afirmava em 2009 que o FI como medida principal da qualidade da investigaccedilatildeo impede o crescimento das revistas de AA pois segundo o autor pode afastar os investigadores da publicaccedilatildeo em revistas de AA Contudo em 2017 existem jaacute revistas de AA com o mesmo niacutevel de prestiacutegio das revistas tradicionais das puras como eacute o caso daquelas publicadas pela Public Library of Science (PLOS) e BioMed Central ou Hindawi agraves hiacutebridas de outros editores cientiacuteficos

Como incentivos para abertura dos seus trabalhos aleacutem do maior reconhecimento e impacto medido pela contagem de citaccedilotildees os investigadores apenas recebem recompensas menos tangiacuteveis como a promoccedilatildeo na carreira (Suber 2012) Para este autor o sucesso do AA natildeo depende do altruiacutesmo do investigador entendendo que o ganho de audiecircncia e de impacto atraveacutes da publicaccedilatildeo da investigaccedilatildeo em AA eacute do interesse pessoal do investigador

Sendo o AA dirigido agrave literatura cientiacutefica revista por pares seria de esperar que o controlo de qualidade natildeo constituiacutesse um problema Contudo surgiram no mundo editorial as revistas predatoacuterias um termo cunhado por Jeffrey Beall para definir as revistas que aproveitam o modelo dourado do AA em proveito proacuteprio ldquoThese predatory publishers are dishonest and lack transparencyrdquo Constroem siacutetios web semelhantes aos dos ldquolegitimate online publishers and publish journals of questionable and downright low qualityrdquo (Beall 2012) Beall assevera que ldquonow there is a journal willing to accept almost every article as long as the author is willing to pay the feerdquo (Beall 2012) Este tipo de revistas cobra pela publicaccedilatildeo de cada artigo sem no entanto oferecer os mesmos serviccedilos editoriais como a revisatildeo por pares um elemento fundamental para garantir a integridade e qualidade cientiacutefica

O AA acarreta vaacuterios benefiacutecios para a sociedade e comunidade cientiacutefica como o aumento da velocidade eficiecircncia e eficaacutecia da investigaccedilatildeo facilita a investigaccedilatildeo interdisciplinar amplia a visibilidade uso e impacto da investigaccedilatildeo e permite que as comunidades de profissionais empreendedores e o puacuteblico em geral retirem valor da investigaccedilatildeo (Swan 2012 traduccedilatildeo livre) O projeto Study of Open Access Publishing (SOAP) concluiu que cerca de 90 dos investigadores que responderam ao inqueacuterito consideram que o AA eacute beneacutefico para a investigaccedilatildeo cientiacutefica com impacto direto positivo no fluxo da comunicaccedilatildeo acadeacutemica (Dallmeier-Tiessen et al 2011)

De acordo com Harnad e Brody (2004) a melhor forma de calcular o impacto do AA eacute ldquocompare the citation counts of individual OA and non-OA articles appearing in the same (non-OA) journals Such ongoing comparisons are revealing dramatic citation advantages for OA Os mesmos autores enfatizam que o acesso natildeo eacute uma condiccedilatildeo suficiente para a citaccedilatildeo mas eacute uma condiccedilatildeo necessaacuteria Com as publicaccedilotildees em AA a crescer exponencialmente entre as revistas de AA e os repositoacuterios ldquoverdesrdquo eacute natural

12

que o uso e impacto potencial aumentem com variaccedilotildees entre campos de conhecimento decorrentes da sua cultura de partilha

Apoacutes a anaacutelise de 36 estudos sobre o impacto do AA nas citaccedilotildees de artigos Swan (2010) concluiu que 27 desses estudos apresentavam uma clara subida do nuacutemero meacutedio de citaccedilotildees Os artigos cientiacuteficos disponibilizados em AA satildeo mais citados que aqueles que permanecem fechados estando este facto relacionado com o aumento de audiecircncia e visibilidade promovida pelo AA (Suber 2012 Caruso Nicol amp Archambault 2013) Swan (2012) defende que o AA estaacute a nivelar a comunicaccedilatildeo cientiacutefica e o acesso a ela A mesma autora realccedila que a investigaccedilatildeo cientiacutefica tem impacto tambeacutem fora do meio acadeacutemico ao niacutevel empresarial sauacutede ou educaccedilatildeo A OECD (2015a) acrescenta que os artigos satildeo mais citados porque possuem livre acesso e uso e natildeo propriamente pela sua qualidade Um estudo da Science-Metrix concluiu que o AA pode aumentar o nuacutemero de artigos citados e diminuir a citaccedilatildeo de artigos que os investigadores natildeo leram Poreacutem a mesma anaacutelise revelou que apenas 8 dos 28 paiacuteses auscultados conseguiram publicar 50 ou mais dos artigos produzidos em AA (Caruso Nicol amp Archambault 2013)

A distinccedilatildeo entre Graacutetis e Livre natildeo possuiu o mesmo significado que a distinccedilatildeo entre via verde e via dourada Enquanto a primeira distinccedilatildeo se refere aos direitos cedidos aos utilizadores (Quatildeo aberto estaacute) a segunda distinccedilatildeo refere-se ao modo de publicaccedilatildeo (Como eacute entregue) (Suber 2012) Os direitos de autor podem constituir uma barreira de peso ao AA A abertura requerida pelo estatuto de AA Livre deve ser assegurada pela concessatildeo de licenccedilas que informem os utilizadores sobre o que podem e natildeo podem fazer com determinado produto de investigaccedilatildeo cientiacutefica Existem licenccedilas abertas como as Creative Commons (CC) que permitem a criaccedilatildeo de modelos de licenciamento com diferentes niacuteveis de permissotildees podendo desta forma o detentor dos direitos de autor autorizar o niacutevel de permissatildeo que lhe seja mais conveniente

Das 9431 revistas cientiacuteficas de AA listadas no Directory of Open Access Journals (DOAJ) em Maio de 2017 8447 dessas revistas utilizavam licenccedilas CC enquanto 278 revistas possuiacuteam licenccedilas proacuteprias das editoras Os cerca de 90 do nuacutemero total de revistas de AA a utilizar licenccedilas CC representa um crescimento exponencial desde 2012 quando Suber afirmou que apenas 20 das revistas em AA usavam algum tipo de licenccedila CC Nesta mesma data encontram-se listadas no DOAJ 78 revistas de AA de editoras portuguesas sendo que 91 dessas publicaccedilotildees usa licenccedilas CC para permitir o AA Livre (Directory of Open Access Journals [DOAJ] 2017)

A abertura dos resultados de investigaccedilatildeo eacute suportada por poliacuteticas que podem encorajar ou requerer de forma obrigatoacuteria o AA Por norma o encorajamento eacute feito na via dourada enquanto na via verde se definem mandatos Segundo Swan (2012 traduccedilatildeo livre) na formulaccedilatildeo de uma poliacutetica de AA devem ser considerados os

13

seguintes fatores Modo de publicaccedilatildeo (via verde ou dourada) Local de depoacutesito Tipos de conteuacutedos abrangidos Periacuteodos de embargo Permissotildees Niacuteveis de aplicaccedilatildeo Sensibilizaccedilatildeo de apoio agraves poliacuteticas Sanccedilotildees por incumprimento e Isenccedilotildees

De acordo com Suber (2012) existe similitude na abordagem agraves poliacuteticas de AA entre universidades e agecircncias de financiamento que tanto podem encorajar a via dourada como requerer a via verde A Wellcome Trust do Reino Unido e a National Institutes of Health (EUA) satildeo dois casos de sucesso de mandatos verdes requerendo que os investigadores depositem o seu trabalho num repositoacuterio de AA e que retenham o direito de autorizar esse AA o que permite que as instituiccedilotildees disponibilizem de forma aberta todos os resultados de investigaccedilatildeo por si financiados (National Institutes of Health [NIH] 2008 Wellcome Trust 2013)

O mais recente programa de financiamento de ciecircncia e inovaccedilatildeo da Uniatildeo Europeia o Horizonte 2020 detalha no artigo 292 do Model Grant Agreement os requisitos legais na abertura das publicaccedilotildees cientiacuteficas financiadas por este programa onde cada beneficiaacuterio deve assegurar o AA a todas as publicaccedilotildees revistas por pares utilizando para isso as duas vias disponiacuteveis (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016a traduccedilatildeo livre)

Existem tambeacutem serviccedilos com o intuito de facilitar a abertura das publicaccedilotildees cientiacuteficas O Registry of Open Access Repository Mandates and Policies (ROARMAP) lista as poliacuteticas e mandatos de AA ao niacutevel global registados neste diretoacuterio Em novembro de 2016 o ROARMAP conta com 794 mandatos instituiacutedos por vaacuterios tipos de organizaccedilotildees Portugal conta com 21 poliacuteticas de AA por via verde distribuiacutedas na sua maioria por instituiccedilotildees de ensino superior Os serviccedilos SHERPA da Universidade de Nottingham atraveacutes das bases de dados RoMEO e JULIET dispotildeem de valiosos indicadores quanto agraves poliacuteticas de AA das editoras cientiacuteficas e das entidades financiadoras de investigaccedilatildeo Relativamente agraves poliacuteticas editoriais de AA tendo em conta os direitos de autor e o auto arquivo existem em Portugal 127 poliacuteticas segundo o SHERPARoMEO sendo que mais de metade autoriza a publicaccedilatildeo em AA do poacutes-print ou da versatildeo final do editor Jaacute em termos de poliacuteticas de AA requeridas pela instituiccedilatildeo financiadora apenas a Fundaccedilatildeo para a Ciecircncia e Tecnologia (FCT) aparece listada no SHERPAJULIET

O AA envolve vaacuterios intervenientes distintos que cooperam na disponibilizaccedilatildeo dos resultados da investigaccedilatildeo cientiacutefica Assim como intervenientes podemos encontrar os investigadores cujo esforccedilo permite a criaccedilatildeo e difusatildeo de novo conhecimento com valor cientiacutefico a sociedade em geral que pode usufruir e construir em cima do novo conhecimento as universidades e institutos de investigaccedilatildeo que disponibilizam condiccedilotildees adequadas para o decurso da produccedilatildeo cientiacutefica incluindo a construccedilatildeo de infraestruturas de AA as entidades financiadoras de investigaccedilatildeo cientiacutefica as editoras que criam revistas de AA para permitir a difusatildeo acesso ao conhecimento e ainda

14

diversas organizaccedilotildees que dedicam parte das suas atividades agrave promoccedilatildeo de poliacuteticas e praticas de AA Entre as organizaccedilotildees mais relevantes podemos encontrar a UNESCO Wellcome Trust a Joint Information Systems Committee (JISC) a Scholarly Publishing and Academic Resources Coalition (SPARC) a Open Knowledge International (OKI) ou a NIH soacute para citar algumas das organizaccedilotildees mais reconhecidas pelo seu esforccedilo em direccedilatildeo ao AA

Em Portugal os grandes intervenientes do AA satildeo a FCT enquanto entidade financiadora a Fundaccedilatildeo para a Computaccedilatildeo Cientiacutefica Nacional (FCCN) no planeamento e gestatildeo da Rede Ciecircncia Tecnologia e Sociedade (RCTS) a Universidade do Minho pioneira no AA no paiacutes e o Repositoacuterio Cientiacutefico de Acesso Aberto de Portugal vulgo RCAAP que eacute um agregador da informaccedilatildeo cientiacutefica produzida

Segundo Suber (2012 traduccedilatildeo livre) o AA eacute um movimento amplo que abrange todos os campos de conhecimento todos os paiacuteses independentemente da sua realidade econoacutemica inclui a investigaccedilatildeo puacuteblica e privada sem limitaccedilatildeo temporal e natildeo se limita aos conteuacutedos textuais pois frequentemente estende-se aos dados conteuacutedos multimeacutedia e coacutedigo executaacutevel A UNESCO (2015) defende que o AA natildeo eacute um movimento isolado embora tenha caracteriacutesticas uacutenicas

111 Via Dourada

A via dourada do AA eacute a publicaccedilatildeo de artigos cientiacuteficos em revistas de AA que pode envolver o pagamento de custos de processamento - Article Processing Charge (APC) - pelo autor instituiccedilatildeo ou entidade financiadora ficando o artigo disponiacutevel e sem custos para os leitores A publicaccedilatildeo em AA por via dourada eacute compatiacutevel com a qualidade cientiacutefica das editoras tradicionais pois as revistas de AA possuem o serviccedilo de revisatildeo por pares dos artigos sendo que algumas delas jaacute atingiram um alto niacutevel de prestiacutegio O prestiacutegio das revistaseditoras cientiacuteficas eacute um fator que pesa na escolha do local de publicaccedilatildeo por parte dos investigadores Contudo o mundo editorial de AA conta jaacute com editoras de grande qualidade que implementaram sistemas rigorosos de revisatildeo cientiacutefica como satildeo o caso da BioMed Central ou PLoS (Swan 2012) O Sponsoring Consortium for Open Access Publishing in Particle Physics (SCOAP3) eacute um exemplo de sucesso de publicaccedilatildeo em AA dourado Sob orientaccedilatildeo do European Organization for Nuclear Research (CERN) apostou no redireccionamento do dinheiro aplicado nas subscriccedilotildees de revistas cientiacuteficas para efetuar o pagamento dos APCrsquos das revistas de AA da aacuterea da fiacutesica das partiacuteculas (Sponsoring Consortium for Open Access Publishing in Particle Physics [SCOAP3] 2014) Algumas revistas cientiacuteficas utilizam um modelo hiacutebrido que lhes permite dobrar os lucros ao cobrar subscriccedilotildees para acesso aos artigos permitindo contudo que estes fiquem em AA se for pago o APC pelo autor (Swan 2012)

15

O Reino Unido um dos liacutederes mundiais em investigaccedilatildeo concluiu que a implementaccedilatildeo de uma licenccedila nacional pode potenciar o AA ao permitir a negociaccedilatildeo de preccedilos ao mesmo tempo que orienta os investigadores para a publicaccedilatildeo em AA dourado (Price amp Chaytor 2015)

112 Via Verde

De acordo com Harnad et al (2004) a via verde de AA eacute um modo de publicaccedilatildeo em revistas cientiacuteficas de subscriccedilatildeo e o respetivo auto arquivo do trabalho publicado num repositoacuterio de AA O auto arquivo eacute o ato de submeter uma coacutepia de um documento cientiacutefico num repositoacuterio de AA de forma a assegurar a abertura e acesso ao seu conteuacutedo (UNESCO 2015) Existem trecircs tipos de documentos usados na via verde a versatildeo preacute-publicada (manuscrito natildeo sujeito a revisatildeo) a versatildeo poacutes-publicada (artigo aceite para publicaccedilatildeo) e a versatildeo final publicada (Laakso 2014 Bjoumlrk Lakso Welling Paetau 2014) Laakso (2014) sublinha a diferenccedila de quantidade de artigos publicados em AA e indexados pela SCOPUS entre as vaacuterias disciplinas cientiacuteficas com a fiacutesica e as ciecircncias da sauacutede a serem as aacutereas do conhecimento mais abertas por larga margem A falta de cultura de utilizaccedilatildeo do preacute-print a ausecircncia de revistas cientiacuteficas de alta qualidade ou a falta de financiamento para pagar os APCrsquos satildeo algumas das razotildees encontradas por Bjoumlrk et al (2014) para justificar a diferenccedila

Os repositoacuterios de AA satildeo coleccedilotildees ou bases de dados bibliograacuteficas de artigos cientiacuteficos publicados na web mas incluem outros conteuacutedos como teses dissertaccedilotildees datasets ou material didaacutetico oferecendo uma ligaccedilatildeo persistente a assegurando a preservaccedilatildeo a longo-prazo (Suber 2012) Os repositoacuterios natildeo efetuam o serviccedilo de revisatildeo por pares embora alojem artigos publicados em revistas de AA Outro aspeto importante da via verde de AA eacute o facto dos repositoacuterios de AA natildeo poderem gerar permissotildees de utilizaccedilatildeo por geralmente natildeo possuiacuterem esses direitos (Suber 2012 Bjoumlrk et al 2014)

Segundo Houghton amp Swan (2013) a via verde eacute o meio mais sustentaacutevel em termos de custos para todas as partes envolvidas Poreacutem de acordo com Swan (2012) soacute quando o AA por via verde eacute mandatado eacute que se atingem resultados satisfatoacuterios Apesar disso os repositoacuterios podem estimular a sua utilizaccedilatildeo se fornecerem serviccedilos como a contagem de citaccedilotildees ou estatiacutesticas de uso Bjork et al (2014 traduccedilatildeo livre) afirmam que o raacutecio de depoacutesito de artigos revistos pelos pares em repositoacuterios ronda os 12 justificando este baixo nuacutemero com os fracos sistemas de incentivo acadeacutemico com a falta de repositoacuterios adequados com a falta de conhecimento e com o fato de ser uma tarefa que consome tempo

Segundo o Directory of Open Access Repositories (OpenDOAR) existem vaacuterios tipos de repositoacuterios de AA os disciplinares que reuacutenem toda a informaccedilatildeo cientiacutefica de um

16

determinado campo do conhecimento os institucionais que agregam a informaccedilatildeo produzida por uma determinada instituiccedilatildeo os governamentais que alojam informaccedilatildeo proveniente de oacutergatildeos do Governo e os repositoacuterios agregadores Em Novembro de 2016 encontram-se listados no OpenDOAR 49 repositoacuterios de AA localizados em Portugal sendo que cerca de frac34 da totalidade dos repositoacuterios pertence a instituiccedilotildees do ensino superior O Open Archive Initiative ndash Protocol for Metadata Harvesting (OAI-PMH) permite a interoperabilidade entre diferentes plataformas possibilitando aos repositoacuterios de AA formar um sistema central virtual potenciando a descoberta e acessibilidade da informaccedilatildeo cientiacutefica (Suber 2012 Swan 2012 Bjoumlrk et al 2014) A Cybermetrics Lab lanccedilou em 2017 o Ranking de Repositoacuterios Web um grupo de investigaccedilatildeo do Conselho Superior de Investigaccedilatildeo Cientiacutefica de Espanha com o objetivo de apoiar o AA agraves publicaccedilotildees cientiacuteficas

Portugal possui 4 repositoacuterios no grupo dos 223 ldquoTop Portalsrdquo do ranking com o Scielo Portugal a ocupar a 76ordf posiccedilatildeo o Repositoacuterio Comum na 87ordf posiccedilatildeo a Plataforma de Revistas de AA da Universidade de Aveiro na 110ordf posiccedilatildeo e o Depoacutesito de Dissertaccedilotildees e Teses Digitais na 124ordm posiccedilatildeo No ldquoTop Institutionalsrdquo Portugal eacute representado pelo Universidade do Minho Repositorium na 60ordf posiccedilatildeo seguido pelo Repositoacuterio Universidade de Lisboa na 156ordf posiccedilatildeo e Repositoacuterio Aberto Universidade do Porto na 188ordf posiccedilatildeo entre os melhores duzentos classificados Em termos de ranking mundial o Repositorium da Universidade do Minho eacute o repositoacuterio melhor colocado ocupando a 68ordf posiccedilatildeo (Cybermetrics Lab 2017)

A relaccedilatildeo entre a via verde e a via dourada pode ser vista como ldquocomplementary and synergisticrdquo pois a filosofia de criaccedilatildeo e implementaccedilatildeo eacute a mesma (Suber 201258) Para este autor a via verde natildeo necessita de investimento econoacutemico tatildeo elevado para alavancar o AA agraves publicaccedilotildees cientiacuteficas nem infringe a liberdade acadeacutemica podendo ainda cobrir todos os resultados de investigaccedilatildeo de uma instituiccedilatildeo Este modo de disseminaccedilatildeo eacute compatiacutevel com a publicaccedilatildeo nas tradicionais revistas por subscriccedilatildeo podendo ainda alojar outros conteuacutedos que natildeo apenas artigos Jaacute a via dourada possui a vantagem de ser imediata sem periacuteodos de embargo podendo ainda ser classificada como AA Livre se forem dadas as respetivas permissotildees de uso Acrescenta-se o facto de a via dourada possuir o serviccedilo de revisatildeo por pares e fornecer sempre o acesso agrave versatildeo final do artigo Suber (2012 traduccedilatildeo livre) afirma que apenas a conjugaccedilatildeo das vantagens de cada modelo de publicaccedilatildeo garante a complementaridade de publicaccedilatildeo em AA uma vez que por si soacute tanto a via verde como a via dourada natildeo satildeo suficientes para assegurar o pleno AA O autor defende que enquanto a via verde atua melhor no registo e preservaccedilatildeo da investigaccedilatildeo cientiacutefica a via dourada assegura uma melhor distribuiccedilatildeo e certificaccedilatildeo de qualidade Na impossibilidade de publicar por uma das vias o investigador pode optar pela outra via assegurando sempre o AA ao seu trabalho

17

12 A Ciecircncia Aberta

A investigaccedilatildeo cientiacutefica encontra-se numa transiccedilatildeo cultural que abrange os

modelos de publicaccedilatildeo e reutilizaccedilatildeo na procura de uma maior abertura com o cariz digital a impulsionar o acesso aos resultados cientiacuteficos Machado (2015) salienta a necessidade de adotar um conceito mais amplo e que possa alojar na sua definiccedilatildeo toda a panoacuteplia de recursos cientiacuteficos produzidos durante o processo de investigaccedilatildeo A Ciecircncia Aberta (CA) refere-se comummente ao esforccedilo para tornar mais acessiacuteveis os resultados da investigaccedilatildeo cientiacutefica financiada pelo setor puacuteblico em formato digital para a comunidade cientiacutefica setor empresarial ou sociedade em geral (OECD 2015a)

O conceito de CA eacute considerado um termo guarda-chuva que assenta em vaacuterios pilares quer para remoccedilatildeo das barreiras de partilha de qualquer resultado meacutetodo ou ferramenta em qualquer fase do processo de investigaccedilatildeo (Bueno de la Fuente 2016 traduccedilatildeo livre) quer como sua condiccedilatildeo para a sua concretizaccedilatildeo (infraestrutura tecnoloacutegica) quer como desambiguaccedilatildeo de autores instituiccedilotildees e produccedilatildeo cientiacutefica (identificadores uacutenicos) A figura seguinte expressa algumas das vertentes que se enquadram no conceito amplo de CA e que respeita a manifestaccedilotildees muito distintas natildeo apenas da academia como jaacute foi referido mas de todas as esferas da sociedade

Fig 1 Os pilares da Ciecircncia Aberta Fonte adaptado de httpswwwfosteropenscienceeucontentwhat-open-science-introduction

A CA eacute um meio e natildeo um fim Garantir o acesso aos resultados de investigaccedilatildeo cientiacutefica pode tornar o sistema de investigaccedilatildeo mais eficiente ao reduzir custos na coleta transferecircncia e reutilizaccedilatildeo de dados ao aumentar a transparecircncia e qualidade no processo de investigaccedilatildeo acelerar a transferecircncia do conhecimento aumentar a

Ciecircncia Aberta

Acesso Aberto

Dados Abertos

Ciecircncia Cidadatilde

Revisatildeo por Pares Aberta

Coacutedigo Aberto

Blocos de Notas abertos

Recursos Educacionais

Abertos

Redes Sociais Cientiacuteficas

18

repercussatildeo do conhecimento na economia e promover a ligaccedilatildeo entre cidadatildeos e a ciecircncia e a investigaccedilatildeo (OECD 2015a traduccedilatildeo livre) A colaboraccedilatildeo dos cidadatildeos no processo de investigaccedilatildeo eacute denominada ciecircncia cidadatilde sendo o movimento de CA um importante facilitador da participaccedilatildeo puacuteblica na ciecircncia (Leonelli Spichtinger Prainsack 2015) O crescimento da ciecircncia cidadatilde aumentou o nuacutemero de intervenientes na cocriaccedilatildeo de conhecimento contribuindo para a aproximaccedilatildeo da fronteira entre o cientista profissional e o amador (Royal Society 2012 International Science 2015) Segundo a UNESCO (2012) citando dados da PubMed Central 40 do acesso a resultados de investigaccedilatildeo eacute feito por cidadatildeos individuais superando a utilizaccedilatildeo feita por universidades empresas e governo

Segundo a Open Science and Research Initiative (2014) a promoccedilatildeo da CA eacute feita em 4 niacuteveis definiccedilatildeo de poliacuteticas gerais alteraccedilatildeo na cultura de trabalho alteraccedilatildeo nos meacutetodos de trabalho e desenvolvimento de serviccedilos e infraestruturas Fecher amp Friesike (2013) estruturaram as mudanccedilas na CA em cinco escolas de pensamento

Fig 2 As 5 escolas de pensamento das mudanccedilas operadas pela Ciecircncia Aberta Fonte Fecher amp Friesike (2013)

A abertura aos resultados da investigaccedilatildeo eacute segundo a UNESCO (2015) muito requerida no processo de capacitaccedilatildeo dos cidadatildeos sendo que esta noccedilatildeo de abertura acarreta mudanccedilas na sociedade ao fornecer soluccedilotildees sustentaacuteveis para o chamado fosso digital6 Para a CA prosperar a comunidade acadeacutemica deve ter acesso a publicaccedilotildees dados meacutetodos conhecimentos serviccedilos de apoio e colaboraccedilatildeo entre os diversos intervenientes (Open Science and Research Initiative 2014 Leonelli Spichtinger Prainsack 2015 OECD 2015a Resoluccedilatildeo do Conselho de Ministros nordm 212016 2016) O acesso agrave literatura acadeacutemica tem por objetivo transpor a clivagem de conhecimento existente na sociedade fornecendo o Acesso Aberto (AA) atraveacutes de sistemas em linha aos resultados da investigaccedilatildeo financiada com fundos puacuteblicos (UNESCO 2015)

6 Segundo o glossaacuterio estatiacutestico da OCDE o termo fosso digital refere-se agrave desigualdade no acesso agrave informaccedilatildeo tecnologias de comunicaccedilatildeo e uso da Internet entre indiviacuteduos negoacutecios e aacutereas geograacuteficas com diferentes niacuteveis socioeconoacutemicos Disponiacutevel na WWW httpsstatsoecdorgglossarydetailaspID=4719

bull dirigida agrave arquitetura tecnoloacutegica com novas plataformas ferramentas e serviccedilos para os cientistas Infraestrutura

bull dirigida agrave acessibilidade do conhecimento pelo puacuteblico Puacuteblica bull dirigida ao desenvolvimento de uma nova avaliaccedilatildeo alternativa de impacto Avaliaccedilatildeo

bull dirigida ao acesso gratuito ao conhecimento pelo puacuteblico Democraacutetica

bull melhoria da eficiecircncia atraveacutes da investigaccedilatildeo colaborativa Pragmaacutetica

19

O projeto da EU Facilitate Open Science Training for European Research (FOSTER) assume a divisatildeo do conceito de Ciecircncia Aberta em quatro diferentes categorias Acesso Aberto Dados Abertos Coacutedigo Aberto e Investigaccedilatildeo Replicaacutevel Aberta (Pontika Knoth Cancellieri amp Pearce 2015)

A plena implementaccedilatildeo da CA estaacute dependente da resoluccedilatildeo de alguns desafios A Royal Society (2012) afirma que os interesses comerciais e econoacutemicos incluem a propriedade dos dados e os direitos de propriedade intelectual associados as parcerias puacuteblico-privadas e a abertura de informaccedilatildeo comercial de interesse puacuteblico a que se junta a privacidade e a seguranccedila e que constituem limites agrave implementaccedilatildeo da CA Por outro lado os incentivos e as recompensas concedidos agrave comunidade cientiacutefica continuam a ser inexistentes particularmente porque existe (i) falta de infraestruturas para apoiar a abertura (ii) receio que os dados em bruto e meacutetodos sejam mal interpretados ou mal usados (iii) incerteza sobre a propriedade dos dados e (iv) falta de experiecircncia na promoccedilatildeo da CA (Open Science and Research Initiative 2014 traduccedilatildeo livre) Metaforicamente Leonelli Spichtinger Prainsack (201513) defendem que ldquoin addition to the stick of compulsatory mandates carrots are therefore also neededrdquo Os autores sintetizam as ldquocarrotsrdquo ou seja as recompensas em trecircs eixos reconhecimento das praacuteticas de partilha nas estruturas de incentivos criaccedilatildeo de incentivos mais significativos para envolver os investigadores na CA e o reconhecimento do papel das meacutetricas alternativas na avaliaccedilatildeo dos investigadores

A CA proporciona vaacuterios benefiacutecios a todos os intervenientes e partes interessadas do processo de investigaccedilatildeo como o aumento da eficaacutecia da investigaccedilatildeo o aumento do conhecimento do modelo cientiacutefico melhoria do foco e da qualidade dos resultados de investigaccedilatildeo geraccedilatildeo de novas ideias de investigaccedilatildeo aumento do compromisso com a ciecircncia e melhoria da literacia cientiacutefica maior abertura e impacto social e econoacutemico aumento da qualidade visibilidade e impacto da investigaccedilatildeo (Open Science and Research Iniciative 2014 Leonelli Spichtinger Prainsack 2015 Forsstroumlm amp Haataja 2016) Estes benefiacutecios abrangem os investigadores e as suas equipas as organizaccedilotildees os decisores e financiadores e tambeacutem o puacuteblico em geral

A CA clama por uma mudanccedila no comportamento dos investigadores de forma a permitir a abertura de conteuacutedos e a adoccedilatildeo de praacuteticas e estrateacutegias abertas em todo o ciclo de investigaccedilatildeo (Pontika et al 2015) De acordo com Machado (2015) a abertura do conhecimento na sociedade da informaccedilatildeo pode ser uma realidade se essa for a prioridade de qualquer poliacutetica que tenha por objetivo promover a melhoria das condiccedilotildees de vida dos cidadatildeos e a reduccedilatildeo das assimetrias globais Quando falamos de CA aquilo que se vecirc eacute uma realidade jaacute espelhada globalmente inclusivamente em paiacuteses como a China (Price amp Chaytor 2015) onde a abertura poliacutetica natildeo o faria supor

20

A Comissatildeo Europeia desenvolveu o Open Science Monitor como forma de avaliar os desenvolvimentos na CA e as tendecircncias particulares ldquoin open science activities over time and comparatively between countries and scientific disciplinesrdquo (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2017) O Open Science Monitor tem como fonte diversas organizaccedilotildees empenhadas na avaliaccedilatildeo da CA do AA e dos Dados Abertos7 garantindo assim a profundidade e qualidade dos dados O modelo usado pelo Open Science Monitor divide diversos indicadores de avaliaccedilatildeo em trecircs categorias AA agraves publicaccedilotildees AA aos dados de investigaccedilatildeo e formas abertas de comunicaccedilatildeo acadeacutemica como demostrado na figura8 seguinte

Fig 3 Caracteriacutesticas e indicadores do Open Science Monitor Fonte Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2017) Disponiacutevel na WWW httpeceuropaeuresearchopenscienceindexcfmpg=homeampsection=monitor

A implementaccedilatildeo da CA implica alteraccedilotildees ao niacutevel da administraccedilatildeo da investigaccedilatildeo para melhorar a ciecircncia tornando-a crediacutevel replicaacutevel e iacutentegra como explica a Comissatildeo Europeia (2016a) Significa tambeacutem fazer alteraccedilotildees teacutecnicas e desenvolver normas para tornar a ciecircncia mais eficiente ao evitar a duplicaccedilatildeo de 7 Entre as vaacuterias organizaccedilotildees encontram-se a 101 innovations Clarivate Analytics Altimetric arXiv F1000Research figshare OpenAIRE Wiley entre outras 8 Os indicadores assinalados com um asterisco () tambeacutem satildeo considerados como forma de comunicaccedilatildeo acadeacutemica aberta

21

recursos e ao otimizar a reutilizaccedilatildeo de dados Por fim tornar a ciecircncia mais aberta ao melhorar a acessibilidade a dados e ao assegurar as condiccedilotildees legais apropriadas para o desenvolvimento de Text e Data Mining potenciando assim alteraccedilotildees econoacutemicas e legais ao niacutevel do copyright

Os investigadores recorrem cada vez mais agraves plataformas sociais para partilhar e validar os projetos de investigaccedilatildeo enquanto a criaccedilatildeo de plataformas abertas permite a partilha de dados para resoluccedilatildeo de problemas puacuteblicos como eacute o caso do The Humanitarian Data Exchange9 (Open Science and Research Initiative 2014) A ScienceOpen eacute outro exemplo de uma plataforma gratuita de pesquisa de informaccedilatildeo cientiacutefica que oferece contexto agrave investigaccedilatildeo atraveacutes de comentaacuterios recomendaccedilotildees ou revisatildeo por pares apoacutes a publicaccedilatildeo permitindo assim que os investigadores encontrem a informaccedilatildeo mais relevante para as suas pesquisas (ScienceOpen 2017) Nos uacuteltimos anos tecircm surgido outras formas de publicaccedilatildeo em AA normalmente atraveacutes de paacuteginas pessoais ou em siacutetios de comunidades cientiacuteficas como o academiaedu ou o Research Gate que em 2017 foram classificados como liacutederes do ranking ldquoTop Portalsrdquo do Ranking de Repositoacuterios Web pela Cybermetrics Lab Outros resultados interessantes foram obtidos por Kramer e Bosman (2016) apoacutes a anaacutelise dos dados dos mais de 20 mil participantes num inqueacuterito a niacutevel global A CA e o AA satildeo apoiados por 809 e 859 dos inquiridos respetivamente Em termos de publicaccedilatildeo de artigos o estudo indica o Research Gate e os repositoacuterios institucionais como os preferidos Relativamente agrave publicaccedilatildeo de dados a preferecircncia dos inquiridos recaiu no GitHub seguindo-se o Figshare DropBox BitBucket Dataverse Dryad e o Zenodo Poreacutem dos 20 mil inquiridos apenas cerca de 30 respondeu a esta questatildeo Em relaccedilatildeo a Portugal e no caso do apoio agrave CA e ao AA os resultados satildeo extremamente positivos contudo a amostra obtida eacute demasiado pequena para se poder aferir qualquer conclusatildeo definitiva E contrastam de forma gritante com as conclusotildees do relatoacuterio sobre a elaboraccedilatildeo de uma poliacutetica nacional de CA que sublinha a dificuldade de generalizaccedilatildeo das praacuteticas de AA registando por isso limitaccedilotildees nas ldquotaxas de sucesso e cumprimentos das poliacuteticas institucionaisrdquo (Comissatildeo Executiva Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta [Comissatildeo Executiva GT-PNCA] 20169)

A intenccedilatildeo da EU eacute criar uma European Open Science Cloud (EOSC) ou seja um ambiente onde os investigadores possam ter acesso a ferramentas e dados para fins de investigaccedilatildeo inovaccedilatildeo e educaccedilatildeo Esta plataforma eacute considerada uma parte fundamental da transiccedilatildeo europeia para a CA e para tornar a ciecircncia orientada por dados (Comissatildeo Europeia 2016a traduccedilatildeo livre)

Podem observar-se algumas tendecircncias chave na CA e a sua relevacircncia na EOSC como o novo modelo de comunicaccedilatildeo acadeacutemica recompensas modernas e

9 Disponiacutevel na WWW httpsdatahumdataorg

22

reconhecimento aumento da dependecircncia de peritos de dados colaboraccedilatildeo interdisciplinar fomento da transiccedilatildeo de ciecircncia para inovaccedilatildeo desenvolvimento de um complexo sistema de infraestruturas da integridade da investigaccedilatildeo e do processamento do conhecimento por maacutequinas (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016b traduccedilatildeo livre)

O FOSTER desenhou uma interessante taxonomia a partir do termo CA que permite demonstrar a grandeza e os diferentes niacuteveis de impacto do conceito (Pontika et al 2015)

Fig 4 Taxonomia da Ciecircncia Aberta Fonte Knoth Petr Pontika Nancy (2015)

Em termos de poliacuteticas existem trecircs tendecircncias na definiccedilatildeo das poliacuteticas de CA como refere a OECD (2015a traduccedilatildeo livre)

As regras obrigatoacuterias impostas nos contratos de financiamento ou em poliacuteticas nacionais

Os mecanismos de incentivo como o apoio financeiro para publicaccedilatildeo de investigaccedilatildeo a citaccedilatildeo e a progressatildeo na carreira

Os viabilizadores ou seja a infraestrutura que permite o decurso da abertura cientiacutefica

23

A OECD (2015a) acrescenta que as poliacuteticas de AA satildeo mais maduras que as poliacuteticas de Ciecircncia Aberta existentes e sublinha ainda que as poliacuteticas de CA devem ter princiacutepios-base mas que tecircm de ser adaptadas agraves realidades locais

A CA tem estado em foco na agenda poliacutetica dos governos e organizaccedilotildees mundiais Ao niacutevel europeu a Agenda Digital da Comissatildeo Europeia define cinco potenciais linhas de accedilatildeo poliacuteticas (Comissatildeo Europeia 2016a45 traduccedilatildeo livre)

Fomento e criaccedilatildeo de incentivos para a CA atraveacutes do fomento do conceito de abertura em programas de educaccedilatildeo e promoccedilatildeo das melhores praacuteticas de ciecircncia cidadatilde garantindo a qualidade impacto e integridade da investigaccedilatildeo

Remoccedilatildeo de barreiras atraveacutes da revisatildeo de carreiras dos investigadores bem como dos incentivos e recompensas pelos esforccedilos de CA

Generalizaccedilatildeo da promoccedilatildeo de poliacuteticas de AA (artigos e dados de investigaccedilatildeo) Desenvolvimento de infraestruturas de investigaccedilatildeo para a CA de forma a

melhorar o alojamento de dados acesso e governaccedilatildeo com a criaccedilatildeo de uma nuvem europeia de CA (European Open Science Cloud)

Incorporar a Ciecircncia Aberta na sociedade como condutor socioeconoacutemico

De acordo com a Open Science and Research Initiative (2014) a CA tem vaacuterios intervenientes distintos os investigadores e as equipas de investigaccedilatildeo organizaccedilotildeesentidades de investigaccedilatildeo financiadores decisores e puacuteblico em geral A OECD (2015a) acrescenta as bibliotecas editoras cientiacuteficas privadas empresas e entidades supranacionais como a proacutepria OECD Neste contexto a EU tem-se destacado como promotora da CA Nesse sentido criou o jaacute mencionado FOSTER um projeto cujo objetivo eacute produzir um programa de treino que iraacute ajudar investigadores estudantes bibliotecaacuterios e outras partes interessadas a incorporar a CA nas suas metodologias de investigaccedilatildeo O portal FOSTER10 eacute uma plataforma e-learning que agrega conteuacutedos de treino sobre CA para aqueles que precisem de desenvolver estrateacutegias e competecircncias para a implementaccedilatildeo da CA nos fluxos de trabalho diaacuterio (FOSTER 2016) A Uniatildeo Europeia (EU) posiciona-se tambeacutem como financiadora do AA como forma de acesso ao conhecimento Nesse sentido adotou o AA como princiacutepio em 2012 tendo-o definido como obrigatoacuterio em 2013 no novo programa de financiamento da investigaccedilatildeo e inovaccedilatildeo europeu denominado Horizonte 2020 (Uniatildeo Europeia 2013) Financiou ainda um projeto de investigaccedilatildeo exclusivamente dedicado ao alinhamento de estrateacutegias e poliacuteticas de AA o Pasteur4OA Aleacutem disso a EU criou o OpenAIRE uma plataforma que permite agregar toda a literatura cientiacutefica produzida em projetos financiados por fundos europeus A segunda fase do OpenAIRE consiste em facilitar o AA ao fornecer ligaccedilotildees cruzadas entre publicaccedilotildees dados e esquemas de financiamento e iraacute expandir a rede de repositoacuterios para incluir os fornecedores de dados com o objetivo de interligar os dados cientiacuteficos associados

10 Disponiacutevel na WWW httpswwwfosteropenscienceeu

24

(OECD 2015a) A terceira fase do projeto arrancou em Janeiro de 2017 com o OpenAIRE-Connect que visa fornecer pontes tecnoloacutegicas e sociais para aleacutem de disponibilizar serviccedilos de troca de literatura dados ou meacutetodos de investigaccedilatildeo ldquowith semantic links between them across research communities and content providers in scientific communicationrdquo (OpenAIRE 2017) O OpenAIRE-Connect iraacute tambeacutem implementar o conceito de ldquoOpen Science as a Service (OSaaS) on top of the existing OpenAIRE infrastructure delivering out-of-the-box on demand deployable toolsrdquo (OpenAIRE 2017) O projeto eacute uma parceria entre 11 instituiccedilotildees onde consta a Universidade do Minho como representante portuguesa

A UNESCO estaacute ativamente empenhada na promoccedilatildeo da CA e em parceria com a Nature lanccedilou em Novembro de 2014 a Biblioteca Mundial de Ciecircncia11 (WLoS) uma biblioteca cientiacutefica gratuita e multilingue com o objetivo de fornecer acesso agrave investigaccedilatildeo cientiacutefica recente a estudantes e professores de todas as partes do globo Podemos ainda relacionar a CA com o conceito de Ciecircncia 20 que sugere a partilha e a colaboraccedilatildeo como nova abordagem para o uso de informaccedilatildeo incluindo o uso de ferramentas como wikis blogs viacutedeos dados em bruto e novas teorias (Machado 2015 Leonelli Spichtinger Prainsack 2015)

Em Portugal soacute em fevereiro de 2016 se regista a intenccedilatildeo de estabelecer uma poliacutetica nacional de Ciecircncia Aberta com a publicaccedilatildeo dos principiacuteos orientadores para a ldquoCiecircncia Aberta Conhecimento para todosrdquo pelo Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior (MCTES) Em Maio a Resoluccedilatildeo do Conselho de Ministros nordm 212016 vem definir os princiacutepios da implementaccedilatildeo da poliacutetica de Ciecircncia Aberta em Portugal Esta poliacutetica estaacute estruturada em torno de quatro eixos Acesso aberto e dados abertos Infraestruturas e preservaccedilatildeo digital Avaliaccedilatildeo cientiacutefica Responsabilidade social cientiacutefica (Comissatildeo Executiva GT-PNCA 2016)

O MCTES e o Ministeacuterio da Cultura lanccedilaram em 201712 o Diretoacuterio dos Repositoacuterios Digitais uma infraestrutura digital com o objetivo de identificar e constituir um ponto de acesso aos repositoacuterios digitais existentes em Portugal na aacuterea da Ciecircncia e da Cultura de forma a promover a utilizaccedilatildeo dos repositoacuterios digitais bem como a normalizaccedilatildeo teacutecnica e praacuteticas de preservaccedilatildeo digital tal como foi anunciado em 2016 (Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior Ministeacuterio da Cultura 2016)

13 Big Data ou dados massivos

O termo Big Data surge associado aos dados em formato digital que excedem a capacidade de processamento dos sistemas de bases de dados convencionais (Reitano 11 Disponiacutevel na WWW httpwwwnaturecomwlsabout 12 Disponiacutevel na WWW httprepositorios-conhecimentopt

25

2013 Comissatildeo Europeia 2014) Segundo Borgman (2015) o Big Data compreende dados estruturados e natildeo estruturados com tendecircncia agrave homogeneidade e agrave padronizaccedilatildeo Ubaldi (2013 traduccedilatildeo livre) reitera que o Big Data enquanto fenoacutemeno emergiu quando a disponibilidade de datasets produzidos por vaacuterias fontes cresceu e quando os utilizadores de dados reconheceram o valor potencial da combinaccedilatildeo e ligaccedilatildeo de diferentes conjuntos de dados produzidos por diferentes intervenientes

A revoluccedilatildeo digital ocorrida nas uacuteltimas deacutecadas teve repercussotildees profundas na coleta acesso armazenamento e transmissatildeo de dados estando atualmente estimado em 40 o volume de crescimento de dados por ano (Manyika et al 2011) Os dados digitais estatildeo presentes em todos os setores econoacutemicos o nuacutemero de paacuteginas web cresceu exponencialmente surgiram as redes sociais os smartphones e toda uma panoacuteplia de tecnologias que coletam dados que podem ser beneacuteficos para a sociedade como as aplicaccedilotildees surgidas no acircmbito da Internet of Things13 (IoT) que iratildeo avolumar o nuacutemero de dados jaacute produzidos (Fan amp Bifet 2012)

Weacutere drowning in data bits are faster than atoms (Croll 20122)

Large amounts of data are being produced permanently and when these are analyzed and interlinked they have the potential to create new knowledge and intelligent solutions for economy and society (Uniatildeo Europeia 2016)

Lynch (2009) salienta a emergecircncia do 4ordm paradigma da investigaccedilatildeo cientiacutefica termo cunhado por Jim Gray definindo-se como uma ciecircncia intensiva orientada a dados

Fig 5 Paradigmas da investigaccedilatildeo cientiacutefica Fonte traduzido de Lynch (2009)

Esta nova ciecircncia assenta em trecircs pilares captura curadoria e anaacutelise de dados (Bell 2009 Royal Society 2012) A curadoria de dados envolve variadas atividades como ldquofinding the right data structures to map into various storesrdquo (Bell 2009XIII) Inclui o esquema de metadados e os respetivos metadados para a sua preservaccedilatildeo e pesquisa A anaacutelise de dados ldquocovers a whole range of activities throughout the workflow pipeline including the use of databases analysis and modeling and then

13 A Internet Of Things eacute um conceito onde edifiacutecios transportes produtos e pessoas se tornam espaccedilos de informaccedilatildeo ou seja satildeo imbuiacutedos com sensores software ou eletroacutenica que lhes permite coletar e partilhar dados Disponiacutevel na WWW httpwwwtheinternetofthingseuwhat-is-the-internet-of-things

Investigaccedilatildeo teoacuterica

Investigaccedilatildeo empiacuterica

Investigaccedilatildeo computacional

Investigaccedilatildeo orientada a dados

26

data visualizationrdquo (Bell 2009XIV) podendo ser sinoacutenimo de melhores resultados processos e decisotildees (Comissatildeo Europeia 2014)

Dumbill (2012) afirma que para retirar valor destes dados eacute necessaacuterio encontrar formas alternativas de os processar Borgman reitera que os dados tecircm muitos tipos de valor e que esse valor pode natildeo ser visiacutevel ateacute os dados serem coletados curados ou perdidos A autora sublinha que os dados natildeo tecircm valor estando isolados eles fazem parte de uma infraestrutura do conhecimento ldquoan ecology of people pratices technologies institutions material objects and relationshpsrdquo (Borgman 20154) Este volume de dados produzidos pode segundo o Big Data Europe (2016) trazer contribuiccedilotildees relevantes para o progresso teacutecnico dos setores chave da sociedade e ajudar a reformular o mundo dos negoacutecios Ainda segundo a EU ldquowhat is needed are innovative technologies strategies and competencies for the beneficial use of Big Data to address societal needsrdquo

Segundo Manyika et al (2011) os Dados Massivos podem gerar valor de vaacuterias formas criar transparecircncia governativa e empresarial permitir a experimentaccedilatildeo expor variaacuteveis e melhorar o rendimento criar de produtos e serviccedilos para populaccedilotildees especiacuteficas apoiar ou substituir o processo de decisatildeo humana com algoritmos automatizados criar de modelos de negoacutecio produtos e serviccedilos inovadores Verifica-se que um nuacutemero crescente de empresas jaacute usa dados para gerar valor econoacutemico sendo que tambeacutem os governos tecircm a possibilidade de aumentar a sua eficiecircncia e gerar poupanccedila (Manyika et al 2011) A Comissatildeo Europeia (2017a) destaca as aplicaccedilotildees para smartphones ou produtos inteligentes para empresas acrescentando que os Dados Massivos podem fomentar o crescimento de emprego na Europa e melhorar a qualidade de vida dos cidadatildeos europeus

Numa organizaccedilatildeo o valor do Big Data eacute contabilizado em duas categorias uso analiacutetico e desenvolvimento de novos produtos (Dumbill 2012) Croll (20122) afirma a necessidade da sociedade em decidir agir e experimentar com base nas aprendizagens feitas e utilizar esse conhecimento em accedilotildees futuras defendendo que estamos a entrar numa ldquofeedback economyrdquo que iraacute tornar-se a norma em organizaccedilotildees puacuteblicas e no setor empresarial dada a eficiecircncia e a otimizaccedilatildeo de recursos geradas Esta economia de retorno de resultados e respetivas mediccedilotildees de impacto tem por base a cadeia de abastecimento dos Dados Massivos como representado na figura seguinte

27

Fig 6 Cadeia de abastecimento dos Dados Massivos Fonte traduzido de Croll (2012)

ldquoIn this networked world people objects and connections are producing data at unprecedented rates both actively and passivelyrdquo (Science International 2015) Segundo Hey Tansley e Tolle (2009) a Internet pode proporcionar mais do que o acesso aos dados pode agregar todos os dados disponiacuteveis agrave literatura que lhes faz referecircncia aumentando a velocidade da informaccedilatildeo cientiacutefica e a eficiecircncia da investigaccedilatildeo Laney (2001) foi o primeiro a caraterizar a gestatildeo de dados atraveacutes do sistema de trecircs Vrsquos que ajuda a perceber a natureza dos dados e as plataformas disponiacuteveis para os explorar Marr (2014) afirma que atualmente o sistema passou a ser composto por dois Vrsquos adicionais perfazendo um total de cinco Vrsquos

Volume o volume e o tamanho dos dados continuam a aumentar contudo a capacidade de processamento dos nossos sistemas continua baixa

Variedade existecircncia de diversos tipos de dados provenientes de diversas fontes Velocidade obtenccedilatildeo de informaccedilatildeo em tempo real Veracidade refere-se agrave qualidade e correccedilatildeo dos dados Valor ganho de competitividade tomada de decisotildees alavancada em informaccedilatildeo

atualizada

A intensidade da revoluccedilatildeo operada pelo fenoacutemeno dos Dados Massivos ldquohas produced changes in economic and social behaviour e has profound implications for sciencerdquo permitindo a identificaccedilatildeo de padrotildees em fenoacutemenos e demonstrando relaccedilotildees insuspeitas entre dados que ateacute aqui eram desconhecidas (Science International 2015) ldquoContrary to many high-volume big data settings where standardised infrastructure are available there exist other big data settings with less

Coleta de Dados

Extraccedilatildeo e Limpeza

Infra

estruturas

Plataformas

M Learning e Mining

Exploraccedilatildeo humana

Armazena mento

Partilha

Mediccedilatildeo de resultados e criaccedilatildeo de feedback

28

mature processes due to the lack of tools resources and community exchangerdquo (Proumll Meixner ampRauber 2016) Borgman (20158) recorre a um termo utilizado na Estatiacutestica para identificar distribuiccedilotildees de dados a long tail of data14 ou cauda longa dos dados que quando aplicada agrave investigaccedilatildeo acadeacutemica implica que ldquoa small number of research teams work with large volumes of data some teams work with very little data and most fall somewhere in betweenrdquo

Fig 7 A cauda longa dos Dados Massivos Fonte traduzido de Borgman (2015)

A cauda longa dos dados de investigaccedilatildeo abrange grandes porccedilotildees ldquoof data that are highly heterogeneous managed predominantly locally within each researcherrsquos environment and frequently not properly transferred to and managed within well-curated repositoriesrdquo (Proumll Meixner ampRauber 2016) Segundo o e-Infrastructure Reflection Group (e-IRG) (2016) citando Heidorn (2008) o termo long tail of data tem-se tambeacutem aplicado para salientar a variedade na estrutura tema complexidade formato tamanho localizaccedilatildeo e o uso na investigaccedilatildeo dos dados de investigaccedilatildeo

Para capturar todo o potencial gerado pela produccedilatildeo massiva de dados devem ser tidas em conta vaacuterias questotildees (Manyika et al 2011 traduccedilatildeo livre)

Formulaccedilatildeo de poliacuteticas de dados que incluam temas sensiacuteveis como a privacidade seguranccedila credibilidade e propriedade intelectual

Desenvolvimento de novas tecnologias de armazenamento computaccedilatildeo e software analiacutetico aleacutem de novas teacutecnicas de anaacutelise

Mudanccedila na cultura organizacional com a contrataccedilatildeo de peritos que possam retirar informaccedilatildeo e conhecimento dos dados e tambeacutem o estabelecimento de incentivos para otimizar o uso do Big Data induzindo melhorias numa tomada de decisatildeo mais informada

Acesso aos dados para permitir a criaccedilatildeo de novas oportunidades de negoacutecio Intensificaccedilatildeo da estrutura competitiva de empresas e setor puacuteblico para

potenciar a captaccedilatildeo de benefiacutecios da massificaccedilatildeo de dados

14 O termo foi introduzido por Cris Anderson (2004) para comparar o mercado de bens feito ao niacutevel de vendas fiacutesicas e online Disponiacutevel na WWW httpswwwwiredcom200410tail

Volu

me

de d

ados

Nuacutemero de Investigadores

29

O fenoacutemeno do Big Data estaacute intrinsecamente ligado a outro fenoacutemeno o desenvolvimento de software aberto como eacute o caso do Apache Hadoop15 que permite o processamento de grandes quantidades de dados em paralelo atraveacutes ldquolarge clusters of compute nodesrdquo (Fan amp Bifet 20123)

A influecircncia do Big Data na sociedade manifesta-se a diversos niacuteveis destacando-se o desenvolvimento de projetos na aacuterea da sauacutede transportes agricultura ambiente induacutestria ganho de competecircncias cientiacuteficas mercado de dados e dados abertos Num artigo assinado na Computer World Olavsrud (2013) identifica alguns dos usos do Big Data na atualidade fins meacutedicos empresariais tecnoloacutegicos em eventos desportivos ou no desenvolvimento das smart cities A Uniatildeo Europeia tem contribuiacutedo para o alargar da importacircncia e da esfera de influecircncia do fenoacutemeno Big Data financiando entre outros projetos como

DataPitch16 que tem por objetivo acelerar a chegada dos dados ao mercado Open Data Incubator Europe17 (ODINE) que oferece incubaccedilatildeo e tutoria agraves PMEs

na nova geraccedilatildeo de empreendedorismo digital European Data Science Academy18 (EDSA) que avalia o estado do setor de peritos

de dados e oferece ciclos de aprendizagem de habilidades especiacuteficas de acordo com as necessidades detetadas

Big Data Europe que visa coletar informaccedilotildees sobre o desenvolvimento de infraestruturas necessaacuterias agrave praacutetica de uma ciecircncia de dados intensiva para a resoluccedilatildeo de problemas da sociedade possibilitando que as empresas possam construir produtos e serviccedilos inovadores ldquobased on semantically interoperable large-scale multi-lingual data assets and knowledge available under a variety of licenses and business modelsrdquo (Big Data Europe 2016)

14 Dados Abertos

Eacute axiomaacutetico o fato de o conhecimento ser essencial ao processo de decisatildeo agrave inovaccedilatildeo e ao bem-estar social Os dados sempre foram essenciais em muitas aacutereas da investigaccedilatildeo e nos uacuteltimos anos tornaram-se destaque em mais aacutereas cientiacuteficas crescendo substancialmente em escala e complexidade Quando a informaccedilatildeo eacute abundante a proacutepria natureza da investigaccedilatildeo comeccedila a mudar gerando um ciclo de respostas entre investigadores e resultados de investigaccedilatildeo que ldquochanges the pace and direction of discoveryrdquo (Comissatildeo Europeia Grupo de peritos de alto niacutevel em dados de investigaccedilatildeo 20108) Os Dados Abertos permitem que os investigadores produzam anaacutelises e inferecircncias muito aleacutem do que os indiviacuteduos e silos de dados isolados podem

15 Disponiacutevel na WWW httphadoopapacheorg 16 Disponiacutevel na WWW httpcordiseuropaeuprojectrcn206193_enhtml 17 Disponiacutevel na WWW httpsopendataincubatoreu 18 Disponiacutevel na WWW httpcordiseuropaeuprojectrcn194116_enhtml

30

produzir (Shadbolt 2016) O International Council for Science (ICSU) considera que quando o setor publico eacute o responsaacutevel pelos custos da criaccedilatildeo de dados de investigaccedilatildeo eacute do interesse cientiacutefico que seja encorajado o maacuteximo e possiacutevel uso e reuacuteso dos dados (International Council for Science [ICSU] 2014) A abertura dos dados gerados na investigaccedilatildeo cientiacutefica ou pelas entidades puacuteblicas as grandes fontes de dados na atualidade constituem uma oportunidade de gerar valor para a sociedade Segundo Borgman (2015) dados satildeo representaccedilotildees de observaccedilotildees objetos ou outras entidades usadas como prova de um fenoacutemeno para fins de investigaccedilatildeo ou acadeacutemicos Os dados tornam-se informaccedilatildeo quando satildeo combinados de formas que podem revelar padrotildees num determinado fenoacutemeno O conhecimento eacute gerado pela informaccedilatildeo apoiada em dados concretos sobre um fenoacutemeno (Royal Society 2012)

ldquoIn the digital age data is the raw material on which discoveries are built and unfettered access to research datardquo (SPARC) O processo de investigaccedilatildeo eacute dividido em vaacuterias etapas atraveacutes das quais muitas vezes satildeo produzidos dados primaacuterios estatiacutesticas caacutelculos ou anotaccedilotildees seja em forma bruta ou em forma graacutefica que servem de suporte aos artigos cientiacuteficos publicados Contudo dada a variedade de tipologias e formatos por norma os dados natildeo satildeo alvo de publicaccedilatildeo correndo o risco de ser perderem se natildeo forem adequadamente armazenados e preservados Neste sentido a abertura de dados eacute essencial para assegurar a sua preservaccedilatildeo e possiacutevel reutilizaccedilatildeo em benefiacutecio da sociedade

Existem vaacuterias definiccedilotildees de Dados Abertos apresentando algumas diferenccedilas entre elas embora focando o mesmo objetivo Algumas das definiccedilotildees satildeo emitidas no acircmbito da abertura de dados puacuteblicos outras da abertura de dados de investigaccedilatildeo O portal de dados dos EUA define Open Data como os conjuntos de dados de alto valor criados pelo governo federal que possam ser processados por maacutequina e que natildeo sejam privados ou restritos por razotildees de seguranccedila (United States General Services Administration) A Royal Society (2012) entende por Open Data os dados que devem ser acessiacuteveis utilizaacuteveis avaliados ou certificados e inteligiacuteveis A Open Definition sintetiza que os Dados Abertos devem poder ser ldquofreely used modified and shared by anyone for any purposerdquo (Open Knowledge International [a]) Segundo a Open Knowledge International (OKI) (2012b) ldquoOpen Data are the building blocks of open knowledgerdquo O termo Open Data pode ainda referir-se a outros tipos de dados natildeo puacuteblicos que sejam acessiacuteveis de forma livre como os dados dos meacutedia sociais (European Data Portal 2016a)

ldquoOpenness is not however enough Data must be intelligently openrdquo (Science International 20154) O primeiro passo na abertura inteligente dos dados eacute segundo a Royal Society (20127) ldquodata that underpin a journal article should be made concurrently available in a accessible databaserdquo O mundo acadeacutemico tem vindo a ser moldado para apoiar a abertura agrave medida que os benefiacutecios se tornam mais tangiacuteveis e

31

a pressatildeo de retorno de investimento exercida sobre as entidades financiadoras aumenta embora nem todas as aacutereas evoluam com a mesma rapidez (Hahnel amp Hook 2016) A Royal Society (2012) sublinha a necessidade das instituiccedilotildees ligadas agrave investigaccedilatildeo cientiacutefica gerirem os seus dados de modo proficiente para obterem os benefiacutecios proporcionados pela abertura de dados e entenderem a enorme mudanccedila cultural necessaacuteria para atingir este objetivo

A Denton Declaration foi publicada em 2012 com o intuito de promover boas praacuteticas de gestatildeo de dados de investigaccedilatildeo promover a colaboraccedilatildeo transparecircncia e prestaccedilatildeo de contas ao longo das fronteiras organizacionais e disciplinares Esta declaraccedilatildeo estabeleceu treze princiacutepios para promover a cultura de abertura na investigaccedilatildeo estabelecer um padratildeo para arquivo de dados de modo a facilitar a sua pesquisa e acesso desenvolver um regime de financiamento para a construccedilatildeo da infraestrutura necessaacuteria para a gestatildeo de dados adotar padrotildees de metadados preservar a longo prazo os dados subjacentes agraves publicaccedilotildees apoiar os investigadores nas negociaccedilotildees para a abertura dos dados com as editoras e o reconhecer da propriedade intelectual dos investigadores nos dados e em outros produtos de investigaccedilatildeo (Denton Declaration An Open Data Manifesto 2012 traduccedilatildeo livre)

A gestatildeo de informaccedilatildeo e do conhecimento deve ser incluiacuteda nas estrateacutegias organizacionais das instituiccedilotildees (Royal Society 2012) Quando os dados satildeo bem organizados documentados preservados e partilhados tornam-se preciosos no avanccedilo cientiacutefico e no aumento de oportunidades de aprendizagem e inovaccedilatildeo (UK Data Archive 2017) O ciclo de vida dos dados contempla seis fases de gestatildeo incluiacutedas num processo contiacutenuo a cada reutilizaccedilatildeo geram-se novos dados conforme demonstrado na figura seguinte

Fig 8 Ciclo de vida dos dados de investigaccedilatildeo Fonte traduzido de UK Data Archive (2017) Disponiacutevel na WWW httpwwwdata-archiveacukcreate-managelife-cycle

As seis fases do ciclo de vida dos dados comportam diversas accedilotildees necessaacuterias agrave plena execuccedilatildeo de cada ciclo

Criaccedilatildeo

Processa mento

Anaacutelise

Preservaccedilatildeo

Fornecer acesso

Reutilizaccedilatildeo

32

Criaccedilatildeo desenho da investigaccedilatildeo criaccedilatildeo do plano de gestatildeo de dados planear a partilha localizar dados existente coletar dados capturar eou criar metadados

Processamento entrada de dados transcriccedilatildeo traduccedilatildeo validaccedilatildeo limpeza anonimizaccedilatildeo descriccedilatildeo gestatildeo e armazenamento de dados

Anaacutelise interpretaccedilatildeo e derivaccedilatildeo de dados produccedilatildeo de resultados de investigaccedilatildeo publicaccedilatildeo e preparaccedilatildeo dos dados para preservaccedilatildeo

Preservaccedilatildeo migraccedilatildeo de dados para o melhor formato criaccedilatildeo de coacutepia de seguranccedila e armazenamento criaccedilatildeo de metadados e arquivo

Fornecer acesso distribuir e partilhar dados controlar o acesso estabelecer a propriedade intelectual promover os dados

Reutilizaccedilatildeo acompanhamento da investigaccedilatildeo assumir a revisatildeo da investigaccedilatildeo escrutinar os resultados e aprender e ensinar (UK Data Archive 2017)

Com o objetivo de contribuir para a adoccedilatildeo de padrotildees e poliacuteticas de Dados Abertos de investigaccedilatildeo algumas organizaccedilotildees lanccedilaram iniciativas e princiacutepios de Open Data destinadas agrave recomendaccedilatildeo de boas praticas na publicaccedilatildeo de dados de investigaccedilatildeo obtidos atraveacutes de financiamento puacuteblico Apoacutes o lanccedilamento de uma declaraccedilatildeo em 2004 a OECD publicou em 2007 um conjunto de 13 princiacutepios para abertura de dados de investigaccedilatildeo provenientes de financiamento puacuteblico Em 2010 foram lanccedilados os Panton Principles um conjunto de quatro princiacutepios delimitadores da abertura de dados na ciecircncia cujo foco centrou-se no licenciamento de conteuacutedos para garantir uma clara partilha distribuiccedilatildeo e reutilizaccedilatildeo de informaccedilatildeo pelos investigadores (Panton Principles 2010 traduccedilatildeo livre) A Royal Society afirma em 2012 que os dados abertos devem ser acessiacuteveis inteligiacuteveis avaliaacuteveis e reutilizaacuteveis Em 2014 foram publicados os Nairobi Data Sharing Principles um conjunto de dez recomendaccedilotildees destinadas a apoiar a abertura de dados puacuteblicos e de investigaccedilatildeo nos paiacuteses em vias de desenvolvimento por forma a gerar valor econoacutemico social educacional e potenciar a investigaccedilatildeo cientiacutefica (International Workshop on Open Data for Science and Sustainability in Developing Countries 2014)

A Open Definition um projeto da responsabilidade da OKI fixou os princiacutepios que definem a abertura de dados e conteuacutedos assegurando a qualidade e encorajando a compatibilidade de diferentes tipos de conteuacutedos atraveacutes da utilizaccedilatildeo precisa do termo aberto (Open Knowledge International [a] traduccedilatildeo livre) Assim o termo Dados Abertos engloba dois tipos diferentes de abertura

Abertura Teacutecnica os conteuacutedos devem ser publicados sob uma licenccedila aberta ao custo de produccedilatildeo num formato aberto e que possa ser processado por maacutequina

Abertura Legal a licenccedila aberta deve permitir o uso redistribuiccedilatildeo modificaccedilatildeo separaccedilatildeo compilaccedilatildeo propagaccedilatildeo aplicaccedilatildeo para qualquer fim ou propoacutesito sem custos e sem discriminaccedilatildeo contra pessoas ou grupos A mesma licenccedila pode requerer condiccedilotildees de uso como a atribuiccedilatildeo de creacutedito de autoria manutenccedilatildeo

33

da integridade do trabalho original redistribuiccedilatildeo sob a mesma licenccedila do original retenccedilatildeo de notificaccedilotildees de copyright acesso agrave fonte original proibiccedilatildeo de implementaccedilatildeo de restriccedilotildees teacutecnicas e implementaccedilatildeo de regras de natildeo-agressatildeo com a licenccedila original (Open Knowledge International [a]) traduccedilatildeo livre)

A Science International (2016) eacute o conjunto das 4 entidades mais representativas a niacutevel da ciecircncia internacional (International Council for Science ndash ICSU the InterAcademy Partnership ndash IAP The World Academy of Sciences ndash TWAS and the International Social Science Council ndash ISSC) que tecircm por missatildeo representar a comunidade cientiacutefica global na definiccedilatildeo de poliacuteticas cientiacuteficas internacionais Esta organizaccedilatildeo lanccedilou 12 princiacutepios para os Dados Abertos criados com base em outros relatoacuterios da autoria quer dos proacuteprios parceiros da Science International quer de instituiccedilotildees governamentais ou acadeacutemicas Estes princiacutepios assentam em trecircs pilares base as responsabilidades de cada interveniente os limites da abertura e as praacuteticas adequadas (Science International 2015 traduccedilatildeo livre)

Todos estes princiacutepios de abertura de dados de investigaccedilatildeo foram sintetizados no Quadro 1 apresentando-se apenas os princiacutepios mencionados em pelo menos duas recomendaccedilotildees de Open Data

Quadro 1 Princiacutepios de abertura de dados de investigaccedilatildeo mais recomendados

Princiacutepios e recomendaccedilotildees

OECD Princ (2007)

Panton Princ (2010)

Royal Soc

(2012)

Nairobi Princ (2014)

Science Int

(2015)

Open Defini tion

Abertura Acesso Reutilizaccedilatildeo

Citaccedilatildeo de dados Interoperabilidade Sem discriminaccedilatildeo Licenccedilas Abertas Formato Aberto

Processaacuteveis p maacutequina Modificaccedilatildeo

Publicaccedilatildeo imediata Qualidade

Acesso Gratuito Disponibilidade

Sustentabilidade Qualidade

Integridade

Fonte Elaboraccedilatildeo proacutepria

Analisando em detalhe os princiacutepios de abertura dos dados de investigaccedilatildeo eacute possiacutevel retirar algumas ilaccedilotildees sobre quais as recomendaccedilotildees consideradas mais importantes Verifica-se uma grande variedade de princiacutepios propostos sendo que

34

apenas 16 num total de 33 se repetem em 2 ou mais recomendaccedilotildees A abertura legal e teacutecnica dos dados soacute eacute acautelada por metade dos princiacutepios Os princiacutepios considerados mais importantes satildeo o AA aos dados seguido da reutilizaccedilatildeo de dados A citaccedilatildeo de dados interoperabilidade acesso sem discriminaccedilatildeo licenccedilas e formatos abertos a modificaccedilatildeo e o fato de os dados serem processaacuteveis por maacutequina satildeo mencionados apenas em trecircs recomendaccedilotildees tendo a seu favor o fato de terem sido incluiacutedas nas recomendaccedilotildees mais recentes Princiacutepios relevantes como a publicaccedilatildeo imediata a qualidade e a integridade dos dados surgem apenas duas vezes listados

Eacute possiacutevel verificar que a OKI (2012b) coloca os dados de investigaccedilatildeo ao mesmo niacutevel de importacircncia que outros tipos de dados com potencial para novos usos e aplicaccedilotildees para benefiacutecio da sociedade como os dados culturais financeiros estatiacutesticos ambientais e ainda sobre o clima e transportes

A OECD (2015a traduccedilatildeo livre) defende haver quatro tipos de dados cientiacuteficos

Fig 9 Tipos de dados cientiacuteficos Fonte traduzido de OECD (2015a)

A explosatildeo de produccedilatildeo de dados que originou o Big Data possui um segundo pilar os Dados Ligados ou Linked Data A combinaccedilatildeo destas duas abordagens tem o potencial para criar uma nova era de entendimento cientiacutefico relativamente aos maiores problemas subjacentes agrave espeacutecie humana (Science International 2015) O termo Linked Data cunhado por Tim Berners-Lee implica que as ldquorelationships among data should be made availablerdquo (World Wide Web Consortium [W3C] 2015) ou seja conjuntos de dados relacionados com um fenoacutemeno em particular e que estatildeo ligados de uma forma loacutegica podem ser conectados semanticamente dando a possibilidade de um computador poder identificar relaccedilotildees mais profundas entre eles (Science International 2015 traduccedilatildeo livre) Reitano (2013) sublinha que a informaccedilatildeo extraiacuteda de conjuntos de dados conectados eacute a que tem mais impacto na investigaccedilatildeo inovaccedilatildeo e crescimento econoacutemico Berners-Lee (2010) propocircs um esquema de 5 estrelas para classificar as melhores praacuteticas de publicaccedilatildeo de dados na web que permitam a ligaccedilatildeo entre diferentes datasets com cinco niacuteveis de abertura tecnoloacutegica

bullprovenientes de instrumentos como telescoacutepios sateacutelites sensores inqueacuteritos e outras ferramentas que registem informaccedilatildeo sobre fenoacutemenos uacutenicos

Dados de observaccedilatildeo

bullobtidos atraveacutes de maacutequinas de alto rendimento ensaios cliacutenicos ou outras experiecircncias controladas Dados experimentais

bullgerados a partir de simulaccedilotildees computacionais Dados computacionais

bullSatildeo conjunto de dados agrupados de alto niacutevel de uso pela comunidade cientiacutefica recebendo para isso um alto niacutevel de curaccedilatildeo

Coleccedilotildees de dados de referecircncia

35

Fig 10 Esquema de classificaccedilatildeo das 5 estrelas para Dados Abertos Ligados Fonte traduzido de Berners-Lee (2010) Disponiacutevel na WWW httpswwww3orgDesignIssuesLinkedDatahtml

O Linked Data usa teacutecnicas e conceitos da World Wide Web para identificar factos conceitos pessoas lugares fenoacutemenos ou documentos que contenham atributos em comum (Science International 2015 traduccedilatildeo livre) A Royal Society (201234) afirma que o aparecimento de ldquosiloed sections of the web linked datardquo deve-se ao uso de vocabulaacuterios heterogeacuteneos na descriccedilatildeo semacircntica dos dados Neste sentido a OKI desenvolveu um cataacutelogo de vocabulaacuterios de Linked Data onde constam um total de 593 distribuiacutedos por vaacuterios temas sendo os mais populares meacutetodos metadados e cataacutelogos Existem 11 vocabulaacuterios em portuguecircs embora nenhum seja exclusivo sendo mesmo a liacutengua com maior nuacutemero de vocabulaacuterios a par com o inglecircs (OKI [a])

Existem algumas razotildees para limitar a abertura da ciecircncia especialmente em redor de dados que vatildeo aleacutem de questotildees teacutecnicas envolvendo a comunidade de investigadores e a sociedade em geral Embora seja mandatado pelas poliacuteticas de Dados Abertos que todos os dados de investigaccedilatildeo obtidos atraveacutes de financiamento puacuteblico devam ser disponibilizados abertamente o fato eacute que existem exceccedilotildees legiacutetimas como questotildees de privacidade seguranccedila ou questotildees eacuteticas que impedem a total abertura de dados (Concordat on Open Research Data 2016)

Os desafios tecnoloacutegicos natildeo implicam as mesmas preocupaccedilotildees na implementaccedilatildeo do AA a dados de investigaccedilatildeo que geram os desafios financeiros culturais e legais Eacute necessaacuterio ldquoadopt technical and infrastructural solutions that holistically address the above issuesrdquo A atenccedilatildeo eacute dada a padrotildees abertos e interoperaacuteveis pesquisa harmonizada e serviccedilos identificadores permanentes promoccedilatildeo da cultura de gestatildeo de dados reutilizaccedilatildeo de dados de investigaccedilatildeo soluccedilotildees teacutecnicas para a seguranccedila e questotildees legais sobre dados de investigaccedilatildeo abertos (RECODE 20146)

Embora se registe progresso a publicaccedilatildeo de Dados Abertos continua a ser um desafio dado que a distribuiccedilatildeo aberta de dados de investigaccedilatildeo natildeo eacute um comportamento comum sendo necessaacuterio uma mudanccedila cultural (Royal Society 2012 Pontika et al 2015 Science International 2015) A avaliaccedilatildeo e revisatildeo por pares dos dados natildeo tecircm a mesma qualidade quando comparada com as publicaccedilotildees

Colocar os conteuacutedos disponiacuteveis na web (sob uma licenccedila aberta)

Tornar os dados estruturados (Excel em vez de uma imagem)

Usar formatos abertos (CSV em vez de Excel)

Usar URIrsquos para identificar os recursos (para serem indicados)

Ligar os dados a outros dados (para fornecer contexto)

36

tradicionais dado a publicaccedilatildeo de dados natildeo ser ainda uma praacutetica comum (European Research Area and Innovation Committee [ERAC] 2016) Hahnel e Hook (2016) apontam a falha na atribuiccedilatildeo de incentivos e recompensas tangiacuteveis aos investigadores pelas suas contribuiccedilotildees A publicaccedilatildeo de dados de forma aberta envolve tarefas que consomem muito tempo aos investigadores como a mudanccedila do formato dos dados manter a informaccedilatildeo atualizada alinhar os dados com as licenccedilas existentes e com os criteacuterios de publicaccedilatildeo de informaccedilatildeo sensiacutevel (Reitano 2013) A Royal Society (2012) sublinha que uma boa parte dos dados torna-se independente das publicaccedilotildees separando assim a ideia da evidecircncia

Para Hahnel e Hook (2016) a abertura de dados cientiacuteficos natildeo pode ser separada das mudanccedilas no desenvolvimento da investigaccedilatildeo e dos receios dos investigadores Estes receios manifestam-se a dois niacuteveis estrutural (questotildees de permissotildees qualidade licenciamento) e cultural (receio de natildeo ser reconhecido ou ser ultrapassado na investigaccedilatildeo)

A Science International (20156) sublinha que os custos da adaptaccedilatildeo ao ldquodata challengerdquo podem causar problemas aos paiacuteses menos desenvolvidos impedindo-os de participar na ldquoglobal research enterpriserdquo A mesma organizaccedilatildeo aponta falhas na replicabilidade de resultados cientiacuteficos atraveacutes da citaccedilatildeo de trecircs estudos nas aacutereas de oncologia preacute-cliacutenica psicologia social e economia que obtiveram meacutedias de sucesso bem inferiores a 50 Satildeo apontadas falhas como a falsificaccedilatildeo de dados raciociacutenios estatiacutesticos invaacutelidos e ausecircncia total ou parcial de dados ou metadados Eacute tambeacutem sublinhado que a falta de um padratildeo de abertura que permita testar a replicabilidade dos resultados cientiacuteficos pode torna-se uma barreira intransponiacutevel no avanccedilo da ciecircncia (Science International 2015)

O acesso aos dados de investigaccedilatildeo possuiu diversas vantagens como o fomento da inovaccedilatildeo em termos de educaccedilatildeo sauacutede estaacute na base da criaccedilatildeo de novos negoacutecios e progresso cientiacutefico (SPARC World Wide Web Foundation 2016) permite a melhoria da qualidade dos resultados de investigaccedilatildeo evita a duplicaccedilatildeo de trabalho acelera a inovaccedilatildeo aumenta a transparecircncia do progresso cientiacutefico (OECD 2007 Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016b ERAC 2016) A abertura de dados facilita a exploraccedilatildeo de novos toacutepicos natildeo estudados inicialmente reforccedila a diversidade de anaacutelise e opiniatildeo (OECD 2007) potencia o crescimento econoacutemico e a seguranccedila dos resultados da investigaccedilatildeo financiada (OECD 2007 SPARC Concordat on Open Research Data 2016 ERAC 2016) A Royal Society (2012) sublinha que a publicaccedilatildeo de dados experimentais e observacionais permite o escrutiacutenio a replicaccedilatildeo de experiecircncia e a reutilizaccedilatildeo de dados para obtenccedilatildeo de inferecircncias adicionais A mesma instituiccedilatildeo assevera que a abertura de dados permite a identificaccedilatildeo de erros a refinaccedilatildeo ou rejeiccedilatildeo de teorias realccedilando que a anaacutelise rigorosa de dados e teoria eacute o processo mais rigoroso de revisatildeo da qualidade O

37

estudo efetuado por Beagrie e Houghton (2014) a trecircs centros de dados do Reino Unido denota um acreacutescimo significativo ao niacutevel da eficiecircncia da investigaccedilatildeo nos utilizadores que usaram os centros de dados e o valor que os utilizadores retiraram dos dados excede o investimento feito na partilha e curaccedilatildeo de dados tendo os centros de dados aumentado exponencialmente o retorno do investimento feito na criaccedilatildeo e coleta de dados

Para Reitano (2013) o processo de abertura de dados pode fomentar a implementaccedilatildeo de novos padrotildees e tecnologias nas organizaccedilotildees e a mudanccedila de comportamentos culturais O mesmo autor refere que o fenoacutemeno dos Dados Abertos pode dar iniacutecio ao processo de validaccedilatildeo da qualidade dos dados A Science International (2015) sublinha o investimento nas infraestruturas fiacutesicas e tecnoloacutegicas natildeo deve ser muito elevado dado que este natildeo difere muito do exigido para uma base nacional de Ciecircncia Aberta O desenvolvimento desta e-infraestrutura pode trazer benefiacutecios a vaacuterios dos intervenientes da abertura de dados (Comissatildeo Europeia Grupo de Peritos em Dados Cientiacuteficos 2010)

Cidadatildeos beneficiam com os resultados da investigaccedilatildeo e encontram as proacuteprias respostas para questotildees importantes baseadas em provas reais

Financiadores e decisores poliacuteticos tomam decisotildees mais informadas e tecircm mais retorno no seu investimento

Investigadores obteacutem dados e ferramentas com mais facilidade aumentando assim a sua produtividade a investigaccedilatildeo extrapola a sua aacuterea de conhecimento gerando novas inferecircncias e produzindo novas soluccedilotildees

Empresas e induacutestria proporcionam uma base industrial e econoacutemica para a prosperidade usam a melhor informaccedilatildeo disponiacutevel para a sua investigaccedilatildeo e desenvolvimento criam novo conhecimento mercados oportunidades e aumentam as oportunidades de troca de conhecimento

Segundo Borgman (201515) o fluxo de informaccedilatildeo depende cada vez mais de infraestruturas tecnoloacutegicas sendo que ldquosubstantial investments in infrastructure are necessary to acquire sustain and exploit research data today tomorrow and beyondrdquo As bases de dados cientiacuteficas tecircm-se tornado importantes na infraestrutura cientiacutefica global sendo indispensaacuteveis no progresso da ciecircncia De acordo com e-IRG (2016) existem trecircs formas de desenvolver uma infraestrutura de dados de investigaccedilatildeo pelo setor industrial pelo setor puacuteblico ou por comunidades especializadas que recebam financiamento para a construccedilatildeo da sua proacutepria infraestrutura Para melhorar o acesso e uso de datasets a e-IRG recomenda

Impor as mesmas tecnologias e padrotildees a todas a disciplinas Atribuir identificadores persistentes para dados instituiccedilotildees e pessoas

38

Aumentar a pesquisabilidade e descoberta de dados nos repositoacuterios atraveacutes da criaccedilatildeo de registos de datasets e repositoacuterios conectar as publicaccedilotildees aos dados subjacentes e criar uma paacutegina de descritiva do dataset

O Open Access Directory (2016) lista 113 repositoacuterios de dados de investigaccedilatildeo referentes a 15 aacutereas do conhecimento O Registry of Research Data Repositories (re3data) eacute um serviccedilo que regista repositoacuterios de dados de investigaccedilatildeo a niacutevel mundial fornecendo acesso a 1821 repositoacuterios divididos por quatro grandes aacutereas cientiacuteficas Este serviccedilo eacute disponibilizado pelo DataCite (2017a) para fornecer acesso e armazenamento permanente de dados aos investigadores entidades financiadoras editores e instituiccedilotildees acadeacutemicas Portugal conta atualmente com dois repositoacuterios indexados o KiMoSys e o INTEGRALL ambos com ligaccedilatildeo ao ramo da biologia

O Projeto do Genoma Humano19 envolveu uma investigaccedilatildeo intensiva agrave escala global sendo um exemplo de sucesso da disponibilidade de dados abertos na inovaccedilatildeo cientiacutefica Com o intuito de facilitar a pesquisa e reutilizaccedilatildeo de dados o W3C (2014) desenvolveu um vocabulaacuterio especiacutefico para dados o Data Catalog Vocabulary (DCAT) que atraveacutes da tecnologia RDF20 facilita a interoperabilidade entre diferentes cataacutelogos de dados na web Utilizar o DCAT para descrever conjunto de dados em cataacutelogos permite aumentar a pesquisabilidade e a extraccedilatildeo de metadados a partir de outros cataacutelogos Salienta-se tambeacutem a existecircncia do schemaorg uma comunidade colaborativa com a missatildeo de criar manter e promover esquemas para dados estruturados na Internet

A Data Documentation Initiative (DDI) eacute um padratildeo internacional para descrever dados criados por meacutetodos observacionais provenientes das ciecircncias sociais econoacutemicas e da sauacutede O DDI eacute um padratildeo que pode ser utilizado para documentar as diferentes fases do ciclo de vida dos dados de investigaccedilatildeo Descrever dados utilizando o padratildeo DDI facilita a compreensatildeo interpretaccedilatildeo e uso por pessoas software e redes de computadores (Data Documentation Initiative [DDI] 2016)

Ainda em formato beta a OKI oferece um serviccedilo o is it open data21 que permite aos utilizadores inquirirem as entidades detentores de dados sobre a abertura dos seus dados focando-se essencialmente em dados de investigaccedilatildeo

19 Este projeto teve como base os Bermuda Principles que asseguraram que todos dados sobre a sequenciaccedilatildeo geneacutetica gerados por centros financiados para esse fim deveriam estar no domiacutenio puacuteblico com livre acesso Disponiacutevel na WWW httpwebornlgovscitechresourcesHuman_Genomeresearchbermudashtml 20 O Resource Description Framework (RDF) eacute um modelo padratildeo desenvolvido pela W3C que permite que dados estruturados e semiestruturados possam ser misturados expostos e partilhados atraveacutes de diferentes aplicaccedilotildees O RDF facilita a uniatildeo de datasets mesmo que usem estes esquemas diferentes Disponiacutevel na WWW httpswwww3orgRDF 21 Disponiacutevel na WWW httpwwwisitopendataorgabout

39

Verifica-se tambeacutem o lanccedilamento de revistas cientiacuteficas especiacuteficas para a ciecircncia orientada a dados como o Data Science Journal22 Scientific Data23 ou o Geoscience Data Journal possibilitando a publicaccedilatildeo de dados e dos artigos cientiacuteficos que os utilizam apoacutes o serviccedilo de revisatildeo por pares A F1000 Research24 utiliza o conceito de revisatildeo apoacutes a publicaccedilatildeo

Os Dados Abertos tecircm estado em foco quando se debate a resoluccedilatildeo de problemas humanitaacuterios A agenda 2030 definida pelas Naccedilotildees Unidas (2015) visa a erradicaccedilatildeo da pobreza e o desenvolvimento econoacutemico humanitaacuterio e social agrave escala global Os 17 objetivos de desenvolvimento sustentaacutevel contam com a preciosa ajuda da abertura de dados para a monotorizaccedilatildeo e tomada de decisatildeo Em 2016 a abertura de dados em casos de emergecircncias puacuteblicas foi alvo de forte debate com a propagaccedilatildeo de viacuterus como Zica e o Eacutebola na agenda O debate culminou na Statement on Data Sharing in Public Health Emergencies (2016) um compromisso assinado por 33 organizaccedilotildees a niacutevel global com vista agrave partilha de dados de investigaccedilatildeo e ao fomento do financiamento nestas aacutereas sensiacuteveis

Conforme indicado nos princiacutepios de Open Data da Science International (2015) existem diversos intervenientes no processo de abertura de dados sendo que cada um destes intervenientes tem responsabilidades proacuteprias Como intervenientes diretos satildeo apontados os investigadores que recebem financiamentos puacuteblicos as universidades e institutos de investigaccedilatildeo as bibliotecas institucionais agecircncias de financiamento e instituiccedilotildees de investigaccedilatildeo governos e sociedade acadeacutemicas Existem outras iniciativasorganizaccedilotildees envolvidas na promoccedilatildeo da abertura de dados como a EU Naccedilotildees Unidas OECD W3C OKI SPARC Royal Society CODATA Digital Curation Center (DCC) Research Data Aliance (RDA) ou o ICSU que procuram promover o desenvolvimento de sistemas e procedimentos a niacutevel internacional que assegurem o acesso sustentabilidade e interoperabilidade Muitas destas organizaccedilotildees jaacute desenvolveram princiacutepios de abertura e protocolos de dados proacuteprios como eacute o exemplo da EU OECD e da OKI ou formaram grupos de trabalho para a definiccedilatildeo de padrotildees de gestatildeo publicaccedilatildeo citaccedilatildeo interoperabilidade e partilha de dados como a RDA Outras como a Universidade de Edimburgo25 criaram cursos de treino em gestatildeo de dados de investigaccedilatildeo para oferecer aos seus investigadores esse conhecimento

Outras atividades e eventos relacionados com a abertura e gestatildeo de dados vatildeo ocorrendo a niacutevel global como eacute o caso do Love Your Data26 um evento internacional que teve a sua quinta ediccedilatildeo em 2017 com vista a fornecerem conhecimento e ferramentas aos investigadores para que estes possam gerir melhor os seus dados

22 Disponiacutevel na WWW httpdatasciencecodataorg 23 Disponiacutevel na WWW httpwwwnaturecomsdata 24 Disponiacutevel na WWW httpsf1000researchcomabout 25 Disponiacutevel na WWW httpdatalibedinaacukmantra 26 Disponiacutevel na WWW httpsloveyourdatawordpresscomlydw-2017

40

15 Dados Abertos Governamentais

A abertura dos dados governamentais teve a sua origem em leis de Freedom of Information (FOI) Segundo Ubaldi (2013) muitos paiacuteses da OECD adotaram este tipo de leis para assegurar o direito do acesso puacuteblico agrave informaccedilatildeo atraveacutes da publicaccedilatildeo de datasets que possam ser usados e reutilizados Os DGA ou no seu termo mais usual Open Government data (OGD) ldquois a philosophy- and increasingly a set of policies - that promotes transparency accountability and value creation by making government data available to allrdquo (OECD 2016a) Esta filosofia assenta numa nova relaccedilatildeo entre cidadatildeos e Governos atraveacutes da abertura dos dados governamentais onde todas as partes interessadas trabalham em cooperaccedilatildeo na procura de novas respostas para os problemas da sociedade num ldquolearning process of changing the culture of public sector administrationrdquo (Dietrich Cherkasov Susar 201311) Os Governos e as sociedades tecircm vindo de forma crescente a apreciar a importacircncia do acesso agrave informaccedilatildeo do setor puacuteblico para sustentar a boa gestatildeo e estimular o crescimento econoacutemico alavancado no conhecimento Esta situaccedilatildeo mudou a forma como os governos valorizaram gerem usam e partilham informaccedilatildeo sendo apoiada pela atualizaccedilatildeo das poliacuteticas estruturas e praacuteticas para produzir e usar a informaccedilatildeo puacuteblica (Ubaldi 2013 traduccedilatildeo livre) A abertura de dados permite inferir duas questotildees importantes quanto ao governo Aleacutem de assumir a preparaccedilatildeo das entidades puacuteblicas para o processo de abertura tambeacutem assume que o governo estaacute disposto a efetuar mudanccedilas consideraacuteveis no setor puacuteblico devendo atuar como um sistema aberto que interage com o seu ambiente (Jansen Charalabidis amp Zuiderwijk 2012) O objetivo eacute segundo Dietrich (20136) passar do ldquoe-gov to we-govrdquo

Os DGA estatildeo segmentados em duas partes os dados abertos e os dados governamentais ou informaccedilatildeo do setor puacuteblico (Ubaldi 2013 Dietrich Cherkasov e Susar 2013) estando os DGA na interseccedilatildeo entre estes dois tipos de dados

Fig 11 Pilares dos Dados Governamentais Abertos Fonte Dietrich (2013) Disponiacutevel na WWW httpworkspaceunpanorgsitesInternetDocumentsUNPAN95209pdf

Governo Aberto

Dados Governament

Dados Abertos

DGA

41

Os DGA referem-se agrave informaccedilatildeo coletada produzida ou paga pelo setor puacuteblico guardada em formato que possa ser lido por maacutequina e tornada acessiacutevel de forma livre para reutilizaccedilatildeo para qualquer propoacutesito atraveacutes da publicaccedilatildeo sob uma licenccedila aberta que permite a livre reutilizaccedilatildeo dentro do domiacutenio puacuteblico e privado (Koski 2015 Carrara Oudkerk Steenbergen Tinholt 2016) A Informaccedilatildeo do Setor Puacuteblico ou Public Sector Information (PSI) abrange toda a vasta gama de informaccedilatildeo que as entidades puacuteblicas coletam produzem reproduzem e disseminam em vaacuterias aacutereas de atividade no cumprimento das suas tarefas institucionais englobando informaccedilatildeo social econoacutemica geograacutefica meteorologia e informaccedilatildeo de cariz turiacutestico ou empresarial A grande diferenccedila entre os DGA e a PSI eacute que esta uacuteltima refere-se apenas aos dados detidos pelas entidade puacuteblicas podendo a sua reutilizaccedilatildeo ter custos Poreacutem se esta PSI for disponibilizada sob uma licenccedila aberta torna-se entatildeo DGA (Carrara et al 2016a traduccedilatildeo livre)

A reutilizaccedilatildeo e distribuiccedilatildeo de dados devem ser garantidas sob termos que permitam essas atividades (Ubaldi 2013) A abertura dos dados governamentais foi apoiada por vaacuterias iniciativas com o objetivo de estabelecer padrotildees e princiacutepios para a disponibilizaccedilatildeo aberta de dados Em 2007 o Open Government Working Group (OGWG) definiu oito princiacutepios sobre a abertura de Dados Governamentais (Tauberer 2014) Em 2010 foi a vez da Sunlight Foundation publicar 10 princiacutepios para abertura da informaccedilatildeo governamental Em 2012 foram lanccediladas trecircs iniciativas de abertura de dados O Reino Unido lanccedilou o Open Data White Paper que incluiu um conjunto de 14 princiacutepios para a abertura de dados puacuteblicos e assevera que o Reino Unido natildeo pretende implementar legislaccedilatildeo de forma raacutepida mas sim reconhecer e clarificar medidas iniciais que assegurem a partilha de dados (Cabinet Office 2012) O Banco Mundial publicou 13 princiacutepios de abertura de dados integrados no seu Open Government Data Toolkit A OKI (2012a traduccedilatildeo livre) identificou as componentes chave da abertura de dados puacuteblicos

Disponibilidade e acesso ndash os dados devem estar completos e a um preccedilo natildeo superior ao seu custo de reproduccedilatildeo com disponibilidade de acesso pela Internet Devem estar disponiacuteveis de forma conveniente e modificaacutevel

Reutilizaccedilatildeo e redistribuiccedilatildeo ndash os dados devem ser disponibilizadas sob licenccedilas que permitam a reutilizaccedilatildeo redistribuiccedilatildeo e mistura com outros datasets Deve ser assegurado que os dados satildeo passiacuteveis de serem processados por maacutequina

Participaccedilatildeo universal ndash os dados devem ser acessiacuteveis a todos para livre reutilizaccedilatildeo e redistribuiccedilatildeo sem discriminar nenhum campo do conhecimento pessoas ou grupos Natildeo eacute permitido a inclusatildeo de restriccedilotildees adjacentes aos dados

Ubaldi (2013) publicou onze princiacutepios de abertura de dados baseados em dois vetores principais disponibilidade e acessibilidade e a reutilizaccedilatildeo e redistribuiccedilatildeo Nos

42

EUA foram lanccedilados 7 princiacutepios para a abertura de dados atraveacutes do Memorando ldquoOpen Data Policy - Managing Information as an Assetrdquo (Executive Office of the President Office of Management and Budget 2013) O Anti-corruption Working Group do G2027 promoveu em 2014 a abertura de dados como um dos pilares essenciais da transparecircncia do setor puacuteblico estabelecendo seis princiacutepios de abertura de dados para apoiar a luta contra a corrupccedilatildeo (G20rsquos Anti-corruption Working Group 2014)

O G828 iniciou um debate sobre a transparecircncia inovaccedilatildeo e prestaccedilatildeo de contas governamentais culminando na criaccedilatildeo do G8 Open Data Charter (Cabinet Office 2013) ldquowhich outlined a set of five core open data principlesrdquo (International Open Data Charter 2015) ou seja ldquoa summary of visions and principles for creating a transparent Government the opening up of data and its quality and quantityrdquo (Carrara et al 2016a39) O G8 Open Data Charter criou uma lista de 14 categorias de dados a serem publicados de forma aberta empresas e negoacutecios crimes e justiccedila observaccedilatildeo da terra educaccedilatildeo energia e ambiente financcedilas e contratos geoespacial desenvolvimento global sauacutede democracia e contabilidade governativa ciecircncia e investigaccedilatildeo estatiacutesticas mobilidade e bem-estar social e por fim transportes e infraestruturas (Cabinet Office 2013) Poreacutem o sentimento geral era que os princiacutepios deveriam ser redefinidos e melhorados de forma a apoiar a adoccedilatildeo global dos Dados Abertos (International Open Data Charter 2015 traduccedilatildeo livre) Assim em 2015 um grupo de vaacuterios paiacuteses e organizaccedilotildees internacionais desenvolveu a International Open Data Charter uma ldquoGlobal Multi-Stakeholder Action Network with two types of leading members Stewards and Lead Stewardsrdquo tendo como missatildeo fomentar uma maior colaboraccedilatildeo na adoccedilatildeo e implementaccedilatildeo de princiacutepios padrotildees e boas praacuteticas de Dados Abertos em todo o mundo com a adesatildeo de 41 governos (International Open Data Charter 2015) Tim Berners-Lee numa opiniatildeo citada no proacuteprio siacutetio web da International Open Data Charter (2015) vecirc nesta rede o ldquopotential to accelerate progress by placing actionable data in the hands of peoplerdquo Todos os princiacutepios e recomendaccedilotildees de abertura de dados puacuteblicos foram sintetizados apresentando-se no Quadro 2 apenas os princiacutepios mencionados em duas iniciativas de Open Data

27 O G20 eacute um grupo formado pelos 19 paiacuteses mais fortes economicamente mais a Uniatildeo Europeia com o objetivo de obter cooperaccedilatildeo internacional em questotildees financeiras e econoacutemicas Disponiacutevel na WWW httpswwwg20orgWebsG20ENG20FAQsfaq_nodehtml 28 O G8 eacute um grupo constituiacutedo pelas economias mais avanccediladas do mundo que se reuacutenem para debater questotildees econoacutemicas e poliacuteticas a niacutevel global Este grupo eacute formado pelos EUA Itaacutelia Alemanha Reino Unido Franccedila Japatildeo Canadaacute e Ruacutessia embora esta uacuteltima tenha sido expulsa em 2014 apoacutes a anexaccedilatildeo da Crimeia A EU tambeacutem estaacute representada neste grupo embora natildeo seja membro oficial

43

Quadro 2 Princiacutepios de abertura mais recomendados pelas iniciativas de Dados Governamentais Abertos

Princiacutepios e recomendaccedilotildees

OGWG (2007)

Sun Fund (2010)

OKI

(2012)

World Bank

(2012)

White Paper (2012)

Mem EUA

(2013) Ubaldi (2013)

G20

(2014)

IODC

(2015) Abertura Acesso

Publicaccedilatildeo imediata Reutilizaccedilatildeo Completos

Sem discriminaccedilatildeo Processaacuteveis p maacutequina

Licenccedilas Abertas Comparabilidade Formato Aberto Disponibilidade

Abertura p defeito Interoperabilidade

Publicaccedilatildeo de metadados

Gestatildeo poacutes publicaccedilatildeo Custo natildeo superior ao da

produccedilatildeo

Desenvolvimento e inovaccedilatildeo inclusivos

Melhoria governaccedilatildeo e envolvimento cidadatildeos

Linked Data

Modificaccedilatildeo

Fonte Elaboraccedilatildeo proacutepria

Analisando em detalhe os princiacutepios de abertura dos dados puacuteblicos eacute possiacutevel inferir quais as recomendaccedilotildees consideradas mais importantes Tal como nos dados de investigaccedilatildeo verifica-se uma grande variedade de princiacutepios propostos sendo que apenas 19 num total de 36 se repetem em 2 ou mais recomendaccedilotildees Embora se registe uma melhoria significativa na abertura legal e teacutecnica relativamente aos dados de investigaccedilatildeo tambeacutem os princiacutepios propostos para os dados puacuteblicos natildeo abarcam a totalidade desta dupla abertura O acesso a publicaccedilatildeo imediata a reutilizaccedilatildeo e a disponibilizaccedilatildeo de dados de forma completa sem discriminaccedilatildeo e de forma a serem processados por maacutequina satildeo os princiacutepios que reuacutenem mais consenso entre as recomendaccedilotildees analisadas As licenccedilas abertas a comparabilidade de dados os formatos abertos a disponibilidade a abertura por defeito de dados a interoperabilidade publicaccedilatildeo de metadados e a gestatildeo de dados apoacutes a sua publicaccedilatildeo satildeo mencionados em menos de metade das recomendaccedilotildees analisadas apesar de ser indiscutiacutevel a sua importacircncia no processo de abertura de dados

44

Segundo Gonzalez-Zapata e Heeks (2015) podemos sintetizar os DGA em quatro perspetivas sumariadas na figura seguinte

Fig 12 Perspetivas da abertura dos dados governamentais Fonte Gonzalez-Zapata e Heeks (2015)

O movimento dos DGA assenta em dois importantes marcos o lanccedilamento do siacutetio datagov nos EUA em 2009 e do datagovuk no Reino Unido em 2010 tendo-se posteriormente estendido a outros paiacuteses e organizaccedilotildees (Janssen 2012) Neste segmento foi fundada em 2011 a Open Government Partnership (OGP) com o objetivo de ldquoprovide an international platform for domestic reformers committed to making their governments more open accountable and responsive to citizensrdquo (Open Government Partnership [OGP] 2015) Esta organizaccedilatildeo lanccedilou em Setembro de 2011 a Open Government Declaration subscrita por 70 paiacuteses e que assenta em quatro eixos estruturantes Transparecircncia da informaccedilatildeo sobre as atividades governativas apoio agrave participaccedilatildeo ciacutevica implementaccedilatildeo dos mais altos padrotildees da integridade profissional aumento do acesso a novas tecnologias de abertura e da prestaccedilatildeo de contas (OGP 2011) Em Dezembro de 2016 realizou-se a quarta cimeira da OGP culminando com a divulgaccedilatildeo da Paris Declaration for Open Government Partnership que pretende encorajar os Governos e as organizaccedilotildees da sociedade civil a inscreverem-se em accedilotildees coletivas para promover a abertura dos dados governamentais (OGP 2016)

O fenoacutemeno dos Dados Abertos eacute coadjuvado por dois sistemas de avaliaccedilatildeo da abertura dos dados provenientes do setor puacuteblico que auxiliam as entidades puacuteblicas a assumir a abertura e ligaccedilatildeo de dados (Colpaert Sarah Peter Mannens amp Van de Walle 2013) Estes dois sistemas atuam em perspetivas diferentes segundo Colpaert et al (2013) o 5 Stars Linked Open Data de Berners-Lee (2010) fornece uma perspetiva tecnoloacutegica enquanto o 5 Stars Open Data Engagement de Davies (2012) tem um acircmbito social atraveacutes do envolvimento da sociedade O esquema de Davies (2012) eacute um esquema de classificaccedilatildeo por estrelas baseado no esquema criado Tim Berners-Lee para sublinhar os niacuteveis de interaccedilatildeo e colaboraccedilatildeo proporcionados pela publicaccedilatildeo de dados ou seja os ldquokey steps that open data initiatives can take to engage with data usersrdquo

bull Definiccedilatildeo de estrateacutegias regulamentos e processos nas atividades do Governo Burocraacutetica bull Inovaccedilatildeo tecnoloacutegica nos sistemas de dados do

Governo Tecnoloacutegica bull Direito ao livre acesso agrave informaccedilatildeo do setor puacuteblico (dados) Poliacutetica bull Mecanismos para gerar valor econoacutemico atraveacutes do uso de dados Econoacutemica

45

Fig 13 Esquema de classificaccedilatildeo das 5 estrelas para as iniciativas de abertura de dados que envolvem os utilizadores Fonte Davies (2012) Disponiacutevel na WWW httpwwwtimdaviesorguk201201215-stars-of-open-data-engagement

No cumprimento das suas obrigaccedilotildees as entidades governamentais produzem coletam e gerem uma vasta quantidade de dados tendo elevado estes agrave categoria dos bens puacuteblicos mais valiosos Para gerar valor ldquodata must be reusable but more importantly actually used (Open Data for Development [OD4D] 20168) Para a OECD (2015a) permitir o acesso e a reutilizaccedilatildeo dos dados governamentais tem um potencial significativo no aumento da eficiecircncia e transparecircncia do setor puacuteblico suportando atividades de ciecircncia cidadatilde com os dados governamentais aumentando assim o seu valor econoacutemico e social Neste sentido concursos desafios e hackathons29 podem tornar-se uacuteteis se ajudarem a focar os cidadatildeos ldquoon high priority public problemsrdquo (Dawes Vidiasova amp Parkhimovich 201610) Para gerar valor eacute necessaacuterio publicar os dados sendo esta fase precedida uma preparaccedilatildeo teacutecnica de coleta preparaccedilatildeo publicaccedilatildeo e gestatildeo de dados (Carrara et al 2016a)

Criaccedilatildeo de uma infraestrutura de gestatildeo de dados Extraccedilatildeo transformaccedilatildeo (em formato open source e linked data) e publicaccedilatildeo Escolha dos canais de publicaccedilatildeo Implementaccedilatildeo da funccedilatildeo de pesquisa no canal de publicaccedilatildeo Definiccedilatildeo de domiacutenio hospedagem funcionalidades do canal de publicaccedilatildeo

incluindo a gestatildeo desta ferramenta e dos serviccedilos que nela forem incorporados

Segundo Ubaldi (2013 traduccedilatildeo livre) podem ser identificadas quatro grandes fases na cadeia de valor dos Dados Governamentais Abertos

Geraccedilatildeo de dados cobre a criaccedilatildeo de dados puacuteblicos Coleta agregaccedilatildeo e processamento de dados os dados governamentais precisam

de ser agregados ligados e manipulados de forma a adicionar valor para a maior parte dos utilizadores

29 Uma hackathon de dados abertos eacute um evento que reuacutene programadores e outros profissionais do ramo do desenvolvimento de software para reutilizar dados de forma a produzir aplicaccedilotildees de software que sejam a base de produtos e serviccedilos uacuteteis e com valor Servem tambeacutem para promover o trabalho de abertura de dados e os datasets disponiacuteveis (AMA 2016)

Os dados devem ser orientados para a procura

Os dados devem fornecer contexto

Os dados devem gerar conversaccedilatildeo

Publicaccedilatildeo de dados deve gerar envolvimento e ganho de habilidades

Dados como um recurso comum na colaboraccedilatildeo entre investigadores

46

Distribuiccedilatildeo e fornecimento de dados os dados precisam de ser distribuiacutedos aos seus potenciais utilizadores para permitir o acesso e reutilizaccedilatildeo

Uso final de dados os dados governamentais tecircm de ser reutilizados por diferentes pessoas para sustentar a criaccedilatildeo de valor puacuteblico

Perceber os diferentes valores associados aos dados governamentais eacute essencial para identificar que viabilizadores e tipos de dados devem ser tornados prioritaacuterios para atingir o objetivo especiacutefico de criaccedilatildeo de valor (Ubaldi 2013) Podem ser identificados trecircs tipos de valor associados aos DGA (Ubaldi 2013 OECD 2015a)

Valor econoacutemico crescimento e competitividade na economia fomentando a inovaccedilatildeo eficiecircncia e eficaacutecia nos serviccedilos governamentais

Valor Social promove empreendedorismo dos cidadatildeos a participaccedilatildeo social e o envolvimento puacuteblico nas decisotildees poliacuteticas e no fornecimento de serviccedilos

Governanccedila puacuteblica Prestaccedilatildeo de contas transparecircncia responsividade e controlo democraacutetico

A abertura dos dados governamentais eacute um domiacutenio emergente que enfrenta restriccedilotildees de natureza complexa Janssen Charalabidis e Zuiderwijk (2012) sintetizaram as barreiras em seis categorias institucional complexidade da tarefa uso e participaccedilatildeo legislaccedilatildeo qualidade da informaccedilatildeo e questotildees teacutecnicas Reitano (2013) defende que os governos devem modificar as praacuteticas e procedimentos internos de gestatildeo de informaccedilatildeo pois a reutilizaccedilatildeo da informaccedilatildeo estaacute dependente da forma em como ela eacute gerida e publicada O desempenho dos programas de DGA tendem apenas para o registo de dados estatiacutesticos e poucos optam por analisar as aplicaccedilotildees comerciais e os avanccedilos proporcionados pela abertura dos dados governamentais (Dawes Vidiasova amp Parkhimovich 2016) Existem outros pontos sensiacuteveis como o pagamento dos custos da coleta e processamento de dados puacuteblicos quais os incentivos concedidos agraves entidades puacuteblicas para estas manterem e atualizarem os seus dados que conjunto de dados devem ser prioritaacuterios para maximizar a criaccedilatildeo de valor puacuteblico e sobretudo a necessidade de desenvolver uma estrutura de anaacutelise entre custos e benefiacutecios que possa demonstrar as vantagens econoacutemico-sociais dos DGA (Ubaldi 2013 OECD 2013) Contudo segundo a OECD (2015a) para as partes interessadas estes dados continuam muitas vezes inacessiacuteveis quer em termos de acesso quer em termos de custo Isto verifica-se porque os dados enfrentam alguns entraves agrave sua publicaccedilatildeo as organizaccedilotildees e governos natildeo consideram os dados interessantes para reutilizaccedilatildeo ou natildeo conseguem entender os benefiacutecios da abertura pelo receio de terem de responder a um elevado nuacutemero de pedidos de dados ou que os utilizadores retirem conclusotildees superficiais que os dados possam natildeo ter um niacutevel de curaccedilatildeo satisfatoacuterio e que isso manche a reputaccedilatildeo da organizaccedilatildeo e por fim a preocupaccedilatildeo com os custos da conversatildeo de dados para formatos padratildeo (Carrara et al 2016a traduccedilatildeo livre) Existem ainda riscos associados agrave abertura dos dados

47

governamentais como o direito agrave privacidade e ao anonimato que resultam em restriccedilotildees agrave disponibilizaccedilatildeo desta informaccedilatildeo (Koski 2015)

Estabelecer um enquadramento legal eacute essencial para alavancar a abertura dos dados governamentais Dawes Vidiasova e Parkhimovich (2016) defendem que o sucesso dos programas de DGA depende da definiccedilatildeo padrotildees teacutecnicos e de qualidade e de um enquadramento legal que defina responsabilidades e limitaccedilotildees Ainda assim as iniciativas de DGA podem enfrentar problemas com a implementaccedilatildeo desafios teacutecnicos ou atrasos administrativos Restriccedilotildees teacutecnicas e financeiras podem limitar a acessibilidade e reutilizaccedilatildeo dos dados sendo necessaacuterio enfrentar desafios relacionados com poliacuteticas tecnologias financcedilas organizaccedilatildeo e cultura para criar um ecossistema e construir um modelo de negoacutecios sustentaacutevel para as iniciativas de DGA (Ubaldi 2013 traduccedilatildeo livre) Koski (2015) realccedila que uma vez abertos deve haver um esforccedilo para manter a qualidade dos dados e tambeacutem a sua atualizaccedilatildeo Por outro lado sem os conhecimentos e habilidades necessaacuterias para interpretar a vasta gama de conjuntos de dados os cidadatildeos podem natildeo conseguir criar valor a partir desses dados (Janssen 2012 Koski 2015) Segundo Carrara Fischer e Steenbergen (2015) satildeo vaacuterias as capacidades necessaacuterias para lidar com a complexidade dos dados As autoras defendem uma junccedilatildeo entre soft skills e hard skills como a colaboraccedilatildeo comunicaccedilatildeo resoluccedilatildeo de problemas e as competecircncias teacutecnicas estatiacutesticas analiacuteticas e domiacutenio da aacuterea do conhecimento (201512) Satildeo apontados ainda outros desafios como a constante evoluccedilatildeo das poliacuteticas e estrateacutegias de DGA a delegaccedilatildeo da produccedilatildeo e administraccedilatildeo dos dados governamentais a niacutevel regional e a falta de definiccedilotildees comuns agrave escala internacional (OECD 2013)

Dado o contexto de urgecircncia em que muitos dos portais foram criados ldquoas part of a politically driven Open Data Initiative without feasibility studies business case strategy or user researchrdquo os portais enfrentam agora uma seacuterie de desafios e problemas (Sasse et al 20177) Satildeo mencionados problemas como a falta de financiamento falta de qualidade dos dados a falta de apoio poliacutetico na publicaccedilatildeo de dados relevantes e desafios na reutilizaccedilatildeo de dados (Sasse et al 2017)

Um bom entendimento dos benefiacutecios da abertura dos dados governamentais pode acelerar o compromisso com as iniciativas de DGA (Carrara et al 2016a) Os benefiacutecios da abertura de dados podem segundo Janssen Charalabidis e Zuiderwijk (2012) ser contextualizados em trecircs quadrantes poliacutetico e social econoacutemico operacional e teacutecnico A partilha dos dados governamentais com o puacuteblico aumenta a transparecircncia e o reconhecimento puacuteblico das atividades do governo (OECD 2013) dado que os DGA satildeo um recurso estrateacutegico que pode beneficiar vaacuterios intervenientes (OECD 2013 Ubaldi 2013 Dietrich Cherkasov Susar 2013 Koski 2015 Carrara et al 2016a The World Bank 2016)

48

Governo melhora a tomada de decisotildees e a alocaccedilatildeo de recursos de forma a promover a eficiecircncia total das operaccedilotildees do governo e fornecer serviccedilos puacuteblicos mais eficientes efetivos inovadores e personalizados permitindo uma reduccedilatildeo de custos administrativos Aumenta a transparecircncia reforccedilando a prestaccedilatildeo de contas governamentais e a reduccedilatildeo de erros

Cidadatildeos permite participaccedilatildeo puacuteblica e o envolvimento social no desenho de respostas agraves necessidades puacuteblicas e cientiacuteficas (ciecircncia cidadatilde)

Sociedade Civil aumenta a transparecircncia e qualidade dos serviccedilos do Governo Setor Puacuteblico pode estimular um mercado competitivo nos serviccedilos puacuteblicos Setor Privado lanccedilamento de serviccedilos inovadores e com valor acrescentado

O Working Group on Open Government Data da OKI elegeu trecircs vantagens na abertura dos dados governamentais aumento da transparecircncia criaccedilatildeo de valor econoacutemico-social e participaccedilatildeo dos cidadatildeos na governaccedilatildeo Dietrich Cherkasov e Susar (2013) sublinham o papel chave da interoperabilidade na obtenccedilatildeo dos benefiacutecios da abertura na medida em que uma definiccedilatildeo comum de abertura iraacute assegurar a capacidade dos sistemas e organizaccedilotildees cooperarem

O impacto da abertura dos dados governamentais pode ser medido em trecircs dimensotildees econoacutemica poliacutetica e social (Granicas 2013 Koski 2015)

Econoacutemica aumento de receitas provenientes de taxas reduccedilatildeo dos custos de transaccedilatildeo de dados criaccedilatildeo de bens e serviccedilos (Granickas 2013) aumento da eficiecircncia e eficaacutecia do serviccedilo puacuteblico criaccedilatildeo de novas empresas (Granickas 2013 Koski 2015)

Poliacutetica aumento da transparecircncia poliacutetica e da prestaccedilatildeo de contas (Granickas 2013 Koski 2015)

Social aumento da proteccedilatildeo ao direito agrave informaccedilatildeo (Granickas 2013) aumento da inclusatildeo social e da capacitaccedilatildeo de grupos eou indiviacuteduos aumento dos niacuteveis de envolvimento e participaccedilatildeo ciacutevica (Granickas 2013 Koski 2015) e melhorias ao niacutevel educaccedilatildeo sauacutede ambiente ou desenvolvimento sustentaacutevel (Koski 2015)

Koski (20153) defende ser necessaacuterio desenvolver um modelo de avaliaccedilatildeo e monotorizaccedilatildeo seguido da coleta sistemaacutetica de dados para se poder medir com exatidatildeo o impacto dos Dados Abertos A autora sublinha a necessidade de explorar o conhecimento sobre o impacto da abertura de dados bem como os meacutetodos de investigaccedilatildeo e indicadores que podem ser usados para estudar os ldquosocio-economics impacts of open data which types of usable data are already being collected and what are the addionational data needsrdquo

Para Janssen (2012) o movimento dos DGA promoveu uma maior disponibilidade de informaccedilatildeo puacuteblica embora natildeo tenha necessariamente melhorado o acesso agrave informaccedilatildeo De acordo com a mesma autora os DAG estatildeo em voga com os

49

programadores e hackers a desenvolverem aplicaccedilotildees atraveacutes dos dados detidos pelo setor puacuteblico e os ativistas a descobrir o valor dos dados governamentais na defesa das suas causas Se as cidades utilizarem os dados que produzem em proveito proacuteprio publicando-os nos seus portais com as licenccedilas adequadas de reutilizaccedilatildeo podem estimular a criaccedilatildeo de novos serviccedilos e transformar-se em smart cities (Garcia 2015) reduzindo custos e consumo de recursos e melhorando o contacto entre cidadatildeos e governo (Carrara Engbers Nieuwenhuis amp Steenbergen 2016)

No acircmbito da digital transformation ocorrida nas uacuteltimas deacutecadas diversas alteraccedilotildees ocorreram na forma comas organizaccedilotildees produzem vendem e disponibilizam os seus produtos e tambeacutem na forma em como os funcionaacuterios trabalham e comunicam Segundo Carrara Fisher Oudkerk Steenbegen e Tinholt (2015) os Dados Abertos podem ser reutilizados por organizaccedilotildees de diferentes setores da induacutestria cultura e turismo educaccedilatildeo e investigaccedilatildeo energia e utilidades financcedilas e seguros sauacutede fabrico de produtos comunicaccedilatildeo e entretenimento puacuteblico imobiliaacuterio retalho telecomunicaccedilotildees transportes e tecnologias de informaccedilatildeo Davies (2014) afirma que no caso dos EUA e do Reino Unido a enfacircse do discurso puacuteblico passou da melhoria da transparecircncia governativa para o discurso das vantagens econoacutemicas dos Dados Abertos como consequecircncia da crise econoacutemica e da maior maturaccedilatildeo das poliacuteticas de abertura de dados Na EU a linha de pensamento tem evoluiacutedo no mesmo sentido com o estudo econoacutemico feito pelo European Data Portal a indiciar um impacto econoacutemico direto da abertura de dados em 2016 de 553 biliotildees de euros e em 2020 de 757 biliotildees de euros com uma projeccedilatildeo de perto de 100 mil postos de trabalho envolvidos O mesmo estudo indica que o mercado total da abertura de dados contabilizando os impactos diretos e indiretos subiraacute dos 193-209 biliotildees de euros em 2016 para os 265-286 biliotildees de euros em 2020 (Carrara Chan Fischer amp Steenbergen 2015)

Os portais de Dados Abertos satildeo uma parte essencial da infraestrutura ao permitirem o acesso e reutilizaccedilatildeo de dados oferecendo um ponto de acesso uacutenico aos utilizadores aos dados governamentais como os cataacutelogos e portais de dados centralizados Veja-se por exemplo os 304 portais incluiacutedos no cataacutelogo do portal de dados governamentais dos EUA o datagov que aleacutem dos portais de dados de cidades e estados norte-americanos (88) engloba ainda 52 paiacuteses e 164 regiotildees internacionais (United States General Services Administration) O Open Data Soft (2017) lista jaacute mais de 2600 portais de dados oriundos de 194 paiacuteses indicando apenas 6 portais de Dados Abertos em Portugal

Poreacutem de acordo com Colpaert et al (2013) natildeo existe nenhum guia que determine as funcionalidades e possibilidades dos portais de dados Os autores vecircm assim propor um esquema de classificaccedilatildeo para portais de Dados Abertos com o

50

objetivo de impulsionarem as entidades puacuteblicas a criarem o seu proacuteprio portal de dados ou a criarem novas metas para os jaacute existentes

Fig 14 Esquema de classificaccedilatildeo das 5 estrelas para os portais de dados Fonte Colpaert et al (2013) Disponiacutevel na WWW httppieterpm5stardataportals5starsofopendataportalspdf

O relatoacuterio feito pelo Open Data Institute (ODI) para o European Data Portal defende que os portais de dados devem continuar a responder aos desafios utilizando para isso modelos sustentaacuteveis em quatro aacutereas chave gestatildeo financcedilas arquitetura e operaccedilotildees Devem tambeacutem usar meacutetricas que permitam avaliar e melhorar a qualidade e usabilidade dos dados sendo que a mediccedilatildeo de impacto da reutilizaccedilatildeo de Dados Abertos tambeacutem deve ser alvo de financiamento contiacutenuo (Sasse et al 2017)

A OKI desenvolveu um sistema de gestatildeo de dados suportado por uma plataforma aberta o CKAN oferecendo soluccedilotildees que agilizam a publicaccedilatildeo partilha pesquisa e uso dos dados sendo utilizado por 146 portais de dados a niacutevel mundial (CKAN) Usar esta ferramenta para construir um cataacutelogo permite agraves entidades governos e organizaccedilotildees publicar dados e disponibiliza-los de forma aberta facilitando a pesquisa e a visualizaccedilatildeo da informaccedilatildeo A plataforma DataHub oferece acesso a muitos dos serviccedilos do CKAN permitindo o upload pesquisa registo de datasets publicados criaccedilatildeo e gestatildeo de grupos de datasets e receber atualizaccedilotildees de conjuntos de dados em que haja interesse O DataHub aloja 35 datasets relacionados com a palavra-chave ldquoPortugalrdquo sendo 18 desses conjuntos de dados diretamente coletados e disponibilizados por entidades portuguesas Os restantes 17 datasets estatildeo englobados em publicaccedilotildees que abrangem vaacuterios paiacuteses (Open Knowledge International [d]) As entidades puacuteblicas tambeacutem podem desenvolver portais de dados contratando para isso serviccedilos de plataformas como o Socrata30 OpenDataSoft31 ou o DataMarket32 que facilitam a publicaccedilatildeo a partilha e a reutilizaccedilatildeo de dados puacuteblicos

30 Disponiacutevel na WWW httpssocratacom 31 Disponiacutevel na WWW httpswwwopendatasoftptsolucao-de-dados-abertos 32 Disponiacutevel na WWW httpwwwqlikcomusproductsqlik-data-market

Registo de conjuntos de dados (ligaccedilatildeo ao dataset)

Fornecimento de metadados (licenccedila contexto atualizaccedilotildees etc)

Plataforma de cocriaccedilatildeo (interaccedilatildeo desenvolvimento aplicaccedilotildees)

Plataforma de publicaccedilatildeo de dados e metadados em formatos comuns

Central de dados comum (agregaccedilatildeo informaccedilatildeo interna e externa)

51

Em termos de licenciamento de dados embora as licenccedilas Creative Commons possam ser aplicadas aos dados foram criadas licenccedilas abertas especiacuteficas para dados sob a tutela da OKI as Open Data Commons (ODC)

ODC Attribution License (ODC-By) Compatiacutevel com a licenccedila CC BY permite a coacutepia distribuiccedilatildeo modificaccedilatildeo de dados ou bases de dados com a devida menccedilatildeo de atribuiccedilatildeo de autoria devendo ser mantida para trabalhos derivados

ODC Open Database License (ODC-ODbL) Segue os mesmo princiacutepios da licenccedila CC BY-SA aplicando-se no entanto apenas a dados Permite a coacutepia distribuiccedilatildeo modificaccedilatildeo de dados ou bases de dados com a devida menccedilatildeo de atribuiccedilatildeo de autoria devendo os trabalhos derivados aplicar a mesma licenccedila e serem redistribuiacutedos sem restriccedilotildees

Public Domain Dedication and License (PDDL) permite a coacutepia distribuiccedilatildeo modificaccedilatildeo de dados ou bases de dados sem qualquer tipo de restriccedilotildees ou atribuiccedilatildeo de creacutedito uma vez que os dados passam para o domiacutenio puacuteblico Eacute compatiacutevel com a licenccedila CC0 (Open Knowledge International [d] traduccedilatildeo livre)

Existem ainda 2 paiacuteses que definiram a sua proacutepria lincenccedila aberta de forma a garantir a abertura da PSI O Reino Unido desenvolveu a Open Government Licence (OGL) que sendo compativel com as licenccedilas CC e ODC autoriza o uso distribuiccedilatildeo publicaccedilatildeo adaptaccedilatildeo e exploraccedilatildeo comercial e natildeo comercial sob o requerimento de menccedilatildeo da fonte e da proviecircncia da informaccedilatildeo (The National Archives) Tambeacutem a Franccedila desenvolveu a sua Licence Ouverte que avaliza a reproduccedilatildeo uso distribuiccedilatildeo publicaccedilatildeo adaptaccedilatildeo e exploraccedilatildeo comercial requerendo apenas o reconhecimento da fonte e da proviecircncia da informaccedilatildeo Tal como a licenccedila britacircnica a Licence Ouverte eacute compatiacutevel com as licenccedilas CC e ODC e ainda com a proacutepria OGL (Etalab 2011)

A publicaccedilatildeo dos DGA envolve quatro intervenientes diferentes (Carrara et al 2016a traduccedilatildeo livre)

Decisores poliacuteticos normalmente os responsaacuteveis pela validaccedilatildeo de estrateacutegias e iniciativas de Open Data

Gestores de Dados satildeo por norma os responsaacuteveis pela coleta partilha de dados design e implementaccedilatildeo da estrateacutegia de Open Data na qualidade de especialistas

Programadores responsaacuteveis pela implementaccedilatildeo dos requisitos teacutecnicos das estrateacutegias de Dados Abertos

Contribuidores tecircm um papel ativo na coleta preparaccedilatildeo publicaccedilatildeo e manutenccedilatildeo dos dados

Gonzalez-Zapata e Heeks (2015) acrescentam outros intervenientes como os ativistas da sociedade civil as organizaccedilotildees internacionais os fornecedores de tecnologias de informaccedilatildeo e comunicaccedilatildeo e os acadeacutemicos As entidades e organizaccedilotildees internacionais envolvidas no esforccedilo de abertura dos dados

52

governamentais tecircm desenvolvido esforccedilos para promover a abertura de dados governamentais O Open Data Institute (2012) foi criado com o objetivo de ajudar instituiccedilotildees puacuteblicas organizaccedilotildees comerciais e natildeo comerciais a ldquoidentify and address how the web of data will impact their businesses and their sectorsrdquo Neste sentido a ODI tem promovido algumas iniciativas como o Open Data Certificate33 que atraveacutes de um sistema de questionaacuterios consegue demonstrar se os dados foram publicados de forma sustentaacutevel e reutilizaacutevel certificando assim a qualidade e a confianccedila nos mesmos A ODI desenvolveu tambeacutem o Open Data Maturity Model para avaliar o quanto as organizaccedilotildees publicam e consomem Dados Abertos identificando os pontos de melhoria O modelo baseia-se numa escala de cinco temas processos de gestatildeo de dados conhecimento e habilidades envolvimento e apoio ao cliente investimento e performance financeira e por fim visatildeo estrateacutegica Estes cinco temas tecircm cinco niacuteveis de progressatildeo possuindo uma aplicaccedilatildeo34 em linha que facilita a avaliaccedilatildeo (Dodds amp Newman 2015) A ODI dedica-se ainda agrave elaboraccedilatildeo de estudos de caso envolvendo iniciativas de Open Data aleacutem de possuir guias de orientaccedilatildeo para a abertura de dados e cursos de aprendizagem com o mesmo objetivo

O Banco Mundial lanccedilou o Open Government Data Toolkit com o objetivo de ajudar governos bancaacuterios e utilizadores a entender os conceitos baacutesicos da abertura de dados e a planear e implementar um programa de abertura dos dados governamentais Falamos de ferramentas de orientaccedilatildeo para a implementaccedilatildeo de poliacuteticas de dados abertos desde a definiccedilatildeo de Open Data e exemplos do seu uso passando pelo licenciamento e qualidade dos dados e finalizando com assistecircncia teacutecnica e apoio na procura de financiamento Uma das ferramentas disponibilizadas eacute o Open Data Readiness Assessment (ODRA) que pode ser usada para conduzir accedilotildees de anaacutelise da preparaccedilatildeo de um governo ou instituiccedilatildeo para avaliar desenhar e implementar uma iniciativa de Dados Abertos (The World Bank 2016)

Outra iniciativa esta com a chancela da Open Data for Development Network (OD4D[a]) ldquoa global network of leaders in the Open Data community working together to develop open data solutions around the worldrdquo desenvolveu uma base de dados puacuteblica de organizaccedilotildees que usam DGA ao niacutevel global O Open Data Impact Map permite aos governos organizaccedilotildees internacionais e investigadores ter a perceccedilatildeo da procura existente de Dados Abertos O mapa inclui organizaccedilotildees que usam DGA para advogar algo para desenvolver produtos e serviccedilos aprimorar operaccedilotildees prestar informaccedilotildees sobre estrateacutegias ou efetuar investigaccedilatildeo (Open Data for Development Network (OD4D[b] traduccedilatildeo livre) Em fevereiro de 2017 encontram-se listadas 1765 organizaccedilotildees oriundas de 96 paiacuteses concentrados sobretudo na Ameacuterica do Norte Europa e Aacutesia Central sendo que a maioria das entidades estaacute relacionada com o setor das tecnologias de informaccedilatildeo geoespacial negoacutecios 33 Disponiacutevel na WWW httpscertificatestheodiorgen 34 Disponiacutevel na WWW httppathwaytheodiorg

53

consultadoria investigaccedilatildeo e com governabilidade Portugal conta com 4 organizaccedilotildees listadas Fundaccedilatildeo Francisco Manuel dos Santos35 Transparecircncia Hackday36 e Open Knowledge Portugal no setor da governabilidade e a Manufactura Independente37 no setor dos meacutedia e comunicaccedilotildees

A OKI estaacute ativamente envolvida em diversos projetos que visam criar condiccedilotildees e potenciar a abertura de dados Aleacutem da mencionada Open Definition a OKI posiciona-se como coordenadora de outros projetos semelhantes um siacutetio web sobre Dados Governamentais Abertos um guia com enfoque nos aspetos teacutecnicos legais e sociais dos Dados Abertos um cataacutelogo de portais de Dados Abertos a niacutevel global um iacutendice que mede a abertura das poliacuteticas de Open Data e ainda introduziu censos sobre a abertura de dados A OKI oferece ainda um portal sobre dados financeiros38 um portal de e-learning sobre literacia de dados39 um portal sobre gastos puacuteblicos40 uma base de dados de ensaios cliacutenicos41 e o Frictionless Data42 que disponibiliza um Data Package Standard para facilitar o agrupamento e descriccedilatildeo de dados

A EU tem assumido uma dupla funccedilatildeo na abertura dos dados puacuteblicos verificando-se a sua intervenccedilatildeo na elaboraccedilatildeo de leis de apoio aos DGA e na promoccedilatildeo da criaccedilatildeo de infraestruturas de suporte A OECD desenvolveu um Observatoacuterio da PSI que coleta e analisa exemplos e partilha experiecircncias de inovaccedilatildeo do setor puacuteblico com o intuito de fornecer conselhos praacuteticos aos paiacuteses na criaccedilatildeo de inovaccedilatildeo O Observatoacuterio permite a partilha discussatildeo e cooperaccedilatildeo na criaccedilatildeo de soluccedilotildees (OECD 2016b traduccedilatildeo livre)

A disponibilidade e acessibilidade de dados eacute um dos pilares da plena afirmaccedilatildeo da Ciecircncia Aberta e neste acircmbito devem ser definidas poliacuteticas de Dados Abertos que mandatem o livre acesso a este tipo de informaccedilatildeo cientiacutefica e administrativa

2 As poliacuteticas de Dados Abertos

O processo de desenvolvimento de poliacuteticas envolve tradicionalmente a investigaccedilatildeo anaacutelise consulta e siacutentese de informaccedilatildeo para produzir recomendaccedilotildees A abertura de dados sem restriccedilotildees de acesso deve ser garantida por uma poliacutetica de Dados Abertos pois ldquoOpen Data is politicalrdquo (World Wide Web Foundation 201638) ldquoInstitutionalizing open data within larger sectoral initiatives requires ample political

35 Disponiacutevel na WWW httpwwwpordatapt 36 Disponiacutevel na WWW httpwwwtransparenciahackdayorg 37 Disponiacutevel na WWW httpmanufacturaindependenteorg 38 Disponiacutevel na WWW httpnextopenspendingorg 39 Disponiacutevel na WWW httpschoolofdataorg 40 Disponiacutevel na WWW httpopenbudgetseu 41 Disponiacutevel na WWW httpopentrialsnet 42 Disponiacutevel na WWW httpfrictionlessdataio

54

willrdquo (OD4D 2016) O fenoacutemeno dos Dados Abertos eacute tambeacutem teacutecnico e social dada a interaccedilatildeo entre o meio local politico social legal e teacutecnico e as tecnologias que produzem resultados (Davies 2014 Pasqueto Sands amp Borgman 2015)

Da revisatildeo da literatura destaca-se a existecircncia de poliacuteticas diferenciadas para a abertura de dados governamentais e para a abertura de dados cientiacuteficos A maior parte das poliacuteticas e estrateacutegias governamentais concentram-se na abertura dos dados governamentais em detrimentos dos dados de investigaccedilatildeo (RECODE 2014) A expressatildeo ldquoPoliacutetica de Dados Abertosrdquo surge frequentemente associada a termos como estrateacutegias programas ou iniciativas de abertura de dados e ainda a poliacuteticas de gestatildeo de dados A contextualizaccedilatildeo das poliacuteticas natildeo eacute clara referindo-se apenas a Dados Abertos mas focando-se preferencialmente apenas nos dados provenientes do setor puacuteblico Em termos de dados de investigaccedilatildeo eacute possiacutevel encontrar poliacuteticas de quatro intervenientes diferentes Governo entidade financiadora que pode ser ou natildeo governamental instituiccedilotildees de investigaccedilatildeo e ainda as editoras de data journals Em termos de dados puacuteblicos satildeo associadas poliacuteticas governamentais e institucionais As poliacuteticas de dados abertos devem ainda incluir uma poliacutetica de gestatildeo de dados independentemente do seu cariz de investigaccedilatildeo ou puacuteblico

Nos uacuteltimos anos questotildees sobre a gestatildeo preservaccedilatildeo e partilha de dados cientiacuteficos tecircm sido alvo de debate puacuteblico O aumento da criaccedilatildeo de datasets vastos e complexos em todo o processo cientiacutefico estaacute a criar profundos desafios para o armazenamento acesso e interpretaccedilatildeo de dados (EAGDA 2014) As recentes poliacuteticas de Open Data pretendem disponibilizar em livre acesso os datasets da mesma forma que qualquer outra publicaccedilatildeo acadeacutemica sendo para isso necessaacuterio garantir uma infraestrutura de armazenamento acesso pesquisa e a reutilizaccedilatildeo dessa informaccedilatildeo (Rans Day Duke amp Ball 2013) As poliacuteticas satildeo essenciais para o estabelecimento de compromissos comuns (Erway et al 2016) Segundo a Science International (20156) ldquoeffective open data in a data-intensive age can only be realised if there is systemic action at disciplinary national and international levelsrdquo De acordo com Tananbaum num estudo preparado em nome da SPARC ldquoopen data policies promote the accessibility and reuse of the raw data generated during the scientific discovery phaserdquo Estas poliacuteticas abrangem uma gama variada de material natildeo-textual como datasets estatiacutesticas resultados de inqueacuterito e os metadados associados a estes objetos devendo permitir que estes sejam sujeitos a processamento por maacutequina e anaacutelise (Tananbaum) Existem alguns desafios teacutecnicos legais e eacuteticos na criaccedilatildeo de uma poliacutetica de abertura de dados como assegurar a heterogeneidade e interoperabilidade dos dados a acessibilidade e pesquisabilidade a preservaccedilatildeo e curaccedilatildeo a qualidade e avaliaccedilatildeo e tambeacutem a seguranccedila dos dados (RECODE 2014)

A abertura de dados de investigaccedilatildeo em todas as aacutereas cientiacuteficas natildeo pode ter uma abordagem one size fits all pois estas produzem diferentes tipos de dados e tecircm

55

procedimentos de anaacutelise publicaccedilatildeo e arquivo diferenciados (Royal Society 2012 RECODE 2014 ERAC 2016 Laumlmmerhirt 2016) A heterogeneidade verificada entre as poliacuteticas de dados de investigaccedilatildeo ao niacutevel da aplicaccedilatildeo normativa e da gestatildeo de dados implica de acordo com Laumlmmerhirt que o cumprimento das medidas impostas pelas poliacuteticas seja irregular O autor defende que as poliacuteticas de dados abertos devem considerar as praacuteticas normas infraestruturas dentro de cada disciplina cientiacutefica e tambeacutem estabelecer incentivos para a publicaccedilatildeo de dados

A Comissatildeo Europeia aborda a necessidade de desenvolver princiacutepios teacutecnicos legais eacuteticos e semacircnticos de interoperabilidade de assegurar a verificaccedilatildeo e a confianccedila nos dados a niacutevel local regional e nacional de implementar novos incentivos para a partilha e proteccedilatildeo de diferentes tipos de dados e por fim uma estrutura que possa avaliar estes princiacutepios (Comissatildeo Europeia Grupo de peritos de alto niacutevel em dados de investigaccedilatildeo 2010) Shadbolt (2016) ressalva que a aposta deve ser feita em poliacuteticas consistentes que determinem a forma de abertura de dados produzidos sob financiamento puacuteblico sendo essencial sublinhar os seus benefiacutecios e partilhar as melhores praacuteticas Para gerar praacuteticas e uma cultura de abertura ldquowe need incentives as well as mandatesrdquo (Shadbolt 20162) A visatildeo subjacente a este movimento de abertura de dados cientiacuteficos eacute que os dados arriscam-se a ficar sem sentido se forem impedidos de ganhar valor cientiacutefico econoacutemico social ou poliacutetico (Leonelli 2016)

Os governos devem desenvolver poliacuteticas de abertura dos dados cientiacuteficos que complementem as poliacuteticas de abertura dos dados puacuteblicos bem como apoiar a criaccedilatildeo de software e recursos humanos habilitados que satildeo criacuteticos no sucesso de ambas as poliacuteticas (Royal Society 2012) As poliacuteticas de Dados Abertos devem ter um caraacuteter diferenciado das poliacuteticas de AA devido a questotildees como a confidencialidade e seguranccedila Nesse sentido o desenvolvimento de poliacuteticas de Dados Abertos eacute uma tarefa mais complexa devendo por isso ser incorporada como uma extensatildeo das poliacuteticas de AA (Swan 2012) A loacutegica para a definiccedilatildeo de poliacuteticas nacionais de Open Data encontra-se em assegurar o rigor da ciecircncia nacional baseado na acessibilidade e reprodutibilidade dos seus resultados em capturar o valor da abertura de dados para benefiacutecio proacuteprio e como base da colaboraccedilatildeo eficiente na ciecircncia internacional (Science International 2015 traduccedilatildeo livre) Embora a ciecircncia seja um elemento central Pasqueto Sands e Borgman (2015) sublinham que esta loacutegica se centra maioritariamente no domiacutenio econoacutemico

Segundo a SPARC as entidades financiadoras de investigaccedilatildeo devem implementar poliacuteticas de Dados Abertos como forma de aumentar a disponibilidade e reutilizaccedilatildeo de dados enquanto reduzem a duplicaccedilatildeo de investigaccedilatildeo maacute-interpretaccedilatildeo fraude e manipulaccedilatildeo de dados As poliacuteticas devem abranger todos os dados e metadados necessaacuterios agrave verificaccedilatildeo dos resultados de investigaccedilatildeo devendo a sua publicaccedilatildeo ocorrer o mais rapidamente possiacutevel (Tananbaum) O tempo passado entre a criaccedilatildeo e

56

a publicaccedilatildeo de dados eacute uma questatildeo importante na cultura do Open Data Poreacutem a Royal Society (2012) sugere que os investigadores deveriam ter exclusividade do uso dos dados por um curto periacuteodo de tempo de maneira a poderem analisa-los e publicar os seus resultados

A RECODE (2014) sublinha que os dados devem ser depositados num repositoacuterio que garanta a reutilizaccedilatildeo seguranccedila estabilidade estrutura de custos relevacircncia temaacutetica metadados diversos formatos de ficheiros processamento por maacutequina e curadoria de dados As poliacuteticas mais significativas das entidades financiadoras definem o AA a dados com obrigatoacuterio para a investigaccedilatildeo financiada com as exceccedilotildees possiacuteveis por razotildees eacuteticas e legais Requem o depoacutesito de dados que suportam as publicaccedilotildees e outros dados importantes em repositoacuterios certificados Requerem que os investigadores descrevam os dados nos Data Management Plan (DMP) que satildeo submetidos com as propostas de financiamento para serem avaliados Para assegurar a reutilizaccedilatildeo dos dados e a habilidade de identificar e medir o cumprimento das poliacuteticas os financiadores de investigaccedilatildeo introduziram especificaccedilotildees teacutecnicas nas suas poliacuteticas (DOIrsquos padrotildees de metadados especiacuteficos) bem como provisotildees para o licenciamento apropriado Mais importante as poliacuteticas eficientes incluem descriccedilotildees claras das responsabilidades e expectativas para os intervenientes envolvidos (financiadores investigadores centros de dados repositoacuterios e instituiccedilotildees de investigaccedilatildeo) (RECODE 2014)

O sucesso das poliacuteticas dos financiadores depende da criaccedilatildeo de um ambiente com incentivos apropriados que assegurem que os investigadores que gerem datasets de qualidade e os disponibilizem publicamente recebam o devido reconhecimento e recompensa bem como o financiamento adequado para os repositoacuterios e a monitorizaccedilatildeo dos planos de gestatildeo de dados (Expert Advisory Group on Data Access [EAGDA] 2014) Segundo a RECODE (2014) as poliacuteticas das entidades financiadoras devem estabelecer o AA a dados de investigaccedilatildeo por defeito devem definir responsabilidades conteuacutedos alvo os planos de gestatildeo de dados tempo e local de depoacutesito as especificaccedilotildees teacutecnicas para permitir a reutilizaccedilatildeo o licenciamento de dados medidas para garantir o acesso a longo termo e garantir a conformidade com a poliacutetica As instituiccedilotildees de investigaccedilatildeo devem desenvolver poliacuteticas para a partilha de dados e preservaccedilatildeo fornecer treino e apoio aos investigadores para gerirem os seus dados de forma efetiva criar carreiras para os gestores de dados e reconhecer os data outputs nos processos de avaliaccedilatildeo (EAGDA 2014) No Reino Unido um grupo de entidades interessadas na abertura de dados assinou em Julho de 2016 a ldquoConcordat on Open Research Datardquo com o intuito de assegurar que os dados de investigaccedilatildeo gerados e coletados por membros da comunidade de investigaccedilatildeo britacircnica sejam disponibilizados de forma aberta para reutilizaccedilatildeo por outros devendo esta abertura ocorrer de maneira consistente ldquowith relevant legal ethical disciplinary and

57

regulatory frameworks and norms and with due regard to the costs involvedrdquo (Concordat on Open Research Data 20161)

O desenvolvimento de poliacuteticas de abertura de dados permite que as instituiccedilotildees43 salvaguardem o seu investimento intelectual financeiro humano e material e respondam agrave crescente pressatildeo dos financiadores que requerem que os dados produzidos sob financiamento sejam geridos de forma apropriada e com AA (RECODE 2014) As poliacuteticas de abertura de dados das instituiccedilotildees de investigaccedilatildeo devem identificar as funccedilotildees e responsabilidades de cada interveniente tendo ainda um papel importante no desenvolvimento de data science skills sendo a sua funccedilatildeo preparar os investigadores para explorarem dados de forma efetiva oferecer serviccedilos de administraccedilatildeo de dados e tambeacutem a infraestrutura de computaccedilatildeo e armazenamento necessaacuteria (RECODE 2014 Whyte amp Donnally 20166) Rouder (2015) defende que as instituiccedilotildees devem utilizar sistemas automatizados que permitem que os dados sejam criados jaacute abertos eliminando erros na gestatildeo de dados fornecendo coacutepias de seguranccedila automaacuteticas simplificaccedilatildeo da partilha aumento da disponibilidade dos dados a longo termo e proporcionando um local de partilha e armazenamento

Segundo o RECODE (2014) os editores estatildeo interessados na abertura de dados de investigaccedilatildeo porque esta abertura agrega valor aos seus produtos principais (publicaccedilotildees tradicionais) ao melhorar a confianccedila da investigaccedilatildeo publicada atraveacutes da habilidade de a verificar Os editores cientiacuteficos devem estabelecer poliacuteticas para a partilha de dados e processos que permitam a contribuiccedilatildeo de autores individuais nas publicaccedilotildees sejam avaliadas e que requeiram a citaccedilatildeo44 e o reconhecimento dos datasets usados no curso da publicaccedilatildeo (EAGDA 2014 ICSU 2014) Os editores devem ainda requerer que se possa aceder avaliar usar e rastrear os dados subjacentes aos artigos a partir dos mesmos como condiccedilatildeo para a publicaccedilatildeo (Royal Society 2012 EAGDA 2014 ICSU 2014) A emergecircncia de data journals45 deve ser ligada ao esforccedilo de publicar dados de forma separada o que permite que partes essenciais do registo cientiacutefico possam ser disponibilizadas de forma inteligiacutevel para a comunidade cientiacutefica (RECODE 2014) Segundo o estudo de Sturges et al (20152445) ldquoa large percentage of journals have no data sharing policy and that there are inconsistencies between those that are traceablerdquo significando que os investigadores natildeo sabem se devem 43 Um bom exemplo encontra-se no siacutetio do Centro Europeu de Investigaccedilatildeo nuclear que apresenta trecircs grupos de dados produzidos que podem ser reutilizados tendo ainda definido poliacuteticas de acesso externo aos dados reutilizaccedilatildeo e preservaccedilatildeo para os dados provenientes de quatro experiecircncias a decorrer com o Large Hadron Collider (Grande Colisor de Haacutedrons) Disponiacutevel na WWW httpopendatacernchabout 44 De forma a potenciar o creacutedito do autor e a citaccedilatildeo de dados a Royal Society (2012) Altman amp Crosas (2013) Carpenter (2014) Ball amp Duke (2015) aconselham a criaccedilatildeo perfis de autor como o ORCID ou o ISNI permitindo desta forma que os investigadores possam associar todos os seus trabalhos cientiacuteficos num ponto uacutenico 45 Os data journals satildeo plataformas de publicaccedilatildeo de dados em AA com revisatildeo por pares para a publicaccedilatildeo partilha e disseminaccedilatildeo de dados que cobrem uma grande variedade de disciplinas (RECODE 2014)

58

partilhar os dados subjacentes aos seus artigos e tambeacutem natildeo sabem como e onde depositar os dados Contudo o cenaacuterio parece estar a mudar com o grupo editorial Nature Springer46 a anunciar em dezembro de 2016 o compromisso de mais de 600 journals com as novas poliacuteticas de partilha de dados definidas pelo grupo encorajando ou mandatando a partilha arquivo citaccedilatildeo de dados e revisatildeo por pares (Nature Springer 2016)

O Open Science Monitor avalia o impacto da abertura dos dados de investigaccedilatildeo atraveacutes trecircs indicadores nuacutemero de repositoacuterios de Dados Abertos poliacuteticas das agecircncias de financiamento relativas agrave partilha de dados e tambeacutem o comportamento dos investigadores em termos de partilha de dados O modelo de avaliaccedilatildeo usa ferramentas como o r3data e o SHERPAJuliet para determinar o nuacutemero de repositoacuterios e de poliacuteticas de abertura de dados recorrendo ainda a estudos de caso para determinar o comportamento dos investigadores na partilha de dados Foram listadas 105 poliacuteticas de financiadores na EU sendo que 76 das instituiccedilotildees natildeo possuem qualquer poliacutetica de Dados Abertos 10 encoraram o arquivo e 19 entidades financiadores requerem o arquivo de dados Os resultados satildeo altamente influenciados pelo enorme nuacutemero de instituiccedilotildees de financiamento de investigaccedilatildeo que pertencem ao Reino Unido sendo que das 69 instituiccedilotildees listadas 53 natildeo implementaram nenhuma poliacutetica de Dados Abertos Ressalve-se tambeacutem que das 19 poliacuteticas que requerem o arquivo de dados 13 pertencem ao Reino Unido (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2017)

O biosharingorg (2017) elaborou uma lista com as poliacuteticas de abertura de dados de investigaccedilatildeo a niacutevel mundial contando com 96 referecircncias em maio de 2017 As poliacuteticas de Dados Abertos distribuem-se por revista cientiacutefica (68) entidade financiadora (22) projetos (4) e sociedade (2) Ciecircncias da Vida e Ciecircncias Biomeacutedicas satildeo os domiacutenios com mais poliacuteticas Natildeo se encontra nenhuma poliacutetica cientiacutefica portuguesa listada

O RECODE (2014) estabeleceu dez recomendaccedilotildees para a abertura de dados cientiacuteficos

Desenvolver poliacuteticas compreensivas de AA aos dados de investigaccedilatildeo e consistentes com as prioridades nacionais e alinhadas com os requisitos europeus

Assegurar o financiamento apropriado para o AA aos dados de investigaccedilatildeo ao niacutevel do financiamento do desenvolvimento e sustentabilidade a longo prazo das

46 A Scientific Data uma das revistas de AA para descriccedilatildeo de datasets cientiacuteficos da divisatildeo editorial Nature Research englobadas no grupo Nature Springer fornece aos investigadores uma lista de repositoacuterios recomendados para o depoacutesito de dados consoante a sua aacuterea temaacutetica Disponiacutevel na WWW httpswwwnaturecomsdatapoliciesrepositoriessocial

59

infraestruturas de investigaccedilatildeo treino de investigadores bibliotecaacuterios e outros profissionais

Desenvolver poliacuteticas e iniciativas que recompensem os investigadores pelo esforccedilo de partilharem dados de alta qualidade

Identificar os intervenientes-chave e as redes de colaboraccedilatildeo para fomentar o trabalho colaborativo para um ecossistema sustentaacutevel de AA aos dados

Planear a sustentabilidade da curadoria e a preservaccedilatildeo dos dados a longo termo Desenvolver soluccedilotildees teacutecnicas e infraestruturais que possam arcar com a

preservaccedilatildeo de dados de alta qualidade a longo prazo harmonizaccedilatildeo de dados descoberta e acesso preservaccedilatildeo obsolescecircncia tecnoloacutegica documentaccedilatildeo e metadados indicadores de qualidade e relevacircncia e questotildees de seguranccedila

Desenvolver padrotildees teacutecnicos e cientiacuteficos de qualidade para os dados Requerer o uso de estruturas harmonizadas abertas e licenciadas Lidar com os sistemaacuteticos desafios legais e eacuteticos decorrentes do AA a dados Apoiar a transiccedilatildeo para os Dados Abertos atraveacutes do treino e desenvolvimento de

curriacuteculo

A ERAC (2016) desenvolveu um conjunto de recomendaccedilotildees para apoiar o desenvolvimento de poliacuteticas nacionais de abertura de dados de investigaccedilatildeo As recomendaccedilotildees satildeo dirigidas aos diversos intervenientes da abertura de dados estando dividas em quatro categorias

Treino dos intervenientes no processo de abertura de dados mudanccedila cultural treino incentivos e sistemas de recompensa e monitorizaccedilatildeo

Gestatildeo e qualidade de dados aspetos teacutecnicos da avaliaccedilatildeo da qualidade de dados identificaccedilatildeo e citaccedilatildeo de dados e gestatildeo de projetos

Sustentabilidade e financiamento abordagem das infraestruturas e financiamento essenciais

Questotildees legais direitos de propriedade intelectual e questotildees de seguranccedila

A mudanccedila cultural exigida para a abertura plena dos dados passa pela necessidade de estabelecer novas formas de reconhecimento e recompensa aos esforccedilos de gestatildeo preservaccedilatildeo e curaccedilatildeo de dados como forma de envolver investigadores e comunidades na abertura de dados (RECODE 2014 International Science 2015) A mudanccedila cultural tem no entanto encontrado alguns reveses pois o caminho para a abertura de dados natildeo eacute percecionado da mesma forma pelos diferentes intervenientes Isto resulta de conflitos entre cadeias de valor processos paralelos e desconectados especialmente entre as praacuteticas de cada disciplina e os requisitos de cada financiadorinstituiccedilatildeo (RECODE 2014) Segundo o inqueacuterito efetuado pelo EAGDA (2014) os planos de gestatildeo de dados natildeo satildeo avaliados adequadamente e existe pouca monitorizaccedilatildeo da implementaccedilatildeo da partilha de dados Os investigadores natildeo se sentem encorajados pelas instituiccedilotildees a partilhar dados e existe necessidade de

60

proporcionar treino aos investigadores A falta de apoio para a partilha de dados eacute sintomaacutetica com a falta de habilidades na gestatildeo de projetos sendo que os investigadores dedicam poucos cuidados agrave preservaccedilatildeo e curaccedilatildeo de dados Estes acontecimentos contribuem para a falta de conhecimento de metadados limitando a utilidade dos datasets Os investigadores sentem tambeacutem que a partilha de dados natildeo tem influecircncia na progressatildeo na carreira (EAGDA 2014)

A OECD (2015a) considera essencial que os investigadores desenvolvam competecircncias sobre dados que lhes permita natildeo soacute partilhar dados limpos e com metadados adequados como tambeacutem entender e reutilizar dados de terceiros A familiaridade com ferramentas e princiacutepios de gestatildeo de dados deve ser segundo a Royal Society (2012) parte integrante do treino dos cientistas As bibliotecas como parte integrante do mundo da investigaccedilatildeo e os bibliotecaacuterios47 como profissionais de informaccedilatildeo multifacetados podem desempenhar um papel ativo no mundo dos Dados Abertos como facilitadores do processo de investigaccedilatildeo (RECODE 2014 Hahnel e Hook 2016 Erway et al 2016 Hernaacutendez-Peacuterez 2016) Para Erway et al (2016) o plano de gestatildeo de dados eacute um ponto base para os bibliotecaacuterios fornecerem serviccedilos de gestatildeo de dados de investigaccedilatildeo As bibliotecas devem fornecer informaccedilatildeo sobre o processo de gestatildeo de dados incluindo planos de gestatildeo de dados e aconselhamento sobre direitos de propriedade intelectual treino serviccedilos de metadados fornecer um cataacutelogo de dados ou um repositoacuterio de dados oferecer serviccedilos de armazenamento pesquisa e acesso permanente para apoiar o ciclo da investigaccedilatildeo (Christensen-Dalsgaard et al 2012 Erway et al 2016 Hernaacutendez-Peacuterez 2016) Christensen-Dalsgaard et al (2012) acrescenta que as bibliotecas devem participar no desenvolvimento da poliacutetica de Dados Abertos da instituiccedilatildeo e estabelecer colaboraccedilotildees com investigadores grupos de investigaccedilatildeo arquivos e centros de dados para fomentar a interoperabilidade da estrutura de acesso pesquisa e partilha de dados Embora muitas das funccedilotildees sejam idecircnticas Hernaacutendez-Peacuterez (2016) faz a distinccedilatildeo entre os papeacuteis das bibliotecas puacuteblicas e das universitaacuterias O autor ressalva que as bibliotecas puacuteblicas devem centrar a atenccedilatildeo nos Dados Abertos que sejam afetos agrave sua comunidade A RDA publicou em 2015 um documento com uma visatildeo geral sobre as praacuteticas recursos online e ferramentas que podem ajudar as bibliotecas a integrar a gestatildeo de dados nas suas rotinas de trabalho As 23 orientaccedilotildees sugeridas dividem-se em recursos de aprendizagem disseminaccedilatildeo de dados planos de gestatildeo de dados literacia de dados metadados citaccedilatildeo de dados licenciamento e privacidades preservaccedilatildeo digital repositoacuterios de dados e comunidade de praacutetica

Na procura de um padratildeo de abertura de dados que permita potenciar a ciecircncia e a investigaccedilatildeo o Data Publishing Group da FORCE11 criou os FAIR principles Estes

47 Veja-se neste ponto os cursos de formaccedilatildeo sobre gestatildeo de dados para bibliotecaacuterios oferecidos pela Universidade de Edimburgo Disponiacutevel na WWW httpdatalibedinaacukmantralibtraininghtml

61

princiacutepios apresentam-se divididos em quatro facetas relacionadas mas tecnicamente independentes (FORCE11 FAIR Data Publishing Group 2014)

Fig 15 Princiacutepios FAIR Data Fonte Adaptado de FORCE11 FAIR Data Publishing Group 2014 Disponiacutevel na WWW httpswwwforce11orggroupfairgroupfairprinciples

A implementaccedilatildeo destes princiacutepios teacutecnicos na abertura de dados poderaacute potenciar tambeacutem a partilha e por consequente a citaccedilatildeo de dados A citaccedilatildeo de dados48 eacute um assunto que tem vindo a ser debatido na comunidade cientiacutefica nos uacuteltimos anos sendo uma aacuterea em que a FORCE11 tambeacutem jaacute definiu princiacutepios49 que comeccedilam a ser adotados pela comunidade cientiacutefica

Relativamente aos dados puacuteblicos ou do setor puacuteblico a comunidade internacional tem vindo a aumentar o seu interesse no uso destes dados embora nem sempre seja claro que a abertura seja uma prioridade na sua agenda poliacutetica (OD4D 2016) ldquoThe 48 Num mundo onde o Fator de Impacto continua a ser a principal medida de avaliaccedilatildeo do trabalho dos cientistas a citaccedilatildeo de dados e as meacutetricas alternativas denominadas de Altimetrias comeccedilam a ganhar algum destaque na literatura cientiacutefica 49 Os Data Citation Principles foram criados pela FORCE11 com o intuito de disponibilizar um padratildeo de citaccedilatildeo de dados cobrindo o propoacutesito funccedilotildees e atributos da citaccedilatildeo O conjunto de oito princiacutepios inclui a importacircncia da citaccedilatildeo de dados a atribuiccedilatildeo de creacutedito prova de evidecircncia identificador uacutenico acesso persistecircncia especificidade e verificabilidade interoperabilidade e flexibilidade Disponiacutevel na WWW httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

bull F1 - Satildeo atribuiacutedos identificadores persistentes e uacutenicos a cada conjunto de (meta)dados

bull F2 - Os dados satildeo descritos atraveacutes do uso de metadados sofisticados

bull F3 - Os (meta)dados devem ser registadosindexados num motor de pesquisa

bull F4 - Os metadados devem especificar o identificador de dados

Faacuteceis de encontrar

bull A1 - Os (meta)dados satildeo pesquisaacuteveis atraveacutes do seu identificador usando um protocolo de comunicaccedilatildeo padratildeo

bull A11 - O protocolo eacute aberto livre e universalmente implementaacutevel

bull A12 O protocolo requer a autenticaccedilatildeo e concessatildeo de autorizaccedilatildeo quando necessaacuterio

bull A2 - Os metadados permanecem acessiacuteveis mesmo quando os dados jaacute natildeo estatildeo disponiacuteveis

Acessiacuteveis

bull I1 - Os (meta)dados usam uma linguagem formal acessiacutevel partilhada e de aplicaccedilatildeo global

bull I2 - Os (meta)dados usam vocabulaacuterios que sigam os princiacutepios FAIR

bull I3 - Os (meta)dados incluem referecircncias qualificadas a outros (meta)dados

Interoperaacuteveis

bull R1 - Os (meta)dados tecircm uma pluralidade de atributos relevantes e precisos

bull R11 - Os (meta)dados satildeo publicados com uma licenccedila clara de acessibilidade e reutilizaccedilatildeo

bull R12 - Os (meta)dados satildeo associados com a sua origem bull R13 - Os (meta)dados cumprem com os padrotildees comunitaacuterios

relevantes de cada domiacutenio

Reutilizaacuteveis

62

culture of open data policies has to change from a culture in which opening of data is standardly considered (Zuiderwijk amp Janssen 201427)

Devem ser consideradas vaacuterias questotildees na elaboraccedilatildeo de uma poliacutetica de Dados Abertos como a definiccedilatildeo da sua aplicaccedilatildeo e os objetivos que dados iratildeo ser publicados quais as condiccedilotildees de publicaccedilatildeo de dados em que siacutetio qual a frequecircncia e qual a razatildeo da publicaccedilatildeo devendo ainda ser calculado o impacto e os benefiacutecios da abertura de dados (Carrara et al 2016a) Os objetivos das poliacuteticas de Dados Abertos podem ser sintetizados em trecircs aacutereas principais fomentar a inovaccedilatildeo social e crescimento econoacutemico melhorar a eficiecircncia dos serviccedilos do setor puacuteblico e fortalecer a democracia e aumentar a transparecircncia (Zuiderwijk Gasco Parycek amp Janssen 2014) Para alcanccedilar este impacto real os governos necessitam de implementar o fenoacutemeno dos Dados Abertos como uma mudanccedila cultural assegurando que recursos humanos e materiais infraestrutura leis e poliacuteticas satildeo eficientes para a implementaccedilatildeo e extraccedilatildeo de resultados a longo prazo (World Wide Web Foundation 2016)

No contexto das poliacuteticas de Dados Abertos a transparecircncia natildeo deve ser vista como um fim mas sim como um meio para atingir outros objetivos como a inovaccedilatildeo no setor puacuteblico permitindo o envolvimento democraacutetico e fornecendo o acesso a informaccedilatildeo ldquoincluding enhancing the findability usability and intelligibility of open data and providing the possibility to trace governmental processes and policy and decision makingrdquo (Zuiderwijk et al 2014) Dados os benefiacutecios desejados as barreiras agrave sua implementaccedilatildeo e os baixos niacuteveis de exploraccedilatildeo de dados os programas de DGA soacute funcionaratildeo bem se forem desenhados mediante a apreciaccedilatildeo da sua complexidade O programa deve natildeo soacute perceber as necessidades e as capacidades dos fornecedores de dados governamentais e privados como tambeacutem as caracteriacutesticas dos dados e a natureza dos recursos da comunidade e dos intervenientes (Dawes Vidiasova amp Parkhimovich 2016) Num estudo comparativo de cinco poliacuteticas nacionais de Dados Abertos Huijboom e van den Broek (2011) concluiacuteram que faltam provas mais evidentes dos benefiacutecios econoacutemicos sociais e democraacuteticos das poliacuteticas de abertura de dados governamentais Os autores sublinham que as barreiras estatildeo dentro das organizaccedilotildees governamentais as motivaccedilotildees estatildeo predominantemente fora desse espectro (Huijboom amp van den Broek 2011)

A investigaccedilatildeo de Dawes Vidiasova amp Parkhimovich (2016) demonstra a existecircncia de vaacuterias abordagens no desenvolvimento de programas de abertura de dados governamentais com diversas consideraccedilotildees sociais e teacutecnicas

Abordagem orientada a dados ou seja focada nas caracteriacutesticas qualidade e disponibilidade de dados abertos

Abordagem orientada ao programa que foca os objetivos e as funcionalidades das estruturas e operaccedilotildees dos programas de DGA

63

Abordagem orientada ao uso e ao utilizador que se centra nos fatores que influenciam o uso de DGA pela comunidade

Abordagem de desempenho e impacto que foca uma vasta gama de consideraccedilotildees que podem influenciar como os programas de DGA funcionam

Abordagem de ecossistemas e redes que indicam os componentes de um programa de DGA e tambeacutem as relaccedilotildees dinacircmicas existentes e como estas influenciam o desempenho do programa

O Secretaacuterio-geral das Naccedilotildees Unidas atraveacutes do seu grupo de aconselhamento independente efetuou recomendaccedilotildees para possibilitar ldquoa data revolution in sustainable developmentrdquo (The UN Secretary Generals Independent Expert Advisory Group on a Data Revolution for Sustainable Development 2014a traduccedilatildeo livre)

Criaccedilatildeo de normas incentivos e regulamentos para encorajar e requerer que os dados sejam tornados publicamente disponiacuteveis e de forma que possam ser uacuteteis a outros utilizadores

Aumentar a literacia de dados para que mais pessoas usem e analisem dados Criar inovaccedilotildees na forma em como quando e que dados satildeo coletados e

partilhados para que estejam sempre atualizados e sejam relevantes para as pessoas e para os poliacuteticos

Para apoiar o desenvolvimento sustentaacutevel e inclusivo a data revolution deve ser guiada pelos seguintes princiacutepios qualidade e integridade de dados desagregaccedilatildeo de dados publicaccedilatildeo de dados de forma raacutepida transparecircncia e abertura de dados curadoria e usabilidade de dados proteccedilatildeo e privacidade gestatildeo e independecircncia recursos e capacidades tecnoloacutegicas (The UN Secretary Generals Independent Expert Advisory Group on a Data Revolution for Sustainable Development 2014b) O repositoacuterio de dados estatiacutesticos das Naccedilotildees Unidas indexa 60 milhotildees de registos de datasets provenientes de 35 bases de dados de 20 temaacuteticas diferenciadas Ao inserir a palavra ldquoPortugalrdquo no campo de pesquisa do repositoacuterio satildeo recuperados 2172 datasets distribuiacutedos por 25 fontes diferenciadas Estes conjuntos de dados distribuem-se por vaacuterias temaacuteticas sendo o setor industrial o maior fornecedor de dados com 612 datasets (United Nations Statistics Division 2017)

Dawes Vidiasova amp Parkhimovich (20162) defendem ldquothe ecosystem metaphorrdquo como uma abordagem heuriacutestica para o desenho efetivo de programas de abertura de dados governamentais sublinhando a sua utilidade se o ecossistema for dotado de ldquofeedback and adjustment among actors and processesrdquo A chave para um ecossistema de Dados Abertos funcional eacute a implementaccedilatildeo de poliacuteticas que definam ldquothe legal context standards to facilitate data interoperability and a stable and sustainable network for users of the datardquo (Donker amp van Loenen 2017)

64

A Sunlight Foundation publicou em 2014 as ldquoGuidelines for open data policiesrdquo fornecendo aconselhamento ao niacutevel dos dados que devem ser tornados puacuteblicos e como essa abertura deve ser efetuada Para a implementaccedilatildeo de poliacuteticas de DGA a Sunlight Foundation aponta como fundamental criar um autoridade de supervisatildeo criar orientaccedilotildees e outras regulaccedilotildees vinculativas para a implementaccedilatildeo da poliacutetica incorporar a perspetiva puacuteblica na implementaccedilatildeo da poliacutetica definir prazos ambiciosos para a implementaccedilatildeo criar processos que assegurem a qualidade dos dados assegurar financiamento suficiente para a implementaccedilatildeo da poliacutetica criar ou explorar parcerias e mandatar futuras revisotildees da poliacutetica para possiacuteveis ajustamentos (Sunlight Foundation 2014 traduccedilatildeo livre)

De acordo com Dietrich (2013) uma poliacutetica de dados abertos deve

Definir a abertura por defeito Estar alinhada com os principais objetivos nacionais de desenvolvimento de

poliacuteticas Definir uma estrateacutegia nacional e as suas prioridades Tornar a coleta e gestatildeo de dados numa rotina Estabelecer accedilotildees de suporte ao ecossistema de dados abertos

Segundo o Open Data GoldBook todas as poliacuteticas de Dados Abertos devem cobrir os seguintes toacutepicos (Carrara et al 2016a traduccedilatildeo livre)

Lista das categorias de dados da organizaccedilatildeo Avaliaccedilatildeo do estatuto dos dados da organizaccedilatildeo Alinhamento com os aspetos legais Accedilotildees necessaacuterias para atingir os objetivos propostos Implicaccedilotildees teacutecnicas Implicaccedilotildees financeiras Criaccedilatildeo de um grupo de trabalho com responsabilidades e funccedilotildees claras Desenvolvimento de um plano que assegure a criaccedilatildeo do grupo de trabalho e

tambeacutem a sua monotorizaccedilatildeo Definiccedilatildeo de indicadores de performance que possibilitem a mediccedilatildeo do progresso

da poliacutetica relativamente aos objetivos delineados

O Open Data Study (Hogge 2011) aponta como razatildeo de sucesso das estrateacutegias de Open Data no Reino Unido e nos EUA a utilizaccedilatildeo de uma abordagem que envolve trecircs niacuteveis de intervenientes

Sociedade Civil e em particular o pequeno grupo que desenvolve aplicaccedilotildees e serviccedilos a partir de dados puacuteblicos

Um grupo de burocratas governamentais munidos de talento e recursos que lhes permita funcionar como niacutevel intermeacutedio ou de ligaccedilatildeo

Uma administraccedilatildeo poliacutetica recetiva agrave mudanccedila e agrave abertura

65

Em entrevista ao mesmo estudo (Hogge 201110) Tim Berners-Lee sintetiza esta estrateacutegia ldquoIt has to start at the top it has to start in the middle and it has to start at the bottomrdquo reforccedilando a ideia da importacircncia destes trecircs niacuteveis de influecircncia

Atraveacutes do seu Task Force Report o e-IRG (2016) efetuou vaacuterias recomendaccedilotildees para a implementaccedilatildeo de poliacuteticas de Dados Abertos preferecircncia pelas licenccedilas abertas promover a certificaccedilatildeo dos repositoacuterios apresentar os dados como um bem cientiacutefico institucional e societal e por fim ligar dados agraves publicaccedilotildees O OD4D (2016) sublinha que os dados devem ser publicados de forma consistente devem ser comparaacuteveis e interoperaacuteveis e para isso eacute necessaacuterio adotar padrotildees abertos e praacuteticas de publicaccedilatildeo para metadados formatos codificaccedilatildeo de caracteres identificadores vocabulaacuterios e licenciamento

Atraveacutes do estudo efetuado agraves poliacuteticas de Dados Abertos de instituiccedilotildees holandesas Zuiderwijk e Janssen (2014 traduccedilatildeo livre) efetuaram diversas recomendaccedilotildees que podem potenciar melhorias nas poliacuteticas de abertura de dados

Colaboraccedilatildeo entre instituiccedilotildees usando recursos e conhecimento coletivo para apoiar a troca de conhecimentos e a superaccedilatildeo da limitaccedilatildeo de recursos

Foco no impacto criaccedilatildeo de valor puacuteblico e natildeo apenas na publicaccedilatildeo de dados Estiacutemulo do uso de Dados Abertos e comunicaccedilatildeo dos sucessos de reutilizaccedilatildeo Criaccedilatildeo de uma cultura onde a abertura de dados seja incorporada nos processos

de trabalho diaacuterios

Arzberger et al (20041777) elencaram uma estrutura de avaliaccedilatildeo com cinco domiacutenios para promover o acesso a dados tecnoloacutegico institucional e de gestatildeo financeiro e orccedilamental legal e poliacutetico cultural e comportamental Estes domiacutenios podem ajudar na formulaccedilatildeo de poliacuteticas de Dados Abertos dado que satildeo ldquoa framework for locating and analyzing where improvements can be maderdquo Alguns autores destacam a pouca importacircncia que tem sido dedicada agrave implementaccedilatildeo avaliaccedilatildeo e alteraccedilotildees das poliacuteticas de Dados Abertos (Zuiderwijk et al2014) e ao desenvolvimento de investigaccedilatildeo que compare as mesmas poliacuteticas (Zuiderwijk amp Janssen 2014) A avaliaccedilatildeo dos efeitos das poliacuteticas de Dados Abertos pode fornecer inferecircncias importantes sobre as vantagens e desvantagens da abertura de dados e o valor puacuteblico que estas podem criar (Zuiderwijk et al2014) Comparar poliacuteticas de Dados Abertos em diferentes aspetos e a diferentes niacuteveis eacute importante e necessaacuterio para obter ldquoa better understanding of the common and differing elements in the policies and to identify the factors that affect the variation in policies and which influence their impactrdquo (Zuiderwijk amp Janssen 201417-18) Avaliar o estado da abertura de dados pode envolver a avaliaccedilatildeo teacutecnica dos conjuntos de dados das iniciativas de abertura dos dados governamentais atraveacutes da mediccedilatildeo quantitativa de resultados e impacto e julgamentos qualitativos sobre o desempenho da iniciativa de Dados Abertos (World Wide Web Foundation 2014) Um meacutetodo comum de avaliar o

66

efeito das poliacuteticas satildeo as estruturas de avaliaccedilatildeo da maturidade dos Dados Abertos sendo que estas podem ser uma ferramenta importante na melhoria da abertura de dados e no envolvimento da sociedade Estas estruturas satildeo usadas como modelo para comparaccedilatildeo de diferentes setores eou paiacuteses como instrumento de melhoria da qualidade e gestatildeo dos Dados Abertos (World Wide Web Foundation 2014 Donker amp van Loenen 2017) para entender os impactos comerciais e sociais e priorizar determinados tipos de dados (World Wide Web Foundation 2014) A World Wide Web Foundation (2014) enfatiza que a avaliaccedilatildeo das atividades de Dados Abertos deve ter em conta

Contexto em que a abertura de dados eacute feita legal organizacional poliacutetico teacutecnico social e econoacutemico

Natureza e qualidade dos conjuntos de dados acessibilidade legibilidade por maacutequina e licenccedilas abertas dimensatildeo teacutecnica legal social e praacutetica da abertura classificaccedilatildeo de datasets avaliaccedilatildeo da qualidade

Contexto de utilizaccedilatildeo quem satildeo os utilizadores quais os seus propoacutesitos e quais as atividades e modelos de negoacutecio construiacutedos a partir dos Dados Abertos

Benefiacutecios adquiridos pela reutilizaccedilatildeo de Dados Abertos sociais ambientais poliacuteticos e econoacutemicos ou comerciais

Atraveacutes de uma extensa revisatildeo da literatura50 Zuiderwijk e Janssen (2014) elaboraram uma estrutura de comparaccedilatildeo para as poliacuteticas de Dados Abertos baseada em trecircs vetores o ambiente e contexto da poliacutetica o conteuacutedo da poliacutetica os indicadores de desempenho que permitem inferir o valor puacuteblico alcanccedilado Estes vetores dividem-se em 27 indicadores de enquadramento e avaliaccedilatildeo das poliacuteticas de Dados Abertos

50 As autoras mencionam publicaccedilotildees de Huijboom amp Van der Broek (2011) Gibbs et al (2003) Eskelinen et al (2008) De Bruijn et al (2002) Dawes et al (2004) Rothenberg (2012) Public Sector Transparency Board (2012) Dawes Pardo amp Cresswell (2004) Open Government Directive (Obama 2012) Jaeger et al (2012) Zuiderwijk Jeffey amp Janssen (2012) Ono amp Zavodny (2007) Jaeger (2007)

67

Fig 16 Estrutura de avaliaccedilatildeo de poliacuteticas de Dados Abertos Fonte Zuiderwijk e Janssen (2014) Disponiacutevel na WWW httpwwwsciencedirectcomsciencearticlepiiS0740624X13001202

Antes de poder avaliar o sucesso do impacto dos Dados Abertos eacute necessaacuterio avaliar o estado atual da abertura de dados (Donker amp van Loenen 2017) De acordo com Sasse et al (2017) a avaliaccedilatildeo dos produtos de Dados Abertos pode ser difiacutecil Os autores enfatizam que os responsaacuteveis pelos portais de dados querem obter mais informaccedilatildeo atraveacutes da mediccedilatildeo de alguns paracircmetros como os datasets mais acedidos que datasets natildeo satildeo atualizados ou a percentagem de downloads entre outros Estas meacutetricas51 podem servir diversas audiecircncias desde organizaccedilotildees que publiquem dados a utilizadores que pretendam saber quais os conjuntos de dados mais usados Ainda

51 As meacutetricas satildeo uma forma de avaliaccedilatildeo que mede o progresso desempenho qualidade ou quantidade de um projeto serviccedilo ferramenta ou produto (Sasse et al 2017)

bullPaiacutes bullNiacutevel da organizaccedilatildeo e tipo de missatildeo bullMotivaccedilotildees e objectivos bullLanccedilamento da plataforma de Dados Abertos bullAlocaccedilatildeo de recursos e contexto econoacutemico bullLegislaccedilatildeo bullContexto poliacutetico e social

Conteacuteudo e ambiente da poliacutetica

bullEstrateacutegia e princiacutepios de abertura bullMedidas e instrumentos poliacuteticos bullProcessamento de dados antes da publicaccedilatildeo bullQuantidade de Dados Abertos bullTemaacutetica dos Dados Abertos bullFormas de apresentaccedilatildeo de dados bullPreccedilo do acesso aos dados bullGrupos alvo da abertura de dados bullPadrotildees e formatos teacutecnicos para os Dados Abertos bullFornececimento de metadados bullTipos de dados natildeo publicados bullApoio teacutecnico para o uso de dados publicados bullPromoccedilatildeo ativa da reutilizaccedilatildeo de dados bullQualidade dos dados bullLicenciamento de dados bullDisponibilidade de dados sem pedido de registo bullEstrutura da relaccedilatildeo entre os fornecedores de informaccedilatildeo e os utilizadores

Conteuacutedo da poliacutetica (input)

bullUsos dos dados publicados bullRiscos da publicaccedilatildeo de dados bullBenefiacutecios da publicaccedilatildeo de dados

Indicadores de desempenho (output)

Valor puacuteblico alcanccedilado (impacto)

68

segundo Sasse et al (2017) as meacutetricas devem ser integradas num contexto mais vasto para que possam conduzir agrave tomada de decisatildeo e agrave formulaccedilatildeo de poliacuteticas

Entre as iniciativas de Open Data ao niacutevel global a disponibilizaccedilatildeo aberta de dados eacute normalmente feita atraveacutes de cataacutelogos e portais de dados centralizados disponibilizando um ponto de acesso uacutenico aos utilizadores e atraveacutes dos quais se pode inferir o impacto das poliacuteticas de Open Data atraveacutes do regime de abertura dos datasets disponibilizados O DataCatalogs52 agrega os portais de DGA espalhados pelo mundo inteiro contabilizando 520 portais em Dezembro de 2016 sendo 197 localizados na Europa e apenas 5 em Portugal53 cenaacuterio que nos parece extremamente desatualizado tendo em conta os resultados obtidos no Quadro 5

O Open Data Barometer coleta informaccedilatildeo sobre a abertura de dados classificando os paiacuteses conforme o niacutevel de preparaccedilatildeo de poliacuteticas de Open Data a sua respetiva implementaccedilatildeo e tambeacutem o impacto causado por esta abertura oferecendo uma visatildeo global daquilo que eacute o estado de abertura dos dados governamentais A quarta ediccedilatildeo do Open Data Barometer revela algumas conclusotildees preocupantes a niacutevel da abertura dos dados governamentais A disponibilidade de dados que cumprem todos os princiacutepios de abertura caiu dos 10 para 7 e a legibilidade por maacutequina tambeacutem tem tendecircncia negativa Apenas se registou uma melhoria no licenciamento de dados A World Wide Web Foundation (2017) listou ainda um conjunto de problemas na disponibilizaccedilatildeo de Dados Abertos

Foi avaliado que nove em cada dez conjuntos de dados natildeo estatildeo abertos sendo que a recomendaccedilatildeo eacute que estes sejam abertos por princiacutepio

Os dados governamentais satildeo normalmente incompletos e de baixa qualidade A World Wide Web Foundation recomenda a descentralizaccedilatildeo da abertura de dados por todas as agecircncias e departamentos governamentais

A vontade poliacutetica eacute aquilo que distingue o sucesso do insucesso da abertura de dados ldquoGovernments must adopt the Open Data Charter to ensure open data practices are embedded beyond political mandatesrdquo (World Wide Web Foundation 201717)

Os governos natildeo estatildeo a publicar os dados necessaacuterios para restaurar a confianccedila dos cidadatildeos A recomendaccedilatildeo eacute que os governos devem consultar os cidadatildeos e intermediaacuterios para saber que dados devem ser considerados prioritaacuterios

Poucas iniciativas de Dados Abertos realmente promovem a igualdade e a inclusatildeo ldquoGovernments must invest in using open data to improve the lives of marginalised groupsrdquo (World Wide Web Foundation 201721)

52 Disponiacutevel na WWW httpdatacatalogsorg 53 Os portais indexados pelo DataCatalogs satildeo OneStopTransport iGEO Central de Dados Dadosgovpt Despesa Puacuteblica Portugal

69

O Open Data Maturity Model da ODI (201511) fornece uma estrutura para avaliar como as praacuteticas de abertura de dados tecircm impacto nas organizaccedilotildees nomeadamente como os dados satildeo publicados como satildeo geridos e valorizados Este modelo eacute baseado em cinco temas que representam uma vasta aacuterea de atividades

Processos de gestatildeo de dados identificaccedilatildeo dos processos de gestatildeo e publicaccedilatildeo de dados incluindo o controlo de qualidade fluxos de trabalho e adoccedilatildeo de padrotildees teacutecnicos Conhecimentos e habilidades delimitaccedilatildeo dos passos necessaacuterios para criar ldquoa culture of open data within an organizationrdquo identificando a necessaacuteria partilha de conhecimento treino e aprendizagem para entender os benefiacutecios da abertura Apoio e envolvimento do cliente foca a necessidade das organizaccedilotildees de se envolver com as fontes de dados e com os reutilizadores de dados de modo a poder fornecer apoio e obter respostas para tornar a abertura de dados bem-sucedida Investimento e desempenho financeiro cobre a necessidade da organizaccedilatildeo em ter uma visatildeo do valor dos seus dados e do orccedilamento necessaacuterio para suportar a sua publicaccedilatildeo Em termos de consumo de dados as organizaccedilotildees devem entender os custos e o valor associado agrave reutilizaccedilatildeo de dados provenientes de outras fontes Visatildeo estrateacutegica sublinha a necessidade de a organizaccedilatildeo adotar uma estrateacutegia clara sobre a partilha e reutilizaccedilatildeo de dados e nomear uma lideranccedila reconhecida com responsabilidade e capacidade para executar a estrateacutegia (ODI 2015 traduccedilatildeo livre)

A W3C publicou em Janeiro de 2017 como recomendaccedilatildeo uma lista de boas praacuteticas para a publicaccedilatildeo e partilha de dados denominada Data on the Web Best Practices Estas praacuteticas cobrem questotildees como o fornecimento de metadados descritivos e estruturais licenciamento arquivamento enriquecimento e republicaccedilatildeo de dados (W3C 2017) Cada uma das praacuteticas estaacute classificada de acordo com os seus benefiacutecios definidos em oito categorias reutilizaccedilatildeo compreensatildeo conexatildeo a outros dados pesquisabilidade confianccedila acesso interoperabilidade e processamento (W3C 2017) Esta lista de boas praacuteticas eacute complementada por dois vocabulaacuterios controlados um para o uso de datasets54 e outro para a qualidade dos dados55 (W3C 2017)

ldquoUma cidade inteligente eacute conhecedora das suas capacidades do seu territoacuterio e dos seus recursos devendo ser capaz de transformar o seu papel de fornecedor de dados em catalisadora de processos de inovaccedilatildeordquo (Soares Baptista e Lima 2015) A disponibilizaccedilatildeo de dados locais permite aos cidadatildeos acompanharem as decisotildees do setor puacuteblico relativas a despesas aumentando a transparecircncia e estimulando a democracia Contudo eacute necessaacuterio que as cidades desenvolvam uma infraestrutura correta que permita processar e integrar a gestatildeo de dados em diversos serviccedilos

54 Disponiacutevel na WWW httpswwww3orgTRvocab-duv 55 Disponiacutevel na WWW httpswwww3orgTRvocab-dqv

70

criando ainda um sistema de gestatildeo que facilite o armazenamento e publicaccedilatildeo de dados (Carrara et al 2016b) A Sunlight Foundation (2013) desenvolveu o Public Policy for Public Data um guia para ajudar as cidades a desenvolver e implementar poliacuteticas puacuteblicas de Dados Abertos desde as razotildees para a abertura passando pelos objetivos e implementaccedilatildeo ateacute agrave promoccedilatildeo da poliacutetica

De forma a sistematizar as iniciativas de Dados Abertos e melhorar a sua gestatildeo foi publicada em Espanha a UNE 1783012015 Ciudades Inteligentes Datos Abiertos permitindo avaliar a maturidade da publicaccedilatildeo de Dados Abertos das cidades inteligentes atraveacutes de meacutetricas e indicadores Esta norma define cinco grandes domiacutenios associados aos Dados Abertos (estrateacutegico legal organizacional teacutecnico econoacutemico-social) fornecendo ainda vocabulaacuterios concretos para a publicaccedilatildeo de dados (Asociacioacuten Espantildeola de Normalizacioacuten y Certificacioacuten 2015)

O World Council on City Data56 eacute uma das organizaccedilotildees envolvidas na promoccedilatildeo das smart cities e da criaccedilatildeo de padrotildees para os dados provenientes das cidades Em 2014 foi publicada a norma internacional ISO 37120 com o tiacutetulo ldquoSustainable development of communities -- Indicators for city services and quality of liferdquo incluindo 100 indicadores que medem indicadores sociais econoacutemicos e ambientais Estes indicadores estatildeo divididos em 17 categorias de dados economia educaccedilatildeo energia ambiente financcedilas governaccedilatildeo fogo e emergecircncias respostas sauacutede recreaccedilatildeo seguranccedila abrigos desperdiacutecios soacutelidos telecomunicaccedilotildees e inovaccedilatildeo transportes planeamento urbano desperdiacutecio de aacutegua e aacutegua e saneamento (Carrara et al 2016b) O World Council on City Data (2016) permite comparar a abertura de dados em diferentes cidades utilizando os indicadores da ISO 3720 Em termos de cidades listadas pelo mapa desta organizaccedilatildeo o Porto eacute o uacutenico representante portuguecircs destacando-se a sauacutede e transportes como aacutereas com maior abertura

21 Poliacuteticas Macro

A promessa de uma ciecircncia orientada a dados ldquohas renewed the vigour of policy efforts to catalyse innovationrdquo (Whyte amp Donnely 20161) No acircmbito da abertura de dados estatildeo a ser desenvolvidas poliacuteticas por governos agecircncias de financiamento e editoras cientiacuteficas57 que assegurem que os dados de investigaccedilatildeo estejam disponiacuteveis em repositoacuterios puacuteblicos A EU tem desempenhado uma dupla funccedilatildeo na abertura de dados cientiacuteficos ao requerer a abertura de dados nos seus programas de investimento e ao coordenar a implementaccedilatildeo de praacuteticas de abertura de dados nos

56 Disponiacutevel na WWW httpwwwdataforcitiesorg 57 O Open Acess Directory possui uma lista ainda em desenvolvimento com as revistas cientiacuteficas que implementaram uma poliacutetica de Dados Abertos Disponiacutevel na WWW httpoadsimmonseduoadwikiJournal_open-data_policies

71

estados membros (ERAC 2016) As agecircncias de financiamento58 tecircm vindo paulatinamente a definir poliacuteticas de AA que exigem a garantia que os dados de investigaccedilatildeo subjacentes agrave publicaccedilatildeo textual satildeo depositados em repositoacuterios adequados de forma a permitir a verificaccedilatildeo dos resultados de investigaccedilatildeo e futuros uso e interpretaccedilotildees (UNESCO 2015) O raacutepido desenvolvimento da abertura e gestatildeo de dados cientiacuteficos nos EUA e no Reino Unido satildeo resultados de mandatos dos financiadores como o Research Council United Kingdom National Science Foundation e da National Institutes of Health (RECODE 2014) As instituiccedilotildees de financiamento reconhecem a dificuldade na mudanccedila da cultura de partilha de dados sendo que a tendecircncia deveraacute passar por aumentar os niacuteveis de monotorizaccedilatildeo das poliacuteticas como a monotorizaccedilatildeo dos DMPrsquos auditorias institucionais monotorizaccedilatildeo de resultados produzidos e recompensas para o apoio na gestatildeo de dados (Whyte e Donnally 2016)

Em 2010 a Comissatildeo Europeia desenhou uma visatildeo que tinha por objetivo o desenvolvimento de uma e-infraestrutura cientiacutefica que potenciasse o acesso uso e reuacuteso bem como a qualidade dos dados dando o impulso para a EU formular poliacuteticas para a construccedilatildeo da infraestrutura de investigaccedilatildeo dentro do enquadramento da agenda digital Foca-se na infraestrutura necessaacuteria para a gestatildeo de dados cientiacuteficos e identifica os benefiacutecios de acelerar o desenvolvimento de uma completa e funcional infraestrutura para os dados cientiacuteficos O relatoacuterio faz seis recomendaccedilotildees destacando-se o papel governamental no desenvolvimento e uso de novas maneiras de medir o valor dos dados a necessidade de recompensar os que contribuem para tal treinar uma nova geraccedilatildeo de cientistas de dados e fomentar o entendimento puacuteblico (Comissatildeo Europeia Grupo de peritos de alto niacutevel em dados de investigaccedilatildeo 2010) No mesmo documento a Comissatildeo Europeia salienta que existem desafios que satildeo necessaacuterios superar na construccedilatildeo da e-infraestrutura estando estes ao niacutevel da coleta qualidade usabilidade interoperabilidade diversidade seguranccedila dos dados educaccedilatildeo e treino publicaccedilatildeo e acesso de dados exploraccedilatildeo comercial preservaccedilatildeo e sustentabilidade e novos paradigmas sociais

Em 2011 a Comissatildeo Europeia emitiu a COM (2011) 882 onde declara que a abertura de dados cientiacuteficos eacute vital para a Europa pelo seu poder de promover negoacutecios e oportunidades econoacutemicas resolver problemas da sociedade e acelerar o progresso cientiacutefico sendo necessaacuterio atuar a niacutevel local regional nacional e a niacutevel europeu (Comissatildeo Europeia 2011)

A recomendaccedilatildeo da Comissatildeo Europeia sobre o acesso agrave informaccedilatildeo cientiacutefica e a sua preservaccedilatildeo (2012417UE) pede aos Estados Membros que desenvolvam poliacuteticas e estrateacutegias que assegurem o AA a publicaccedilotildees e dados de investigaccedilatildeo provenientes

58 A Universidade de Cambridge apresenta uma lista com as 18 entidades financiadoras a niacutevel internacional que possuem poliacuteticas de Dados Abertos Disponiacutevel na WWW httpwwwdatacamacukfunders

72

de financiamento puacuteblico Estas poliacuteticas devem prever os objetivos e os indicadores de avaliaccedilatildeo o plano de execuccedilatildeo e o plano financeiro garantindo que os dados resultantes de financiamento puacuteblico sejam acessiacuteveis e reutilizaacuteveis ldquothrough digital e-infrastructuresrdquo e sejam facilmente identificados e ligados a outros conjuntos de dados As instituiccedilotildees nacionais devem promover a poliacutetica nacional atraveacutes de mecanismos que permitam e recompensem ldquothe sharing of research datardquo (EUR-Lex 201241-42) A poliacutetica instaurada em 2015 pela Comissatildeo Europeia denominada Digital Single Market propocircs a implementaccedilatildeo de uma ldquocopyright exception that would permit researchers to analyse on a large scale scientific data to which they have lawful accessrdquo (Comissatildeo Europeia 2016b) Esta exceccedilatildeo iraacute permitir que os investigadores europeus usem meacutetodos de ldquoText e Data Miningrdquo para analisar e extrair conhecimento de grandes quantidades de informaccedilatildeo atraveacutes de teacutecnicas computacionais (Comissatildeo Europeia 2016a51) Atraveacutes da implementaccedilatildeo deste Digital Single Market a EU tem envidado esforccedilos para desenvolver uma economia baseada em dados Esta economia de dados caracteriza-se por um ldquoecossistema de diferentes tipos de intervenientes no mercado como fabricantes investigadores e fornecedores de infraestruturas que colaboram para garantir que os dados satildeo acessiacuteveis e utilizaacuteveisrdquo Deste modo os intervenientes do mercado podem retirar valor desses dados ldquoatraveacutes da criaccedilatildeo de um leque de aplicaccedilotildees com um grande potencial de melhoria da vida quotidianardquo (Comissatildeo Europeia 2017c)

Com a ambiccedilatildeo de tornar a Europa liacuteder mundial numa economia baseada em dados a Comissatildeo Europeia (2016c) pretende ldquodisponibilizar serviccedilos baseados na computaccedilatildeo em nuvem e infraestruturas de dados de craveira mundialrdquo que forneccedilam vantagens competitivas a investigadores empresaacuterios e instituiccedilotildees puacuteblicas baseadas na utilizaccedilatildeo de grandes volumes de dados Neste sentido foram delineadas quatro metas a cumprir ateacute 2020 (Comissatildeo Europeia 2016d)

ldquoA partir de 2016 Criaccedilatildeo de uma nuvem europeia para a ciecircncia aberta destinada aos investigadores europeus e seus colaboradores cientiacuteficosrdquo A estrateacutegia definida inclui a ldquointegraccedilatildeo e consolidaccedilatildeo das plataformas de infraestruturas eletroacutenicas da agregaccedilatildeo das atuais nuvens cientiacuteficas e infraestruturas de investigaccedilatildeordquo e tambeacutem o apoio agrave criaccedilatildeo de ldquoserviccedilos baseados na computaccedilatildeo em nuvemrdquo

2017 Definiccedilatildeo de abertura por princiacutepio de todos os dados cientiacuteficos gerados em futuros projetos financiados pelo quadro atual de financiamento (H2020) para garantir a reutilizaccedilatildeo do volume massivo de dados produzidos pela comunidade cientiacutefica

2018 Lanccedilamento de uma iniciativa para acelerar o desenvolvimento de ldquotecnologias quacircnticas que estatildeo na base da proacutexima geraccedilatildeo de supercomputadoresrdquo

73

Ateacute 2020 desenvolvimento e implantaccedilatildeo em larga escala de uma infraestrutura europeia de computaccedilatildeo de alto desempenho armazenamento de dados e redesrdquo onde se destaca a ldquocriaccedilatildeo de um centro europeu de grandes volumes de dadosrdquo e a melhoria do GEANT59 ldquoa rede de base de investigaccedilatildeo e inovaccedilatildeordquo

A aposta na criaccedilatildeo de poliacuteticas de abertura de dados de acordo com os objetivos europeus relativamente agrave CA reflete-se no atual programa de financiamento da investigaccedilatildeo e inovaccedilatildeo da EU o Horizonte 2020 (H2020) Este programa criou um projeto-piloto de dados abertos com o objetivo de maximizar o acesso e reutilizaccedilatildeo de dados de investigaccedilatildeo nas aacutereas cientiacuteficas selecionadas60 embora todas as outras aacutereas sejam convidadas a participar (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016a) Sob o artigo 293 do Model Grant Agreement o projeto-piloto de abertura de dados requer o depoacutesito num repositoacuterio de AA de todos os dados e metadados associados que sejam subjacentes aos resultados finais da investigaccedilatildeo permitindo assim o seu acesso exploraccedilatildeo por maacutequina reproduccedilatildeo e disseminaccedilatildeo sem custos para os utilizadores Os investigadores devem fornecer informaccedilatildeo sobre as ferramentas e instrumentos necessaacuterios para validar os resultados Aos participantes em projetos financiados por fundos europeus eacute exigido a elaboraccedilatildeo de um DMP uma ferramenta para a gestatildeo publicaccedilatildeo e reutilizaccedilatildeo de dados permitindo descrever os conjuntos de dados gerados no processo de investigaccedilatildeo e como e quando seratildeo publicados A gestatildeo de dados deve ser efetuada segundo os princiacutepios FAIR tornando os dados faacuteceis de encontrar acessiacuteveis interoperaacuteveis e reutilizaacuteveis (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016c)

Com a extensatildeo do projeto-piloto a todas as aacutereas de investigaccedilatildeo financiadas a abertura de dados de investigaccedilatildeo passou a ser a norma por princiacutepio Poreacutem existe a opccedilatildeo de natildeo participaccedilatildeo (Comissatildeo Europeia 2017b) tendo sido implementado o lema ldquoas open as possible as closed as necessaryrdquo (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016b8) O opt out ou as exceccedilotildees de natildeo participaccedilatildeo podem ser exercidas em caso de incompatibilidade com a obrigaccedilatildeo de proteger resultados com razotildees de seguranccedila com regras de proteccedilatildeo de dados pessoais pelo fato de o objetivo do projeto ser colocado em causa de o projeto natildeo gerar ou coletar dados e ainda outras razotildees legiacutetimas que possam ser apresentadas (Comissatildeo Europeia 2017b)

59 O GEacuteANT eacute um elemento fundamental na infraestrutura europeia fornecendo uma rede para a criaccedilatildeo de investigaccedilatildeo educaccedilatildeo inovaccedilatildeo e perfeiccedilatildeo cientiacutefica Disponiacutevel na WWW httpswwwgeantorgAbout 60 As aacutereas cientiacuteficas selecionadas satildeo Tecnologias emergentes e futuras infraestruturas de investigaccedilatildeo lideranccedila na melhoria de tecnologias industriais (tenologias de informaccedilatildeo e comunicaccedilatildeo) nano e biotecnologias seguranccedila alimentar sustentabilidade de recursos agriacutecolas marinhos e mariacutetimos ambiente e eficiecircncia de recursos sociedades inovadoras e inclusivas ciecircncia de e para a sociedade e cidades inteligentes

74

A abertura dos dados de investigaccedilatildeo criados com financiamento puacuteblico conta com o apoio dos projetos do OpenAIRE+ e do OpenAIRE-Connect visam estimular a abertura de dados funcionando ldquoas a knowledge bank and Open Access web-portalrdquo (ERAC 201667) O portal do OpenAIRE agrega em Maio de 2017 um total de 46238 conjuntos de dados sendo que Portugal contribui com 1968 datasets distribuiacutedos por quatro entidades embora o Instituto Politeacutecnico de Castelo Branco seja o fornecedor de mais de 95 dos dados

O projeto EUDAT financiado pelo H2020 visa fornecer uma infraestrutura de dados colaborativa aos investigadores europeus de qualquer disciplina cientiacutefica onde possam preservar pesquisar aceder e processar dados como parte da EUDAT Collaborative Data Infrastructure uma rede de colaboraccedilatildeo e centros de cooperaccedilatildeo O EUDAT fornece acesso a sete serviccedilos diferentes relativos agrave gestatildeo de dados (EUDAT[a]) Atraveacutes do serviccedilo B2FIND61 eacute possiacutevel pesquisar os dados armazenados atraveacutes do serviccedilo B2SHARE62 verificando-se a existecircncia de 484795 conjuntos de dados (EUDAT[b])

Vaacuterios programas de abertura de dados governamentais foram lanccedilados em diversos paiacuteses e sistemas poliacuteticos tendo-se expandido tambeacutem ao niacutevel subnacional e local sendo que estes programas compreendem diretivas regras e praacuteticas com aplicaccedilatildeo em todos ou na maior parte dos setores do governo (Dawes Vidiasova amp Parkhimovich 2016) Estas iniciativas satildeo idecircnticas numa primeira anaacutelise atraveacutes da construccedilatildeo de um portal na seleccedilatildeo de datasets semelhantes sendo que tambeacutem recorrem aos mesmos tipos de eventos como os hackathons para preparar e divulgar o lanccedilamento de programas de DGA (Davies 2014) Contudo estas iniciativas diferem no seu estado de maturaccedilatildeo estruturas poliacuteticas e as suas prioridades puacuteblicas (Davies 2014) e nos princiacutepios de abertura na quantidade e tipos de dados publicados nos metadados fornecidos e no apoio agrave reutilizaccedilatildeo de dados (Zuiderwijk amp Janssen 2014) De facto uma simples comparaccedilatildeo dos vaacuterios iacutendices de avaliaccedilatildeo permitiraacute perceber os diferentes niacuteveis de maturidade das poliacuteticas de Dados Abertos e a niacutevel europeu e mundial

Os Dados Abertos estatildeo na agenda europeia haacute mais de uma deacutecada tendo o primeiro passo sido dado em 2003 com a publicaccedilatildeo da Diretiva 200398EC sobre a reutilizaccedilatildeo da PSI (EUR-Lex 2003a) e da Diretiva 20034CE relativa ao acesso puacuteblico agrave informaccedilatildeo ambiental (EUR-Lex 2003b) Esta Diretiva aplica-se agrave reutilizaccedilatildeo dos documentos detidos pelo setor puacuteblico poreacutem natildeo obriga os estados membros a publicar dados do setor puacuteblico para estimular o mercado da informaccedilatildeo apenas os aconselha a tornar disponiacuteveis nem impotildee nenhuma obrigaccedilatildeo de autorizaccedilatildeo de reutilizaccedilatildeo dos dados (Janssen 2011) Janssen (2011) sublinha que apesar do sucesso

61 Disponiacutevel na WWW httpb2findeudateudatasetq= 62 Disponiacutevel na WWW httpsb2shareeudateu

75

da abertura dos dados governamentais ter a contribuiccedilatildeo da Diretiva Europeia as iniciativas mais bem-sucedidas referem-se a princiacutepios de transparecircncia e prestaccedilatildeo de contas e natildeo agrave Diretiva em si

A EU adotou ainda uma estrutura compreensiva para o acesso e reutilizaccedilatildeo de informaccedilatildeo geoespacial incluindo as infraestruturas eletroacutenicas atraveacutes da INSPIRE Directive63 e fomentou a disseminaccedilatildeo do patrimoacutenio cultural atraveacutes da Europeana ldquothe European digital library for cultural objectsrdquo e o acesso a informaccedilatildeo ambientalrdquo (Comissatildeo Europeia 20132)

A Diretiva 2011833EU sobre a reutilizaccedilatildeo de documentos publicados pela Comissatildeo Europeia veio autorizar salvo nas exceccedilotildees previstas a utilizaccedilatildeo comercial e natildeo comercial sem custos e sem necessidade de pedido da informaccedilatildeo produzida pela EU ou em seu nome (EUR-Lex 2011) A Diretiva estabelece as condiccedilotildees de reutilizaccedilatildeo formatos em que os documentos devem ser disponibilizados regras de custos transparecircncia e natildeo discriminaccedilatildeo

A Diretiva 201337EU veio reformular a autorizaccedilatildeo da reutilizaccedilatildeo da PSI A nova diretiva requer que a informaccedilatildeo puacuteblica seja disponibilizada ldquothrough open and machine-readable formats and together with their metadata at the best level of precision and granularity in a format that ensures interoperabilityrdquo incluindo agora entidades como bibliotecas arquivos e museus na esfera da abertura de dados (EUR-Lex 20133) Esta diretiva tornou obrigatoacuteria a disponibilizaccedilatildeo de informaccedilatildeo proveniente das entidades puacuteblicas para reutilizaccedilatildeo ao custo de reproduccedilatildeo de preferecircncia num portal e sob licenccedilas de formatos digitais O artigo 9ordm sublinha que os Estados-Membros devem fornecer instrumentos que facilitem a pesquisa de dados como inventaacuterios dos documentos com os respetivos metadados disponibilizando-os se possiacutevel em linha em formato legiacutevel por maacutequina bem como a ligaccedilatildeo entre o portal e o inventaacuterio Os objetivos passam por estimular o desenvolvimento de um mercado europeu de serviccedilos baseados na PSI melhorar o uso e aplicaccedilatildeo da PSI nos processos de negoacutecio fortalecer a competitividade no mercado interno e para resolver divergecircncias sobre regras de reutilizaccedilatildeo entre Estados Membros

De forma a promover a abertura dos seus proacuteprios dados em Junho de 2013 a EU adotou os princiacutepios do G8 Open Data Charter comprometendo-se a

Identificar e tornar disponiacuteveis os datasets fundamentais ao niacutevel da EU Identificar e tornar disponiacuteveis os datasets de alto valor ao niacutevel da EU Publicar os dados no EU Open Data Portal

63A INSPIRE Directive eacute a Diretiva 20072EC do Parlamento Europeu e do Conselho de 14 Marccedilo 2007 que veio estabelecer uma Infraestrutura para a informaccedilatildeo espacial na Comunidade Europeia Disponiacutevel na WWW httpinspireeceuropaeuinspire-legislation26

76

Aplicar os princiacutepios do G8 Open Data Charter em todos os 28 estados-membros atraveacutes da revisatildeo da Diretiva sobre a PSI e de guias de orientaccedilatildeo

Apoiar atividades consultadoria e a participaccedilatildeo Partilhar experiecircncias na aacuterea dos Dados Abertos (Comissatildeo Europeia 2013)

Em 2016 entrou em vigor o novo Regulamento Geral sobre a Proteccedilatildeo de Dados que eacute relativo ao tratamento de dados pessoais e agrave livre circulaccedilatildeo dos mesmos O regulamente veio implementar o direito de pedido de esquecimento por parte do cidadatildeo a portabilidade de dados que permite migrar dados pessoais entre sistemas ou empresas multas para os incumpridores entre outras novidades A implementaccedilatildeo do regulamento seraacute obrigatoacuteria ateacute maio de 2018 sendo as legislaccedilotildees nacionais substituiacutedas por uma regulamentaccedilatildeo europeia (EUR-Lex 2016)

A EU criou em 2012 um portal para alojar dados puacuteblicos e de investigaccedilatildeo que provecircm de organizaccedilotildees europeias ou de projetos financiados pela EU O European Union Data Portal aloja dados afetos a vinte categorias contendo 10746 datasets em Maio de 2017 com o Eurostat a assumir a lideranccedila destacada em termos de nuacutemero de datasets Os dados satildeo classificados em domiacutenios com o recurso a metadados controlados provenientes de vocabulaacuterios controlados como o EuroVoc64 com a ciecircncia (1906) emprego e condiccedilotildees de trabalho (1795) questotildees sociais (1599) a destacarem-se como os domiacutenios com mais datasets publicados Em termos de formatos de dados os primeiros trecircs lugares satildeo ocupados pelos formatos ZIP (8072) HTML (7024) e texttab-separated-values (6762) O primeiro formato estruturado o XML aparece apenas em quinto lugar com 595 ficheiros seguido do primeiro formato aberto o CSV com apenas 360 (Uniatildeo Europeia 2017) Eacute importante tecer duas consideraccedilotildees sobre os formatos dos datasets disponibilizados O formato ZIP eacute um formato de compressatildeo de documentos e natildeo um formato de documento em si portanto estes 8072 ficheiros deveratildeo ser distribuiacutedos por outros tipos de formatos Em segundo lugar verifica-se uma fraca percentagem de dados a utilizarem formatos estruturados eou abertos que permitam a ligaccedilatildeo com outros dados Este portal apresenta 2663 datasets com ligaccedilatildeo a Portugal em grande parte das categorias de Ciecircncia e do Ambiente (Uniatildeo Europeia 2017)

O Public Sector Information Scoreboard eacute uma ferramenta ldquocrowd sourcedrdquo utilizada para medir o estado da abertura de dados e da PSI da EU Este painel de avaliaccedilatildeo atraveacutes do uso de 27 indicadores mede sete aspetos da reutilizaccedilatildeo da informaccedilatildeo puacuteblica implementaccedilatildeo da Diretiva europeia referente agrave PSI praacuteticas de reuacuteso preccedilo formatos acordos exclusivos informaccedilatildeo puacuteblica local e por fim eventos e atividades (ePSI Scoreboard 2013)

64 O EuroVoc eacute um vocabulaacuterio controlado multilingue e pluridisciplinar sobre as atividades da EU Disponiacutevel na WWW httpeurovoceuropaeudrupalq=pt

77

O Open Data Monitor um projeto financiado pela Comissatildeo Europeia que decorreu entre 2013 e 2015 teve por objetivo a extraccedilatildeo harmonizaccedilatildeo mediccedilatildeo e monitorizaccedilatildeo anaacutelise e visualizaccedilatildeo automaacutetica de metadados dos datasets disponibilizados nos cataacutelogos a niacutevel regional nacional e europeu (Sasse et al 2017) Os datasets ldquoharvested from portals across Europerdquo (Sasse et al 201759) satildeo estudados atraveacutes de meacutetricas quantitativas e qualitativas (Open Data Monitor 2015) A sua plataforma permite que os utilizadores tenham uma visatildeo dos conjuntos de dados e dos 173 cataacutelogos de dados identificados apresentando os resultados em termos do nuacutemero de datasets existentes tamanho de armazenamento a sua disponibilidade a posse de uma licenccedila aberta o uso por maacutequina e por fim a exaustividade dos metadados (Open Data Monitor 2015)

O European Data Portal uma plataforma criada em 2015 pela EU tem por objetivo melhorar a acessibilidade e aumentar o valor dos Dados Abertos abrangendo toda a cadeia de valor desde a publicaccedilatildeo de dados ateacute agrave sua reutilizaccedilatildeo Para isso coleta metadados da PSI disponiacutevel em portais de dados nos paiacuteses europeus incluindo a informaccedilatildeo sobre a disponibilizaccedilatildeo de dados e os benefiacutecios de reutilizaccedilatildeo fornecendo ainda aacutereas dedicadas agrave pesquisa de datasets disponibilizaccedilatildeo de dados uso de dados treino e biblioteca de dados (Carrara et al 2016a Carrara Nieuwenhuis amp Vollers 2016 Sasse et al 2017) O European Data Portal criou o Open Data Maturity para avaliar o desenvolvimento de poliacuteticas nacionais e portais na Europa usando a informaccedilatildeo coletada para elaborar um iacutendice de maturidade das poliacuteticas de Open Data baseado na preparaccedilatildeo poliacutetica e na maturidade do portal de dados (Carrara Nieuwenhuis amp Vollers 2016) Em termos de preparaccedilatildeo poliacutetica eacute avaliada a presenccedila de uma poliacutetica de Dados Abertos especiacutefica normas de licenciamento extensatildeo da coordenaccedilatildeo a niacutevel nacional uso de dados e impacto poliacutetico social e econoacutemico A maturidade dos portais eacute avaliada de acordo com a sua usabilidade a reutilizaccedilatildeo dos dados alojados no portal e inclusatildeo de dados de diferentes domiacutenios Segundo a informaccedilatildeo apurada no relatoacuterio a maioria dos paiacuteses europeus ainda natildeo atingiram a maturidade por completo Em 2016 houve um aumento do nuacutemero de paiacuteses que completaram a sua demanda na abertura de dados sendo agora de 566 entre os 31 avaliados O nuacutemero de paiacuteses com uma poliacutetica de Dados Abertos estabelecida passou de 23 para 28 O uso de dados chegou em 2016 aos 493 e o impacto da abertura de dados aos 463 sendo que a maturidade dos portais estabeleceu-se nos 643 Contudo os paiacuteses necessitam de elevar o reconhecimento poliacutetico sobre os Dados Abertos aumentar os processos automatizados nos seus portais para aumentar a usabilidade e reutilizaccedilatildeo dos dados e tambeacutem organizar mais eventos e treinos para apoiar as iniciativas nacionais e locais (Carrara Nieuwenhuis amp Vollers 2016) O relatoacuterio conclui que os paiacuteses europeus estatildeo a enfrentar barreiras legais financeiras de qualidade de dados e de poliacuteticas sublinhando que os poliacuteticos natildeo conhecem os benefiacutecios da abertura de dados e que por isso os Dados Abertos natildeo satildeo estabelecidos como uma prioridade poliacutetica Satildeo

78

deixadas ainda algumas recomendaccedilotildees para ajudar os paiacuteses a avanccedilar no processo de abertura de dados implementar uma estrateacutegia de Dados Abertos que estimula a criaccedilatildeo de uma poliacutetica adicionar funcionalidades ao portal e melhorar a qualidade dos dados aumentar o reconhecimento sobre os Dados Abertos monitorizar as atividades relacionadas com o Open Data (Carrara Nieuwenhuis amp Vollers 2016)

22 O caso portuguecircs

O primeiro sinal de abertura cientiacutefica eacute dado pelo artigo 50ordm do Decreto-Lei nordm 1152013 de 7 de agosto veio regulamentar a obrigatoriedade da inclusatildeo de trabalhos acadeacutemicos no RCAAP sendo posteriormente reforccedilado com a entrada em vigor da Portaria nordm 2852015 de 15 de setembro que aprova o Regulamento Teacutecnico de Depoacutesito de Teses e Trabalhos de Doutoramento e de Dissertaccedilotildees e Trabalhos de Mestrado Os Dados Abertos entram finalmente na poliacutetica cientiacutefica portuguesa em 2014 A FCT definiu e adotou uma poliacutetica que visa encorajar e promover a disponibilizaccedilatildeo em ldquobases de dados de AA apropriadasrdquo dos dados cientiacuteficos e outros materiais de investigaccedilatildeo criados em projetos financiados pela instituiccedilatildeo (Fundaccedilatildeo para a Ciecircncia e Tecnologia [FCT] 2014) Contudo a poliacutetica da FCT ldquonatildeo estaacute alinhada com os requisitos relativamente aos dados de investigaccedilatildeo do H2020rdquo (Comissatildeo Executiva GT-PNCA 2016)

Os princiacutepios orientadores para uma poliacutetica nacional de Ciecircncia Aberta definidos em fevereiro de 2016 pelo Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior delinearam algumas metas a curto-prazo sendo que na componente dos Dados Abertos apenas se regista a sensibilizaccedilatildeo para a importacircncia da partilha de dados ldquocomo um valor essencial agrave ciecircncia especialmente no que respeita agrave investigaccedilatildeo beneficiaacuteria de financiamento puacuteblicordquo (Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior [MCTES] 20163) Foram tambeacutem definidas metas a atingir ateacute 2018 dentro das quais se destacam as que se referem a dados de investigaccedilatildeo

ldquoCumprimento a 100 da publicaccedilatildeo de dados resultantes de projetos com financiamento puacuteblico num repositoacuterio em acesso abertordquo

Incluir ldquoa verificaccedilatildeo contiacutenua da publicaccedilatildeo de dados e de resultados da investigaccedilatildeo financiada com fundos puacuteblicosrdquo nos modelos de avaliaccedilatildeo da CA

Eliminar o ldquoduplo financiamento de publicaccedilotildeesdados em acesso abertordquo para racionalizar os custos puacuteblicos com ciecircncia

ldquoOferta regular de accedilotildees de formaccedilatildeo e esclarecimento em mateacuteria de publicaccedilatildeo de dados e resultados de investigaccedilatildeo em acesso aberto propriedade intelectual e proteccedilatildeo de dadosrdquo (Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior [MCTES] 2016 20164)

79

O acesso aos dados de investigaccedilatildeo eacute finalmente incluiacutedo na poliacutetica cientiacutefica atraveacutes da Resoluccedilatildeo do Conselho de Ministros nordm 212016 de 11 de abril No acircmbito da definiccedilatildeo de uma poliacutetica de Ciecircncia Aberta eacute incluiacuteda a obrigatoriedade do AA aos ldquodados cientiacuteficos resultantes de investigaccedilatildeo financiada por fundos puacuteblicosrdquo e sua respetiva preservaccedilatildeo ldquopor forma a permitir a sua reutilizaccedilatildeo e o acesso continuadordquo (Resoluccedilatildeo do Conselho de Ministros nordm 212016 2016)

Em dezembro de 2016 foi criado o Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta (GT-PNCA) atraveacutes do Despacho nordm 153892016 cujo objetivo se centra na elaboraccedilatildeo de uma poliacutetica nacional de CA e onde a abertura de dados de investigaccedilatildeo eacute parte integrante A Comissatildeo Executiva do GT-PNCA foi dividida em quatro conjuntos de temas acesso aberto e dados abertos infraestruturas e preservaccedilatildeo digital avaliaccedilatildeo cientiacutefica e responsabilidade social cientiacutefica (Despacho nordm 153892016 de 12 de dezembro do Ministeacuterio das Financcedilas e da Secretaria de Estado da Cultura e Ciecircncia Tecnologia e Ensino Superior 2016)

A abertura de dados cientiacuteficos estaacute ainda numa fase precoce O primeiro relatoacuterio da Comissatildeo Executiva do Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta constatou que em termos de gestatildeo e partilha de dados existem algumas iniciativas e experiecircncias de ldquoacircmbito disciplinar nomeadamente no contexto de projetosrdquo sendo expectaacutevel que o Roteiro Nacional de Infraestruturas de Investigaccedilatildeo de Interesse Estrateacutegico traga ldquoprogressos significativosrdquo (Comissatildeo Executiva GT-PNCA 20167) O mesmo relatoacuterio sublinha que ao niacutevel das instituiccedilotildees de investigaccedilatildeo e de ensino superior as iniciativas de partilha e gestatildeo de dados satildeo quase inexistentes

Em termos de dados de investigaccedilatildeo o ecossistema eacute bem mais concentrado a niacutevel disciplinar e inferior em nuacutemero de e-infraestruturas se comparado com o ecossistema de dados do setor puacuteblico Integrado no projeto RCAAP que visa a agregaccedilatildeo de conteuacutedos cientiacuteficos produzidos no paiacutes surge em 2011 o Serviccedilo de Alojamento de Repositoacuterios de Dados Cientiacuteficos65 (SARDC) uma plataforma de livre acesso que visa agregar os dados de investigaccedilatildeo de instituiccedilotildees nacionais Poreacutem com jaacute cerca de seis anos de existecircncia o SARDC apresenta apenas 2007 datasets em Maio de 2017 que correspondem a 42 categorias de assunto Os conjuntos disponibilizados satildeo provenientes de apenas duas instituiccedilotildees o Arquivo Portuguecircs de Informaccedilatildeo Social (APIS) com 37 e o Instituto Politeacutecnico de Castelo Branco (IPCB) com 1970 conjuntos de dados sendo que o SARDC apenas aloja os dados do APIS Embora exista um espaccedilo atribuiacutedo a mais duas instituiccedilotildees o Laboratoacuterio Nacional de Engenharia Civil e Universidade Catoacutelica Portuguesa nenhuma das entidades publicou ateacute agora dados atraveacutes desta plataforma O portal nacional de dados cientiacuteficos eacute extremamente limitado em termos de funcionalidades permitindo apenas a buscar

65 Disponiacutevel na WWW httpsdadosrcaappt

80

por autor data titulo assunto e tipo de documento Natildeo eacute possiacutevel perceber a legalidade da reutilizaccedilatildeo de dados pois natildeo eacute referido qualquer tipo de licenciamento A qualidade dos dados apresentados pelo SARDC eacute uma incoacutegnita pela falta de indicaccedilatildeo do uso de formatos abertos e estruturados e tambeacutem de um esquema padratildeo de metadados Aleacutem do SARDC os repositoacuterios de dados cientiacuteficos existentes em Portugal satildeo em grande parte do domiacutenio das Ciecircncias da Vida como se poderaacute constatar no Quadro 5 com exceccedilatildeo do Repositoacuterio Cientiacutefico do Instituto Politeacutecnico de Castelo Branco que tem um caraacutecter geral Depois da criaccedilatildeo do repositoacuterio de dados cientiacuteficos e da colocaccedilatildeo em massa de conjuntos de dados verifica-se que o depoacutesito de datasets decresceu de forma extrema

Graacutefico 1 Nuacutemero de datasets publicados no SARDC nos anos seguintes agrave sua criaccedilatildeo Fonte Adaptado de SARDC (2017)

A tendecircncia de abertura de dados cientiacuteficos parece estar ligada agrave cultura disciplinar Algumas disciplinas provenientes das ciecircncias naturais e das ciecircncias exatas possuem jaacute uma estrutura uniformizada de bases de dados onde a partilha e reutilizaccedilatildeo de datasets se encontra mais avanccedilada do que se verifica nas restantes disciplinas cientiacuteficas O Registry of Research Data Repositories (re3data) indexa apenas 2 repositoacuterios de dados cientiacuteficos portugueses o INTEGRALL66 e o KiMoSys67 sendo que ambos pertencem ao ramo da biologia (DataCite 2017a) O Biosharingorg (2017) indexou cinco bases de dados cientiacuteficas com origem em Portugal havendo participaccedilatildeo portuguesa em outras duas bases de dados internacionais Estas pertencem todas ao domiacutenio das Ciecircncias da Vida e da Biologia com exceccedilatildeo de uma conotada com as Ciecircncias da Terra O DataCite68 (2017b) criou um Digital Object Identifier (DOI) para 18632 datasets relacionados com o termo Portugal sendo a grande maioria de autores portugueses e provenientes da Global Biodiversity Information Facility (GBIF) tambeacutem da aacuterea da biologia A GBIF possui um noacute

66 Disponiacutevel na WWW httpintegrallbiouapt 67 Disponiacutevel na WWW httpwwwkimosysorg 68 Os dados obtidos relativamente ao DataCite Pangea e GitHub foram obtidos atraveacutes da inscriccedilatildeo do termo Portugal na caixa de pesquisa de cada repositoacuterio

13

3 1

2 1

2012 2013 2014 2015 2016 0 2 4 6 8

10 12 14

Nordm datasets

81

portuguecircs que aloja 2681051 ocorrecircncias de biodiversidade com Portugal a fornecer de 23 conjuntos de dados que correspondem a 448136 ocorrecircncias (Portal de Dados de Biodiversidade de Portugal 2016) Destaca-se ainda os 2772 datasets sobre Portugal muitos criados por autores portugueses alojados no Pangea (2017) que preserva dados relacionados com as ciecircncias da terra e do ambiente ou o GitHub (2017) que armazena 1324 registos sobre software relacionados com o termo Portugal

Portugal tem um consoacutercio denominado ELIXIR Portugal69 que eacute constituiacutedo por quatro70 instituiccedilotildees de investigaccedilatildeo que satildeo parte da rede nacional de informaccedilatildeo bioloacutegica - BioDatapt71 O ELIXIR Portugal (2015) ldquoaims to provide data tools standards and training in this domain and thus contribute to build an ELIXIR framework that is of added-value to all woody plant based industriesrdquo O BioDatapt fornece acesso a duas bases de dados disciplinares uma ontologia para descrever experiecircncias bioloacutegicas baseadas em plantas 4 softwares e 5 conjuntos de dados

O interesse na abertura de dados de investigaccedilatildeo tem crescido no discurso poliacutetico e cientiacutefico verificando-se jaacute a organizaccedilatildeo de uma conferecircncia de dados de investigaccedilatildeo e CA72 em 2016 e de dois foacuteruns de gestatildeo de dados de investigaccedilatildeo73 o uacuteltimo jaacute em 2017 Estes eventos tecircm a chancela direta do MCTES em coorganizaccedilatildeo com a FCT a Universidade do Minho e FCCN embora esta uacuteltima apenas no caso da conferecircncia Foi lanccedilado na Faculdade de Engenharia da Universidade do Porto o projeto TAIL com o objetivo de otimizar o processo de gestatildeo de dados de investigaccedilatildeo desde a sua produccedilatildeo ateacute ao depoacutesito e partilha Este projeto a decorrer de 2016 ateacute 2019 ldquovai construir um portfoacutelio de exemplos de gestatildeo de dados em diversos domiacutenios que poderatildeo ser usados pelos investigadores para avaliar o esforccedilo requerido e as compensaccedilotildees a obter com esta atividaderdquo (Ribeiro et al 2016256-257) Os resultados seratildeo avaliados atraveacutes da utilizaccedilatildeo da plataforma Dendro ldquodesigned to help researchers use concepts from domain-specific ontologies to collaboratively describe and share datasets within their groupsrdquo (Universidade do Porto Faculdade de Engenharia 2017)

69 Este consoacutercio eacute o noacute portuguecircs de uma organizaccedilatildeo intergovernamental denominada ELIXIR que pretende reunir os recursos europeus relacionados com as ciecircncias da vida Os recursos incluem bases de dados software material de treino armazenamento na nuvem e supercomputadores Disponiacutevel na WWW httpswwwelixir-europeorgabout-us 70 As organizaccedilotildees envolvidas no BioDatapt satildeo Instituto Gulbenkian de Ciecircncia Universidade do Minho Instituto de Biologia Experimental e Tecnoloacutegica e o Instituto de Biotecnologia e Bioengenharia 71 O BioDatapt faz parte do Roteiro das Infraestruturas de Investigaccedilatildeo de Portugal Disponiacutevel na WWW httpswwwfctptapoiosequipamentoroteiro 72 A conferecircncia ldquoDados de investigaccedilatildeo e Ciecircncia Aberta rumo a uma estrateacutegia nacionalrdquo apresentou-se com o objetivo de ldquoestabelecer as linhas orientadoras da estrateacutegia nacional para os dados de investigaccedilatildeordquo Disponiacutevel na WWW httpsconfdadosrcaappt 73 O objetivo dos foacuteruns sobre gestatildeo de dados de investigaccedilatildeo eacute de desenvolver competecircncias teacutecnicas e capitalizar saberes e praacuteticas nos investigadores e comunidade cientiacutefica Disponiacutevel na WWW httpforumgdircaappt2forum

82

O RCAAP publicou em Abril de 2017 um documento de apoio agrave abertura e gestatildeo de dados de investigaccedilatildeo O ldquoKit de Dados de Investigaccedilatildeordquo tem por objetivo prestar apoio e informaccedilatildeo aos ldquogestores de repositoacuterios da comunidade RCAAPrdquo e fornecer ajuda semelhante a ldquoinvestigadores gestores de ciecircncia e outros parceiros envolvidos em atividades de suporte agrave gestatildeo de dados de investigaccedilatildeordquo (Carvalho Furtado Priacutencipe 20175) Este documento seraacute a base da formaccedilatildeo que o RCAAP iraacute disponibilizar fornecendo uma contextualizaccedilatildeo sobre Dados Abertos Big Data preservaccedilatildeo digital e informaccedilatildeo sobre ciclos de gestatildeo de dados planos de gestatildeo de dados direitos de autor licenciamento e privacidade de dados poliacuteticas e diretrizes de abertura de dados de investigaccedilatildeo recursos de apoio e aplicaccedilatildeo nos recursos RCAAP

Os dados do setor puacuteblico tecircm uma contextualizaccedilatildeo legislativa diferenciada daquela que eacute aplicada aos dados de investigaccedilatildeo O direito ao acesso agrave informaccedilatildeo puacuteblica em Portugal foi estabelecido pelo artigo 268ordm da Constituiccedilatildeo de 1976 Poreacutem apenas em 1993 o estado portuguecircs legislou no sentido da abertura dos documentos administrativos com a publicaccedilatildeo da Lei nordm 6593 de 26 de Agosto a Lei do Acesso aos Documentos Administrativos (LADA) posteriormente alterada pelas leis nordm 895 de 29 de Marccedilo e 9499 de 16 de Julho

A evoluccedilatildeo da conjuntura de acesso aos documentos administrativos eacute derivada da imposiccedilatildeo das Diretivas Europeias a que Portugal como membro da EU estaacute obrigado A Lei 462007 de 24 de Agosto viraacute revogar da Lei nordm 6593 e as suas alteraccedilotildees ldquotranspondo para a ordem juriacutedica nacional a Diretiva nordm 200398CE do Parlamento e do Conselho de 17 de Novembro relativa agrave reutilizaccedilatildeo de informaccedilotildees do sector puacuteblicordquo O artigo 24ordm postula a obrigaccedilatildeo das entidades puacuteblicas em publicar documentos administrativos de forma eletroacutenica para que possam ser acedidos e reutilizados O artigo 27ordm nordm 1 vem criar a Comissatildeo de Aceso aos Documentos Administrativos (CADA) ldquouma entidade administrativa independente que funciona junto da Assembleia da Repuacuteblica e tem como fim zelar nos termos da Lei pelo cumprimento das disposiccedilotildees legais referentes ao acesso agrave informaccedilatildeo administrativardquo (Comissatildeo de Acesso aos Documentos Administrativos [CADA])

A Resoluccedilatildeo do Conselho de Ministros nordm 912010 (20105296) veio implementar a Agenda Digital 2015 O ponto 23 da Resoluccedilatildeo no acircmbito da transparecircncia na administraccedilatildeo puacuteblica tinha como objetivo ldquodesenvolver um programa de administraccedilatildeo aberta para a publicaccedilatildeo e agregaccedilatildeo em formatos reutilizaacuteveis da informaccedilatildeo produzida pela Administraccedilatildeo Puacuteblicardquo Eacute neste sentido que eacute proposta a criaccedilatildeo do siacutetio web dadosgovpt ldquopara publicar e agregar a informaccedilatildeo produzida pela Administraccedilatildeo Puacuteblica em formatos que possam ser lidos e reutilizados por qualquer cidadatildeordquo Esta medida teve o intuito de ldquofacilitar o acesso dos cidadatildeos e empresas agrave informaccedilatildeo relevante sobre os serviccedilos puacuteblicos com o desenvolvimento de novas aplicaccedilotildees com valor acrescentadordquo A Lei nordm 362011 de 21 de Junho veio

83

estabelecer a implementaccedilatildeo de normas abertas nos sistemas informaacuteticos do Estado contribuindo assim para a adoccedilatildeo de formatos de dados abertos

Em 2016 a Lei nordm 262016 de 22 de Agosto revogou a Lei 462007 de 24 de Agosto aprovando ldquoo regime de acesso agrave informaccedilatildeo administrativa e ambiental e de reutilizaccedilatildeo dos documentos administrativos transpondo a Diretiva 20034CE do Parlamento Europeu e do Conselho de 28 de janeiro e a Diretiva 200398CE do Parlamento Europeu e do Conselho de 17 de novembrordquo O artigo 3ordm mandata a abertura dos dados ambientais agrave comunidade incluindo-os na definiccedilatildeo de documento administrativo devendo a sua publicaccedilatildeo ser feita num formato aberto e legiacutevel por maacutequina O artigo 10ordm sobre a divulgaccedilatildeo ativa de informaccedilatildeo prevecirc que sejam publicados ldquoos documentos administrativos dados ou listas que os inventariem que entendam disponibilizar livremente para acesso e reutilizaccedilatildeo nos termos da presente lei sem prejuiacutezo do regime legal de proteccedilatildeo de dados pessoaisrdquo Tambeacutem deve ser garantida a abertura da informaccedilatildeo cujo ldquoconhecimento seja relevante para garantir a transparecircncia da atividade relacionada com o seu funcionamentordquo sobretudo ao niacutevel de planos de atividades orccedilamentos relatoacuterios de atividades e contas balanccedilo social e outros instrumentos de gestatildeo similaresrdquo e tambeacutem de despachos normativos internos circulares e orientaccedilotildees que comportem enquadramento estrateacutegico da atividade administrativardquo (Lei nordm 262016 de 22 de Agosto 20162780) O artigo 23ordm apenas prevecirc a reutilizaccedilatildeo dos dados para fins educativos e para fins de investigaccedilatildeo e desenvolvimento deixando de lado a reutilizaccedilatildeo comercial Contudo o dadosgov atribuiu aos dados que aloja a licenccedila CC BY 30 o que natildeo impede a reutilizaccedilatildeo comercial dos dados Eacute tambeacutem impossiacutevel natildeo questionar a razatildeo de natildeo ter sido transposta a nova Diretiva 201337EU que veio revogar precisamente a Diretiva que a Lei nordm 262016 de 22 de Agosto implementa

A AMA (2016) defende que as poliacuteticas de Dados Abertos devem ldquoprivilegiar o interesse e pertinecircncia dos dados para o cidadatildeo em geral ou para setores da sociedade especiacuteficosrdquo Ao niacutevel local apenas Lisboa e Porto parecem ter definido uma poliacutetica de abertura de dados A Carta de Princiacutepios da Politica de Dados Abertos do Municiacutepio de Lisboa tem por objetivo aumentar o envolvimento dos cidadatildeos aumentar a transparecircncia e o desenvolvimento econoacutemico aleacutem da melhoria da eficiecircncia dos serviccedilos A Cacircmara Municipal de Lisboa (CML) (2016) compromete-se a atualizar ldquoanualmente a poliacutetica de disponibilizaccedilatildeo puacuteblica de dados abertos indicando quais os dados a libertar ao longo do ano e em que formatordquo A poliacutetica abrangeraacute todas as unidades orgacircnicas do municiacutepio que produzam dados sendo que a CML incentivaraacute as Juntas de Freguesia e as empresas municipais a publicarem os seus dados A publicaccedilatildeo de todos os dados eacute feita no portal do municiacutepio como ponto de acesso uacutenico estando disponiacuteveis sem qualquer pedido de registo A carta de princiacutepios sublinha que os dados devem ser atualizados legiacuteveis por maacutequina deter uma licenccedila aberta que permita a reutilizaccedilatildeo comercial e ainda respeitar as leis de

84

privacidade e seguranccedila A CML compromete-se a publicar inventaacuterios das coleccedilotildees de dados e a promover a reutilizaccedilatildeo de dados atraveacutes de iniciativas de estiacutemulo ao desenvolvimento de aplicaccedilotildees e participaccedilatildeo puacuteblica (Lisboa Cacircmara Municipal [CML] 2016)

A poliacutetica de Dados Abertos no Porto eacute enquadrada na Agenda Digital para a Europa tendo como visatildeo a ldquodisponibilizaccedilatildeo e uso de dados e informaccedilatildeo do Municiacutepio do Porto contribuindo deste modo para a competitividade do Municiacutepio do Porto e da regiatildeo para visitar para residir captar e realizar negoacutecios no mercado nacional e internacionalrdquo (Porto Cacircmara Municipal)

Utilizando a estrutura de avaliaccedilatildeo de poliacuteticas de Dados Abertos de Zuiderwijk e Janssen (2014) foi elaborado um quadro para avaliar o estado da implementaccedilatildeo da poliacutetica de Dados Abertos em Portugal e o seu impacto Os dados foram recolhidos com base na Lei nordm 262016 de 22 de Agosto na informaccedilatildeo disponiacutevel no portal de dados nacional atraveacutes de um gestor de projeto da AMA Andreacute Lapa e tambeacutem em alguma literatura

85

Quadro 3 Visatildeo geral sobre o contexto conteuacutedo e desempenho da poliacutetica de Dados Abertos em Portugal com base no esquema delineado por Zuiderwijk e Janssen (2014) Aspetos da poliacutetica de Dados Abertos Acircmbito de aplicaccedilatildeo

Conteuacutedo e ambiente da

poliacutetica

Paiacutes Portugal

Niacutevel de organizaccedilatildeo e tipo de missatildeo Poliacutetica nacional de cariz regulamentar que eacute aplicada a entidades governamentais e puacuteblicas (art 4ordm)

Motivaccedilotildees e objetivos Econoacutemica e poliacutetica via EU Facilitar o acesso e reutilizaccedilatildeo da informaccedilatildeo por parte dos cidadatildeos e garantir a transparecircncia da atividade administrativa (art 2ordm)

Lanccedilamento da plataforma de dados Lanccedilamento do portal nacional em 2011

Alocaccedilatildeo de recursos e contexto econoacutemico

Abertura alicerccedilada em duas instituiccedilotildees puacuteblicas a CADA responsaacutevel pelo cumprimento da lei e a AMA que fornece a e-infraestrutura e apoio teacutecnico Os custos de abertura de informaccedilatildeo do setor puacuteblico satildeo financiados pelo Plano Global Estrateacutegico para a racionalizaccedilatildeo de custos com as TIC na Administraccedilatildeo Puacuteblica (OECD 2015)

Legislaccedilatildeo Lei nordm 262016 de 22 de Agosto que transpotildee a Diretiva 200398CE

Contexto poliacutetico e social Cumprimento da Diretiva europeia Disponibilizaccedilatildeo de informaccedilatildeo uacutetil para o cidadatildeo

Aspetos da poliacutetica de Dados Abertos Acircmbito de aplicaccedilatildeo

Conteuacutedo da poliacutetica

Estrateacutegia e princiacutepios de abertura

Cumprimento do princiacutepio da administraccedilatildeo aberta que advoga que o acesso aos dados deve ser feito mediantes princiacutepios de igualdade da proporcionalidade da justiccedila da imparcialidade O acesso deve ser livre e universal bem como a acessibilidade a interoperabilidade a qualidade a integridade e a autenticidade dos dados publicados e ainda a sua identificaccedilatildeo e localizaccedilatildeo (art 2ordm) A publicaccedilatildeo de dados deve ser feita num formato aberto e legiacutevel por maacutequina (art 3ordm)

Medidas e instrumentos poliacuteticos Portal nacional Natildeo satildeo conhecidas meacutetricas de avaliaccedilatildeo nem multas ou recompensas

Processamento de dados antes da publicaccedilatildeo Validaccedilatildeo da integridade das tabelas Natildeo existe verificaccedilatildeo de metadados (Lapa 2017)

Quantidade de dados Abertos 802 Conjuntos de dados no portal nacional Mas a contabilidade eacute bastante mais elevada com a adiccedilatildeo dos dados alojados em outros portais puacuteblicos e privados

Temaacutetica dos Dados Abertos Diversa mas com maior incidecircncia na Economia e Financcedilas

Formas de apresentaccedilatildeo de dados Faacutecil acesso e compreensatildeo

Preccedilo do acesso Gratuito

Grupos-alvo Developers programadores jornalistas de dados investigadores acadeacutemicos administraccedilatildeo puacuteblica (central ou local) empresas e sociedade civil (Lapa 2017)

Padrotildees e formatos teacutecnicos Todos os dados no dadosgov estatildeo disponiacuteveis em pdf csv xlsx e atraveacutes de serviccedilos REST (que inclui formatos como odata JSON ou KML e RDF se aplicaacutevel) (Lapa 2017)

86

Aspetos da poliacutetica de Dados Abertos Acircmbito de aplicaccedilatildeo

Conteuacutedo da poliacutetica (cont)

Fornecimento de metadados Natildeo existe um esquema padratildeo de metadados a ser utilizado sendo que estes tambeacutem natildeo satildeo verificados antes da publicaccedilatildeo dos dados (Lapa 2017)

Tipos de dados natildeo publicados Desconhecido

Apoio teacutecnico para o uso de dados publicados Sim fornecido pela AMA mediante pedido

Promoccedilatildeo ativa da reutilizaccedilatildeo de dados A uacuteltima grande atividade de promoccedilatildeo de reutilizaccedilatildeo Government as a Developer ocorreu em 2014-2015 natildeo se conhecendo para novas atividades previstas (Lapa 2017)

Qualidade dos Dados A uacuteltima mediccedilatildeo data de 2014 onde foram encontrados alguns problemas que natildeo foram totalmente resolvidos junto dos fornecedores (Lapa 2017)

Licenciamento Eacute aplicada a licenccedila CC BY 30 a todos os datasets

Disponibilidade dos dados sem registo Todos os dados no dadosgov estatildeo disponiacuteveis para download sem necessidade de pedido ou registo

Estrutura da relaccedilatildeo entre fornecedores de dados e os utilizadores Limitada

Aspetos da poliacutetica de Dados Abertos Acircmbito de aplicaccedilatildeo

Indicadores de

desempenho

Uso de dados publicados Existem 2 aplicaccedilotildees elaboradas a partir de Dados Abertos disponibilizados pela AMA e Direcccedilatildeo-Geral das Autarquias Locais

Riscos da publicaccedilatildeo de dados Privacidade seguranccedila maacute utilizaccedilatildeo (ainda sem casos reportados) (Lapa 2017)

Benefiacutecios da publicaccedilatildeo de dados Fraco impacto poliacutetico econoacutemico e social segundo o Open Data Barometer O estudo de Gomes e Soares (2014) conclui que a transparecircncia eacute o uacutenico benefiacutecio real

Valor puacuteblico alcanccedilado

Transparecircncia governativa e disponibilidade de dados Faltam indicadores de reutilizaccedilatildeo e estudos de impacto para uma avaliaccedilatildeo concreta do valor alcanccedilado

Fonte Elaboraccedilatildeo proacutepria

87

Em adiccedilatildeo agraves poliacuteticas de abertura de dados puacuteblicos um dos componentes principais do ecossistema de Dados Abertos eacute o desenvolvimento de e-infraestruturas que possam alojar e permitir a livre reutilizaccedilatildeo de dados O PORDATA criado em 2010 foi o primeiro portal de dados abertos em Portugal disponibilizando dados estatiacutesticos sobre os municiacutepios portugueses sobre o paiacutes e sobre a Europa A niacutevel puacuteblico a abertura de dados em Portugal iniciou-se com a abertura do portal de dados puacuteblicos e do portal de dados de investigaccedilatildeo Criado em 2011 depois da sua aprovaccedilatildeo poliacutetica o dadosgov eacute uma responsabilidade da AMA (2016a31) e ldquoeacute o ponto central na estrateacutegia nacional de Dados Abertos constituindo-se como a porta central de acesso online ao repositoacuterio de dados abertos disponibilizados pelas vaacuterias instituiccedilotildeesrdquo puacuteblicas em Portugal Em termos estrateacutegicos o gestor de projeto Andreacute Lapa declara que a AMA jaacute assumiu a necessidade do estabelecimento de uma relaccedilatildeo forte entre portal central e portais sectoriais regionais e locais sendo que a funccedilatildeo do dadosgov deve passar por alojar dados e por apontar para dados existentes noutros portais embora esta uacuteltima ainda natildeo tenha sido implementada (A Lapa comunicaccedilatildeo pessoal 2017) Eacute possiacutevel retirar algumas conclusotildees estatiacutesticas sobre os dados disponibilizados no dadosgov Os 802 conjuntos de dados existentes pertencem a 26 fornecedores de dados diferenciados embora os dados sejam maioritariamente publicados por apenas alguns dos fornecedores com o Instituto Nacional de Estatiacutestica a fornecer metade dos dados disponibilizados como se pode ver no graacutefico seguinte

Graacutefico 2 Maiores fornecedores de dados do portal nacional Fonte AMA (2016b)

Relativamente agrave tipologia dos fornecedores de dados do portal nacional esta apresenta-se concentrada em dois tipos de entidade

328 51

129 20

86 13

38 6 34 5 33 5

Instituto Nacional de Estatiacutestica (INE) Agecircncia Modernizaccedilatildeo Administrativa (AMA) Portal do SNS (Aacuterea da Transparecircncia) Direcccedilatildeo-Geral das Autarquias Locais (DGAL) Fundaccedilatildeo para a Computaccedilatildeo Cientiacutefica Nacional (FCCN) Comissatildeo Nacional de Eleiccediloes (CNE)

88

Graacutefico 3 Tipologia dos fornecedores de dados do portal nacional Fonte AMA (2016b)

Em termos de categorias de dados disponibilizados verifica-se uma maior dispersatildeo embora a Economia e Financcedilas assumam 13 dos dados existentes

Graacutefico 4 Tipologia das categorias de dados do portal nacional Fonte AMA (2016b)

O ecossistema de abertura de dados tem aumentado dentro e fora do espectro poliacutetico Aleacutem do portal nacional de dados puacuteblicos um grande nuacutemero de organizaccedilotildees puacuteblicas tem criado os seus portais de dados eou tem publicado os mesmos no dadosgov Por outro lado existem vaacuterios portais de dados com origem na sociedade civil com o selo da Transparecircncia Hackday Portugal74 Organizar eventos eacute

74 Transparecircncia Hackday Portugal eacute um movimento que nasceu no Porto e rdquose define como um grupo de trabalho entusiasmado com informaccedilatildeo puacuteblica dados abertos e as interaccedilotildees possiacuteveis entre

468 59

21 3

300 38 Entidades puacuteblicas Corpos de supervisatildeo

Municipalidades

Entidades governamentais

281 36

102 13 86 11 67 9

60 8 58 7

51 6

34 4 24 3 12 2

10 1 2 0

2 0

Economia e Financcedilas

Governo Eleiccedilotildees e Assuntos Parlamentares Sauacutede

Estatiacutesticas Gerais

Educaccedilatildeo Ciecircncia e Tecnologia

Administraccedilatildeo Local

Outras

Emprego e Seguranccedila Social

Justiccedila e Tribunais

Ambiente Geografia e Ordenamento Transportes Infra-estruturas e Telecomunicaccedilotildees Agricultura e Pescas

Cultura

89

uma forma de promover o reconhecimento nacional sobre a abertura de dados entre organizaccedilotildees e cidadatildeos (Carrara Nieuwenhuis amp Vollers 2016) Em Portugal tecircm existido diversas iniciativas a este niacutevel hackathons como o Date with Data organizados pela Transparecircncia Hackday Portugal e com o apoio da Open Knowledge Portugal com o intuito de alertar informar e formar a comunidade para este novo paradigma na disponibilizaccedilatildeo da informaccedilatildeo A Open Knowledge Portugal organiza em Lisboa o Lisbon Open Data Maker Night75 tendo em 2017 decorrido a terceira ediccedilatildeo A Porto Digital estaacute a organizar um hackathon76 sobre utilizaccedilatildeo de dados abertos no desenvolvimento de novas aplicaccedilotildees que ocorreraacute em Julho de 2017

Verifica-se tambeacutem que as entidades governamentais estatildeo a apostar na criaccedilatildeo de linhas de orientaccedilatildeo para abertura e gestatildeo de dados puacuteblicos A AMA criou em 2016 um guia de Dados Abertos para apoiar a abertura dos dados puacuteblicos O guia centra-se em quatro eixos

Definiccedilatildeo de Dados Abertos e enunciaccedilatildeo dos seus benefiacutecios bem como as questotildees de privacidade

Potencial dos Dados Abertos a niacutevel econoacutemico e no aumento da transparecircncia e da participaccedilatildeo ciacutevica

Estrateacutegia de abertura que aborda o planeamento escolha de dados tipos de utilizadores dados prioritaacuterios disponibilizaccedilatildeo de dados estrateacutegias de divulgaccedilatildeo e manutenccedilatildeo de dados

Princiacutepios que possibilitem a reutilizaccedilatildeo de dados como os formatos e as licenccedilas abertas aleacutem da forma de as escolher e publicar a estrutura de dados e metadados (AMA 2016a traduccedilatildeo livre)

A AMA assume a publicaccedilatildeo de dados como um compromisso com o cidadatildeo devendo a publicaccedilatildeo ser orientada por princiacutepios que potenciem a reutilizaccedilatildeo dos dados A disponibilizaccedilatildeo de dados deve abranger conjuntos de dados constantes ou sem continuidade regular e conjuntos de dados em seacuterie ou seja com continuidade temporal A relevacircncia dos dados eacute justificada quando ldquotem potencial para ser explorado por um grande nuacutemero de utilizadores ou quando o benefiacutecio potencial da sua utilizaccedilatildeo eacute elevadordquo (AMA 2016a20)

As duas principais cidades portuguesas Lisboa e Porto tecircm abordagens distintas relativamente agraves suas estrateacutegias de abertura de dados Lisboa possui uma parceria com a AMA e disponibiliza no seu portal77 ldquodatasets sobre a cidade nas mais diversas aacutereas de modo a potenciar a sua utilizaccedilatildeo em trabalhos de investigaccedilatildeo ou no tecnologia e cidadaniardquo O Transparecircncia Hackday Portugal estaacute envolvido em vaacuterios projetos de abertura de dados entre os quais se destacam a Central de Dados e a Democratica Disponiacutevel na WWW httpwwwtransparenciahackdayorgacerca 75 Disponiacutevel na WWW httpflipsideorgnotesopen-data-maker-night-III 76 Disponiacutevel na WWW httpshackacityeuporto 77 Disponiacutevel na WWW httpdadosabertoscm-lisboapt

90

desenvolvimento de aplicaccedilotildees informaacuteticasrdquo (Soares Baptista e Lima 201517) Os dados disponibilizados no portal ldquosatildeo produzidos no acircmbito de sistemas de informaccedilatildeordquo que pertencem a diversos organismos registando-se jaacute diversas aplicaccedilotildees78 que utilizam esses dados para criar valor para o cidadatildeo e visitante de Lisboa na aacuterea do turismo ambiente urbanismo (Soares Baptista e Lima 201518) Lisboa implementou tambeacutem o programa Smart Open Lisboa que visa dar apoio a start ups na validaccedilatildeo de ldquosolutions using real data in a live environment and work directly with your potential customers or partnersrdquo O apoio eacute dirigido a soluccedilotildees na aacuterea da mobilidade envolvimento dos cidadatildeos turismo cultura e sustentabilidade (Lisboa Cacircmara Municipal 2016) A estrateacutegia do Porto passa pela promoccedilatildeo de conjuntos de Application Programming Interface (API)79 permitindo a disponibilizaccedilatildeo de alguns serviccedilos na web como a disponibilizaccedilatildeo de ldquoconteuacutedos dos Portal de Turismordquo ou do BDRT80 entre outros que indica pontos de interesse na cidade A abertura de dados eacute centrada na ldquodimensatildeo turismo e negligencia pelo menos aparentemente as restantesrdquo (Soares Baptista e Lima 201518) Esta conclusatildeo pode ser reforccedilada com a anaacutelise do portal de dados do Porto onde apenas constam cinco conjuntos de dados sendo estes pertencentes ao turismo ou relacionados numa perspetiva de visita ou mudanccedila como enuncia a estrateacutegia de abertura de dados publicada pelo municiacutepio

O Porto Lisboa Fundatildeo Palmela Penela e Aacutegueda estatildeo entre as cidades que integram o Open and Agile Smart Cities (OASC) (2017) uma iniciativa com o objetivo de desenvolver mercados para as cidades inteligentes baseados nas necessidades das cidades e das comunidades O Porto eacute destaque nesta iniciativa pela utilizaccedilatildeo da tecnologia FIWARE81 que ajuda a melhorar o uso de dados abertos e a partilha conhecimentos e tecnologias entre cidades A FIWARE (2015) sintetizou o impacto da abertura de dados em tempo real no Porto ldquoImagine walking or driving through a city and the city itself tells you which trendy spots to check out where to park your car in that moment or which areas to avoid because of air quality or traffic congestionrdquo Na realidade a cidade do Porto jaacute consegue comunicar com os residentes turistas ou empresas que utilizem ldquoFIWARE standards and the UrbanSense platform82rdquo

A publicaccedilatildeo de Dados Abertos e a respetiva mediccedilatildeo de impacto podem ser avaliadas atraveacutes das vaacuterias iniciativas que visam medir o estado de abertura de dados 78 As aplicaccedilotildees referidas satildeo SPOT in Lisbon Lisboa Verde Lisboa NAV e Lisboa 360 79 De acordo com a Wikipeacutedia uma API eacute um conjunto de definiccedilotildees protocolos e ferramentas para construir aplicaccedilotildees de software Disponiacutevel em httpsenwikipediaorgwikiApplication_programming_interface 80 Disponiacutevel na WWW httpbdrtcm-portoptpt 81 A missatildeo da FIWARE eacute construir um ldquosustainable ecosystem around public royalty-free and implementation-driven software platform standards that will ease the development of new Smart Applications in multiple sectorsrdquo Disponiacutevel na WWW httpswwwfiwareorgabout-us 82 A plataforma Urbansense estaacute integrada no projeto futurecitiesup da Universidade do Porto sendo uma plataforma para a monitorizaccedilatildeo ambiental nas cidades composta por 20 unidades que coletam dados em pontos relevantes da cidade Disponiacutevel na WWW httpfuturecitiesupptsitehybrid-sensor-networking-testbed

91

algumas das quais jaacute mencionadas permitindo assim retirar conclusotildees especiacuteficas quanto ao estado dos Dados Abertos em Portugal A anaacutelise feita por Soares Baptista e Lima (2015) sobre a abertura de dados em quatro cidades do norte do paiacutes Braga Barcelos Guimaratildees e Vila Nova de Famalicatildeo concluiu que a disponibilizaccedilatildeo de dados ao niacutevel local eacute feita apenas ao niacutevel de ldquocontratos municipais orccedilamento anual gastos resultados eleitorais qualidade do ar horaacuterios de transporte orccedilamento participativo e lista de empresasrdquo A abertura de dados destas categorias eacute feita com a ajuda da ldquoadministraccedilatildeo central e algumas instituiccedilotildees transversais ao territoacuteriordquo sendo que existem aacutereas onde nenhum dos municiacutepios analisados possuiu Dados Abertos como os ldquotransportes em tempo real instalaccedilotildees puacuteblicas estatiacutesticas criminais seguranccedila e higiene alimentar acidentes de tracircnsito permissotildees de construccedilatildeo requisiccedilotildees de serviccedilos e licenccedilas comerciaisrdquo (Soares Baptista e Lima 201522) O estudo revela ainda que as cidades analisadas tecircm a maior taxa de abertura no Open Data Census pelo facto de serem a uacutenicas onde a informaccedilatildeo estaacute completa pois os resultados obtidos no estudo foram registados no censo

O Portal da Transparecircncia Municipal eacute uma ferramenta que permite avaliar vaacuterios indicadores da governaccedilatildeo dos municiacutepios portugueses com o recurso agrave disponibilizaccedilatildeo de dados estatiacutesticos Os indicadores abordam a gestatildeo financeira e administrativa decisotildees fiscais dinacircmica econoacutemica do municiacutepio serviccedilos municipais e participaccedilatildeo eleitoral autaacuterquica (Portugal Governo 2017) Contudo a disponibilidade de dados em cada indicador natildeo eacute totalmente uniforme em termos temporais e registam-se algumas falhas de coleta ou cedecircncia de dados

O Open Data Census83 responsabilidade da OKI coleta informaccedilatildeo sobre a performance de cada paiacutes e respetivas cidades em termos de abertura de dados acessibilidade disponibilidade licenciamento processamento por maacutequina e transparecircncia Existem dados de 2014 para Portugal com um total de 178 datasets provenientes de 51 cidades distribuiacutedos por aacutereas como a qualidade do ar transportes orccedilamentos contratos puacuteblicos despesas e eleiccedilotildees sendo Braga e Guimaratildees as cidades mais abertas Contudo apenas um desses conjuntos de dados possui a totalidade da abertura desejada (OKI 2014) Para 2015 e 2016 natildeo satildeo apresentados resultados relativos agrave abertura de dados nas cidades portuguesas

O Global Open Data Index eacute um iacutendice que mede o estado de abertura dos dados governamentais ao niacutevel global Este iacutendice coleta informaccedilatildeo sobre a abertura dos dados governamentais desde 2013 ano em que Portugal se encontrava no 16ordm lugar em 60 paiacuteses com uma taxa de abertura84 calculada em 56 Em 2014 Portugal desce

83 Disponiacutevel na WWW httpcensusokfnorgenlatest 84 O Global Open Data Index considera 9 criteacuterios na sua avaliaccedilatildeo para os dados serem denominados totalmente abertos Licenccedila aberta dados em formatos que sejam processaacuteveis por maacutequinas acesso sem custos disponibilidade do dataset completa para download disponibilizaccedilatildeo de forma raacutepida e

92

para o 36ordm lugar em 97 paiacuteses registando uma taxa de abertura para 47 Em 2015 nova descida do paiacutes no ranking ateacute ao 54ordm lugar num total de 122 paiacuteses com uma taxa de abertura estimada em 34 Para o ano de 2016 as categorias das estatiacutesticas nacionais limites administrativos e aquisiccedilotildees possuem a taxa de abertura mais elevada apenas indicando como falha o licenciamento mas que implica que nenhum dos datasets seja verdadeiramente aberto A taxa de abertura calculada situa-se agora nos 37 com Portugal a subir para 46ordm lugar (OKI 2017)

O Public Sector Information Scoreboard coloca Portugal em 25ordm lugar num total de 31 paiacuteses pontuados sendo alguns destes resultados obtidos com base na LADA cuja uacuteltima revisatildeo data de 1999 Este painel de avaliaccedilatildeo destaca pela positiva as praacuteticas de reutilizaccedilatildeo os formatos os acordos exclusivos e os eventos e atividades Pela negativa destaca a publicaccedilatildeo de informaccedilatildeo puacuteblica local a natildeo implementaccedilatildeo da Diretiva europeia (ePSI Scoreboard 2013) o que natildeo corresponde agrave realidade pois a Lei nordm 462007 de 24 de agosto entretanto revogada pela Lei nordm 262016 de 22 de agosto transpocircs para a ordem juriacutedica nacional a Diretiva nordm 200398CE

O Open Data Barometer coloca Portugal em 2016 no 34ordm lugar do ranking entre 92 paiacuteses caindo trecircs posiccedilotildees relativamente a 2015 Destaca-se pela positiva a prontidatildeo da publicaccedilatildeo de dados com 58 e pela negativa o impacto poliacutetico econoacutemico e social da abertura com apenas 16 com uma meacutedia total de 42 de abertura Eacute assinalada a maior abertura de dados geograacuteficos censos transportes puacuteblicos comeacutercio internacional desempenho do setor da sauacutede estatiacutesticas sobre educaccedilatildeo crimes ambiente e informaccedilatildeo sobre contratos puacuteblicos No sentido oposto a posse de terras informaccedilatildeo orccedilamental e gastos governamentais o registo de empresas legislaccedilatildeo e resultados de eleiccedilotildees satildeo apontados como os dados com menos abertura (World Wide Web Foundation 2017)

O Open Data Maturity divide os paiacuteses em vaacuterios segmentos liacutederes seguidores raacutepidos seguidores e iniciantes Portugal encontra-se no grupo dos seguidores o que indicia o desenvolvimento de uma poliacutetica baacutesica de Dados Abertos e um portal com funcionalidades avanccediladas O impacto da abertura de dados eacute baixo verificando-se apenas resultados positivos na transparecircncia e eficiecircncia poliacutetica Ao niacutevel social eacute denotado um baixo impacto praticamente nulo na sustentabilidade ambiental e na inclusatildeo de grupos marginalizados A niacutevel econoacutemico apenas a aplicaccedilatildeo do modelo de custo marginal para a abertura de dados merece destaque Em termos de preparaccedilatildeo para a abertura de dados Portugal desce de pontuaccedilatildeo em relaccedilatildeo a 2015 o que eacute explicado pela fase de transiccedilatildeo para uma nova estrateacutegia de Dados Abertos Jaacute a maturidade do portal nacional cresceu mais de 20 em 2016 rondando agora os 70 Segundo os dados recolhidos pelo Open Data Maturity o uso de Dados Abertos

imediata disponibilidade dos dados sem conexatildeo agrave internet disponibilizaccedilatildeo dos dados em formato digital disponibilidade puacuteblica dos dados e por fim a confirmaccedilatildeo da existecircncia dos dados

93

em 2016 em Portugal decaiu ligeiramente em relaccedilatildeo ao ano anterior rondando os 35 O estudo indica que o paiacutes natildeo tem uma poliacutetica de Dados Abertos e que apenas vai transpor a Diretiva europeia em 2016 apesar de jaacute o ter feito na Lei nordm 462007 de 24 de agosto sendo mencionado que a estrateacutegia a 5 anos estaacute a ser revista (Carrara Nieuwenhuis amp Vollers 2016) O Open Data Maturity aponta diversas barreiras em termos de publicaccedilatildeo de dados como a falta de apoio politico para a abertura de dados valiosos e relevantes a falta de recursos humanos teacutecnicos e financeiros e falta de conhecimentos relativos a padrotildees e boas praacuteticas de partilha de dados puacuteblicos O relatoacuterio afirma que ldquosome countries have a policy framework that does not necessarily require them to add a specific licence per data setrdquo apontando Portugal entre outros paiacuteses como exemplo (Carrara Nieuwenhuis amp Vollers 201624) Contudo a consulta dos avisos legais do portal dadosgov indica que todos os conjuntos de dados disponibilizados possuem uma licenccedila aberta Creative Commons Atribuiccedilatildeo 30 Portugal (CC-BY) (AMA 2016b)

O projeto Open Data Inventory (ODIN) monitoriza o progresso das poliacuteticas de abertura dos dados puacuteblicos medindo o seu sucesso e impacto e fornece suporte agrave implementaccedilatildeo de sistemas de dados Fruto deste acompanhamento o ODIN desenvolveu um ranking global com vista a avaliar a cobertura da abertura de dados e a abertura em si De acordo com os resultados de 2016 Portugal situa-se em 15ordm lugar entre os 173 paiacuteses cujas poliacuteticas de abertura de dados puacuteblicos foram avaliadas com uma cobertura de 58 e abertura de 75 perfazendo um total calculado de 67 Este ranking foi obtido depois da avaliaccedilatildeo da abertura de estatiacutesticas sociais (62) econoacutemicas (70) e ambientais (69) retirados do siacutetio web do Instituto Nacional de Estatiacutestica (INE) (Open Data Watch 2016)

Uma iniciativa de avaliaccedilatildeo dos programas de abertura da informaccedilatildeo do setor puacuteblico da OECD (2015b) fornece informaccedilatildeo uacutetil relativa ao estado dos Dados Abertos em Portugal Segundo esta organizaccedilatildeo os custos de abertura de informaccedilatildeo do setor puacuteblico satildeo financiados como parte do Plano Global Estrateacutegico para a racionalizaccedilatildeo de custos com tecnologias de informaccedilatildeo e comunicaccedilatildeo na Administraccedilatildeo Puacuteblica A legibilidade de dados por maacutequina eacute apontada como uma falha na avaliaccedilatildeo teacutecnica da abertura embora Andreacute Lapa da AMA tenha confirmado que todos os dados existentes no portal dadosgov tecircm essa caracteriacutestica (A Lapa comunicaccedilatildeo pessoal 27 Marccedilo 2017) Os resultados satildeo muitos positivos em termos de formatos abertos com a totalidade dos dados a deter esse estatuto e tambeacutem na interoperabilidade onde a OECD indica que esta caracteriacutestica teacutecnica iraacute ser implementada como obrigatoacuteria A niacutevel de licenciamento em Portugal eacute atribuiacuteda a Licenccedila CC BY 30 agrave totalidade de dados alojados no portal nacional (OECD 2015b AMA 2016b)

Referindo-se a dados de 2015 o portal do Open Data Monitor indica que apenas foi indexado um portal de dados em Portugal com um total de 656 datasets disponiacuteveis

94

sem contudo indicar qual Em termos de resultados apurados eacute indicado que Portugal apenas cumpre no capiacutetulo da exaustividade (50) tendo os campos da disponibilidade uso por maacutequina e do licenciamento aberto com uma percentagem de 0 o que explicaraacute os 13 de qualidade global atribuiacutedos pelo Open Data Monitor

Em Maio de 2017 o cataacutelogo do European Data Portal oferece o acesso a um total 633680 datasets provenientes de 34 paiacuteses europeus Portugal ocupa o 18ordm lugar com um total de 1635 conjuntos de dados disponibilizados oriundos dos trecircs portais indexados o dadosgovpt o portal do Sistema Nacional de Informaccedilatildeo de Ambiente (SNIAmb) e o Lisboa Aberta (European Data Portal 2017) Verifica-se uma discrepacircncia entre o nuacutemero de datasets disponibilizados no cataacutelogo do European Data Portal e o nuacutemero real existente nos cataacutelogos dos portais mencionados O portal dadosgovpt apresenta 802 conjuntos de dados no cataacutelogo (AMA 2016) enquanto o European Data Portal assinala 832 datasets O SNIAmb regista um total de 1991 datasets (Agecircncia Portuguesa do Ambiente 2017) contra os 439 indexados pelo European Data Portal Apenas os nuacutemeros referentes ao portal Lisboa Aberta satildeo coincidentes com o registo de 364 conjuntos de dados (Lisboa Cacircmara Municipal 2017)

Num estudo comparativo de seis iniciativas do norte e do sul da Europa Gomes e Soares (2014) analisaram diversos indicadores relativos aos portais de dados nacionais como o cumprimento dos princiacutepios de abertura de dados governamentais o niacutevel de atividade do portal e os benefiacutecios observaacuteveis da abertura de dados Segundo este estudo o portal portuguecircs tem nota eacute positiva no cumprimento dos princiacutepios de abertura A anaacutelise da atividade do portal eacute negativa com a atividade dos visitantes o desenvolvimento de aplicaccedilotildees a atividade geradora de novo conhecimento e a utilizaccedilatildeo de recursos do portal a serem classificadas como pobres Neste indicador apenas a atividade dos fornecedores no portal eacute satisfatoacuteria Em termos de benefiacutecios observaacuteveis da abertura de dados governamentais o estudo apenas regista bons niacuteveis de transparecircncia governativa enquanto a participaccedilatildeo puacuteblica a inovaccedilatildeo e o empreendedorismo e a eficiecircncia governativas natildeo revelam impactos satisfatoacuterios

Portugal possui ainda o Iacutendice de Transparecircncia Municipal (ITM) (2016) que mede o grau de transparecircncia das Cacircmaras Municipais atraveacutes de uma anaacutelise da informaccedilatildeo disponibilizada nas suas paacuteginas web O ITM eacute composto por 76 indicadores divididos em sete dimensotildees85 contudo este iacutendice eacute baseado no tipo de dados disponibilizados e natildeo em que contexto de abertura estes foram publicados

O cruzamento da informaccedilatildeo obtida atraveacutes das vaacuterias iniciativas de avaliaccedilatildeo da abertura de dados permite inferir algumas conclusotildees e revelar algumas disparidades

85 As dimensotildees satildeo Informaccedilatildeo sobre a Organizaccedilatildeo Composiccedilatildeo Social e Funcionamento do Municiacutepio Planos e Relatoacuterios Impostos Taxas Tarifas Preccedilos e Regulamentos Relaccedilatildeo com a Sociedade Contrataccedilatildeo Puacuteblica Transparecircncia Econoacutemico-Financeira Transparecircncia na aacuterea do Urbanismo Disponiacutevel na WWW httpstransparenciaptprojetosindice-de-transparencia-municipal

95

O Open Data Barometer e o Open Data Maturity apontam o baixo impacto econoacutemico e social da abertura de dados em Portugal Gomes e Soares (2014) concluem que o problema em Portugal natildeo eacute quantidade de dados disponibilizados mas sim a quantidade de dados que satildeo reutilizados e como satildeo reutilizados O Public Sector Information Scoreboard e o Open Data Maturity afirmam que Portugal natildeo possui uma poliacutetica de Dados Abertos o que como vimos natildeo corresponde agrave verdade Entre as vaacuterias iniciativas de avaliaccedilatildeo do estado de abertura de dados apenas trecircs publicaram informaccedilatildeo relativa a 2016

Quadro 4 Comparaccedilatildeo dos resultados de abertura de dados atribuiacutedos pelas vaacuterias iniciativas de avaliaccedilatildeo Iniciativa Ranking Taxa de Abertura

Global Open Data Index 46ordm122 Paiacuteses 37

Open Data Barometer

34ordm114 Paiacuteses 42

Open Data Inventory 15ordm173 Paiacuteses 67

Fonte Elaboraccedilatildeo proacutepria

Apesar da equivalecircncia de ranking e taxa de abertura entre duas das iniciativas eacute redundante inferir qualquer conclusatildeo dado que estas natildeo medem o mesmo nuacutemero paracircmetros nem estes coincidem na maioria dos casos O Open Data Inventory refere-se a dados avaliados apenas do portal do INE para calcular a sua taxa de abertura pelo que tambeacutem deve ser relativizado

Como pontos positivos satildeo apontados a abertura de dados de diferentes domiacutenios o fato de todos os dados disponibilizados no portal estarem num formato processaacutevel por maacutequina (Carrara Nieuwenhuis amp Vollers 2016) ao contraacuterio do que afirma a OECD (2015b) e o Open Data Inventory Apesar de a AMA natildeo deter dados concretos do impacto da reutilizaccedilatildeo de dados existentes no dadosgov existem pelo menos 2 aplicaccedilotildees Mapa do Cidadatildeo e Portal da Transparecircncia Municipal que utilizam dados do portal como fonte da informaccedilatildeo que disponibilizam (Lapa 2017) O Open Data Goldbook for Data Holders and Data Managers faz referecircncia a Portugal como um exemplo de boas praacuteticas ao niacutevel da abertura dos dados governamentais destacando a aplicaccedilatildeo moacutevel e a plataforma online86 da AMA que permite aos cidadatildeos aceder a um mapa que conteacutem a localizaccedilatildeo de todos os serviccedilos puacuteblicos (Carrara et al 2016a) A Infraestrutura de Dados Espaciais do Algarve disponibiliza atraveacutes do seu portal acesso a quatro aplicaccedilotildees87 que reutilizam Dados Abertos para fornecer informaccedilatildeo de acircmbito regional os cidadatildeos

86 Disponiacutevel na WWW httpswwwmapadocidadaopt 87 As aplicaccedilotildees satildeo ldquoSiacutetios Lugares e Ruasrdquo ldquoCarta Regional de Equipamentordquo ldquoReserva Ecoloacutegica Nacionalrdquo e ldquoPlanos Municipais de Ordenamento de Territoacuteriordquo Disponiacutevel na WWW httpidealgccdr-algptaplicacoesaspx

96

Relativamente agrave usabilidade do portal o Open Data Maturity refere que natildeo eacute possiacutevel contribuir para o portal o que parece natildeo corresponder agrave realidade Citando Andreacute Lapa da AMA organizaccedilatildeo responsaacutevel pelo portal nacional existem fornecedores com acesso direto ao backoffice e que publicam os seus dados (Lapa 2017) embora o mesmo natildeo se verifique relativamente aos cidadatildeos O Open Data Maturity avalia tambeacutem a usabilidade de dados referindo que natildeo eacute possiacutevel saber a maioria dos formatos dos ficheiros existentes no portal nacional Recorrendo agrave informaccedilatildeo disponibilizada por Lapa (2017) todos os dados no dadosgov estatildeo disponiacuteveis em pdf csv xlsx e atraveacutes de serviccedilos REST incluindo assim formatos como odata JSON ou KML e RDF se aplicaacutevel A disponibilizaccedilatildeo dos formatos enunciados garante que todos os dados que o portal disponibiliza cumprem pelo menos as 3 estrelas da classificaccedilatildeo de Tim Berners-Lee (Lapa 2017) O Open Data Maturity afirma ainda que natildeo existe uma licenccedila atribuiacuteda contudo a AMA (2016b) enuncia que todos os seus dados estatildeo disponiacuteveis com uma licenccedila CC BY 30 O portal dadosgov possui algumas funcionalidades como a disponibilizaccedilatildeo de uma API que permite efetuar consultas baacutesicas relativas ao cataacutelogo de dados e tem capacidades de coleta automatizada para o caso dos dados disponibilizados atraveacutes de web services sendo que os restantes satildeo atualizados de forma manual (Lapa 2017)

Em Maio de 2017 contabilizam-se 60 portais de dados abertos em Portugal distribuiacutedos por uma variada gama de aacutereas Foi elaborado um quadro com dados recolhidos atraveacutes desses portais para tentar identificar as e-infraestruturas que disponibilizam Dados Abertos que cumprem os requisitos inscritos na Open Definition nomeadamente em termos de licenccedila legibilidade por maacutequina esquema de metadados padratildeo e formatos abertos Todos os conjuntos de dados tecircm acesso gratuito atraveacutes da web razatildeo pela qual esse requisito natildeo foi incluiacutedo no quadro de avaliaccedilatildeo Atraveacutes deste quadro foi possiacutevel retirar algumas conclusotildees Existem apenas 11 portais de dados de investigaccedilatildeo com os restantes 49 a conter dados do setor puacuteblico Os dados estatiacutesticos satildeo os grandes dominadores do panorama nacional com 13 siacutetios web seguidos dos dados econoacutemicos com 6 Dos 60 portais analisados apenas 33 disponibilizam dados legiacuteveis por maacutequina sendo que alguns portais natildeo o fazem totalmente Apenas 16 portais indicam usar uma licenccedila aberta que permita a livre reutilizaccedilatildeo dos dados e apenas 3 fornecem a indicaccedilatildeo do padratildeo de metadados usado embora alguns dos portais pareccedilam usar um esquema proacuteprio de descriccedilatildeo de datasets Existem 17 portais que fornecem dados em formatos estruturados e 17 portais que natildeo utilizam formatos abertos ou natildeo indicam sequer o tipo de formato

97

Quadro 5 Portais de dados abertos existentes em Portugal

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Repositoacuterio de dados cientiacuteficos

RCAAP FCTFCCN Acadeacutemico 2007 IPCB ndash CC BY-NC APIS ndash CC BY 30 Sim Sem indicaccedilatildeo

IPCB ndash XLS APIS - PDF XML SAV

Repositoacuterio Cientiacutefico do Instituto Politeacutecnico de

Castelo Branco

IPCB Acadeacutemico 1970 CC BY-NC Sim Sem indicaccedilatildeo XLS

Qualidade da aacutegua da Albufeira do Roxo na

dinacircmica dos solos e das culturas agriacutecolas

Assoc Benefic do Roxo Inst

Politeacutecnico de Beja Univ Eacutevora

Agricultura Recursos Hiacutedricos

10 Sem licenccedila especiacutefica Sim ISO-19139

Metadata CSV KML Shapefile

Portal de dados da biodiversidade de Portugal

Instituto Superior de Agronomia

Biologia 23 CC BY 30 CC BY-NC 30

Sem indicaccedilatildeo

Esquema proacuteprio Sem indicaccedilatildeo

Biodatapt ELIXIR Portugal Biologia 5 Sem indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo Vaacuterios

Yeastract Inst Superior Teacutecnico - Lisboa

Ciecircncias da Vida Biologia

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

Cork Oak DB Instituto

Gulbenkian de Ciecircncia

Ciecircncias da Vida Biologia

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo HTML

Mitobreak Universidade do Porto

Ciecircncias da Vida Biologia

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

Haeckaliens Instituto

Gulbenkian de Ciecircncia

Ciecircncias da Vida Biologia

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Vaacuterios

Integrall Univ Aveiro Ciecircncias da Vida Biologia 8843 Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

Kymosys INESC-ID Lisboa Ciecircncias da Vida Biologia 42 CC BY 40 Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

98

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Geodados CM Lisboa Informaccedilatildeo Geograacutefica 257 PDDL Sim Esquema

proacuteprio CSV KLM

iGEO APA DGTerritoacuterio Informaccedilatildeo Geograacutefica 99 Sem indicaccedilatildeo Sem

indicaccedilatildeo Esquema proacuteprio HTML

IDEAlg CCDR Algarve Informaccedilatildeo Geograacutefica

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

Mapa de Obras ndash Portal do Muniacutecipe De Vila do Bispo

CM Vila do Bispo Autaacuterquico Informaccedilatildeo geograacutefica Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Aplicaccedilatildeo web

Portal de Dados Abertos do Porto

CM Porto Autaacuterquico 5 CC BY Sim Esquema proacuteprio SHP XLS

Lisboa Aberta CM Lisboa Autaacuterquico 365 CC0 e CC BY Sim (natildeo a 100)

Esquema proacuteprio

Diversos a maioria satildeo estruturados

Dados Abertos Aacutegueda CM Aacutegueda Autaacuterquico 47 CC0 CC BY-SA e CC BY

Sim (natildeo a 100)

Esquema proacuteprio

Diversosnem todos satildeo estruturados

SNIAmb APA Ambiente 1991 Sem indicaccedilatildeo Sim Esquema proacuteprio XML

SNIRH APA Ambiente

Recursos Hiacutedricos

7210 Resultados Sem indicaccedilatildeo Sim Sem indicaccedilatildeo CSV TSV

DadosGov AMA Agregador de Dados 802 CC BY 30 Sim Esquema

proacuteprio Diversos a maioria satildeo estruturados

Dados Abertos BNP Biblioteca Nacional Bibliograacutefico 12 CC0 10 Sim UNIMARC

Dublin Core Mods

RDF XML RDF TURTLE e Dublin Core XML

Simplex + - Dados Abertos AMA Burocraacutetico

Serviccedilos Puacuteblicos

1

Sem licenccedila especiacutefica autoriza

a reproduccedilatildeo de conteuacutedos

Sim Sem indicaccedilatildeo JSON

Mapa do Cidadatildeo AMA Burocraacutetico

Serviccedilos Puacuteblicos

Informaccedilatildeo geograacutefica Sem indicaccedilatildeo Sim Sem indicaccedilatildeo Aplicaccedilatildeo web e

moacutevel

99

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Instituto Nacional de Estatiacutestica

INE Estatiacutesticas Nacionais 8340

CC BY 30 (nos dados existentes no

dadosgov) Sim Esquema

proacuteprio XLS CSV

Estatiacutesticas Cultura GEPAC Cultura Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica autoriza a reproduccedilatildeo natildeo

comercial de conteuacutedos

Natildeo Sem indicaccedilatildeo PDF

AICEP - Estatiacutesticas AICEP Comeacutercio e Investimento

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo PDF

BPStat Banco de Portugal Economia Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sem

indicaccedilatildeo Esquema proacuteprio Sem indicaccedilatildeo

Portugal Economy Probe Vaacuterios Economia Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim (natildeo a

100) Sem indicaccedilatildeo PDF XLS

Estatiacutesticas Economia GEE Economia Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica autoriza a coacutepia mediante citaccedilatildeo da fonte

Sim Sem indicaccedilatildeo XLXS

Portal de Transparecircncia Municipal

AMA e DGAL Economia Financcedilas

Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica indica

que a coacutepia importaccedilatildeo ou

utilizaccedilatildeo satildeo graacutetis

Sim Sem indicaccedilatildeo XML CSV

Base INCI Economia Compras Puacuteblicas

766326 Resultados

CC BY 30 (nos dados existentes no

dadosgov) Natildeo Esquema

proacuteprio HTML PDF

Estatiacutesticas Empresariais MJ Estatiacutesticas Empresariais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim Sem indicaccedilatildeo PDF XLS

100

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

PORDATA

Fundaccedilatildeo Manuel dos Santos

Estatiacutesticas Nacionais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim Esquema

proacuteprio HTML PDF XLS

PORDATA Kids

Fundaccedilatildeo Manuel dos Santos

Estatiacutesticas Nacionais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim Esquema

proacuteprio HTML PDF XLS

CCDR-N - Indicadores Regionais

CCDR Norte Estatiacutesticas Regionais 8 Sem indicaccedilatildeo Sim Sem indicaccedilatildeo XLS

Observatoacuterio DR CCDR Alentejo Estatiacutesticas Regionais

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo PDF XLS

Datacentro CCDR-Centro Estatiacutesticas Regionais

Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica autoriza a reproduccedilatildeo natildeo

comercial de conteuacutedos desde que identifique a

fonte

Natildeo Sem indicaccedilatildeo HTML

Estatiacutesticas dos Accedilores

Governo dos Accedilores

Estatiacutesticas Regionais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Esquema

proacuteprio HTML PDF

Estatiacutesticas da Madeira

Governo da Madeira

Estatiacutesticas Regionais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sem

indicaccedilatildeo Esquema

usado pelo INE PDF XLS

Quarenta anos de Abstenccedilatildeo

Transparecircncia Hackday Portugal Open Knowledge

Portugal

Estatiacutesticas Poliacuteticas

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo HTML

Central de dados

Transparecircncia Hackday Portugal

Estatiacutesticas Poliacuteticas e

Sociais 9 PDDL Sim Esquema

proacuteprio CSV JSON

Um Paiacutes como noacutes UBI U Aveiro Estatiacutesticas Sociais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo Aplicaccedilatildeo web

Dados e estatiacutesticas de cursos superiores

MEC Educaccedilatildeo Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim (natildeo a

100) Sem indicaccedilatildeo HTML XLXS ODS

101

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Estatiacutesticas Educaccedilatildeo e Ciecircncia

DGEEC Educaccedilatildeo e Ciecircncia

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim (natildeo a

100) Sem indicaccedilatildeo PDF XLXS ODS

Estatiacutesticas Justiccedila DGPJ-MJ Justiccedila Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim (natildeo a

100) Sem indicaccedilatildeo HTML PDF XLS

Sistema de informaccedilatildeo dos certificados de oacutebitos

M Sauacutede Oacutebitos Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo HTML

Serviccedilo Nacional de Sauacutede SNS Sauacutede 126 Sem indicaccedilatildeo Sim Esquema proacuteprio Vaacuterios

Estatiacutesticas Sauacutede DGS Sauacutede Sem indicaccedilatildeo Sem indicaccedilatildeo Sim Sem indicaccedilatildeo PDF CSV

Dashboard da Sauacutede DGS Sauacutede Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo HTML

Relatoacuterios Sinistralidade ANSR Seguranccedila Rodoviaacuteria

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo PDF

Portal Opiniatildeo Puacuteblica

Fundaccedilatildeo Francisco Manuel dos Santos

Sondagens Opiniatildeo

Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica autoriza a reproduccedilatildeo natildeo

comercial de conteuacutedos desde que identifique a

fonte

Sim Sem indicaccedilatildeo HTML PDF XLS

Estatiacutesticas SegSocial ISS Seg Social Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo HTML PDF

O Preccedilo Certo em Votos

Transparecircncia Hackday Portugal Open Knowledge

Portugal

Estatiacutesticas Poliacuteticas

Informaccedilatildeo estatiacutestica

General Public License v20

Sem indicaccedilatildeo Sem indicaccedilatildeo HTML

Arquivo Portuguecircs de Informaccedilatildeo Social

APIS Informaccedilatildeo social 37 CC BY 30 Sim Padratildeo do DDI PDF XML SAV

102

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Mila

Transparecircncia Hackday Portugal Aplicaccedilatildeo 78

Resultados Sem indicaccedilatildeo Sim Sem indicaccedilatildeo Aplicaccedilatildeo web

GeoDevolutas

Transparecircncia Hackday Portugal Aplicaccedilatildeo 250

Resultados Sem indicaccedilatildeo Sim Sem indicaccedilatildeo Aplicaccedilatildeo web

(tambeacutem disponiacutevel em CSV)

Open Food Facts

Open Food Facts - Portugal Aplicaccedilatildeo

Informaccedilatildeo estatiacutestica

e descritiva CC BY 40 Sim Sem indicaccedilatildeo Aplicaccedilatildeo web e

moacutevel

Invasatildeo dos hamburgueres

Transparecircncia Hackday Portugal Aplicaccedilatildeo Informaccedilatildeo

geograacutefica Sem indicaccedilatildeo Sim Sem indicaccedilatildeo

Aplicaccedilatildeo web (tambeacutem disponiacutevel em PDF CSV ODS

XLXS TSV)

103

Conclusatildeo

O conhecimento eacute inseparaacutevel do progresso cientiacutefico do processo de decisatildeo da inovaccedilatildeo e do bem-estar social Apesar de natildeo ser objetivo principal deste estudo natildeo deixaacutemos de constatar que o ecossistema portuguecircs de AA parece estar a amadurecer Aleacutem do RCAAP existem largas dezenas de repositoacuterios pertencentes a universidades e institutos de investigaccedilatildeo alguns incluiacutedos no ranking Top Portals O ROARMAP lista 21 poliacuteticas de AA por via verde em instituiccedilotildees do ensino superior o DOAJ (2017) indexa 78 revistas de AA com 91 a publicarem sob uma licenccedila CC que permite a sua livre reutilizaccedilatildeo O SHERPARoMEO listou 127 poliacuteticas editoriais de AA em Portugal sendo que mais de metade autoriza a publicaccedilatildeo em AA do posprint ou da versatildeo final do editor Nota ainda para a existecircncia de uma poliacutetica de AA da FCT por via do artigo 292 do acordo de financiamento que mandata a abertura de todos as publicaccedilotildees cientiacuteficas produzidos sob financiamento do programa H2020 Contudo os parcos resultados obtidos atraveacutes da literatura explorada natildeo permitem inferir a dimensatildeo cultural da implementaccedilatildeo do AA em Portugal

A plena implementaccedilatildeo do conceito de CA em Portugal parece ainda longe da realidade O estabelecimento de uma poliacutetica de CA apenas comeccedilou a ser desenhado em fevereiro de 2016 com a publicaccedilatildeo dos principiacuteos orientadores para a ldquoCiecircncia Aberta Conhecimento para todosrdquo pelo MCTES Em Maio a Resoluccedilatildeo do Conselho de Ministros nordm 212016 definiu os princiacutepios da implementaccedilatildeo da poliacutetica de CA em Portugal estruturada em torno de quatro eixos AA e Dados Abertos Infraestruturas e preservaccedilatildeo digital Avaliaccedilatildeo cientiacutefica Responsabilidade social cientiacutefica (Comissatildeo Executiva GT-PNCA 2016)

Hoje aplicamos o termo Dados Abertos referindo-nos a dados de investigaccedilatildeo e a dados do setor puacuteblico A origem da abertura destes dois tipos de dados tem contextos muito diferenciados e independentes embora os objetivos possam ser semelhantes Os dados sempre foram essenciais em muitas aacutereas da investigaccedilatildeo e nos uacuteltimos anos tornaram-se destaque em mais aacutereas cientiacuteficas crescendo substancialmente em escala e complexidade A niacutevel mundial verifica-se uma atenccedilatildeo crescente para o fenoacutemeno da abertura de dados de investigaccedilatildeo sobretudo quando se debate a resoluccedilatildeo de problemas agrave escala global Existem tambeacutem iniciativas e organizaccedilotildees internacionais envolvidas na promoccedilatildeo da abertura de dados que procuram fomentar o desenvolvimento de sistemas e procedimentos a niacutevel internacional que assegurem o acesso sustentabilidade e interoperabilidade Muitas destas organizaccedilotildees jaacute desenvolveram princiacutepios de abertura e protocolos de dados proacuteprios formaram grupos de trabalho para a definiccedilatildeo de padrotildees de gestatildeo publicaccedilatildeo citaccedilatildeo interoperabilidade e partilha de dados ou criaram cursos de treino em gestatildeo de dados de investigaccedilatildeo para oferecer aos seus investigadores Analisando em detalhe os

104

princiacutepios propostos para a abertura dos dados de investigaccedilatildeo verifica-se que aleacutem da grande variedade de princiacutepios propostos a abertura legal e teacutecnica dos dados soacute eacute acautelada em metade das recomendaccedilotildees Destacam-se o AA aos dados e a reutilizaccedilatildeo de dados em nuacutemero de menccedilotildees Em contrapartida a citaccedilatildeo de dados a interoperabilidade o acesso sem discriminaccedilatildeo as licenccedilas e formatos abertos a modificaccedilatildeo e legibilidade por maacutequina satildeo mencionados apenas em trecircs recomendaccedilotildees tendo a seu favor o facto de terem sido incluiacutedas nas recomendaccedilotildees mais recentes Princiacutepios relevantes como a publicaccedilatildeo imediata a qualidade e a integridade dos dados surgem apenas duas vezes listados Verifica-se tambeacutem o lanccedilamento de revistas cientiacuteficas especiacuteficas para a ciecircncia orientada a dados possibilitando a publicaccedilatildeo de dados e dos artigos cientiacuteficos que os utilizam apoacutes o serviccedilo de revisatildeo por pares

Apesar do progresso a literatura examinada aponta no sentido de que a abertura a dados de investigaccedilatildeo natildeo ser ainda um comportamento comum sendo necessaacuterio uma mudanccedila cultural (Royal Society 2012 Pontika et al 2015 Science International 2015) Verificam-se trecircs fatores que parecem estar a atrasar esta mudanccedila no comportamento dos investigadores

a) A OKI (2012b) coloca os dados de investigaccedilatildeo ao mesmo niacutevel de importacircncia que outros tipos de dados como os dados culturais financeiros estatiacutesticos ambientais e ainda sobre o clima e transportes sem lhes atribuir qualquer destaque ou importacircncia especial

b) A avaliaccedilatildeo e revisatildeo por pares dos dados natildeo tecircm a mesma qualidade quando comparada com as publicaccedilotildees tradicionais dado a publicaccedilatildeo de dados natildeo ser ainda uma praacutetica comum (ERAC 2016)

c) Hahnel e Hook (2016) apontam a falha na atribuiccedilatildeo de incentivos e recompensas tangiacuteveis aos investigadores pelas suas contribuiccedilotildees A publicaccedilatildeo de dados de forma aberta envolve tarefas que consomem muito tempo aos investigadores como a mudanccedila do formato dos dados manter a informaccedilatildeo atualizada alinhar os dados com as licenccedilas existentes e com os criteacuterios de publicaccedilatildeo de informaccedilatildeo sensiacutevel (Reitano 2013)

O debate sobre a abertura dos dados governamentais tem mais de uma deacutecada Diversas iniciativas e organizaccedilotildees internacionais tecircm promovido princiacutepios de abertura de dados do setor puacuteblico como a OKI (2012a) que identificou as componentes chave da abertura de dados puacuteblicos disponibilidade e acesso reutilizaccedilatildeo e redistribuiccedilatildeo participaccedilatildeo universal Foram analisados princiacutepios de abertura de dados puacuteblicos de nove organizaccedilotildees e tal como em relaccedilatildeo aos dados de investigaccedilatildeo verifica-se uma grande variedade de princiacutepios propostos Embora se registe uma melhoria significativa na abertura legal e teacutecnica relativamente aos dados de investigaccedilatildeo tambeacutem os princiacutepios propostos para os dados puacuteblicos natildeo abarcam

105

a totalidade desta dupla abertura O acesso a publicaccedilatildeo imediata a reutilizaccedilatildeo e a disponibilizaccedilatildeo de dados de forma completa sem discriminaccedilatildeo e de forma a serem processados por maacutequina satildeo os princiacutepios que reuacutenem mais consenso entre as recomendaccedilotildees analisadas As licenccedilas abertas a comparabilidade de dados os formatos abertos a disponibilidade a abertura por defeito de dados a interoperabilidade publicaccedilatildeo de metadados e a gestatildeo de dados apoacutes a sua publicaccedilatildeo satildeo mencionados em menos de metade das recomendaccedilotildees analisadas apesar de ser indiscutiacutevel a sua importacircncia no processo de abertura de dados

A abertura dos dados governamentais enfrenta restriccedilotildees complexas a niacutevel institucional da complexidade da tarefa uso e participaccedilatildeo legislaccedilatildeo qualidade da informaccedilatildeo e questotildees teacutecnicas (Janssen Charalabidis e Zuiderwijk 2012) Os governos devem modificar as praacuteticas e procedimentos internos de gestatildeo de informaccedilatildeo pois a reutilizaccedilatildeo da informaccedilatildeo estaacute dependente da forma como eacute gerida e publicada (Reitano 2013) A OECD (2015a) declara que estes dados continuam muitas vezes inacessiacuteveis quer em termos de acesso quer em termos de custo Satildeo apontados alguns entraves agrave sua publicaccedilatildeo derivados de questotildees culturais (Carrara et al 2016a) restriccedilotildees teacutecnicas e financeiras (Ubaldi 2013 Carrara et al 2016a) sendo necessaacuterio enfrentar desafios relacionados com poliacuteticas tecnologias financcedilas organizaccedilatildeo e cultura para criar um ecossistema e construir um modelo de negoacutecios sustentaacutevel para as iniciativas de DGA (Ubaldi 2013 traduccedilatildeo livre) Por outro lado devem ser fornecidos aos cidadatildeos os conhecimentos e habilidades necessaacuterias para interpretar a vasta gama de conjuntos de dados e gerar valor a partir desses dados (Janssen 2012 Koski 2015)

O impacto da abertura dos dados governamentais pode ser medido em trecircs dimensotildees econoacutemica poliacutetica e social (Granicas 2013 Koski 2015) Koski (20153) defende ser necessaacuterio desenvolver um modelo de avaliaccedilatildeo e monotorizaccedilatildeo seguido da coleta sistemaacutetica de dados para medir com exatidatildeo o impacto dos Dados Abertos

A abertura de dados sem restriccedilotildees de acesso deve ser garantida por uma poliacutetica de Dados Abertos pois ldquoOpen Data is politicalrdquo (World Wide Web Foundation 201638) O fenoacutemeno dos Dados Abertos eacute tambeacutem teacutecnico e social dada a interaccedilatildeo entre o meio local politico social legal e teacutecnico e as tecnologias que produzem resultados (Davies 2014 Pasqueto Sands amp Borgman 2015) A literatura destaca a existecircncia de poliacuteticas diferenciadas para a abertura de dados governamentais e para a abertura de dados cientiacuteficos com maior enfoque poliacutetico na abertura dos dados governamentais (RECODE 2014) Em termos de dados de investigaccedilatildeo eacute possiacutevel encontrar poliacuteticas de quatro intervenientes diferentes Governo entidade financiadora que pode ser ou natildeo governamental instituiccedilotildees de investigaccedilatildeo e ainda as editoras de data journals Ao niacutevel dos dados puacuteblicos satildeo associadas poliacuteticas

106

governamentais e institucionais As poliacuteticas de dados abertos devem ainda incluir uma poliacutetica de gestatildeo de dados independentemente do cariz dos dados

As recentes poliacuteticas de Open Data pretendem disponibilizar em livre acesso os datasets da mesma forma que qualquer outra publicaccedilatildeo acadeacutemica sendo para isso necessaacuterio garantir uma infraestrutura de armazenamento acesso pesquisa e a reutilizaccedilatildeo dessa informaccedilatildeo (Rans Day Duke amp Ball 2013) Segundo a Science International (20156) ldquoeffective open data in a data-intensive age can only be realised if there is systemic action at disciplinary national and international levelsrdquo

Exige-se uma mudanccedila cultural para atingir a abertura plena dos dados de investigaccedilatildeo sendo necessaacuterio estabelecer novas formas de reconhecimento e recompensa aos esforccedilos de gestatildeo preservaccedilatildeo e curadoria de dados como forma de envolver investigadores e comunidades na abertura de dados (RECODE 2014 Internacional Science 2015) Eacute essencial que os investigadores desenvolvam competecircncias que lhes permita natildeo soacute partilhar dados com metadados adequados como tambeacutem entender e reutilizar dados de terceiros (OECD 2015a) A familiaridade com ferramentas e princiacutepios de gestatildeo de dados deve ser segundo a Royal Society (2012) parte integrante do treino dos cientistas As bibliotecas e os bibliotecaacuterios como profissionais de informaccedilatildeo multifacetados podem desempenhar um papel ativo no mundo dos Dados Abertos como facilitadores do processo de investigaccedilatildeo (RECODE 2014 Hahnel e Hook 2016 Erway et al 2016 Hernaacutendez-Peacuterez 2016)

A implementaccedilatildeo de uma poliacutetica de abertura de dados puacuteblicos deve ter em conta a definiccedilatildeo da sua aplicaccedilatildeo e os objetivos que dados iratildeo ser publicados quais as condiccedilotildees de publicaccedilatildeo de dados em que siacutetio qual a frequecircncia e qual a razatildeo da publicaccedilatildeo devendo ainda ser calculado o impacto e os benefiacutecios da abertura de dados (Carrara et al 2016a) ldquoThe culture of open data policies has to change from a culture in which opening of data is standardly consideredrdquo (Zuiderwijk amp Janssen 201427) Os governos necessitam de implementar o fenoacutemeno dos Dados Abertos como uma mudanccedila cultural assegurando que recursos humanos e materiais infraestrutura leis e poliacuteticas satildeo eficientes para a implementaccedilatildeo e extraccedilatildeo de resultados a longo prazo (World Wide Web Foundation 2016) A literatura indica algumas estruturas de avaliaccedilatildeo da abertura de dados puacuteblicos tendo o nosso enfoque recaiacutedo no modelo criado Zuiderwijk e Janssen (2014) que aborda o contexto conteuacutedo e indicadores de desempenho da poliacutetica de dados abertos para calcular o valor alcanccedilado pela abertura de dados Destaque ainda para o Open Data Barometer que revela algumas conclusotildees preocupantes a niacutevel da abertura dos dados governamentais A disponibilidade de dados que cumprem todos os princiacutepios de abertura caiu dos 10 para 7 em 2016 e a legibilidade por maacutequina tambeacutem tem tendecircncia negativa Apenas se registou uma melhoria no licenciamento de dados

107

Ao niacutevel macro a EU tem estado ativa na recomendaccedilatildeo e implementaccedilatildeo de poliacuteticas de abertura de dados de investigaccedilatildeo e governamentais Em 2015 no acircmbito da criaccedilatildeo do Mercado Digital Uacutenico propocircs a implementaccedilatildeo de uma ldquocopyright exception that would permit researchers to analyse on a large scale scientific data to which they have lawful accessrdquo (Comissatildeo Europeia 2016b) Com a ambiccedilatildeo de tornar a Europa liacuteder mundial numa economia baseada em dados a Comissatildeo Europeia (2016c) pretende ldquodisponibilizar serviccedilos baseados na computaccedilatildeo em nuvem e infraestruturas de dados de craveira mundialrdquo que forneccedilam vantagens competitivas a investigadores empresaacuterios e instituiccedilotildees puacuteblicas baseadas na utilizaccedilatildeo de grandes volumes de dados

A aposta na criaccedilatildeo de poliacuteticas de abertura de dados de acordo com os objetivos europeus relativamente agrave CA reflete-se no atual programa de financiamento da investigaccedilatildeo e inovaccedilatildeo da EU o Horizonte 2020 (H2020) Foi criado um projeto-piloto de dados abertos com o objetivo de maximizar o acesso e reutilizaccedilatildeo de dados de investigaccedilatildeo nas aacutereas cientiacuteficas selecionadas tendo sido expandido em 2017 a todas as aacutereas sob financiamento do H2020 O artigo 293 do Model Grant Agreement requer o depoacutesito num repositoacuterio de AA de todos os dados e metadados associados permitindo assim o seu acesso exploraccedilatildeo por maacutequina reproduccedilatildeo e disseminaccedilatildeo sem custos para os utilizadores Os investigadores devem tambeacutem fornecer informaccedilatildeo sobre as ferramentas e instrumentos necessaacuterios para validar os resultados e elaborar um Data Management Plan para descrever os conjuntos de dados gerados no processo de investigaccedilatildeo e como e quando seratildeo publicados A gestatildeo de dados deve ser efetuada segundo os princiacutepios FAIR tornando os dados faacuteceis de encontrar acessiacuteveis interoperaacuteveis e reutilizaacuteveis (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016c) A implementaccedilatildeo dos princiacutepios FAIR na gestatildeo e abertura de dados de investigaccedilatildeo poderaacute potenciar tambeacutem a partilha e por conseguinte a citaccedilatildeo de dados

Em termos de dados puacuteblicos a EU implementou uma nova Diretiva (201337EU) que requer que a informaccedilatildeo puacuteblica seja disponibilizada ldquothrough open and machine-readable formats and together with their metadata at the best level of precision and granularity in a format that ensures interoperabilityrdquo incluindo agora entidades como bibliotecas arquivos e museus na esfera da abertura de dados (EUR-Lex 20133) Esta diretiva tornou obrigatoacuteria a disponibilizaccedilatildeo de informaccedilatildeo proveniente das entidades puacuteblicas para reutilizaccedilatildeo ao custo de reproduccedilatildeo de preferecircncia num portal e sob licenccedilas de formatos digitais

A EU criou tambeacutem o Open Data Maturity para avaliar o desenvolvimento de poliacuteticas nacionais e portais na Europa usando a informaccedilatildeo coletada para elaborar um iacutendice de maturidade das poliacuteticas de Open Data baseado na preparaccedilatildeo poliacutetica e na maturidade do portal de dados (Carrara Nieuwenhuis amp Vollers 2016) Em termos

108

de preparaccedilatildeo poliacutetica eacute avaliada a presenccedila de uma poliacutetica de Dados Abertos especiacutefica normas de licenciamento extensatildeo da coordenaccedilatildeo a niacutevel nacional uso de dados e impacto poliacutetico social e econoacutemico A maturidade dos portais eacute avaliada de acordo com a sua usabilidade a reutilizaccedilatildeo dos dados alojados no portal e inclusatildeo de dados de diferentes domiacutenios Segundo a informaccedilatildeo apurada no relatoacuterio apesar da melhoria do nuacutemero de poliacuteticas de Dados Abertos no uso de dados e impacto da abertura de dados a maioria dos paiacuteses europeus ainda natildeo atingiu a maturidade por completo Os paiacuteses necessitam de elevar o reconhecimento poliacutetico sobre os Dados Abertos aumentar os processos automatizados nos seus portais para aumentar a usabilidade e reutilizaccedilatildeo dos dados e tambeacutem organizar mais eventos e treinos para apoiar as iniciativas nacionais e locais O relatoacuterio do Open Data Maturity conclui que os paiacuteses europeus estatildeo a enfrentar barreiras legais financeiras de qualidade de dados e de poliacuteticas sublinhando que os poliacuteticos natildeo conhecem os benefiacutecios da abertura de dados e que por isso os Dados Abertos natildeo satildeo estabelecidos como uma prioridade poliacutetica (Carrara Nieuwenhuis amp Vollers 2016)

Em Portugal as poliacuteticas de abertura de dados de investigaccedilatildeo e do setor puacuteblico apresentam estados de maturidade diferentes Apenas em 2014 foi definida uma poliacutetica de AA aos dados de investigaccedilatildeo atraveacutes da FCT enquanto entidade financiadora de investigaccedilatildeo Contudo esta poliacutetica ldquonatildeo estaacute alinhada com os requisitos relativamente aos dados de investigaccedilatildeo do H2020rdquo (Comissatildeo Executiva GT-PNCA 2016) pois apenas recomenda a abertura de dados sem no entanto mencionar onde os depositar o tipo de licenccedilas a utilizar que tipo de metadados inserir que formatos utilizar

A abertura de dados de investigaccedilatildeo em Portugal foi enquadrada no acircmbito da definiccedilatildeo de uma poliacutetica de CA tendo sido delineadas algumas metas a atingir ateacute 2018 pelo Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior (2016) publicaccedilatildeo de 100 dos dados criados com financiamento puacuteblico num repositoacuterio de AA verificaccedilatildeo contiacutenua da publicaccedilatildeo de dados eliminaccedilatildeo do duplo financiamento para colocar publicaccedilotildees e dados em AA oferta regular de formaccedilatildeo relativa a publicaccedilatildeo de dados em AA propriedade intelectual e proteccedilatildeo de dados

A Resoluccedilatildeo do Conselho de Ministros nordm 212016 de 11 de abril vem finalmente incluir o AA aos dados de investigaccedilatildeo na poliacutetica cientiacutefica No acircmbito da definiccedilatildeo de uma poliacutetica de Ciecircncia Aberta eacute incluiacuteda a obrigatoriedade do AA aos ldquodados cientiacuteficos resultantes de investigaccedilatildeo financiada por fundos puacuteblicosrdquo e sua respetiva preservaccedilatildeo ldquopor forma a permitir a sua reutilizaccedilatildeo e o acesso continuadordquo (Resoluccedilatildeo do Conselho de Ministros nordm 212016 2016) O interesse na abertura de dados de investigaccedilatildeo tem crescido no discurso poliacutetico e cientiacutefico verificando-se jaacute a organizaccedilatildeo de uma conferecircncia de dados de investigaccedilatildeo e CA em 2016 e de dois foacuteruns de gestatildeo de dados de investigaccedilatildeo o uacuteltimo jaacute em 2017

109

O primeiro relatoacuterio da Comissatildeo Executiva do Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta constatou que em termos de gestatildeo e partilha de dados existem algumas iniciativas e experiecircncias de ldquoacircmbito disciplinar nomeadamente no contexto de projetosrdquo sendo expectaacutevel que o Roteiro Nacional de Infraestruturas de Investigaccedilatildeo de Interesse Estrateacutegico traga ldquoprogressos significativosrdquo (Comissatildeo Executiva GT-PNCA 20167) O mesmo relatoacuterio sublinha que ao niacutevel das instituiccedilotildees de investigaccedilatildeo e de ensino superior as iniciativas de partilha e gestatildeo de dados satildeo quase inexistentes De facto apenas se regista a existecircncia do projeto TAIL lanccedilado na Faculdade de Engenharia da Universidade do Porto com o objetivo de otimizar o processo de gestatildeo de dados de investigaccedilatildeo desde a sua produccedilatildeo ateacute ao depoacutesito e partilha Este projeto a decorrer de 2016 ateacute 2019 ldquovai construir um portfoacutelio de exemplos de gestatildeo de dados em diversos domiacutenios que poderatildeo ser usados pelos investigadores para avaliar o esforccedilo requerido e as compensaccedilotildees a obter com esta atividaderdquo (Ribeiro et al 2016256-257) Os resultados seratildeo avaliados atraveacutes da utilizaccedilatildeo da plataforma Dendro ldquodesigned to help researchers use concepts from domain-specific ontologies to collaboratively describe and share datasets within their groupsrdquo (Universidade do Porto Faculdade de Engenharia 2017)

O ecossistema dos dados de investigaccedilatildeo em Portugal eacute concentrado a niacutevel disciplinar e inferior em nuacutemero de e-infraestruturas relativamente aos dados puacuteblicos Regista-se a existecircncia do SARDC com jaacute cerca de seis anos de existecircncia e que apresenta apenas 2007 datasets em maio de 2017 Depois da sua criaccedilatildeo e da colocaccedilatildeo em massa de conjuntos de dados verifica-se que o depoacutesito de datasets decresceu de forma extrema Os conjuntos disponibilizados satildeo provenientes de apenas duas instituiccedilotildees o APIS com 37 e o IPCB com 1970 conjuntos de dados Embora exista um espaccedilo atribuiacutedo a mais duas instituiccedilotildees nenhuma dessas entidades publicou ateacute agora dados atraveacutes desta plataforma O SARDC eacute limitado em termos de funcionalidades permitindo apenas a busca por autor data titulo assunto e tipo de documento Natildeo eacute possiacutevel perceber a legalidade da reutilizaccedilatildeo de dados pois natildeo eacute referido qualquer tipo de licenciamento A qualidade dos dados apresentados pelo SARDC eacute uma incoacutegnita pela falta de indicaccedilatildeo do uso de formatos abertos e tambeacutem de um esquema padratildeo de metadados A niacutevel das instituiccedilotildees de investigaccedilatildeo apenas o IPCB possui um repositoacuterio de Dados Abertos

A tendecircncia de abertura de dados de investigaccedilatildeo parece estar ligada agrave cultura disciplinar com os repositoacuterios de dados cientiacuteficos existentes em Portugal a conotarem-se no domiacutenio das Ciecircncias da Vida O re3data indexa apenas 2 repositoacuterios de dados cientiacuteficos portugueses o INTEGRALL e o KiMoSys sendo que ambos pertencem ao ramo da biologia (DataCite 2017a) O Biosharingorg (2017) indexou cinco bases de dados cientiacuteficas com origem portuguesa havendo participaccedilatildeo nacional em outras duas bases de dados internacionais Estas pertencem todas ao domiacutenio das Ciecircncias da Vida e da Biologia com exceccedilatildeo de uma conotada com as

110

Ciecircncias da Terra A GBIF possui um noacute portuguecircs que aloja 23 conjuntos de dados que correspondem a 448136 ocorrecircncias (Portal de Dados de Biodiversidade de Portugal 2016) A rede nacional de informaccedilatildeo bioloacutegica - BioDatapt fornece acesso a duas bases de dados disciplinares uma ontologia para descrever experiecircncias bioloacutegicas baseadas em plantas quatro ferramentas de software e cinco conjuntos de dados

Em suma eacute necessaacuterio desenvolver por completo a poliacutetica de abertura de dados cientiacuteficos clarificando questotildees como o local de depoacutesito licenccedilas metadados e formatos a utilizar Ao niacutevel do ecossistema eacute necessaacuterio melhorar a visibilidade do SARDC abrir totalmente os dados isto eacute de forma legal e teacutecnica e construir mais repositoacuterios de dados Em termos de impacto eacute imperiosa uma mudanccedila cultural que passe pelo treino dos investigadores para a gestatildeo e partilha de dados pela definiccedilatildeo de recompensas e incentivos para os investigadores que partilhem dados e tambeacutem pela criaccedilatildeo de mais iniciativas de promoccedilatildeo da abertura de dados

A evoluccedilatildeo da conjuntura de acesso aos documentos administrativos do setor puacuteblico eacute derivada da imposiccedilatildeo das Diretivas Europeias a que Portugal como membro da EU estaacute obrigado A Lei 462007 de 24 de Agosto viraacute transpor para a ordem juriacutedica nacional a Diretiva nordm 200398CE legislando a obrigaccedilatildeo das entidades puacuteblicas publicar documentos administrativos de forma eletroacutenica para que possam ser acedidos e reutilizados Foi tambeacutem criada a CADA para supervisionar o cumprimento das disposiccedilotildees legais referentes ao acesso agrave informaccedilatildeo administrativardquo (Comissatildeo de Acesso aos Documentos Administrativos [CADA])

A Lei nordm 262016 de 22 de Agosto revoga e transpotildee a novamente a Diretiva 200398EC O artigo 3ordm mandata a abertura dos dados ambientais agrave comunidade incluindo-os na definiccedilatildeo de documento administrativo devendo a sua publicaccedilatildeo ser feita num formato aberto e legiacutevel por maacutequina O artigo 23ordm apenas prevecirc a reutilizaccedilatildeo dos dados para fins educativos e para fins de investigaccedilatildeo e desenvolvimento deixando de lado a reutilizaccedilatildeo comercial Contudo o dadosgov atribuiu aos dados que aloja a licenccedila CC BY 30 o que natildeo impede a reutilizaccedilatildeo comercial dos dados Perante este contexto eacute impossiacutevel natildeo questionar a razatildeo de natildeo ter sido transposta a nova Diretiva 201337EU que facilita a reutilizaccedilatildeo de dados ao tornar obrigatoacuteria a disponibilizaccedilatildeo de informaccedilatildeo proveniente das entidades puacuteblicas para reutilizaccedilatildeo ao custo de reproduccedilatildeo de preferecircncia num portal e sob licenccedilas de formatos digitais Um desenvolvimento interessante seria o de criar um legislaccedilatildeo apropriada para a abertura de dados governamentais que fosse estabelecida tendo em conta as necessidades dos utilizadores e os objetivos governamentais em vez da simples transposiccedilatildeo da Diretiva da Uniatildeo Europeia

Ao niacutevel local apenas Lisboa e Porto parecem ter definido uma poliacutetica de abertura de dados com estrateacutegias diferenciadas Lisboa aposta na publicaccedilatildeo de dados municipais que promovam o envolvimento dos cidadatildeos aumentem a transparecircncia e

111

o desenvolvimento econoacutemico aleacutem da melhoria da eficiecircncia dos serviccedilos devendo os dados ser atualizados legiacuteveis por maacutequina com licenccedila aberta que permita a reutilizaccedilatildeo comercial (Lisboa Cacircmara Municipal 2016) Os dados disponibilizados no portal ldquosatildeo produzidos no acircmbito de sistemas de informaccedilatildeordquo que pertencem a diversos organismos registando-se jaacute diversas aplicaccedilotildees que utilizam esses dados para criar valor para o cidadatildeo e visitante de Lisboa na aacuterea do turismo ambiente urbanismo (Soares Baptista e Lima 201518) Jaacute o Porto parece concentrado na publicaccedilatildeo de dados que contribuam para a ldquocompetitividade do Municiacutepio do Porto e da regiatildeo para visitar para residir captar e realizar negoacutecios no mercado nacional e internacionalrdquo (Porto Cacircmara Municipal) De acordo com a opiniatildeo de Soares Baptista e Lima (201518) a abertura de dados eacute centrada na ldquodimensatildeo turismo e negligencia pelo menos aparentemente as restantesrdquo Esta conclusatildeo pode ser reforccedilada com a anaacutelise do portal de dados do Porto onde apenas constam cinco conjuntos de dados sendo estes pertencentes ao turismo ou relacionados

O ecossistema de abertura de dados tem aumentado dentro e fora do espectro poliacutetico Aleacutem do portal nacional de dados puacuteblicos um grande nuacutemero de organizaccedilotildees puacuteblicas tem criado os seus portais de dados eou tem publicado os mesmos no dadosgov Por outro lado existem vaacuterios portais de dados com origem na sociedade civil com o selo da Transparecircncia Hackday Portugal Em Portugal tecircm existido diversas iniciativas a este niacutevel hackathons como o Date with Data com o intuito de alertar informar e formar a comunidade para este novo paradigma na disponibilizaccedilatildeo da informaccedilatildeo conferecircncias de Dados Abertos

O Porto Lisboa Fundatildeo Palmela Penela e Aacutegueda estatildeo entre as cidades que integram o Open and Agile Smart Cities (OASC) (2017) uma iniciativa com o objetivo de desenvolver mercados para as cidades inteligentes baseados nas necessidades das cidades e das comunidades O Porto eacute destaque nesta iniciativa pela utilizaccedilatildeo da tecnologia FIWARE que ajuda a melhorar o uso de dados abertos e a partilha conhecimentos e tecnologias entre cidades

A anaacutelise feita por Soares Baptista e Lima (2015) sobre a abertura de dados em quatro cidades do norte do paiacutes Braga Barcelos Guimaratildees e Vila Nova de Famalicatildeo concluiu que a disponibilizaccedilatildeo de dados ao niacutevel local eacute feita apenas ao niacutevel de ldquocontratos municipais orccedilamento anual gastos resultados eleitorais qualidade do ar horaacuterios de transporte orccedilamento participativo e lista de empresasrdquo

A avaliaccedilatildeo da transparecircncia governativa local pode tambeacutem ser obtida atraveacutes do Portal da Transparecircncia Municipal uma ferramenta que permite avaliar vaacuterios indicadores da governaccedilatildeo dos municiacutepios portugueses com o recurso agrave disponibilizaccedilatildeo de dados estatiacutesticos Os indicadores abordam a gestatildeo financeira e administrativa decisotildees fiscais dinacircmica econoacutemica do municiacutepio serviccedilos municipais e participaccedilatildeo eleitoral autaacuterquica (Portugal Governo 2017)

112

Utilizando a estrutura de avaliaccedilatildeo de poliacuteticas de Dados Abertos de Zuiderwijk e Janssen (2014) eacute possiacutevel tirar algumas ilaccedilotildees sobre o contexto conteuacutedo e indicadores de desempenho da poliacutetica de abertura de dados do setor puacuteblico bem como sobre o valor puacuteblico alcanccedilado A niacutevel de contexto da poliacutetica de Dados Abertos a Lei nordm 262016 de 22 de Agosto transpotildee a Diretiva 200398CE tendo como motivaccedilatildeo para a sua implementaccedilatildeo eacute sobretudo econoacutemica e poliacutetica via EU A poliacutetica tambeacutem pretende facilitar o acesso e reutilizaccedilatildeo da informaccedilatildeo por parte dos cidadatildeos e garantir a transparecircncia da atividade administrativa A abertura de dados do setor puacuteblico eacute garantida pela CADA responsaacutevel pelo cumprimento da lei e a AMA que fornece a e-infraestrutura e apoio teacutecnico Tambeacutem os custos de abertura de dados governamentais parecem estar assegurados num plano de racionalizaccedilatildeo de custos da Administraccedilatildeo Puacuteblica (OECD 2015)

Em termos de conteuacutedo a poliacutetica de Dados Abertos enuncia na sua constituiccedilatildeo alguns princiacutepios de abertura bastante importantes como o acesso livre e universal a acessibilidade a interoperabilidade a qualidade a integridade e a autenticidade dos dados publicados e ainda a sua identificaccedilatildeo e localizaccedilatildeo (art 2ordm) A publicaccedilatildeo de dados deve ser feita num formato aberto e legiacutevel por maacutequina (art 3ordm)

Relativamente ao contexto o acesso eacute gratuito e de faacutecil compreensatildeo sendo que todos os dados no dadosgov estatildeo disponiacuteveis para download sem necessidade de pedido ou registo Eacute aplicada a licenccedila CC BY 30 a todos os datasets alojados no portal permitindo assim a sua reutilizaccedilatildeo com apenas a restriccedilatildeo de mencionar a fonte dos dados Todos os dados no dadosgov estatildeo disponiacuteveis em formatos abertos podendo ser classificados com 3 estrelas segundo o conceito de dados abertos conectados de Tim Berners-Lee (2010)

Contudo natildeo existe esquema padratildeo de metadados nem existe verificaccedilatildeo dos metadados antes da publicaccedilatildeo de cada dataset (Lapa 2017) Natildeo satildeo conhecidas meacutetricas de avaliaccedilatildeo nem multas ou recompensas no ecossistema portuguecircs de Dados Abertos A uacuteltima mediccedilatildeo da qualidade dos dados data de 2014 onde foram encontrados alguns problemas que natildeo foram totalmente resolvidos junto dos fornecedores A uacuteltima grande atividade de promoccedilatildeo de reutilizaccedilatildeo de dados do setor puacuteblico ocorreu em 2014-2015 natildeo se conhecendo para jaacute novas atividades previstas (Lapa 2017)

Em termos de disponibilidade de dados Portugal apresenta 802 conjuntos de dados no portal nacional de temaacutetica diversa mas com maior incidecircncia na Economia e Financcedilas Mas se considerarmos os dados alojado em outros portais puacuteblicos e natildeo que ainda natildeo constam no portal nacional a contabilidade eacute bastante mais elevada

Os indicadores de desempenho satildeo modestos Apesar do espetro alargado de destinataacuterios da abertura de dados registam-se apenas 2 aplicaccedilotildees elaboradas a

113

partir de Dados Abertos disponibilizados pela AMA e Direcccedilatildeo-Geral das Autarquias Locais (Lapa 2017) Natildeo eacute por isso surpreendente o fraco impacto poliacutetico econoacutemico e social apontado pelo Open Data Barometer e pelo Open Data Maturity O estudo de Gomes e Soares (2014) conclui que a transparecircncia eacute o uacutenico benefiacutecio real

Em termos de valor puacuteblico alcanccedilado apenas conseguimos identificar a transparecircncia governativa e disponibilidade de dados Mesmo que a poliacutetica mandate a abertura de dados mediante como a interoperabilidade e a qualidade se natildeo existe verificaccedilatildeo nem mediccedilatildeo quem pode assegurar que estes estatildeo a ser cumpridos A disponibilidade de dados existe o que natildeo se verifica eacute grande reutilizaccedilatildeo dos dados puacuteblicos Poderaacute esta falta de verificaccedilatildeo da qualidade dos dados estar a interferir com a sua reutilizaccedilatildeo Faltam claramente indicadores de reutilizaccedilatildeo de dados do setor puacuteblico e estudos de impacto para uma avaliaccedilatildeo concreta do valor alcanccedilado

Gomes e Soares (2014) apenas atribuem nota positiva ao dadosgov no cumprimento dos princiacutepios de abertura A atividade dos visitantes o desenvolvimento de aplicaccedilotildees a atividade geradora de novo conhecimento e a utilizaccedilatildeo de recursos do portal satildeo classificadas como pobres Neste indicador apenas a atividade dos fornecedores no portal eacute satisfatoacuteria Em termos de benefiacutecios observaacuteveis da abertura de dados governamentais o estudo apenas regista bons niacuteveis de transparecircncia governativa enquanto a participaccedilatildeo puacuteblica a inovaccedilatildeo e o empreendedorismo e a eficiecircncia governativas natildeo revelam impactos satisfatoacuterios

O cruzamento da informaccedilatildeo obtida atraveacutes das vaacuterias iniciativas de avaliaccedilatildeo da abertura de dados permite inferir algumas conclusotildees e tambeacutem revelar algumas disparidades O Open Data Barometer e o Open Data Maturity apontam o baixo impacto econoacutemico e social da abertura de dados em Portugal Gomes e Soares (2014) concluem que o problema em Portugal natildeo eacute quantidade de dados disponibilizados mas sim a quantidade de dados que satildeo reutilizados e como satildeo reutilizados

O Public Sector Information Scoreboard e o Open Data Maturity afirmam que Portugal natildeo possui uma poliacutetica de Dados Abertos o que como vimos natildeo corresponde agrave verdade Entre as vaacuterias iniciativas de avaliaccedilatildeo do estado de abertura de dados apenas trecircs publicaram informaccedilatildeo relativa a 2016 Apesar da equivalecircncia de ranking e taxa de abertura entre duas das iniciativas eacute redundante inferir qualquer conclusatildeo dado que estas natildeo medem o mesmo nuacutemero paracircmetros nem estes coincidem na maioria dos casos O Open Data Inventory refere-se a dados avaliados apenas do portal do INE para calcular a sua taxa de abertura pelo que tambeacutem deve ser relativizado

Como pontos positivos satildeo apontados a abertura de dados de diferentes domiacutenios o fato de todos os dados disponibilizados no portal estarem num formato processaacutevel

114

por maacutequina (Carrara Nieuwenhuis amp Vollers 2016) ao contraacuterio do que afirma a OECD (2015b) e o Open Data Inventory

Todos os iacutendices de avaliaccedilatildeo da maturidade do estado das iniciativas e poliacuteticas de Dados Abertos satildeo relativos a dados puacuteblicos natildeo tendo sido encontrada nenhuma estrutura de avaliaccedilatildeo das poliacuteticas de abertura de dados de investigaccedilatildeo

Tendo em conta o Quadro 5 eacute possiacutevel verificar a qualidade da abertura dos dados dos 60 portais de dados portugueses encontrados na web e inferir algumas conclusotildees Em termos de portais de dados de investigaccedilatildeo foram encontrados apenas 11 com os restantes 49 a conter dados do setor publico Os portais de dados estatiacutesticos satildeo os grandes dominadores do panorama nacional com 13 siacutetios web seguidos dos portais de dados econoacutemicos com 6 Dos 60 portais analisados apenas 33 disponibilizam dados legiacuteveis por maacutequina sendo que alguns portais natildeo o fazem totalmente Apenas 16 portais indicam usar uma licenccedila aberta que permita a livre reutilizaccedilatildeo dos dados e apenas 3 fornecem a indicaccedilatildeo do padratildeo de metadados usado Denota-se que alguns dos portais parecem usar um esquema proacuteprio de descriccedilatildeo de datasets no entanto estes natildeo parecem corresponder aos padrotildees de metadados mais reconhecidos Existem 17 portais que natildeo utilizam formatos abertos ou natildeo indicam sequer o tipo de formato Eacute possiacutevel jaacute encontrar jaacute tambeacutem 17 portais que fornecem dados em formatos estruturados

Em suma eacute necessaacuterio transpor a Diretiva da EU de 2013 e criar mais poliacuteticas municipais e institucionais mandatar a total abertura legal e teacutecnica de dados e a sua verificaccedilatildeo da qualidade O niacutevel de reutilizaccedilatildeo de dados e as atividades de treino e envolvimento dos cidadatildeos devem ser aumentados

O sucesso das poliacuteticas de Dados Abertos depende como vimos da criaccedilatildeo de um ecossistema sustentaacutevel e tambeacutem do impacto e reutilizaccedilatildeo que estes tipos de informaccedilatildeo possam induzir O impacto dos Dados abertos pode ser medido atraveacutes da citaccedilatildeo de dados ou atraveacutes de indicadores altimeacutetricos que permitem uma observaccedilatildeo mais clara e detalhada dos possiacuteveis impactos dos conjuntos de dados disponibilizados em AA sejam eles provenientes do setor puacuteblico ou das entidades de investigaccedilatildeo

115

Referecircncias Bibliograacuteficas

Agecircncia para a Modernizaccedilatildeo Administrativa (AMA) (2016a) Guia Dados Abertos Disponiacutevel na WWW httpwwwdadosgovptmedia46120guia_dados_abertos_amapdf

Agecircncia para a Modernizaccedilatildeo Administrativa (AMA) (2016b) Dadosgov [Consultado a 11-05-2017] Disponiacutevel na WWW httpwwwdadosgovpt

Agecircncia Portuguesa do Ambiente (2017) SNIAmb - Sistema Nacional de Informaccedilatildeo de Ambiente [Consultado a 12-05-2017] Disponiacutevel na WWW httpsniambapambienteptHomeDefaulthtm

Arzberger P et al (2004) An international framework to promote access to data Science 303(5665) 1777-1778 Disponiacutevel na WWW httpsciencesciencemagorgcontent30356651777full

Asociacioacuten Espantildeola de Normalizacioacuten y Certificacioacuten (2015) UNE 178301 Ciudades Inteligentes Datos Abiertos (Open Data) Madrid AENOR Beagrie C amp Houghton J (2014) The Value and Impact of Data Sharing and Curation A synthesis of three recent studies of UK research data centres Disponiacutevel na WWW httprepositoryjiscacuk55681iDF308_-_Digital_Infrastructure_Directions_Report2C_Jan14_v1-04pdf

Beall J (2012) Predatory publishers are corrupting open access Nature 489(7415) 179 Disponiacutevel na WWW httpswwwnaturecomnewspredatory-publishers-are-corrupting-open-access-111385

Bell G (2009) Foreword In Hey T Tansley S amp Tolle K (eds) (2009) The Fourth Paradigm Data-Intensive Scientific Discovery (pp XI-XV) Microsoft Research Disponiacutevel na WWW httpwwwastrocaltechedu~georgeaybi1994th_paradigm_book_complete_lrpdf

Berners-Lee Tim (2010) Is your Linked Open Data 5 Star Disponiacutevel na WWW httpswwww3orgDesignIssuesLinkedDatahtml

Big Data Europe (2016) Big Data Europe Empowering Communities with Data Technologies [Consultado a 22-11-2016] Disponiacutevel na WWW httpswwwbig-data-europeeu

BioDatapt Recursos [Consultado a 18-05-2017] Disponiacutevel na WWW httpwwwbiodataptresourceshtml

Biosharingorg (2017) Policies [Consultado a 22-05-2017] Disponiacutevel na WWW httpsbiosharingorgpolicies

Bjoumlrk B-C Laakso M Welling P amp Paetau P (2014) Anatomy of green open access Journal of the American Society for Information Science and Technology 65 237ndash250 Disponiacutevel na WWW httponlinelibrarywileycomwol1doi101002asi22963full

BOAI - Budapest Open Access Initiative (2002) Disponiacutevel na WWW httpwwwbudapestopenaccessinitiativeorg

116

BOAI - Budapest Open Access Initiative (2012) Ten years on from the Budapest Open Access Initiative setting the default to open Disponiacutevel na WWW httpwwwbudapestopenaccessinitiativeorgboai-10-recommendations

Borges M M (2006) A esfera comunicaccedilatildeo acadeacutemica e novos meacutedia (Tese de Doutoramento) Faculdade de Letras Universidade de Coimbra Portugal Disponiacutevel na WWW httpsestudogeralsibucptjspuibitstream1031685575MMBorges_tesepdf

Borgman C L (2015) Big Data Little Data No Data Scholarship in the Networked World The MIT Press

Bueno de la Fuente G (2016) What is Open Science Introduction Disponiacutevel na WWW httpswwwfosteropenscienceeucontentwhat-open-science-introduction

Cabinet Office (2012) Open Data White Paper Unleashing the Potential Disponiacutevel na WWW httpsdatagovuksitesdefaultfilesOpen_data_White_Paperpdf

Cabinet Office (2013) G8 Open Data Charter and Technical Annex Disponiacutevel na WWW httpswwwgovukgovernmentpublicationsopen-data-charterg8-open-data-charter-and-technical-annex

Cambridge University Press (2017) Cambridge Dictionary Disponiacutevel na WWW httpdictionarycambridgeorgdictionaryenglishpolicy

Carrara W Chan W S Fischer S Steenbergen E (2015) Creating Value through Open Data Study on the Impact of Re-use of Public Data Resources Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_creating_value_through_open_data_0pdf

Carrara W Fischer S Oudkerk F S Steenbergen E amp Tinholt D (2015) Analytical Report 1 Digital Transformations and Open Data Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_analytical_report_n1_-_digital_transformationpdf Carrara W Fischer S Steenbergen E (2015) Analytical Report 2 E-skills and Open Data Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_analytical_report_n2_-_e-skillspdf Carrara W Nieuwenhuis M amp Vollers H (2016) Open Data Maturity in Europe 2016 Insights into the European state of play Disponiacutevel na WWW httpswwwcapgemini-consultingcomresource-file-accessresourcepdfopen_data_maturity_in_europe_2016_final_v10_0pdf

Carrara W Oudkerk F Steenbergen E Tinholt D (2016a) European Data Portal Open Data Goldbook for Data Managers and Data Holders Capgemini Consulting Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesgoldbookpdf

117

Carrara W Engbers W Nieuwenhuis M amp Steenbergen E (2016b) Analytical report nordm4 Open Data in Cities Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_analytical_report_n4_-_open_data_in_cities_v10_finalpdf

Caruso J Nicol A amp Archambault Eacute (2013) Open Access Strategies in the European Research Area (August) 1ndash46 Retrieved from httpeuropaeurapidpress-release_IP-13-786_enhtmlocale=ennhttpwwwscience-metrixcompdfSM_EC_OA_Policiespdf

Carvalho J Furtado F amp Priacutencipe P (2017) WP4 ndash D25 ndash Kit sobre dados de investigaccedilatildeo RCAAP Disponiacutevel na WWW httpprojectorcaapptindexphplang-ptconsultar-recursos-de-apoioremositoryfunc=finishdownampid=395

Christensen-Dalsgaard B et al (2012) Ten recommendations for libraries to get started with research data management Final report of the LIBER working group on E-Science Research Data Management Disponiacutevel na WWW httplibereuropeeuwp-contentuploadsThe20research20data20group20201220v720finalpdf

CKAN CKAN The open source data portal software Disponiacutevel na WWW httpckanorg

Colpaert P Sarah J Peter M Mannens E Van de Walle R (2013) The 5 star of open data portals 7th internacional conference on methodologies Technologies and tools enabling e-Government (MeTTeG) 61-67 Disponiacutevel na WWW httppieterpm5stardataportals5starsofopendataportalspdf

Comissatildeo de Acesso aos Documentos Administrativos (CADA) Quem somos Disponiacutevel na WWW httpwwwcadapt

Comissatildeo Europeia (2011) Open data an engine for innovation growth and transparent governance Communication from the Commission to the European Parliament the Council the European economic and social committee and the committee of the regions (COM [2011] 882) Disponiacutevel na WWW httpwwweuroparleuropaeuRegDatadocs_autres_institutionscommission_europeennecom20110882COM_COM282011290882_ENpdf

Comissatildeo Europeia (2012) COMUNICACcedilAtildeO DA COMISSAtildeO AO PARLAMENTO EUROPEU AO CONSELHO AO COMITEacute ECONOacuteMICO E SOCIAL EUROPEU E AO COMITEacute DAS REGIOtildeES - Melhorar o acesso agrave informaccedilatildeo cientiacutefica rentabilizar o investimento puacuteblico em investigaccedilatildeo COM (2012) 401 final Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentENTXTuri=COM20120401FIN

Comissatildeo Europeia (2013) EU implementation of the G8 Open Data Charter Disponiacutevel na WWW httpseceuropaeudigital-single-marketnewseu-implementation-g8-open-data-charter

Comissatildeo Europeia (2014) COMUNICACcedilAtildeO DA COMISSAtildeO AO PARLAMENTO EUROPEU AO CONSELHO AO COMITEacute ECONOacuteMICO E SOCIAL EUROPEU E AO COMITEacute DAS REGIOtildeES - Para

118

uma economia dos dados proacutespera COM(2014) 442 final Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentENTXTuri=COM20140442FIN

Comissatildeo Europeia (2016a) Open innovation Open Science open to the world A vision for Europe Brussels European Commission Directorate-General for Research and Innovation Disponiacutevel na WWW httpbookshopeuropaeuenopen-innovation-open-science-open-to-the-world-pbKI0416263

Comissatildeo Europeia (2016b) Research amp Innovation News Alert Commission proposes copyright exception for researchers Disponiacutevel na WWW httpeceuropaeuresearchindexcfmpg=newsalertampyear=2016ampna=na-140916

Comissatildeo Europeia (2016c) COMUNICACcedilAtildeO DA COMISSAtildeO AO PARLAMENTO EUROPEU AO CONSELHO AO COMITEacute ECONOacuteMICO E SOCIAL EUROPEU E AO COMITEacute DAS REGIOtildeES ndash Iniciativa Europeia para a Nuvem ndash Construir uma economia de dados e conhecimento competitiva na Europa COM(2016) 178 final Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentPTALLuri=CELEX52016DC0178

Comissatildeo Europeia (2016d) Europa liacuteder mundial da economia baseada nos dados graccedilas agrave iniciativa europeia para a computaccedilatildeo em nuvem Comissatildeo Europeia comunicado de imprensa Disponiacutevel na WWW httpeuropaeurapidpress-release_IP-16-1408_pthtm

Comissatildeo Europeia (2017a) Digital Single Market Digital Economy amp Society Disponiacutevel na WWW httpseceuropaeudigital-single-marketenwhat-big-data-can-do-you

Comissatildeo Europeia (2017b) H2020 Programme AGA ndash Annotated Model Grant Agreement Disponiacutevel na WWW httpeceuropaeuresearchparticipantsdatarefh2020grants_manualamgah2020-amga_enpdf

Comissatildeo Europeia (2017c) COMUNICACcedilAtildeO DA COMISSAtildeO AO PARLAMENTO EUROPEU AO CONSELHO AO COMITEacute ECONOacuteMICO E SOCIAL EUROPEU E AO COMITEacute DAS REGIOtildeES - Construir uma economia de dados proacutespera COM(2017) 9 final Disponiacutevel na WWW httpeceuropaeutransparencyregdocrep12017PTCOM-2017-9-F1-PT-MAIN-PART-1PDF

Comissatildeo Europeia Grupo de peritos de alto niacutevel em dados de investigaccedilatildeo (2010) Riding the wave how Europe can gain from the rising tide of scientific data Disponiacutevel na WWW httpeceuropaeuinformation_societynewsroomcfitemlongdetailcfmitem_id=6204

Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2016a) H2020 Programme Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020 Disponiacutevel na WWW httpseceuropaeuresearchparticipantsdatarefh2020grants_manualhioa_piloth2020-hi-oa-pilot-guide_enpdf

Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2016b) Realising the European Open Science Cloud First report and recommendations Group of the Commission

119

High Level Expert Cloud on the European Open Science Luxemburgo Publications Office of the European Union Disponiacutevel na WWW httpseceuropaeuresearchopensciencepdfrealising_the_european_open_science_cloud_2016pdf

Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2016c) H2020 Programme Guidelines on FAIR Data Management in Horizon 2020 Disponiacutevel na WWW httpeceuropaeuresearchparticipantsdatarefh2020grants_manualhioa_piloth2020-hi-oa-data-mgt_enpdf

Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2017) Open Science Monitor Disponiacutevel na WWW httpeceuropaeuresearchopenscienceindexcfmpg=aboutampsection=monitor

Comissatildeo Executiva Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta (Comissatildeo Executiva GT-PNCA) (2016) Primeiro Relatoacuterio da Comissatildeo Executiva Grupo de Trabalho Para a Poliacutetica Nacional de Ciecircncia Aberta Disponiacutevel na WWW httpmediawixcomugda8bd7c_1ca622bff7f34abbad228ac94e1eda16pdf

Concordat on Open Research Data (2016) Disponiacutevel na WWW httpwwwrcukacukdocumentsdocumentsconcordatonopenresearchdata-pdf

Croll A (2012) The feedback economy In Planning for big data (pp 1-8) Sebastepol OacuteReilly Media

Cybermetrics Lab (2017) Ranking web of repositories [Consultado a 02-02-2017] Disponiacutevel na WWW httprepositorieswebometricsinfoen

Dallmeier-Tiessen et al (2011) Highlights from the SOAP project survey What Scientists Think about Open Access Publishing arXiv11015260 [Cs] 14 httpsarxivorgabs11015260

DataCite (2017a) re3data registry of research data repositories [Consultado a 02-05-2017] Disponiacutevel na WWW httpwwwre3dataorg

DataCite (2017b) Search [Consultado a 02-05-2017] Disponiacutevel na WWW httpssearchdataciteorg

Data Documention Iniciative (DDI) (2016) Document Discover and Interoperate Disponiacutevel na WWW httpwwwddiallianceorg

DataHub Datasets [Consultado a 03-01-2017] Disponiacutevel na WWW httpsdatahubiodatasetq=portugalamppage=1

DataCite (2017) Search [Consultado a 18-05-2017] Disponiacutevel na WWW httpssearchdataciteorg

Davies T (2012) 5-Stars of Open Data Engagement Disponiacutevel na WWW httpwwwtimdaviesorguk201201215-stars-of-open-data-engagement

Davies T (2014) Open data policies and practice an internacional comparison Paper for European Consortium for Political Research Panel P356 ndashThe Impacts of Open Data Disponiacutevel na WWW httpsecpreuFilestorePaperProposald591e267-cbee-4d5d-b699-7d0bda633e2epdf

120

Dawes S Vidiasova L amp Parkhimovich O (2016) Planning and designing open government data programs An ecosystem approach Government Information Quarterly 33(1) 15-27 Disponiacutevel na WWW httpwwwsciencedirectcomsciencearticlepiiS0740624X1630003X

Declaraccedilatildeo de Bethesda sobre a Publicaccedilatildeo em Acesso Aberto (2003) Disponiacutevel na WWW httplegacyearlhamedu~petersfosbethesdahtm

Declaraccedilatildeo de Berlim sobre Acesso Livre ao Conhecimento nas Ciecircncias e Humanidades (2003) Disponiacutevel na WWW httpsrepositoriumsdumuminhoptaboutDeclaracaoBerlimhtm

Decreto-Lei nordm 1152013 de 7 de agosto do Ministeacuterio da Educaccedilatildeo e Ciecircncia Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 151 (2013) 4749-4772 Disponiacutevel na WWW httpsdreptapplicationdirpdf1sdip201308151000474904772pdf

Despacho nordm 153892016 de 12 de dezembro do Ministeacuterio das Financcedilas e da Secretaria de Estado da Cultura e Ciecircncia Tecnologia e Ensino Superior Diaacuterio da Repuacuteblica nordm 2442016 Seacuterie II Nordm 244 (2016) 37155 ndash 37156 Disponiacutevel na WWW httpsdreptapplicationfilea105580126

Dietrich D (2013) Open Government Data principles concepts amp best practice Disponiacutevel na WWW httpworkspaceunpanorgsitesInternetDocumentsUNPAN95209pdf

Dietrich D Cherkasov V Susar D (2013) Open Government Data for Citizen Engagement in Managing Development Disponiacutevel na WWW httpworkspaceunpanorgsitesInternetDocumentsOGDCE20Toolkit20v113-Feb2013pdf

Directory of Open Access Journals (DOAJ) (2017) Search [Consultado a 27-05-2017] Disponiacutevel na WWW httpsdoajorg

Dodds L Newman A (2015) Open Data Maturity Model ed 10 Disponiacutevel na WWW httptheodiorgguidesmaturity-model

Donker F amp van Loenen B (2017) How to assess the sucess of the open data ecossystem Internacional journal of digital eart 10(3) 284-306 Disponiacutevel na WWW httpwwwtandfonlinecomdoifull1010801753894720161224938

Dumbill E (2012) What is Big Data In Planning for big data (pp 9-16) Sebastepol OacuteReilly Media Disponiacutevel na WWW httpeecswsuedu~yinghuimatcoursesfall202015resourcesplanning-for-big-datapdf

e-Infraestruture Reflection Group (e-IRG) (2016) Long Tail of Data e-IRG Task Force Report Disponiacutevel na WWW httpe-irgeudocuments10920238968LongTailOfData2016pdf

ELIXIR Portugal (2015) What is ELIXIR Portugal Disponiacutevel na WWW httpelixir-portugalorg

ePSI Scoreboard (2013) ePSI platform scoreboard Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesoverview_page_-_epsi_platform_scoreboardpdf

Etalab (2011) Licence Ouvert Disponiacutevel na WWW httpswwwetalabgouvfrenlicence-ouverte-open-licence

EUDAT(a) What is EUDAT Disponiacutevel na WWW httpseudateuwhat-eudat

121

EUDAT(b) B2FIND [Consultado a 22-05-2017] Disponiacutevel na WWW httpb2findeudateu

EUR-Lex (2003a) Directive 200398EC of the European Parliament and of the Council of 17 November 2003 on the re-use of public sector information Official Journal of the European Union 90-96 Disponiacutevel na WWW httpeur-lexeuropaeuLexUriServLexUriServdouri=OJL200334500900096enPDF

EUR-Lex (2003b) Directive 20034EC of the European Parliament and of the Council of 28 January 2003 on public access to environmental information and repealing Council Directive 90313EEC Official Journal of the European Union 26-32 Disponiacutevel na WWW httpeur-lexeuropaeuLexUriServLexUriServdouri=OJL200304100260032ENPDF

EUR-Lex (2011) COMMISSION DECISION of 12 December 2011 on the reuse of Commission documents (2011833EU) Official Journal of the European Union 39-42 Disponiacutevel na WWW httpeur-lexeuropaeuLexUriServLexUriServdouri=OJL201133000390042ENPDF

EUR-Lex (2012) COMMISSION RECOMMENDATION of 17 July 2012 on access to and preservation of scientific information (2012417EU) Official Journal of the European Union 39-43 Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentENTXTuri=celex3A32012H0417

EUR-Lex (2013) Directive 201337EU of the European Parliament and of the Council of 26 June 2013 amending Directive 200398EC on the re-use of public sector information Official Journal of the European Union 1ndash8 Disponiacutevel na WWW httpeur-lexeuropaeuLexUriServLexUriServdouri=OJL201317500010008ENPDF

EUR-Lex (2016) REGULAMENTO (UE) 2016679 DO PARLAMENTO EUROPEU E DO CONSELHO de 27 de abril de 2016 relativo agrave proteccedilatildeo das pessoas singulares no que diz respeito ao tratamento de dados pessoais e agrave livre circulaccedilatildeo desses dados e que revoga a Diretiva 9546CE (Regulamento Geral sobre a Proteccedilatildeo de Dados) Jornal Oficial da Uniatildeo Europeia 1-88 Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentPTTXTPDFuri=CELEX32016R0679ampfrom=PT

European Data Portal (2016) Conjuntos de dados [Consultado a 12-05-2017] Disponiacutevel na WWW httpswwweuropeandataportaleudataptdataset

European Research Area and Innovation Committee (ERAC) (2016) ERAC opinion on open research data (ERAC 120216) Disponiacutevel na WWW httpwwweartoeufileadmincontentWebsiteERAC_Opinion_on_Open_Research_DataPDF

Erway R Horton L Nurnberger A Otsuji R amp Rushing A (2016) Building blocks laying the foundation for a research data management program Dublin Ohio OCLC Research Disponiacutevel na WWW httpswwwoclcorgcontentdamresearchpublications2016oclcresearch-data-management-building-blocks-2016pdf

Expert Advisory Group on Data Acess (EAGDA) (2014) Establishing Incentives and changing cultures to support data acess Disponiacutevel na WWW httpswellcomeacuksitesdefaultfilesestablishing-incentives-and-changing-cultures-to-support-data-access-eagda-may14pdf

Executive Office of the President Office of Managment and Budget (2013) MEMORANDUM FOR THE HEADS OF EXECUTIVE DEPARTMENTS AND AGENCIES Open Data Policy - Managing Information as an Asset Disponiacutevel na WWW

122

httpsobamawhitehousearchivesgovsitesdefaultfilesombmemoranda2013m-13-13pdf

Fan W amp Bifet A (2012) Mining Bid Data Current Status and Forecast to the Future SIGKDDExplorations 14(2) 1-5 Disponiacutevel na WWW httpwwwkddorgexploration_filesV14-02-01-Fanpdf

Fecher B amp Friesike S (2013) Open Science One Term Five Schools of Thought In Bartling S amp Friesike (Eds) Opening Science (pp 17-47) New York Springer Disponiacutevel na WWW httpswwwresearchgatenetpublication236607487_Open_Science_One_Term_Five_Schools_of_Thought

FIWARE (2015) Porto a city that has become a real-time guide Disponiacutevel na WWW httpswwwfiwareorg20151120porto-a-city-that-has-become-a-real-time-guide

FORCE11 FAIR Data Publishing Group (2014) The FAIR Data Principles Disponiacutevel na WWW httpswwwforce11orggroupfairgroupfairprinciples

Forsstroumlm P amp Haataja J (2016) Open Science as an Instrument for Effective Research Disponiacutevel na WWW httpojstsvfiindexphpsignumarticleviewFile5874120303

FOSTER (2016) About FOSTER portal Disponiacutevel na WWW httpswwwfosteropenscienceeuabout

Fundaccedilatildeo para a Ciecircncia e Tecnologia [FCT] (2014) Poliacutetica sobre a Disponibilizaccedilatildeo de Dados e outros Resultados de Projetos de IampD Financiados Pela FCT Disponiacutevel na WWW httpswwwfctptdocumentosPoliticaAcessoAberto_Dadospdf

G20rsquos Anti-corruption Working Group (2014) G20 Anti-corruption Open Data Principles Disponiacutevel na WWW httpwwwg20utorontoca2015G20-Anti-Corruption-Open-Data-Principlespdf

Garcia M (2015) New businesses around open data smart cities and Fiware European Public Sector Information Platform Topic Report Nordm 201504 Disponiacutevel na WWW httpwwwinvesthorizoneuresourcesdocuments6263232145-New-Businesses-Around-Open-Data-Smart-Cities-FIWAREpdf

Garfield E (2006) The History and Meaning of the Journal Impact Factor Journal of the American Medical Association (JAMA) 293 90-93 Disponiacutevel na WWW httpgarfieldlibraryupennedupapersjifchicago2005pdf

GitHub (2017) Search [Consultado a 18-05-2017] Disponiacutevel na WWW httpsgithubcomsearchutf8=E29C93ampq=portugalamptype=

Gomes A amp Soares D (2014) Open government iniciatives in Europe nothern versus Southern countries analysis In ICEGOV2014 Outubro 27-30 Guimaratildees Portugal Disponiacutevel na WWW httphdlhandlenet182237172

Gonzalez-Zapata F amp Heeks R (2015) The multiple meanings of open government data understanding different stakeholders and their perspectives Government Information Quarterly 32(4) 441-452 Disponiacutevel na WWW httpsdoiorg101016jgiq201509001

123

Granickas K (2013) Understanding the impact of releasing and re-usinf open government data European Public Sector Information Platform Topic Report Nordm 2013 08 Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfileslibrary201308_understanding_the_impact_of_releasing_and_re_using_open_datapdf

Hahnel M amp Hook D (2016) Open by default In Treadway J et al The state of open data a selections of analyses and articles about open data curated by Figshare (pp 3-6) Disponiacutevel na WWW httpsfigsharecomarticlesThe_State_of_Open_Data_Report40363981

Harnad S et al (2004) The AccessImpact Problem and the green and gold roads to Open Access Serials Review 30(4) Disponiacutevel na WWW httpusersecssotonacukharnadTempimpacthtml

Harnad S amp Brody T (2004) Comparing the Impact of Open Access (OA) vs Non-AO Articles in the Same Journals D-Lib Magazine 10(6) Disponiacutevel na WWW httpwwwdliborgdlibjune04harnad06harnadhtml

Hernaacutendez-Peacuterez T (2016) En la era de la web de los datos primero datos abiertos despueacutes datos massivos El profesional de la informacioacuten 25(4) 517-525 Disponiacutevel na WWW httpsdoiorg103145epi2016jul01

Hey T Tansley S amp Tolle K (2009) Jim Gray on eScience A Transformed Scientific Method In Hey T Tansley S amp Tolle K (eds) (2009) The Fourth Paradigm Data-Intensive Scientific Discovery (pp 5-12) Microsoft Research Disponiacutevel na WWW httpwwwastrocaltechedu~georgeaybi1994th_paradigm_book_complete_lrpdf

Hogge B (2010) Open Data Study Open Society Institute Disponiacutevel na WWW httpwwwtransparencyinitiativeorgwpcontentuploads201105open_data_study_finalpdf

Houghton J amp Swan A (2013) Planting the green seeds for a golden harvest Comments and clarifications on ldquoGoing for Goldrdquo D-Lib Magazine 19 1ndash2 Disponiacutevel na WWW httpdoiorg101045january2013-houghton

Huijboom N van den Broek T (2011) Open Data an internacional comparison of strategies European Journal of ePractice 12 4-16 Disponiacutevel na WWW httpsjoinupeceuropaeusitesdefaultfiles76a705ePractice20Journal-20Vol2012-March_April202011pdf

Internacional Council for Science (ICSU) (2014) Open acess to scientific data and literature and the assessement of research by metrics Disponiacutevel na WWW httpwikilibsunaczaimagesbb8Icsu-report-on-open-accesspdf

International Open Data Charter (2015) Open Data Charter Disponiacutevel na WWW httpopendatacharternet

International Workshop on Open Data for Science and Sustainability in Developing Countries (2014) Data Sharing Principles in Developing Countries (The Nairobi Data Sharing Principles)

124

Disponiacutevel na WWW httpswwwrd-allianceorgsitesdefaultfilesattachmentNairobiDataSharingPrinciplespdf

Janssen M (2011) The influence of the PSI directive on open government data an overview of recent developments Government Information Quaterly 28 446-456 Disponiacutevel na WWW httpsdoiorg101016jgiq201101004

Janssen M Charalabidis Y amp Zuiderwijk A (2012) Benefits adoption barriers and myths of open data and open government Information Systems Management 4 258-268 Disponiacutevel na WWW httpwwwtandfonlinecomdoiabs101080105805302012716740

Jenssen K (2012) Open Government Data and the right to information opportunities and obstacles The Journal of Community Informatics 8 (2) Disponiacutevel na WWW httpci-journalnetindexphpciejarticleview952

Koski H (2015) The impact of open data ndash a preliminary study Ministry of Finance publications 15b2015 Disponiacutevel na WWW httpswwww3org2013share-psiwikiimages667Impact_of_Open_Data_in_the_Public_Sector_Koski_2015pdf

Kramer B amp Bosman J (2016) Innovations in Scholarly Communication [Consultado a 24-02-2017] Disponiacutevel na WWW https101innovationswordpresscom

Laakso M (2014) Green open access policies of scholarly journal publishers A study of what when and where self-archiving is allowed Scientometrics 99(2) 475ndash494 Disponiacutevel na WWW httpdoiorg101007s11192-013-1205-3

Laumlmmerhirt D (2016) PASTEUR4OA Briefing Paper Disciplinary differences in opening research data Disponiacutevel na WWW httpwwwpasteur4oaeuresources209

Laney D (2001) 3-D Data Management Controlling DataVolume Velocity and Variety META Group Disponiacutevel na WWW httpswwwnoexperiencenecessarybookcom8VeXJ3d-data-management-controlling-data-volume-velocity-and-varietyhtml

Lei nordm 462007 de 24 de Agosto Regula o acesso aos documentos administrativos e a sua reutilizaccedilatildeo revoga a Lei nordm 6593 de 26 de Agosto com a redaccedilatildeo introduzida pelas Lei nordm 895 de 29 de Marccedilo e 9499 de 16 de Julho e transpotildee para a ordem juriacutedica nacional a Diretiva nordm 200398CE do Parlamento e do Conselho de 17 de Novembro relativa agrave reutilizaccedilatildeo de informaccedilotildees do sector puacuteblico Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 163 (2007) 5680-5687 Disponiacutevel na WWW httpswwwfctptarquivodocsLei46_2007pdf

Lei nordm 362011 de 21 de Junho Estabelece a adopccedilatildeo de normas abertas nos sistemas informaacuteticos do Estado Diaacuterio da Repuacuteblica 1ordf seacuterie mdash Nordm 118 (2011) 3599-3600 Disponiacutevel na WWW httpsm6amaptdocsLei362011-NormasAbertaspdf

Lei nordm 262016 de 22 de Agosto Aprova o regime de acesso agrave informaccedilatildeo administrativa e ambiental e de reutilizaccedilatildeo dos documentos administrativos transpondo a Diretiva 20034CE do Parlamento Europeu e do Conselho de 28 de janeiro e a Diretiva 200398CE do Parlamento Europeu e do Conselho de 17 de novembro Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 160 (2016) 2777-2788 Disponiacutevel na WWW httpsdreptapplicationconteudo75177801

125

Leonelli S (2016) Why open data now Big data knowledge production and the political economy of research In Treadway J et al The state of open data a selections of analyses and articles about open data curated by Figshare (pp 7-11) Disponiacutevel na WWW httpsfigsharecomarticlesThe_State_of_Open_Data_Report40363981

Leonelli S Spichtinger D and Prainsack B (2015) Sticks and carrots encouraging open science at its source Geography and Environment 2 12ndash16 Disponiacutevel na WWW httponlinelibrarywileycomenhancedexportCitationdoi101002geo22

Lisboa Cacircmara Municipal (2016) Smart Open Lisboa Disponiacutevel na WWW httpwwwsmartopenlisboacom

Lisboa Cacircmara Municipal (2017) Lisboa Aberta [Consultado a 12-05-2017] Disponiacutevel na WWW httpdadoscm-lisboaptdataset

Lynch C (2009) Jim Grayrsquos Fourth Paradigm and the Construction of the Scientific Record In Hey T Tansley S amp Tolle K (eds) (2009) The Fourth Paradigm Data-Intensive Scientific Discovery (pp 177-183) Microsoft Research Disponiacutevel na WWW httpwwwastrocaltechedu~georgeaybi1994th_paradigm_book_complete_lrpdf

Machado Jorge (2015) Open Data and Open Science In Albagli S Maciel M amp Abdo A (Eds) Open Science Open Issues 189-214 Brasiacutelia IBICT Rio de Janeiro Unirio Disponiacutevel na WWW httplivroabertoibictbrbitstream110611Open20Science20open20issues_Digitalpdf

Manyika J Chui M Brown B Bughin J Dobbs R Roxburgh C amp Byers A H (2011) Big Dat The next frontier for innovation competition and productivity McKinsey Global Institute Disponiacutevel na WWW httpwwwmckinseycombusiness-functionsdigital-mckinseyour-insightsbig-data-the-next-frontier-for-innovation

Marr B (2014) Big Data The 5 Vs Everyone Must Know Disponiacutevel na WWW httpswwwlinkedincompulse20140306073407-64875646-big-data-the-5-vs-everyone-must-know

Naccedilotildees Unidas (2015) Addis Ababa Action Agenda of the Third International Conference on Financing for Development (Addis Ababa Action Agenda) Disponiacutevel na WWW httpssustainabledevelopmentunorgcontentdocuments2051AAAA_Outcomepdf

National Institutes of Health (NIH) (2008) NIH Guide Notice for Public Access Disponiacutevel na WWW httpgrantsnihgovgrantsguidenotice-filesNOT-OD-08-033html

Nature Springer (2016) Over 600 Springer Nature journals commit to new data sharing policies Disponiacutevel na WWW httpwwwspringernaturecombrgroupmediapress-releasesover-600-springer-nature-journals-commit-to-new-data-sharing-policies11111248

OECD (2007) Principles and Guidelines for Access to Research Data from Public Funding Paris OECD Publishing Disponiacutevel na WWW httpwwwoecdorgstisci-techoecdprinciplesandguidelinesforaccesstoresearchdatafrompublicfundinghtm

126

OECD (2013) Open Government data In Government at a Glance 2013 (pp 140-142) Paris OECD Publishing Disponiacutevel na WWW httpdxdoiorg101787gov_glance-2013-48-en

OECD (2015a) Making Open Science a Reality OECD Science Tecnology and Industy Policy Papers 25 Paris OECD Publications Disponiacutevel na WWW httpdoiorg1017875jrs2f963zs1-en

OECD (2015b) Assessing government initiatives on public sector information A review of the OECD Council Recommendation OECD Digital Economy Papers 248 Paris OECD Publishing Disponiacutevel na WWW httpdxdoiorg1017875js04dr9l47j-en

OECD (2016a) Open Government Data Disponiacutevel na WWW httpwwwoecdorggovdigital-governmentopen-government-datahtm

OECD (2016b) Observatory of Public Sector Innovation Disponiacutevel na WWW httpswwwoecdorggovernanceobservatory-public-sector-innovationhome

Olavsrud T (2013 Abril 05) 10 intriguing real-world uses for big data Computer World Disponiacutevel na WWW httpwwwcomputerworldcomarticle2473691big-data92712-10-Real-World-Big-Data-Deployments-That-Will-Change-Our-Liveshtml

Open Acess Directory (2016) Data repositories [Consultado a 22-02-2017] Disponiacutevel na WWW httpoadsimmonseduoadwikiData_repositories

OpenAIRE Research Data [Consultado a 12-05-2017] Disponiacutevel na WWW httpswwwopenaireeusearchfinddatasetskeyword=

OpenAIRE (2017) About OpenAIRE-Connect Disponiacutevel na WWW httpswwwopenaireeuconnect

Open and Agile Smart Cities (OASC) (2017) Cities [Consultado a 17-05-2017] Disponiacutevel na WWW httpwwwoascitiesorglist-of-cities

Open Data for Development Network (OD4D[a]) About OD4D [Consultado a 16-02-2017] Disponiacutevel na WWW httpod4dcomabout

Open Data for Development Network (OD4D[b]) Open Data Impact Map [Consultado a 16-02-2017] Disponiacutevel na WWW httpopendataimpactmaporgindexhtml

Open Data for Development Network (OD4D) (2016) Summary report and the Second Action Plan for International Collaborations International Open Data Roadmap International Open Data Conference 2016 6-7 outubro Madrid Espanha Disponiacutevel na WWW httpod4dcomroadmapassetsfilesreport-iodc-2016-webpdf

Open Data Institute (ODI) (2012) About the ODI Disponiacutevel na WWW httptheodiorgabout

Open Data Institute (ODI) (2015) Open Data Maturity Model assessing your open data publishing and use Disponiacutevel na WWW httpsptscribdcomdocument260481608ODI-Maturity-Model-Guide-Assessing-your-open-data-publishing-and-use

127

Open Data Soft (2017) A comprehensive list of 2600+ Open Data portals around the world [Consultado a 15-04-2017] Disponiacutevel na WWW httpswwwopendatasoftcoma-comprehensive-list-of-all-open-data-portals-around-the-world

Open Government Partnership (OGP) (2011) Open Government Declaration Disponiacutevel na WWW httpswwwopengovpartnershiporgopen-government-declaration

Open Government Partnership (OGP) (2015) What is the Open Government Partnership Disponiacutevel na WWW httpwwwopengovpartnershiporg

Open Government Partnership (OGP) (2016) PARIS DECLARATION 4th Global Summit of the Open Government Partnership Disponiacutevel na WWW httpwwwopengovpartnershiporgsitesdefaultfilesOGP-Summit_PARIS-DECLARATION_ENpdf

Open Knowledge International (OKI [a]) Open Definition 21 Disponiacutevel na WWW httpopendefinitionorgod21en

Open Knowledge International (OKI [b]) Linked Open Vocabularies [Consultado a 31-01-2017] Disponiacutevel na WWW httplovokfnorgdatasetlov

Open Knowledge International (OKI [c]) Open Data Commons Disponiacutevel na WWW httpopendatacommonsorg

Open Knowledge International (OKI [d]) Datahub [Consultado a 18-02-2017] Disponiacutevel na WWW httpsdatahubio

Open Knowledge International (OKI) (2012a) The Open Data Handbook Disponiacutevel na WWW httpopendatahandbookorgguideen

Open Knowledge International (OKI) (2012b) What is open Disponiacutevel na WWW httpsokfnorgopendata

Open Knowledge International (OKI) (2014) Portugal Open Data Census Disponiacutevel na WWW httppt-citycensusokfnorgyear2014

Open Knowledge International (OKI) (2017) Global Open Data Index Disponiacutevel na WWW httpindexokfnorgplace

Open Knowledge International Working Group on Open Government Data () Open Government Data Disponiacutevel na WWW httpopengovernmentdataorg

Open Science and Research Iniciative (2014) The Open Science and Research Handbook Disponiacutevel na WWW httpsavointiedefidocuments142730Open+Science+and+Research+Handbook+v1050316d5d-440b-4496-b039-2997663afff8

Open Science Monitor (2015) Open Science Monitor Disponiacutevel na WWW httpopendatamonitoreu

128

Pangea (2017) Search [Consultado a 18-05-2017] Disponiacutevel na WWW httpswwwpangaeadeq=Portugal

Panton Principles (2010) Panton Principles Principles for open data in science Disponiacutevel na WWW httppantonprinciplesorg

Pasqueto I Sands A amp Borgman C (2015 novembro) Exploring openess in data and science What is ldquoopenrdquo to whom when and why Apresentado em ASIST 2015 6 - 10 Novembro St Louis MO USA Disponiacutevel na WWW httponlinelibrarywileycomdoi101002pra220151450520100141full

Pontika N Knoth P Cancellieri M amp Pearce S (2015 outubro) Fostering Open Science to Research using a Taxonomy and an eLearning Portal Apresentado em I-KNOW rsquo15 Proceedings of the 15th International Conference on Knowledge Technologies and Data-Driven Busines 21 - 22 Outubro 2015 1ndash8 Graz Austria Disponiacutevel na WWW httpdoiorg10114528095632809571

Pontika N Knoth P Cancellieri M amp Pearce S (2015) Open Science Taxonomy Figshare Disponiacutevel na WWW httpsdxdoiorg106084m9figshare1508606v3

Portal de Dados de Biodiversidade de Portugal (2016) Dados [Consultado a 18-05-2017] Disponiacutevel na WWW httpdadosgbifpt

Portaria nordm 2852015 de 15 de setembro do Ministeacuterio da Educaccedilatildeo e Ciecircncia Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 180 (2015) 8011-8014 Disponiacutevel na WWW httpsdreptapplicationconteudo70297426 Porto Cacircmara Municipal Dados Abertos para uma cidade mais inteligente [Consultado a 22-05-2017] Disponiacutevel na WWW httpdadosabertoscm-portoptabout

Portugal Governo (2017) Portal da Transparecircncia Municipal [Consultado a 20-05-2017] Disponiacutevel na WWW httpswwwportalmunicipalpthomelocale=pt

Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior Ministeacuterio da Cultura (2016) Diretoacuterio dos Repositoacuterios Digitais Disponiacutevel na WWW httprepositorios-conhecimentopt

Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior (MCTES) (2016) Ciecircncia Aberta Conhecimento para todos Princiacutepios orientadores Disponiacutevel na WWW httpwwwportugalgovptmedia1850619920160210-mctes-ciencia-abertapdf

Price D amp Chaytor S (2015) Open Access is a national licence the answer Disponiacutevel na WWW httpwwwhepiacuk20150330open-access-national-licence-answeruna-licencia-nacional-es-la-respuesta

Proumll S Meixner K amp Rauber A (2016) Precise Data Identification Services for Long Tail Research Data Proceedings of International Conference on Digital Preservation Bern Switzerland Disponiacutevel na WWW httpswwwrd-allianceorgsystemfilesdocumentsiPRES2016-Proellpdf

129

Rans J Day M Duke M amp Ball A (2013) Enabling the citation of datasets generated through public health research (DCC) 41 Retrieved from httpswellcomeacuksitesdefaultfilesenabling-citation-of-datasets-through-public-health-research-phrdf-2013PDF

RECODE (2014) Policy recommendations for open access to research data Disponiacutevel na WWW httprecodeprojecteuwp-contentuploads201501recode_guideline_en_web_version_full_FINALpdf

Registry of Open Access Repository Mandates and Policies (ROARMAP) Browse [Consultado a 25-11-2016] Disponiacutevel na WWW httproarmapeprintsorgviewcountry620html

Reitano S (2013) The Benefits of Open Data Royal Roads University Disponiacutevel na WWW httpdocplayernet589190-The-benefits-of-open-datahtml

Resoluccedilatildeo do Conselho de Ministros nordm 912010 Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 225 (2010) 5288-5307 Disponiacutevel na WWW httpsdreptapplicationdirpdf1s201011225000528805307pdf

Resoluccedilatildeo do Conselho de Ministros nordm 212016 Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 70 (2016) 1191-1193 Disponiacutevel na WWW httpsdreptapplicationconteudo74094659

Research Data Alliance (RDA) (2015) 23 Things Libraries for Research Data Disponiacutevel na WWW httpswwwrd-allianceorgsystemfilesdocuments23Things_Libraries_For_Data_Managementpdf

Ribeiro C et al (2016) Projeto TAIL ndash Gestatildeo de dados de investigaccedilatildeo da produccedilatildeo ao depoacutesito e agrave partilha (resultados preliminares) Cadernos BAD 2 (jul-dez) 256-264 Disponiacutevel na WWW httpwwwbadptpublicacoesindexphpcadernosarticleviewFile1603pdf

Rouder J (2016) The what why and how of born-open data Behavior Research Methods 48(3) 1062-1069 Disponiacutevel na WWW httplinkspringercomarticle103758s13428-015-0630-z

Royal Society (2012) Science as an Open Enterprise The Royal Society Policy Centre Report 0212 Disponiacutevel na WWW httpsroyalsocietyorgtopics-policyprojectsscience-public-enterprisereport

Sasse T Smith A Broad E Tennison J Wells P amp Atz U (2017) Recomendations for Open Data Portals from Setup to sustainability Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_s3wp4_sustainability_recommendationspdf

Schiermeier Q (2015 Dezembro 04) Pirate research-paper sites play hide-and-seek with publishers Nature Internacional weekly journal of science Disponiacutevel na WWW httpwwwnaturecomnewspirate-research-paper-sites-play-hide-and-seek-with-publishers-118876

130

Science International (2015) Open Data in a Big Data World Paris International Council for Science (ICSU) International Social Science Council (ISSC) The World Academy of Sciences (TWAS) InterAcademy Partnership (IAP) Disponiacutevel na WWW httpwwwscience-internationalorgsitesdefaultfilesreportsopen-data-in-big-data-world_short_enpdf

Science International (2016) About Science International Disponiacutevel na WWW httpwwwscience-internationalorgabout

ScienceOpen (2017) About ScienceOpen Disponiacutevel na WWW httpaboutscienceopencomcategoryabout-scienceopen

Sci-Hub About Disponiacutevel na WWW httpsci-hubio

Shadbolt N (2016) Foreword In Treadway J et al The state of open data a selections of analyses and articles about open data curated by Figshare (pp 2) Disponiacutevel na WWW httpsfigsharecomarticlesThe_State_of_Open_Data_Report40363981

SHERPAJULIET Research funders open access policies [Consultado a 26-11-2016] Disponiacutevel na WWW httpsherpaacukjulietindexphpla=enampmode=simple

SHERPARoMEO Publisher copyright policies amp self-archiving [Consultado a 26-11-2016] Disponiacutevel na WWW httpsherpaacukromeoindexphpla=enampfIDnum=1109|1ampmode=advanced

Soares N Baptista A amp Lima A (2015) Estudo Open Data Municiacutepios Quadrilaacutetero Disponiacutevel na WWW httpwwwccgptwp-contentuploads201510OpendataQuadrilatero_Estudopdf

SPARC Open Data Disponiacutevel na WWW httpsparcopenorgopen-data

Sponsoring Consortium for Open Access Publishing in Particle Physics (SCOAP3) (2014) What is SCOAP3 Disponiacutevel na WWW httpsscoap3orgwhat-is-scoap3

Statement on Data Sharing in Public Health Emergencies (2016) Disponiacutevel na WWW httpblogsplosorgplos201602statement-on-data-sharing-in-public-health-emergencies

Sturges P Bamkin M Anders J Hubbard B Hussain A amp Heeley M (2015) Research data sharing developing a stakeholder-driven model for journal policies Journal of the Association for Information Science and Technology 66(12) 2445-2455 Disponiacutevel na WWW httponlinelibrarywileycomdoi101002asi23336abstract

Suber P (2008) Open Access News Disponiacutevel na WWW httplegacyearlhamedu~petersfos200808greengold-oa-and-gratislibre-oahtml

Suber P (2009) Ten challenges for open-access journals SPARC Open Access Newsletter 138 Disponiacutevel na WWW httplegacyearlhamedu~petersfosnewsletter10-02-09htm

Suber P (2012) Open Access Cambridge MIT Press Disponiacutevel na WWW httpsmitpressmitedusitesdefaultfiles9780262517638_Open_Access_PDF_Versionpdf

131

Sunlight Foundation (2010) Ten Principles for Opening Up Government Information Disponiacutevel na WWW httpssunlightfoundationcompolicydocumentsten-open-data-principles

Sunlight Foundation (2013) Public Policy for Public Data Disponiacutevel na WWW httpwhatworkscitiessunlightfoundationcomsection-h2-02

Sunlight Foundation (2014) Guidelines for Open Data Policies Disponiacutevel na WWW httpssunlightfoundationcomopendataguidelines

Sunlight Foundation Open Data Policy Collection [Consultado a 12-05-2017] Disponiacutevel na WWW httpwwwopendatapoliciesorgbrowse

Swan A (2010) The open access citation advantage studies and results to date Disponiacutevel na WWW httpeprintssotonacuk2685162Citation_advantage_paperpdf

Swan A (2012) Diretrizes para as Poliacuteticas de desenvolvimento do acesso aberto UNESCO Paris Disponiacutevel na WWW httpunesdocunescoorgimages0021002158215863epdf

Tauberer Joshua (2014) Open Government Data The Book (2ordf ed) Disponiacutevel na WWW httpsopengovdataio20148-principles

Taunabaum G Implementing an Open Data Policy a SPARC Primer for Research Funders Disponiacutevel na WWW httpssparcopenorgwp-contentuploads201601sparc-open-data-primer-finalpdf

Transparecircncia e Integridade Associaccedilatildeo Ciacutevica (2016) Iacutendice de Transparecircncia Municipal Disponiacutevel na WWW httpstransparenciaptindice-de-transparencia-municipal

The UN Secretary Generals Independent Expert Advisory Group on a Data Revolution for Sustainable Development (2014a) UN Data Revolution Disponiacutevel na WWW httpwwwundatarevolutionorg

The UN Secretary Generals Independent Expert Advisory Group on a Data Revolution for Sustainable Development (2014b) A world that counts mobilising the data revolution for sustainable development Disponiacutevel na WWW httpwwwundatarevolutionorgwp-contentuploads201411A-World-That-Countspdf

The World Bank (2016) Open Government Data Toolkit Disponiacutevel na WWW httpopendatatoolkitworldbankorgenindexhtml

Ubaldi B (2013) Open Government Data Towards empirical analysis of open government data initiatives Disponiacutevel na WWW httpwwwoecd-ilibraryorggovernanceopen-government-data_5k46bj4f03s7-en

UK Data Archive (2017) Create amp Manage Data Research Data Lifecycle Disponiacutevel na WWW httpwwwdata-archiveacukcreate-managelife-cycle

UK The National Archives Open Government Licence for Public Sector Information Disponiacutevel na WWW httpwwwnationalarchivesgovukdocopen-government-licenceversion3

132

UNESCO (2015) Concepts of Openness and Open Access Open Access for Researchers Paris UNESCO Disponiacutevel na WWW httpunesdocunescoorgimages0023002322232207Epdf Uniatildeo Europeia (2013) REGULAMENTO (UE) Nordm 12912013 DO PARLAMENTO EUROPEU E DO CONSELHO de 11 de dezembro de 2013 Jornal Oficial da Uniatildeo Europeia Disponiacutevel na WWW httpeceuropaeuresearchparticipantsdatarefh2020legal_basisfph2020-eu-establact_ptpdf

Uniatildeo Europeia (2017) European Union Open Data Portal [Consultado a 12-05-2017] Disponiacutevel na WWW httpdataeuropaeueuodpendata

United Nations Statistics Division (2017) UN data a world of information [Consultado a 13-05-2017] Disponiacutevel na WWW httpdataunorgSearchaspxq=Portugalampt=Data

United States General Services Administration Datagov Disponiacutevel na WWW httpswwwdatagovopen-gov

Universidade do Minho (2017) Open Access Disponiacutevel na WWW httpsopenaccesssdumuminhoptpage_id=352

Universidade do Porto Faculdade de Engenharia (2017) Dendro The convergence between data management and description Disponiacutevel na WWW httpdendrofeupptblogindexphpdendro

Welcome Trust (2013) Open access policy Disponiacutevel na WWW httpswellcomeacukfundingmanaging-grantopen-access-policy

Whyte A amp Donnely M (2016) Common directions in research data policy a briefing for iInstitutions DCC Briefing Papers Edinburgh Digital Curation Centre Disponiacutevel na WWW httpwwwdccacukresourcesbriefing-paperscommon-directions-research-data-policycommon-directions-research-data-pol

World Council on City Data (2016) Data Portal [Consultado a 12-04-2017] Disponiacutevel na WWW httpopendataforcitiesorg

World Wide Web Consortium [W3C] (2014) Data Catalog Vocabulary (DCAT) Disponiacutevel na WWW httpswwww3orgTRvocab-dcat

World Wide Web Consortium [W3C] (2015) Linked Data Disponiacutevel na WWW httpswwww3orgstandardssemanticwebdata

World Wide Web Foundation (2014 maio) Towards common methods for assessing open data workshop report amp draft framework Apresentado em Towards common methods for assessing open data 2014 8 - 9 Maio Nova Iorque EUA Disponiacutevel na WWW httpopendataresearchorgsitesdefaultfilespostsCommon20Assessment20Workshop20Reportpdf

World Wide Web Foundation (2017) ODB Global Report Fourth Edition Disponiacutevel na WWW httpopendatabarometerorgdoc4thEditionODB-4thEdition-GlobalReportpdf

133

Zuiderwijk A Gasco M Parycek P amp Janssen M (2014) Special issue on transparency and open data policies guest editors introduction Journal of theoretical and applied electronic commerce research 9(3) I-IX Disponiacutevel na WWW httpwwwscieloclscielophpscript=sci_arttextamppid=S0718-18762014000300001

Zuiderwijk A amp Janssen M (2014) Open data policies their implementation and impact a comparison Framework Government Information Quaterly 31(1) 17-29 Disponiacutevel na WWW httpwwwsciencedirectcomsciencearticlepiiS0740624X13001202

134

LISTA DE SIGLAS AA - Acesso Aberto AMA - Agecircncia para a Modernizaccedilatildeo Administrativa APC - Article Processing Charge API - Application Programming Interface APIS - Arquivo Portuguecircs de Informaccedilatildeo Social BOAI - Budapest Open Access Initiative CA - Ciecircncia Aberta CADA - Comissatildeo de Aceso aos Documentos Administrativos CC - Creative Commons CERN - European Organization for Nuclear Research CML - Cacircmara Municipal de Lisboa DCAT - Data Catalog Vocabulary DCC - Digital Curation Center DDI - Data Documentation Initiative DGA - Dados Governamentais Abertos DMP - Data Management Plan DOAJ - Directory of Open Access Journals DOI - Digital Object Identifier EAGDA - Expert Advisory Group on Data Access e-IRG - e-Infrastructure Reflection Group EOSC - European Open Science Cloud ERAC - European Research Area and Innovation Committee EU - Uniatildeo Europeia EUA - Estados Unidos da Ameacuterica FCCN - Fundaccedilatildeo para a Computaccedilatildeo Cientiacutefica Nacional FCT - Fundaccedilatildeo para a Ciecircncia e Tecnologia FI - Fator de Impacto FOI - Freedom of Information FOSTER - Facilitate Open Science Training for European Research GBIF - Global Biodiversity Information Facility ICSU - International Council for Science INE - Instituto Nacional de Estatiacutestica IPCB - Instituto Politeacutecnico de Castelo Branco ITM - Iacutendice de Transparecircncia Municipal JISC - Joint Information Systems Committee MCTES - Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior NIH - National Institutes of Health OAI-PMH - Open Archive Initiative ndash Protocol for Metadata Harvesting OD4D - Open Data for Development

135

ODC - Open Data Commons ODIN - Open Data Inventory ODRA - Open Data Readiness Assessment OECD - Organizaccedilatildeo para a Cooperaccedilatildeo e Desenvolvimento Econoacutemico OGD - Open Government data OGL - Open Government Licence OGP - Open Government Partnership OGWG - Open Government Working Group OKI - Open Knowledge International OpenDOAR - Directory of Open Access Repositories PLOS - Public Library of Science PSI - Public Sector Information RCAAP - Repositoacuterio Cientiacutefico de Acesso Aberto de Portugal RDA - Research Data Aliance RDF - Resource Description Framework Re3data - Registry of Research Data Repositories ROARMAP - Registry of Open Access Repository Mandates and Policies SARDC - Serviccedilo de Alojamento de Repositoacuterio de Dados Cientiacuteficos SCOAP3 - Sponsoring Consortium for Open Access Publishing in Particle Physics SNIAmb - Sistema Nacional de Informaccedilatildeo de Ambiente SOAP - Study of Open Access Publishing SPARC - Scholarly Publishing and Academic Resources Coalition W3C - World Wide Web Consortium

136

IacuteNDICE DE FIGURAS

Fig 1 Os pilares da Ciecircncia Aberta 17 Fig 2 As 5 escolas de pensamento das mudanccedilas operadas pela Ciecircncia Aberta 18 Fig 3 Caracteriacutesticas e indicadores do Open Science Monitor 20 Fig 4 Taxonomia da Ciecircncia Aberta 22 Fig 5 Paradigmas da investigaccedilatildeo cientiacutefica 25 Fig 6 Cadeia de abastecimento dos Dados Massivos 27 Fig 7 A cauda longa dos Dados Massivos 28 Fig 8 Ciclo de vida dos dados de investigaccedilatildeo 31 Fig 9 Tipos de dados cientiacuteficos 34 Fig 10 Esquema de classificaccedilatildeo das 5 estrelas para Dados Abertos Ligados 35 Fig 11 Pilares dos Dados Governamentais Abertos 40 Fig 12 Perspetivas da abertura dos dados governamentais 44 Fig 13 Esquema de classificaccedilatildeo das 5 estrelas para as iniciativas de abertura de dados que envolvem os utilizadores 45 Fig 14 Esquema de classificaccedilatildeo das 5 estrelas para os portais de dados 50 Fig 15 Princiacutepios FAIR Data 61 Fig 16 Estrutura de avaliaccedilatildeo de poliacuteticas de Dados Abertos 67

137

IacuteNDICE DE QUADROS

Quadro 1 Princiacutepios de abertura de dados de investigaccedilatildeo mais recomendados 33 Quadro 2 Princiacutepios de abertura mais recomendados pelas iniciativas de Dados Governamentais Abertos 43 Quadro 3 Visatildeo geral sobre o contexto conteuacutedo e desempenho da poliacutetica de Dados Abertos em Portugal com base no esquema delineado por Zuiderwijk e Janssen (2014) 85 Quadro 4 Comparaccedilatildeo dos resultados de abertura de dados atribuiacutedos pelas vaacuterias iniciativas de avaliaccedilatildeo 95 Quadro 5 Portais de dados abertos existentes em Portugal 97

138

IacuteNDICE DE GRAacuteFICOS

Graacutefico 1 Nuacutemero de datasets publicados no SARDC nos anos seguintes agrave sua criaccedilatildeo 80 Graacutefico 2 Maiores fornecedores de dados do portal nacional 87 Graacutefico 3 Tipologia dos fornecedores de dados do portal nacional 88 Graacutefico 4 Tipologia das categorias de dados do portal nacional 88

Page 2: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação

Imagem Open Data CC BY-NC-ND httpwwwchefuturoit

Faculdade de Letras

As poliacuteticas de Open Data em Portugal

Anaacutelise da sua implementaccedilatildeo e impacto

Ficha Teacutecnica

Tipo de trabalho Dissertaccedilatildeo de Mestrado Tiacutetulo As poliacuteticas de Open Data em Portugal anaacutelise da sua

implementaccedilatildeo e impacto Autores Paulo Fernando Pereira da Silva

Orientador Prof Doutora Maria Manuel Borges Coorientador Prof Doutora Daniela de Filippo

Identificaccedilatildeo do Curso 2ordm Ciclo em Ciecircncia da Informaccedilatildeo Data da entrega

Data de realizaccedilatildeo das provas

Membros do Juacuteri Presidente

Vogais

Classificaccedilatildeo

14-06-2017 28-07-2017 Prof Doutora Maria da Graccedila Melo Simotildees Prof Doutora Maria Manuel Lopes Figueiredo Costa Marques Borges Prof Doutor Andreacutes Pandiella Dominique 19

ii

iii

Aos meus pais Gracinda e Fernando

Agrave Sara namorada companheira e amiga

iv

v

AGRADECIMENTOS

O sucesso neste percurso acadeacutemico deve-se tambeacutem a todos os que me apoiaram incentivaram e inspiraram nos melhores e nos piores momentos tornando o caminho mais faacutecil de percorrer Espero que as palavras seguintes faccedilam justiccedila ao sentimento de agradecimento que pretendo transmitir

Agrave Professora Doutora Maria Manuel Borges a quem devo a introduccedilatildeo a este tema pela total disponibilidade pelo aconselhamento acadeacutemico e profissional espiacuterito criacutetico pela confianccedila depositada pela sua amizade e pelo privileacutegio de poder trabalhar com algueacutem por quem se nutre admiraccedilatildeo

Agrave Professora Doutora Daniela de Filippo pelo aconselhamento orientaccedilatildeo espiacuterito criacutetico e amizade que foram importantes durante o uacuteltimo ano

Agrave Sara cujo apoio paciecircncia e amor foram fundamentais ao longo deste percurso

Aos meus pais que nunca me deixaram desistir deste sonho

Agrave Ana Luiacutesa Ribeiro colega e amiga cujo esforccedilo me permitiu assistir a todas as aulas do mestrado

Agrave Cristina Caetano colega de mestrado e amiga pelo apoio incentivo partilha de ideias e espiacuterito criacutetico

Aos colegas Daniel Gonccedilalves Rosa Gomes e Quele pelo companheirismo amizade boa energia e pelas trocas de ideias ao almoccedilo agraves quintas-feiras

A todos os professores deste ciclo acadeacutemico pela mestria e paixatildeo com que transmitiram conhecimentos e me tornaram melhor profissional da informaccedilatildeo

vi

vii

A mente que se abre a uma nova ideia jamais volta ao seu tamanho inicial

Albert Einstein

viii

ix

RESUMO

A abertura de dados cientiacuteficos e de dados do setor puacuteblico eacute garantida por poliacuteticas de Dados Abertos que na sua constituiccedilatildeo recomendam ou mandatam a livre disponibilizaccedilatildeo de dados A um niacutevel macro a Uniatildeo Europeia atraveacutes do seu programa de financiamento de investigaccedilatildeo implementou um piloto de Dados Abertos que atualmente abrange todas as aacutereas de investigaccedilatildeo financiadas O acordo de financiamento mandata a abertura de todos os dados de investigaccedilatildeo subjacentes agraves publicaccedilotildees cientiacuteficas A Uniatildeo Europeia tem tambeacutem publicado legislaccedilatildeo referente agrave abertura de dados do setor puacuteblico que eacute transposta para as normas juriacutedicas de cada estado-membro onde Portugal natildeo eacute exceccedilatildeo Foram tambeacutem observadas as diversas iniciativas que visam medir a abertura de dados puacuteblicos a niacutevel europeu e mundial

O objetivo geral do trabalho eacute analisar a implementaccedilatildeo de poliacuteticas de Dados Abertos em Portugal Dado o diferente enquadramento legislativo relativamente aos dados de investigaccedilatildeo e aos dados do setor puacuteblico foram elencadas as poliacuteticas existentes para os diferentes tipos de dados A abertura de dados de investigaccedilatildeo situa-se ainda numa fase prematura natildeo sendo ainda visiacuteveis resultados da implementaccedilatildeo da Resoluccedilatildeo do Conselho de Ministros nordm212016 Ao niacutevel dos dados do setor puacuteblico abertura processou-se atraveacutes da transposiccedilatildeo da Diretiva 200398CE para as normas juriacutedicas portuguesas em 2007 e novamente em 2016 Usando o modelo de Zuiderwijk e Janssen (2014) foi elaborada uma estrutura para a avaliaccedilatildeo do conteuacutedo contexto e indicadores de desempenho da poliacutetica de abertura de dados do setor puacuteblico permitindo obter uma visatildeo geral do valor puacuteblico alcanccedilado Foram confrontados os resultados obtidos por esta anaacutelise com os indicadores de abertura provenientes de algumas iniciativas de avaliaccedilatildeo de impacto da abertura de dados do setor puacuteblico e com a informaccedilatildeo prestada pela AMA O ecossistema portuguecircs de Dados Governamentais Abertos encontra-se jaacute numa fase mais avanccedilada revelando a existecircncia do portal de dados nacional (dadosgov) e de diversos portais de entidades puacuteblicas e ateacute do setor privado que disponibilizam dados de forma aberta Esses portais foram analisados para se perceber se os conjuntos de dados cumpriam os requisitos de abertura definidos pela Open Knowledge International

Palavras-chave Dados Abertos Dados Governamentais Abertos poliacuteticas de Dados Abertos impacto avaliaccedilatildeo

x

xi

ABSTRACT

The openness of scientific data and public sector data is granted by Open Data policies which recommend or mandate free availability of data At a macro level the European Union through its research funding program implemented an Open Data pilot that now is extended to all the funded research areas The model agreement sets the openness of all the data underlying scientific publications The European Union has also published legislation referring to the openness of public sector information which is transposed to the legal system of each state member where Portugal is no exception We also analysed the different initiatives that aim to measure the openness of public data at European and global level

The main goal of this academic work is to analyse the implementation of Open Data policies in Portugal Given the different legal framework between scientific data and public sector data wersquove considered and listed the policies regarding both type of data The openness of scientific data is still in a premature phase which means that the results of the implementation of Resoluccedilatildeo do Conselho de Ministros nordm212016 are not visible yet In terms of public sector data the openness has started with the transposition of the EU Directive 200398EC to the Portuguese juridical system in 2007 and again in 2016 Using Zuiderwijk e Janssenrsquos (2014) model it was elaborated a structure to assess the context content and performance indicators of public sector open data policies which allows to obtain a general vision of public value achieved The results produce by this analysis were confronted with the openness indicators generated by some public sector data impact assessment initiatives and also with the information disclosed by AMA The Portuguese ecosystem of Open Governmental Data is in a more advanced phase disclosing the existence of a national data portal (dadosgov) and data portals from public institutions and even from the private sector which made data available in an open manner These data portals were analysed to understand if they fulfil all the openness requirements defined by Open Knowledge International

Keywords Open Data Open Government Data Open Data policies impact assessment

xii

xiii

Sumaacuterio

AGRADECIMENTOS v

RESUMO ix

ABSTRACT xi

Introduccedilatildeo 1

Indicaccedilotildees Metodoloacutegicas 6

1 Do Acesso Aberto aos Dados Abertos 8

11 Acesso Aberto 8

111 Via Dourada 14

112 Via Verde 15

12 A Ciecircncia Aberta 17

13 Big Data ou dados massivos 24

14 Dados Abertos 29

15 Dados Abertos Governamentais 40

2 As poliacuteticas de Dados Abertos 53

21 Poliacuteticas Macro 70

22 O caso portuguecircs 78

Conclusatildeo 103

Referecircncias Bibliograacuteficas 115

LISTA DE SIGLAS 134

IacuteNDICE DE FIGURAS 136

IacuteNDICE DE QUADROS 137

IacuteNDICE DE GRAacuteFICOS 138

xiv

1

Introduccedilatildeo

Uma marca distintiva da nossa eacutepoca eacute o crescimento exponencial da produccedilatildeo de informaccedilatildeo com a proliferaccedilatildeo de novas tecnologias de informaccedilatildeo e comunicaccedilatildeo que permitiram o aumento de troca de informaccedilatildeo de nuacutemero de artigos cientiacuteficos publicados e a produccedilatildeo massiva de dados O acesso generalizado agrave internet propiciou uma alteraccedilatildeo no paradigma do acesso e publicaccedilatildeo de conteuacutedos cientiacuteficos Eacute com o intuito de promover o livre acesso agrave informaccedilatildeo cientiacutefica que nasce o movimento de Acesso Aberto (AA) apoiado em trecircs declaraccedilotildees de princiacutepios de abertura Budapeste Bethesda e Berlim

Segundo a Budapest Open Access Initiative (BOAI) entende-se por AA a disponibilizaccedilatildeo na Internet de literatura cientiacutefica permitindo que os utilizadores possam ler copiar distribuir imprimir e pesquisar esta literatura sem barreiras legais teacutecnicas ou financeiras que natildeo o proacuteprio acesso agrave Internet (Budapest Open Access Iniciative [BOAI] 2002 traduccedilatildeo livre) O AA possuiu dois modelos de abertura a via dourada que remete para a publicaccedilatildeo em revistas cientiacuteficas de AA e a via verde que pressupotildee o auto arquivo num repositoacuterio adequado Subjacente a este movimento estaacute a abertura sem qualquer tipo de discriminaccedilatildeo de toda a literatura de investigaccedilatildeo cientiacutefica revista por pares no caso dos postprints como artigos dissertaccedilotildees e teses e mais recentemente dados de investigaccedilatildeo e livros cientiacuteficos (Swan 2012) Existem dois tipos de AA o AA graacutetis que se refere agrave remoccedilatildeo de barreiras de preccedilo e o AA livre que se refere agrave remoccedilatildeo de barreiras de preccedilo e de pelo menos algumas barreiras de permissatildeo (Suber 2012)

O AA enquadra-se num contexto cientiacutefico mais vasto o da Ciecircncia Aberta (CA) O conceito de CA eacute definido como o esforccedilo para disponibilizar todos os resultados da investigaccedilatildeo cientiacutefica que sejam financiados pelo setor puacuteblico (Organizaccedilatildeo para a Cooperaccedilatildeo e Desenvolvimento Econoacutemico [OECD] 2015a) Nesse sentido a Ciecircncia Aberta surge como um termo guarda-chuva referente agrave abertura de todos os resultados da investigaccedilatildeo financiada e que assenta em vaacuterios pilares remoccedilatildeo das barreiras de partilha construccedilatildeo da infraestrutura para a sua concretizaccedilatildeo e como desambiguaccedilatildeo de autores instituiccedilotildees e produccedilatildeo cientiacutefica A CA eacute um meio para garantir um sistema de investigaccedilatildeo mais eficiente atraveacutes da reduccedilatildeo de custos no processo de coleta transferecircncia e reutilizaccedilatildeo de dados do aumento da transparecircncia e qualidade do processo de investigaccedilatildeo da maior rapidez na transferecircncia de conhecimento do aumento do impacto econoacutemico e aproximaccedilatildeo entre ciecircncia e cidadatildeos (OECD 2015a)

A complexidade da abertura dos resultados de investigaccedilatildeo reside no fator cultural na implementaccedilatildeo de um ambiente de partilha Leonelli Spichtinger e Prainsack

2

(201513) defendem que ldquoin addition to the stick of compulsatory mandates carrots are therefore also neededrdquo As recompensas satildeo definidas em trecircs eixos reconhecimento das praacuteticas de partilha nas estruturas de incentivos reconhecimento do papel das meacutetricas alternativas na avaliaccedilatildeo dos investigadores e a criaccedilatildeo de incentivos mais significativos para envolver os investigadores na CA Fecher e Friesike (2013) sintetizaram as mudanccedilas operadas pela CA em cinco escolas de pensamento ao niacutevel da infraestrutura da acessibilidade puacuteblica da avaliaccedilatildeo de impacto do acesso gratuito e da melhoria da eficiecircncia

A Uniatildeo Europeia (EU) tem desempenhado um papel central na promoccedilatildeo da CA quer atraveacutes da criaccedilatildeo de legislaccedilatildeo adequada aos princiacutepios de abertura que defende quer ao niacutevel de financiamento para o AA agraves publicaccedilotildees cientiacuteficas criaccedilatildeo de e-infraestruturas de alojamento de recursos de informaccedilatildeo e programas de treino e apoio Em Portugal apesar da jaacute existecircncia de e-infraestruturas cientiacuteficas como o Repositoacuterio Cientiacutefico de Acesso Aberto de Portugal (RCAAP) e o Serviccedilo de Alojamento de Repositoacuterio de Dados Cientiacuteficos (SARDC) apenas em 2016 se veio a definir os princiacutepios da implementaccedilatildeo da poliacutetica nacional de CA atraveacutes da Resoluccedilatildeo do Conselho de Ministros nordm212016 A estrateacutegia assenta em quatros eixos AA e Dados Abertos infraestruturas e preservaccedilatildeo digital avaliaccedilatildeo cientiacutefica e responsabilidade social cientiacutefica (Comissatildeo Executiva GT-PNCA 2016)

O crescimento exponencial da produccedilatildeo de dados estimado em 40 ao ano (Manyika et al 2011) levou agrave emergecircncia do fenoacutemeno Big Data ou dados massivos atraveacutes do incremento da disponibilizaccedilatildeo de conjuntos de dados e tambeacutem do reconhecimento do potencial valor da combinaccedilatildeo e ligaccedilatildeo de diferentes datasets (Ubaldi 2013) Os dados digitais estatildeo presentes em todos os setores econoacutemicos existindo diversas ferramentas que coletam dados de forma massiva que depois podem ser reutilizados para desenvolver novas investigaccedilotildees ou aplicaccedilotildees1 para benefiacutecio da sociedade O crescimento da disponibilidade de dados originou mudanccedilas no paradigma da investigaccedilatildeo cientiacutefica sendo que Jim Gray considera que vivemos atualmente no 4ordm paradigma caracterizado pelo uso massivo de dados na investigaccedilatildeo cientiacutefica (Lynch 2009) Esta nova ciecircncia assenta em trecircs pilares captura curadoria e anaacutelise de dados (Bell 2009 Royal Society 2012) A influecircncia do Big Data na sociedade manifesta-se a diversos niacuteveis destacando-se o desenvolvimento de projetos na aacuterea da sauacutede transportes agricultura ambiente induacutestria ganho de competecircncias cientiacuteficas mercado de dados e dados abertos

Os dados que produzimos satildeo globais diversificados complexos e sobretudo podem representar um enorme valor cientiacutefico econoacutemico social ou cultural Neste

1 O termo aplicaccedilotildees deve ser aqui entendido de duas formas como aplicaccedilatildeo na inovaccedilatildeo cientiacutefica produzindo por exemplo um avanccedilo meacutedico e tambeacutem como aplicaccedilatildeo no sentido de software fornecendo um serviccedilo com o recurso agrave reutilizaccedilatildeo de dados

3

sentido o AA a dados torna-se um dos pilares da investigaccedilatildeo cientiacutefica do seacuteculo XXI mas tambeacutem um dos pilares do desenvolvimento econoacutemico do envolvimento dos cidadatildeos na ciecircncia atraveacutes da denominada ciecircncia cidadatilde e tambeacutem na auscultaccedilatildeo da transparecircncia governativa com a disponibilizaccedilatildeo em AA de dados governamentais

O mundo acadeacutemico tem vindo a ser pressionado para apoiar a abertura atraveacutes das imposiccedilotildees das entidades de financiamento e do aumento de benefiacutecios dos Dados Abertos embora nem todos os domiacutenios evoluam com a mesma rapidez (Hahnel amp Hook 2016) A Royal Society (2012) sublinha que os dados devem ser geridos de modo proficiente para as instituiccedilotildees obterem os benefiacutecios proporcionados pela abertura de dados e entenderem a enorme mudanccedila cultural necessaacuteria para atingir este objetivo

Existem vaacuterias definiccedilotildees de Dados Abertos apresentando algumas diferenccedilas entre elas embora focando o mesmo objetivo A Royal Society (2012) entende por Open Data os dados que devem ser acessiacuteveis utilizaacuteveis avaliados ou certificados e inteligiacuteveis Contudo ldquoOpenness is not however enough Data must be intelligently openrdquo (Science International 20154) Segundo a Open Definition os Dados Abertos englobam dois tipos diferentes de abertura teacutecnica e legal (Open Knowledge International [a])

Com o objetivo de contribuir para a adoccedilatildeo de padrotildees e poliacuteticas de Dados Abertos de investigaccedilatildeo algumas organizaccedilotildees lanccedilaram iniciativas e princiacutepios de Open Data destinadas agrave recomendaccedilatildeo de boas praacuteticas na publicaccedilatildeo de dados de investigaccedilatildeo obtidos atraveacutes de financiamento puacuteblico Estes princiacutepios foram comparados de forma a obter-se uma visatildeo geral da abertura teacutecnica e legal recomendada

A abertura dos dados governamentais teve a sua origem nas leis de ldquoFreedom of Informationrdquo Os Governos e as sociedades tecircm vindo de forma crescente a apoiar o acesso agrave informaccedilatildeo do setor puacuteblico como forma de aumentar a transparecircncia governativa e o crescimento econoacutemico A abertura de dados assume a preparaccedilatildeo das entidades puacuteblicas para o processo de abertura e que o governo estaacute disposto a efetuar mudanccedilas consideraacuteveis no setor puacuteblico devendo atuar como um sistema aberto que interage com o seu ambiente (Jansen Charalabidis amp Zuiderwijk 2012)

Os Dados Governamentais Abertos (DGA) referem-se agrave informaccedilatildeo coletada produzida ou paga pelo setor puacuteblico guardada em formato que possa ser lido por maacutequina e tornada acessiacutevel de forma livre para reutilizaccedilatildeo para qualquer propoacutesito atraveacutes da publicaccedilatildeo sob uma licenccedila aberta que permite a livre reutilizaccedilatildeo dentro do domiacutenio puacuteblico e privado (Koski 2015 Carrara Oudkerk Steenbergen Tinholt 2016) A Open Knowledge International (OKI) (2012a) identificou as componentes chave da abertura de dados puacuteblicos disponibilidade e acesso reutilizaccedilatildeo e redistribuiccedilatildeo e a participaccedilatildeo universal A abertura dos dados governamentais foi apoiada por vaacuterias iniciativas com o objetivo de estabelecer padrotildees e princiacutepios para a

4

disponibilizaccedilatildeo aberta de dados as quais foram comparadas para obter uma visatildeo geral da abertura teacutecnica e legal recomendada

Para gerar valor ldquodata must be reusable but more importantly actually used (Open Data for Development [OD4D] 20168) O acesso e a reutilizaccedilatildeo dos dados governamentais tecircm um potencial significativo no aumento da eficiecircncia e transparecircncia do setor puacuteblico alavancando atividades de ciecircncia cidadatilde com os dados governamentais aumentando assim o seu valor econoacutemico e social (OECD 2015a) Segundo Ubaldi (2013 traduccedilatildeo livre) podem ser identificadas quatro grandes fases na cadeia de valor dos Dados DGA geraccedilatildeo de dados coleta agregaccedilatildeo e processamento de dados distribuiccedilatildeo e fornecimento de dados e reutilizaccedilatildeo de dados Existem trecircs tipos de valor associados aos DGA valor econoacutemico valor social e transparecircncia puacuteblica (Ubaldi 2013 OECD 2015a)

O acesso a dados sem restriccedilotildees de acesso deve ser garantido por uma poliacutetica de Dados Abertos pois ldquoOpen Data is politicalrdquo (World Wide Web Foundation 201638) Existem poliacuteticas diferenciadas para a abertura de dados governamentais e para a abertura de dados cientiacuteficos sendo que a expressatildeo ldquoPoliacutetica de Dados Abertosrdquo surge frequentemente associada a termos como estrateacutegias programas ou iniciativas de abertura de dados e ainda a poliacuteticas de gestatildeo de dados A contextualizaccedilatildeo das poliacuteticas natildeo eacute clara mas foca-se preferencialmente apenas nos dados provenientes do setor puacuteblico Satildeo associadas poliacuteticas de Dados Abertos de vaacuterios niacuteveis desde o governamental em termos de dados puacuteblicos agraves poliacuteticas editoriais de abertura de dados cientiacuteficos

A niacutevel de dados cientiacuteficos salienta-se a existecircncia de vaacuterias recomendaccedilotildees no sentido de balizar indicadores fundamentais para o desenvolvimento de poliacuteticas de abertura de dados cientiacuteficos e a importacircncia da gestatildeo de dados no seio dessa abertura A mudanccedila cultural a necessidade de treino dos investigadores e a abertura de dados mediante os princiacutepios FAIR que pretendem facilitar o acesso a interoperabilidade e a reutilizaccedilatildeo de dados satildeo outros desafios focados A abertura dos dados de investigaccedilatildeo eacute incluiacuteda no programa de investimento Horizonte 2020 (H2020) da EU com a criaccedilatildeo um projeto-piloto de Dados Abertos para sete aacutereas com opccedilatildeo de natildeo participaccedilatildeo tendo sido alargado a todas as aacutereas cientiacuteficas em projetos iniciados a partir de 2017 O artigo 293 do acordo modelo de financiamento requer o depoacutesito de todos os dados e metadados associados aos resultados finais da investigaccedilatildeo num repositoacuterio devendo estes cumprir os princiacutepios FAIR A este model grant agreement estaacute associada tambeacutem a necessidade obrigatoacuteria de desenvolver um plano de gestatildeo de dados que descreva os dados que seratildeo produzidos e como e quando seratildeo publicados O AA a dados cientiacuteficos possui um contexto legislativo diferenciado dos dados puacuteblicos apresentando-se em Portugal numa fase ainda pouca maturada A primeira poliacutetica de Dados Abertos surge em 2014 atraveacutes da Fundaccedilatildeo

5

para a Ciecircncia e Tecnologia (FCT) com o objetivo de encorajar e promover a disponibilizaccedilatildeo de dados em AA O acesso a dados foi incluiacutedo na poliacutetica cientiacutefica atraveacutes da Resoluccedilatildeo do Conselho de Ministros nordm212016 que integrada na poliacutetica nacional de CA instaura a obrigatoriedade da abertura dos dados cientiacuteficos resultantes de projetos financiados por fundos puacuteblicos

O desenvolvimento de uma poliacutetica de abertura de dados governamentais deve considerar algumas questotildees como a definiccedilatildeo da sua aplicaccedilatildeo e os objetivos dados publicados condiccedilotildees de publicaccedilatildeo de dados local frequecircncia e razatildeo da publicaccedilatildeo devendo ainda ser calculado o impacto e os benefiacutecios da abertura de dados (Carrara et al 2016a) Os objetivos das poliacuteticas de Dados Abertos podem ser sintetizados em trecircs aacutereas principais fomentar a inovaccedilatildeo social e crescimento econoacutemico melhorar a eficiecircncia dos serviccedilos do setor puacuteblico e fortalecer a democracia e aumentar a transparecircncia (Zuiderwijk Gasco Parycek amp Janssen 2014)

A EU e a Comissatildeo Europeia tecircm promovido os DGA atraveacutes da publicaccedilatildeo de Diretivas Europeias (2003 e 2013) que estabeleceram regulamentos para permitir o livre acesso e reutilizaccedilatildeo dos dados produzidos pelas entidades europeias e governamentais Esta legislaccedilatildeo eacute de cariz obrigatoacuterio para todos os estados-membros Foram tambeacutem estabelecidas diversas e-infraestruturas para alojar e apoiar toda a produccedilatildeo de dados produzidos na EU e que indexam os dados existentes nos portais nacionais de cada paiacutes Satildeo abordadas as vaacuterias iniciativas europeias e internacionais de avaliaccedilatildeo de abertura de dados que permitem obter uma vista geral ainda que desfocada do estado de abertura de dados puacuteblicos a niacutevel nacional e europeu

Portugal confere o direito ao acesso agrave informaccedilatildeo puacuteblica desde 1993 As poliacuteticas de abertura de dados governamentais mais recentes foram publicadas em 2007 e 2016 e assentam na transposiccedilatildeo da Diretiva 200398CE para a lei nacional Assinala-se a existecircncia de duas poliacuteticas municipais a criaccedilatildeo do portal nacional e de vaacuterios portais regionais e institucionais Para avaliar a abertura dos dados governamentais em Portugal foi usada a estrutura elencada por Zuiderwijk e Janssen (2014) Atraveacutes da anaacutelise de vaacuterios indicadores esta estrutura fornece uma perspetiva do contexto e ambiente da poliacutetica do seu conteuacutedo e dos indicadores de desempenho permitindo assim inferir o valor puacuteblico alcanccedilado Foi tambeacutem analisada a abertura de dados alojados nos portais de dados portugueses com o recurso agraves caracteriacutesticas de abertura enunciadas na Open Definition

O objetivo geral deste trabalho eacute identificar as poliacuteticas de Dados Abertos em Portugal bem como a analisar a sua implementaccedilatildeo e impacto Neste sentido foram delineados os seguintes objetivos especiacuteficos

6

a) Contextualizar o movimento de Dados Abertos como continuaccedilatildeo do AA e tambeacutem dentro de um modelo mais amplo a CA focando ainda a produccedilatildeo massiva de dados

b) Identificar princiacutepios de abertura de dados cientiacuteficos e dados puacuteblicos c) Contextualizar os modelos de poliacuteticas de Dados Abertos e formas de avaliaccedilatildeo

de impacto das mesmas d) Identificar a constituiccedilatildeo e implementaccedilatildeo de poliacuteticas de abertura de dados

cientiacuteficos e dados puacuteblicos a niacutevel da EU e) Identificar a constituiccedilatildeo de poliacuteticas de abertura de dados cientiacuteficos e dados

puacuteblicos a niacutevel portuguecircs f) Avaliaccedilatildeo da implementaccedilatildeo e do impacto das poliacuteticas de Dados Abertos em

Portugal em termos de dados cientiacuteficos e de dados puacuteblicos

Indicaccedilotildees Metodoloacutegicas

Para cumprir os objetivos estipulados seguiu-se uma abordagem qualitativa baseada na revisatildeo bibliograacutefica de artigos cientiacuteficos recuperados em bases de dados especializadas disponiacuteveis na Universidade de Coimbra articulando a recuperaccedilatildeo de documentos com os documentos mais citados da aacuterea da Ciecircncia Aberta Acesso Aberto e Dados Abertos indexados na Web of Science Foram usados os termos de pesquisa em liacutengua inglesa open science open access open data open government data e scientific open data para situar o tema seguindo-se a pesquisa por open data policies government open data policies e open data impact A base da literatura revista para analisar o desenvolvimento e impacto das poliacuteticas de Dados Abertos em Portugal foi obtida em grande parte com o recurso ao motor de busca Google derivado agrave especificidade da legislaccedilatildeo das comunicaccedilotildees poliacuteticas e institucionais dos portais de dados e tambeacutem agrave escassez de literatura cientiacutefica nesse campo Foi ainda solicitado um esclarecimento de duacutevidas agrave Agecircncia para a Modernizaccedilatildeo Administrativa (AMA) por correio eletroacutenico em termos de conteuacutedos e funcionalidades do portal de dados nacional tendo as respostas do gestor de projeto Andreacute Lapa sido incluiacutedas como contraposiccedilatildeo a algumas afirmaccedilotildees da literatura ou das iniciativas de avaliaccedilatildeo Os Dados Abertos enquanto alvo do nosso estudo satildeo enquadrados na dimensatildeo da Ciecircncia Aberta que defende a abertura de todos os resultados cientiacuteficos e na dimensatildeo de abertura da informaccedilatildeo do setor puacuteblico que defende o acesso do cidadatildeo agrave informaccedilatildeo dos oacutergatildeos puacuteblicos e governativos

Em termos de Dados Abertos e as suas poliacuteticas a oferta de literatura eacute consideravelmente mais curta sendo que apenas os documentos mais antigos apresentam nuacutemero de citaccedilotildees com algum relevo Sempre que necessaacuterio recorreu-se a trabalhos citados nas publicaccedilotildees em estudo A singularidade da aacuterea e o seu raacutepido crescimento levou agrave opccedilatildeo por autores e artigos menos cotados mas

7

diretamente relacionados com o mundo dos Dados Abertos A recolha de literatura para investigaccedilatildeo visou identificar legislaccedilatildeo referente a poliacuteticas de Dados Abertos publicaccedilotildees de organizaccedilotildees internacionais documentos oficiais relacionados com a abertura de dados e tambeacutem comunicaccedilotildees poliacuteticas quer para o caso portuguecircs quer ao niacutevel macro da EU Foi identificado o contexto social e poliacutetico dos Dados Abertos destacando-se as iniciativas com potencial impacto na abertura de dados Foram pesquisados documentos de investigaccedilatildeo relativos a poliacuteticas de dados abertos e formas de anaacutelise das mesmas

A avaliaccedilatildeo de impacto das poliacuteticas de Dados Abertos em Portugal foi feita com base na estrutura elencada por Zuiderwijk e Janssen (2014) A identificaccedilatildeo das respostas aos 27 indicadores foi feita com o recurso agrave literatura legislaccedilatildeo e agraves respostas obtidas a partir da AMA

Para determinar a quantidade de conjuntos de dados existentes em cada portal internacional analisado quando natildeo estava disponiacutevel a possibilidade de pesquisar por paiacutes foi introduzido o termo Portugal na caixa de pesquisa Deste modo recuperaram-se os conjuntos de dados relacionados com o paiacutes embora nem todos os datasets tenham autoria portuguesa A determinaccedilatildeo das caracteriacutesticas dos portais de dados portugueses analisados foi efetuada com base na informaccedilatildeo inscrita no proacuteprio siacutetio web Quando natildeo disponiacuteveis na paacutegina principal dos cataacutelogos de dados procedeu-se agrave pesquisa nas paacuteginas descritivas dos datasets ou no setor dos avisos legais

Procurou-se aqui tambeacutem definir alguns dos termos que iratildeo ser utilizados com frequecircncia na liacutengua inglesa e tambeacutem o seu acircmbito de aplicaccedilatildeo Segundo Borgman (2015) dados satildeo representaccedilotildees de observaccedilotildees objetos ou outras entidades usadas como prova de um fenoacutemeno para fins de investigaccedilatildeo ou acadeacutemicos

O termo dataset designa um conjunto ou coleccedilatildeo de dados publicados ou preservados por um agente uacutenico estando disponiacutevel para acesso ou download em um ou mais formatos (World Wide Web Consortium [W3C] 2014)

Para a contextualizaccedilatildeo e avaliaccedilatildeo de poliacuteticas foi tida em consideraccedilatildeo a definiccedilatildeo do Dicionaacuterio de Cambridge que define poliacutetica como ldquoa set of ideas or a plan of what to do in particular situations that has been agreed to officially by a group of people a business organization a government or a political partyrdquo (Cambridge University Press 2017)

8

1 Do Acesso Aberto aos Dados Abertos

O processo de abertura do conhecimento cientiacutefico comeccedilou em 2002 com o movimento do Acesso Aberto (AA) culminando na abertura da literatura cientiacutefica financiada por fundo puacuteblicos O avanccedilar da tecnologia a produccedilatildeo massiva de dados as redes sociais cientiacuteficas a ciecircncia cidadatilde os recursos educacionais e o coacutedigo aberto em conjunto gerou uma ciecircncia diferente Este conceito mais amplo de ciecircncia definido como Ciecircncia Aberta pretende abrir toda a panoacuteplia de formatos e recursos onde constem resultados cientiacuteficos com destaque para os dados de investigaccedilatildeo financiados publicamente A abertura de dados processa-se tambeacutem a niacutevel puacuteblico com o Governo e vaacuterias instituiccedilotildees puacuteblicas empenhadas em disponibilizar de forma aberta a informaccedilatildeo do setor puacuteblico

11 Acesso Aberto

O acesso ao conhecimento eacute a base do processo cientiacutefico motor do desenvolvimento social econoacutemico e humano O acesso generalizado agrave Internet alterou o paradigma da comunicaccedilatildeo acadeacutemica pela introduccedilatildeo experimental de novas formas de publicaccedilatildeo e disseminaccedilatildeo da ciecircncia Os primoacuterdios do Acesso Aberto (AA) agrave informaccedilatildeo cientiacutefica remontam a iniciativas como o ArXiv2 um servidor de preprints3 e o EPrints um dos softwares usados para a constituiccedilatildeo de repositoacuterios

O movimento de AA surgiu como resposta ao problema conhecido como lsquoCrise dos Perioacutedicosrsquo Na verdade a escalada de preccedilos das assinaturas de revistas cientiacuteficas e as restriccedilotildees colocadas pelas editoras limitando de forma seacuteria o acesso aos resultados de investigaccedilatildeo teve duas consequecircncias limitaccedilatildeo severa no acesso agrave informaccedilatildeo e colateral diminuiccedilatildeo do potencial de impacto de citaccedilatildeo Eacute neste contexto que em 2002 surge a declaraccedilatildeo fundadora do AA a Budapeste Open Access Initiative (BOAI) Segundo a BOAI entende-se por AA a disponibilizaccedilatildeo na Internet de literatura cientiacutefica permitindo que os utilizadores possam ler copiar distribuir imprimir e pesquisar esta literatura sem barreiras legais teacutecnicas ou financeiras que natildeo o proacuteprio acesso agrave Internet (Budapest Open Access Iniciative [BOAI] 2002 traduccedilatildeo livre) A BOAI estabeleceu duas vias para concretizar o AA a publicaccedilatildeo em revistas cientiacuteficas de AA conhecida como a via dourada e o auto arquivo em repositoacuterios cientiacuteficos conhecido como a via verde de AA Para atingir a abertura dos artigos a BOAI sublinha que devem ser cumpridas duas estrateacutegias complementares

2 O arXiv surgiu em 1991 com o intuito de alojar preprints de artigos cientiacuteficos da aacuterea da fiacutesica tendo sido expandido para integrar aacutereas como a matemaacutetica astronomia ciecircncias da computaccedilatildeo biologia e financcedila quantitativa e estatiacutestica Disponiacutevel na WWW httpsarxivorg 3 O preprint eacute uma versatildeo de um artigo cientiacutefico natildeo publicado e ainda natildeo sujeito a revisatildeo por pares

9

Os investigadores devem proceder ao Auto arquivo da versatildeo completa das suas publicaccedilotildees Necessidade de desenvolver uma nova geraccedilatildeo de revistas cientiacuteficas cujo foco seja a publicaccedilatildeo em AA (BOAI 2002)

Seguiram-se mais duas declaraccedilotildees de elevada importacircncia para o estabelecimento do AA a Declaraccedilatildeo de Bethesda sobre a Publicaccedilatildeo em Acesso Aberto e a Declaraccedilatildeo de Berlim sobre Acesso Livre ao Conhecimento nas Ciecircncias e Humanidades ambas em 2003 A Declaraccedilatildeo de Bethesda define o AA agraves publicaccedilotildees quando eacute autorizado o livre acesso uso e redistribuiccedilatildeo e tambeacutem quando eacute fornecida a versatildeo completa incluindo materiais suplementares e respetiva licenccedila de utilizaccedilatildeo em formato digital num repositoacuterio adequado (Declaraccedilatildeo de Bethesda sobre a Publicaccedilatildeo em Acesso Aberto 2003) A Declaraccedilatildeo de Berlim impotildee o cumprimento de duas condiccedilotildees os autoresdetentores dos direitos de autor devem autorizar sob a forma de uma licenccedila qualquer tipo de coacutepia reutilizaccedilatildeo redistribuiccedilatildeo e transmissatildeo sujeito apenas agrave menccedilatildeo de atribuiccedilatildeo de creacutedito e os autores devem depositar uma coacutepia completa do seu trabalho num repositoacuterio que assegure a sua preservaccedilatildeo a longo prazo (Declaraccedilatildeo de Berlim sobre Acesso Livre ao Conhecimento nas Ciecircncias e Humanidades 2003 traduccedilatildeo livre)

Borges (200692) sintetizou outros exemplos de iniciativas de AA desencadeadas a niacutevel global como o Open Archives Forum em 2001 a International Scholarly Communications Alliance ao niacutevel das ldquobibliotecas especializadas de investigaccedilatildeordquo listando ainda princiacutepios editoriais dos Estados Unidos da Ameacuterica (EUA)4 e europeus5 e assinalando tambeacutem a existecircncia do ldquoDAREnet a rede dos Digital Academic Repositoriesrdquo

Em 2012 a BOAI declarou que ldquoNothing in the last ten years makes OA less necessary or less opportunerdquo renovando e definindo recomendaccedilotildees para os proacuteximos 10 anos ao niacutevel de poliacuteticas licenciamento e reutilizaccedilatildeo infraestrutura e sustentabilidade e por fim sobre promoccedilatildeo e coordenaccedilatildeo

A abertura requerida por estas declaraccedilotildees tem por objetivo disponibilizar o AA a todos os que manifestem interesse nele sem distinccedilotildees discriminatoacuterias Suber (2012) um dos promotores do Movimento de Acesso Aberto agrave informaccedilatildeo cientiacutefica afirma que temos de ver o conhecimento como um bem puacuteblico e natildeo como uma mercadoria O AA deve incluir tambeacutem o processamento da informaccedilatildeo por maacutequinas que atraveacutes de teacutecnicas de extraccedilatildeo indexaccedilatildeo ou mistura permitem obter novas inferecircncias de

4 Os princiacutepios foram denominados Washington DC Principles For Free Access to Science em 2004 tendo sido assinados ldquopor uma seacuterie de editores natildeo lucrativos de sociedades cientiacuteficasrdquo (Borges 200692) 5 Borges (2006) indica que a Association of Learned and Professional Society Publishers emitiu princiacutepios semelhantes aos princiacutepios anunciados nos EUA

10

conhecimento (Suber 2012 Swan 2012) Os conteuacutedos comummente abrangidos pelo AA satildeo a literatura de investigaccedilatildeo cientiacutefica revista por pares dissertaccedilotildees teses e mais recentemente os dados de investigaccedilatildeo e livros cientiacuteficos (Swan 2012) aleacutem de manuais software modelos tridimensionais plantas mapas entre outros

As barreiras de preccedilo e de direitos de autor causam danos aos autores por limitarem a audiecircncia e impacto do seu trabalho ao condicionarem o que pode ser lido usado e citado (Suber 2012 traduccedilatildeo livre) O movimento de AA veio ameaccedilar o modelo dominante de publicaccedilatildeo cientiacutefica baseado ateacute entatildeo em subscriccedilotildees de revistas cientiacuteficas de elevado custo mudando o paradigma em termos de pagamento isentando o leitor e cobrando ao autor O AA natildeo eacute acesso sem custos (OECD 2015a) Em 2008 Stevan Harnad e Peter Suber propuseram termos para descrever os dois tipos de livre acesso agrave informaccedilatildeo cientiacutefica que se impuseram como fundamentais e reconhecidos O termo Graacutetis refere-se agrave remoccedilatildeo das barreiras de preccedilo enquanto o termo Livre refere-se agrave retirada das barreiras de preccedilo e de pelo menos algumas barreiras de permissatildeo (Suber 2008 traduccedilatildeo livre)

A viabilidade econoacutemica das infraestruturas de suporte ao AA pode constituir outro obstaacuteculo Contudo as revistas de AA podem optar por vaacuterios modelos de financiamento que lhes garanta a sustentabilidade econoacutemica como ldquosubsiacutedios publicidade taxas de poacutes-processamento do artigo impressotildees outros serviccedilos de publicaccedilatildeo taxas de associado ou combinaccedilotildees destas accedilotildeesrdquo (Universidade do Minho 2017) Jaacute os repositoacuterios de AA satildeo mais limitados em termos de sustentabilidade no entanto tecircm menos custos de manutenccedilatildeo e estatildeo jaacute em grande parte construiacutedos (OECD 2015a) O retorno do investimento que cada instituiccedilatildeo faz num repositoacuterio tem sempre garantia de retorno atraveacutes do conhecimento que aloja atraindo desta forma alunos investigadores e outros potenciais interessados

A complexidade do AA reside na transiccedilatildeo entre o modelo tradicional e o novo modelo de abertura natildeo pelos obstaacuteculos legais teacutecnicos ou financeiros mas sobretudo pelo fator cultural (Suber 2012 traduccedilatildeo livre) O mesmo autor defende que o AA natildeo eacute acesso universal pois mesmo removendo as barreiras de preccedilos e de permissotildees continuam a existir outras barreiras como filtros e censura barreiras de linguagem de acesso a incapacitados e de conectividade

A escolha do local de publicaccedilatildeo por parte do investigador eacute muitas vezes influenciada pelo prestiacutegio da revista na procura da melhor visibilidade para a sua investigaccedilatildeo O prestiacutegio das revistas eacute conseguido atraveacutes do Fator de Impacto (FI) uma medida de avaliaccedilatildeo criada por Eugene Garfield e Irving H Sher ldquoIn addition to helping libraries decide which journals to purchase JIFs are also used by aithors to decide where to submit their articles As a general rule the journals with high impact factors include the most prestigious Some would equate prestige with high impactrdquo (Garfield 200692) O FI do ano de uma revista cientiacutefica eacute calculado atraveacutes da divisatildeo

11

entre o nuacutemero de citaccedilotildees total que os artigos dessa revista receberam nos dois anos anteriores e o nuacutemero total de artigos publicados no mesmo periacuteodo (Garfield 2006) Suber afirmava em 2009 que o FI como medida principal da qualidade da investigaccedilatildeo impede o crescimento das revistas de AA pois segundo o autor pode afastar os investigadores da publicaccedilatildeo em revistas de AA Contudo em 2017 existem jaacute revistas de AA com o mesmo niacutevel de prestiacutegio das revistas tradicionais das puras como eacute o caso daquelas publicadas pela Public Library of Science (PLOS) e BioMed Central ou Hindawi agraves hiacutebridas de outros editores cientiacuteficos

Como incentivos para abertura dos seus trabalhos aleacutem do maior reconhecimento e impacto medido pela contagem de citaccedilotildees os investigadores apenas recebem recompensas menos tangiacuteveis como a promoccedilatildeo na carreira (Suber 2012) Para este autor o sucesso do AA natildeo depende do altruiacutesmo do investigador entendendo que o ganho de audiecircncia e de impacto atraveacutes da publicaccedilatildeo da investigaccedilatildeo em AA eacute do interesse pessoal do investigador

Sendo o AA dirigido agrave literatura cientiacutefica revista por pares seria de esperar que o controlo de qualidade natildeo constituiacutesse um problema Contudo surgiram no mundo editorial as revistas predatoacuterias um termo cunhado por Jeffrey Beall para definir as revistas que aproveitam o modelo dourado do AA em proveito proacuteprio ldquoThese predatory publishers are dishonest and lack transparencyrdquo Constroem siacutetios web semelhantes aos dos ldquolegitimate online publishers and publish journals of questionable and downright low qualityrdquo (Beall 2012) Beall assevera que ldquonow there is a journal willing to accept almost every article as long as the author is willing to pay the feerdquo (Beall 2012) Este tipo de revistas cobra pela publicaccedilatildeo de cada artigo sem no entanto oferecer os mesmos serviccedilos editoriais como a revisatildeo por pares um elemento fundamental para garantir a integridade e qualidade cientiacutefica

O AA acarreta vaacuterios benefiacutecios para a sociedade e comunidade cientiacutefica como o aumento da velocidade eficiecircncia e eficaacutecia da investigaccedilatildeo facilita a investigaccedilatildeo interdisciplinar amplia a visibilidade uso e impacto da investigaccedilatildeo e permite que as comunidades de profissionais empreendedores e o puacuteblico em geral retirem valor da investigaccedilatildeo (Swan 2012 traduccedilatildeo livre) O projeto Study of Open Access Publishing (SOAP) concluiu que cerca de 90 dos investigadores que responderam ao inqueacuterito consideram que o AA eacute beneacutefico para a investigaccedilatildeo cientiacutefica com impacto direto positivo no fluxo da comunicaccedilatildeo acadeacutemica (Dallmeier-Tiessen et al 2011)

De acordo com Harnad e Brody (2004) a melhor forma de calcular o impacto do AA eacute ldquocompare the citation counts of individual OA and non-OA articles appearing in the same (non-OA) journals Such ongoing comparisons are revealing dramatic citation advantages for OA Os mesmos autores enfatizam que o acesso natildeo eacute uma condiccedilatildeo suficiente para a citaccedilatildeo mas eacute uma condiccedilatildeo necessaacuteria Com as publicaccedilotildees em AA a crescer exponencialmente entre as revistas de AA e os repositoacuterios ldquoverdesrdquo eacute natural

12

que o uso e impacto potencial aumentem com variaccedilotildees entre campos de conhecimento decorrentes da sua cultura de partilha

Apoacutes a anaacutelise de 36 estudos sobre o impacto do AA nas citaccedilotildees de artigos Swan (2010) concluiu que 27 desses estudos apresentavam uma clara subida do nuacutemero meacutedio de citaccedilotildees Os artigos cientiacuteficos disponibilizados em AA satildeo mais citados que aqueles que permanecem fechados estando este facto relacionado com o aumento de audiecircncia e visibilidade promovida pelo AA (Suber 2012 Caruso Nicol amp Archambault 2013) Swan (2012) defende que o AA estaacute a nivelar a comunicaccedilatildeo cientiacutefica e o acesso a ela A mesma autora realccedila que a investigaccedilatildeo cientiacutefica tem impacto tambeacutem fora do meio acadeacutemico ao niacutevel empresarial sauacutede ou educaccedilatildeo A OECD (2015a) acrescenta que os artigos satildeo mais citados porque possuem livre acesso e uso e natildeo propriamente pela sua qualidade Um estudo da Science-Metrix concluiu que o AA pode aumentar o nuacutemero de artigos citados e diminuir a citaccedilatildeo de artigos que os investigadores natildeo leram Poreacutem a mesma anaacutelise revelou que apenas 8 dos 28 paiacuteses auscultados conseguiram publicar 50 ou mais dos artigos produzidos em AA (Caruso Nicol amp Archambault 2013)

A distinccedilatildeo entre Graacutetis e Livre natildeo possuiu o mesmo significado que a distinccedilatildeo entre via verde e via dourada Enquanto a primeira distinccedilatildeo se refere aos direitos cedidos aos utilizadores (Quatildeo aberto estaacute) a segunda distinccedilatildeo refere-se ao modo de publicaccedilatildeo (Como eacute entregue) (Suber 2012) Os direitos de autor podem constituir uma barreira de peso ao AA A abertura requerida pelo estatuto de AA Livre deve ser assegurada pela concessatildeo de licenccedilas que informem os utilizadores sobre o que podem e natildeo podem fazer com determinado produto de investigaccedilatildeo cientiacutefica Existem licenccedilas abertas como as Creative Commons (CC) que permitem a criaccedilatildeo de modelos de licenciamento com diferentes niacuteveis de permissotildees podendo desta forma o detentor dos direitos de autor autorizar o niacutevel de permissatildeo que lhe seja mais conveniente

Das 9431 revistas cientiacuteficas de AA listadas no Directory of Open Access Journals (DOAJ) em Maio de 2017 8447 dessas revistas utilizavam licenccedilas CC enquanto 278 revistas possuiacuteam licenccedilas proacuteprias das editoras Os cerca de 90 do nuacutemero total de revistas de AA a utilizar licenccedilas CC representa um crescimento exponencial desde 2012 quando Suber afirmou que apenas 20 das revistas em AA usavam algum tipo de licenccedila CC Nesta mesma data encontram-se listadas no DOAJ 78 revistas de AA de editoras portuguesas sendo que 91 dessas publicaccedilotildees usa licenccedilas CC para permitir o AA Livre (Directory of Open Access Journals [DOAJ] 2017)

A abertura dos resultados de investigaccedilatildeo eacute suportada por poliacuteticas que podem encorajar ou requerer de forma obrigatoacuteria o AA Por norma o encorajamento eacute feito na via dourada enquanto na via verde se definem mandatos Segundo Swan (2012 traduccedilatildeo livre) na formulaccedilatildeo de uma poliacutetica de AA devem ser considerados os

13

seguintes fatores Modo de publicaccedilatildeo (via verde ou dourada) Local de depoacutesito Tipos de conteuacutedos abrangidos Periacuteodos de embargo Permissotildees Niacuteveis de aplicaccedilatildeo Sensibilizaccedilatildeo de apoio agraves poliacuteticas Sanccedilotildees por incumprimento e Isenccedilotildees

De acordo com Suber (2012) existe similitude na abordagem agraves poliacuteticas de AA entre universidades e agecircncias de financiamento que tanto podem encorajar a via dourada como requerer a via verde A Wellcome Trust do Reino Unido e a National Institutes of Health (EUA) satildeo dois casos de sucesso de mandatos verdes requerendo que os investigadores depositem o seu trabalho num repositoacuterio de AA e que retenham o direito de autorizar esse AA o que permite que as instituiccedilotildees disponibilizem de forma aberta todos os resultados de investigaccedilatildeo por si financiados (National Institutes of Health [NIH] 2008 Wellcome Trust 2013)

O mais recente programa de financiamento de ciecircncia e inovaccedilatildeo da Uniatildeo Europeia o Horizonte 2020 detalha no artigo 292 do Model Grant Agreement os requisitos legais na abertura das publicaccedilotildees cientiacuteficas financiadas por este programa onde cada beneficiaacuterio deve assegurar o AA a todas as publicaccedilotildees revistas por pares utilizando para isso as duas vias disponiacuteveis (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016a traduccedilatildeo livre)

Existem tambeacutem serviccedilos com o intuito de facilitar a abertura das publicaccedilotildees cientiacuteficas O Registry of Open Access Repository Mandates and Policies (ROARMAP) lista as poliacuteticas e mandatos de AA ao niacutevel global registados neste diretoacuterio Em novembro de 2016 o ROARMAP conta com 794 mandatos instituiacutedos por vaacuterios tipos de organizaccedilotildees Portugal conta com 21 poliacuteticas de AA por via verde distribuiacutedas na sua maioria por instituiccedilotildees de ensino superior Os serviccedilos SHERPA da Universidade de Nottingham atraveacutes das bases de dados RoMEO e JULIET dispotildeem de valiosos indicadores quanto agraves poliacuteticas de AA das editoras cientiacuteficas e das entidades financiadoras de investigaccedilatildeo Relativamente agraves poliacuteticas editoriais de AA tendo em conta os direitos de autor e o auto arquivo existem em Portugal 127 poliacuteticas segundo o SHERPARoMEO sendo que mais de metade autoriza a publicaccedilatildeo em AA do poacutes-print ou da versatildeo final do editor Jaacute em termos de poliacuteticas de AA requeridas pela instituiccedilatildeo financiadora apenas a Fundaccedilatildeo para a Ciecircncia e Tecnologia (FCT) aparece listada no SHERPAJULIET

O AA envolve vaacuterios intervenientes distintos que cooperam na disponibilizaccedilatildeo dos resultados da investigaccedilatildeo cientiacutefica Assim como intervenientes podemos encontrar os investigadores cujo esforccedilo permite a criaccedilatildeo e difusatildeo de novo conhecimento com valor cientiacutefico a sociedade em geral que pode usufruir e construir em cima do novo conhecimento as universidades e institutos de investigaccedilatildeo que disponibilizam condiccedilotildees adequadas para o decurso da produccedilatildeo cientiacutefica incluindo a construccedilatildeo de infraestruturas de AA as entidades financiadoras de investigaccedilatildeo cientiacutefica as editoras que criam revistas de AA para permitir a difusatildeo acesso ao conhecimento e ainda

14

diversas organizaccedilotildees que dedicam parte das suas atividades agrave promoccedilatildeo de poliacuteticas e praticas de AA Entre as organizaccedilotildees mais relevantes podemos encontrar a UNESCO Wellcome Trust a Joint Information Systems Committee (JISC) a Scholarly Publishing and Academic Resources Coalition (SPARC) a Open Knowledge International (OKI) ou a NIH soacute para citar algumas das organizaccedilotildees mais reconhecidas pelo seu esforccedilo em direccedilatildeo ao AA

Em Portugal os grandes intervenientes do AA satildeo a FCT enquanto entidade financiadora a Fundaccedilatildeo para a Computaccedilatildeo Cientiacutefica Nacional (FCCN) no planeamento e gestatildeo da Rede Ciecircncia Tecnologia e Sociedade (RCTS) a Universidade do Minho pioneira no AA no paiacutes e o Repositoacuterio Cientiacutefico de Acesso Aberto de Portugal vulgo RCAAP que eacute um agregador da informaccedilatildeo cientiacutefica produzida

Segundo Suber (2012 traduccedilatildeo livre) o AA eacute um movimento amplo que abrange todos os campos de conhecimento todos os paiacuteses independentemente da sua realidade econoacutemica inclui a investigaccedilatildeo puacuteblica e privada sem limitaccedilatildeo temporal e natildeo se limita aos conteuacutedos textuais pois frequentemente estende-se aos dados conteuacutedos multimeacutedia e coacutedigo executaacutevel A UNESCO (2015) defende que o AA natildeo eacute um movimento isolado embora tenha caracteriacutesticas uacutenicas

111 Via Dourada

A via dourada do AA eacute a publicaccedilatildeo de artigos cientiacuteficos em revistas de AA que pode envolver o pagamento de custos de processamento - Article Processing Charge (APC) - pelo autor instituiccedilatildeo ou entidade financiadora ficando o artigo disponiacutevel e sem custos para os leitores A publicaccedilatildeo em AA por via dourada eacute compatiacutevel com a qualidade cientiacutefica das editoras tradicionais pois as revistas de AA possuem o serviccedilo de revisatildeo por pares dos artigos sendo que algumas delas jaacute atingiram um alto niacutevel de prestiacutegio O prestiacutegio das revistaseditoras cientiacuteficas eacute um fator que pesa na escolha do local de publicaccedilatildeo por parte dos investigadores Contudo o mundo editorial de AA conta jaacute com editoras de grande qualidade que implementaram sistemas rigorosos de revisatildeo cientiacutefica como satildeo o caso da BioMed Central ou PLoS (Swan 2012) O Sponsoring Consortium for Open Access Publishing in Particle Physics (SCOAP3) eacute um exemplo de sucesso de publicaccedilatildeo em AA dourado Sob orientaccedilatildeo do European Organization for Nuclear Research (CERN) apostou no redireccionamento do dinheiro aplicado nas subscriccedilotildees de revistas cientiacuteficas para efetuar o pagamento dos APCrsquos das revistas de AA da aacuterea da fiacutesica das partiacuteculas (Sponsoring Consortium for Open Access Publishing in Particle Physics [SCOAP3] 2014) Algumas revistas cientiacuteficas utilizam um modelo hiacutebrido que lhes permite dobrar os lucros ao cobrar subscriccedilotildees para acesso aos artigos permitindo contudo que estes fiquem em AA se for pago o APC pelo autor (Swan 2012)

15

O Reino Unido um dos liacutederes mundiais em investigaccedilatildeo concluiu que a implementaccedilatildeo de uma licenccedila nacional pode potenciar o AA ao permitir a negociaccedilatildeo de preccedilos ao mesmo tempo que orienta os investigadores para a publicaccedilatildeo em AA dourado (Price amp Chaytor 2015)

112 Via Verde

De acordo com Harnad et al (2004) a via verde de AA eacute um modo de publicaccedilatildeo em revistas cientiacuteficas de subscriccedilatildeo e o respetivo auto arquivo do trabalho publicado num repositoacuterio de AA O auto arquivo eacute o ato de submeter uma coacutepia de um documento cientiacutefico num repositoacuterio de AA de forma a assegurar a abertura e acesso ao seu conteuacutedo (UNESCO 2015) Existem trecircs tipos de documentos usados na via verde a versatildeo preacute-publicada (manuscrito natildeo sujeito a revisatildeo) a versatildeo poacutes-publicada (artigo aceite para publicaccedilatildeo) e a versatildeo final publicada (Laakso 2014 Bjoumlrk Lakso Welling Paetau 2014) Laakso (2014) sublinha a diferenccedila de quantidade de artigos publicados em AA e indexados pela SCOPUS entre as vaacuterias disciplinas cientiacuteficas com a fiacutesica e as ciecircncias da sauacutede a serem as aacutereas do conhecimento mais abertas por larga margem A falta de cultura de utilizaccedilatildeo do preacute-print a ausecircncia de revistas cientiacuteficas de alta qualidade ou a falta de financiamento para pagar os APCrsquos satildeo algumas das razotildees encontradas por Bjoumlrk et al (2014) para justificar a diferenccedila

Os repositoacuterios de AA satildeo coleccedilotildees ou bases de dados bibliograacuteficas de artigos cientiacuteficos publicados na web mas incluem outros conteuacutedos como teses dissertaccedilotildees datasets ou material didaacutetico oferecendo uma ligaccedilatildeo persistente a assegurando a preservaccedilatildeo a longo-prazo (Suber 2012) Os repositoacuterios natildeo efetuam o serviccedilo de revisatildeo por pares embora alojem artigos publicados em revistas de AA Outro aspeto importante da via verde de AA eacute o facto dos repositoacuterios de AA natildeo poderem gerar permissotildees de utilizaccedilatildeo por geralmente natildeo possuiacuterem esses direitos (Suber 2012 Bjoumlrk et al 2014)

Segundo Houghton amp Swan (2013) a via verde eacute o meio mais sustentaacutevel em termos de custos para todas as partes envolvidas Poreacutem de acordo com Swan (2012) soacute quando o AA por via verde eacute mandatado eacute que se atingem resultados satisfatoacuterios Apesar disso os repositoacuterios podem estimular a sua utilizaccedilatildeo se fornecerem serviccedilos como a contagem de citaccedilotildees ou estatiacutesticas de uso Bjork et al (2014 traduccedilatildeo livre) afirmam que o raacutecio de depoacutesito de artigos revistos pelos pares em repositoacuterios ronda os 12 justificando este baixo nuacutemero com os fracos sistemas de incentivo acadeacutemico com a falta de repositoacuterios adequados com a falta de conhecimento e com o fato de ser uma tarefa que consome tempo

Segundo o Directory of Open Access Repositories (OpenDOAR) existem vaacuterios tipos de repositoacuterios de AA os disciplinares que reuacutenem toda a informaccedilatildeo cientiacutefica de um

16

determinado campo do conhecimento os institucionais que agregam a informaccedilatildeo produzida por uma determinada instituiccedilatildeo os governamentais que alojam informaccedilatildeo proveniente de oacutergatildeos do Governo e os repositoacuterios agregadores Em Novembro de 2016 encontram-se listados no OpenDOAR 49 repositoacuterios de AA localizados em Portugal sendo que cerca de frac34 da totalidade dos repositoacuterios pertence a instituiccedilotildees do ensino superior O Open Archive Initiative ndash Protocol for Metadata Harvesting (OAI-PMH) permite a interoperabilidade entre diferentes plataformas possibilitando aos repositoacuterios de AA formar um sistema central virtual potenciando a descoberta e acessibilidade da informaccedilatildeo cientiacutefica (Suber 2012 Swan 2012 Bjoumlrk et al 2014) A Cybermetrics Lab lanccedilou em 2017 o Ranking de Repositoacuterios Web um grupo de investigaccedilatildeo do Conselho Superior de Investigaccedilatildeo Cientiacutefica de Espanha com o objetivo de apoiar o AA agraves publicaccedilotildees cientiacuteficas

Portugal possui 4 repositoacuterios no grupo dos 223 ldquoTop Portalsrdquo do ranking com o Scielo Portugal a ocupar a 76ordf posiccedilatildeo o Repositoacuterio Comum na 87ordf posiccedilatildeo a Plataforma de Revistas de AA da Universidade de Aveiro na 110ordf posiccedilatildeo e o Depoacutesito de Dissertaccedilotildees e Teses Digitais na 124ordm posiccedilatildeo No ldquoTop Institutionalsrdquo Portugal eacute representado pelo Universidade do Minho Repositorium na 60ordf posiccedilatildeo seguido pelo Repositoacuterio Universidade de Lisboa na 156ordf posiccedilatildeo e Repositoacuterio Aberto Universidade do Porto na 188ordf posiccedilatildeo entre os melhores duzentos classificados Em termos de ranking mundial o Repositorium da Universidade do Minho eacute o repositoacuterio melhor colocado ocupando a 68ordf posiccedilatildeo (Cybermetrics Lab 2017)

A relaccedilatildeo entre a via verde e a via dourada pode ser vista como ldquocomplementary and synergisticrdquo pois a filosofia de criaccedilatildeo e implementaccedilatildeo eacute a mesma (Suber 201258) Para este autor a via verde natildeo necessita de investimento econoacutemico tatildeo elevado para alavancar o AA agraves publicaccedilotildees cientiacuteficas nem infringe a liberdade acadeacutemica podendo ainda cobrir todos os resultados de investigaccedilatildeo de uma instituiccedilatildeo Este modo de disseminaccedilatildeo eacute compatiacutevel com a publicaccedilatildeo nas tradicionais revistas por subscriccedilatildeo podendo ainda alojar outros conteuacutedos que natildeo apenas artigos Jaacute a via dourada possui a vantagem de ser imediata sem periacuteodos de embargo podendo ainda ser classificada como AA Livre se forem dadas as respetivas permissotildees de uso Acrescenta-se o facto de a via dourada possuir o serviccedilo de revisatildeo por pares e fornecer sempre o acesso agrave versatildeo final do artigo Suber (2012 traduccedilatildeo livre) afirma que apenas a conjugaccedilatildeo das vantagens de cada modelo de publicaccedilatildeo garante a complementaridade de publicaccedilatildeo em AA uma vez que por si soacute tanto a via verde como a via dourada natildeo satildeo suficientes para assegurar o pleno AA O autor defende que enquanto a via verde atua melhor no registo e preservaccedilatildeo da investigaccedilatildeo cientiacutefica a via dourada assegura uma melhor distribuiccedilatildeo e certificaccedilatildeo de qualidade Na impossibilidade de publicar por uma das vias o investigador pode optar pela outra via assegurando sempre o AA ao seu trabalho

17

12 A Ciecircncia Aberta

A investigaccedilatildeo cientiacutefica encontra-se numa transiccedilatildeo cultural que abrange os

modelos de publicaccedilatildeo e reutilizaccedilatildeo na procura de uma maior abertura com o cariz digital a impulsionar o acesso aos resultados cientiacuteficos Machado (2015) salienta a necessidade de adotar um conceito mais amplo e que possa alojar na sua definiccedilatildeo toda a panoacuteplia de recursos cientiacuteficos produzidos durante o processo de investigaccedilatildeo A Ciecircncia Aberta (CA) refere-se comummente ao esforccedilo para tornar mais acessiacuteveis os resultados da investigaccedilatildeo cientiacutefica financiada pelo setor puacuteblico em formato digital para a comunidade cientiacutefica setor empresarial ou sociedade em geral (OECD 2015a)

O conceito de CA eacute considerado um termo guarda-chuva que assenta em vaacuterios pilares quer para remoccedilatildeo das barreiras de partilha de qualquer resultado meacutetodo ou ferramenta em qualquer fase do processo de investigaccedilatildeo (Bueno de la Fuente 2016 traduccedilatildeo livre) quer como sua condiccedilatildeo para a sua concretizaccedilatildeo (infraestrutura tecnoloacutegica) quer como desambiguaccedilatildeo de autores instituiccedilotildees e produccedilatildeo cientiacutefica (identificadores uacutenicos) A figura seguinte expressa algumas das vertentes que se enquadram no conceito amplo de CA e que respeita a manifestaccedilotildees muito distintas natildeo apenas da academia como jaacute foi referido mas de todas as esferas da sociedade

Fig 1 Os pilares da Ciecircncia Aberta Fonte adaptado de httpswwwfosteropenscienceeucontentwhat-open-science-introduction

A CA eacute um meio e natildeo um fim Garantir o acesso aos resultados de investigaccedilatildeo cientiacutefica pode tornar o sistema de investigaccedilatildeo mais eficiente ao reduzir custos na coleta transferecircncia e reutilizaccedilatildeo de dados ao aumentar a transparecircncia e qualidade no processo de investigaccedilatildeo acelerar a transferecircncia do conhecimento aumentar a

Ciecircncia Aberta

Acesso Aberto

Dados Abertos

Ciecircncia Cidadatilde

Revisatildeo por Pares Aberta

Coacutedigo Aberto

Blocos de Notas abertos

Recursos Educacionais

Abertos

Redes Sociais Cientiacuteficas

18

repercussatildeo do conhecimento na economia e promover a ligaccedilatildeo entre cidadatildeos e a ciecircncia e a investigaccedilatildeo (OECD 2015a traduccedilatildeo livre) A colaboraccedilatildeo dos cidadatildeos no processo de investigaccedilatildeo eacute denominada ciecircncia cidadatilde sendo o movimento de CA um importante facilitador da participaccedilatildeo puacuteblica na ciecircncia (Leonelli Spichtinger Prainsack 2015) O crescimento da ciecircncia cidadatilde aumentou o nuacutemero de intervenientes na cocriaccedilatildeo de conhecimento contribuindo para a aproximaccedilatildeo da fronteira entre o cientista profissional e o amador (Royal Society 2012 International Science 2015) Segundo a UNESCO (2012) citando dados da PubMed Central 40 do acesso a resultados de investigaccedilatildeo eacute feito por cidadatildeos individuais superando a utilizaccedilatildeo feita por universidades empresas e governo

Segundo a Open Science and Research Initiative (2014) a promoccedilatildeo da CA eacute feita em 4 niacuteveis definiccedilatildeo de poliacuteticas gerais alteraccedilatildeo na cultura de trabalho alteraccedilatildeo nos meacutetodos de trabalho e desenvolvimento de serviccedilos e infraestruturas Fecher amp Friesike (2013) estruturaram as mudanccedilas na CA em cinco escolas de pensamento

Fig 2 As 5 escolas de pensamento das mudanccedilas operadas pela Ciecircncia Aberta Fonte Fecher amp Friesike (2013)

A abertura aos resultados da investigaccedilatildeo eacute segundo a UNESCO (2015) muito requerida no processo de capacitaccedilatildeo dos cidadatildeos sendo que esta noccedilatildeo de abertura acarreta mudanccedilas na sociedade ao fornecer soluccedilotildees sustentaacuteveis para o chamado fosso digital6 Para a CA prosperar a comunidade acadeacutemica deve ter acesso a publicaccedilotildees dados meacutetodos conhecimentos serviccedilos de apoio e colaboraccedilatildeo entre os diversos intervenientes (Open Science and Research Initiative 2014 Leonelli Spichtinger Prainsack 2015 OECD 2015a Resoluccedilatildeo do Conselho de Ministros nordm 212016 2016) O acesso agrave literatura acadeacutemica tem por objetivo transpor a clivagem de conhecimento existente na sociedade fornecendo o Acesso Aberto (AA) atraveacutes de sistemas em linha aos resultados da investigaccedilatildeo financiada com fundos puacuteblicos (UNESCO 2015)

6 Segundo o glossaacuterio estatiacutestico da OCDE o termo fosso digital refere-se agrave desigualdade no acesso agrave informaccedilatildeo tecnologias de comunicaccedilatildeo e uso da Internet entre indiviacuteduos negoacutecios e aacutereas geograacuteficas com diferentes niacuteveis socioeconoacutemicos Disponiacutevel na WWW httpsstatsoecdorgglossarydetailaspID=4719

bull dirigida agrave arquitetura tecnoloacutegica com novas plataformas ferramentas e serviccedilos para os cientistas Infraestrutura

bull dirigida agrave acessibilidade do conhecimento pelo puacuteblico Puacuteblica bull dirigida ao desenvolvimento de uma nova avaliaccedilatildeo alternativa de impacto Avaliaccedilatildeo

bull dirigida ao acesso gratuito ao conhecimento pelo puacuteblico Democraacutetica

bull melhoria da eficiecircncia atraveacutes da investigaccedilatildeo colaborativa Pragmaacutetica

19

O projeto da EU Facilitate Open Science Training for European Research (FOSTER) assume a divisatildeo do conceito de Ciecircncia Aberta em quatro diferentes categorias Acesso Aberto Dados Abertos Coacutedigo Aberto e Investigaccedilatildeo Replicaacutevel Aberta (Pontika Knoth Cancellieri amp Pearce 2015)

A plena implementaccedilatildeo da CA estaacute dependente da resoluccedilatildeo de alguns desafios A Royal Society (2012) afirma que os interesses comerciais e econoacutemicos incluem a propriedade dos dados e os direitos de propriedade intelectual associados as parcerias puacuteblico-privadas e a abertura de informaccedilatildeo comercial de interesse puacuteblico a que se junta a privacidade e a seguranccedila e que constituem limites agrave implementaccedilatildeo da CA Por outro lado os incentivos e as recompensas concedidos agrave comunidade cientiacutefica continuam a ser inexistentes particularmente porque existe (i) falta de infraestruturas para apoiar a abertura (ii) receio que os dados em bruto e meacutetodos sejam mal interpretados ou mal usados (iii) incerteza sobre a propriedade dos dados e (iv) falta de experiecircncia na promoccedilatildeo da CA (Open Science and Research Initiative 2014 traduccedilatildeo livre) Metaforicamente Leonelli Spichtinger Prainsack (201513) defendem que ldquoin addition to the stick of compulsatory mandates carrots are therefore also neededrdquo Os autores sintetizam as ldquocarrotsrdquo ou seja as recompensas em trecircs eixos reconhecimento das praacuteticas de partilha nas estruturas de incentivos criaccedilatildeo de incentivos mais significativos para envolver os investigadores na CA e o reconhecimento do papel das meacutetricas alternativas na avaliaccedilatildeo dos investigadores

A CA proporciona vaacuterios benefiacutecios a todos os intervenientes e partes interessadas do processo de investigaccedilatildeo como o aumento da eficaacutecia da investigaccedilatildeo o aumento do conhecimento do modelo cientiacutefico melhoria do foco e da qualidade dos resultados de investigaccedilatildeo geraccedilatildeo de novas ideias de investigaccedilatildeo aumento do compromisso com a ciecircncia e melhoria da literacia cientiacutefica maior abertura e impacto social e econoacutemico aumento da qualidade visibilidade e impacto da investigaccedilatildeo (Open Science and Research Iniciative 2014 Leonelli Spichtinger Prainsack 2015 Forsstroumlm amp Haataja 2016) Estes benefiacutecios abrangem os investigadores e as suas equipas as organizaccedilotildees os decisores e financiadores e tambeacutem o puacuteblico em geral

A CA clama por uma mudanccedila no comportamento dos investigadores de forma a permitir a abertura de conteuacutedos e a adoccedilatildeo de praacuteticas e estrateacutegias abertas em todo o ciclo de investigaccedilatildeo (Pontika et al 2015) De acordo com Machado (2015) a abertura do conhecimento na sociedade da informaccedilatildeo pode ser uma realidade se essa for a prioridade de qualquer poliacutetica que tenha por objetivo promover a melhoria das condiccedilotildees de vida dos cidadatildeos e a reduccedilatildeo das assimetrias globais Quando falamos de CA aquilo que se vecirc eacute uma realidade jaacute espelhada globalmente inclusivamente em paiacuteses como a China (Price amp Chaytor 2015) onde a abertura poliacutetica natildeo o faria supor

20

A Comissatildeo Europeia desenvolveu o Open Science Monitor como forma de avaliar os desenvolvimentos na CA e as tendecircncias particulares ldquoin open science activities over time and comparatively between countries and scientific disciplinesrdquo (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2017) O Open Science Monitor tem como fonte diversas organizaccedilotildees empenhadas na avaliaccedilatildeo da CA do AA e dos Dados Abertos7 garantindo assim a profundidade e qualidade dos dados O modelo usado pelo Open Science Monitor divide diversos indicadores de avaliaccedilatildeo em trecircs categorias AA agraves publicaccedilotildees AA aos dados de investigaccedilatildeo e formas abertas de comunicaccedilatildeo acadeacutemica como demostrado na figura8 seguinte

Fig 3 Caracteriacutesticas e indicadores do Open Science Monitor Fonte Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2017) Disponiacutevel na WWW httpeceuropaeuresearchopenscienceindexcfmpg=homeampsection=monitor

A implementaccedilatildeo da CA implica alteraccedilotildees ao niacutevel da administraccedilatildeo da investigaccedilatildeo para melhorar a ciecircncia tornando-a crediacutevel replicaacutevel e iacutentegra como explica a Comissatildeo Europeia (2016a) Significa tambeacutem fazer alteraccedilotildees teacutecnicas e desenvolver normas para tornar a ciecircncia mais eficiente ao evitar a duplicaccedilatildeo de 7 Entre as vaacuterias organizaccedilotildees encontram-se a 101 innovations Clarivate Analytics Altimetric arXiv F1000Research figshare OpenAIRE Wiley entre outras 8 Os indicadores assinalados com um asterisco () tambeacutem satildeo considerados como forma de comunicaccedilatildeo acadeacutemica aberta

21

recursos e ao otimizar a reutilizaccedilatildeo de dados Por fim tornar a ciecircncia mais aberta ao melhorar a acessibilidade a dados e ao assegurar as condiccedilotildees legais apropriadas para o desenvolvimento de Text e Data Mining potenciando assim alteraccedilotildees econoacutemicas e legais ao niacutevel do copyright

Os investigadores recorrem cada vez mais agraves plataformas sociais para partilhar e validar os projetos de investigaccedilatildeo enquanto a criaccedilatildeo de plataformas abertas permite a partilha de dados para resoluccedilatildeo de problemas puacuteblicos como eacute o caso do The Humanitarian Data Exchange9 (Open Science and Research Initiative 2014) A ScienceOpen eacute outro exemplo de uma plataforma gratuita de pesquisa de informaccedilatildeo cientiacutefica que oferece contexto agrave investigaccedilatildeo atraveacutes de comentaacuterios recomendaccedilotildees ou revisatildeo por pares apoacutes a publicaccedilatildeo permitindo assim que os investigadores encontrem a informaccedilatildeo mais relevante para as suas pesquisas (ScienceOpen 2017) Nos uacuteltimos anos tecircm surgido outras formas de publicaccedilatildeo em AA normalmente atraveacutes de paacuteginas pessoais ou em siacutetios de comunidades cientiacuteficas como o academiaedu ou o Research Gate que em 2017 foram classificados como liacutederes do ranking ldquoTop Portalsrdquo do Ranking de Repositoacuterios Web pela Cybermetrics Lab Outros resultados interessantes foram obtidos por Kramer e Bosman (2016) apoacutes a anaacutelise dos dados dos mais de 20 mil participantes num inqueacuterito a niacutevel global A CA e o AA satildeo apoiados por 809 e 859 dos inquiridos respetivamente Em termos de publicaccedilatildeo de artigos o estudo indica o Research Gate e os repositoacuterios institucionais como os preferidos Relativamente agrave publicaccedilatildeo de dados a preferecircncia dos inquiridos recaiu no GitHub seguindo-se o Figshare DropBox BitBucket Dataverse Dryad e o Zenodo Poreacutem dos 20 mil inquiridos apenas cerca de 30 respondeu a esta questatildeo Em relaccedilatildeo a Portugal e no caso do apoio agrave CA e ao AA os resultados satildeo extremamente positivos contudo a amostra obtida eacute demasiado pequena para se poder aferir qualquer conclusatildeo definitiva E contrastam de forma gritante com as conclusotildees do relatoacuterio sobre a elaboraccedilatildeo de uma poliacutetica nacional de CA que sublinha a dificuldade de generalizaccedilatildeo das praacuteticas de AA registando por isso limitaccedilotildees nas ldquotaxas de sucesso e cumprimentos das poliacuteticas institucionaisrdquo (Comissatildeo Executiva Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta [Comissatildeo Executiva GT-PNCA] 20169)

A intenccedilatildeo da EU eacute criar uma European Open Science Cloud (EOSC) ou seja um ambiente onde os investigadores possam ter acesso a ferramentas e dados para fins de investigaccedilatildeo inovaccedilatildeo e educaccedilatildeo Esta plataforma eacute considerada uma parte fundamental da transiccedilatildeo europeia para a CA e para tornar a ciecircncia orientada por dados (Comissatildeo Europeia 2016a traduccedilatildeo livre)

Podem observar-se algumas tendecircncias chave na CA e a sua relevacircncia na EOSC como o novo modelo de comunicaccedilatildeo acadeacutemica recompensas modernas e

9 Disponiacutevel na WWW httpsdatahumdataorg

22

reconhecimento aumento da dependecircncia de peritos de dados colaboraccedilatildeo interdisciplinar fomento da transiccedilatildeo de ciecircncia para inovaccedilatildeo desenvolvimento de um complexo sistema de infraestruturas da integridade da investigaccedilatildeo e do processamento do conhecimento por maacutequinas (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016b traduccedilatildeo livre)

O FOSTER desenhou uma interessante taxonomia a partir do termo CA que permite demonstrar a grandeza e os diferentes niacuteveis de impacto do conceito (Pontika et al 2015)

Fig 4 Taxonomia da Ciecircncia Aberta Fonte Knoth Petr Pontika Nancy (2015)

Em termos de poliacuteticas existem trecircs tendecircncias na definiccedilatildeo das poliacuteticas de CA como refere a OECD (2015a traduccedilatildeo livre)

As regras obrigatoacuterias impostas nos contratos de financiamento ou em poliacuteticas nacionais

Os mecanismos de incentivo como o apoio financeiro para publicaccedilatildeo de investigaccedilatildeo a citaccedilatildeo e a progressatildeo na carreira

Os viabilizadores ou seja a infraestrutura que permite o decurso da abertura cientiacutefica

23

A OECD (2015a) acrescenta que as poliacuteticas de AA satildeo mais maduras que as poliacuteticas de Ciecircncia Aberta existentes e sublinha ainda que as poliacuteticas de CA devem ter princiacutepios-base mas que tecircm de ser adaptadas agraves realidades locais

A CA tem estado em foco na agenda poliacutetica dos governos e organizaccedilotildees mundiais Ao niacutevel europeu a Agenda Digital da Comissatildeo Europeia define cinco potenciais linhas de accedilatildeo poliacuteticas (Comissatildeo Europeia 2016a45 traduccedilatildeo livre)

Fomento e criaccedilatildeo de incentivos para a CA atraveacutes do fomento do conceito de abertura em programas de educaccedilatildeo e promoccedilatildeo das melhores praacuteticas de ciecircncia cidadatilde garantindo a qualidade impacto e integridade da investigaccedilatildeo

Remoccedilatildeo de barreiras atraveacutes da revisatildeo de carreiras dos investigadores bem como dos incentivos e recompensas pelos esforccedilos de CA

Generalizaccedilatildeo da promoccedilatildeo de poliacuteticas de AA (artigos e dados de investigaccedilatildeo) Desenvolvimento de infraestruturas de investigaccedilatildeo para a CA de forma a

melhorar o alojamento de dados acesso e governaccedilatildeo com a criaccedilatildeo de uma nuvem europeia de CA (European Open Science Cloud)

Incorporar a Ciecircncia Aberta na sociedade como condutor socioeconoacutemico

De acordo com a Open Science and Research Initiative (2014) a CA tem vaacuterios intervenientes distintos os investigadores e as equipas de investigaccedilatildeo organizaccedilotildeesentidades de investigaccedilatildeo financiadores decisores e puacuteblico em geral A OECD (2015a) acrescenta as bibliotecas editoras cientiacuteficas privadas empresas e entidades supranacionais como a proacutepria OECD Neste contexto a EU tem-se destacado como promotora da CA Nesse sentido criou o jaacute mencionado FOSTER um projeto cujo objetivo eacute produzir um programa de treino que iraacute ajudar investigadores estudantes bibliotecaacuterios e outras partes interessadas a incorporar a CA nas suas metodologias de investigaccedilatildeo O portal FOSTER10 eacute uma plataforma e-learning que agrega conteuacutedos de treino sobre CA para aqueles que precisem de desenvolver estrateacutegias e competecircncias para a implementaccedilatildeo da CA nos fluxos de trabalho diaacuterio (FOSTER 2016) A Uniatildeo Europeia (EU) posiciona-se tambeacutem como financiadora do AA como forma de acesso ao conhecimento Nesse sentido adotou o AA como princiacutepio em 2012 tendo-o definido como obrigatoacuterio em 2013 no novo programa de financiamento da investigaccedilatildeo e inovaccedilatildeo europeu denominado Horizonte 2020 (Uniatildeo Europeia 2013) Financiou ainda um projeto de investigaccedilatildeo exclusivamente dedicado ao alinhamento de estrateacutegias e poliacuteticas de AA o Pasteur4OA Aleacutem disso a EU criou o OpenAIRE uma plataforma que permite agregar toda a literatura cientiacutefica produzida em projetos financiados por fundos europeus A segunda fase do OpenAIRE consiste em facilitar o AA ao fornecer ligaccedilotildees cruzadas entre publicaccedilotildees dados e esquemas de financiamento e iraacute expandir a rede de repositoacuterios para incluir os fornecedores de dados com o objetivo de interligar os dados cientiacuteficos associados

10 Disponiacutevel na WWW httpswwwfosteropenscienceeu

24

(OECD 2015a) A terceira fase do projeto arrancou em Janeiro de 2017 com o OpenAIRE-Connect que visa fornecer pontes tecnoloacutegicas e sociais para aleacutem de disponibilizar serviccedilos de troca de literatura dados ou meacutetodos de investigaccedilatildeo ldquowith semantic links between them across research communities and content providers in scientific communicationrdquo (OpenAIRE 2017) O OpenAIRE-Connect iraacute tambeacutem implementar o conceito de ldquoOpen Science as a Service (OSaaS) on top of the existing OpenAIRE infrastructure delivering out-of-the-box on demand deployable toolsrdquo (OpenAIRE 2017) O projeto eacute uma parceria entre 11 instituiccedilotildees onde consta a Universidade do Minho como representante portuguesa

A UNESCO estaacute ativamente empenhada na promoccedilatildeo da CA e em parceria com a Nature lanccedilou em Novembro de 2014 a Biblioteca Mundial de Ciecircncia11 (WLoS) uma biblioteca cientiacutefica gratuita e multilingue com o objetivo de fornecer acesso agrave investigaccedilatildeo cientiacutefica recente a estudantes e professores de todas as partes do globo Podemos ainda relacionar a CA com o conceito de Ciecircncia 20 que sugere a partilha e a colaboraccedilatildeo como nova abordagem para o uso de informaccedilatildeo incluindo o uso de ferramentas como wikis blogs viacutedeos dados em bruto e novas teorias (Machado 2015 Leonelli Spichtinger Prainsack 2015)

Em Portugal soacute em fevereiro de 2016 se regista a intenccedilatildeo de estabelecer uma poliacutetica nacional de Ciecircncia Aberta com a publicaccedilatildeo dos principiacuteos orientadores para a ldquoCiecircncia Aberta Conhecimento para todosrdquo pelo Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior (MCTES) Em Maio a Resoluccedilatildeo do Conselho de Ministros nordm 212016 vem definir os princiacutepios da implementaccedilatildeo da poliacutetica de Ciecircncia Aberta em Portugal Esta poliacutetica estaacute estruturada em torno de quatro eixos Acesso aberto e dados abertos Infraestruturas e preservaccedilatildeo digital Avaliaccedilatildeo cientiacutefica Responsabilidade social cientiacutefica (Comissatildeo Executiva GT-PNCA 2016)

O MCTES e o Ministeacuterio da Cultura lanccedilaram em 201712 o Diretoacuterio dos Repositoacuterios Digitais uma infraestrutura digital com o objetivo de identificar e constituir um ponto de acesso aos repositoacuterios digitais existentes em Portugal na aacuterea da Ciecircncia e da Cultura de forma a promover a utilizaccedilatildeo dos repositoacuterios digitais bem como a normalizaccedilatildeo teacutecnica e praacuteticas de preservaccedilatildeo digital tal como foi anunciado em 2016 (Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior Ministeacuterio da Cultura 2016)

13 Big Data ou dados massivos

O termo Big Data surge associado aos dados em formato digital que excedem a capacidade de processamento dos sistemas de bases de dados convencionais (Reitano 11 Disponiacutevel na WWW httpwwwnaturecomwlsabout 12 Disponiacutevel na WWW httprepositorios-conhecimentopt

25

2013 Comissatildeo Europeia 2014) Segundo Borgman (2015) o Big Data compreende dados estruturados e natildeo estruturados com tendecircncia agrave homogeneidade e agrave padronizaccedilatildeo Ubaldi (2013 traduccedilatildeo livre) reitera que o Big Data enquanto fenoacutemeno emergiu quando a disponibilidade de datasets produzidos por vaacuterias fontes cresceu e quando os utilizadores de dados reconheceram o valor potencial da combinaccedilatildeo e ligaccedilatildeo de diferentes conjuntos de dados produzidos por diferentes intervenientes

A revoluccedilatildeo digital ocorrida nas uacuteltimas deacutecadas teve repercussotildees profundas na coleta acesso armazenamento e transmissatildeo de dados estando atualmente estimado em 40 o volume de crescimento de dados por ano (Manyika et al 2011) Os dados digitais estatildeo presentes em todos os setores econoacutemicos o nuacutemero de paacuteginas web cresceu exponencialmente surgiram as redes sociais os smartphones e toda uma panoacuteplia de tecnologias que coletam dados que podem ser beneacuteficos para a sociedade como as aplicaccedilotildees surgidas no acircmbito da Internet of Things13 (IoT) que iratildeo avolumar o nuacutemero de dados jaacute produzidos (Fan amp Bifet 2012)

Weacutere drowning in data bits are faster than atoms (Croll 20122)

Large amounts of data are being produced permanently and when these are analyzed and interlinked they have the potential to create new knowledge and intelligent solutions for economy and society (Uniatildeo Europeia 2016)

Lynch (2009) salienta a emergecircncia do 4ordm paradigma da investigaccedilatildeo cientiacutefica termo cunhado por Jim Gray definindo-se como uma ciecircncia intensiva orientada a dados

Fig 5 Paradigmas da investigaccedilatildeo cientiacutefica Fonte traduzido de Lynch (2009)

Esta nova ciecircncia assenta em trecircs pilares captura curadoria e anaacutelise de dados (Bell 2009 Royal Society 2012) A curadoria de dados envolve variadas atividades como ldquofinding the right data structures to map into various storesrdquo (Bell 2009XIII) Inclui o esquema de metadados e os respetivos metadados para a sua preservaccedilatildeo e pesquisa A anaacutelise de dados ldquocovers a whole range of activities throughout the workflow pipeline including the use of databases analysis and modeling and then

13 A Internet Of Things eacute um conceito onde edifiacutecios transportes produtos e pessoas se tornam espaccedilos de informaccedilatildeo ou seja satildeo imbuiacutedos com sensores software ou eletroacutenica que lhes permite coletar e partilhar dados Disponiacutevel na WWW httpwwwtheinternetofthingseuwhat-is-the-internet-of-things

Investigaccedilatildeo teoacuterica

Investigaccedilatildeo empiacuterica

Investigaccedilatildeo computacional

Investigaccedilatildeo orientada a dados

26

data visualizationrdquo (Bell 2009XIV) podendo ser sinoacutenimo de melhores resultados processos e decisotildees (Comissatildeo Europeia 2014)

Dumbill (2012) afirma que para retirar valor destes dados eacute necessaacuterio encontrar formas alternativas de os processar Borgman reitera que os dados tecircm muitos tipos de valor e que esse valor pode natildeo ser visiacutevel ateacute os dados serem coletados curados ou perdidos A autora sublinha que os dados natildeo tecircm valor estando isolados eles fazem parte de uma infraestrutura do conhecimento ldquoan ecology of people pratices technologies institutions material objects and relationshpsrdquo (Borgman 20154) Este volume de dados produzidos pode segundo o Big Data Europe (2016) trazer contribuiccedilotildees relevantes para o progresso teacutecnico dos setores chave da sociedade e ajudar a reformular o mundo dos negoacutecios Ainda segundo a EU ldquowhat is needed are innovative technologies strategies and competencies for the beneficial use of Big Data to address societal needsrdquo

Segundo Manyika et al (2011) os Dados Massivos podem gerar valor de vaacuterias formas criar transparecircncia governativa e empresarial permitir a experimentaccedilatildeo expor variaacuteveis e melhorar o rendimento criar de produtos e serviccedilos para populaccedilotildees especiacuteficas apoiar ou substituir o processo de decisatildeo humana com algoritmos automatizados criar de modelos de negoacutecio produtos e serviccedilos inovadores Verifica-se que um nuacutemero crescente de empresas jaacute usa dados para gerar valor econoacutemico sendo que tambeacutem os governos tecircm a possibilidade de aumentar a sua eficiecircncia e gerar poupanccedila (Manyika et al 2011) A Comissatildeo Europeia (2017a) destaca as aplicaccedilotildees para smartphones ou produtos inteligentes para empresas acrescentando que os Dados Massivos podem fomentar o crescimento de emprego na Europa e melhorar a qualidade de vida dos cidadatildeos europeus

Numa organizaccedilatildeo o valor do Big Data eacute contabilizado em duas categorias uso analiacutetico e desenvolvimento de novos produtos (Dumbill 2012) Croll (20122) afirma a necessidade da sociedade em decidir agir e experimentar com base nas aprendizagens feitas e utilizar esse conhecimento em accedilotildees futuras defendendo que estamos a entrar numa ldquofeedback economyrdquo que iraacute tornar-se a norma em organizaccedilotildees puacuteblicas e no setor empresarial dada a eficiecircncia e a otimizaccedilatildeo de recursos geradas Esta economia de retorno de resultados e respetivas mediccedilotildees de impacto tem por base a cadeia de abastecimento dos Dados Massivos como representado na figura seguinte

27

Fig 6 Cadeia de abastecimento dos Dados Massivos Fonte traduzido de Croll (2012)

ldquoIn this networked world people objects and connections are producing data at unprecedented rates both actively and passivelyrdquo (Science International 2015) Segundo Hey Tansley e Tolle (2009) a Internet pode proporcionar mais do que o acesso aos dados pode agregar todos os dados disponiacuteveis agrave literatura que lhes faz referecircncia aumentando a velocidade da informaccedilatildeo cientiacutefica e a eficiecircncia da investigaccedilatildeo Laney (2001) foi o primeiro a caraterizar a gestatildeo de dados atraveacutes do sistema de trecircs Vrsquos que ajuda a perceber a natureza dos dados e as plataformas disponiacuteveis para os explorar Marr (2014) afirma que atualmente o sistema passou a ser composto por dois Vrsquos adicionais perfazendo um total de cinco Vrsquos

Volume o volume e o tamanho dos dados continuam a aumentar contudo a capacidade de processamento dos nossos sistemas continua baixa

Variedade existecircncia de diversos tipos de dados provenientes de diversas fontes Velocidade obtenccedilatildeo de informaccedilatildeo em tempo real Veracidade refere-se agrave qualidade e correccedilatildeo dos dados Valor ganho de competitividade tomada de decisotildees alavancada em informaccedilatildeo

atualizada

A intensidade da revoluccedilatildeo operada pelo fenoacutemeno dos Dados Massivos ldquohas produced changes in economic and social behaviour e has profound implications for sciencerdquo permitindo a identificaccedilatildeo de padrotildees em fenoacutemenos e demonstrando relaccedilotildees insuspeitas entre dados que ateacute aqui eram desconhecidas (Science International 2015) ldquoContrary to many high-volume big data settings where standardised infrastructure are available there exist other big data settings with less

Coleta de Dados

Extraccedilatildeo e Limpeza

Infra

estruturas

Plataformas

M Learning e Mining

Exploraccedilatildeo humana

Armazena mento

Partilha

Mediccedilatildeo de resultados e criaccedilatildeo de feedback

28

mature processes due to the lack of tools resources and community exchangerdquo (Proumll Meixner ampRauber 2016) Borgman (20158) recorre a um termo utilizado na Estatiacutestica para identificar distribuiccedilotildees de dados a long tail of data14 ou cauda longa dos dados que quando aplicada agrave investigaccedilatildeo acadeacutemica implica que ldquoa small number of research teams work with large volumes of data some teams work with very little data and most fall somewhere in betweenrdquo

Fig 7 A cauda longa dos Dados Massivos Fonte traduzido de Borgman (2015)

A cauda longa dos dados de investigaccedilatildeo abrange grandes porccedilotildees ldquoof data that are highly heterogeneous managed predominantly locally within each researcherrsquos environment and frequently not properly transferred to and managed within well-curated repositoriesrdquo (Proumll Meixner ampRauber 2016) Segundo o e-Infrastructure Reflection Group (e-IRG) (2016) citando Heidorn (2008) o termo long tail of data tem-se tambeacutem aplicado para salientar a variedade na estrutura tema complexidade formato tamanho localizaccedilatildeo e o uso na investigaccedilatildeo dos dados de investigaccedilatildeo

Para capturar todo o potencial gerado pela produccedilatildeo massiva de dados devem ser tidas em conta vaacuterias questotildees (Manyika et al 2011 traduccedilatildeo livre)

Formulaccedilatildeo de poliacuteticas de dados que incluam temas sensiacuteveis como a privacidade seguranccedila credibilidade e propriedade intelectual

Desenvolvimento de novas tecnologias de armazenamento computaccedilatildeo e software analiacutetico aleacutem de novas teacutecnicas de anaacutelise

Mudanccedila na cultura organizacional com a contrataccedilatildeo de peritos que possam retirar informaccedilatildeo e conhecimento dos dados e tambeacutem o estabelecimento de incentivos para otimizar o uso do Big Data induzindo melhorias numa tomada de decisatildeo mais informada

Acesso aos dados para permitir a criaccedilatildeo de novas oportunidades de negoacutecio Intensificaccedilatildeo da estrutura competitiva de empresas e setor puacuteblico para

potenciar a captaccedilatildeo de benefiacutecios da massificaccedilatildeo de dados

14 O termo foi introduzido por Cris Anderson (2004) para comparar o mercado de bens feito ao niacutevel de vendas fiacutesicas e online Disponiacutevel na WWW httpswwwwiredcom200410tail

Volu

me

de d

ados

Nuacutemero de Investigadores

29

O fenoacutemeno do Big Data estaacute intrinsecamente ligado a outro fenoacutemeno o desenvolvimento de software aberto como eacute o caso do Apache Hadoop15 que permite o processamento de grandes quantidades de dados em paralelo atraveacutes ldquolarge clusters of compute nodesrdquo (Fan amp Bifet 20123)

A influecircncia do Big Data na sociedade manifesta-se a diversos niacuteveis destacando-se o desenvolvimento de projetos na aacuterea da sauacutede transportes agricultura ambiente induacutestria ganho de competecircncias cientiacuteficas mercado de dados e dados abertos Num artigo assinado na Computer World Olavsrud (2013) identifica alguns dos usos do Big Data na atualidade fins meacutedicos empresariais tecnoloacutegicos em eventos desportivos ou no desenvolvimento das smart cities A Uniatildeo Europeia tem contribuiacutedo para o alargar da importacircncia e da esfera de influecircncia do fenoacutemeno Big Data financiando entre outros projetos como

DataPitch16 que tem por objetivo acelerar a chegada dos dados ao mercado Open Data Incubator Europe17 (ODINE) que oferece incubaccedilatildeo e tutoria agraves PMEs

na nova geraccedilatildeo de empreendedorismo digital European Data Science Academy18 (EDSA) que avalia o estado do setor de peritos

de dados e oferece ciclos de aprendizagem de habilidades especiacuteficas de acordo com as necessidades detetadas

Big Data Europe que visa coletar informaccedilotildees sobre o desenvolvimento de infraestruturas necessaacuterias agrave praacutetica de uma ciecircncia de dados intensiva para a resoluccedilatildeo de problemas da sociedade possibilitando que as empresas possam construir produtos e serviccedilos inovadores ldquobased on semantically interoperable large-scale multi-lingual data assets and knowledge available under a variety of licenses and business modelsrdquo (Big Data Europe 2016)

14 Dados Abertos

Eacute axiomaacutetico o fato de o conhecimento ser essencial ao processo de decisatildeo agrave inovaccedilatildeo e ao bem-estar social Os dados sempre foram essenciais em muitas aacutereas da investigaccedilatildeo e nos uacuteltimos anos tornaram-se destaque em mais aacutereas cientiacuteficas crescendo substancialmente em escala e complexidade Quando a informaccedilatildeo eacute abundante a proacutepria natureza da investigaccedilatildeo comeccedila a mudar gerando um ciclo de respostas entre investigadores e resultados de investigaccedilatildeo que ldquochanges the pace and direction of discoveryrdquo (Comissatildeo Europeia Grupo de peritos de alto niacutevel em dados de investigaccedilatildeo 20108) Os Dados Abertos permitem que os investigadores produzam anaacutelises e inferecircncias muito aleacutem do que os indiviacuteduos e silos de dados isolados podem

15 Disponiacutevel na WWW httphadoopapacheorg 16 Disponiacutevel na WWW httpcordiseuropaeuprojectrcn206193_enhtml 17 Disponiacutevel na WWW httpsopendataincubatoreu 18 Disponiacutevel na WWW httpcordiseuropaeuprojectrcn194116_enhtml

30

produzir (Shadbolt 2016) O International Council for Science (ICSU) considera que quando o setor publico eacute o responsaacutevel pelos custos da criaccedilatildeo de dados de investigaccedilatildeo eacute do interesse cientiacutefico que seja encorajado o maacuteximo e possiacutevel uso e reuacuteso dos dados (International Council for Science [ICSU] 2014) A abertura dos dados gerados na investigaccedilatildeo cientiacutefica ou pelas entidades puacuteblicas as grandes fontes de dados na atualidade constituem uma oportunidade de gerar valor para a sociedade Segundo Borgman (2015) dados satildeo representaccedilotildees de observaccedilotildees objetos ou outras entidades usadas como prova de um fenoacutemeno para fins de investigaccedilatildeo ou acadeacutemicos Os dados tornam-se informaccedilatildeo quando satildeo combinados de formas que podem revelar padrotildees num determinado fenoacutemeno O conhecimento eacute gerado pela informaccedilatildeo apoiada em dados concretos sobre um fenoacutemeno (Royal Society 2012)

ldquoIn the digital age data is the raw material on which discoveries are built and unfettered access to research datardquo (SPARC) O processo de investigaccedilatildeo eacute dividido em vaacuterias etapas atraveacutes das quais muitas vezes satildeo produzidos dados primaacuterios estatiacutesticas caacutelculos ou anotaccedilotildees seja em forma bruta ou em forma graacutefica que servem de suporte aos artigos cientiacuteficos publicados Contudo dada a variedade de tipologias e formatos por norma os dados natildeo satildeo alvo de publicaccedilatildeo correndo o risco de ser perderem se natildeo forem adequadamente armazenados e preservados Neste sentido a abertura de dados eacute essencial para assegurar a sua preservaccedilatildeo e possiacutevel reutilizaccedilatildeo em benefiacutecio da sociedade

Existem vaacuterias definiccedilotildees de Dados Abertos apresentando algumas diferenccedilas entre elas embora focando o mesmo objetivo Algumas das definiccedilotildees satildeo emitidas no acircmbito da abertura de dados puacuteblicos outras da abertura de dados de investigaccedilatildeo O portal de dados dos EUA define Open Data como os conjuntos de dados de alto valor criados pelo governo federal que possam ser processados por maacutequina e que natildeo sejam privados ou restritos por razotildees de seguranccedila (United States General Services Administration) A Royal Society (2012) entende por Open Data os dados que devem ser acessiacuteveis utilizaacuteveis avaliados ou certificados e inteligiacuteveis A Open Definition sintetiza que os Dados Abertos devem poder ser ldquofreely used modified and shared by anyone for any purposerdquo (Open Knowledge International [a]) Segundo a Open Knowledge International (OKI) (2012b) ldquoOpen Data are the building blocks of open knowledgerdquo O termo Open Data pode ainda referir-se a outros tipos de dados natildeo puacuteblicos que sejam acessiacuteveis de forma livre como os dados dos meacutedia sociais (European Data Portal 2016a)

ldquoOpenness is not however enough Data must be intelligently openrdquo (Science International 20154) O primeiro passo na abertura inteligente dos dados eacute segundo a Royal Society (20127) ldquodata that underpin a journal article should be made concurrently available in a accessible databaserdquo O mundo acadeacutemico tem vindo a ser moldado para apoiar a abertura agrave medida que os benefiacutecios se tornam mais tangiacuteveis e

31

a pressatildeo de retorno de investimento exercida sobre as entidades financiadoras aumenta embora nem todas as aacutereas evoluam com a mesma rapidez (Hahnel amp Hook 2016) A Royal Society (2012) sublinha a necessidade das instituiccedilotildees ligadas agrave investigaccedilatildeo cientiacutefica gerirem os seus dados de modo proficiente para obterem os benefiacutecios proporcionados pela abertura de dados e entenderem a enorme mudanccedila cultural necessaacuteria para atingir este objetivo

A Denton Declaration foi publicada em 2012 com o intuito de promover boas praacuteticas de gestatildeo de dados de investigaccedilatildeo promover a colaboraccedilatildeo transparecircncia e prestaccedilatildeo de contas ao longo das fronteiras organizacionais e disciplinares Esta declaraccedilatildeo estabeleceu treze princiacutepios para promover a cultura de abertura na investigaccedilatildeo estabelecer um padratildeo para arquivo de dados de modo a facilitar a sua pesquisa e acesso desenvolver um regime de financiamento para a construccedilatildeo da infraestrutura necessaacuteria para a gestatildeo de dados adotar padrotildees de metadados preservar a longo prazo os dados subjacentes agraves publicaccedilotildees apoiar os investigadores nas negociaccedilotildees para a abertura dos dados com as editoras e o reconhecer da propriedade intelectual dos investigadores nos dados e em outros produtos de investigaccedilatildeo (Denton Declaration An Open Data Manifesto 2012 traduccedilatildeo livre)

A gestatildeo de informaccedilatildeo e do conhecimento deve ser incluiacuteda nas estrateacutegias organizacionais das instituiccedilotildees (Royal Society 2012) Quando os dados satildeo bem organizados documentados preservados e partilhados tornam-se preciosos no avanccedilo cientiacutefico e no aumento de oportunidades de aprendizagem e inovaccedilatildeo (UK Data Archive 2017) O ciclo de vida dos dados contempla seis fases de gestatildeo incluiacutedas num processo contiacutenuo a cada reutilizaccedilatildeo geram-se novos dados conforme demonstrado na figura seguinte

Fig 8 Ciclo de vida dos dados de investigaccedilatildeo Fonte traduzido de UK Data Archive (2017) Disponiacutevel na WWW httpwwwdata-archiveacukcreate-managelife-cycle

As seis fases do ciclo de vida dos dados comportam diversas accedilotildees necessaacuterias agrave plena execuccedilatildeo de cada ciclo

Criaccedilatildeo

Processa mento

Anaacutelise

Preservaccedilatildeo

Fornecer acesso

Reutilizaccedilatildeo

32

Criaccedilatildeo desenho da investigaccedilatildeo criaccedilatildeo do plano de gestatildeo de dados planear a partilha localizar dados existente coletar dados capturar eou criar metadados

Processamento entrada de dados transcriccedilatildeo traduccedilatildeo validaccedilatildeo limpeza anonimizaccedilatildeo descriccedilatildeo gestatildeo e armazenamento de dados

Anaacutelise interpretaccedilatildeo e derivaccedilatildeo de dados produccedilatildeo de resultados de investigaccedilatildeo publicaccedilatildeo e preparaccedilatildeo dos dados para preservaccedilatildeo

Preservaccedilatildeo migraccedilatildeo de dados para o melhor formato criaccedilatildeo de coacutepia de seguranccedila e armazenamento criaccedilatildeo de metadados e arquivo

Fornecer acesso distribuir e partilhar dados controlar o acesso estabelecer a propriedade intelectual promover os dados

Reutilizaccedilatildeo acompanhamento da investigaccedilatildeo assumir a revisatildeo da investigaccedilatildeo escrutinar os resultados e aprender e ensinar (UK Data Archive 2017)

Com o objetivo de contribuir para a adoccedilatildeo de padrotildees e poliacuteticas de Dados Abertos de investigaccedilatildeo algumas organizaccedilotildees lanccedilaram iniciativas e princiacutepios de Open Data destinadas agrave recomendaccedilatildeo de boas praticas na publicaccedilatildeo de dados de investigaccedilatildeo obtidos atraveacutes de financiamento puacuteblico Apoacutes o lanccedilamento de uma declaraccedilatildeo em 2004 a OECD publicou em 2007 um conjunto de 13 princiacutepios para abertura de dados de investigaccedilatildeo provenientes de financiamento puacuteblico Em 2010 foram lanccedilados os Panton Principles um conjunto de quatro princiacutepios delimitadores da abertura de dados na ciecircncia cujo foco centrou-se no licenciamento de conteuacutedos para garantir uma clara partilha distribuiccedilatildeo e reutilizaccedilatildeo de informaccedilatildeo pelos investigadores (Panton Principles 2010 traduccedilatildeo livre) A Royal Society afirma em 2012 que os dados abertos devem ser acessiacuteveis inteligiacuteveis avaliaacuteveis e reutilizaacuteveis Em 2014 foram publicados os Nairobi Data Sharing Principles um conjunto de dez recomendaccedilotildees destinadas a apoiar a abertura de dados puacuteblicos e de investigaccedilatildeo nos paiacuteses em vias de desenvolvimento por forma a gerar valor econoacutemico social educacional e potenciar a investigaccedilatildeo cientiacutefica (International Workshop on Open Data for Science and Sustainability in Developing Countries 2014)

A Open Definition um projeto da responsabilidade da OKI fixou os princiacutepios que definem a abertura de dados e conteuacutedos assegurando a qualidade e encorajando a compatibilidade de diferentes tipos de conteuacutedos atraveacutes da utilizaccedilatildeo precisa do termo aberto (Open Knowledge International [a] traduccedilatildeo livre) Assim o termo Dados Abertos engloba dois tipos diferentes de abertura

Abertura Teacutecnica os conteuacutedos devem ser publicados sob uma licenccedila aberta ao custo de produccedilatildeo num formato aberto e que possa ser processado por maacutequina

Abertura Legal a licenccedila aberta deve permitir o uso redistribuiccedilatildeo modificaccedilatildeo separaccedilatildeo compilaccedilatildeo propagaccedilatildeo aplicaccedilatildeo para qualquer fim ou propoacutesito sem custos e sem discriminaccedilatildeo contra pessoas ou grupos A mesma licenccedila pode requerer condiccedilotildees de uso como a atribuiccedilatildeo de creacutedito de autoria manutenccedilatildeo

33

da integridade do trabalho original redistribuiccedilatildeo sob a mesma licenccedila do original retenccedilatildeo de notificaccedilotildees de copyright acesso agrave fonte original proibiccedilatildeo de implementaccedilatildeo de restriccedilotildees teacutecnicas e implementaccedilatildeo de regras de natildeo-agressatildeo com a licenccedila original (Open Knowledge International [a]) traduccedilatildeo livre)

A Science International (2016) eacute o conjunto das 4 entidades mais representativas a niacutevel da ciecircncia internacional (International Council for Science ndash ICSU the InterAcademy Partnership ndash IAP The World Academy of Sciences ndash TWAS and the International Social Science Council ndash ISSC) que tecircm por missatildeo representar a comunidade cientiacutefica global na definiccedilatildeo de poliacuteticas cientiacuteficas internacionais Esta organizaccedilatildeo lanccedilou 12 princiacutepios para os Dados Abertos criados com base em outros relatoacuterios da autoria quer dos proacuteprios parceiros da Science International quer de instituiccedilotildees governamentais ou acadeacutemicas Estes princiacutepios assentam em trecircs pilares base as responsabilidades de cada interveniente os limites da abertura e as praacuteticas adequadas (Science International 2015 traduccedilatildeo livre)

Todos estes princiacutepios de abertura de dados de investigaccedilatildeo foram sintetizados no Quadro 1 apresentando-se apenas os princiacutepios mencionados em pelo menos duas recomendaccedilotildees de Open Data

Quadro 1 Princiacutepios de abertura de dados de investigaccedilatildeo mais recomendados

Princiacutepios e recomendaccedilotildees

OECD Princ (2007)

Panton Princ (2010)

Royal Soc

(2012)

Nairobi Princ (2014)

Science Int

(2015)

Open Defini tion

Abertura Acesso Reutilizaccedilatildeo

Citaccedilatildeo de dados Interoperabilidade Sem discriminaccedilatildeo Licenccedilas Abertas Formato Aberto

Processaacuteveis p maacutequina Modificaccedilatildeo

Publicaccedilatildeo imediata Qualidade

Acesso Gratuito Disponibilidade

Sustentabilidade Qualidade

Integridade

Fonte Elaboraccedilatildeo proacutepria

Analisando em detalhe os princiacutepios de abertura dos dados de investigaccedilatildeo eacute possiacutevel retirar algumas ilaccedilotildees sobre quais as recomendaccedilotildees consideradas mais importantes Verifica-se uma grande variedade de princiacutepios propostos sendo que

34

apenas 16 num total de 33 se repetem em 2 ou mais recomendaccedilotildees A abertura legal e teacutecnica dos dados soacute eacute acautelada por metade dos princiacutepios Os princiacutepios considerados mais importantes satildeo o AA aos dados seguido da reutilizaccedilatildeo de dados A citaccedilatildeo de dados interoperabilidade acesso sem discriminaccedilatildeo licenccedilas e formatos abertos a modificaccedilatildeo e o fato de os dados serem processaacuteveis por maacutequina satildeo mencionados apenas em trecircs recomendaccedilotildees tendo a seu favor o fato de terem sido incluiacutedas nas recomendaccedilotildees mais recentes Princiacutepios relevantes como a publicaccedilatildeo imediata a qualidade e a integridade dos dados surgem apenas duas vezes listados

Eacute possiacutevel verificar que a OKI (2012b) coloca os dados de investigaccedilatildeo ao mesmo niacutevel de importacircncia que outros tipos de dados com potencial para novos usos e aplicaccedilotildees para benefiacutecio da sociedade como os dados culturais financeiros estatiacutesticos ambientais e ainda sobre o clima e transportes

A OECD (2015a traduccedilatildeo livre) defende haver quatro tipos de dados cientiacuteficos

Fig 9 Tipos de dados cientiacuteficos Fonte traduzido de OECD (2015a)

A explosatildeo de produccedilatildeo de dados que originou o Big Data possui um segundo pilar os Dados Ligados ou Linked Data A combinaccedilatildeo destas duas abordagens tem o potencial para criar uma nova era de entendimento cientiacutefico relativamente aos maiores problemas subjacentes agrave espeacutecie humana (Science International 2015) O termo Linked Data cunhado por Tim Berners-Lee implica que as ldquorelationships among data should be made availablerdquo (World Wide Web Consortium [W3C] 2015) ou seja conjuntos de dados relacionados com um fenoacutemeno em particular e que estatildeo ligados de uma forma loacutegica podem ser conectados semanticamente dando a possibilidade de um computador poder identificar relaccedilotildees mais profundas entre eles (Science International 2015 traduccedilatildeo livre) Reitano (2013) sublinha que a informaccedilatildeo extraiacuteda de conjuntos de dados conectados eacute a que tem mais impacto na investigaccedilatildeo inovaccedilatildeo e crescimento econoacutemico Berners-Lee (2010) propocircs um esquema de 5 estrelas para classificar as melhores praacuteticas de publicaccedilatildeo de dados na web que permitam a ligaccedilatildeo entre diferentes datasets com cinco niacuteveis de abertura tecnoloacutegica

bullprovenientes de instrumentos como telescoacutepios sateacutelites sensores inqueacuteritos e outras ferramentas que registem informaccedilatildeo sobre fenoacutemenos uacutenicos

Dados de observaccedilatildeo

bullobtidos atraveacutes de maacutequinas de alto rendimento ensaios cliacutenicos ou outras experiecircncias controladas Dados experimentais

bullgerados a partir de simulaccedilotildees computacionais Dados computacionais

bullSatildeo conjunto de dados agrupados de alto niacutevel de uso pela comunidade cientiacutefica recebendo para isso um alto niacutevel de curaccedilatildeo

Coleccedilotildees de dados de referecircncia

35

Fig 10 Esquema de classificaccedilatildeo das 5 estrelas para Dados Abertos Ligados Fonte traduzido de Berners-Lee (2010) Disponiacutevel na WWW httpswwww3orgDesignIssuesLinkedDatahtml

O Linked Data usa teacutecnicas e conceitos da World Wide Web para identificar factos conceitos pessoas lugares fenoacutemenos ou documentos que contenham atributos em comum (Science International 2015 traduccedilatildeo livre) A Royal Society (201234) afirma que o aparecimento de ldquosiloed sections of the web linked datardquo deve-se ao uso de vocabulaacuterios heterogeacuteneos na descriccedilatildeo semacircntica dos dados Neste sentido a OKI desenvolveu um cataacutelogo de vocabulaacuterios de Linked Data onde constam um total de 593 distribuiacutedos por vaacuterios temas sendo os mais populares meacutetodos metadados e cataacutelogos Existem 11 vocabulaacuterios em portuguecircs embora nenhum seja exclusivo sendo mesmo a liacutengua com maior nuacutemero de vocabulaacuterios a par com o inglecircs (OKI [a])

Existem algumas razotildees para limitar a abertura da ciecircncia especialmente em redor de dados que vatildeo aleacutem de questotildees teacutecnicas envolvendo a comunidade de investigadores e a sociedade em geral Embora seja mandatado pelas poliacuteticas de Dados Abertos que todos os dados de investigaccedilatildeo obtidos atraveacutes de financiamento puacuteblico devam ser disponibilizados abertamente o fato eacute que existem exceccedilotildees legiacutetimas como questotildees de privacidade seguranccedila ou questotildees eacuteticas que impedem a total abertura de dados (Concordat on Open Research Data 2016)

Os desafios tecnoloacutegicos natildeo implicam as mesmas preocupaccedilotildees na implementaccedilatildeo do AA a dados de investigaccedilatildeo que geram os desafios financeiros culturais e legais Eacute necessaacuterio ldquoadopt technical and infrastructural solutions that holistically address the above issuesrdquo A atenccedilatildeo eacute dada a padrotildees abertos e interoperaacuteveis pesquisa harmonizada e serviccedilos identificadores permanentes promoccedilatildeo da cultura de gestatildeo de dados reutilizaccedilatildeo de dados de investigaccedilatildeo soluccedilotildees teacutecnicas para a seguranccedila e questotildees legais sobre dados de investigaccedilatildeo abertos (RECODE 20146)

Embora se registe progresso a publicaccedilatildeo de Dados Abertos continua a ser um desafio dado que a distribuiccedilatildeo aberta de dados de investigaccedilatildeo natildeo eacute um comportamento comum sendo necessaacuterio uma mudanccedila cultural (Royal Society 2012 Pontika et al 2015 Science International 2015) A avaliaccedilatildeo e revisatildeo por pares dos dados natildeo tecircm a mesma qualidade quando comparada com as publicaccedilotildees

Colocar os conteuacutedos disponiacuteveis na web (sob uma licenccedila aberta)

Tornar os dados estruturados (Excel em vez de uma imagem)

Usar formatos abertos (CSV em vez de Excel)

Usar URIrsquos para identificar os recursos (para serem indicados)

Ligar os dados a outros dados (para fornecer contexto)

36

tradicionais dado a publicaccedilatildeo de dados natildeo ser ainda uma praacutetica comum (European Research Area and Innovation Committee [ERAC] 2016) Hahnel e Hook (2016) apontam a falha na atribuiccedilatildeo de incentivos e recompensas tangiacuteveis aos investigadores pelas suas contribuiccedilotildees A publicaccedilatildeo de dados de forma aberta envolve tarefas que consomem muito tempo aos investigadores como a mudanccedila do formato dos dados manter a informaccedilatildeo atualizada alinhar os dados com as licenccedilas existentes e com os criteacuterios de publicaccedilatildeo de informaccedilatildeo sensiacutevel (Reitano 2013) A Royal Society (2012) sublinha que uma boa parte dos dados torna-se independente das publicaccedilotildees separando assim a ideia da evidecircncia

Para Hahnel e Hook (2016) a abertura de dados cientiacuteficos natildeo pode ser separada das mudanccedilas no desenvolvimento da investigaccedilatildeo e dos receios dos investigadores Estes receios manifestam-se a dois niacuteveis estrutural (questotildees de permissotildees qualidade licenciamento) e cultural (receio de natildeo ser reconhecido ou ser ultrapassado na investigaccedilatildeo)

A Science International (20156) sublinha que os custos da adaptaccedilatildeo ao ldquodata challengerdquo podem causar problemas aos paiacuteses menos desenvolvidos impedindo-os de participar na ldquoglobal research enterpriserdquo A mesma organizaccedilatildeo aponta falhas na replicabilidade de resultados cientiacuteficos atraveacutes da citaccedilatildeo de trecircs estudos nas aacutereas de oncologia preacute-cliacutenica psicologia social e economia que obtiveram meacutedias de sucesso bem inferiores a 50 Satildeo apontadas falhas como a falsificaccedilatildeo de dados raciociacutenios estatiacutesticos invaacutelidos e ausecircncia total ou parcial de dados ou metadados Eacute tambeacutem sublinhado que a falta de um padratildeo de abertura que permita testar a replicabilidade dos resultados cientiacuteficos pode torna-se uma barreira intransponiacutevel no avanccedilo da ciecircncia (Science International 2015)

O acesso aos dados de investigaccedilatildeo possuiu diversas vantagens como o fomento da inovaccedilatildeo em termos de educaccedilatildeo sauacutede estaacute na base da criaccedilatildeo de novos negoacutecios e progresso cientiacutefico (SPARC World Wide Web Foundation 2016) permite a melhoria da qualidade dos resultados de investigaccedilatildeo evita a duplicaccedilatildeo de trabalho acelera a inovaccedilatildeo aumenta a transparecircncia do progresso cientiacutefico (OECD 2007 Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016b ERAC 2016) A abertura de dados facilita a exploraccedilatildeo de novos toacutepicos natildeo estudados inicialmente reforccedila a diversidade de anaacutelise e opiniatildeo (OECD 2007) potencia o crescimento econoacutemico e a seguranccedila dos resultados da investigaccedilatildeo financiada (OECD 2007 SPARC Concordat on Open Research Data 2016 ERAC 2016) A Royal Society (2012) sublinha que a publicaccedilatildeo de dados experimentais e observacionais permite o escrutiacutenio a replicaccedilatildeo de experiecircncia e a reutilizaccedilatildeo de dados para obtenccedilatildeo de inferecircncias adicionais A mesma instituiccedilatildeo assevera que a abertura de dados permite a identificaccedilatildeo de erros a refinaccedilatildeo ou rejeiccedilatildeo de teorias realccedilando que a anaacutelise rigorosa de dados e teoria eacute o processo mais rigoroso de revisatildeo da qualidade O

37

estudo efetuado por Beagrie e Houghton (2014) a trecircs centros de dados do Reino Unido denota um acreacutescimo significativo ao niacutevel da eficiecircncia da investigaccedilatildeo nos utilizadores que usaram os centros de dados e o valor que os utilizadores retiraram dos dados excede o investimento feito na partilha e curaccedilatildeo de dados tendo os centros de dados aumentado exponencialmente o retorno do investimento feito na criaccedilatildeo e coleta de dados

Para Reitano (2013) o processo de abertura de dados pode fomentar a implementaccedilatildeo de novos padrotildees e tecnologias nas organizaccedilotildees e a mudanccedila de comportamentos culturais O mesmo autor refere que o fenoacutemeno dos Dados Abertos pode dar iniacutecio ao processo de validaccedilatildeo da qualidade dos dados A Science International (2015) sublinha o investimento nas infraestruturas fiacutesicas e tecnoloacutegicas natildeo deve ser muito elevado dado que este natildeo difere muito do exigido para uma base nacional de Ciecircncia Aberta O desenvolvimento desta e-infraestrutura pode trazer benefiacutecios a vaacuterios dos intervenientes da abertura de dados (Comissatildeo Europeia Grupo de Peritos em Dados Cientiacuteficos 2010)

Cidadatildeos beneficiam com os resultados da investigaccedilatildeo e encontram as proacuteprias respostas para questotildees importantes baseadas em provas reais

Financiadores e decisores poliacuteticos tomam decisotildees mais informadas e tecircm mais retorno no seu investimento

Investigadores obteacutem dados e ferramentas com mais facilidade aumentando assim a sua produtividade a investigaccedilatildeo extrapola a sua aacuterea de conhecimento gerando novas inferecircncias e produzindo novas soluccedilotildees

Empresas e induacutestria proporcionam uma base industrial e econoacutemica para a prosperidade usam a melhor informaccedilatildeo disponiacutevel para a sua investigaccedilatildeo e desenvolvimento criam novo conhecimento mercados oportunidades e aumentam as oportunidades de troca de conhecimento

Segundo Borgman (201515) o fluxo de informaccedilatildeo depende cada vez mais de infraestruturas tecnoloacutegicas sendo que ldquosubstantial investments in infrastructure are necessary to acquire sustain and exploit research data today tomorrow and beyondrdquo As bases de dados cientiacuteficas tecircm-se tornado importantes na infraestrutura cientiacutefica global sendo indispensaacuteveis no progresso da ciecircncia De acordo com e-IRG (2016) existem trecircs formas de desenvolver uma infraestrutura de dados de investigaccedilatildeo pelo setor industrial pelo setor puacuteblico ou por comunidades especializadas que recebam financiamento para a construccedilatildeo da sua proacutepria infraestrutura Para melhorar o acesso e uso de datasets a e-IRG recomenda

Impor as mesmas tecnologias e padrotildees a todas a disciplinas Atribuir identificadores persistentes para dados instituiccedilotildees e pessoas

38

Aumentar a pesquisabilidade e descoberta de dados nos repositoacuterios atraveacutes da criaccedilatildeo de registos de datasets e repositoacuterios conectar as publicaccedilotildees aos dados subjacentes e criar uma paacutegina de descritiva do dataset

O Open Access Directory (2016) lista 113 repositoacuterios de dados de investigaccedilatildeo referentes a 15 aacutereas do conhecimento O Registry of Research Data Repositories (re3data) eacute um serviccedilo que regista repositoacuterios de dados de investigaccedilatildeo a niacutevel mundial fornecendo acesso a 1821 repositoacuterios divididos por quatro grandes aacutereas cientiacuteficas Este serviccedilo eacute disponibilizado pelo DataCite (2017a) para fornecer acesso e armazenamento permanente de dados aos investigadores entidades financiadoras editores e instituiccedilotildees acadeacutemicas Portugal conta atualmente com dois repositoacuterios indexados o KiMoSys e o INTEGRALL ambos com ligaccedilatildeo ao ramo da biologia

O Projeto do Genoma Humano19 envolveu uma investigaccedilatildeo intensiva agrave escala global sendo um exemplo de sucesso da disponibilidade de dados abertos na inovaccedilatildeo cientiacutefica Com o intuito de facilitar a pesquisa e reutilizaccedilatildeo de dados o W3C (2014) desenvolveu um vocabulaacuterio especiacutefico para dados o Data Catalog Vocabulary (DCAT) que atraveacutes da tecnologia RDF20 facilita a interoperabilidade entre diferentes cataacutelogos de dados na web Utilizar o DCAT para descrever conjunto de dados em cataacutelogos permite aumentar a pesquisabilidade e a extraccedilatildeo de metadados a partir de outros cataacutelogos Salienta-se tambeacutem a existecircncia do schemaorg uma comunidade colaborativa com a missatildeo de criar manter e promover esquemas para dados estruturados na Internet

A Data Documentation Initiative (DDI) eacute um padratildeo internacional para descrever dados criados por meacutetodos observacionais provenientes das ciecircncias sociais econoacutemicas e da sauacutede O DDI eacute um padratildeo que pode ser utilizado para documentar as diferentes fases do ciclo de vida dos dados de investigaccedilatildeo Descrever dados utilizando o padratildeo DDI facilita a compreensatildeo interpretaccedilatildeo e uso por pessoas software e redes de computadores (Data Documentation Initiative [DDI] 2016)

Ainda em formato beta a OKI oferece um serviccedilo o is it open data21 que permite aos utilizadores inquirirem as entidades detentores de dados sobre a abertura dos seus dados focando-se essencialmente em dados de investigaccedilatildeo

19 Este projeto teve como base os Bermuda Principles que asseguraram que todos dados sobre a sequenciaccedilatildeo geneacutetica gerados por centros financiados para esse fim deveriam estar no domiacutenio puacuteblico com livre acesso Disponiacutevel na WWW httpwebornlgovscitechresourcesHuman_Genomeresearchbermudashtml 20 O Resource Description Framework (RDF) eacute um modelo padratildeo desenvolvido pela W3C que permite que dados estruturados e semiestruturados possam ser misturados expostos e partilhados atraveacutes de diferentes aplicaccedilotildees O RDF facilita a uniatildeo de datasets mesmo que usem estes esquemas diferentes Disponiacutevel na WWW httpswwww3orgRDF 21 Disponiacutevel na WWW httpwwwisitopendataorgabout

39

Verifica-se tambeacutem o lanccedilamento de revistas cientiacuteficas especiacuteficas para a ciecircncia orientada a dados como o Data Science Journal22 Scientific Data23 ou o Geoscience Data Journal possibilitando a publicaccedilatildeo de dados e dos artigos cientiacuteficos que os utilizam apoacutes o serviccedilo de revisatildeo por pares A F1000 Research24 utiliza o conceito de revisatildeo apoacutes a publicaccedilatildeo

Os Dados Abertos tecircm estado em foco quando se debate a resoluccedilatildeo de problemas humanitaacuterios A agenda 2030 definida pelas Naccedilotildees Unidas (2015) visa a erradicaccedilatildeo da pobreza e o desenvolvimento econoacutemico humanitaacuterio e social agrave escala global Os 17 objetivos de desenvolvimento sustentaacutevel contam com a preciosa ajuda da abertura de dados para a monotorizaccedilatildeo e tomada de decisatildeo Em 2016 a abertura de dados em casos de emergecircncias puacuteblicas foi alvo de forte debate com a propagaccedilatildeo de viacuterus como Zica e o Eacutebola na agenda O debate culminou na Statement on Data Sharing in Public Health Emergencies (2016) um compromisso assinado por 33 organizaccedilotildees a niacutevel global com vista agrave partilha de dados de investigaccedilatildeo e ao fomento do financiamento nestas aacutereas sensiacuteveis

Conforme indicado nos princiacutepios de Open Data da Science International (2015) existem diversos intervenientes no processo de abertura de dados sendo que cada um destes intervenientes tem responsabilidades proacuteprias Como intervenientes diretos satildeo apontados os investigadores que recebem financiamentos puacuteblicos as universidades e institutos de investigaccedilatildeo as bibliotecas institucionais agecircncias de financiamento e instituiccedilotildees de investigaccedilatildeo governos e sociedade acadeacutemicas Existem outras iniciativasorganizaccedilotildees envolvidas na promoccedilatildeo da abertura de dados como a EU Naccedilotildees Unidas OECD W3C OKI SPARC Royal Society CODATA Digital Curation Center (DCC) Research Data Aliance (RDA) ou o ICSU que procuram promover o desenvolvimento de sistemas e procedimentos a niacutevel internacional que assegurem o acesso sustentabilidade e interoperabilidade Muitas destas organizaccedilotildees jaacute desenvolveram princiacutepios de abertura e protocolos de dados proacuteprios como eacute o exemplo da EU OECD e da OKI ou formaram grupos de trabalho para a definiccedilatildeo de padrotildees de gestatildeo publicaccedilatildeo citaccedilatildeo interoperabilidade e partilha de dados como a RDA Outras como a Universidade de Edimburgo25 criaram cursos de treino em gestatildeo de dados de investigaccedilatildeo para oferecer aos seus investigadores esse conhecimento

Outras atividades e eventos relacionados com a abertura e gestatildeo de dados vatildeo ocorrendo a niacutevel global como eacute o caso do Love Your Data26 um evento internacional que teve a sua quinta ediccedilatildeo em 2017 com vista a fornecerem conhecimento e ferramentas aos investigadores para que estes possam gerir melhor os seus dados

22 Disponiacutevel na WWW httpdatasciencecodataorg 23 Disponiacutevel na WWW httpwwwnaturecomsdata 24 Disponiacutevel na WWW httpsf1000researchcomabout 25 Disponiacutevel na WWW httpdatalibedinaacukmantra 26 Disponiacutevel na WWW httpsloveyourdatawordpresscomlydw-2017

40

15 Dados Abertos Governamentais

A abertura dos dados governamentais teve a sua origem em leis de Freedom of Information (FOI) Segundo Ubaldi (2013) muitos paiacuteses da OECD adotaram este tipo de leis para assegurar o direito do acesso puacuteblico agrave informaccedilatildeo atraveacutes da publicaccedilatildeo de datasets que possam ser usados e reutilizados Os DGA ou no seu termo mais usual Open Government data (OGD) ldquois a philosophy- and increasingly a set of policies - that promotes transparency accountability and value creation by making government data available to allrdquo (OECD 2016a) Esta filosofia assenta numa nova relaccedilatildeo entre cidadatildeos e Governos atraveacutes da abertura dos dados governamentais onde todas as partes interessadas trabalham em cooperaccedilatildeo na procura de novas respostas para os problemas da sociedade num ldquolearning process of changing the culture of public sector administrationrdquo (Dietrich Cherkasov Susar 201311) Os Governos e as sociedades tecircm vindo de forma crescente a apreciar a importacircncia do acesso agrave informaccedilatildeo do setor puacuteblico para sustentar a boa gestatildeo e estimular o crescimento econoacutemico alavancado no conhecimento Esta situaccedilatildeo mudou a forma como os governos valorizaram gerem usam e partilham informaccedilatildeo sendo apoiada pela atualizaccedilatildeo das poliacuteticas estruturas e praacuteticas para produzir e usar a informaccedilatildeo puacuteblica (Ubaldi 2013 traduccedilatildeo livre) A abertura de dados permite inferir duas questotildees importantes quanto ao governo Aleacutem de assumir a preparaccedilatildeo das entidades puacuteblicas para o processo de abertura tambeacutem assume que o governo estaacute disposto a efetuar mudanccedilas consideraacuteveis no setor puacuteblico devendo atuar como um sistema aberto que interage com o seu ambiente (Jansen Charalabidis amp Zuiderwijk 2012) O objetivo eacute segundo Dietrich (20136) passar do ldquoe-gov to we-govrdquo

Os DGA estatildeo segmentados em duas partes os dados abertos e os dados governamentais ou informaccedilatildeo do setor puacuteblico (Ubaldi 2013 Dietrich Cherkasov e Susar 2013) estando os DGA na interseccedilatildeo entre estes dois tipos de dados

Fig 11 Pilares dos Dados Governamentais Abertos Fonte Dietrich (2013) Disponiacutevel na WWW httpworkspaceunpanorgsitesInternetDocumentsUNPAN95209pdf

Governo Aberto

Dados Governament

Dados Abertos

DGA

41

Os DGA referem-se agrave informaccedilatildeo coletada produzida ou paga pelo setor puacuteblico guardada em formato que possa ser lido por maacutequina e tornada acessiacutevel de forma livre para reutilizaccedilatildeo para qualquer propoacutesito atraveacutes da publicaccedilatildeo sob uma licenccedila aberta que permite a livre reutilizaccedilatildeo dentro do domiacutenio puacuteblico e privado (Koski 2015 Carrara Oudkerk Steenbergen Tinholt 2016) A Informaccedilatildeo do Setor Puacuteblico ou Public Sector Information (PSI) abrange toda a vasta gama de informaccedilatildeo que as entidades puacuteblicas coletam produzem reproduzem e disseminam em vaacuterias aacutereas de atividade no cumprimento das suas tarefas institucionais englobando informaccedilatildeo social econoacutemica geograacutefica meteorologia e informaccedilatildeo de cariz turiacutestico ou empresarial A grande diferenccedila entre os DGA e a PSI eacute que esta uacuteltima refere-se apenas aos dados detidos pelas entidade puacuteblicas podendo a sua reutilizaccedilatildeo ter custos Poreacutem se esta PSI for disponibilizada sob uma licenccedila aberta torna-se entatildeo DGA (Carrara et al 2016a traduccedilatildeo livre)

A reutilizaccedilatildeo e distribuiccedilatildeo de dados devem ser garantidas sob termos que permitam essas atividades (Ubaldi 2013) A abertura dos dados governamentais foi apoiada por vaacuterias iniciativas com o objetivo de estabelecer padrotildees e princiacutepios para a disponibilizaccedilatildeo aberta de dados Em 2007 o Open Government Working Group (OGWG) definiu oito princiacutepios sobre a abertura de Dados Governamentais (Tauberer 2014) Em 2010 foi a vez da Sunlight Foundation publicar 10 princiacutepios para abertura da informaccedilatildeo governamental Em 2012 foram lanccediladas trecircs iniciativas de abertura de dados O Reino Unido lanccedilou o Open Data White Paper que incluiu um conjunto de 14 princiacutepios para a abertura de dados puacuteblicos e assevera que o Reino Unido natildeo pretende implementar legislaccedilatildeo de forma raacutepida mas sim reconhecer e clarificar medidas iniciais que assegurem a partilha de dados (Cabinet Office 2012) O Banco Mundial publicou 13 princiacutepios de abertura de dados integrados no seu Open Government Data Toolkit A OKI (2012a traduccedilatildeo livre) identificou as componentes chave da abertura de dados puacuteblicos

Disponibilidade e acesso ndash os dados devem estar completos e a um preccedilo natildeo superior ao seu custo de reproduccedilatildeo com disponibilidade de acesso pela Internet Devem estar disponiacuteveis de forma conveniente e modificaacutevel

Reutilizaccedilatildeo e redistribuiccedilatildeo ndash os dados devem ser disponibilizadas sob licenccedilas que permitam a reutilizaccedilatildeo redistribuiccedilatildeo e mistura com outros datasets Deve ser assegurado que os dados satildeo passiacuteveis de serem processados por maacutequina

Participaccedilatildeo universal ndash os dados devem ser acessiacuteveis a todos para livre reutilizaccedilatildeo e redistribuiccedilatildeo sem discriminar nenhum campo do conhecimento pessoas ou grupos Natildeo eacute permitido a inclusatildeo de restriccedilotildees adjacentes aos dados

Ubaldi (2013) publicou onze princiacutepios de abertura de dados baseados em dois vetores principais disponibilidade e acessibilidade e a reutilizaccedilatildeo e redistribuiccedilatildeo Nos

42

EUA foram lanccedilados 7 princiacutepios para a abertura de dados atraveacutes do Memorando ldquoOpen Data Policy - Managing Information as an Assetrdquo (Executive Office of the President Office of Management and Budget 2013) O Anti-corruption Working Group do G2027 promoveu em 2014 a abertura de dados como um dos pilares essenciais da transparecircncia do setor puacuteblico estabelecendo seis princiacutepios de abertura de dados para apoiar a luta contra a corrupccedilatildeo (G20rsquos Anti-corruption Working Group 2014)

O G828 iniciou um debate sobre a transparecircncia inovaccedilatildeo e prestaccedilatildeo de contas governamentais culminando na criaccedilatildeo do G8 Open Data Charter (Cabinet Office 2013) ldquowhich outlined a set of five core open data principlesrdquo (International Open Data Charter 2015) ou seja ldquoa summary of visions and principles for creating a transparent Government the opening up of data and its quality and quantityrdquo (Carrara et al 2016a39) O G8 Open Data Charter criou uma lista de 14 categorias de dados a serem publicados de forma aberta empresas e negoacutecios crimes e justiccedila observaccedilatildeo da terra educaccedilatildeo energia e ambiente financcedilas e contratos geoespacial desenvolvimento global sauacutede democracia e contabilidade governativa ciecircncia e investigaccedilatildeo estatiacutesticas mobilidade e bem-estar social e por fim transportes e infraestruturas (Cabinet Office 2013) Poreacutem o sentimento geral era que os princiacutepios deveriam ser redefinidos e melhorados de forma a apoiar a adoccedilatildeo global dos Dados Abertos (International Open Data Charter 2015 traduccedilatildeo livre) Assim em 2015 um grupo de vaacuterios paiacuteses e organizaccedilotildees internacionais desenvolveu a International Open Data Charter uma ldquoGlobal Multi-Stakeholder Action Network with two types of leading members Stewards and Lead Stewardsrdquo tendo como missatildeo fomentar uma maior colaboraccedilatildeo na adoccedilatildeo e implementaccedilatildeo de princiacutepios padrotildees e boas praacuteticas de Dados Abertos em todo o mundo com a adesatildeo de 41 governos (International Open Data Charter 2015) Tim Berners-Lee numa opiniatildeo citada no proacuteprio siacutetio web da International Open Data Charter (2015) vecirc nesta rede o ldquopotential to accelerate progress by placing actionable data in the hands of peoplerdquo Todos os princiacutepios e recomendaccedilotildees de abertura de dados puacuteblicos foram sintetizados apresentando-se no Quadro 2 apenas os princiacutepios mencionados em duas iniciativas de Open Data

27 O G20 eacute um grupo formado pelos 19 paiacuteses mais fortes economicamente mais a Uniatildeo Europeia com o objetivo de obter cooperaccedilatildeo internacional em questotildees financeiras e econoacutemicas Disponiacutevel na WWW httpswwwg20orgWebsG20ENG20FAQsfaq_nodehtml 28 O G8 eacute um grupo constituiacutedo pelas economias mais avanccediladas do mundo que se reuacutenem para debater questotildees econoacutemicas e poliacuteticas a niacutevel global Este grupo eacute formado pelos EUA Itaacutelia Alemanha Reino Unido Franccedila Japatildeo Canadaacute e Ruacutessia embora esta uacuteltima tenha sido expulsa em 2014 apoacutes a anexaccedilatildeo da Crimeia A EU tambeacutem estaacute representada neste grupo embora natildeo seja membro oficial

43

Quadro 2 Princiacutepios de abertura mais recomendados pelas iniciativas de Dados Governamentais Abertos

Princiacutepios e recomendaccedilotildees

OGWG (2007)

Sun Fund (2010)

OKI

(2012)

World Bank

(2012)

White Paper (2012)

Mem EUA

(2013) Ubaldi (2013)

G20

(2014)

IODC

(2015) Abertura Acesso

Publicaccedilatildeo imediata Reutilizaccedilatildeo Completos

Sem discriminaccedilatildeo Processaacuteveis p maacutequina

Licenccedilas Abertas Comparabilidade Formato Aberto Disponibilidade

Abertura p defeito Interoperabilidade

Publicaccedilatildeo de metadados

Gestatildeo poacutes publicaccedilatildeo Custo natildeo superior ao da

produccedilatildeo

Desenvolvimento e inovaccedilatildeo inclusivos

Melhoria governaccedilatildeo e envolvimento cidadatildeos

Linked Data

Modificaccedilatildeo

Fonte Elaboraccedilatildeo proacutepria

Analisando em detalhe os princiacutepios de abertura dos dados puacuteblicos eacute possiacutevel inferir quais as recomendaccedilotildees consideradas mais importantes Tal como nos dados de investigaccedilatildeo verifica-se uma grande variedade de princiacutepios propostos sendo que apenas 19 num total de 36 se repetem em 2 ou mais recomendaccedilotildees Embora se registe uma melhoria significativa na abertura legal e teacutecnica relativamente aos dados de investigaccedilatildeo tambeacutem os princiacutepios propostos para os dados puacuteblicos natildeo abarcam a totalidade desta dupla abertura O acesso a publicaccedilatildeo imediata a reutilizaccedilatildeo e a disponibilizaccedilatildeo de dados de forma completa sem discriminaccedilatildeo e de forma a serem processados por maacutequina satildeo os princiacutepios que reuacutenem mais consenso entre as recomendaccedilotildees analisadas As licenccedilas abertas a comparabilidade de dados os formatos abertos a disponibilidade a abertura por defeito de dados a interoperabilidade publicaccedilatildeo de metadados e a gestatildeo de dados apoacutes a sua publicaccedilatildeo satildeo mencionados em menos de metade das recomendaccedilotildees analisadas apesar de ser indiscutiacutevel a sua importacircncia no processo de abertura de dados

44

Segundo Gonzalez-Zapata e Heeks (2015) podemos sintetizar os DGA em quatro perspetivas sumariadas na figura seguinte

Fig 12 Perspetivas da abertura dos dados governamentais Fonte Gonzalez-Zapata e Heeks (2015)

O movimento dos DGA assenta em dois importantes marcos o lanccedilamento do siacutetio datagov nos EUA em 2009 e do datagovuk no Reino Unido em 2010 tendo-se posteriormente estendido a outros paiacuteses e organizaccedilotildees (Janssen 2012) Neste segmento foi fundada em 2011 a Open Government Partnership (OGP) com o objetivo de ldquoprovide an international platform for domestic reformers committed to making their governments more open accountable and responsive to citizensrdquo (Open Government Partnership [OGP] 2015) Esta organizaccedilatildeo lanccedilou em Setembro de 2011 a Open Government Declaration subscrita por 70 paiacuteses e que assenta em quatro eixos estruturantes Transparecircncia da informaccedilatildeo sobre as atividades governativas apoio agrave participaccedilatildeo ciacutevica implementaccedilatildeo dos mais altos padrotildees da integridade profissional aumento do acesso a novas tecnologias de abertura e da prestaccedilatildeo de contas (OGP 2011) Em Dezembro de 2016 realizou-se a quarta cimeira da OGP culminando com a divulgaccedilatildeo da Paris Declaration for Open Government Partnership que pretende encorajar os Governos e as organizaccedilotildees da sociedade civil a inscreverem-se em accedilotildees coletivas para promover a abertura dos dados governamentais (OGP 2016)

O fenoacutemeno dos Dados Abertos eacute coadjuvado por dois sistemas de avaliaccedilatildeo da abertura dos dados provenientes do setor puacuteblico que auxiliam as entidades puacuteblicas a assumir a abertura e ligaccedilatildeo de dados (Colpaert Sarah Peter Mannens amp Van de Walle 2013) Estes dois sistemas atuam em perspetivas diferentes segundo Colpaert et al (2013) o 5 Stars Linked Open Data de Berners-Lee (2010) fornece uma perspetiva tecnoloacutegica enquanto o 5 Stars Open Data Engagement de Davies (2012) tem um acircmbito social atraveacutes do envolvimento da sociedade O esquema de Davies (2012) eacute um esquema de classificaccedilatildeo por estrelas baseado no esquema criado Tim Berners-Lee para sublinhar os niacuteveis de interaccedilatildeo e colaboraccedilatildeo proporcionados pela publicaccedilatildeo de dados ou seja os ldquokey steps that open data initiatives can take to engage with data usersrdquo

bull Definiccedilatildeo de estrateacutegias regulamentos e processos nas atividades do Governo Burocraacutetica bull Inovaccedilatildeo tecnoloacutegica nos sistemas de dados do

Governo Tecnoloacutegica bull Direito ao livre acesso agrave informaccedilatildeo do setor puacuteblico (dados) Poliacutetica bull Mecanismos para gerar valor econoacutemico atraveacutes do uso de dados Econoacutemica

45

Fig 13 Esquema de classificaccedilatildeo das 5 estrelas para as iniciativas de abertura de dados que envolvem os utilizadores Fonte Davies (2012) Disponiacutevel na WWW httpwwwtimdaviesorguk201201215-stars-of-open-data-engagement

No cumprimento das suas obrigaccedilotildees as entidades governamentais produzem coletam e gerem uma vasta quantidade de dados tendo elevado estes agrave categoria dos bens puacuteblicos mais valiosos Para gerar valor ldquodata must be reusable but more importantly actually used (Open Data for Development [OD4D] 20168) Para a OECD (2015a) permitir o acesso e a reutilizaccedilatildeo dos dados governamentais tem um potencial significativo no aumento da eficiecircncia e transparecircncia do setor puacuteblico suportando atividades de ciecircncia cidadatilde com os dados governamentais aumentando assim o seu valor econoacutemico e social Neste sentido concursos desafios e hackathons29 podem tornar-se uacuteteis se ajudarem a focar os cidadatildeos ldquoon high priority public problemsrdquo (Dawes Vidiasova amp Parkhimovich 201610) Para gerar valor eacute necessaacuterio publicar os dados sendo esta fase precedida uma preparaccedilatildeo teacutecnica de coleta preparaccedilatildeo publicaccedilatildeo e gestatildeo de dados (Carrara et al 2016a)

Criaccedilatildeo de uma infraestrutura de gestatildeo de dados Extraccedilatildeo transformaccedilatildeo (em formato open source e linked data) e publicaccedilatildeo Escolha dos canais de publicaccedilatildeo Implementaccedilatildeo da funccedilatildeo de pesquisa no canal de publicaccedilatildeo Definiccedilatildeo de domiacutenio hospedagem funcionalidades do canal de publicaccedilatildeo

incluindo a gestatildeo desta ferramenta e dos serviccedilos que nela forem incorporados

Segundo Ubaldi (2013 traduccedilatildeo livre) podem ser identificadas quatro grandes fases na cadeia de valor dos Dados Governamentais Abertos

Geraccedilatildeo de dados cobre a criaccedilatildeo de dados puacuteblicos Coleta agregaccedilatildeo e processamento de dados os dados governamentais precisam

de ser agregados ligados e manipulados de forma a adicionar valor para a maior parte dos utilizadores

29 Uma hackathon de dados abertos eacute um evento que reuacutene programadores e outros profissionais do ramo do desenvolvimento de software para reutilizar dados de forma a produzir aplicaccedilotildees de software que sejam a base de produtos e serviccedilos uacuteteis e com valor Servem tambeacutem para promover o trabalho de abertura de dados e os datasets disponiacuteveis (AMA 2016)

Os dados devem ser orientados para a procura

Os dados devem fornecer contexto

Os dados devem gerar conversaccedilatildeo

Publicaccedilatildeo de dados deve gerar envolvimento e ganho de habilidades

Dados como um recurso comum na colaboraccedilatildeo entre investigadores

46

Distribuiccedilatildeo e fornecimento de dados os dados precisam de ser distribuiacutedos aos seus potenciais utilizadores para permitir o acesso e reutilizaccedilatildeo

Uso final de dados os dados governamentais tecircm de ser reutilizados por diferentes pessoas para sustentar a criaccedilatildeo de valor puacuteblico

Perceber os diferentes valores associados aos dados governamentais eacute essencial para identificar que viabilizadores e tipos de dados devem ser tornados prioritaacuterios para atingir o objetivo especiacutefico de criaccedilatildeo de valor (Ubaldi 2013) Podem ser identificados trecircs tipos de valor associados aos DGA (Ubaldi 2013 OECD 2015a)

Valor econoacutemico crescimento e competitividade na economia fomentando a inovaccedilatildeo eficiecircncia e eficaacutecia nos serviccedilos governamentais

Valor Social promove empreendedorismo dos cidadatildeos a participaccedilatildeo social e o envolvimento puacuteblico nas decisotildees poliacuteticas e no fornecimento de serviccedilos

Governanccedila puacuteblica Prestaccedilatildeo de contas transparecircncia responsividade e controlo democraacutetico

A abertura dos dados governamentais eacute um domiacutenio emergente que enfrenta restriccedilotildees de natureza complexa Janssen Charalabidis e Zuiderwijk (2012) sintetizaram as barreiras em seis categorias institucional complexidade da tarefa uso e participaccedilatildeo legislaccedilatildeo qualidade da informaccedilatildeo e questotildees teacutecnicas Reitano (2013) defende que os governos devem modificar as praacuteticas e procedimentos internos de gestatildeo de informaccedilatildeo pois a reutilizaccedilatildeo da informaccedilatildeo estaacute dependente da forma em como ela eacute gerida e publicada O desempenho dos programas de DGA tendem apenas para o registo de dados estatiacutesticos e poucos optam por analisar as aplicaccedilotildees comerciais e os avanccedilos proporcionados pela abertura dos dados governamentais (Dawes Vidiasova amp Parkhimovich 2016) Existem outros pontos sensiacuteveis como o pagamento dos custos da coleta e processamento de dados puacuteblicos quais os incentivos concedidos agraves entidades puacuteblicas para estas manterem e atualizarem os seus dados que conjunto de dados devem ser prioritaacuterios para maximizar a criaccedilatildeo de valor puacuteblico e sobretudo a necessidade de desenvolver uma estrutura de anaacutelise entre custos e benefiacutecios que possa demonstrar as vantagens econoacutemico-sociais dos DGA (Ubaldi 2013 OECD 2013) Contudo segundo a OECD (2015a) para as partes interessadas estes dados continuam muitas vezes inacessiacuteveis quer em termos de acesso quer em termos de custo Isto verifica-se porque os dados enfrentam alguns entraves agrave sua publicaccedilatildeo as organizaccedilotildees e governos natildeo consideram os dados interessantes para reutilizaccedilatildeo ou natildeo conseguem entender os benefiacutecios da abertura pelo receio de terem de responder a um elevado nuacutemero de pedidos de dados ou que os utilizadores retirem conclusotildees superficiais que os dados possam natildeo ter um niacutevel de curaccedilatildeo satisfatoacuterio e que isso manche a reputaccedilatildeo da organizaccedilatildeo e por fim a preocupaccedilatildeo com os custos da conversatildeo de dados para formatos padratildeo (Carrara et al 2016a traduccedilatildeo livre) Existem ainda riscos associados agrave abertura dos dados

47

governamentais como o direito agrave privacidade e ao anonimato que resultam em restriccedilotildees agrave disponibilizaccedilatildeo desta informaccedilatildeo (Koski 2015)

Estabelecer um enquadramento legal eacute essencial para alavancar a abertura dos dados governamentais Dawes Vidiasova e Parkhimovich (2016) defendem que o sucesso dos programas de DGA depende da definiccedilatildeo padrotildees teacutecnicos e de qualidade e de um enquadramento legal que defina responsabilidades e limitaccedilotildees Ainda assim as iniciativas de DGA podem enfrentar problemas com a implementaccedilatildeo desafios teacutecnicos ou atrasos administrativos Restriccedilotildees teacutecnicas e financeiras podem limitar a acessibilidade e reutilizaccedilatildeo dos dados sendo necessaacuterio enfrentar desafios relacionados com poliacuteticas tecnologias financcedilas organizaccedilatildeo e cultura para criar um ecossistema e construir um modelo de negoacutecios sustentaacutevel para as iniciativas de DGA (Ubaldi 2013 traduccedilatildeo livre) Koski (2015) realccedila que uma vez abertos deve haver um esforccedilo para manter a qualidade dos dados e tambeacutem a sua atualizaccedilatildeo Por outro lado sem os conhecimentos e habilidades necessaacuterias para interpretar a vasta gama de conjuntos de dados os cidadatildeos podem natildeo conseguir criar valor a partir desses dados (Janssen 2012 Koski 2015) Segundo Carrara Fischer e Steenbergen (2015) satildeo vaacuterias as capacidades necessaacuterias para lidar com a complexidade dos dados As autoras defendem uma junccedilatildeo entre soft skills e hard skills como a colaboraccedilatildeo comunicaccedilatildeo resoluccedilatildeo de problemas e as competecircncias teacutecnicas estatiacutesticas analiacuteticas e domiacutenio da aacuterea do conhecimento (201512) Satildeo apontados ainda outros desafios como a constante evoluccedilatildeo das poliacuteticas e estrateacutegias de DGA a delegaccedilatildeo da produccedilatildeo e administraccedilatildeo dos dados governamentais a niacutevel regional e a falta de definiccedilotildees comuns agrave escala internacional (OECD 2013)

Dado o contexto de urgecircncia em que muitos dos portais foram criados ldquoas part of a politically driven Open Data Initiative without feasibility studies business case strategy or user researchrdquo os portais enfrentam agora uma seacuterie de desafios e problemas (Sasse et al 20177) Satildeo mencionados problemas como a falta de financiamento falta de qualidade dos dados a falta de apoio poliacutetico na publicaccedilatildeo de dados relevantes e desafios na reutilizaccedilatildeo de dados (Sasse et al 2017)

Um bom entendimento dos benefiacutecios da abertura dos dados governamentais pode acelerar o compromisso com as iniciativas de DGA (Carrara et al 2016a) Os benefiacutecios da abertura de dados podem segundo Janssen Charalabidis e Zuiderwijk (2012) ser contextualizados em trecircs quadrantes poliacutetico e social econoacutemico operacional e teacutecnico A partilha dos dados governamentais com o puacuteblico aumenta a transparecircncia e o reconhecimento puacuteblico das atividades do governo (OECD 2013) dado que os DGA satildeo um recurso estrateacutegico que pode beneficiar vaacuterios intervenientes (OECD 2013 Ubaldi 2013 Dietrich Cherkasov Susar 2013 Koski 2015 Carrara et al 2016a The World Bank 2016)

48

Governo melhora a tomada de decisotildees e a alocaccedilatildeo de recursos de forma a promover a eficiecircncia total das operaccedilotildees do governo e fornecer serviccedilos puacuteblicos mais eficientes efetivos inovadores e personalizados permitindo uma reduccedilatildeo de custos administrativos Aumenta a transparecircncia reforccedilando a prestaccedilatildeo de contas governamentais e a reduccedilatildeo de erros

Cidadatildeos permite participaccedilatildeo puacuteblica e o envolvimento social no desenho de respostas agraves necessidades puacuteblicas e cientiacuteficas (ciecircncia cidadatilde)

Sociedade Civil aumenta a transparecircncia e qualidade dos serviccedilos do Governo Setor Puacuteblico pode estimular um mercado competitivo nos serviccedilos puacuteblicos Setor Privado lanccedilamento de serviccedilos inovadores e com valor acrescentado

O Working Group on Open Government Data da OKI elegeu trecircs vantagens na abertura dos dados governamentais aumento da transparecircncia criaccedilatildeo de valor econoacutemico-social e participaccedilatildeo dos cidadatildeos na governaccedilatildeo Dietrich Cherkasov e Susar (2013) sublinham o papel chave da interoperabilidade na obtenccedilatildeo dos benefiacutecios da abertura na medida em que uma definiccedilatildeo comum de abertura iraacute assegurar a capacidade dos sistemas e organizaccedilotildees cooperarem

O impacto da abertura dos dados governamentais pode ser medido em trecircs dimensotildees econoacutemica poliacutetica e social (Granicas 2013 Koski 2015)

Econoacutemica aumento de receitas provenientes de taxas reduccedilatildeo dos custos de transaccedilatildeo de dados criaccedilatildeo de bens e serviccedilos (Granickas 2013) aumento da eficiecircncia e eficaacutecia do serviccedilo puacuteblico criaccedilatildeo de novas empresas (Granickas 2013 Koski 2015)

Poliacutetica aumento da transparecircncia poliacutetica e da prestaccedilatildeo de contas (Granickas 2013 Koski 2015)

Social aumento da proteccedilatildeo ao direito agrave informaccedilatildeo (Granickas 2013) aumento da inclusatildeo social e da capacitaccedilatildeo de grupos eou indiviacuteduos aumento dos niacuteveis de envolvimento e participaccedilatildeo ciacutevica (Granickas 2013 Koski 2015) e melhorias ao niacutevel educaccedilatildeo sauacutede ambiente ou desenvolvimento sustentaacutevel (Koski 2015)

Koski (20153) defende ser necessaacuterio desenvolver um modelo de avaliaccedilatildeo e monotorizaccedilatildeo seguido da coleta sistemaacutetica de dados para se poder medir com exatidatildeo o impacto dos Dados Abertos A autora sublinha a necessidade de explorar o conhecimento sobre o impacto da abertura de dados bem como os meacutetodos de investigaccedilatildeo e indicadores que podem ser usados para estudar os ldquosocio-economics impacts of open data which types of usable data are already being collected and what are the addionational data needsrdquo

Para Janssen (2012) o movimento dos DGA promoveu uma maior disponibilidade de informaccedilatildeo puacuteblica embora natildeo tenha necessariamente melhorado o acesso agrave informaccedilatildeo De acordo com a mesma autora os DAG estatildeo em voga com os

49

programadores e hackers a desenvolverem aplicaccedilotildees atraveacutes dos dados detidos pelo setor puacuteblico e os ativistas a descobrir o valor dos dados governamentais na defesa das suas causas Se as cidades utilizarem os dados que produzem em proveito proacuteprio publicando-os nos seus portais com as licenccedilas adequadas de reutilizaccedilatildeo podem estimular a criaccedilatildeo de novos serviccedilos e transformar-se em smart cities (Garcia 2015) reduzindo custos e consumo de recursos e melhorando o contacto entre cidadatildeos e governo (Carrara Engbers Nieuwenhuis amp Steenbergen 2016)

No acircmbito da digital transformation ocorrida nas uacuteltimas deacutecadas diversas alteraccedilotildees ocorreram na forma comas organizaccedilotildees produzem vendem e disponibilizam os seus produtos e tambeacutem na forma em como os funcionaacuterios trabalham e comunicam Segundo Carrara Fisher Oudkerk Steenbegen e Tinholt (2015) os Dados Abertos podem ser reutilizados por organizaccedilotildees de diferentes setores da induacutestria cultura e turismo educaccedilatildeo e investigaccedilatildeo energia e utilidades financcedilas e seguros sauacutede fabrico de produtos comunicaccedilatildeo e entretenimento puacuteblico imobiliaacuterio retalho telecomunicaccedilotildees transportes e tecnologias de informaccedilatildeo Davies (2014) afirma que no caso dos EUA e do Reino Unido a enfacircse do discurso puacuteblico passou da melhoria da transparecircncia governativa para o discurso das vantagens econoacutemicas dos Dados Abertos como consequecircncia da crise econoacutemica e da maior maturaccedilatildeo das poliacuteticas de abertura de dados Na EU a linha de pensamento tem evoluiacutedo no mesmo sentido com o estudo econoacutemico feito pelo European Data Portal a indiciar um impacto econoacutemico direto da abertura de dados em 2016 de 553 biliotildees de euros e em 2020 de 757 biliotildees de euros com uma projeccedilatildeo de perto de 100 mil postos de trabalho envolvidos O mesmo estudo indica que o mercado total da abertura de dados contabilizando os impactos diretos e indiretos subiraacute dos 193-209 biliotildees de euros em 2016 para os 265-286 biliotildees de euros em 2020 (Carrara Chan Fischer amp Steenbergen 2015)

Os portais de Dados Abertos satildeo uma parte essencial da infraestrutura ao permitirem o acesso e reutilizaccedilatildeo de dados oferecendo um ponto de acesso uacutenico aos utilizadores aos dados governamentais como os cataacutelogos e portais de dados centralizados Veja-se por exemplo os 304 portais incluiacutedos no cataacutelogo do portal de dados governamentais dos EUA o datagov que aleacutem dos portais de dados de cidades e estados norte-americanos (88) engloba ainda 52 paiacuteses e 164 regiotildees internacionais (United States General Services Administration) O Open Data Soft (2017) lista jaacute mais de 2600 portais de dados oriundos de 194 paiacuteses indicando apenas 6 portais de Dados Abertos em Portugal

Poreacutem de acordo com Colpaert et al (2013) natildeo existe nenhum guia que determine as funcionalidades e possibilidades dos portais de dados Os autores vecircm assim propor um esquema de classificaccedilatildeo para portais de Dados Abertos com o

50

objetivo de impulsionarem as entidades puacuteblicas a criarem o seu proacuteprio portal de dados ou a criarem novas metas para os jaacute existentes

Fig 14 Esquema de classificaccedilatildeo das 5 estrelas para os portais de dados Fonte Colpaert et al (2013) Disponiacutevel na WWW httppieterpm5stardataportals5starsofopendataportalspdf

O relatoacuterio feito pelo Open Data Institute (ODI) para o European Data Portal defende que os portais de dados devem continuar a responder aos desafios utilizando para isso modelos sustentaacuteveis em quatro aacutereas chave gestatildeo financcedilas arquitetura e operaccedilotildees Devem tambeacutem usar meacutetricas que permitam avaliar e melhorar a qualidade e usabilidade dos dados sendo que a mediccedilatildeo de impacto da reutilizaccedilatildeo de Dados Abertos tambeacutem deve ser alvo de financiamento contiacutenuo (Sasse et al 2017)

A OKI desenvolveu um sistema de gestatildeo de dados suportado por uma plataforma aberta o CKAN oferecendo soluccedilotildees que agilizam a publicaccedilatildeo partilha pesquisa e uso dos dados sendo utilizado por 146 portais de dados a niacutevel mundial (CKAN) Usar esta ferramenta para construir um cataacutelogo permite agraves entidades governos e organizaccedilotildees publicar dados e disponibiliza-los de forma aberta facilitando a pesquisa e a visualizaccedilatildeo da informaccedilatildeo A plataforma DataHub oferece acesso a muitos dos serviccedilos do CKAN permitindo o upload pesquisa registo de datasets publicados criaccedilatildeo e gestatildeo de grupos de datasets e receber atualizaccedilotildees de conjuntos de dados em que haja interesse O DataHub aloja 35 datasets relacionados com a palavra-chave ldquoPortugalrdquo sendo 18 desses conjuntos de dados diretamente coletados e disponibilizados por entidades portuguesas Os restantes 17 datasets estatildeo englobados em publicaccedilotildees que abrangem vaacuterios paiacuteses (Open Knowledge International [d]) As entidades puacuteblicas tambeacutem podem desenvolver portais de dados contratando para isso serviccedilos de plataformas como o Socrata30 OpenDataSoft31 ou o DataMarket32 que facilitam a publicaccedilatildeo a partilha e a reutilizaccedilatildeo de dados puacuteblicos

30 Disponiacutevel na WWW httpssocratacom 31 Disponiacutevel na WWW httpswwwopendatasoftptsolucao-de-dados-abertos 32 Disponiacutevel na WWW httpwwwqlikcomusproductsqlik-data-market

Registo de conjuntos de dados (ligaccedilatildeo ao dataset)

Fornecimento de metadados (licenccedila contexto atualizaccedilotildees etc)

Plataforma de cocriaccedilatildeo (interaccedilatildeo desenvolvimento aplicaccedilotildees)

Plataforma de publicaccedilatildeo de dados e metadados em formatos comuns

Central de dados comum (agregaccedilatildeo informaccedilatildeo interna e externa)

51

Em termos de licenciamento de dados embora as licenccedilas Creative Commons possam ser aplicadas aos dados foram criadas licenccedilas abertas especiacuteficas para dados sob a tutela da OKI as Open Data Commons (ODC)

ODC Attribution License (ODC-By) Compatiacutevel com a licenccedila CC BY permite a coacutepia distribuiccedilatildeo modificaccedilatildeo de dados ou bases de dados com a devida menccedilatildeo de atribuiccedilatildeo de autoria devendo ser mantida para trabalhos derivados

ODC Open Database License (ODC-ODbL) Segue os mesmo princiacutepios da licenccedila CC BY-SA aplicando-se no entanto apenas a dados Permite a coacutepia distribuiccedilatildeo modificaccedilatildeo de dados ou bases de dados com a devida menccedilatildeo de atribuiccedilatildeo de autoria devendo os trabalhos derivados aplicar a mesma licenccedila e serem redistribuiacutedos sem restriccedilotildees

Public Domain Dedication and License (PDDL) permite a coacutepia distribuiccedilatildeo modificaccedilatildeo de dados ou bases de dados sem qualquer tipo de restriccedilotildees ou atribuiccedilatildeo de creacutedito uma vez que os dados passam para o domiacutenio puacuteblico Eacute compatiacutevel com a licenccedila CC0 (Open Knowledge International [d] traduccedilatildeo livre)

Existem ainda 2 paiacuteses que definiram a sua proacutepria lincenccedila aberta de forma a garantir a abertura da PSI O Reino Unido desenvolveu a Open Government Licence (OGL) que sendo compativel com as licenccedilas CC e ODC autoriza o uso distribuiccedilatildeo publicaccedilatildeo adaptaccedilatildeo e exploraccedilatildeo comercial e natildeo comercial sob o requerimento de menccedilatildeo da fonte e da proviecircncia da informaccedilatildeo (The National Archives) Tambeacutem a Franccedila desenvolveu a sua Licence Ouverte que avaliza a reproduccedilatildeo uso distribuiccedilatildeo publicaccedilatildeo adaptaccedilatildeo e exploraccedilatildeo comercial requerendo apenas o reconhecimento da fonte e da proviecircncia da informaccedilatildeo Tal como a licenccedila britacircnica a Licence Ouverte eacute compatiacutevel com as licenccedilas CC e ODC e ainda com a proacutepria OGL (Etalab 2011)

A publicaccedilatildeo dos DGA envolve quatro intervenientes diferentes (Carrara et al 2016a traduccedilatildeo livre)

Decisores poliacuteticos normalmente os responsaacuteveis pela validaccedilatildeo de estrateacutegias e iniciativas de Open Data

Gestores de Dados satildeo por norma os responsaacuteveis pela coleta partilha de dados design e implementaccedilatildeo da estrateacutegia de Open Data na qualidade de especialistas

Programadores responsaacuteveis pela implementaccedilatildeo dos requisitos teacutecnicos das estrateacutegias de Dados Abertos

Contribuidores tecircm um papel ativo na coleta preparaccedilatildeo publicaccedilatildeo e manutenccedilatildeo dos dados

Gonzalez-Zapata e Heeks (2015) acrescentam outros intervenientes como os ativistas da sociedade civil as organizaccedilotildees internacionais os fornecedores de tecnologias de informaccedilatildeo e comunicaccedilatildeo e os acadeacutemicos As entidades e organizaccedilotildees internacionais envolvidas no esforccedilo de abertura dos dados

52

governamentais tecircm desenvolvido esforccedilos para promover a abertura de dados governamentais O Open Data Institute (2012) foi criado com o objetivo de ajudar instituiccedilotildees puacuteblicas organizaccedilotildees comerciais e natildeo comerciais a ldquoidentify and address how the web of data will impact their businesses and their sectorsrdquo Neste sentido a ODI tem promovido algumas iniciativas como o Open Data Certificate33 que atraveacutes de um sistema de questionaacuterios consegue demonstrar se os dados foram publicados de forma sustentaacutevel e reutilizaacutevel certificando assim a qualidade e a confianccedila nos mesmos A ODI desenvolveu tambeacutem o Open Data Maturity Model para avaliar o quanto as organizaccedilotildees publicam e consomem Dados Abertos identificando os pontos de melhoria O modelo baseia-se numa escala de cinco temas processos de gestatildeo de dados conhecimento e habilidades envolvimento e apoio ao cliente investimento e performance financeira e por fim visatildeo estrateacutegica Estes cinco temas tecircm cinco niacuteveis de progressatildeo possuindo uma aplicaccedilatildeo34 em linha que facilita a avaliaccedilatildeo (Dodds amp Newman 2015) A ODI dedica-se ainda agrave elaboraccedilatildeo de estudos de caso envolvendo iniciativas de Open Data aleacutem de possuir guias de orientaccedilatildeo para a abertura de dados e cursos de aprendizagem com o mesmo objetivo

O Banco Mundial lanccedilou o Open Government Data Toolkit com o objetivo de ajudar governos bancaacuterios e utilizadores a entender os conceitos baacutesicos da abertura de dados e a planear e implementar um programa de abertura dos dados governamentais Falamos de ferramentas de orientaccedilatildeo para a implementaccedilatildeo de poliacuteticas de dados abertos desde a definiccedilatildeo de Open Data e exemplos do seu uso passando pelo licenciamento e qualidade dos dados e finalizando com assistecircncia teacutecnica e apoio na procura de financiamento Uma das ferramentas disponibilizadas eacute o Open Data Readiness Assessment (ODRA) que pode ser usada para conduzir accedilotildees de anaacutelise da preparaccedilatildeo de um governo ou instituiccedilatildeo para avaliar desenhar e implementar uma iniciativa de Dados Abertos (The World Bank 2016)

Outra iniciativa esta com a chancela da Open Data for Development Network (OD4D[a]) ldquoa global network of leaders in the Open Data community working together to develop open data solutions around the worldrdquo desenvolveu uma base de dados puacuteblica de organizaccedilotildees que usam DGA ao niacutevel global O Open Data Impact Map permite aos governos organizaccedilotildees internacionais e investigadores ter a perceccedilatildeo da procura existente de Dados Abertos O mapa inclui organizaccedilotildees que usam DGA para advogar algo para desenvolver produtos e serviccedilos aprimorar operaccedilotildees prestar informaccedilotildees sobre estrateacutegias ou efetuar investigaccedilatildeo (Open Data for Development Network (OD4D[b] traduccedilatildeo livre) Em fevereiro de 2017 encontram-se listadas 1765 organizaccedilotildees oriundas de 96 paiacuteses concentrados sobretudo na Ameacuterica do Norte Europa e Aacutesia Central sendo que a maioria das entidades estaacute relacionada com o setor das tecnologias de informaccedilatildeo geoespacial negoacutecios 33 Disponiacutevel na WWW httpscertificatestheodiorgen 34 Disponiacutevel na WWW httppathwaytheodiorg

53

consultadoria investigaccedilatildeo e com governabilidade Portugal conta com 4 organizaccedilotildees listadas Fundaccedilatildeo Francisco Manuel dos Santos35 Transparecircncia Hackday36 e Open Knowledge Portugal no setor da governabilidade e a Manufactura Independente37 no setor dos meacutedia e comunicaccedilotildees

A OKI estaacute ativamente envolvida em diversos projetos que visam criar condiccedilotildees e potenciar a abertura de dados Aleacutem da mencionada Open Definition a OKI posiciona-se como coordenadora de outros projetos semelhantes um siacutetio web sobre Dados Governamentais Abertos um guia com enfoque nos aspetos teacutecnicos legais e sociais dos Dados Abertos um cataacutelogo de portais de Dados Abertos a niacutevel global um iacutendice que mede a abertura das poliacuteticas de Open Data e ainda introduziu censos sobre a abertura de dados A OKI oferece ainda um portal sobre dados financeiros38 um portal de e-learning sobre literacia de dados39 um portal sobre gastos puacuteblicos40 uma base de dados de ensaios cliacutenicos41 e o Frictionless Data42 que disponibiliza um Data Package Standard para facilitar o agrupamento e descriccedilatildeo de dados

A EU tem assumido uma dupla funccedilatildeo na abertura dos dados puacuteblicos verificando-se a sua intervenccedilatildeo na elaboraccedilatildeo de leis de apoio aos DGA e na promoccedilatildeo da criaccedilatildeo de infraestruturas de suporte A OECD desenvolveu um Observatoacuterio da PSI que coleta e analisa exemplos e partilha experiecircncias de inovaccedilatildeo do setor puacuteblico com o intuito de fornecer conselhos praacuteticos aos paiacuteses na criaccedilatildeo de inovaccedilatildeo O Observatoacuterio permite a partilha discussatildeo e cooperaccedilatildeo na criaccedilatildeo de soluccedilotildees (OECD 2016b traduccedilatildeo livre)

A disponibilidade e acessibilidade de dados eacute um dos pilares da plena afirmaccedilatildeo da Ciecircncia Aberta e neste acircmbito devem ser definidas poliacuteticas de Dados Abertos que mandatem o livre acesso a este tipo de informaccedilatildeo cientiacutefica e administrativa

2 As poliacuteticas de Dados Abertos

O processo de desenvolvimento de poliacuteticas envolve tradicionalmente a investigaccedilatildeo anaacutelise consulta e siacutentese de informaccedilatildeo para produzir recomendaccedilotildees A abertura de dados sem restriccedilotildees de acesso deve ser garantida por uma poliacutetica de Dados Abertos pois ldquoOpen Data is politicalrdquo (World Wide Web Foundation 201638) ldquoInstitutionalizing open data within larger sectoral initiatives requires ample political

35 Disponiacutevel na WWW httpwwwpordatapt 36 Disponiacutevel na WWW httpwwwtransparenciahackdayorg 37 Disponiacutevel na WWW httpmanufacturaindependenteorg 38 Disponiacutevel na WWW httpnextopenspendingorg 39 Disponiacutevel na WWW httpschoolofdataorg 40 Disponiacutevel na WWW httpopenbudgetseu 41 Disponiacutevel na WWW httpopentrialsnet 42 Disponiacutevel na WWW httpfrictionlessdataio

54

willrdquo (OD4D 2016) O fenoacutemeno dos Dados Abertos eacute tambeacutem teacutecnico e social dada a interaccedilatildeo entre o meio local politico social legal e teacutecnico e as tecnologias que produzem resultados (Davies 2014 Pasqueto Sands amp Borgman 2015)

Da revisatildeo da literatura destaca-se a existecircncia de poliacuteticas diferenciadas para a abertura de dados governamentais e para a abertura de dados cientiacuteficos A maior parte das poliacuteticas e estrateacutegias governamentais concentram-se na abertura dos dados governamentais em detrimentos dos dados de investigaccedilatildeo (RECODE 2014) A expressatildeo ldquoPoliacutetica de Dados Abertosrdquo surge frequentemente associada a termos como estrateacutegias programas ou iniciativas de abertura de dados e ainda a poliacuteticas de gestatildeo de dados A contextualizaccedilatildeo das poliacuteticas natildeo eacute clara referindo-se apenas a Dados Abertos mas focando-se preferencialmente apenas nos dados provenientes do setor puacuteblico Em termos de dados de investigaccedilatildeo eacute possiacutevel encontrar poliacuteticas de quatro intervenientes diferentes Governo entidade financiadora que pode ser ou natildeo governamental instituiccedilotildees de investigaccedilatildeo e ainda as editoras de data journals Em termos de dados puacuteblicos satildeo associadas poliacuteticas governamentais e institucionais As poliacuteticas de dados abertos devem ainda incluir uma poliacutetica de gestatildeo de dados independentemente do seu cariz de investigaccedilatildeo ou puacuteblico

Nos uacuteltimos anos questotildees sobre a gestatildeo preservaccedilatildeo e partilha de dados cientiacuteficos tecircm sido alvo de debate puacuteblico O aumento da criaccedilatildeo de datasets vastos e complexos em todo o processo cientiacutefico estaacute a criar profundos desafios para o armazenamento acesso e interpretaccedilatildeo de dados (EAGDA 2014) As recentes poliacuteticas de Open Data pretendem disponibilizar em livre acesso os datasets da mesma forma que qualquer outra publicaccedilatildeo acadeacutemica sendo para isso necessaacuterio garantir uma infraestrutura de armazenamento acesso pesquisa e a reutilizaccedilatildeo dessa informaccedilatildeo (Rans Day Duke amp Ball 2013) As poliacuteticas satildeo essenciais para o estabelecimento de compromissos comuns (Erway et al 2016) Segundo a Science International (20156) ldquoeffective open data in a data-intensive age can only be realised if there is systemic action at disciplinary national and international levelsrdquo De acordo com Tananbaum num estudo preparado em nome da SPARC ldquoopen data policies promote the accessibility and reuse of the raw data generated during the scientific discovery phaserdquo Estas poliacuteticas abrangem uma gama variada de material natildeo-textual como datasets estatiacutesticas resultados de inqueacuterito e os metadados associados a estes objetos devendo permitir que estes sejam sujeitos a processamento por maacutequina e anaacutelise (Tananbaum) Existem alguns desafios teacutecnicos legais e eacuteticos na criaccedilatildeo de uma poliacutetica de abertura de dados como assegurar a heterogeneidade e interoperabilidade dos dados a acessibilidade e pesquisabilidade a preservaccedilatildeo e curaccedilatildeo a qualidade e avaliaccedilatildeo e tambeacutem a seguranccedila dos dados (RECODE 2014)

A abertura de dados de investigaccedilatildeo em todas as aacutereas cientiacuteficas natildeo pode ter uma abordagem one size fits all pois estas produzem diferentes tipos de dados e tecircm

55

procedimentos de anaacutelise publicaccedilatildeo e arquivo diferenciados (Royal Society 2012 RECODE 2014 ERAC 2016 Laumlmmerhirt 2016) A heterogeneidade verificada entre as poliacuteticas de dados de investigaccedilatildeo ao niacutevel da aplicaccedilatildeo normativa e da gestatildeo de dados implica de acordo com Laumlmmerhirt que o cumprimento das medidas impostas pelas poliacuteticas seja irregular O autor defende que as poliacuteticas de dados abertos devem considerar as praacuteticas normas infraestruturas dentro de cada disciplina cientiacutefica e tambeacutem estabelecer incentivos para a publicaccedilatildeo de dados

A Comissatildeo Europeia aborda a necessidade de desenvolver princiacutepios teacutecnicos legais eacuteticos e semacircnticos de interoperabilidade de assegurar a verificaccedilatildeo e a confianccedila nos dados a niacutevel local regional e nacional de implementar novos incentivos para a partilha e proteccedilatildeo de diferentes tipos de dados e por fim uma estrutura que possa avaliar estes princiacutepios (Comissatildeo Europeia Grupo de peritos de alto niacutevel em dados de investigaccedilatildeo 2010) Shadbolt (2016) ressalva que a aposta deve ser feita em poliacuteticas consistentes que determinem a forma de abertura de dados produzidos sob financiamento puacuteblico sendo essencial sublinhar os seus benefiacutecios e partilhar as melhores praacuteticas Para gerar praacuteticas e uma cultura de abertura ldquowe need incentives as well as mandatesrdquo (Shadbolt 20162) A visatildeo subjacente a este movimento de abertura de dados cientiacuteficos eacute que os dados arriscam-se a ficar sem sentido se forem impedidos de ganhar valor cientiacutefico econoacutemico social ou poliacutetico (Leonelli 2016)

Os governos devem desenvolver poliacuteticas de abertura dos dados cientiacuteficos que complementem as poliacuteticas de abertura dos dados puacuteblicos bem como apoiar a criaccedilatildeo de software e recursos humanos habilitados que satildeo criacuteticos no sucesso de ambas as poliacuteticas (Royal Society 2012) As poliacuteticas de Dados Abertos devem ter um caraacuteter diferenciado das poliacuteticas de AA devido a questotildees como a confidencialidade e seguranccedila Nesse sentido o desenvolvimento de poliacuteticas de Dados Abertos eacute uma tarefa mais complexa devendo por isso ser incorporada como uma extensatildeo das poliacuteticas de AA (Swan 2012) A loacutegica para a definiccedilatildeo de poliacuteticas nacionais de Open Data encontra-se em assegurar o rigor da ciecircncia nacional baseado na acessibilidade e reprodutibilidade dos seus resultados em capturar o valor da abertura de dados para benefiacutecio proacuteprio e como base da colaboraccedilatildeo eficiente na ciecircncia internacional (Science International 2015 traduccedilatildeo livre) Embora a ciecircncia seja um elemento central Pasqueto Sands e Borgman (2015) sublinham que esta loacutegica se centra maioritariamente no domiacutenio econoacutemico

Segundo a SPARC as entidades financiadoras de investigaccedilatildeo devem implementar poliacuteticas de Dados Abertos como forma de aumentar a disponibilidade e reutilizaccedilatildeo de dados enquanto reduzem a duplicaccedilatildeo de investigaccedilatildeo maacute-interpretaccedilatildeo fraude e manipulaccedilatildeo de dados As poliacuteticas devem abranger todos os dados e metadados necessaacuterios agrave verificaccedilatildeo dos resultados de investigaccedilatildeo devendo a sua publicaccedilatildeo ocorrer o mais rapidamente possiacutevel (Tananbaum) O tempo passado entre a criaccedilatildeo e

56

a publicaccedilatildeo de dados eacute uma questatildeo importante na cultura do Open Data Poreacutem a Royal Society (2012) sugere que os investigadores deveriam ter exclusividade do uso dos dados por um curto periacuteodo de tempo de maneira a poderem analisa-los e publicar os seus resultados

A RECODE (2014) sublinha que os dados devem ser depositados num repositoacuterio que garanta a reutilizaccedilatildeo seguranccedila estabilidade estrutura de custos relevacircncia temaacutetica metadados diversos formatos de ficheiros processamento por maacutequina e curadoria de dados As poliacuteticas mais significativas das entidades financiadoras definem o AA a dados com obrigatoacuterio para a investigaccedilatildeo financiada com as exceccedilotildees possiacuteveis por razotildees eacuteticas e legais Requem o depoacutesito de dados que suportam as publicaccedilotildees e outros dados importantes em repositoacuterios certificados Requerem que os investigadores descrevam os dados nos Data Management Plan (DMP) que satildeo submetidos com as propostas de financiamento para serem avaliados Para assegurar a reutilizaccedilatildeo dos dados e a habilidade de identificar e medir o cumprimento das poliacuteticas os financiadores de investigaccedilatildeo introduziram especificaccedilotildees teacutecnicas nas suas poliacuteticas (DOIrsquos padrotildees de metadados especiacuteficos) bem como provisotildees para o licenciamento apropriado Mais importante as poliacuteticas eficientes incluem descriccedilotildees claras das responsabilidades e expectativas para os intervenientes envolvidos (financiadores investigadores centros de dados repositoacuterios e instituiccedilotildees de investigaccedilatildeo) (RECODE 2014)

O sucesso das poliacuteticas dos financiadores depende da criaccedilatildeo de um ambiente com incentivos apropriados que assegurem que os investigadores que gerem datasets de qualidade e os disponibilizem publicamente recebam o devido reconhecimento e recompensa bem como o financiamento adequado para os repositoacuterios e a monitorizaccedilatildeo dos planos de gestatildeo de dados (Expert Advisory Group on Data Access [EAGDA] 2014) Segundo a RECODE (2014) as poliacuteticas das entidades financiadoras devem estabelecer o AA a dados de investigaccedilatildeo por defeito devem definir responsabilidades conteuacutedos alvo os planos de gestatildeo de dados tempo e local de depoacutesito as especificaccedilotildees teacutecnicas para permitir a reutilizaccedilatildeo o licenciamento de dados medidas para garantir o acesso a longo termo e garantir a conformidade com a poliacutetica As instituiccedilotildees de investigaccedilatildeo devem desenvolver poliacuteticas para a partilha de dados e preservaccedilatildeo fornecer treino e apoio aos investigadores para gerirem os seus dados de forma efetiva criar carreiras para os gestores de dados e reconhecer os data outputs nos processos de avaliaccedilatildeo (EAGDA 2014) No Reino Unido um grupo de entidades interessadas na abertura de dados assinou em Julho de 2016 a ldquoConcordat on Open Research Datardquo com o intuito de assegurar que os dados de investigaccedilatildeo gerados e coletados por membros da comunidade de investigaccedilatildeo britacircnica sejam disponibilizados de forma aberta para reutilizaccedilatildeo por outros devendo esta abertura ocorrer de maneira consistente ldquowith relevant legal ethical disciplinary and

57

regulatory frameworks and norms and with due regard to the costs involvedrdquo (Concordat on Open Research Data 20161)

O desenvolvimento de poliacuteticas de abertura de dados permite que as instituiccedilotildees43 salvaguardem o seu investimento intelectual financeiro humano e material e respondam agrave crescente pressatildeo dos financiadores que requerem que os dados produzidos sob financiamento sejam geridos de forma apropriada e com AA (RECODE 2014) As poliacuteticas de abertura de dados das instituiccedilotildees de investigaccedilatildeo devem identificar as funccedilotildees e responsabilidades de cada interveniente tendo ainda um papel importante no desenvolvimento de data science skills sendo a sua funccedilatildeo preparar os investigadores para explorarem dados de forma efetiva oferecer serviccedilos de administraccedilatildeo de dados e tambeacutem a infraestrutura de computaccedilatildeo e armazenamento necessaacuteria (RECODE 2014 Whyte amp Donnally 20166) Rouder (2015) defende que as instituiccedilotildees devem utilizar sistemas automatizados que permitem que os dados sejam criados jaacute abertos eliminando erros na gestatildeo de dados fornecendo coacutepias de seguranccedila automaacuteticas simplificaccedilatildeo da partilha aumento da disponibilidade dos dados a longo termo e proporcionando um local de partilha e armazenamento

Segundo o RECODE (2014) os editores estatildeo interessados na abertura de dados de investigaccedilatildeo porque esta abertura agrega valor aos seus produtos principais (publicaccedilotildees tradicionais) ao melhorar a confianccedila da investigaccedilatildeo publicada atraveacutes da habilidade de a verificar Os editores cientiacuteficos devem estabelecer poliacuteticas para a partilha de dados e processos que permitam a contribuiccedilatildeo de autores individuais nas publicaccedilotildees sejam avaliadas e que requeiram a citaccedilatildeo44 e o reconhecimento dos datasets usados no curso da publicaccedilatildeo (EAGDA 2014 ICSU 2014) Os editores devem ainda requerer que se possa aceder avaliar usar e rastrear os dados subjacentes aos artigos a partir dos mesmos como condiccedilatildeo para a publicaccedilatildeo (Royal Society 2012 EAGDA 2014 ICSU 2014) A emergecircncia de data journals45 deve ser ligada ao esforccedilo de publicar dados de forma separada o que permite que partes essenciais do registo cientiacutefico possam ser disponibilizadas de forma inteligiacutevel para a comunidade cientiacutefica (RECODE 2014) Segundo o estudo de Sturges et al (20152445) ldquoa large percentage of journals have no data sharing policy and that there are inconsistencies between those that are traceablerdquo significando que os investigadores natildeo sabem se devem 43 Um bom exemplo encontra-se no siacutetio do Centro Europeu de Investigaccedilatildeo nuclear que apresenta trecircs grupos de dados produzidos que podem ser reutilizados tendo ainda definido poliacuteticas de acesso externo aos dados reutilizaccedilatildeo e preservaccedilatildeo para os dados provenientes de quatro experiecircncias a decorrer com o Large Hadron Collider (Grande Colisor de Haacutedrons) Disponiacutevel na WWW httpopendatacernchabout 44 De forma a potenciar o creacutedito do autor e a citaccedilatildeo de dados a Royal Society (2012) Altman amp Crosas (2013) Carpenter (2014) Ball amp Duke (2015) aconselham a criaccedilatildeo perfis de autor como o ORCID ou o ISNI permitindo desta forma que os investigadores possam associar todos os seus trabalhos cientiacuteficos num ponto uacutenico 45 Os data journals satildeo plataformas de publicaccedilatildeo de dados em AA com revisatildeo por pares para a publicaccedilatildeo partilha e disseminaccedilatildeo de dados que cobrem uma grande variedade de disciplinas (RECODE 2014)

58

partilhar os dados subjacentes aos seus artigos e tambeacutem natildeo sabem como e onde depositar os dados Contudo o cenaacuterio parece estar a mudar com o grupo editorial Nature Springer46 a anunciar em dezembro de 2016 o compromisso de mais de 600 journals com as novas poliacuteticas de partilha de dados definidas pelo grupo encorajando ou mandatando a partilha arquivo citaccedilatildeo de dados e revisatildeo por pares (Nature Springer 2016)

O Open Science Monitor avalia o impacto da abertura dos dados de investigaccedilatildeo atraveacutes trecircs indicadores nuacutemero de repositoacuterios de Dados Abertos poliacuteticas das agecircncias de financiamento relativas agrave partilha de dados e tambeacutem o comportamento dos investigadores em termos de partilha de dados O modelo de avaliaccedilatildeo usa ferramentas como o r3data e o SHERPAJuliet para determinar o nuacutemero de repositoacuterios e de poliacuteticas de abertura de dados recorrendo ainda a estudos de caso para determinar o comportamento dos investigadores na partilha de dados Foram listadas 105 poliacuteticas de financiadores na EU sendo que 76 das instituiccedilotildees natildeo possuem qualquer poliacutetica de Dados Abertos 10 encoraram o arquivo e 19 entidades financiadores requerem o arquivo de dados Os resultados satildeo altamente influenciados pelo enorme nuacutemero de instituiccedilotildees de financiamento de investigaccedilatildeo que pertencem ao Reino Unido sendo que das 69 instituiccedilotildees listadas 53 natildeo implementaram nenhuma poliacutetica de Dados Abertos Ressalve-se tambeacutem que das 19 poliacuteticas que requerem o arquivo de dados 13 pertencem ao Reino Unido (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2017)

O biosharingorg (2017) elaborou uma lista com as poliacuteticas de abertura de dados de investigaccedilatildeo a niacutevel mundial contando com 96 referecircncias em maio de 2017 As poliacuteticas de Dados Abertos distribuem-se por revista cientiacutefica (68) entidade financiadora (22) projetos (4) e sociedade (2) Ciecircncias da Vida e Ciecircncias Biomeacutedicas satildeo os domiacutenios com mais poliacuteticas Natildeo se encontra nenhuma poliacutetica cientiacutefica portuguesa listada

O RECODE (2014) estabeleceu dez recomendaccedilotildees para a abertura de dados cientiacuteficos

Desenvolver poliacuteticas compreensivas de AA aos dados de investigaccedilatildeo e consistentes com as prioridades nacionais e alinhadas com os requisitos europeus

Assegurar o financiamento apropriado para o AA aos dados de investigaccedilatildeo ao niacutevel do financiamento do desenvolvimento e sustentabilidade a longo prazo das

46 A Scientific Data uma das revistas de AA para descriccedilatildeo de datasets cientiacuteficos da divisatildeo editorial Nature Research englobadas no grupo Nature Springer fornece aos investigadores uma lista de repositoacuterios recomendados para o depoacutesito de dados consoante a sua aacuterea temaacutetica Disponiacutevel na WWW httpswwwnaturecomsdatapoliciesrepositoriessocial

59

infraestruturas de investigaccedilatildeo treino de investigadores bibliotecaacuterios e outros profissionais

Desenvolver poliacuteticas e iniciativas que recompensem os investigadores pelo esforccedilo de partilharem dados de alta qualidade

Identificar os intervenientes-chave e as redes de colaboraccedilatildeo para fomentar o trabalho colaborativo para um ecossistema sustentaacutevel de AA aos dados

Planear a sustentabilidade da curadoria e a preservaccedilatildeo dos dados a longo termo Desenvolver soluccedilotildees teacutecnicas e infraestruturais que possam arcar com a

preservaccedilatildeo de dados de alta qualidade a longo prazo harmonizaccedilatildeo de dados descoberta e acesso preservaccedilatildeo obsolescecircncia tecnoloacutegica documentaccedilatildeo e metadados indicadores de qualidade e relevacircncia e questotildees de seguranccedila

Desenvolver padrotildees teacutecnicos e cientiacuteficos de qualidade para os dados Requerer o uso de estruturas harmonizadas abertas e licenciadas Lidar com os sistemaacuteticos desafios legais e eacuteticos decorrentes do AA a dados Apoiar a transiccedilatildeo para os Dados Abertos atraveacutes do treino e desenvolvimento de

curriacuteculo

A ERAC (2016) desenvolveu um conjunto de recomendaccedilotildees para apoiar o desenvolvimento de poliacuteticas nacionais de abertura de dados de investigaccedilatildeo As recomendaccedilotildees satildeo dirigidas aos diversos intervenientes da abertura de dados estando dividas em quatro categorias

Treino dos intervenientes no processo de abertura de dados mudanccedila cultural treino incentivos e sistemas de recompensa e monitorizaccedilatildeo

Gestatildeo e qualidade de dados aspetos teacutecnicos da avaliaccedilatildeo da qualidade de dados identificaccedilatildeo e citaccedilatildeo de dados e gestatildeo de projetos

Sustentabilidade e financiamento abordagem das infraestruturas e financiamento essenciais

Questotildees legais direitos de propriedade intelectual e questotildees de seguranccedila

A mudanccedila cultural exigida para a abertura plena dos dados passa pela necessidade de estabelecer novas formas de reconhecimento e recompensa aos esforccedilos de gestatildeo preservaccedilatildeo e curaccedilatildeo de dados como forma de envolver investigadores e comunidades na abertura de dados (RECODE 2014 International Science 2015) A mudanccedila cultural tem no entanto encontrado alguns reveses pois o caminho para a abertura de dados natildeo eacute percecionado da mesma forma pelos diferentes intervenientes Isto resulta de conflitos entre cadeias de valor processos paralelos e desconectados especialmente entre as praacuteticas de cada disciplina e os requisitos de cada financiadorinstituiccedilatildeo (RECODE 2014) Segundo o inqueacuterito efetuado pelo EAGDA (2014) os planos de gestatildeo de dados natildeo satildeo avaliados adequadamente e existe pouca monitorizaccedilatildeo da implementaccedilatildeo da partilha de dados Os investigadores natildeo se sentem encorajados pelas instituiccedilotildees a partilhar dados e existe necessidade de

60

proporcionar treino aos investigadores A falta de apoio para a partilha de dados eacute sintomaacutetica com a falta de habilidades na gestatildeo de projetos sendo que os investigadores dedicam poucos cuidados agrave preservaccedilatildeo e curaccedilatildeo de dados Estes acontecimentos contribuem para a falta de conhecimento de metadados limitando a utilidade dos datasets Os investigadores sentem tambeacutem que a partilha de dados natildeo tem influecircncia na progressatildeo na carreira (EAGDA 2014)

A OECD (2015a) considera essencial que os investigadores desenvolvam competecircncias sobre dados que lhes permita natildeo soacute partilhar dados limpos e com metadados adequados como tambeacutem entender e reutilizar dados de terceiros A familiaridade com ferramentas e princiacutepios de gestatildeo de dados deve ser segundo a Royal Society (2012) parte integrante do treino dos cientistas As bibliotecas como parte integrante do mundo da investigaccedilatildeo e os bibliotecaacuterios47 como profissionais de informaccedilatildeo multifacetados podem desempenhar um papel ativo no mundo dos Dados Abertos como facilitadores do processo de investigaccedilatildeo (RECODE 2014 Hahnel e Hook 2016 Erway et al 2016 Hernaacutendez-Peacuterez 2016) Para Erway et al (2016) o plano de gestatildeo de dados eacute um ponto base para os bibliotecaacuterios fornecerem serviccedilos de gestatildeo de dados de investigaccedilatildeo As bibliotecas devem fornecer informaccedilatildeo sobre o processo de gestatildeo de dados incluindo planos de gestatildeo de dados e aconselhamento sobre direitos de propriedade intelectual treino serviccedilos de metadados fornecer um cataacutelogo de dados ou um repositoacuterio de dados oferecer serviccedilos de armazenamento pesquisa e acesso permanente para apoiar o ciclo da investigaccedilatildeo (Christensen-Dalsgaard et al 2012 Erway et al 2016 Hernaacutendez-Peacuterez 2016) Christensen-Dalsgaard et al (2012) acrescenta que as bibliotecas devem participar no desenvolvimento da poliacutetica de Dados Abertos da instituiccedilatildeo e estabelecer colaboraccedilotildees com investigadores grupos de investigaccedilatildeo arquivos e centros de dados para fomentar a interoperabilidade da estrutura de acesso pesquisa e partilha de dados Embora muitas das funccedilotildees sejam idecircnticas Hernaacutendez-Peacuterez (2016) faz a distinccedilatildeo entre os papeacuteis das bibliotecas puacuteblicas e das universitaacuterias O autor ressalva que as bibliotecas puacuteblicas devem centrar a atenccedilatildeo nos Dados Abertos que sejam afetos agrave sua comunidade A RDA publicou em 2015 um documento com uma visatildeo geral sobre as praacuteticas recursos online e ferramentas que podem ajudar as bibliotecas a integrar a gestatildeo de dados nas suas rotinas de trabalho As 23 orientaccedilotildees sugeridas dividem-se em recursos de aprendizagem disseminaccedilatildeo de dados planos de gestatildeo de dados literacia de dados metadados citaccedilatildeo de dados licenciamento e privacidades preservaccedilatildeo digital repositoacuterios de dados e comunidade de praacutetica

Na procura de um padratildeo de abertura de dados que permita potenciar a ciecircncia e a investigaccedilatildeo o Data Publishing Group da FORCE11 criou os FAIR principles Estes

47 Veja-se neste ponto os cursos de formaccedilatildeo sobre gestatildeo de dados para bibliotecaacuterios oferecidos pela Universidade de Edimburgo Disponiacutevel na WWW httpdatalibedinaacukmantralibtraininghtml

61

princiacutepios apresentam-se divididos em quatro facetas relacionadas mas tecnicamente independentes (FORCE11 FAIR Data Publishing Group 2014)

Fig 15 Princiacutepios FAIR Data Fonte Adaptado de FORCE11 FAIR Data Publishing Group 2014 Disponiacutevel na WWW httpswwwforce11orggroupfairgroupfairprinciples

A implementaccedilatildeo destes princiacutepios teacutecnicos na abertura de dados poderaacute potenciar tambeacutem a partilha e por consequente a citaccedilatildeo de dados A citaccedilatildeo de dados48 eacute um assunto que tem vindo a ser debatido na comunidade cientiacutefica nos uacuteltimos anos sendo uma aacuterea em que a FORCE11 tambeacutem jaacute definiu princiacutepios49 que comeccedilam a ser adotados pela comunidade cientiacutefica

Relativamente aos dados puacuteblicos ou do setor puacuteblico a comunidade internacional tem vindo a aumentar o seu interesse no uso destes dados embora nem sempre seja claro que a abertura seja uma prioridade na sua agenda poliacutetica (OD4D 2016) ldquoThe 48 Num mundo onde o Fator de Impacto continua a ser a principal medida de avaliaccedilatildeo do trabalho dos cientistas a citaccedilatildeo de dados e as meacutetricas alternativas denominadas de Altimetrias comeccedilam a ganhar algum destaque na literatura cientiacutefica 49 Os Data Citation Principles foram criados pela FORCE11 com o intuito de disponibilizar um padratildeo de citaccedilatildeo de dados cobrindo o propoacutesito funccedilotildees e atributos da citaccedilatildeo O conjunto de oito princiacutepios inclui a importacircncia da citaccedilatildeo de dados a atribuiccedilatildeo de creacutedito prova de evidecircncia identificador uacutenico acesso persistecircncia especificidade e verificabilidade interoperabilidade e flexibilidade Disponiacutevel na WWW httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

bull F1 - Satildeo atribuiacutedos identificadores persistentes e uacutenicos a cada conjunto de (meta)dados

bull F2 - Os dados satildeo descritos atraveacutes do uso de metadados sofisticados

bull F3 - Os (meta)dados devem ser registadosindexados num motor de pesquisa

bull F4 - Os metadados devem especificar o identificador de dados

Faacuteceis de encontrar

bull A1 - Os (meta)dados satildeo pesquisaacuteveis atraveacutes do seu identificador usando um protocolo de comunicaccedilatildeo padratildeo

bull A11 - O protocolo eacute aberto livre e universalmente implementaacutevel

bull A12 O protocolo requer a autenticaccedilatildeo e concessatildeo de autorizaccedilatildeo quando necessaacuterio

bull A2 - Os metadados permanecem acessiacuteveis mesmo quando os dados jaacute natildeo estatildeo disponiacuteveis

Acessiacuteveis

bull I1 - Os (meta)dados usam uma linguagem formal acessiacutevel partilhada e de aplicaccedilatildeo global

bull I2 - Os (meta)dados usam vocabulaacuterios que sigam os princiacutepios FAIR

bull I3 - Os (meta)dados incluem referecircncias qualificadas a outros (meta)dados

Interoperaacuteveis

bull R1 - Os (meta)dados tecircm uma pluralidade de atributos relevantes e precisos

bull R11 - Os (meta)dados satildeo publicados com uma licenccedila clara de acessibilidade e reutilizaccedilatildeo

bull R12 - Os (meta)dados satildeo associados com a sua origem bull R13 - Os (meta)dados cumprem com os padrotildees comunitaacuterios

relevantes de cada domiacutenio

Reutilizaacuteveis

62

culture of open data policies has to change from a culture in which opening of data is standardly considered (Zuiderwijk amp Janssen 201427)

Devem ser consideradas vaacuterias questotildees na elaboraccedilatildeo de uma poliacutetica de Dados Abertos como a definiccedilatildeo da sua aplicaccedilatildeo e os objetivos que dados iratildeo ser publicados quais as condiccedilotildees de publicaccedilatildeo de dados em que siacutetio qual a frequecircncia e qual a razatildeo da publicaccedilatildeo devendo ainda ser calculado o impacto e os benefiacutecios da abertura de dados (Carrara et al 2016a) Os objetivos das poliacuteticas de Dados Abertos podem ser sintetizados em trecircs aacutereas principais fomentar a inovaccedilatildeo social e crescimento econoacutemico melhorar a eficiecircncia dos serviccedilos do setor puacuteblico e fortalecer a democracia e aumentar a transparecircncia (Zuiderwijk Gasco Parycek amp Janssen 2014) Para alcanccedilar este impacto real os governos necessitam de implementar o fenoacutemeno dos Dados Abertos como uma mudanccedila cultural assegurando que recursos humanos e materiais infraestrutura leis e poliacuteticas satildeo eficientes para a implementaccedilatildeo e extraccedilatildeo de resultados a longo prazo (World Wide Web Foundation 2016)

No contexto das poliacuteticas de Dados Abertos a transparecircncia natildeo deve ser vista como um fim mas sim como um meio para atingir outros objetivos como a inovaccedilatildeo no setor puacuteblico permitindo o envolvimento democraacutetico e fornecendo o acesso a informaccedilatildeo ldquoincluding enhancing the findability usability and intelligibility of open data and providing the possibility to trace governmental processes and policy and decision makingrdquo (Zuiderwijk et al 2014) Dados os benefiacutecios desejados as barreiras agrave sua implementaccedilatildeo e os baixos niacuteveis de exploraccedilatildeo de dados os programas de DGA soacute funcionaratildeo bem se forem desenhados mediante a apreciaccedilatildeo da sua complexidade O programa deve natildeo soacute perceber as necessidades e as capacidades dos fornecedores de dados governamentais e privados como tambeacutem as caracteriacutesticas dos dados e a natureza dos recursos da comunidade e dos intervenientes (Dawes Vidiasova amp Parkhimovich 2016) Num estudo comparativo de cinco poliacuteticas nacionais de Dados Abertos Huijboom e van den Broek (2011) concluiacuteram que faltam provas mais evidentes dos benefiacutecios econoacutemicos sociais e democraacuteticos das poliacuteticas de abertura de dados governamentais Os autores sublinham que as barreiras estatildeo dentro das organizaccedilotildees governamentais as motivaccedilotildees estatildeo predominantemente fora desse espectro (Huijboom amp van den Broek 2011)

A investigaccedilatildeo de Dawes Vidiasova amp Parkhimovich (2016) demonstra a existecircncia de vaacuterias abordagens no desenvolvimento de programas de abertura de dados governamentais com diversas consideraccedilotildees sociais e teacutecnicas

Abordagem orientada a dados ou seja focada nas caracteriacutesticas qualidade e disponibilidade de dados abertos

Abordagem orientada ao programa que foca os objetivos e as funcionalidades das estruturas e operaccedilotildees dos programas de DGA

63

Abordagem orientada ao uso e ao utilizador que se centra nos fatores que influenciam o uso de DGA pela comunidade

Abordagem de desempenho e impacto que foca uma vasta gama de consideraccedilotildees que podem influenciar como os programas de DGA funcionam

Abordagem de ecossistemas e redes que indicam os componentes de um programa de DGA e tambeacutem as relaccedilotildees dinacircmicas existentes e como estas influenciam o desempenho do programa

O Secretaacuterio-geral das Naccedilotildees Unidas atraveacutes do seu grupo de aconselhamento independente efetuou recomendaccedilotildees para possibilitar ldquoa data revolution in sustainable developmentrdquo (The UN Secretary Generals Independent Expert Advisory Group on a Data Revolution for Sustainable Development 2014a traduccedilatildeo livre)

Criaccedilatildeo de normas incentivos e regulamentos para encorajar e requerer que os dados sejam tornados publicamente disponiacuteveis e de forma que possam ser uacuteteis a outros utilizadores

Aumentar a literacia de dados para que mais pessoas usem e analisem dados Criar inovaccedilotildees na forma em como quando e que dados satildeo coletados e

partilhados para que estejam sempre atualizados e sejam relevantes para as pessoas e para os poliacuteticos

Para apoiar o desenvolvimento sustentaacutevel e inclusivo a data revolution deve ser guiada pelos seguintes princiacutepios qualidade e integridade de dados desagregaccedilatildeo de dados publicaccedilatildeo de dados de forma raacutepida transparecircncia e abertura de dados curadoria e usabilidade de dados proteccedilatildeo e privacidade gestatildeo e independecircncia recursos e capacidades tecnoloacutegicas (The UN Secretary Generals Independent Expert Advisory Group on a Data Revolution for Sustainable Development 2014b) O repositoacuterio de dados estatiacutesticos das Naccedilotildees Unidas indexa 60 milhotildees de registos de datasets provenientes de 35 bases de dados de 20 temaacuteticas diferenciadas Ao inserir a palavra ldquoPortugalrdquo no campo de pesquisa do repositoacuterio satildeo recuperados 2172 datasets distribuiacutedos por 25 fontes diferenciadas Estes conjuntos de dados distribuem-se por vaacuterias temaacuteticas sendo o setor industrial o maior fornecedor de dados com 612 datasets (United Nations Statistics Division 2017)

Dawes Vidiasova amp Parkhimovich (20162) defendem ldquothe ecosystem metaphorrdquo como uma abordagem heuriacutestica para o desenho efetivo de programas de abertura de dados governamentais sublinhando a sua utilidade se o ecossistema for dotado de ldquofeedback and adjustment among actors and processesrdquo A chave para um ecossistema de Dados Abertos funcional eacute a implementaccedilatildeo de poliacuteticas que definam ldquothe legal context standards to facilitate data interoperability and a stable and sustainable network for users of the datardquo (Donker amp van Loenen 2017)

64

A Sunlight Foundation publicou em 2014 as ldquoGuidelines for open data policiesrdquo fornecendo aconselhamento ao niacutevel dos dados que devem ser tornados puacuteblicos e como essa abertura deve ser efetuada Para a implementaccedilatildeo de poliacuteticas de DGA a Sunlight Foundation aponta como fundamental criar um autoridade de supervisatildeo criar orientaccedilotildees e outras regulaccedilotildees vinculativas para a implementaccedilatildeo da poliacutetica incorporar a perspetiva puacuteblica na implementaccedilatildeo da poliacutetica definir prazos ambiciosos para a implementaccedilatildeo criar processos que assegurem a qualidade dos dados assegurar financiamento suficiente para a implementaccedilatildeo da poliacutetica criar ou explorar parcerias e mandatar futuras revisotildees da poliacutetica para possiacuteveis ajustamentos (Sunlight Foundation 2014 traduccedilatildeo livre)

De acordo com Dietrich (2013) uma poliacutetica de dados abertos deve

Definir a abertura por defeito Estar alinhada com os principais objetivos nacionais de desenvolvimento de

poliacuteticas Definir uma estrateacutegia nacional e as suas prioridades Tornar a coleta e gestatildeo de dados numa rotina Estabelecer accedilotildees de suporte ao ecossistema de dados abertos

Segundo o Open Data GoldBook todas as poliacuteticas de Dados Abertos devem cobrir os seguintes toacutepicos (Carrara et al 2016a traduccedilatildeo livre)

Lista das categorias de dados da organizaccedilatildeo Avaliaccedilatildeo do estatuto dos dados da organizaccedilatildeo Alinhamento com os aspetos legais Accedilotildees necessaacuterias para atingir os objetivos propostos Implicaccedilotildees teacutecnicas Implicaccedilotildees financeiras Criaccedilatildeo de um grupo de trabalho com responsabilidades e funccedilotildees claras Desenvolvimento de um plano que assegure a criaccedilatildeo do grupo de trabalho e

tambeacutem a sua monotorizaccedilatildeo Definiccedilatildeo de indicadores de performance que possibilitem a mediccedilatildeo do progresso

da poliacutetica relativamente aos objetivos delineados

O Open Data Study (Hogge 2011) aponta como razatildeo de sucesso das estrateacutegias de Open Data no Reino Unido e nos EUA a utilizaccedilatildeo de uma abordagem que envolve trecircs niacuteveis de intervenientes

Sociedade Civil e em particular o pequeno grupo que desenvolve aplicaccedilotildees e serviccedilos a partir de dados puacuteblicos

Um grupo de burocratas governamentais munidos de talento e recursos que lhes permita funcionar como niacutevel intermeacutedio ou de ligaccedilatildeo

Uma administraccedilatildeo poliacutetica recetiva agrave mudanccedila e agrave abertura

65

Em entrevista ao mesmo estudo (Hogge 201110) Tim Berners-Lee sintetiza esta estrateacutegia ldquoIt has to start at the top it has to start in the middle and it has to start at the bottomrdquo reforccedilando a ideia da importacircncia destes trecircs niacuteveis de influecircncia

Atraveacutes do seu Task Force Report o e-IRG (2016) efetuou vaacuterias recomendaccedilotildees para a implementaccedilatildeo de poliacuteticas de Dados Abertos preferecircncia pelas licenccedilas abertas promover a certificaccedilatildeo dos repositoacuterios apresentar os dados como um bem cientiacutefico institucional e societal e por fim ligar dados agraves publicaccedilotildees O OD4D (2016) sublinha que os dados devem ser publicados de forma consistente devem ser comparaacuteveis e interoperaacuteveis e para isso eacute necessaacuterio adotar padrotildees abertos e praacuteticas de publicaccedilatildeo para metadados formatos codificaccedilatildeo de caracteres identificadores vocabulaacuterios e licenciamento

Atraveacutes do estudo efetuado agraves poliacuteticas de Dados Abertos de instituiccedilotildees holandesas Zuiderwijk e Janssen (2014 traduccedilatildeo livre) efetuaram diversas recomendaccedilotildees que podem potenciar melhorias nas poliacuteticas de abertura de dados

Colaboraccedilatildeo entre instituiccedilotildees usando recursos e conhecimento coletivo para apoiar a troca de conhecimentos e a superaccedilatildeo da limitaccedilatildeo de recursos

Foco no impacto criaccedilatildeo de valor puacuteblico e natildeo apenas na publicaccedilatildeo de dados Estiacutemulo do uso de Dados Abertos e comunicaccedilatildeo dos sucessos de reutilizaccedilatildeo Criaccedilatildeo de uma cultura onde a abertura de dados seja incorporada nos processos

de trabalho diaacuterios

Arzberger et al (20041777) elencaram uma estrutura de avaliaccedilatildeo com cinco domiacutenios para promover o acesso a dados tecnoloacutegico institucional e de gestatildeo financeiro e orccedilamental legal e poliacutetico cultural e comportamental Estes domiacutenios podem ajudar na formulaccedilatildeo de poliacuteticas de Dados Abertos dado que satildeo ldquoa framework for locating and analyzing where improvements can be maderdquo Alguns autores destacam a pouca importacircncia que tem sido dedicada agrave implementaccedilatildeo avaliaccedilatildeo e alteraccedilotildees das poliacuteticas de Dados Abertos (Zuiderwijk et al2014) e ao desenvolvimento de investigaccedilatildeo que compare as mesmas poliacuteticas (Zuiderwijk amp Janssen 2014) A avaliaccedilatildeo dos efeitos das poliacuteticas de Dados Abertos pode fornecer inferecircncias importantes sobre as vantagens e desvantagens da abertura de dados e o valor puacuteblico que estas podem criar (Zuiderwijk et al2014) Comparar poliacuteticas de Dados Abertos em diferentes aspetos e a diferentes niacuteveis eacute importante e necessaacuterio para obter ldquoa better understanding of the common and differing elements in the policies and to identify the factors that affect the variation in policies and which influence their impactrdquo (Zuiderwijk amp Janssen 201417-18) Avaliar o estado da abertura de dados pode envolver a avaliaccedilatildeo teacutecnica dos conjuntos de dados das iniciativas de abertura dos dados governamentais atraveacutes da mediccedilatildeo quantitativa de resultados e impacto e julgamentos qualitativos sobre o desempenho da iniciativa de Dados Abertos (World Wide Web Foundation 2014) Um meacutetodo comum de avaliar o

66

efeito das poliacuteticas satildeo as estruturas de avaliaccedilatildeo da maturidade dos Dados Abertos sendo que estas podem ser uma ferramenta importante na melhoria da abertura de dados e no envolvimento da sociedade Estas estruturas satildeo usadas como modelo para comparaccedilatildeo de diferentes setores eou paiacuteses como instrumento de melhoria da qualidade e gestatildeo dos Dados Abertos (World Wide Web Foundation 2014 Donker amp van Loenen 2017) para entender os impactos comerciais e sociais e priorizar determinados tipos de dados (World Wide Web Foundation 2014) A World Wide Web Foundation (2014) enfatiza que a avaliaccedilatildeo das atividades de Dados Abertos deve ter em conta

Contexto em que a abertura de dados eacute feita legal organizacional poliacutetico teacutecnico social e econoacutemico

Natureza e qualidade dos conjuntos de dados acessibilidade legibilidade por maacutequina e licenccedilas abertas dimensatildeo teacutecnica legal social e praacutetica da abertura classificaccedilatildeo de datasets avaliaccedilatildeo da qualidade

Contexto de utilizaccedilatildeo quem satildeo os utilizadores quais os seus propoacutesitos e quais as atividades e modelos de negoacutecio construiacutedos a partir dos Dados Abertos

Benefiacutecios adquiridos pela reutilizaccedilatildeo de Dados Abertos sociais ambientais poliacuteticos e econoacutemicos ou comerciais

Atraveacutes de uma extensa revisatildeo da literatura50 Zuiderwijk e Janssen (2014) elaboraram uma estrutura de comparaccedilatildeo para as poliacuteticas de Dados Abertos baseada em trecircs vetores o ambiente e contexto da poliacutetica o conteuacutedo da poliacutetica os indicadores de desempenho que permitem inferir o valor puacuteblico alcanccedilado Estes vetores dividem-se em 27 indicadores de enquadramento e avaliaccedilatildeo das poliacuteticas de Dados Abertos

50 As autoras mencionam publicaccedilotildees de Huijboom amp Van der Broek (2011) Gibbs et al (2003) Eskelinen et al (2008) De Bruijn et al (2002) Dawes et al (2004) Rothenberg (2012) Public Sector Transparency Board (2012) Dawes Pardo amp Cresswell (2004) Open Government Directive (Obama 2012) Jaeger et al (2012) Zuiderwijk Jeffey amp Janssen (2012) Ono amp Zavodny (2007) Jaeger (2007)

67

Fig 16 Estrutura de avaliaccedilatildeo de poliacuteticas de Dados Abertos Fonte Zuiderwijk e Janssen (2014) Disponiacutevel na WWW httpwwwsciencedirectcomsciencearticlepiiS0740624X13001202

Antes de poder avaliar o sucesso do impacto dos Dados Abertos eacute necessaacuterio avaliar o estado atual da abertura de dados (Donker amp van Loenen 2017) De acordo com Sasse et al (2017) a avaliaccedilatildeo dos produtos de Dados Abertos pode ser difiacutecil Os autores enfatizam que os responsaacuteveis pelos portais de dados querem obter mais informaccedilatildeo atraveacutes da mediccedilatildeo de alguns paracircmetros como os datasets mais acedidos que datasets natildeo satildeo atualizados ou a percentagem de downloads entre outros Estas meacutetricas51 podem servir diversas audiecircncias desde organizaccedilotildees que publiquem dados a utilizadores que pretendam saber quais os conjuntos de dados mais usados Ainda

51 As meacutetricas satildeo uma forma de avaliaccedilatildeo que mede o progresso desempenho qualidade ou quantidade de um projeto serviccedilo ferramenta ou produto (Sasse et al 2017)

bullPaiacutes bullNiacutevel da organizaccedilatildeo e tipo de missatildeo bullMotivaccedilotildees e objectivos bullLanccedilamento da plataforma de Dados Abertos bullAlocaccedilatildeo de recursos e contexto econoacutemico bullLegislaccedilatildeo bullContexto poliacutetico e social

Conteacuteudo e ambiente da poliacutetica

bullEstrateacutegia e princiacutepios de abertura bullMedidas e instrumentos poliacuteticos bullProcessamento de dados antes da publicaccedilatildeo bullQuantidade de Dados Abertos bullTemaacutetica dos Dados Abertos bullFormas de apresentaccedilatildeo de dados bullPreccedilo do acesso aos dados bullGrupos alvo da abertura de dados bullPadrotildees e formatos teacutecnicos para os Dados Abertos bullFornececimento de metadados bullTipos de dados natildeo publicados bullApoio teacutecnico para o uso de dados publicados bullPromoccedilatildeo ativa da reutilizaccedilatildeo de dados bullQualidade dos dados bullLicenciamento de dados bullDisponibilidade de dados sem pedido de registo bullEstrutura da relaccedilatildeo entre os fornecedores de informaccedilatildeo e os utilizadores

Conteuacutedo da poliacutetica (input)

bullUsos dos dados publicados bullRiscos da publicaccedilatildeo de dados bullBenefiacutecios da publicaccedilatildeo de dados

Indicadores de desempenho (output)

Valor puacuteblico alcanccedilado (impacto)

68

segundo Sasse et al (2017) as meacutetricas devem ser integradas num contexto mais vasto para que possam conduzir agrave tomada de decisatildeo e agrave formulaccedilatildeo de poliacuteticas

Entre as iniciativas de Open Data ao niacutevel global a disponibilizaccedilatildeo aberta de dados eacute normalmente feita atraveacutes de cataacutelogos e portais de dados centralizados disponibilizando um ponto de acesso uacutenico aos utilizadores e atraveacutes dos quais se pode inferir o impacto das poliacuteticas de Open Data atraveacutes do regime de abertura dos datasets disponibilizados O DataCatalogs52 agrega os portais de DGA espalhados pelo mundo inteiro contabilizando 520 portais em Dezembro de 2016 sendo 197 localizados na Europa e apenas 5 em Portugal53 cenaacuterio que nos parece extremamente desatualizado tendo em conta os resultados obtidos no Quadro 5

O Open Data Barometer coleta informaccedilatildeo sobre a abertura de dados classificando os paiacuteses conforme o niacutevel de preparaccedilatildeo de poliacuteticas de Open Data a sua respetiva implementaccedilatildeo e tambeacutem o impacto causado por esta abertura oferecendo uma visatildeo global daquilo que eacute o estado de abertura dos dados governamentais A quarta ediccedilatildeo do Open Data Barometer revela algumas conclusotildees preocupantes a niacutevel da abertura dos dados governamentais A disponibilidade de dados que cumprem todos os princiacutepios de abertura caiu dos 10 para 7 e a legibilidade por maacutequina tambeacutem tem tendecircncia negativa Apenas se registou uma melhoria no licenciamento de dados A World Wide Web Foundation (2017) listou ainda um conjunto de problemas na disponibilizaccedilatildeo de Dados Abertos

Foi avaliado que nove em cada dez conjuntos de dados natildeo estatildeo abertos sendo que a recomendaccedilatildeo eacute que estes sejam abertos por princiacutepio

Os dados governamentais satildeo normalmente incompletos e de baixa qualidade A World Wide Web Foundation recomenda a descentralizaccedilatildeo da abertura de dados por todas as agecircncias e departamentos governamentais

A vontade poliacutetica eacute aquilo que distingue o sucesso do insucesso da abertura de dados ldquoGovernments must adopt the Open Data Charter to ensure open data practices are embedded beyond political mandatesrdquo (World Wide Web Foundation 201717)

Os governos natildeo estatildeo a publicar os dados necessaacuterios para restaurar a confianccedila dos cidadatildeos A recomendaccedilatildeo eacute que os governos devem consultar os cidadatildeos e intermediaacuterios para saber que dados devem ser considerados prioritaacuterios

Poucas iniciativas de Dados Abertos realmente promovem a igualdade e a inclusatildeo ldquoGovernments must invest in using open data to improve the lives of marginalised groupsrdquo (World Wide Web Foundation 201721)

52 Disponiacutevel na WWW httpdatacatalogsorg 53 Os portais indexados pelo DataCatalogs satildeo OneStopTransport iGEO Central de Dados Dadosgovpt Despesa Puacuteblica Portugal

69

O Open Data Maturity Model da ODI (201511) fornece uma estrutura para avaliar como as praacuteticas de abertura de dados tecircm impacto nas organizaccedilotildees nomeadamente como os dados satildeo publicados como satildeo geridos e valorizados Este modelo eacute baseado em cinco temas que representam uma vasta aacuterea de atividades

Processos de gestatildeo de dados identificaccedilatildeo dos processos de gestatildeo e publicaccedilatildeo de dados incluindo o controlo de qualidade fluxos de trabalho e adoccedilatildeo de padrotildees teacutecnicos Conhecimentos e habilidades delimitaccedilatildeo dos passos necessaacuterios para criar ldquoa culture of open data within an organizationrdquo identificando a necessaacuteria partilha de conhecimento treino e aprendizagem para entender os benefiacutecios da abertura Apoio e envolvimento do cliente foca a necessidade das organizaccedilotildees de se envolver com as fontes de dados e com os reutilizadores de dados de modo a poder fornecer apoio e obter respostas para tornar a abertura de dados bem-sucedida Investimento e desempenho financeiro cobre a necessidade da organizaccedilatildeo em ter uma visatildeo do valor dos seus dados e do orccedilamento necessaacuterio para suportar a sua publicaccedilatildeo Em termos de consumo de dados as organizaccedilotildees devem entender os custos e o valor associado agrave reutilizaccedilatildeo de dados provenientes de outras fontes Visatildeo estrateacutegica sublinha a necessidade de a organizaccedilatildeo adotar uma estrateacutegia clara sobre a partilha e reutilizaccedilatildeo de dados e nomear uma lideranccedila reconhecida com responsabilidade e capacidade para executar a estrateacutegia (ODI 2015 traduccedilatildeo livre)

A W3C publicou em Janeiro de 2017 como recomendaccedilatildeo uma lista de boas praacuteticas para a publicaccedilatildeo e partilha de dados denominada Data on the Web Best Practices Estas praacuteticas cobrem questotildees como o fornecimento de metadados descritivos e estruturais licenciamento arquivamento enriquecimento e republicaccedilatildeo de dados (W3C 2017) Cada uma das praacuteticas estaacute classificada de acordo com os seus benefiacutecios definidos em oito categorias reutilizaccedilatildeo compreensatildeo conexatildeo a outros dados pesquisabilidade confianccedila acesso interoperabilidade e processamento (W3C 2017) Esta lista de boas praacuteticas eacute complementada por dois vocabulaacuterios controlados um para o uso de datasets54 e outro para a qualidade dos dados55 (W3C 2017)

ldquoUma cidade inteligente eacute conhecedora das suas capacidades do seu territoacuterio e dos seus recursos devendo ser capaz de transformar o seu papel de fornecedor de dados em catalisadora de processos de inovaccedilatildeordquo (Soares Baptista e Lima 2015) A disponibilizaccedilatildeo de dados locais permite aos cidadatildeos acompanharem as decisotildees do setor puacuteblico relativas a despesas aumentando a transparecircncia e estimulando a democracia Contudo eacute necessaacuterio que as cidades desenvolvam uma infraestrutura correta que permita processar e integrar a gestatildeo de dados em diversos serviccedilos

54 Disponiacutevel na WWW httpswwww3orgTRvocab-duv 55 Disponiacutevel na WWW httpswwww3orgTRvocab-dqv

70

criando ainda um sistema de gestatildeo que facilite o armazenamento e publicaccedilatildeo de dados (Carrara et al 2016b) A Sunlight Foundation (2013) desenvolveu o Public Policy for Public Data um guia para ajudar as cidades a desenvolver e implementar poliacuteticas puacuteblicas de Dados Abertos desde as razotildees para a abertura passando pelos objetivos e implementaccedilatildeo ateacute agrave promoccedilatildeo da poliacutetica

De forma a sistematizar as iniciativas de Dados Abertos e melhorar a sua gestatildeo foi publicada em Espanha a UNE 1783012015 Ciudades Inteligentes Datos Abiertos permitindo avaliar a maturidade da publicaccedilatildeo de Dados Abertos das cidades inteligentes atraveacutes de meacutetricas e indicadores Esta norma define cinco grandes domiacutenios associados aos Dados Abertos (estrateacutegico legal organizacional teacutecnico econoacutemico-social) fornecendo ainda vocabulaacuterios concretos para a publicaccedilatildeo de dados (Asociacioacuten Espantildeola de Normalizacioacuten y Certificacioacuten 2015)

O World Council on City Data56 eacute uma das organizaccedilotildees envolvidas na promoccedilatildeo das smart cities e da criaccedilatildeo de padrotildees para os dados provenientes das cidades Em 2014 foi publicada a norma internacional ISO 37120 com o tiacutetulo ldquoSustainable development of communities -- Indicators for city services and quality of liferdquo incluindo 100 indicadores que medem indicadores sociais econoacutemicos e ambientais Estes indicadores estatildeo divididos em 17 categorias de dados economia educaccedilatildeo energia ambiente financcedilas governaccedilatildeo fogo e emergecircncias respostas sauacutede recreaccedilatildeo seguranccedila abrigos desperdiacutecios soacutelidos telecomunicaccedilotildees e inovaccedilatildeo transportes planeamento urbano desperdiacutecio de aacutegua e aacutegua e saneamento (Carrara et al 2016b) O World Council on City Data (2016) permite comparar a abertura de dados em diferentes cidades utilizando os indicadores da ISO 3720 Em termos de cidades listadas pelo mapa desta organizaccedilatildeo o Porto eacute o uacutenico representante portuguecircs destacando-se a sauacutede e transportes como aacutereas com maior abertura

21 Poliacuteticas Macro

A promessa de uma ciecircncia orientada a dados ldquohas renewed the vigour of policy efforts to catalyse innovationrdquo (Whyte amp Donnely 20161) No acircmbito da abertura de dados estatildeo a ser desenvolvidas poliacuteticas por governos agecircncias de financiamento e editoras cientiacuteficas57 que assegurem que os dados de investigaccedilatildeo estejam disponiacuteveis em repositoacuterios puacuteblicos A EU tem desempenhado uma dupla funccedilatildeo na abertura de dados cientiacuteficos ao requerer a abertura de dados nos seus programas de investimento e ao coordenar a implementaccedilatildeo de praacuteticas de abertura de dados nos

56 Disponiacutevel na WWW httpwwwdataforcitiesorg 57 O Open Acess Directory possui uma lista ainda em desenvolvimento com as revistas cientiacuteficas que implementaram uma poliacutetica de Dados Abertos Disponiacutevel na WWW httpoadsimmonseduoadwikiJournal_open-data_policies

71

estados membros (ERAC 2016) As agecircncias de financiamento58 tecircm vindo paulatinamente a definir poliacuteticas de AA que exigem a garantia que os dados de investigaccedilatildeo subjacentes agrave publicaccedilatildeo textual satildeo depositados em repositoacuterios adequados de forma a permitir a verificaccedilatildeo dos resultados de investigaccedilatildeo e futuros uso e interpretaccedilotildees (UNESCO 2015) O raacutepido desenvolvimento da abertura e gestatildeo de dados cientiacuteficos nos EUA e no Reino Unido satildeo resultados de mandatos dos financiadores como o Research Council United Kingdom National Science Foundation e da National Institutes of Health (RECODE 2014) As instituiccedilotildees de financiamento reconhecem a dificuldade na mudanccedila da cultura de partilha de dados sendo que a tendecircncia deveraacute passar por aumentar os niacuteveis de monotorizaccedilatildeo das poliacuteticas como a monotorizaccedilatildeo dos DMPrsquos auditorias institucionais monotorizaccedilatildeo de resultados produzidos e recompensas para o apoio na gestatildeo de dados (Whyte e Donnally 2016)

Em 2010 a Comissatildeo Europeia desenhou uma visatildeo que tinha por objetivo o desenvolvimento de uma e-infraestrutura cientiacutefica que potenciasse o acesso uso e reuacuteso bem como a qualidade dos dados dando o impulso para a EU formular poliacuteticas para a construccedilatildeo da infraestrutura de investigaccedilatildeo dentro do enquadramento da agenda digital Foca-se na infraestrutura necessaacuteria para a gestatildeo de dados cientiacuteficos e identifica os benefiacutecios de acelerar o desenvolvimento de uma completa e funcional infraestrutura para os dados cientiacuteficos O relatoacuterio faz seis recomendaccedilotildees destacando-se o papel governamental no desenvolvimento e uso de novas maneiras de medir o valor dos dados a necessidade de recompensar os que contribuem para tal treinar uma nova geraccedilatildeo de cientistas de dados e fomentar o entendimento puacuteblico (Comissatildeo Europeia Grupo de peritos de alto niacutevel em dados de investigaccedilatildeo 2010) No mesmo documento a Comissatildeo Europeia salienta que existem desafios que satildeo necessaacuterios superar na construccedilatildeo da e-infraestrutura estando estes ao niacutevel da coleta qualidade usabilidade interoperabilidade diversidade seguranccedila dos dados educaccedilatildeo e treino publicaccedilatildeo e acesso de dados exploraccedilatildeo comercial preservaccedilatildeo e sustentabilidade e novos paradigmas sociais

Em 2011 a Comissatildeo Europeia emitiu a COM (2011) 882 onde declara que a abertura de dados cientiacuteficos eacute vital para a Europa pelo seu poder de promover negoacutecios e oportunidades econoacutemicas resolver problemas da sociedade e acelerar o progresso cientiacutefico sendo necessaacuterio atuar a niacutevel local regional nacional e a niacutevel europeu (Comissatildeo Europeia 2011)

A recomendaccedilatildeo da Comissatildeo Europeia sobre o acesso agrave informaccedilatildeo cientiacutefica e a sua preservaccedilatildeo (2012417UE) pede aos Estados Membros que desenvolvam poliacuteticas e estrateacutegias que assegurem o AA a publicaccedilotildees e dados de investigaccedilatildeo provenientes

58 A Universidade de Cambridge apresenta uma lista com as 18 entidades financiadoras a niacutevel internacional que possuem poliacuteticas de Dados Abertos Disponiacutevel na WWW httpwwwdatacamacukfunders

72

de financiamento puacuteblico Estas poliacuteticas devem prever os objetivos e os indicadores de avaliaccedilatildeo o plano de execuccedilatildeo e o plano financeiro garantindo que os dados resultantes de financiamento puacuteblico sejam acessiacuteveis e reutilizaacuteveis ldquothrough digital e-infrastructuresrdquo e sejam facilmente identificados e ligados a outros conjuntos de dados As instituiccedilotildees nacionais devem promover a poliacutetica nacional atraveacutes de mecanismos que permitam e recompensem ldquothe sharing of research datardquo (EUR-Lex 201241-42) A poliacutetica instaurada em 2015 pela Comissatildeo Europeia denominada Digital Single Market propocircs a implementaccedilatildeo de uma ldquocopyright exception that would permit researchers to analyse on a large scale scientific data to which they have lawful accessrdquo (Comissatildeo Europeia 2016b) Esta exceccedilatildeo iraacute permitir que os investigadores europeus usem meacutetodos de ldquoText e Data Miningrdquo para analisar e extrair conhecimento de grandes quantidades de informaccedilatildeo atraveacutes de teacutecnicas computacionais (Comissatildeo Europeia 2016a51) Atraveacutes da implementaccedilatildeo deste Digital Single Market a EU tem envidado esforccedilos para desenvolver uma economia baseada em dados Esta economia de dados caracteriza-se por um ldquoecossistema de diferentes tipos de intervenientes no mercado como fabricantes investigadores e fornecedores de infraestruturas que colaboram para garantir que os dados satildeo acessiacuteveis e utilizaacuteveisrdquo Deste modo os intervenientes do mercado podem retirar valor desses dados ldquoatraveacutes da criaccedilatildeo de um leque de aplicaccedilotildees com um grande potencial de melhoria da vida quotidianardquo (Comissatildeo Europeia 2017c)

Com a ambiccedilatildeo de tornar a Europa liacuteder mundial numa economia baseada em dados a Comissatildeo Europeia (2016c) pretende ldquodisponibilizar serviccedilos baseados na computaccedilatildeo em nuvem e infraestruturas de dados de craveira mundialrdquo que forneccedilam vantagens competitivas a investigadores empresaacuterios e instituiccedilotildees puacuteblicas baseadas na utilizaccedilatildeo de grandes volumes de dados Neste sentido foram delineadas quatro metas a cumprir ateacute 2020 (Comissatildeo Europeia 2016d)

ldquoA partir de 2016 Criaccedilatildeo de uma nuvem europeia para a ciecircncia aberta destinada aos investigadores europeus e seus colaboradores cientiacuteficosrdquo A estrateacutegia definida inclui a ldquointegraccedilatildeo e consolidaccedilatildeo das plataformas de infraestruturas eletroacutenicas da agregaccedilatildeo das atuais nuvens cientiacuteficas e infraestruturas de investigaccedilatildeordquo e tambeacutem o apoio agrave criaccedilatildeo de ldquoserviccedilos baseados na computaccedilatildeo em nuvemrdquo

2017 Definiccedilatildeo de abertura por princiacutepio de todos os dados cientiacuteficos gerados em futuros projetos financiados pelo quadro atual de financiamento (H2020) para garantir a reutilizaccedilatildeo do volume massivo de dados produzidos pela comunidade cientiacutefica

2018 Lanccedilamento de uma iniciativa para acelerar o desenvolvimento de ldquotecnologias quacircnticas que estatildeo na base da proacutexima geraccedilatildeo de supercomputadoresrdquo

73

Ateacute 2020 desenvolvimento e implantaccedilatildeo em larga escala de uma infraestrutura europeia de computaccedilatildeo de alto desempenho armazenamento de dados e redesrdquo onde se destaca a ldquocriaccedilatildeo de um centro europeu de grandes volumes de dadosrdquo e a melhoria do GEANT59 ldquoa rede de base de investigaccedilatildeo e inovaccedilatildeordquo

A aposta na criaccedilatildeo de poliacuteticas de abertura de dados de acordo com os objetivos europeus relativamente agrave CA reflete-se no atual programa de financiamento da investigaccedilatildeo e inovaccedilatildeo da EU o Horizonte 2020 (H2020) Este programa criou um projeto-piloto de dados abertos com o objetivo de maximizar o acesso e reutilizaccedilatildeo de dados de investigaccedilatildeo nas aacutereas cientiacuteficas selecionadas60 embora todas as outras aacutereas sejam convidadas a participar (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016a) Sob o artigo 293 do Model Grant Agreement o projeto-piloto de abertura de dados requer o depoacutesito num repositoacuterio de AA de todos os dados e metadados associados que sejam subjacentes aos resultados finais da investigaccedilatildeo permitindo assim o seu acesso exploraccedilatildeo por maacutequina reproduccedilatildeo e disseminaccedilatildeo sem custos para os utilizadores Os investigadores devem fornecer informaccedilatildeo sobre as ferramentas e instrumentos necessaacuterios para validar os resultados Aos participantes em projetos financiados por fundos europeus eacute exigido a elaboraccedilatildeo de um DMP uma ferramenta para a gestatildeo publicaccedilatildeo e reutilizaccedilatildeo de dados permitindo descrever os conjuntos de dados gerados no processo de investigaccedilatildeo e como e quando seratildeo publicados A gestatildeo de dados deve ser efetuada segundo os princiacutepios FAIR tornando os dados faacuteceis de encontrar acessiacuteveis interoperaacuteveis e reutilizaacuteveis (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016c)

Com a extensatildeo do projeto-piloto a todas as aacutereas de investigaccedilatildeo financiadas a abertura de dados de investigaccedilatildeo passou a ser a norma por princiacutepio Poreacutem existe a opccedilatildeo de natildeo participaccedilatildeo (Comissatildeo Europeia 2017b) tendo sido implementado o lema ldquoas open as possible as closed as necessaryrdquo (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016b8) O opt out ou as exceccedilotildees de natildeo participaccedilatildeo podem ser exercidas em caso de incompatibilidade com a obrigaccedilatildeo de proteger resultados com razotildees de seguranccedila com regras de proteccedilatildeo de dados pessoais pelo fato de o objetivo do projeto ser colocado em causa de o projeto natildeo gerar ou coletar dados e ainda outras razotildees legiacutetimas que possam ser apresentadas (Comissatildeo Europeia 2017b)

59 O GEacuteANT eacute um elemento fundamental na infraestrutura europeia fornecendo uma rede para a criaccedilatildeo de investigaccedilatildeo educaccedilatildeo inovaccedilatildeo e perfeiccedilatildeo cientiacutefica Disponiacutevel na WWW httpswwwgeantorgAbout 60 As aacutereas cientiacuteficas selecionadas satildeo Tecnologias emergentes e futuras infraestruturas de investigaccedilatildeo lideranccedila na melhoria de tecnologias industriais (tenologias de informaccedilatildeo e comunicaccedilatildeo) nano e biotecnologias seguranccedila alimentar sustentabilidade de recursos agriacutecolas marinhos e mariacutetimos ambiente e eficiecircncia de recursos sociedades inovadoras e inclusivas ciecircncia de e para a sociedade e cidades inteligentes

74

A abertura dos dados de investigaccedilatildeo criados com financiamento puacuteblico conta com o apoio dos projetos do OpenAIRE+ e do OpenAIRE-Connect visam estimular a abertura de dados funcionando ldquoas a knowledge bank and Open Access web-portalrdquo (ERAC 201667) O portal do OpenAIRE agrega em Maio de 2017 um total de 46238 conjuntos de dados sendo que Portugal contribui com 1968 datasets distribuiacutedos por quatro entidades embora o Instituto Politeacutecnico de Castelo Branco seja o fornecedor de mais de 95 dos dados

O projeto EUDAT financiado pelo H2020 visa fornecer uma infraestrutura de dados colaborativa aos investigadores europeus de qualquer disciplina cientiacutefica onde possam preservar pesquisar aceder e processar dados como parte da EUDAT Collaborative Data Infrastructure uma rede de colaboraccedilatildeo e centros de cooperaccedilatildeo O EUDAT fornece acesso a sete serviccedilos diferentes relativos agrave gestatildeo de dados (EUDAT[a]) Atraveacutes do serviccedilo B2FIND61 eacute possiacutevel pesquisar os dados armazenados atraveacutes do serviccedilo B2SHARE62 verificando-se a existecircncia de 484795 conjuntos de dados (EUDAT[b])

Vaacuterios programas de abertura de dados governamentais foram lanccedilados em diversos paiacuteses e sistemas poliacuteticos tendo-se expandido tambeacutem ao niacutevel subnacional e local sendo que estes programas compreendem diretivas regras e praacuteticas com aplicaccedilatildeo em todos ou na maior parte dos setores do governo (Dawes Vidiasova amp Parkhimovich 2016) Estas iniciativas satildeo idecircnticas numa primeira anaacutelise atraveacutes da construccedilatildeo de um portal na seleccedilatildeo de datasets semelhantes sendo que tambeacutem recorrem aos mesmos tipos de eventos como os hackathons para preparar e divulgar o lanccedilamento de programas de DGA (Davies 2014) Contudo estas iniciativas diferem no seu estado de maturaccedilatildeo estruturas poliacuteticas e as suas prioridades puacuteblicas (Davies 2014) e nos princiacutepios de abertura na quantidade e tipos de dados publicados nos metadados fornecidos e no apoio agrave reutilizaccedilatildeo de dados (Zuiderwijk amp Janssen 2014) De facto uma simples comparaccedilatildeo dos vaacuterios iacutendices de avaliaccedilatildeo permitiraacute perceber os diferentes niacuteveis de maturidade das poliacuteticas de Dados Abertos e a niacutevel europeu e mundial

Os Dados Abertos estatildeo na agenda europeia haacute mais de uma deacutecada tendo o primeiro passo sido dado em 2003 com a publicaccedilatildeo da Diretiva 200398EC sobre a reutilizaccedilatildeo da PSI (EUR-Lex 2003a) e da Diretiva 20034CE relativa ao acesso puacuteblico agrave informaccedilatildeo ambiental (EUR-Lex 2003b) Esta Diretiva aplica-se agrave reutilizaccedilatildeo dos documentos detidos pelo setor puacuteblico poreacutem natildeo obriga os estados membros a publicar dados do setor puacuteblico para estimular o mercado da informaccedilatildeo apenas os aconselha a tornar disponiacuteveis nem impotildee nenhuma obrigaccedilatildeo de autorizaccedilatildeo de reutilizaccedilatildeo dos dados (Janssen 2011) Janssen (2011) sublinha que apesar do sucesso

61 Disponiacutevel na WWW httpb2findeudateudatasetq= 62 Disponiacutevel na WWW httpsb2shareeudateu

75

da abertura dos dados governamentais ter a contribuiccedilatildeo da Diretiva Europeia as iniciativas mais bem-sucedidas referem-se a princiacutepios de transparecircncia e prestaccedilatildeo de contas e natildeo agrave Diretiva em si

A EU adotou ainda uma estrutura compreensiva para o acesso e reutilizaccedilatildeo de informaccedilatildeo geoespacial incluindo as infraestruturas eletroacutenicas atraveacutes da INSPIRE Directive63 e fomentou a disseminaccedilatildeo do patrimoacutenio cultural atraveacutes da Europeana ldquothe European digital library for cultural objectsrdquo e o acesso a informaccedilatildeo ambientalrdquo (Comissatildeo Europeia 20132)

A Diretiva 2011833EU sobre a reutilizaccedilatildeo de documentos publicados pela Comissatildeo Europeia veio autorizar salvo nas exceccedilotildees previstas a utilizaccedilatildeo comercial e natildeo comercial sem custos e sem necessidade de pedido da informaccedilatildeo produzida pela EU ou em seu nome (EUR-Lex 2011) A Diretiva estabelece as condiccedilotildees de reutilizaccedilatildeo formatos em que os documentos devem ser disponibilizados regras de custos transparecircncia e natildeo discriminaccedilatildeo

A Diretiva 201337EU veio reformular a autorizaccedilatildeo da reutilizaccedilatildeo da PSI A nova diretiva requer que a informaccedilatildeo puacuteblica seja disponibilizada ldquothrough open and machine-readable formats and together with their metadata at the best level of precision and granularity in a format that ensures interoperabilityrdquo incluindo agora entidades como bibliotecas arquivos e museus na esfera da abertura de dados (EUR-Lex 20133) Esta diretiva tornou obrigatoacuteria a disponibilizaccedilatildeo de informaccedilatildeo proveniente das entidades puacuteblicas para reutilizaccedilatildeo ao custo de reproduccedilatildeo de preferecircncia num portal e sob licenccedilas de formatos digitais O artigo 9ordm sublinha que os Estados-Membros devem fornecer instrumentos que facilitem a pesquisa de dados como inventaacuterios dos documentos com os respetivos metadados disponibilizando-os se possiacutevel em linha em formato legiacutevel por maacutequina bem como a ligaccedilatildeo entre o portal e o inventaacuterio Os objetivos passam por estimular o desenvolvimento de um mercado europeu de serviccedilos baseados na PSI melhorar o uso e aplicaccedilatildeo da PSI nos processos de negoacutecio fortalecer a competitividade no mercado interno e para resolver divergecircncias sobre regras de reutilizaccedilatildeo entre Estados Membros

De forma a promover a abertura dos seus proacuteprios dados em Junho de 2013 a EU adotou os princiacutepios do G8 Open Data Charter comprometendo-se a

Identificar e tornar disponiacuteveis os datasets fundamentais ao niacutevel da EU Identificar e tornar disponiacuteveis os datasets de alto valor ao niacutevel da EU Publicar os dados no EU Open Data Portal

63A INSPIRE Directive eacute a Diretiva 20072EC do Parlamento Europeu e do Conselho de 14 Marccedilo 2007 que veio estabelecer uma Infraestrutura para a informaccedilatildeo espacial na Comunidade Europeia Disponiacutevel na WWW httpinspireeceuropaeuinspire-legislation26

76

Aplicar os princiacutepios do G8 Open Data Charter em todos os 28 estados-membros atraveacutes da revisatildeo da Diretiva sobre a PSI e de guias de orientaccedilatildeo

Apoiar atividades consultadoria e a participaccedilatildeo Partilhar experiecircncias na aacuterea dos Dados Abertos (Comissatildeo Europeia 2013)

Em 2016 entrou em vigor o novo Regulamento Geral sobre a Proteccedilatildeo de Dados que eacute relativo ao tratamento de dados pessoais e agrave livre circulaccedilatildeo dos mesmos O regulamente veio implementar o direito de pedido de esquecimento por parte do cidadatildeo a portabilidade de dados que permite migrar dados pessoais entre sistemas ou empresas multas para os incumpridores entre outras novidades A implementaccedilatildeo do regulamento seraacute obrigatoacuteria ateacute maio de 2018 sendo as legislaccedilotildees nacionais substituiacutedas por uma regulamentaccedilatildeo europeia (EUR-Lex 2016)

A EU criou em 2012 um portal para alojar dados puacuteblicos e de investigaccedilatildeo que provecircm de organizaccedilotildees europeias ou de projetos financiados pela EU O European Union Data Portal aloja dados afetos a vinte categorias contendo 10746 datasets em Maio de 2017 com o Eurostat a assumir a lideranccedila destacada em termos de nuacutemero de datasets Os dados satildeo classificados em domiacutenios com o recurso a metadados controlados provenientes de vocabulaacuterios controlados como o EuroVoc64 com a ciecircncia (1906) emprego e condiccedilotildees de trabalho (1795) questotildees sociais (1599) a destacarem-se como os domiacutenios com mais datasets publicados Em termos de formatos de dados os primeiros trecircs lugares satildeo ocupados pelos formatos ZIP (8072) HTML (7024) e texttab-separated-values (6762) O primeiro formato estruturado o XML aparece apenas em quinto lugar com 595 ficheiros seguido do primeiro formato aberto o CSV com apenas 360 (Uniatildeo Europeia 2017) Eacute importante tecer duas consideraccedilotildees sobre os formatos dos datasets disponibilizados O formato ZIP eacute um formato de compressatildeo de documentos e natildeo um formato de documento em si portanto estes 8072 ficheiros deveratildeo ser distribuiacutedos por outros tipos de formatos Em segundo lugar verifica-se uma fraca percentagem de dados a utilizarem formatos estruturados eou abertos que permitam a ligaccedilatildeo com outros dados Este portal apresenta 2663 datasets com ligaccedilatildeo a Portugal em grande parte das categorias de Ciecircncia e do Ambiente (Uniatildeo Europeia 2017)

O Public Sector Information Scoreboard eacute uma ferramenta ldquocrowd sourcedrdquo utilizada para medir o estado da abertura de dados e da PSI da EU Este painel de avaliaccedilatildeo atraveacutes do uso de 27 indicadores mede sete aspetos da reutilizaccedilatildeo da informaccedilatildeo puacuteblica implementaccedilatildeo da Diretiva europeia referente agrave PSI praacuteticas de reuacuteso preccedilo formatos acordos exclusivos informaccedilatildeo puacuteblica local e por fim eventos e atividades (ePSI Scoreboard 2013)

64 O EuroVoc eacute um vocabulaacuterio controlado multilingue e pluridisciplinar sobre as atividades da EU Disponiacutevel na WWW httpeurovoceuropaeudrupalq=pt

77

O Open Data Monitor um projeto financiado pela Comissatildeo Europeia que decorreu entre 2013 e 2015 teve por objetivo a extraccedilatildeo harmonizaccedilatildeo mediccedilatildeo e monitorizaccedilatildeo anaacutelise e visualizaccedilatildeo automaacutetica de metadados dos datasets disponibilizados nos cataacutelogos a niacutevel regional nacional e europeu (Sasse et al 2017) Os datasets ldquoharvested from portals across Europerdquo (Sasse et al 201759) satildeo estudados atraveacutes de meacutetricas quantitativas e qualitativas (Open Data Monitor 2015) A sua plataforma permite que os utilizadores tenham uma visatildeo dos conjuntos de dados e dos 173 cataacutelogos de dados identificados apresentando os resultados em termos do nuacutemero de datasets existentes tamanho de armazenamento a sua disponibilidade a posse de uma licenccedila aberta o uso por maacutequina e por fim a exaustividade dos metadados (Open Data Monitor 2015)

O European Data Portal uma plataforma criada em 2015 pela EU tem por objetivo melhorar a acessibilidade e aumentar o valor dos Dados Abertos abrangendo toda a cadeia de valor desde a publicaccedilatildeo de dados ateacute agrave sua reutilizaccedilatildeo Para isso coleta metadados da PSI disponiacutevel em portais de dados nos paiacuteses europeus incluindo a informaccedilatildeo sobre a disponibilizaccedilatildeo de dados e os benefiacutecios de reutilizaccedilatildeo fornecendo ainda aacutereas dedicadas agrave pesquisa de datasets disponibilizaccedilatildeo de dados uso de dados treino e biblioteca de dados (Carrara et al 2016a Carrara Nieuwenhuis amp Vollers 2016 Sasse et al 2017) O European Data Portal criou o Open Data Maturity para avaliar o desenvolvimento de poliacuteticas nacionais e portais na Europa usando a informaccedilatildeo coletada para elaborar um iacutendice de maturidade das poliacuteticas de Open Data baseado na preparaccedilatildeo poliacutetica e na maturidade do portal de dados (Carrara Nieuwenhuis amp Vollers 2016) Em termos de preparaccedilatildeo poliacutetica eacute avaliada a presenccedila de uma poliacutetica de Dados Abertos especiacutefica normas de licenciamento extensatildeo da coordenaccedilatildeo a niacutevel nacional uso de dados e impacto poliacutetico social e econoacutemico A maturidade dos portais eacute avaliada de acordo com a sua usabilidade a reutilizaccedilatildeo dos dados alojados no portal e inclusatildeo de dados de diferentes domiacutenios Segundo a informaccedilatildeo apurada no relatoacuterio a maioria dos paiacuteses europeus ainda natildeo atingiram a maturidade por completo Em 2016 houve um aumento do nuacutemero de paiacuteses que completaram a sua demanda na abertura de dados sendo agora de 566 entre os 31 avaliados O nuacutemero de paiacuteses com uma poliacutetica de Dados Abertos estabelecida passou de 23 para 28 O uso de dados chegou em 2016 aos 493 e o impacto da abertura de dados aos 463 sendo que a maturidade dos portais estabeleceu-se nos 643 Contudo os paiacuteses necessitam de elevar o reconhecimento poliacutetico sobre os Dados Abertos aumentar os processos automatizados nos seus portais para aumentar a usabilidade e reutilizaccedilatildeo dos dados e tambeacutem organizar mais eventos e treinos para apoiar as iniciativas nacionais e locais (Carrara Nieuwenhuis amp Vollers 2016) O relatoacuterio conclui que os paiacuteses europeus estatildeo a enfrentar barreiras legais financeiras de qualidade de dados e de poliacuteticas sublinhando que os poliacuteticos natildeo conhecem os benefiacutecios da abertura de dados e que por isso os Dados Abertos natildeo satildeo estabelecidos como uma prioridade poliacutetica Satildeo

78

deixadas ainda algumas recomendaccedilotildees para ajudar os paiacuteses a avanccedilar no processo de abertura de dados implementar uma estrateacutegia de Dados Abertos que estimula a criaccedilatildeo de uma poliacutetica adicionar funcionalidades ao portal e melhorar a qualidade dos dados aumentar o reconhecimento sobre os Dados Abertos monitorizar as atividades relacionadas com o Open Data (Carrara Nieuwenhuis amp Vollers 2016)

22 O caso portuguecircs

O primeiro sinal de abertura cientiacutefica eacute dado pelo artigo 50ordm do Decreto-Lei nordm 1152013 de 7 de agosto veio regulamentar a obrigatoriedade da inclusatildeo de trabalhos acadeacutemicos no RCAAP sendo posteriormente reforccedilado com a entrada em vigor da Portaria nordm 2852015 de 15 de setembro que aprova o Regulamento Teacutecnico de Depoacutesito de Teses e Trabalhos de Doutoramento e de Dissertaccedilotildees e Trabalhos de Mestrado Os Dados Abertos entram finalmente na poliacutetica cientiacutefica portuguesa em 2014 A FCT definiu e adotou uma poliacutetica que visa encorajar e promover a disponibilizaccedilatildeo em ldquobases de dados de AA apropriadasrdquo dos dados cientiacuteficos e outros materiais de investigaccedilatildeo criados em projetos financiados pela instituiccedilatildeo (Fundaccedilatildeo para a Ciecircncia e Tecnologia [FCT] 2014) Contudo a poliacutetica da FCT ldquonatildeo estaacute alinhada com os requisitos relativamente aos dados de investigaccedilatildeo do H2020rdquo (Comissatildeo Executiva GT-PNCA 2016)

Os princiacutepios orientadores para uma poliacutetica nacional de Ciecircncia Aberta definidos em fevereiro de 2016 pelo Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior delinearam algumas metas a curto-prazo sendo que na componente dos Dados Abertos apenas se regista a sensibilizaccedilatildeo para a importacircncia da partilha de dados ldquocomo um valor essencial agrave ciecircncia especialmente no que respeita agrave investigaccedilatildeo beneficiaacuteria de financiamento puacuteblicordquo (Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior [MCTES] 20163) Foram tambeacutem definidas metas a atingir ateacute 2018 dentro das quais se destacam as que se referem a dados de investigaccedilatildeo

ldquoCumprimento a 100 da publicaccedilatildeo de dados resultantes de projetos com financiamento puacuteblico num repositoacuterio em acesso abertordquo

Incluir ldquoa verificaccedilatildeo contiacutenua da publicaccedilatildeo de dados e de resultados da investigaccedilatildeo financiada com fundos puacuteblicosrdquo nos modelos de avaliaccedilatildeo da CA

Eliminar o ldquoduplo financiamento de publicaccedilotildeesdados em acesso abertordquo para racionalizar os custos puacuteblicos com ciecircncia

ldquoOferta regular de accedilotildees de formaccedilatildeo e esclarecimento em mateacuteria de publicaccedilatildeo de dados e resultados de investigaccedilatildeo em acesso aberto propriedade intelectual e proteccedilatildeo de dadosrdquo (Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior [MCTES] 2016 20164)

79

O acesso aos dados de investigaccedilatildeo eacute finalmente incluiacutedo na poliacutetica cientiacutefica atraveacutes da Resoluccedilatildeo do Conselho de Ministros nordm 212016 de 11 de abril No acircmbito da definiccedilatildeo de uma poliacutetica de Ciecircncia Aberta eacute incluiacuteda a obrigatoriedade do AA aos ldquodados cientiacuteficos resultantes de investigaccedilatildeo financiada por fundos puacuteblicosrdquo e sua respetiva preservaccedilatildeo ldquopor forma a permitir a sua reutilizaccedilatildeo e o acesso continuadordquo (Resoluccedilatildeo do Conselho de Ministros nordm 212016 2016)

Em dezembro de 2016 foi criado o Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta (GT-PNCA) atraveacutes do Despacho nordm 153892016 cujo objetivo se centra na elaboraccedilatildeo de uma poliacutetica nacional de CA e onde a abertura de dados de investigaccedilatildeo eacute parte integrante A Comissatildeo Executiva do GT-PNCA foi dividida em quatro conjuntos de temas acesso aberto e dados abertos infraestruturas e preservaccedilatildeo digital avaliaccedilatildeo cientiacutefica e responsabilidade social cientiacutefica (Despacho nordm 153892016 de 12 de dezembro do Ministeacuterio das Financcedilas e da Secretaria de Estado da Cultura e Ciecircncia Tecnologia e Ensino Superior 2016)

A abertura de dados cientiacuteficos estaacute ainda numa fase precoce O primeiro relatoacuterio da Comissatildeo Executiva do Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta constatou que em termos de gestatildeo e partilha de dados existem algumas iniciativas e experiecircncias de ldquoacircmbito disciplinar nomeadamente no contexto de projetosrdquo sendo expectaacutevel que o Roteiro Nacional de Infraestruturas de Investigaccedilatildeo de Interesse Estrateacutegico traga ldquoprogressos significativosrdquo (Comissatildeo Executiva GT-PNCA 20167) O mesmo relatoacuterio sublinha que ao niacutevel das instituiccedilotildees de investigaccedilatildeo e de ensino superior as iniciativas de partilha e gestatildeo de dados satildeo quase inexistentes

Em termos de dados de investigaccedilatildeo o ecossistema eacute bem mais concentrado a niacutevel disciplinar e inferior em nuacutemero de e-infraestruturas se comparado com o ecossistema de dados do setor puacuteblico Integrado no projeto RCAAP que visa a agregaccedilatildeo de conteuacutedos cientiacuteficos produzidos no paiacutes surge em 2011 o Serviccedilo de Alojamento de Repositoacuterios de Dados Cientiacuteficos65 (SARDC) uma plataforma de livre acesso que visa agregar os dados de investigaccedilatildeo de instituiccedilotildees nacionais Poreacutem com jaacute cerca de seis anos de existecircncia o SARDC apresenta apenas 2007 datasets em Maio de 2017 que correspondem a 42 categorias de assunto Os conjuntos disponibilizados satildeo provenientes de apenas duas instituiccedilotildees o Arquivo Portuguecircs de Informaccedilatildeo Social (APIS) com 37 e o Instituto Politeacutecnico de Castelo Branco (IPCB) com 1970 conjuntos de dados sendo que o SARDC apenas aloja os dados do APIS Embora exista um espaccedilo atribuiacutedo a mais duas instituiccedilotildees o Laboratoacuterio Nacional de Engenharia Civil e Universidade Catoacutelica Portuguesa nenhuma das entidades publicou ateacute agora dados atraveacutes desta plataforma O portal nacional de dados cientiacuteficos eacute extremamente limitado em termos de funcionalidades permitindo apenas a buscar

65 Disponiacutevel na WWW httpsdadosrcaappt

80

por autor data titulo assunto e tipo de documento Natildeo eacute possiacutevel perceber a legalidade da reutilizaccedilatildeo de dados pois natildeo eacute referido qualquer tipo de licenciamento A qualidade dos dados apresentados pelo SARDC eacute uma incoacutegnita pela falta de indicaccedilatildeo do uso de formatos abertos e estruturados e tambeacutem de um esquema padratildeo de metadados Aleacutem do SARDC os repositoacuterios de dados cientiacuteficos existentes em Portugal satildeo em grande parte do domiacutenio das Ciecircncias da Vida como se poderaacute constatar no Quadro 5 com exceccedilatildeo do Repositoacuterio Cientiacutefico do Instituto Politeacutecnico de Castelo Branco que tem um caraacutecter geral Depois da criaccedilatildeo do repositoacuterio de dados cientiacuteficos e da colocaccedilatildeo em massa de conjuntos de dados verifica-se que o depoacutesito de datasets decresceu de forma extrema

Graacutefico 1 Nuacutemero de datasets publicados no SARDC nos anos seguintes agrave sua criaccedilatildeo Fonte Adaptado de SARDC (2017)

A tendecircncia de abertura de dados cientiacuteficos parece estar ligada agrave cultura disciplinar Algumas disciplinas provenientes das ciecircncias naturais e das ciecircncias exatas possuem jaacute uma estrutura uniformizada de bases de dados onde a partilha e reutilizaccedilatildeo de datasets se encontra mais avanccedilada do que se verifica nas restantes disciplinas cientiacuteficas O Registry of Research Data Repositories (re3data) indexa apenas 2 repositoacuterios de dados cientiacuteficos portugueses o INTEGRALL66 e o KiMoSys67 sendo que ambos pertencem ao ramo da biologia (DataCite 2017a) O Biosharingorg (2017) indexou cinco bases de dados cientiacuteficas com origem em Portugal havendo participaccedilatildeo portuguesa em outras duas bases de dados internacionais Estas pertencem todas ao domiacutenio das Ciecircncias da Vida e da Biologia com exceccedilatildeo de uma conotada com as Ciecircncias da Terra O DataCite68 (2017b) criou um Digital Object Identifier (DOI) para 18632 datasets relacionados com o termo Portugal sendo a grande maioria de autores portugueses e provenientes da Global Biodiversity Information Facility (GBIF) tambeacutem da aacuterea da biologia A GBIF possui um noacute

66 Disponiacutevel na WWW httpintegrallbiouapt 67 Disponiacutevel na WWW httpwwwkimosysorg 68 Os dados obtidos relativamente ao DataCite Pangea e GitHub foram obtidos atraveacutes da inscriccedilatildeo do termo Portugal na caixa de pesquisa de cada repositoacuterio

13

3 1

2 1

2012 2013 2014 2015 2016 0 2 4 6 8

10 12 14

Nordm datasets

81

portuguecircs que aloja 2681051 ocorrecircncias de biodiversidade com Portugal a fornecer de 23 conjuntos de dados que correspondem a 448136 ocorrecircncias (Portal de Dados de Biodiversidade de Portugal 2016) Destaca-se ainda os 2772 datasets sobre Portugal muitos criados por autores portugueses alojados no Pangea (2017) que preserva dados relacionados com as ciecircncias da terra e do ambiente ou o GitHub (2017) que armazena 1324 registos sobre software relacionados com o termo Portugal

Portugal tem um consoacutercio denominado ELIXIR Portugal69 que eacute constituiacutedo por quatro70 instituiccedilotildees de investigaccedilatildeo que satildeo parte da rede nacional de informaccedilatildeo bioloacutegica - BioDatapt71 O ELIXIR Portugal (2015) ldquoaims to provide data tools standards and training in this domain and thus contribute to build an ELIXIR framework that is of added-value to all woody plant based industriesrdquo O BioDatapt fornece acesso a duas bases de dados disciplinares uma ontologia para descrever experiecircncias bioloacutegicas baseadas em plantas 4 softwares e 5 conjuntos de dados

O interesse na abertura de dados de investigaccedilatildeo tem crescido no discurso poliacutetico e cientiacutefico verificando-se jaacute a organizaccedilatildeo de uma conferecircncia de dados de investigaccedilatildeo e CA72 em 2016 e de dois foacuteruns de gestatildeo de dados de investigaccedilatildeo73 o uacuteltimo jaacute em 2017 Estes eventos tecircm a chancela direta do MCTES em coorganizaccedilatildeo com a FCT a Universidade do Minho e FCCN embora esta uacuteltima apenas no caso da conferecircncia Foi lanccedilado na Faculdade de Engenharia da Universidade do Porto o projeto TAIL com o objetivo de otimizar o processo de gestatildeo de dados de investigaccedilatildeo desde a sua produccedilatildeo ateacute ao depoacutesito e partilha Este projeto a decorrer de 2016 ateacute 2019 ldquovai construir um portfoacutelio de exemplos de gestatildeo de dados em diversos domiacutenios que poderatildeo ser usados pelos investigadores para avaliar o esforccedilo requerido e as compensaccedilotildees a obter com esta atividaderdquo (Ribeiro et al 2016256-257) Os resultados seratildeo avaliados atraveacutes da utilizaccedilatildeo da plataforma Dendro ldquodesigned to help researchers use concepts from domain-specific ontologies to collaboratively describe and share datasets within their groupsrdquo (Universidade do Porto Faculdade de Engenharia 2017)

69 Este consoacutercio eacute o noacute portuguecircs de uma organizaccedilatildeo intergovernamental denominada ELIXIR que pretende reunir os recursos europeus relacionados com as ciecircncias da vida Os recursos incluem bases de dados software material de treino armazenamento na nuvem e supercomputadores Disponiacutevel na WWW httpswwwelixir-europeorgabout-us 70 As organizaccedilotildees envolvidas no BioDatapt satildeo Instituto Gulbenkian de Ciecircncia Universidade do Minho Instituto de Biologia Experimental e Tecnoloacutegica e o Instituto de Biotecnologia e Bioengenharia 71 O BioDatapt faz parte do Roteiro das Infraestruturas de Investigaccedilatildeo de Portugal Disponiacutevel na WWW httpswwwfctptapoiosequipamentoroteiro 72 A conferecircncia ldquoDados de investigaccedilatildeo e Ciecircncia Aberta rumo a uma estrateacutegia nacionalrdquo apresentou-se com o objetivo de ldquoestabelecer as linhas orientadoras da estrateacutegia nacional para os dados de investigaccedilatildeordquo Disponiacutevel na WWW httpsconfdadosrcaappt 73 O objetivo dos foacuteruns sobre gestatildeo de dados de investigaccedilatildeo eacute de desenvolver competecircncias teacutecnicas e capitalizar saberes e praacuteticas nos investigadores e comunidade cientiacutefica Disponiacutevel na WWW httpforumgdircaappt2forum

82

O RCAAP publicou em Abril de 2017 um documento de apoio agrave abertura e gestatildeo de dados de investigaccedilatildeo O ldquoKit de Dados de Investigaccedilatildeordquo tem por objetivo prestar apoio e informaccedilatildeo aos ldquogestores de repositoacuterios da comunidade RCAAPrdquo e fornecer ajuda semelhante a ldquoinvestigadores gestores de ciecircncia e outros parceiros envolvidos em atividades de suporte agrave gestatildeo de dados de investigaccedilatildeordquo (Carvalho Furtado Priacutencipe 20175) Este documento seraacute a base da formaccedilatildeo que o RCAAP iraacute disponibilizar fornecendo uma contextualizaccedilatildeo sobre Dados Abertos Big Data preservaccedilatildeo digital e informaccedilatildeo sobre ciclos de gestatildeo de dados planos de gestatildeo de dados direitos de autor licenciamento e privacidade de dados poliacuteticas e diretrizes de abertura de dados de investigaccedilatildeo recursos de apoio e aplicaccedilatildeo nos recursos RCAAP

Os dados do setor puacuteblico tecircm uma contextualizaccedilatildeo legislativa diferenciada daquela que eacute aplicada aos dados de investigaccedilatildeo O direito ao acesso agrave informaccedilatildeo puacuteblica em Portugal foi estabelecido pelo artigo 268ordm da Constituiccedilatildeo de 1976 Poreacutem apenas em 1993 o estado portuguecircs legislou no sentido da abertura dos documentos administrativos com a publicaccedilatildeo da Lei nordm 6593 de 26 de Agosto a Lei do Acesso aos Documentos Administrativos (LADA) posteriormente alterada pelas leis nordm 895 de 29 de Marccedilo e 9499 de 16 de Julho

A evoluccedilatildeo da conjuntura de acesso aos documentos administrativos eacute derivada da imposiccedilatildeo das Diretivas Europeias a que Portugal como membro da EU estaacute obrigado A Lei 462007 de 24 de Agosto viraacute revogar da Lei nordm 6593 e as suas alteraccedilotildees ldquotranspondo para a ordem juriacutedica nacional a Diretiva nordm 200398CE do Parlamento e do Conselho de 17 de Novembro relativa agrave reutilizaccedilatildeo de informaccedilotildees do sector puacuteblicordquo O artigo 24ordm postula a obrigaccedilatildeo das entidades puacuteblicas em publicar documentos administrativos de forma eletroacutenica para que possam ser acedidos e reutilizados O artigo 27ordm nordm 1 vem criar a Comissatildeo de Aceso aos Documentos Administrativos (CADA) ldquouma entidade administrativa independente que funciona junto da Assembleia da Repuacuteblica e tem como fim zelar nos termos da Lei pelo cumprimento das disposiccedilotildees legais referentes ao acesso agrave informaccedilatildeo administrativardquo (Comissatildeo de Acesso aos Documentos Administrativos [CADA])

A Resoluccedilatildeo do Conselho de Ministros nordm 912010 (20105296) veio implementar a Agenda Digital 2015 O ponto 23 da Resoluccedilatildeo no acircmbito da transparecircncia na administraccedilatildeo puacuteblica tinha como objetivo ldquodesenvolver um programa de administraccedilatildeo aberta para a publicaccedilatildeo e agregaccedilatildeo em formatos reutilizaacuteveis da informaccedilatildeo produzida pela Administraccedilatildeo Puacuteblicardquo Eacute neste sentido que eacute proposta a criaccedilatildeo do siacutetio web dadosgovpt ldquopara publicar e agregar a informaccedilatildeo produzida pela Administraccedilatildeo Puacuteblica em formatos que possam ser lidos e reutilizados por qualquer cidadatildeordquo Esta medida teve o intuito de ldquofacilitar o acesso dos cidadatildeos e empresas agrave informaccedilatildeo relevante sobre os serviccedilos puacuteblicos com o desenvolvimento de novas aplicaccedilotildees com valor acrescentadordquo A Lei nordm 362011 de 21 de Junho veio

83

estabelecer a implementaccedilatildeo de normas abertas nos sistemas informaacuteticos do Estado contribuindo assim para a adoccedilatildeo de formatos de dados abertos

Em 2016 a Lei nordm 262016 de 22 de Agosto revogou a Lei 462007 de 24 de Agosto aprovando ldquoo regime de acesso agrave informaccedilatildeo administrativa e ambiental e de reutilizaccedilatildeo dos documentos administrativos transpondo a Diretiva 20034CE do Parlamento Europeu e do Conselho de 28 de janeiro e a Diretiva 200398CE do Parlamento Europeu e do Conselho de 17 de novembrordquo O artigo 3ordm mandata a abertura dos dados ambientais agrave comunidade incluindo-os na definiccedilatildeo de documento administrativo devendo a sua publicaccedilatildeo ser feita num formato aberto e legiacutevel por maacutequina O artigo 10ordm sobre a divulgaccedilatildeo ativa de informaccedilatildeo prevecirc que sejam publicados ldquoos documentos administrativos dados ou listas que os inventariem que entendam disponibilizar livremente para acesso e reutilizaccedilatildeo nos termos da presente lei sem prejuiacutezo do regime legal de proteccedilatildeo de dados pessoaisrdquo Tambeacutem deve ser garantida a abertura da informaccedilatildeo cujo ldquoconhecimento seja relevante para garantir a transparecircncia da atividade relacionada com o seu funcionamentordquo sobretudo ao niacutevel de planos de atividades orccedilamentos relatoacuterios de atividades e contas balanccedilo social e outros instrumentos de gestatildeo similaresrdquo e tambeacutem de despachos normativos internos circulares e orientaccedilotildees que comportem enquadramento estrateacutegico da atividade administrativardquo (Lei nordm 262016 de 22 de Agosto 20162780) O artigo 23ordm apenas prevecirc a reutilizaccedilatildeo dos dados para fins educativos e para fins de investigaccedilatildeo e desenvolvimento deixando de lado a reutilizaccedilatildeo comercial Contudo o dadosgov atribuiu aos dados que aloja a licenccedila CC BY 30 o que natildeo impede a reutilizaccedilatildeo comercial dos dados Eacute tambeacutem impossiacutevel natildeo questionar a razatildeo de natildeo ter sido transposta a nova Diretiva 201337EU que veio revogar precisamente a Diretiva que a Lei nordm 262016 de 22 de Agosto implementa

A AMA (2016) defende que as poliacuteticas de Dados Abertos devem ldquoprivilegiar o interesse e pertinecircncia dos dados para o cidadatildeo em geral ou para setores da sociedade especiacuteficosrdquo Ao niacutevel local apenas Lisboa e Porto parecem ter definido uma poliacutetica de abertura de dados A Carta de Princiacutepios da Politica de Dados Abertos do Municiacutepio de Lisboa tem por objetivo aumentar o envolvimento dos cidadatildeos aumentar a transparecircncia e o desenvolvimento econoacutemico aleacutem da melhoria da eficiecircncia dos serviccedilos A Cacircmara Municipal de Lisboa (CML) (2016) compromete-se a atualizar ldquoanualmente a poliacutetica de disponibilizaccedilatildeo puacuteblica de dados abertos indicando quais os dados a libertar ao longo do ano e em que formatordquo A poliacutetica abrangeraacute todas as unidades orgacircnicas do municiacutepio que produzam dados sendo que a CML incentivaraacute as Juntas de Freguesia e as empresas municipais a publicarem os seus dados A publicaccedilatildeo de todos os dados eacute feita no portal do municiacutepio como ponto de acesso uacutenico estando disponiacuteveis sem qualquer pedido de registo A carta de princiacutepios sublinha que os dados devem ser atualizados legiacuteveis por maacutequina deter uma licenccedila aberta que permita a reutilizaccedilatildeo comercial e ainda respeitar as leis de

84

privacidade e seguranccedila A CML compromete-se a publicar inventaacuterios das coleccedilotildees de dados e a promover a reutilizaccedilatildeo de dados atraveacutes de iniciativas de estiacutemulo ao desenvolvimento de aplicaccedilotildees e participaccedilatildeo puacuteblica (Lisboa Cacircmara Municipal [CML] 2016)

A poliacutetica de Dados Abertos no Porto eacute enquadrada na Agenda Digital para a Europa tendo como visatildeo a ldquodisponibilizaccedilatildeo e uso de dados e informaccedilatildeo do Municiacutepio do Porto contribuindo deste modo para a competitividade do Municiacutepio do Porto e da regiatildeo para visitar para residir captar e realizar negoacutecios no mercado nacional e internacionalrdquo (Porto Cacircmara Municipal)

Utilizando a estrutura de avaliaccedilatildeo de poliacuteticas de Dados Abertos de Zuiderwijk e Janssen (2014) foi elaborado um quadro para avaliar o estado da implementaccedilatildeo da poliacutetica de Dados Abertos em Portugal e o seu impacto Os dados foram recolhidos com base na Lei nordm 262016 de 22 de Agosto na informaccedilatildeo disponiacutevel no portal de dados nacional atraveacutes de um gestor de projeto da AMA Andreacute Lapa e tambeacutem em alguma literatura

85

Quadro 3 Visatildeo geral sobre o contexto conteuacutedo e desempenho da poliacutetica de Dados Abertos em Portugal com base no esquema delineado por Zuiderwijk e Janssen (2014) Aspetos da poliacutetica de Dados Abertos Acircmbito de aplicaccedilatildeo

Conteuacutedo e ambiente da

poliacutetica

Paiacutes Portugal

Niacutevel de organizaccedilatildeo e tipo de missatildeo Poliacutetica nacional de cariz regulamentar que eacute aplicada a entidades governamentais e puacuteblicas (art 4ordm)

Motivaccedilotildees e objetivos Econoacutemica e poliacutetica via EU Facilitar o acesso e reutilizaccedilatildeo da informaccedilatildeo por parte dos cidadatildeos e garantir a transparecircncia da atividade administrativa (art 2ordm)

Lanccedilamento da plataforma de dados Lanccedilamento do portal nacional em 2011

Alocaccedilatildeo de recursos e contexto econoacutemico

Abertura alicerccedilada em duas instituiccedilotildees puacuteblicas a CADA responsaacutevel pelo cumprimento da lei e a AMA que fornece a e-infraestrutura e apoio teacutecnico Os custos de abertura de informaccedilatildeo do setor puacuteblico satildeo financiados pelo Plano Global Estrateacutegico para a racionalizaccedilatildeo de custos com as TIC na Administraccedilatildeo Puacuteblica (OECD 2015)

Legislaccedilatildeo Lei nordm 262016 de 22 de Agosto que transpotildee a Diretiva 200398CE

Contexto poliacutetico e social Cumprimento da Diretiva europeia Disponibilizaccedilatildeo de informaccedilatildeo uacutetil para o cidadatildeo

Aspetos da poliacutetica de Dados Abertos Acircmbito de aplicaccedilatildeo

Conteuacutedo da poliacutetica

Estrateacutegia e princiacutepios de abertura

Cumprimento do princiacutepio da administraccedilatildeo aberta que advoga que o acesso aos dados deve ser feito mediantes princiacutepios de igualdade da proporcionalidade da justiccedila da imparcialidade O acesso deve ser livre e universal bem como a acessibilidade a interoperabilidade a qualidade a integridade e a autenticidade dos dados publicados e ainda a sua identificaccedilatildeo e localizaccedilatildeo (art 2ordm) A publicaccedilatildeo de dados deve ser feita num formato aberto e legiacutevel por maacutequina (art 3ordm)

Medidas e instrumentos poliacuteticos Portal nacional Natildeo satildeo conhecidas meacutetricas de avaliaccedilatildeo nem multas ou recompensas

Processamento de dados antes da publicaccedilatildeo Validaccedilatildeo da integridade das tabelas Natildeo existe verificaccedilatildeo de metadados (Lapa 2017)

Quantidade de dados Abertos 802 Conjuntos de dados no portal nacional Mas a contabilidade eacute bastante mais elevada com a adiccedilatildeo dos dados alojados em outros portais puacuteblicos e privados

Temaacutetica dos Dados Abertos Diversa mas com maior incidecircncia na Economia e Financcedilas

Formas de apresentaccedilatildeo de dados Faacutecil acesso e compreensatildeo

Preccedilo do acesso Gratuito

Grupos-alvo Developers programadores jornalistas de dados investigadores acadeacutemicos administraccedilatildeo puacuteblica (central ou local) empresas e sociedade civil (Lapa 2017)

Padrotildees e formatos teacutecnicos Todos os dados no dadosgov estatildeo disponiacuteveis em pdf csv xlsx e atraveacutes de serviccedilos REST (que inclui formatos como odata JSON ou KML e RDF se aplicaacutevel) (Lapa 2017)

86

Aspetos da poliacutetica de Dados Abertos Acircmbito de aplicaccedilatildeo

Conteuacutedo da poliacutetica (cont)

Fornecimento de metadados Natildeo existe um esquema padratildeo de metadados a ser utilizado sendo que estes tambeacutem natildeo satildeo verificados antes da publicaccedilatildeo dos dados (Lapa 2017)

Tipos de dados natildeo publicados Desconhecido

Apoio teacutecnico para o uso de dados publicados Sim fornecido pela AMA mediante pedido

Promoccedilatildeo ativa da reutilizaccedilatildeo de dados A uacuteltima grande atividade de promoccedilatildeo de reutilizaccedilatildeo Government as a Developer ocorreu em 2014-2015 natildeo se conhecendo para novas atividades previstas (Lapa 2017)

Qualidade dos Dados A uacuteltima mediccedilatildeo data de 2014 onde foram encontrados alguns problemas que natildeo foram totalmente resolvidos junto dos fornecedores (Lapa 2017)

Licenciamento Eacute aplicada a licenccedila CC BY 30 a todos os datasets

Disponibilidade dos dados sem registo Todos os dados no dadosgov estatildeo disponiacuteveis para download sem necessidade de pedido ou registo

Estrutura da relaccedilatildeo entre fornecedores de dados e os utilizadores Limitada

Aspetos da poliacutetica de Dados Abertos Acircmbito de aplicaccedilatildeo

Indicadores de

desempenho

Uso de dados publicados Existem 2 aplicaccedilotildees elaboradas a partir de Dados Abertos disponibilizados pela AMA e Direcccedilatildeo-Geral das Autarquias Locais

Riscos da publicaccedilatildeo de dados Privacidade seguranccedila maacute utilizaccedilatildeo (ainda sem casos reportados) (Lapa 2017)

Benefiacutecios da publicaccedilatildeo de dados Fraco impacto poliacutetico econoacutemico e social segundo o Open Data Barometer O estudo de Gomes e Soares (2014) conclui que a transparecircncia eacute o uacutenico benefiacutecio real

Valor puacuteblico alcanccedilado

Transparecircncia governativa e disponibilidade de dados Faltam indicadores de reutilizaccedilatildeo e estudos de impacto para uma avaliaccedilatildeo concreta do valor alcanccedilado

Fonte Elaboraccedilatildeo proacutepria

87

Em adiccedilatildeo agraves poliacuteticas de abertura de dados puacuteblicos um dos componentes principais do ecossistema de Dados Abertos eacute o desenvolvimento de e-infraestruturas que possam alojar e permitir a livre reutilizaccedilatildeo de dados O PORDATA criado em 2010 foi o primeiro portal de dados abertos em Portugal disponibilizando dados estatiacutesticos sobre os municiacutepios portugueses sobre o paiacutes e sobre a Europa A niacutevel puacuteblico a abertura de dados em Portugal iniciou-se com a abertura do portal de dados puacuteblicos e do portal de dados de investigaccedilatildeo Criado em 2011 depois da sua aprovaccedilatildeo poliacutetica o dadosgov eacute uma responsabilidade da AMA (2016a31) e ldquoeacute o ponto central na estrateacutegia nacional de Dados Abertos constituindo-se como a porta central de acesso online ao repositoacuterio de dados abertos disponibilizados pelas vaacuterias instituiccedilotildeesrdquo puacuteblicas em Portugal Em termos estrateacutegicos o gestor de projeto Andreacute Lapa declara que a AMA jaacute assumiu a necessidade do estabelecimento de uma relaccedilatildeo forte entre portal central e portais sectoriais regionais e locais sendo que a funccedilatildeo do dadosgov deve passar por alojar dados e por apontar para dados existentes noutros portais embora esta uacuteltima ainda natildeo tenha sido implementada (A Lapa comunicaccedilatildeo pessoal 2017) Eacute possiacutevel retirar algumas conclusotildees estatiacutesticas sobre os dados disponibilizados no dadosgov Os 802 conjuntos de dados existentes pertencem a 26 fornecedores de dados diferenciados embora os dados sejam maioritariamente publicados por apenas alguns dos fornecedores com o Instituto Nacional de Estatiacutestica a fornecer metade dos dados disponibilizados como se pode ver no graacutefico seguinte

Graacutefico 2 Maiores fornecedores de dados do portal nacional Fonte AMA (2016b)

Relativamente agrave tipologia dos fornecedores de dados do portal nacional esta apresenta-se concentrada em dois tipos de entidade

328 51

129 20

86 13

38 6 34 5 33 5

Instituto Nacional de Estatiacutestica (INE) Agecircncia Modernizaccedilatildeo Administrativa (AMA) Portal do SNS (Aacuterea da Transparecircncia) Direcccedilatildeo-Geral das Autarquias Locais (DGAL) Fundaccedilatildeo para a Computaccedilatildeo Cientiacutefica Nacional (FCCN) Comissatildeo Nacional de Eleiccediloes (CNE)

88

Graacutefico 3 Tipologia dos fornecedores de dados do portal nacional Fonte AMA (2016b)

Em termos de categorias de dados disponibilizados verifica-se uma maior dispersatildeo embora a Economia e Financcedilas assumam 13 dos dados existentes

Graacutefico 4 Tipologia das categorias de dados do portal nacional Fonte AMA (2016b)

O ecossistema de abertura de dados tem aumentado dentro e fora do espectro poliacutetico Aleacutem do portal nacional de dados puacuteblicos um grande nuacutemero de organizaccedilotildees puacuteblicas tem criado os seus portais de dados eou tem publicado os mesmos no dadosgov Por outro lado existem vaacuterios portais de dados com origem na sociedade civil com o selo da Transparecircncia Hackday Portugal74 Organizar eventos eacute

74 Transparecircncia Hackday Portugal eacute um movimento que nasceu no Porto e rdquose define como um grupo de trabalho entusiasmado com informaccedilatildeo puacuteblica dados abertos e as interaccedilotildees possiacuteveis entre

468 59

21 3

300 38 Entidades puacuteblicas Corpos de supervisatildeo

Municipalidades

Entidades governamentais

281 36

102 13 86 11 67 9

60 8 58 7

51 6

34 4 24 3 12 2

10 1 2 0

2 0

Economia e Financcedilas

Governo Eleiccedilotildees e Assuntos Parlamentares Sauacutede

Estatiacutesticas Gerais

Educaccedilatildeo Ciecircncia e Tecnologia

Administraccedilatildeo Local

Outras

Emprego e Seguranccedila Social

Justiccedila e Tribunais

Ambiente Geografia e Ordenamento Transportes Infra-estruturas e Telecomunicaccedilotildees Agricultura e Pescas

Cultura

89

uma forma de promover o reconhecimento nacional sobre a abertura de dados entre organizaccedilotildees e cidadatildeos (Carrara Nieuwenhuis amp Vollers 2016) Em Portugal tecircm existido diversas iniciativas a este niacutevel hackathons como o Date with Data organizados pela Transparecircncia Hackday Portugal e com o apoio da Open Knowledge Portugal com o intuito de alertar informar e formar a comunidade para este novo paradigma na disponibilizaccedilatildeo da informaccedilatildeo A Open Knowledge Portugal organiza em Lisboa o Lisbon Open Data Maker Night75 tendo em 2017 decorrido a terceira ediccedilatildeo A Porto Digital estaacute a organizar um hackathon76 sobre utilizaccedilatildeo de dados abertos no desenvolvimento de novas aplicaccedilotildees que ocorreraacute em Julho de 2017

Verifica-se tambeacutem que as entidades governamentais estatildeo a apostar na criaccedilatildeo de linhas de orientaccedilatildeo para abertura e gestatildeo de dados puacuteblicos A AMA criou em 2016 um guia de Dados Abertos para apoiar a abertura dos dados puacuteblicos O guia centra-se em quatro eixos

Definiccedilatildeo de Dados Abertos e enunciaccedilatildeo dos seus benefiacutecios bem como as questotildees de privacidade

Potencial dos Dados Abertos a niacutevel econoacutemico e no aumento da transparecircncia e da participaccedilatildeo ciacutevica

Estrateacutegia de abertura que aborda o planeamento escolha de dados tipos de utilizadores dados prioritaacuterios disponibilizaccedilatildeo de dados estrateacutegias de divulgaccedilatildeo e manutenccedilatildeo de dados

Princiacutepios que possibilitem a reutilizaccedilatildeo de dados como os formatos e as licenccedilas abertas aleacutem da forma de as escolher e publicar a estrutura de dados e metadados (AMA 2016a traduccedilatildeo livre)

A AMA assume a publicaccedilatildeo de dados como um compromisso com o cidadatildeo devendo a publicaccedilatildeo ser orientada por princiacutepios que potenciem a reutilizaccedilatildeo dos dados A disponibilizaccedilatildeo de dados deve abranger conjuntos de dados constantes ou sem continuidade regular e conjuntos de dados em seacuterie ou seja com continuidade temporal A relevacircncia dos dados eacute justificada quando ldquotem potencial para ser explorado por um grande nuacutemero de utilizadores ou quando o benefiacutecio potencial da sua utilizaccedilatildeo eacute elevadordquo (AMA 2016a20)

As duas principais cidades portuguesas Lisboa e Porto tecircm abordagens distintas relativamente agraves suas estrateacutegias de abertura de dados Lisboa possui uma parceria com a AMA e disponibiliza no seu portal77 ldquodatasets sobre a cidade nas mais diversas aacutereas de modo a potenciar a sua utilizaccedilatildeo em trabalhos de investigaccedilatildeo ou no tecnologia e cidadaniardquo O Transparecircncia Hackday Portugal estaacute envolvido em vaacuterios projetos de abertura de dados entre os quais se destacam a Central de Dados e a Democratica Disponiacutevel na WWW httpwwwtransparenciahackdayorgacerca 75 Disponiacutevel na WWW httpflipsideorgnotesopen-data-maker-night-III 76 Disponiacutevel na WWW httpshackacityeuporto 77 Disponiacutevel na WWW httpdadosabertoscm-lisboapt

90

desenvolvimento de aplicaccedilotildees informaacuteticasrdquo (Soares Baptista e Lima 201517) Os dados disponibilizados no portal ldquosatildeo produzidos no acircmbito de sistemas de informaccedilatildeordquo que pertencem a diversos organismos registando-se jaacute diversas aplicaccedilotildees78 que utilizam esses dados para criar valor para o cidadatildeo e visitante de Lisboa na aacuterea do turismo ambiente urbanismo (Soares Baptista e Lima 201518) Lisboa implementou tambeacutem o programa Smart Open Lisboa que visa dar apoio a start ups na validaccedilatildeo de ldquosolutions using real data in a live environment and work directly with your potential customers or partnersrdquo O apoio eacute dirigido a soluccedilotildees na aacuterea da mobilidade envolvimento dos cidadatildeos turismo cultura e sustentabilidade (Lisboa Cacircmara Municipal 2016) A estrateacutegia do Porto passa pela promoccedilatildeo de conjuntos de Application Programming Interface (API)79 permitindo a disponibilizaccedilatildeo de alguns serviccedilos na web como a disponibilizaccedilatildeo de ldquoconteuacutedos dos Portal de Turismordquo ou do BDRT80 entre outros que indica pontos de interesse na cidade A abertura de dados eacute centrada na ldquodimensatildeo turismo e negligencia pelo menos aparentemente as restantesrdquo (Soares Baptista e Lima 201518) Esta conclusatildeo pode ser reforccedilada com a anaacutelise do portal de dados do Porto onde apenas constam cinco conjuntos de dados sendo estes pertencentes ao turismo ou relacionados numa perspetiva de visita ou mudanccedila como enuncia a estrateacutegia de abertura de dados publicada pelo municiacutepio

O Porto Lisboa Fundatildeo Palmela Penela e Aacutegueda estatildeo entre as cidades que integram o Open and Agile Smart Cities (OASC) (2017) uma iniciativa com o objetivo de desenvolver mercados para as cidades inteligentes baseados nas necessidades das cidades e das comunidades O Porto eacute destaque nesta iniciativa pela utilizaccedilatildeo da tecnologia FIWARE81 que ajuda a melhorar o uso de dados abertos e a partilha conhecimentos e tecnologias entre cidades A FIWARE (2015) sintetizou o impacto da abertura de dados em tempo real no Porto ldquoImagine walking or driving through a city and the city itself tells you which trendy spots to check out where to park your car in that moment or which areas to avoid because of air quality or traffic congestionrdquo Na realidade a cidade do Porto jaacute consegue comunicar com os residentes turistas ou empresas que utilizem ldquoFIWARE standards and the UrbanSense platform82rdquo

A publicaccedilatildeo de Dados Abertos e a respetiva mediccedilatildeo de impacto podem ser avaliadas atraveacutes das vaacuterias iniciativas que visam medir o estado de abertura de dados 78 As aplicaccedilotildees referidas satildeo SPOT in Lisbon Lisboa Verde Lisboa NAV e Lisboa 360 79 De acordo com a Wikipeacutedia uma API eacute um conjunto de definiccedilotildees protocolos e ferramentas para construir aplicaccedilotildees de software Disponiacutevel em httpsenwikipediaorgwikiApplication_programming_interface 80 Disponiacutevel na WWW httpbdrtcm-portoptpt 81 A missatildeo da FIWARE eacute construir um ldquosustainable ecosystem around public royalty-free and implementation-driven software platform standards that will ease the development of new Smart Applications in multiple sectorsrdquo Disponiacutevel na WWW httpswwwfiwareorgabout-us 82 A plataforma Urbansense estaacute integrada no projeto futurecitiesup da Universidade do Porto sendo uma plataforma para a monitorizaccedilatildeo ambiental nas cidades composta por 20 unidades que coletam dados em pontos relevantes da cidade Disponiacutevel na WWW httpfuturecitiesupptsitehybrid-sensor-networking-testbed

91

algumas das quais jaacute mencionadas permitindo assim retirar conclusotildees especiacuteficas quanto ao estado dos Dados Abertos em Portugal A anaacutelise feita por Soares Baptista e Lima (2015) sobre a abertura de dados em quatro cidades do norte do paiacutes Braga Barcelos Guimaratildees e Vila Nova de Famalicatildeo concluiu que a disponibilizaccedilatildeo de dados ao niacutevel local eacute feita apenas ao niacutevel de ldquocontratos municipais orccedilamento anual gastos resultados eleitorais qualidade do ar horaacuterios de transporte orccedilamento participativo e lista de empresasrdquo A abertura de dados destas categorias eacute feita com a ajuda da ldquoadministraccedilatildeo central e algumas instituiccedilotildees transversais ao territoacuteriordquo sendo que existem aacutereas onde nenhum dos municiacutepios analisados possuiu Dados Abertos como os ldquotransportes em tempo real instalaccedilotildees puacuteblicas estatiacutesticas criminais seguranccedila e higiene alimentar acidentes de tracircnsito permissotildees de construccedilatildeo requisiccedilotildees de serviccedilos e licenccedilas comerciaisrdquo (Soares Baptista e Lima 201522) O estudo revela ainda que as cidades analisadas tecircm a maior taxa de abertura no Open Data Census pelo facto de serem a uacutenicas onde a informaccedilatildeo estaacute completa pois os resultados obtidos no estudo foram registados no censo

O Portal da Transparecircncia Municipal eacute uma ferramenta que permite avaliar vaacuterios indicadores da governaccedilatildeo dos municiacutepios portugueses com o recurso agrave disponibilizaccedilatildeo de dados estatiacutesticos Os indicadores abordam a gestatildeo financeira e administrativa decisotildees fiscais dinacircmica econoacutemica do municiacutepio serviccedilos municipais e participaccedilatildeo eleitoral autaacuterquica (Portugal Governo 2017) Contudo a disponibilidade de dados em cada indicador natildeo eacute totalmente uniforme em termos temporais e registam-se algumas falhas de coleta ou cedecircncia de dados

O Open Data Census83 responsabilidade da OKI coleta informaccedilatildeo sobre a performance de cada paiacutes e respetivas cidades em termos de abertura de dados acessibilidade disponibilidade licenciamento processamento por maacutequina e transparecircncia Existem dados de 2014 para Portugal com um total de 178 datasets provenientes de 51 cidades distribuiacutedos por aacutereas como a qualidade do ar transportes orccedilamentos contratos puacuteblicos despesas e eleiccedilotildees sendo Braga e Guimaratildees as cidades mais abertas Contudo apenas um desses conjuntos de dados possui a totalidade da abertura desejada (OKI 2014) Para 2015 e 2016 natildeo satildeo apresentados resultados relativos agrave abertura de dados nas cidades portuguesas

O Global Open Data Index eacute um iacutendice que mede o estado de abertura dos dados governamentais ao niacutevel global Este iacutendice coleta informaccedilatildeo sobre a abertura dos dados governamentais desde 2013 ano em que Portugal se encontrava no 16ordm lugar em 60 paiacuteses com uma taxa de abertura84 calculada em 56 Em 2014 Portugal desce

83 Disponiacutevel na WWW httpcensusokfnorgenlatest 84 O Global Open Data Index considera 9 criteacuterios na sua avaliaccedilatildeo para os dados serem denominados totalmente abertos Licenccedila aberta dados em formatos que sejam processaacuteveis por maacutequinas acesso sem custos disponibilidade do dataset completa para download disponibilizaccedilatildeo de forma raacutepida e

92

para o 36ordm lugar em 97 paiacuteses registando uma taxa de abertura para 47 Em 2015 nova descida do paiacutes no ranking ateacute ao 54ordm lugar num total de 122 paiacuteses com uma taxa de abertura estimada em 34 Para o ano de 2016 as categorias das estatiacutesticas nacionais limites administrativos e aquisiccedilotildees possuem a taxa de abertura mais elevada apenas indicando como falha o licenciamento mas que implica que nenhum dos datasets seja verdadeiramente aberto A taxa de abertura calculada situa-se agora nos 37 com Portugal a subir para 46ordm lugar (OKI 2017)

O Public Sector Information Scoreboard coloca Portugal em 25ordm lugar num total de 31 paiacuteses pontuados sendo alguns destes resultados obtidos com base na LADA cuja uacuteltima revisatildeo data de 1999 Este painel de avaliaccedilatildeo destaca pela positiva as praacuteticas de reutilizaccedilatildeo os formatos os acordos exclusivos e os eventos e atividades Pela negativa destaca a publicaccedilatildeo de informaccedilatildeo puacuteblica local a natildeo implementaccedilatildeo da Diretiva europeia (ePSI Scoreboard 2013) o que natildeo corresponde agrave realidade pois a Lei nordm 462007 de 24 de agosto entretanto revogada pela Lei nordm 262016 de 22 de agosto transpocircs para a ordem juriacutedica nacional a Diretiva nordm 200398CE

O Open Data Barometer coloca Portugal em 2016 no 34ordm lugar do ranking entre 92 paiacuteses caindo trecircs posiccedilotildees relativamente a 2015 Destaca-se pela positiva a prontidatildeo da publicaccedilatildeo de dados com 58 e pela negativa o impacto poliacutetico econoacutemico e social da abertura com apenas 16 com uma meacutedia total de 42 de abertura Eacute assinalada a maior abertura de dados geograacuteficos censos transportes puacuteblicos comeacutercio internacional desempenho do setor da sauacutede estatiacutesticas sobre educaccedilatildeo crimes ambiente e informaccedilatildeo sobre contratos puacuteblicos No sentido oposto a posse de terras informaccedilatildeo orccedilamental e gastos governamentais o registo de empresas legislaccedilatildeo e resultados de eleiccedilotildees satildeo apontados como os dados com menos abertura (World Wide Web Foundation 2017)

O Open Data Maturity divide os paiacuteses em vaacuterios segmentos liacutederes seguidores raacutepidos seguidores e iniciantes Portugal encontra-se no grupo dos seguidores o que indicia o desenvolvimento de uma poliacutetica baacutesica de Dados Abertos e um portal com funcionalidades avanccediladas O impacto da abertura de dados eacute baixo verificando-se apenas resultados positivos na transparecircncia e eficiecircncia poliacutetica Ao niacutevel social eacute denotado um baixo impacto praticamente nulo na sustentabilidade ambiental e na inclusatildeo de grupos marginalizados A niacutevel econoacutemico apenas a aplicaccedilatildeo do modelo de custo marginal para a abertura de dados merece destaque Em termos de preparaccedilatildeo para a abertura de dados Portugal desce de pontuaccedilatildeo em relaccedilatildeo a 2015 o que eacute explicado pela fase de transiccedilatildeo para uma nova estrateacutegia de Dados Abertos Jaacute a maturidade do portal nacional cresceu mais de 20 em 2016 rondando agora os 70 Segundo os dados recolhidos pelo Open Data Maturity o uso de Dados Abertos

imediata disponibilidade dos dados sem conexatildeo agrave internet disponibilizaccedilatildeo dos dados em formato digital disponibilidade puacuteblica dos dados e por fim a confirmaccedilatildeo da existecircncia dos dados

93

em 2016 em Portugal decaiu ligeiramente em relaccedilatildeo ao ano anterior rondando os 35 O estudo indica que o paiacutes natildeo tem uma poliacutetica de Dados Abertos e que apenas vai transpor a Diretiva europeia em 2016 apesar de jaacute o ter feito na Lei nordm 462007 de 24 de agosto sendo mencionado que a estrateacutegia a 5 anos estaacute a ser revista (Carrara Nieuwenhuis amp Vollers 2016) O Open Data Maturity aponta diversas barreiras em termos de publicaccedilatildeo de dados como a falta de apoio politico para a abertura de dados valiosos e relevantes a falta de recursos humanos teacutecnicos e financeiros e falta de conhecimentos relativos a padrotildees e boas praacuteticas de partilha de dados puacuteblicos O relatoacuterio afirma que ldquosome countries have a policy framework that does not necessarily require them to add a specific licence per data setrdquo apontando Portugal entre outros paiacuteses como exemplo (Carrara Nieuwenhuis amp Vollers 201624) Contudo a consulta dos avisos legais do portal dadosgov indica que todos os conjuntos de dados disponibilizados possuem uma licenccedila aberta Creative Commons Atribuiccedilatildeo 30 Portugal (CC-BY) (AMA 2016b)

O projeto Open Data Inventory (ODIN) monitoriza o progresso das poliacuteticas de abertura dos dados puacuteblicos medindo o seu sucesso e impacto e fornece suporte agrave implementaccedilatildeo de sistemas de dados Fruto deste acompanhamento o ODIN desenvolveu um ranking global com vista a avaliar a cobertura da abertura de dados e a abertura em si De acordo com os resultados de 2016 Portugal situa-se em 15ordm lugar entre os 173 paiacuteses cujas poliacuteticas de abertura de dados puacuteblicos foram avaliadas com uma cobertura de 58 e abertura de 75 perfazendo um total calculado de 67 Este ranking foi obtido depois da avaliaccedilatildeo da abertura de estatiacutesticas sociais (62) econoacutemicas (70) e ambientais (69) retirados do siacutetio web do Instituto Nacional de Estatiacutestica (INE) (Open Data Watch 2016)

Uma iniciativa de avaliaccedilatildeo dos programas de abertura da informaccedilatildeo do setor puacuteblico da OECD (2015b) fornece informaccedilatildeo uacutetil relativa ao estado dos Dados Abertos em Portugal Segundo esta organizaccedilatildeo os custos de abertura de informaccedilatildeo do setor puacuteblico satildeo financiados como parte do Plano Global Estrateacutegico para a racionalizaccedilatildeo de custos com tecnologias de informaccedilatildeo e comunicaccedilatildeo na Administraccedilatildeo Puacuteblica A legibilidade de dados por maacutequina eacute apontada como uma falha na avaliaccedilatildeo teacutecnica da abertura embora Andreacute Lapa da AMA tenha confirmado que todos os dados existentes no portal dadosgov tecircm essa caracteriacutestica (A Lapa comunicaccedilatildeo pessoal 27 Marccedilo 2017) Os resultados satildeo muitos positivos em termos de formatos abertos com a totalidade dos dados a deter esse estatuto e tambeacutem na interoperabilidade onde a OECD indica que esta caracteriacutestica teacutecnica iraacute ser implementada como obrigatoacuteria A niacutevel de licenciamento em Portugal eacute atribuiacuteda a Licenccedila CC BY 30 agrave totalidade de dados alojados no portal nacional (OECD 2015b AMA 2016b)

Referindo-se a dados de 2015 o portal do Open Data Monitor indica que apenas foi indexado um portal de dados em Portugal com um total de 656 datasets disponiacuteveis

94

sem contudo indicar qual Em termos de resultados apurados eacute indicado que Portugal apenas cumpre no capiacutetulo da exaustividade (50) tendo os campos da disponibilidade uso por maacutequina e do licenciamento aberto com uma percentagem de 0 o que explicaraacute os 13 de qualidade global atribuiacutedos pelo Open Data Monitor

Em Maio de 2017 o cataacutelogo do European Data Portal oferece o acesso a um total 633680 datasets provenientes de 34 paiacuteses europeus Portugal ocupa o 18ordm lugar com um total de 1635 conjuntos de dados disponibilizados oriundos dos trecircs portais indexados o dadosgovpt o portal do Sistema Nacional de Informaccedilatildeo de Ambiente (SNIAmb) e o Lisboa Aberta (European Data Portal 2017) Verifica-se uma discrepacircncia entre o nuacutemero de datasets disponibilizados no cataacutelogo do European Data Portal e o nuacutemero real existente nos cataacutelogos dos portais mencionados O portal dadosgovpt apresenta 802 conjuntos de dados no cataacutelogo (AMA 2016) enquanto o European Data Portal assinala 832 datasets O SNIAmb regista um total de 1991 datasets (Agecircncia Portuguesa do Ambiente 2017) contra os 439 indexados pelo European Data Portal Apenas os nuacutemeros referentes ao portal Lisboa Aberta satildeo coincidentes com o registo de 364 conjuntos de dados (Lisboa Cacircmara Municipal 2017)

Num estudo comparativo de seis iniciativas do norte e do sul da Europa Gomes e Soares (2014) analisaram diversos indicadores relativos aos portais de dados nacionais como o cumprimento dos princiacutepios de abertura de dados governamentais o niacutevel de atividade do portal e os benefiacutecios observaacuteveis da abertura de dados Segundo este estudo o portal portuguecircs tem nota eacute positiva no cumprimento dos princiacutepios de abertura A anaacutelise da atividade do portal eacute negativa com a atividade dos visitantes o desenvolvimento de aplicaccedilotildees a atividade geradora de novo conhecimento e a utilizaccedilatildeo de recursos do portal a serem classificadas como pobres Neste indicador apenas a atividade dos fornecedores no portal eacute satisfatoacuteria Em termos de benefiacutecios observaacuteveis da abertura de dados governamentais o estudo apenas regista bons niacuteveis de transparecircncia governativa enquanto a participaccedilatildeo puacuteblica a inovaccedilatildeo e o empreendedorismo e a eficiecircncia governativas natildeo revelam impactos satisfatoacuterios

Portugal possui ainda o Iacutendice de Transparecircncia Municipal (ITM) (2016) que mede o grau de transparecircncia das Cacircmaras Municipais atraveacutes de uma anaacutelise da informaccedilatildeo disponibilizada nas suas paacuteginas web O ITM eacute composto por 76 indicadores divididos em sete dimensotildees85 contudo este iacutendice eacute baseado no tipo de dados disponibilizados e natildeo em que contexto de abertura estes foram publicados

O cruzamento da informaccedilatildeo obtida atraveacutes das vaacuterias iniciativas de avaliaccedilatildeo da abertura de dados permite inferir algumas conclusotildees e revelar algumas disparidades

85 As dimensotildees satildeo Informaccedilatildeo sobre a Organizaccedilatildeo Composiccedilatildeo Social e Funcionamento do Municiacutepio Planos e Relatoacuterios Impostos Taxas Tarifas Preccedilos e Regulamentos Relaccedilatildeo com a Sociedade Contrataccedilatildeo Puacuteblica Transparecircncia Econoacutemico-Financeira Transparecircncia na aacuterea do Urbanismo Disponiacutevel na WWW httpstransparenciaptprojetosindice-de-transparencia-municipal

95

O Open Data Barometer e o Open Data Maturity apontam o baixo impacto econoacutemico e social da abertura de dados em Portugal Gomes e Soares (2014) concluem que o problema em Portugal natildeo eacute quantidade de dados disponibilizados mas sim a quantidade de dados que satildeo reutilizados e como satildeo reutilizados O Public Sector Information Scoreboard e o Open Data Maturity afirmam que Portugal natildeo possui uma poliacutetica de Dados Abertos o que como vimos natildeo corresponde agrave verdade Entre as vaacuterias iniciativas de avaliaccedilatildeo do estado de abertura de dados apenas trecircs publicaram informaccedilatildeo relativa a 2016

Quadro 4 Comparaccedilatildeo dos resultados de abertura de dados atribuiacutedos pelas vaacuterias iniciativas de avaliaccedilatildeo Iniciativa Ranking Taxa de Abertura

Global Open Data Index 46ordm122 Paiacuteses 37

Open Data Barometer

34ordm114 Paiacuteses 42

Open Data Inventory 15ordm173 Paiacuteses 67

Fonte Elaboraccedilatildeo proacutepria

Apesar da equivalecircncia de ranking e taxa de abertura entre duas das iniciativas eacute redundante inferir qualquer conclusatildeo dado que estas natildeo medem o mesmo nuacutemero paracircmetros nem estes coincidem na maioria dos casos O Open Data Inventory refere-se a dados avaliados apenas do portal do INE para calcular a sua taxa de abertura pelo que tambeacutem deve ser relativizado

Como pontos positivos satildeo apontados a abertura de dados de diferentes domiacutenios o fato de todos os dados disponibilizados no portal estarem num formato processaacutevel por maacutequina (Carrara Nieuwenhuis amp Vollers 2016) ao contraacuterio do que afirma a OECD (2015b) e o Open Data Inventory Apesar de a AMA natildeo deter dados concretos do impacto da reutilizaccedilatildeo de dados existentes no dadosgov existem pelo menos 2 aplicaccedilotildees Mapa do Cidadatildeo e Portal da Transparecircncia Municipal que utilizam dados do portal como fonte da informaccedilatildeo que disponibilizam (Lapa 2017) O Open Data Goldbook for Data Holders and Data Managers faz referecircncia a Portugal como um exemplo de boas praacuteticas ao niacutevel da abertura dos dados governamentais destacando a aplicaccedilatildeo moacutevel e a plataforma online86 da AMA que permite aos cidadatildeos aceder a um mapa que conteacutem a localizaccedilatildeo de todos os serviccedilos puacuteblicos (Carrara et al 2016a) A Infraestrutura de Dados Espaciais do Algarve disponibiliza atraveacutes do seu portal acesso a quatro aplicaccedilotildees87 que reutilizam Dados Abertos para fornecer informaccedilatildeo de acircmbito regional os cidadatildeos

86 Disponiacutevel na WWW httpswwwmapadocidadaopt 87 As aplicaccedilotildees satildeo ldquoSiacutetios Lugares e Ruasrdquo ldquoCarta Regional de Equipamentordquo ldquoReserva Ecoloacutegica Nacionalrdquo e ldquoPlanos Municipais de Ordenamento de Territoacuteriordquo Disponiacutevel na WWW httpidealgccdr-algptaplicacoesaspx

96

Relativamente agrave usabilidade do portal o Open Data Maturity refere que natildeo eacute possiacutevel contribuir para o portal o que parece natildeo corresponder agrave realidade Citando Andreacute Lapa da AMA organizaccedilatildeo responsaacutevel pelo portal nacional existem fornecedores com acesso direto ao backoffice e que publicam os seus dados (Lapa 2017) embora o mesmo natildeo se verifique relativamente aos cidadatildeos O Open Data Maturity avalia tambeacutem a usabilidade de dados referindo que natildeo eacute possiacutevel saber a maioria dos formatos dos ficheiros existentes no portal nacional Recorrendo agrave informaccedilatildeo disponibilizada por Lapa (2017) todos os dados no dadosgov estatildeo disponiacuteveis em pdf csv xlsx e atraveacutes de serviccedilos REST incluindo assim formatos como odata JSON ou KML e RDF se aplicaacutevel A disponibilizaccedilatildeo dos formatos enunciados garante que todos os dados que o portal disponibiliza cumprem pelo menos as 3 estrelas da classificaccedilatildeo de Tim Berners-Lee (Lapa 2017) O Open Data Maturity afirma ainda que natildeo existe uma licenccedila atribuiacuteda contudo a AMA (2016b) enuncia que todos os seus dados estatildeo disponiacuteveis com uma licenccedila CC BY 30 O portal dadosgov possui algumas funcionalidades como a disponibilizaccedilatildeo de uma API que permite efetuar consultas baacutesicas relativas ao cataacutelogo de dados e tem capacidades de coleta automatizada para o caso dos dados disponibilizados atraveacutes de web services sendo que os restantes satildeo atualizados de forma manual (Lapa 2017)

Em Maio de 2017 contabilizam-se 60 portais de dados abertos em Portugal distribuiacutedos por uma variada gama de aacutereas Foi elaborado um quadro com dados recolhidos atraveacutes desses portais para tentar identificar as e-infraestruturas que disponibilizam Dados Abertos que cumprem os requisitos inscritos na Open Definition nomeadamente em termos de licenccedila legibilidade por maacutequina esquema de metadados padratildeo e formatos abertos Todos os conjuntos de dados tecircm acesso gratuito atraveacutes da web razatildeo pela qual esse requisito natildeo foi incluiacutedo no quadro de avaliaccedilatildeo Atraveacutes deste quadro foi possiacutevel retirar algumas conclusotildees Existem apenas 11 portais de dados de investigaccedilatildeo com os restantes 49 a conter dados do setor puacuteblico Os dados estatiacutesticos satildeo os grandes dominadores do panorama nacional com 13 siacutetios web seguidos dos dados econoacutemicos com 6 Dos 60 portais analisados apenas 33 disponibilizam dados legiacuteveis por maacutequina sendo que alguns portais natildeo o fazem totalmente Apenas 16 portais indicam usar uma licenccedila aberta que permita a livre reutilizaccedilatildeo dos dados e apenas 3 fornecem a indicaccedilatildeo do padratildeo de metadados usado embora alguns dos portais pareccedilam usar um esquema proacuteprio de descriccedilatildeo de datasets Existem 17 portais que fornecem dados em formatos estruturados e 17 portais que natildeo utilizam formatos abertos ou natildeo indicam sequer o tipo de formato

97

Quadro 5 Portais de dados abertos existentes em Portugal

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Repositoacuterio de dados cientiacuteficos

RCAAP FCTFCCN Acadeacutemico 2007 IPCB ndash CC BY-NC APIS ndash CC BY 30 Sim Sem indicaccedilatildeo

IPCB ndash XLS APIS - PDF XML SAV

Repositoacuterio Cientiacutefico do Instituto Politeacutecnico de

Castelo Branco

IPCB Acadeacutemico 1970 CC BY-NC Sim Sem indicaccedilatildeo XLS

Qualidade da aacutegua da Albufeira do Roxo na

dinacircmica dos solos e das culturas agriacutecolas

Assoc Benefic do Roxo Inst

Politeacutecnico de Beja Univ Eacutevora

Agricultura Recursos Hiacutedricos

10 Sem licenccedila especiacutefica Sim ISO-19139

Metadata CSV KML Shapefile

Portal de dados da biodiversidade de Portugal

Instituto Superior de Agronomia

Biologia 23 CC BY 30 CC BY-NC 30

Sem indicaccedilatildeo

Esquema proacuteprio Sem indicaccedilatildeo

Biodatapt ELIXIR Portugal Biologia 5 Sem indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo Vaacuterios

Yeastract Inst Superior Teacutecnico - Lisboa

Ciecircncias da Vida Biologia

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

Cork Oak DB Instituto

Gulbenkian de Ciecircncia

Ciecircncias da Vida Biologia

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo HTML

Mitobreak Universidade do Porto

Ciecircncias da Vida Biologia

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

Haeckaliens Instituto

Gulbenkian de Ciecircncia

Ciecircncias da Vida Biologia

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Vaacuterios

Integrall Univ Aveiro Ciecircncias da Vida Biologia 8843 Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

Kymosys INESC-ID Lisboa Ciecircncias da Vida Biologia 42 CC BY 40 Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

98

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Geodados CM Lisboa Informaccedilatildeo Geograacutefica 257 PDDL Sim Esquema

proacuteprio CSV KLM

iGEO APA DGTerritoacuterio Informaccedilatildeo Geograacutefica 99 Sem indicaccedilatildeo Sem

indicaccedilatildeo Esquema proacuteprio HTML

IDEAlg CCDR Algarve Informaccedilatildeo Geograacutefica

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

Mapa de Obras ndash Portal do Muniacutecipe De Vila do Bispo

CM Vila do Bispo Autaacuterquico Informaccedilatildeo geograacutefica Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Aplicaccedilatildeo web

Portal de Dados Abertos do Porto

CM Porto Autaacuterquico 5 CC BY Sim Esquema proacuteprio SHP XLS

Lisboa Aberta CM Lisboa Autaacuterquico 365 CC0 e CC BY Sim (natildeo a 100)

Esquema proacuteprio

Diversos a maioria satildeo estruturados

Dados Abertos Aacutegueda CM Aacutegueda Autaacuterquico 47 CC0 CC BY-SA e CC BY

Sim (natildeo a 100)

Esquema proacuteprio

Diversosnem todos satildeo estruturados

SNIAmb APA Ambiente 1991 Sem indicaccedilatildeo Sim Esquema proacuteprio XML

SNIRH APA Ambiente

Recursos Hiacutedricos

7210 Resultados Sem indicaccedilatildeo Sim Sem indicaccedilatildeo CSV TSV

DadosGov AMA Agregador de Dados 802 CC BY 30 Sim Esquema

proacuteprio Diversos a maioria satildeo estruturados

Dados Abertos BNP Biblioteca Nacional Bibliograacutefico 12 CC0 10 Sim UNIMARC

Dublin Core Mods

RDF XML RDF TURTLE e Dublin Core XML

Simplex + - Dados Abertos AMA Burocraacutetico

Serviccedilos Puacuteblicos

1

Sem licenccedila especiacutefica autoriza

a reproduccedilatildeo de conteuacutedos

Sim Sem indicaccedilatildeo JSON

Mapa do Cidadatildeo AMA Burocraacutetico

Serviccedilos Puacuteblicos

Informaccedilatildeo geograacutefica Sem indicaccedilatildeo Sim Sem indicaccedilatildeo Aplicaccedilatildeo web e

moacutevel

99

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Instituto Nacional de Estatiacutestica

INE Estatiacutesticas Nacionais 8340

CC BY 30 (nos dados existentes no

dadosgov) Sim Esquema

proacuteprio XLS CSV

Estatiacutesticas Cultura GEPAC Cultura Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica autoriza a reproduccedilatildeo natildeo

comercial de conteuacutedos

Natildeo Sem indicaccedilatildeo PDF

AICEP - Estatiacutesticas AICEP Comeacutercio e Investimento

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo PDF

BPStat Banco de Portugal Economia Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sem

indicaccedilatildeo Esquema proacuteprio Sem indicaccedilatildeo

Portugal Economy Probe Vaacuterios Economia Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim (natildeo a

100) Sem indicaccedilatildeo PDF XLS

Estatiacutesticas Economia GEE Economia Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica autoriza a coacutepia mediante citaccedilatildeo da fonte

Sim Sem indicaccedilatildeo XLXS

Portal de Transparecircncia Municipal

AMA e DGAL Economia Financcedilas

Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica indica

que a coacutepia importaccedilatildeo ou

utilizaccedilatildeo satildeo graacutetis

Sim Sem indicaccedilatildeo XML CSV

Base INCI Economia Compras Puacuteblicas

766326 Resultados

CC BY 30 (nos dados existentes no

dadosgov) Natildeo Esquema

proacuteprio HTML PDF

Estatiacutesticas Empresariais MJ Estatiacutesticas Empresariais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim Sem indicaccedilatildeo PDF XLS

100

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

PORDATA

Fundaccedilatildeo Manuel dos Santos

Estatiacutesticas Nacionais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim Esquema

proacuteprio HTML PDF XLS

PORDATA Kids

Fundaccedilatildeo Manuel dos Santos

Estatiacutesticas Nacionais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim Esquema

proacuteprio HTML PDF XLS

CCDR-N - Indicadores Regionais

CCDR Norte Estatiacutesticas Regionais 8 Sem indicaccedilatildeo Sim Sem indicaccedilatildeo XLS

Observatoacuterio DR CCDR Alentejo Estatiacutesticas Regionais

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo PDF XLS

Datacentro CCDR-Centro Estatiacutesticas Regionais

Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica autoriza a reproduccedilatildeo natildeo

comercial de conteuacutedos desde que identifique a

fonte

Natildeo Sem indicaccedilatildeo HTML

Estatiacutesticas dos Accedilores

Governo dos Accedilores

Estatiacutesticas Regionais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Esquema

proacuteprio HTML PDF

Estatiacutesticas da Madeira

Governo da Madeira

Estatiacutesticas Regionais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sem

indicaccedilatildeo Esquema

usado pelo INE PDF XLS

Quarenta anos de Abstenccedilatildeo

Transparecircncia Hackday Portugal Open Knowledge

Portugal

Estatiacutesticas Poliacuteticas

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo HTML

Central de dados

Transparecircncia Hackday Portugal

Estatiacutesticas Poliacuteticas e

Sociais 9 PDDL Sim Esquema

proacuteprio CSV JSON

Um Paiacutes como noacutes UBI U Aveiro Estatiacutesticas Sociais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo Aplicaccedilatildeo web

Dados e estatiacutesticas de cursos superiores

MEC Educaccedilatildeo Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim (natildeo a

100) Sem indicaccedilatildeo HTML XLXS ODS

101

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Estatiacutesticas Educaccedilatildeo e Ciecircncia

DGEEC Educaccedilatildeo e Ciecircncia

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim (natildeo a

100) Sem indicaccedilatildeo PDF XLXS ODS

Estatiacutesticas Justiccedila DGPJ-MJ Justiccedila Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim (natildeo a

100) Sem indicaccedilatildeo HTML PDF XLS

Sistema de informaccedilatildeo dos certificados de oacutebitos

M Sauacutede Oacutebitos Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo HTML

Serviccedilo Nacional de Sauacutede SNS Sauacutede 126 Sem indicaccedilatildeo Sim Esquema proacuteprio Vaacuterios

Estatiacutesticas Sauacutede DGS Sauacutede Sem indicaccedilatildeo Sem indicaccedilatildeo Sim Sem indicaccedilatildeo PDF CSV

Dashboard da Sauacutede DGS Sauacutede Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo HTML

Relatoacuterios Sinistralidade ANSR Seguranccedila Rodoviaacuteria

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo PDF

Portal Opiniatildeo Puacuteblica

Fundaccedilatildeo Francisco Manuel dos Santos

Sondagens Opiniatildeo

Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica autoriza a reproduccedilatildeo natildeo

comercial de conteuacutedos desde que identifique a

fonte

Sim Sem indicaccedilatildeo HTML PDF XLS

Estatiacutesticas SegSocial ISS Seg Social Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo HTML PDF

O Preccedilo Certo em Votos

Transparecircncia Hackday Portugal Open Knowledge

Portugal

Estatiacutesticas Poliacuteticas

Informaccedilatildeo estatiacutestica

General Public License v20

Sem indicaccedilatildeo Sem indicaccedilatildeo HTML

Arquivo Portuguecircs de Informaccedilatildeo Social

APIS Informaccedilatildeo social 37 CC BY 30 Sim Padratildeo do DDI PDF XML SAV

102

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Mila

Transparecircncia Hackday Portugal Aplicaccedilatildeo 78

Resultados Sem indicaccedilatildeo Sim Sem indicaccedilatildeo Aplicaccedilatildeo web

GeoDevolutas

Transparecircncia Hackday Portugal Aplicaccedilatildeo 250

Resultados Sem indicaccedilatildeo Sim Sem indicaccedilatildeo Aplicaccedilatildeo web

(tambeacutem disponiacutevel em CSV)

Open Food Facts

Open Food Facts - Portugal Aplicaccedilatildeo

Informaccedilatildeo estatiacutestica

e descritiva CC BY 40 Sim Sem indicaccedilatildeo Aplicaccedilatildeo web e

moacutevel

Invasatildeo dos hamburgueres

Transparecircncia Hackday Portugal Aplicaccedilatildeo Informaccedilatildeo

geograacutefica Sem indicaccedilatildeo Sim Sem indicaccedilatildeo

Aplicaccedilatildeo web (tambeacutem disponiacutevel em PDF CSV ODS

XLXS TSV)

103

Conclusatildeo

O conhecimento eacute inseparaacutevel do progresso cientiacutefico do processo de decisatildeo da inovaccedilatildeo e do bem-estar social Apesar de natildeo ser objetivo principal deste estudo natildeo deixaacutemos de constatar que o ecossistema portuguecircs de AA parece estar a amadurecer Aleacutem do RCAAP existem largas dezenas de repositoacuterios pertencentes a universidades e institutos de investigaccedilatildeo alguns incluiacutedos no ranking Top Portals O ROARMAP lista 21 poliacuteticas de AA por via verde em instituiccedilotildees do ensino superior o DOAJ (2017) indexa 78 revistas de AA com 91 a publicarem sob uma licenccedila CC que permite a sua livre reutilizaccedilatildeo O SHERPARoMEO listou 127 poliacuteticas editoriais de AA em Portugal sendo que mais de metade autoriza a publicaccedilatildeo em AA do posprint ou da versatildeo final do editor Nota ainda para a existecircncia de uma poliacutetica de AA da FCT por via do artigo 292 do acordo de financiamento que mandata a abertura de todos as publicaccedilotildees cientiacuteficas produzidos sob financiamento do programa H2020 Contudo os parcos resultados obtidos atraveacutes da literatura explorada natildeo permitem inferir a dimensatildeo cultural da implementaccedilatildeo do AA em Portugal

A plena implementaccedilatildeo do conceito de CA em Portugal parece ainda longe da realidade O estabelecimento de uma poliacutetica de CA apenas comeccedilou a ser desenhado em fevereiro de 2016 com a publicaccedilatildeo dos principiacuteos orientadores para a ldquoCiecircncia Aberta Conhecimento para todosrdquo pelo MCTES Em Maio a Resoluccedilatildeo do Conselho de Ministros nordm 212016 definiu os princiacutepios da implementaccedilatildeo da poliacutetica de CA em Portugal estruturada em torno de quatro eixos AA e Dados Abertos Infraestruturas e preservaccedilatildeo digital Avaliaccedilatildeo cientiacutefica Responsabilidade social cientiacutefica (Comissatildeo Executiva GT-PNCA 2016)

Hoje aplicamos o termo Dados Abertos referindo-nos a dados de investigaccedilatildeo e a dados do setor puacuteblico A origem da abertura destes dois tipos de dados tem contextos muito diferenciados e independentes embora os objetivos possam ser semelhantes Os dados sempre foram essenciais em muitas aacutereas da investigaccedilatildeo e nos uacuteltimos anos tornaram-se destaque em mais aacutereas cientiacuteficas crescendo substancialmente em escala e complexidade A niacutevel mundial verifica-se uma atenccedilatildeo crescente para o fenoacutemeno da abertura de dados de investigaccedilatildeo sobretudo quando se debate a resoluccedilatildeo de problemas agrave escala global Existem tambeacutem iniciativas e organizaccedilotildees internacionais envolvidas na promoccedilatildeo da abertura de dados que procuram fomentar o desenvolvimento de sistemas e procedimentos a niacutevel internacional que assegurem o acesso sustentabilidade e interoperabilidade Muitas destas organizaccedilotildees jaacute desenvolveram princiacutepios de abertura e protocolos de dados proacuteprios formaram grupos de trabalho para a definiccedilatildeo de padrotildees de gestatildeo publicaccedilatildeo citaccedilatildeo interoperabilidade e partilha de dados ou criaram cursos de treino em gestatildeo de dados de investigaccedilatildeo para oferecer aos seus investigadores Analisando em detalhe os

104

princiacutepios propostos para a abertura dos dados de investigaccedilatildeo verifica-se que aleacutem da grande variedade de princiacutepios propostos a abertura legal e teacutecnica dos dados soacute eacute acautelada em metade das recomendaccedilotildees Destacam-se o AA aos dados e a reutilizaccedilatildeo de dados em nuacutemero de menccedilotildees Em contrapartida a citaccedilatildeo de dados a interoperabilidade o acesso sem discriminaccedilatildeo as licenccedilas e formatos abertos a modificaccedilatildeo e legibilidade por maacutequina satildeo mencionados apenas em trecircs recomendaccedilotildees tendo a seu favor o facto de terem sido incluiacutedas nas recomendaccedilotildees mais recentes Princiacutepios relevantes como a publicaccedilatildeo imediata a qualidade e a integridade dos dados surgem apenas duas vezes listados Verifica-se tambeacutem o lanccedilamento de revistas cientiacuteficas especiacuteficas para a ciecircncia orientada a dados possibilitando a publicaccedilatildeo de dados e dos artigos cientiacuteficos que os utilizam apoacutes o serviccedilo de revisatildeo por pares

Apesar do progresso a literatura examinada aponta no sentido de que a abertura a dados de investigaccedilatildeo natildeo ser ainda um comportamento comum sendo necessaacuterio uma mudanccedila cultural (Royal Society 2012 Pontika et al 2015 Science International 2015) Verificam-se trecircs fatores que parecem estar a atrasar esta mudanccedila no comportamento dos investigadores

a) A OKI (2012b) coloca os dados de investigaccedilatildeo ao mesmo niacutevel de importacircncia que outros tipos de dados como os dados culturais financeiros estatiacutesticos ambientais e ainda sobre o clima e transportes sem lhes atribuir qualquer destaque ou importacircncia especial

b) A avaliaccedilatildeo e revisatildeo por pares dos dados natildeo tecircm a mesma qualidade quando comparada com as publicaccedilotildees tradicionais dado a publicaccedilatildeo de dados natildeo ser ainda uma praacutetica comum (ERAC 2016)

c) Hahnel e Hook (2016) apontam a falha na atribuiccedilatildeo de incentivos e recompensas tangiacuteveis aos investigadores pelas suas contribuiccedilotildees A publicaccedilatildeo de dados de forma aberta envolve tarefas que consomem muito tempo aos investigadores como a mudanccedila do formato dos dados manter a informaccedilatildeo atualizada alinhar os dados com as licenccedilas existentes e com os criteacuterios de publicaccedilatildeo de informaccedilatildeo sensiacutevel (Reitano 2013)

O debate sobre a abertura dos dados governamentais tem mais de uma deacutecada Diversas iniciativas e organizaccedilotildees internacionais tecircm promovido princiacutepios de abertura de dados do setor puacuteblico como a OKI (2012a) que identificou as componentes chave da abertura de dados puacuteblicos disponibilidade e acesso reutilizaccedilatildeo e redistribuiccedilatildeo participaccedilatildeo universal Foram analisados princiacutepios de abertura de dados puacuteblicos de nove organizaccedilotildees e tal como em relaccedilatildeo aos dados de investigaccedilatildeo verifica-se uma grande variedade de princiacutepios propostos Embora se registe uma melhoria significativa na abertura legal e teacutecnica relativamente aos dados de investigaccedilatildeo tambeacutem os princiacutepios propostos para os dados puacuteblicos natildeo abarcam

105

a totalidade desta dupla abertura O acesso a publicaccedilatildeo imediata a reutilizaccedilatildeo e a disponibilizaccedilatildeo de dados de forma completa sem discriminaccedilatildeo e de forma a serem processados por maacutequina satildeo os princiacutepios que reuacutenem mais consenso entre as recomendaccedilotildees analisadas As licenccedilas abertas a comparabilidade de dados os formatos abertos a disponibilidade a abertura por defeito de dados a interoperabilidade publicaccedilatildeo de metadados e a gestatildeo de dados apoacutes a sua publicaccedilatildeo satildeo mencionados em menos de metade das recomendaccedilotildees analisadas apesar de ser indiscutiacutevel a sua importacircncia no processo de abertura de dados

A abertura dos dados governamentais enfrenta restriccedilotildees complexas a niacutevel institucional da complexidade da tarefa uso e participaccedilatildeo legislaccedilatildeo qualidade da informaccedilatildeo e questotildees teacutecnicas (Janssen Charalabidis e Zuiderwijk 2012) Os governos devem modificar as praacuteticas e procedimentos internos de gestatildeo de informaccedilatildeo pois a reutilizaccedilatildeo da informaccedilatildeo estaacute dependente da forma como eacute gerida e publicada (Reitano 2013) A OECD (2015a) declara que estes dados continuam muitas vezes inacessiacuteveis quer em termos de acesso quer em termos de custo Satildeo apontados alguns entraves agrave sua publicaccedilatildeo derivados de questotildees culturais (Carrara et al 2016a) restriccedilotildees teacutecnicas e financeiras (Ubaldi 2013 Carrara et al 2016a) sendo necessaacuterio enfrentar desafios relacionados com poliacuteticas tecnologias financcedilas organizaccedilatildeo e cultura para criar um ecossistema e construir um modelo de negoacutecios sustentaacutevel para as iniciativas de DGA (Ubaldi 2013 traduccedilatildeo livre) Por outro lado devem ser fornecidos aos cidadatildeos os conhecimentos e habilidades necessaacuterias para interpretar a vasta gama de conjuntos de dados e gerar valor a partir desses dados (Janssen 2012 Koski 2015)

O impacto da abertura dos dados governamentais pode ser medido em trecircs dimensotildees econoacutemica poliacutetica e social (Granicas 2013 Koski 2015) Koski (20153) defende ser necessaacuterio desenvolver um modelo de avaliaccedilatildeo e monotorizaccedilatildeo seguido da coleta sistemaacutetica de dados para medir com exatidatildeo o impacto dos Dados Abertos

A abertura de dados sem restriccedilotildees de acesso deve ser garantida por uma poliacutetica de Dados Abertos pois ldquoOpen Data is politicalrdquo (World Wide Web Foundation 201638) O fenoacutemeno dos Dados Abertos eacute tambeacutem teacutecnico e social dada a interaccedilatildeo entre o meio local politico social legal e teacutecnico e as tecnologias que produzem resultados (Davies 2014 Pasqueto Sands amp Borgman 2015) A literatura destaca a existecircncia de poliacuteticas diferenciadas para a abertura de dados governamentais e para a abertura de dados cientiacuteficos com maior enfoque poliacutetico na abertura dos dados governamentais (RECODE 2014) Em termos de dados de investigaccedilatildeo eacute possiacutevel encontrar poliacuteticas de quatro intervenientes diferentes Governo entidade financiadora que pode ser ou natildeo governamental instituiccedilotildees de investigaccedilatildeo e ainda as editoras de data journals Ao niacutevel dos dados puacuteblicos satildeo associadas poliacuteticas

106

governamentais e institucionais As poliacuteticas de dados abertos devem ainda incluir uma poliacutetica de gestatildeo de dados independentemente do cariz dos dados

As recentes poliacuteticas de Open Data pretendem disponibilizar em livre acesso os datasets da mesma forma que qualquer outra publicaccedilatildeo acadeacutemica sendo para isso necessaacuterio garantir uma infraestrutura de armazenamento acesso pesquisa e a reutilizaccedilatildeo dessa informaccedilatildeo (Rans Day Duke amp Ball 2013) Segundo a Science International (20156) ldquoeffective open data in a data-intensive age can only be realised if there is systemic action at disciplinary national and international levelsrdquo

Exige-se uma mudanccedila cultural para atingir a abertura plena dos dados de investigaccedilatildeo sendo necessaacuterio estabelecer novas formas de reconhecimento e recompensa aos esforccedilos de gestatildeo preservaccedilatildeo e curadoria de dados como forma de envolver investigadores e comunidades na abertura de dados (RECODE 2014 Internacional Science 2015) Eacute essencial que os investigadores desenvolvam competecircncias que lhes permita natildeo soacute partilhar dados com metadados adequados como tambeacutem entender e reutilizar dados de terceiros (OECD 2015a) A familiaridade com ferramentas e princiacutepios de gestatildeo de dados deve ser segundo a Royal Society (2012) parte integrante do treino dos cientistas As bibliotecas e os bibliotecaacuterios como profissionais de informaccedilatildeo multifacetados podem desempenhar um papel ativo no mundo dos Dados Abertos como facilitadores do processo de investigaccedilatildeo (RECODE 2014 Hahnel e Hook 2016 Erway et al 2016 Hernaacutendez-Peacuterez 2016)

A implementaccedilatildeo de uma poliacutetica de abertura de dados puacuteblicos deve ter em conta a definiccedilatildeo da sua aplicaccedilatildeo e os objetivos que dados iratildeo ser publicados quais as condiccedilotildees de publicaccedilatildeo de dados em que siacutetio qual a frequecircncia e qual a razatildeo da publicaccedilatildeo devendo ainda ser calculado o impacto e os benefiacutecios da abertura de dados (Carrara et al 2016a) ldquoThe culture of open data policies has to change from a culture in which opening of data is standardly consideredrdquo (Zuiderwijk amp Janssen 201427) Os governos necessitam de implementar o fenoacutemeno dos Dados Abertos como uma mudanccedila cultural assegurando que recursos humanos e materiais infraestrutura leis e poliacuteticas satildeo eficientes para a implementaccedilatildeo e extraccedilatildeo de resultados a longo prazo (World Wide Web Foundation 2016) A literatura indica algumas estruturas de avaliaccedilatildeo da abertura de dados puacuteblicos tendo o nosso enfoque recaiacutedo no modelo criado Zuiderwijk e Janssen (2014) que aborda o contexto conteuacutedo e indicadores de desempenho da poliacutetica de dados abertos para calcular o valor alcanccedilado pela abertura de dados Destaque ainda para o Open Data Barometer que revela algumas conclusotildees preocupantes a niacutevel da abertura dos dados governamentais A disponibilidade de dados que cumprem todos os princiacutepios de abertura caiu dos 10 para 7 em 2016 e a legibilidade por maacutequina tambeacutem tem tendecircncia negativa Apenas se registou uma melhoria no licenciamento de dados

107

Ao niacutevel macro a EU tem estado ativa na recomendaccedilatildeo e implementaccedilatildeo de poliacuteticas de abertura de dados de investigaccedilatildeo e governamentais Em 2015 no acircmbito da criaccedilatildeo do Mercado Digital Uacutenico propocircs a implementaccedilatildeo de uma ldquocopyright exception that would permit researchers to analyse on a large scale scientific data to which they have lawful accessrdquo (Comissatildeo Europeia 2016b) Com a ambiccedilatildeo de tornar a Europa liacuteder mundial numa economia baseada em dados a Comissatildeo Europeia (2016c) pretende ldquodisponibilizar serviccedilos baseados na computaccedilatildeo em nuvem e infraestruturas de dados de craveira mundialrdquo que forneccedilam vantagens competitivas a investigadores empresaacuterios e instituiccedilotildees puacuteblicas baseadas na utilizaccedilatildeo de grandes volumes de dados

A aposta na criaccedilatildeo de poliacuteticas de abertura de dados de acordo com os objetivos europeus relativamente agrave CA reflete-se no atual programa de financiamento da investigaccedilatildeo e inovaccedilatildeo da EU o Horizonte 2020 (H2020) Foi criado um projeto-piloto de dados abertos com o objetivo de maximizar o acesso e reutilizaccedilatildeo de dados de investigaccedilatildeo nas aacutereas cientiacuteficas selecionadas tendo sido expandido em 2017 a todas as aacutereas sob financiamento do H2020 O artigo 293 do Model Grant Agreement requer o depoacutesito num repositoacuterio de AA de todos os dados e metadados associados permitindo assim o seu acesso exploraccedilatildeo por maacutequina reproduccedilatildeo e disseminaccedilatildeo sem custos para os utilizadores Os investigadores devem tambeacutem fornecer informaccedilatildeo sobre as ferramentas e instrumentos necessaacuterios para validar os resultados e elaborar um Data Management Plan para descrever os conjuntos de dados gerados no processo de investigaccedilatildeo e como e quando seratildeo publicados A gestatildeo de dados deve ser efetuada segundo os princiacutepios FAIR tornando os dados faacuteceis de encontrar acessiacuteveis interoperaacuteveis e reutilizaacuteveis (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016c) A implementaccedilatildeo dos princiacutepios FAIR na gestatildeo e abertura de dados de investigaccedilatildeo poderaacute potenciar tambeacutem a partilha e por conseguinte a citaccedilatildeo de dados

Em termos de dados puacuteblicos a EU implementou uma nova Diretiva (201337EU) que requer que a informaccedilatildeo puacuteblica seja disponibilizada ldquothrough open and machine-readable formats and together with their metadata at the best level of precision and granularity in a format that ensures interoperabilityrdquo incluindo agora entidades como bibliotecas arquivos e museus na esfera da abertura de dados (EUR-Lex 20133) Esta diretiva tornou obrigatoacuteria a disponibilizaccedilatildeo de informaccedilatildeo proveniente das entidades puacuteblicas para reutilizaccedilatildeo ao custo de reproduccedilatildeo de preferecircncia num portal e sob licenccedilas de formatos digitais

A EU criou tambeacutem o Open Data Maturity para avaliar o desenvolvimento de poliacuteticas nacionais e portais na Europa usando a informaccedilatildeo coletada para elaborar um iacutendice de maturidade das poliacuteticas de Open Data baseado na preparaccedilatildeo poliacutetica e na maturidade do portal de dados (Carrara Nieuwenhuis amp Vollers 2016) Em termos

108

de preparaccedilatildeo poliacutetica eacute avaliada a presenccedila de uma poliacutetica de Dados Abertos especiacutefica normas de licenciamento extensatildeo da coordenaccedilatildeo a niacutevel nacional uso de dados e impacto poliacutetico social e econoacutemico A maturidade dos portais eacute avaliada de acordo com a sua usabilidade a reutilizaccedilatildeo dos dados alojados no portal e inclusatildeo de dados de diferentes domiacutenios Segundo a informaccedilatildeo apurada no relatoacuterio apesar da melhoria do nuacutemero de poliacuteticas de Dados Abertos no uso de dados e impacto da abertura de dados a maioria dos paiacuteses europeus ainda natildeo atingiu a maturidade por completo Os paiacuteses necessitam de elevar o reconhecimento poliacutetico sobre os Dados Abertos aumentar os processos automatizados nos seus portais para aumentar a usabilidade e reutilizaccedilatildeo dos dados e tambeacutem organizar mais eventos e treinos para apoiar as iniciativas nacionais e locais O relatoacuterio do Open Data Maturity conclui que os paiacuteses europeus estatildeo a enfrentar barreiras legais financeiras de qualidade de dados e de poliacuteticas sublinhando que os poliacuteticos natildeo conhecem os benefiacutecios da abertura de dados e que por isso os Dados Abertos natildeo satildeo estabelecidos como uma prioridade poliacutetica (Carrara Nieuwenhuis amp Vollers 2016)

Em Portugal as poliacuteticas de abertura de dados de investigaccedilatildeo e do setor puacuteblico apresentam estados de maturidade diferentes Apenas em 2014 foi definida uma poliacutetica de AA aos dados de investigaccedilatildeo atraveacutes da FCT enquanto entidade financiadora de investigaccedilatildeo Contudo esta poliacutetica ldquonatildeo estaacute alinhada com os requisitos relativamente aos dados de investigaccedilatildeo do H2020rdquo (Comissatildeo Executiva GT-PNCA 2016) pois apenas recomenda a abertura de dados sem no entanto mencionar onde os depositar o tipo de licenccedilas a utilizar que tipo de metadados inserir que formatos utilizar

A abertura de dados de investigaccedilatildeo em Portugal foi enquadrada no acircmbito da definiccedilatildeo de uma poliacutetica de CA tendo sido delineadas algumas metas a atingir ateacute 2018 pelo Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior (2016) publicaccedilatildeo de 100 dos dados criados com financiamento puacuteblico num repositoacuterio de AA verificaccedilatildeo contiacutenua da publicaccedilatildeo de dados eliminaccedilatildeo do duplo financiamento para colocar publicaccedilotildees e dados em AA oferta regular de formaccedilatildeo relativa a publicaccedilatildeo de dados em AA propriedade intelectual e proteccedilatildeo de dados

A Resoluccedilatildeo do Conselho de Ministros nordm 212016 de 11 de abril vem finalmente incluir o AA aos dados de investigaccedilatildeo na poliacutetica cientiacutefica No acircmbito da definiccedilatildeo de uma poliacutetica de Ciecircncia Aberta eacute incluiacuteda a obrigatoriedade do AA aos ldquodados cientiacuteficos resultantes de investigaccedilatildeo financiada por fundos puacuteblicosrdquo e sua respetiva preservaccedilatildeo ldquopor forma a permitir a sua reutilizaccedilatildeo e o acesso continuadordquo (Resoluccedilatildeo do Conselho de Ministros nordm 212016 2016) O interesse na abertura de dados de investigaccedilatildeo tem crescido no discurso poliacutetico e cientiacutefico verificando-se jaacute a organizaccedilatildeo de uma conferecircncia de dados de investigaccedilatildeo e CA em 2016 e de dois foacuteruns de gestatildeo de dados de investigaccedilatildeo o uacuteltimo jaacute em 2017

109

O primeiro relatoacuterio da Comissatildeo Executiva do Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta constatou que em termos de gestatildeo e partilha de dados existem algumas iniciativas e experiecircncias de ldquoacircmbito disciplinar nomeadamente no contexto de projetosrdquo sendo expectaacutevel que o Roteiro Nacional de Infraestruturas de Investigaccedilatildeo de Interesse Estrateacutegico traga ldquoprogressos significativosrdquo (Comissatildeo Executiva GT-PNCA 20167) O mesmo relatoacuterio sublinha que ao niacutevel das instituiccedilotildees de investigaccedilatildeo e de ensino superior as iniciativas de partilha e gestatildeo de dados satildeo quase inexistentes De facto apenas se regista a existecircncia do projeto TAIL lanccedilado na Faculdade de Engenharia da Universidade do Porto com o objetivo de otimizar o processo de gestatildeo de dados de investigaccedilatildeo desde a sua produccedilatildeo ateacute ao depoacutesito e partilha Este projeto a decorrer de 2016 ateacute 2019 ldquovai construir um portfoacutelio de exemplos de gestatildeo de dados em diversos domiacutenios que poderatildeo ser usados pelos investigadores para avaliar o esforccedilo requerido e as compensaccedilotildees a obter com esta atividaderdquo (Ribeiro et al 2016256-257) Os resultados seratildeo avaliados atraveacutes da utilizaccedilatildeo da plataforma Dendro ldquodesigned to help researchers use concepts from domain-specific ontologies to collaboratively describe and share datasets within their groupsrdquo (Universidade do Porto Faculdade de Engenharia 2017)

O ecossistema dos dados de investigaccedilatildeo em Portugal eacute concentrado a niacutevel disciplinar e inferior em nuacutemero de e-infraestruturas relativamente aos dados puacuteblicos Regista-se a existecircncia do SARDC com jaacute cerca de seis anos de existecircncia e que apresenta apenas 2007 datasets em maio de 2017 Depois da sua criaccedilatildeo e da colocaccedilatildeo em massa de conjuntos de dados verifica-se que o depoacutesito de datasets decresceu de forma extrema Os conjuntos disponibilizados satildeo provenientes de apenas duas instituiccedilotildees o APIS com 37 e o IPCB com 1970 conjuntos de dados Embora exista um espaccedilo atribuiacutedo a mais duas instituiccedilotildees nenhuma dessas entidades publicou ateacute agora dados atraveacutes desta plataforma O SARDC eacute limitado em termos de funcionalidades permitindo apenas a busca por autor data titulo assunto e tipo de documento Natildeo eacute possiacutevel perceber a legalidade da reutilizaccedilatildeo de dados pois natildeo eacute referido qualquer tipo de licenciamento A qualidade dos dados apresentados pelo SARDC eacute uma incoacutegnita pela falta de indicaccedilatildeo do uso de formatos abertos e tambeacutem de um esquema padratildeo de metadados A niacutevel das instituiccedilotildees de investigaccedilatildeo apenas o IPCB possui um repositoacuterio de Dados Abertos

A tendecircncia de abertura de dados de investigaccedilatildeo parece estar ligada agrave cultura disciplinar com os repositoacuterios de dados cientiacuteficos existentes em Portugal a conotarem-se no domiacutenio das Ciecircncias da Vida O re3data indexa apenas 2 repositoacuterios de dados cientiacuteficos portugueses o INTEGRALL e o KiMoSys sendo que ambos pertencem ao ramo da biologia (DataCite 2017a) O Biosharingorg (2017) indexou cinco bases de dados cientiacuteficas com origem portuguesa havendo participaccedilatildeo nacional em outras duas bases de dados internacionais Estas pertencem todas ao domiacutenio das Ciecircncias da Vida e da Biologia com exceccedilatildeo de uma conotada com as

110

Ciecircncias da Terra A GBIF possui um noacute portuguecircs que aloja 23 conjuntos de dados que correspondem a 448136 ocorrecircncias (Portal de Dados de Biodiversidade de Portugal 2016) A rede nacional de informaccedilatildeo bioloacutegica - BioDatapt fornece acesso a duas bases de dados disciplinares uma ontologia para descrever experiecircncias bioloacutegicas baseadas em plantas quatro ferramentas de software e cinco conjuntos de dados

Em suma eacute necessaacuterio desenvolver por completo a poliacutetica de abertura de dados cientiacuteficos clarificando questotildees como o local de depoacutesito licenccedilas metadados e formatos a utilizar Ao niacutevel do ecossistema eacute necessaacuterio melhorar a visibilidade do SARDC abrir totalmente os dados isto eacute de forma legal e teacutecnica e construir mais repositoacuterios de dados Em termos de impacto eacute imperiosa uma mudanccedila cultural que passe pelo treino dos investigadores para a gestatildeo e partilha de dados pela definiccedilatildeo de recompensas e incentivos para os investigadores que partilhem dados e tambeacutem pela criaccedilatildeo de mais iniciativas de promoccedilatildeo da abertura de dados

A evoluccedilatildeo da conjuntura de acesso aos documentos administrativos do setor puacuteblico eacute derivada da imposiccedilatildeo das Diretivas Europeias a que Portugal como membro da EU estaacute obrigado A Lei 462007 de 24 de Agosto viraacute transpor para a ordem juriacutedica nacional a Diretiva nordm 200398CE legislando a obrigaccedilatildeo das entidades puacuteblicas publicar documentos administrativos de forma eletroacutenica para que possam ser acedidos e reutilizados Foi tambeacutem criada a CADA para supervisionar o cumprimento das disposiccedilotildees legais referentes ao acesso agrave informaccedilatildeo administrativardquo (Comissatildeo de Acesso aos Documentos Administrativos [CADA])

A Lei nordm 262016 de 22 de Agosto revoga e transpotildee a novamente a Diretiva 200398EC O artigo 3ordm mandata a abertura dos dados ambientais agrave comunidade incluindo-os na definiccedilatildeo de documento administrativo devendo a sua publicaccedilatildeo ser feita num formato aberto e legiacutevel por maacutequina O artigo 23ordm apenas prevecirc a reutilizaccedilatildeo dos dados para fins educativos e para fins de investigaccedilatildeo e desenvolvimento deixando de lado a reutilizaccedilatildeo comercial Contudo o dadosgov atribuiu aos dados que aloja a licenccedila CC BY 30 o que natildeo impede a reutilizaccedilatildeo comercial dos dados Perante este contexto eacute impossiacutevel natildeo questionar a razatildeo de natildeo ter sido transposta a nova Diretiva 201337EU que facilita a reutilizaccedilatildeo de dados ao tornar obrigatoacuteria a disponibilizaccedilatildeo de informaccedilatildeo proveniente das entidades puacuteblicas para reutilizaccedilatildeo ao custo de reproduccedilatildeo de preferecircncia num portal e sob licenccedilas de formatos digitais Um desenvolvimento interessante seria o de criar um legislaccedilatildeo apropriada para a abertura de dados governamentais que fosse estabelecida tendo em conta as necessidades dos utilizadores e os objetivos governamentais em vez da simples transposiccedilatildeo da Diretiva da Uniatildeo Europeia

Ao niacutevel local apenas Lisboa e Porto parecem ter definido uma poliacutetica de abertura de dados com estrateacutegias diferenciadas Lisboa aposta na publicaccedilatildeo de dados municipais que promovam o envolvimento dos cidadatildeos aumentem a transparecircncia e

111

o desenvolvimento econoacutemico aleacutem da melhoria da eficiecircncia dos serviccedilos devendo os dados ser atualizados legiacuteveis por maacutequina com licenccedila aberta que permita a reutilizaccedilatildeo comercial (Lisboa Cacircmara Municipal 2016) Os dados disponibilizados no portal ldquosatildeo produzidos no acircmbito de sistemas de informaccedilatildeordquo que pertencem a diversos organismos registando-se jaacute diversas aplicaccedilotildees que utilizam esses dados para criar valor para o cidadatildeo e visitante de Lisboa na aacuterea do turismo ambiente urbanismo (Soares Baptista e Lima 201518) Jaacute o Porto parece concentrado na publicaccedilatildeo de dados que contribuam para a ldquocompetitividade do Municiacutepio do Porto e da regiatildeo para visitar para residir captar e realizar negoacutecios no mercado nacional e internacionalrdquo (Porto Cacircmara Municipal) De acordo com a opiniatildeo de Soares Baptista e Lima (201518) a abertura de dados eacute centrada na ldquodimensatildeo turismo e negligencia pelo menos aparentemente as restantesrdquo Esta conclusatildeo pode ser reforccedilada com a anaacutelise do portal de dados do Porto onde apenas constam cinco conjuntos de dados sendo estes pertencentes ao turismo ou relacionados

O ecossistema de abertura de dados tem aumentado dentro e fora do espectro poliacutetico Aleacutem do portal nacional de dados puacuteblicos um grande nuacutemero de organizaccedilotildees puacuteblicas tem criado os seus portais de dados eou tem publicado os mesmos no dadosgov Por outro lado existem vaacuterios portais de dados com origem na sociedade civil com o selo da Transparecircncia Hackday Portugal Em Portugal tecircm existido diversas iniciativas a este niacutevel hackathons como o Date with Data com o intuito de alertar informar e formar a comunidade para este novo paradigma na disponibilizaccedilatildeo da informaccedilatildeo conferecircncias de Dados Abertos

O Porto Lisboa Fundatildeo Palmela Penela e Aacutegueda estatildeo entre as cidades que integram o Open and Agile Smart Cities (OASC) (2017) uma iniciativa com o objetivo de desenvolver mercados para as cidades inteligentes baseados nas necessidades das cidades e das comunidades O Porto eacute destaque nesta iniciativa pela utilizaccedilatildeo da tecnologia FIWARE que ajuda a melhorar o uso de dados abertos e a partilha conhecimentos e tecnologias entre cidades

A anaacutelise feita por Soares Baptista e Lima (2015) sobre a abertura de dados em quatro cidades do norte do paiacutes Braga Barcelos Guimaratildees e Vila Nova de Famalicatildeo concluiu que a disponibilizaccedilatildeo de dados ao niacutevel local eacute feita apenas ao niacutevel de ldquocontratos municipais orccedilamento anual gastos resultados eleitorais qualidade do ar horaacuterios de transporte orccedilamento participativo e lista de empresasrdquo

A avaliaccedilatildeo da transparecircncia governativa local pode tambeacutem ser obtida atraveacutes do Portal da Transparecircncia Municipal uma ferramenta que permite avaliar vaacuterios indicadores da governaccedilatildeo dos municiacutepios portugueses com o recurso agrave disponibilizaccedilatildeo de dados estatiacutesticos Os indicadores abordam a gestatildeo financeira e administrativa decisotildees fiscais dinacircmica econoacutemica do municiacutepio serviccedilos municipais e participaccedilatildeo eleitoral autaacuterquica (Portugal Governo 2017)

112

Utilizando a estrutura de avaliaccedilatildeo de poliacuteticas de Dados Abertos de Zuiderwijk e Janssen (2014) eacute possiacutevel tirar algumas ilaccedilotildees sobre o contexto conteuacutedo e indicadores de desempenho da poliacutetica de abertura de dados do setor puacuteblico bem como sobre o valor puacuteblico alcanccedilado A niacutevel de contexto da poliacutetica de Dados Abertos a Lei nordm 262016 de 22 de Agosto transpotildee a Diretiva 200398CE tendo como motivaccedilatildeo para a sua implementaccedilatildeo eacute sobretudo econoacutemica e poliacutetica via EU A poliacutetica tambeacutem pretende facilitar o acesso e reutilizaccedilatildeo da informaccedilatildeo por parte dos cidadatildeos e garantir a transparecircncia da atividade administrativa A abertura de dados do setor puacuteblico eacute garantida pela CADA responsaacutevel pelo cumprimento da lei e a AMA que fornece a e-infraestrutura e apoio teacutecnico Tambeacutem os custos de abertura de dados governamentais parecem estar assegurados num plano de racionalizaccedilatildeo de custos da Administraccedilatildeo Puacuteblica (OECD 2015)

Em termos de conteuacutedo a poliacutetica de Dados Abertos enuncia na sua constituiccedilatildeo alguns princiacutepios de abertura bastante importantes como o acesso livre e universal a acessibilidade a interoperabilidade a qualidade a integridade e a autenticidade dos dados publicados e ainda a sua identificaccedilatildeo e localizaccedilatildeo (art 2ordm) A publicaccedilatildeo de dados deve ser feita num formato aberto e legiacutevel por maacutequina (art 3ordm)

Relativamente ao contexto o acesso eacute gratuito e de faacutecil compreensatildeo sendo que todos os dados no dadosgov estatildeo disponiacuteveis para download sem necessidade de pedido ou registo Eacute aplicada a licenccedila CC BY 30 a todos os datasets alojados no portal permitindo assim a sua reutilizaccedilatildeo com apenas a restriccedilatildeo de mencionar a fonte dos dados Todos os dados no dadosgov estatildeo disponiacuteveis em formatos abertos podendo ser classificados com 3 estrelas segundo o conceito de dados abertos conectados de Tim Berners-Lee (2010)

Contudo natildeo existe esquema padratildeo de metadados nem existe verificaccedilatildeo dos metadados antes da publicaccedilatildeo de cada dataset (Lapa 2017) Natildeo satildeo conhecidas meacutetricas de avaliaccedilatildeo nem multas ou recompensas no ecossistema portuguecircs de Dados Abertos A uacuteltima mediccedilatildeo da qualidade dos dados data de 2014 onde foram encontrados alguns problemas que natildeo foram totalmente resolvidos junto dos fornecedores A uacuteltima grande atividade de promoccedilatildeo de reutilizaccedilatildeo de dados do setor puacuteblico ocorreu em 2014-2015 natildeo se conhecendo para jaacute novas atividades previstas (Lapa 2017)

Em termos de disponibilidade de dados Portugal apresenta 802 conjuntos de dados no portal nacional de temaacutetica diversa mas com maior incidecircncia na Economia e Financcedilas Mas se considerarmos os dados alojado em outros portais puacuteblicos e natildeo que ainda natildeo constam no portal nacional a contabilidade eacute bastante mais elevada

Os indicadores de desempenho satildeo modestos Apesar do espetro alargado de destinataacuterios da abertura de dados registam-se apenas 2 aplicaccedilotildees elaboradas a

113

partir de Dados Abertos disponibilizados pela AMA e Direcccedilatildeo-Geral das Autarquias Locais (Lapa 2017) Natildeo eacute por isso surpreendente o fraco impacto poliacutetico econoacutemico e social apontado pelo Open Data Barometer e pelo Open Data Maturity O estudo de Gomes e Soares (2014) conclui que a transparecircncia eacute o uacutenico benefiacutecio real

Em termos de valor puacuteblico alcanccedilado apenas conseguimos identificar a transparecircncia governativa e disponibilidade de dados Mesmo que a poliacutetica mandate a abertura de dados mediante como a interoperabilidade e a qualidade se natildeo existe verificaccedilatildeo nem mediccedilatildeo quem pode assegurar que estes estatildeo a ser cumpridos A disponibilidade de dados existe o que natildeo se verifica eacute grande reutilizaccedilatildeo dos dados puacuteblicos Poderaacute esta falta de verificaccedilatildeo da qualidade dos dados estar a interferir com a sua reutilizaccedilatildeo Faltam claramente indicadores de reutilizaccedilatildeo de dados do setor puacuteblico e estudos de impacto para uma avaliaccedilatildeo concreta do valor alcanccedilado

Gomes e Soares (2014) apenas atribuem nota positiva ao dadosgov no cumprimento dos princiacutepios de abertura A atividade dos visitantes o desenvolvimento de aplicaccedilotildees a atividade geradora de novo conhecimento e a utilizaccedilatildeo de recursos do portal satildeo classificadas como pobres Neste indicador apenas a atividade dos fornecedores no portal eacute satisfatoacuteria Em termos de benefiacutecios observaacuteveis da abertura de dados governamentais o estudo apenas regista bons niacuteveis de transparecircncia governativa enquanto a participaccedilatildeo puacuteblica a inovaccedilatildeo e o empreendedorismo e a eficiecircncia governativas natildeo revelam impactos satisfatoacuterios

O cruzamento da informaccedilatildeo obtida atraveacutes das vaacuterias iniciativas de avaliaccedilatildeo da abertura de dados permite inferir algumas conclusotildees e tambeacutem revelar algumas disparidades O Open Data Barometer e o Open Data Maturity apontam o baixo impacto econoacutemico e social da abertura de dados em Portugal Gomes e Soares (2014) concluem que o problema em Portugal natildeo eacute quantidade de dados disponibilizados mas sim a quantidade de dados que satildeo reutilizados e como satildeo reutilizados

O Public Sector Information Scoreboard e o Open Data Maturity afirmam que Portugal natildeo possui uma poliacutetica de Dados Abertos o que como vimos natildeo corresponde agrave verdade Entre as vaacuterias iniciativas de avaliaccedilatildeo do estado de abertura de dados apenas trecircs publicaram informaccedilatildeo relativa a 2016 Apesar da equivalecircncia de ranking e taxa de abertura entre duas das iniciativas eacute redundante inferir qualquer conclusatildeo dado que estas natildeo medem o mesmo nuacutemero paracircmetros nem estes coincidem na maioria dos casos O Open Data Inventory refere-se a dados avaliados apenas do portal do INE para calcular a sua taxa de abertura pelo que tambeacutem deve ser relativizado

Como pontos positivos satildeo apontados a abertura de dados de diferentes domiacutenios o fato de todos os dados disponibilizados no portal estarem num formato processaacutevel

114

por maacutequina (Carrara Nieuwenhuis amp Vollers 2016) ao contraacuterio do que afirma a OECD (2015b) e o Open Data Inventory

Todos os iacutendices de avaliaccedilatildeo da maturidade do estado das iniciativas e poliacuteticas de Dados Abertos satildeo relativos a dados puacuteblicos natildeo tendo sido encontrada nenhuma estrutura de avaliaccedilatildeo das poliacuteticas de abertura de dados de investigaccedilatildeo

Tendo em conta o Quadro 5 eacute possiacutevel verificar a qualidade da abertura dos dados dos 60 portais de dados portugueses encontrados na web e inferir algumas conclusotildees Em termos de portais de dados de investigaccedilatildeo foram encontrados apenas 11 com os restantes 49 a conter dados do setor publico Os portais de dados estatiacutesticos satildeo os grandes dominadores do panorama nacional com 13 siacutetios web seguidos dos portais de dados econoacutemicos com 6 Dos 60 portais analisados apenas 33 disponibilizam dados legiacuteveis por maacutequina sendo que alguns portais natildeo o fazem totalmente Apenas 16 portais indicam usar uma licenccedila aberta que permita a livre reutilizaccedilatildeo dos dados e apenas 3 fornecem a indicaccedilatildeo do padratildeo de metadados usado Denota-se que alguns dos portais parecem usar um esquema proacuteprio de descriccedilatildeo de datasets no entanto estes natildeo parecem corresponder aos padrotildees de metadados mais reconhecidos Existem 17 portais que natildeo utilizam formatos abertos ou natildeo indicam sequer o tipo de formato Eacute possiacutevel jaacute encontrar jaacute tambeacutem 17 portais que fornecem dados em formatos estruturados

Em suma eacute necessaacuterio transpor a Diretiva da EU de 2013 e criar mais poliacuteticas municipais e institucionais mandatar a total abertura legal e teacutecnica de dados e a sua verificaccedilatildeo da qualidade O niacutevel de reutilizaccedilatildeo de dados e as atividades de treino e envolvimento dos cidadatildeos devem ser aumentados

O sucesso das poliacuteticas de Dados Abertos depende como vimos da criaccedilatildeo de um ecossistema sustentaacutevel e tambeacutem do impacto e reutilizaccedilatildeo que estes tipos de informaccedilatildeo possam induzir O impacto dos Dados abertos pode ser medido atraveacutes da citaccedilatildeo de dados ou atraveacutes de indicadores altimeacutetricos que permitem uma observaccedilatildeo mais clara e detalhada dos possiacuteveis impactos dos conjuntos de dados disponibilizados em AA sejam eles provenientes do setor puacuteblico ou das entidades de investigaccedilatildeo

115

Referecircncias Bibliograacuteficas

Agecircncia para a Modernizaccedilatildeo Administrativa (AMA) (2016a) Guia Dados Abertos Disponiacutevel na WWW httpwwwdadosgovptmedia46120guia_dados_abertos_amapdf

Agecircncia para a Modernizaccedilatildeo Administrativa (AMA) (2016b) Dadosgov [Consultado a 11-05-2017] Disponiacutevel na WWW httpwwwdadosgovpt

Agecircncia Portuguesa do Ambiente (2017) SNIAmb - Sistema Nacional de Informaccedilatildeo de Ambiente [Consultado a 12-05-2017] Disponiacutevel na WWW httpsniambapambienteptHomeDefaulthtm

Arzberger P et al (2004) An international framework to promote access to data Science 303(5665) 1777-1778 Disponiacutevel na WWW httpsciencesciencemagorgcontent30356651777full

Asociacioacuten Espantildeola de Normalizacioacuten y Certificacioacuten (2015) UNE 178301 Ciudades Inteligentes Datos Abiertos (Open Data) Madrid AENOR Beagrie C amp Houghton J (2014) The Value and Impact of Data Sharing and Curation A synthesis of three recent studies of UK research data centres Disponiacutevel na WWW httprepositoryjiscacuk55681iDF308_-_Digital_Infrastructure_Directions_Report2C_Jan14_v1-04pdf

Beall J (2012) Predatory publishers are corrupting open access Nature 489(7415) 179 Disponiacutevel na WWW httpswwwnaturecomnewspredatory-publishers-are-corrupting-open-access-111385

Bell G (2009) Foreword In Hey T Tansley S amp Tolle K (eds) (2009) The Fourth Paradigm Data-Intensive Scientific Discovery (pp XI-XV) Microsoft Research Disponiacutevel na WWW httpwwwastrocaltechedu~georgeaybi1994th_paradigm_book_complete_lrpdf

Berners-Lee Tim (2010) Is your Linked Open Data 5 Star Disponiacutevel na WWW httpswwww3orgDesignIssuesLinkedDatahtml

Big Data Europe (2016) Big Data Europe Empowering Communities with Data Technologies [Consultado a 22-11-2016] Disponiacutevel na WWW httpswwwbig-data-europeeu

BioDatapt Recursos [Consultado a 18-05-2017] Disponiacutevel na WWW httpwwwbiodataptresourceshtml

Biosharingorg (2017) Policies [Consultado a 22-05-2017] Disponiacutevel na WWW httpsbiosharingorgpolicies

Bjoumlrk B-C Laakso M Welling P amp Paetau P (2014) Anatomy of green open access Journal of the American Society for Information Science and Technology 65 237ndash250 Disponiacutevel na WWW httponlinelibrarywileycomwol1doi101002asi22963full

BOAI - Budapest Open Access Initiative (2002) Disponiacutevel na WWW httpwwwbudapestopenaccessinitiativeorg

116

BOAI - Budapest Open Access Initiative (2012) Ten years on from the Budapest Open Access Initiative setting the default to open Disponiacutevel na WWW httpwwwbudapestopenaccessinitiativeorgboai-10-recommendations

Borges M M (2006) A esfera comunicaccedilatildeo acadeacutemica e novos meacutedia (Tese de Doutoramento) Faculdade de Letras Universidade de Coimbra Portugal Disponiacutevel na WWW httpsestudogeralsibucptjspuibitstream1031685575MMBorges_tesepdf

Borgman C L (2015) Big Data Little Data No Data Scholarship in the Networked World The MIT Press

Bueno de la Fuente G (2016) What is Open Science Introduction Disponiacutevel na WWW httpswwwfosteropenscienceeucontentwhat-open-science-introduction

Cabinet Office (2012) Open Data White Paper Unleashing the Potential Disponiacutevel na WWW httpsdatagovuksitesdefaultfilesOpen_data_White_Paperpdf

Cabinet Office (2013) G8 Open Data Charter and Technical Annex Disponiacutevel na WWW httpswwwgovukgovernmentpublicationsopen-data-charterg8-open-data-charter-and-technical-annex

Cambridge University Press (2017) Cambridge Dictionary Disponiacutevel na WWW httpdictionarycambridgeorgdictionaryenglishpolicy

Carrara W Chan W S Fischer S Steenbergen E (2015) Creating Value through Open Data Study on the Impact of Re-use of Public Data Resources Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_creating_value_through_open_data_0pdf

Carrara W Fischer S Oudkerk F S Steenbergen E amp Tinholt D (2015) Analytical Report 1 Digital Transformations and Open Data Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_analytical_report_n1_-_digital_transformationpdf Carrara W Fischer S Steenbergen E (2015) Analytical Report 2 E-skills and Open Data Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_analytical_report_n2_-_e-skillspdf Carrara W Nieuwenhuis M amp Vollers H (2016) Open Data Maturity in Europe 2016 Insights into the European state of play Disponiacutevel na WWW httpswwwcapgemini-consultingcomresource-file-accessresourcepdfopen_data_maturity_in_europe_2016_final_v10_0pdf

Carrara W Oudkerk F Steenbergen E Tinholt D (2016a) European Data Portal Open Data Goldbook for Data Managers and Data Holders Capgemini Consulting Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesgoldbookpdf

117

Carrara W Engbers W Nieuwenhuis M amp Steenbergen E (2016b) Analytical report nordm4 Open Data in Cities Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_analytical_report_n4_-_open_data_in_cities_v10_finalpdf

Caruso J Nicol A amp Archambault Eacute (2013) Open Access Strategies in the European Research Area (August) 1ndash46 Retrieved from httpeuropaeurapidpress-release_IP-13-786_enhtmlocale=ennhttpwwwscience-metrixcompdfSM_EC_OA_Policiespdf

Carvalho J Furtado F amp Priacutencipe P (2017) WP4 ndash D25 ndash Kit sobre dados de investigaccedilatildeo RCAAP Disponiacutevel na WWW httpprojectorcaapptindexphplang-ptconsultar-recursos-de-apoioremositoryfunc=finishdownampid=395

Christensen-Dalsgaard B et al (2012) Ten recommendations for libraries to get started with research data management Final report of the LIBER working group on E-Science Research Data Management Disponiacutevel na WWW httplibereuropeeuwp-contentuploadsThe20research20data20group20201220v720finalpdf

CKAN CKAN The open source data portal software Disponiacutevel na WWW httpckanorg

Colpaert P Sarah J Peter M Mannens E Van de Walle R (2013) The 5 star of open data portals 7th internacional conference on methodologies Technologies and tools enabling e-Government (MeTTeG) 61-67 Disponiacutevel na WWW httppieterpm5stardataportals5starsofopendataportalspdf

Comissatildeo de Acesso aos Documentos Administrativos (CADA) Quem somos Disponiacutevel na WWW httpwwwcadapt

Comissatildeo Europeia (2011) Open data an engine for innovation growth and transparent governance Communication from the Commission to the European Parliament the Council the European economic and social committee and the committee of the regions (COM [2011] 882) Disponiacutevel na WWW httpwwweuroparleuropaeuRegDatadocs_autres_institutionscommission_europeennecom20110882COM_COM282011290882_ENpdf

Comissatildeo Europeia (2012) COMUNICACcedilAtildeO DA COMISSAtildeO AO PARLAMENTO EUROPEU AO CONSELHO AO COMITEacute ECONOacuteMICO E SOCIAL EUROPEU E AO COMITEacute DAS REGIOtildeES - Melhorar o acesso agrave informaccedilatildeo cientiacutefica rentabilizar o investimento puacuteblico em investigaccedilatildeo COM (2012) 401 final Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentENTXTuri=COM20120401FIN

Comissatildeo Europeia (2013) EU implementation of the G8 Open Data Charter Disponiacutevel na WWW httpseceuropaeudigital-single-marketnewseu-implementation-g8-open-data-charter

Comissatildeo Europeia (2014) COMUNICACcedilAtildeO DA COMISSAtildeO AO PARLAMENTO EUROPEU AO CONSELHO AO COMITEacute ECONOacuteMICO E SOCIAL EUROPEU E AO COMITEacute DAS REGIOtildeES - Para

118

uma economia dos dados proacutespera COM(2014) 442 final Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentENTXTuri=COM20140442FIN

Comissatildeo Europeia (2016a) Open innovation Open Science open to the world A vision for Europe Brussels European Commission Directorate-General for Research and Innovation Disponiacutevel na WWW httpbookshopeuropaeuenopen-innovation-open-science-open-to-the-world-pbKI0416263

Comissatildeo Europeia (2016b) Research amp Innovation News Alert Commission proposes copyright exception for researchers Disponiacutevel na WWW httpeceuropaeuresearchindexcfmpg=newsalertampyear=2016ampna=na-140916

Comissatildeo Europeia (2016c) COMUNICACcedilAtildeO DA COMISSAtildeO AO PARLAMENTO EUROPEU AO CONSELHO AO COMITEacute ECONOacuteMICO E SOCIAL EUROPEU E AO COMITEacute DAS REGIOtildeES ndash Iniciativa Europeia para a Nuvem ndash Construir uma economia de dados e conhecimento competitiva na Europa COM(2016) 178 final Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentPTALLuri=CELEX52016DC0178

Comissatildeo Europeia (2016d) Europa liacuteder mundial da economia baseada nos dados graccedilas agrave iniciativa europeia para a computaccedilatildeo em nuvem Comissatildeo Europeia comunicado de imprensa Disponiacutevel na WWW httpeuropaeurapidpress-release_IP-16-1408_pthtm

Comissatildeo Europeia (2017a) Digital Single Market Digital Economy amp Society Disponiacutevel na WWW httpseceuropaeudigital-single-marketenwhat-big-data-can-do-you

Comissatildeo Europeia (2017b) H2020 Programme AGA ndash Annotated Model Grant Agreement Disponiacutevel na WWW httpeceuropaeuresearchparticipantsdatarefh2020grants_manualamgah2020-amga_enpdf

Comissatildeo Europeia (2017c) COMUNICACcedilAtildeO DA COMISSAtildeO AO PARLAMENTO EUROPEU AO CONSELHO AO COMITEacute ECONOacuteMICO E SOCIAL EUROPEU E AO COMITEacute DAS REGIOtildeES - Construir uma economia de dados proacutespera COM(2017) 9 final Disponiacutevel na WWW httpeceuropaeutransparencyregdocrep12017PTCOM-2017-9-F1-PT-MAIN-PART-1PDF

Comissatildeo Europeia Grupo de peritos de alto niacutevel em dados de investigaccedilatildeo (2010) Riding the wave how Europe can gain from the rising tide of scientific data Disponiacutevel na WWW httpeceuropaeuinformation_societynewsroomcfitemlongdetailcfmitem_id=6204

Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2016a) H2020 Programme Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020 Disponiacutevel na WWW httpseceuropaeuresearchparticipantsdatarefh2020grants_manualhioa_piloth2020-hi-oa-pilot-guide_enpdf

Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2016b) Realising the European Open Science Cloud First report and recommendations Group of the Commission

119

High Level Expert Cloud on the European Open Science Luxemburgo Publications Office of the European Union Disponiacutevel na WWW httpseceuropaeuresearchopensciencepdfrealising_the_european_open_science_cloud_2016pdf

Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2016c) H2020 Programme Guidelines on FAIR Data Management in Horizon 2020 Disponiacutevel na WWW httpeceuropaeuresearchparticipantsdatarefh2020grants_manualhioa_piloth2020-hi-oa-data-mgt_enpdf

Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2017) Open Science Monitor Disponiacutevel na WWW httpeceuropaeuresearchopenscienceindexcfmpg=aboutampsection=monitor

Comissatildeo Executiva Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta (Comissatildeo Executiva GT-PNCA) (2016) Primeiro Relatoacuterio da Comissatildeo Executiva Grupo de Trabalho Para a Poliacutetica Nacional de Ciecircncia Aberta Disponiacutevel na WWW httpmediawixcomugda8bd7c_1ca622bff7f34abbad228ac94e1eda16pdf

Concordat on Open Research Data (2016) Disponiacutevel na WWW httpwwwrcukacukdocumentsdocumentsconcordatonopenresearchdata-pdf

Croll A (2012) The feedback economy In Planning for big data (pp 1-8) Sebastepol OacuteReilly Media

Cybermetrics Lab (2017) Ranking web of repositories [Consultado a 02-02-2017] Disponiacutevel na WWW httprepositorieswebometricsinfoen

Dallmeier-Tiessen et al (2011) Highlights from the SOAP project survey What Scientists Think about Open Access Publishing arXiv11015260 [Cs] 14 httpsarxivorgabs11015260

DataCite (2017a) re3data registry of research data repositories [Consultado a 02-05-2017] Disponiacutevel na WWW httpwwwre3dataorg

DataCite (2017b) Search [Consultado a 02-05-2017] Disponiacutevel na WWW httpssearchdataciteorg

Data Documention Iniciative (DDI) (2016) Document Discover and Interoperate Disponiacutevel na WWW httpwwwddiallianceorg

DataHub Datasets [Consultado a 03-01-2017] Disponiacutevel na WWW httpsdatahubiodatasetq=portugalamppage=1

DataCite (2017) Search [Consultado a 18-05-2017] Disponiacutevel na WWW httpssearchdataciteorg

Davies T (2012) 5-Stars of Open Data Engagement Disponiacutevel na WWW httpwwwtimdaviesorguk201201215-stars-of-open-data-engagement

Davies T (2014) Open data policies and practice an internacional comparison Paper for European Consortium for Political Research Panel P356 ndashThe Impacts of Open Data Disponiacutevel na WWW httpsecpreuFilestorePaperProposald591e267-cbee-4d5d-b699-7d0bda633e2epdf

120

Dawes S Vidiasova L amp Parkhimovich O (2016) Planning and designing open government data programs An ecosystem approach Government Information Quarterly 33(1) 15-27 Disponiacutevel na WWW httpwwwsciencedirectcomsciencearticlepiiS0740624X1630003X

Declaraccedilatildeo de Bethesda sobre a Publicaccedilatildeo em Acesso Aberto (2003) Disponiacutevel na WWW httplegacyearlhamedu~petersfosbethesdahtm

Declaraccedilatildeo de Berlim sobre Acesso Livre ao Conhecimento nas Ciecircncias e Humanidades (2003) Disponiacutevel na WWW httpsrepositoriumsdumuminhoptaboutDeclaracaoBerlimhtm

Decreto-Lei nordm 1152013 de 7 de agosto do Ministeacuterio da Educaccedilatildeo e Ciecircncia Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 151 (2013) 4749-4772 Disponiacutevel na WWW httpsdreptapplicationdirpdf1sdip201308151000474904772pdf

Despacho nordm 153892016 de 12 de dezembro do Ministeacuterio das Financcedilas e da Secretaria de Estado da Cultura e Ciecircncia Tecnologia e Ensino Superior Diaacuterio da Repuacuteblica nordm 2442016 Seacuterie II Nordm 244 (2016) 37155 ndash 37156 Disponiacutevel na WWW httpsdreptapplicationfilea105580126

Dietrich D (2013) Open Government Data principles concepts amp best practice Disponiacutevel na WWW httpworkspaceunpanorgsitesInternetDocumentsUNPAN95209pdf

Dietrich D Cherkasov V Susar D (2013) Open Government Data for Citizen Engagement in Managing Development Disponiacutevel na WWW httpworkspaceunpanorgsitesInternetDocumentsOGDCE20Toolkit20v113-Feb2013pdf

Directory of Open Access Journals (DOAJ) (2017) Search [Consultado a 27-05-2017] Disponiacutevel na WWW httpsdoajorg

Dodds L Newman A (2015) Open Data Maturity Model ed 10 Disponiacutevel na WWW httptheodiorgguidesmaturity-model

Donker F amp van Loenen B (2017) How to assess the sucess of the open data ecossystem Internacional journal of digital eart 10(3) 284-306 Disponiacutevel na WWW httpwwwtandfonlinecomdoifull1010801753894720161224938

Dumbill E (2012) What is Big Data In Planning for big data (pp 9-16) Sebastepol OacuteReilly Media Disponiacutevel na WWW httpeecswsuedu~yinghuimatcoursesfall202015resourcesplanning-for-big-datapdf

e-Infraestruture Reflection Group (e-IRG) (2016) Long Tail of Data e-IRG Task Force Report Disponiacutevel na WWW httpe-irgeudocuments10920238968LongTailOfData2016pdf

ELIXIR Portugal (2015) What is ELIXIR Portugal Disponiacutevel na WWW httpelixir-portugalorg

ePSI Scoreboard (2013) ePSI platform scoreboard Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesoverview_page_-_epsi_platform_scoreboardpdf

Etalab (2011) Licence Ouvert Disponiacutevel na WWW httpswwwetalabgouvfrenlicence-ouverte-open-licence

EUDAT(a) What is EUDAT Disponiacutevel na WWW httpseudateuwhat-eudat

121

EUDAT(b) B2FIND [Consultado a 22-05-2017] Disponiacutevel na WWW httpb2findeudateu

EUR-Lex (2003a) Directive 200398EC of the European Parliament and of the Council of 17 November 2003 on the re-use of public sector information Official Journal of the European Union 90-96 Disponiacutevel na WWW httpeur-lexeuropaeuLexUriServLexUriServdouri=OJL200334500900096enPDF

EUR-Lex (2003b) Directive 20034EC of the European Parliament and of the Council of 28 January 2003 on public access to environmental information and repealing Council Directive 90313EEC Official Journal of the European Union 26-32 Disponiacutevel na WWW httpeur-lexeuropaeuLexUriServLexUriServdouri=OJL200304100260032ENPDF

EUR-Lex (2011) COMMISSION DECISION of 12 December 2011 on the reuse of Commission documents (2011833EU) Official Journal of the European Union 39-42 Disponiacutevel na WWW httpeur-lexeuropaeuLexUriServLexUriServdouri=OJL201133000390042ENPDF

EUR-Lex (2012) COMMISSION RECOMMENDATION of 17 July 2012 on access to and preservation of scientific information (2012417EU) Official Journal of the European Union 39-43 Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentENTXTuri=celex3A32012H0417

EUR-Lex (2013) Directive 201337EU of the European Parliament and of the Council of 26 June 2013 amending Directive 200398EC on the re-use of public sector information Official Journal of the European Union 1ndash8 Disponiacutevel na WWW httpeur-lexeuropaeuLexUriServLexUriServdouri=OJL201317500010008ENPDF

EUR-Lex (2016) REGULAMENTO (UE) 2016679 DO PARLAMENTO EUROPEU E DO CONSELHO de 27 de abril de 2016 relativo agrave proteccedilatildeo das pessoas singulares no que diz respeito ao tratamento de dados pessoais e agrave livre circulaccedilatildeo desses dados e que revoga a Diretiva 9546CE (Regulamento Geral sobre a Proteccedilatildeo de Dados) Jornal Oficial da Uniatildeo Europeia 1-88 Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentPTTXTPDFuri=CELEX32016R0679ampfrom=PT

European Data Portal (2016) Conjuntos de dados [Consultado a 12-05-2017] Disponiacutevel na WWW httpswwweuropeandataportaleudataptdataset

European Research Area and Innovation Committee (ERAC) (2016) ERAC opinion on open research data (ERAC 120216) Disponiacutevel na WWW httpwwweartoeufileadmincontentWebsiteERAC_Opinion_on_Open_Research_DataPDF

Erway R Horton L Nurnberger A Otsuji R amp Rushing A (2016) Building blocks laying the foundation for a research data management program Dublin Ohio OCLC Research Disponiacutevel na WWW httpswwwoclcorgcontentdamresearchpublications2016oclcresearch-data-management-building-blocks-2016pdf

Expert Advisory Group on Data Acess (EAGDA) (2014) Establishing Incentives and changing cultures to support data acess Disponiacutevel na WWW httpswellcomeacuksitesdefaultfilesestablishing-incentives-and-changing-cultures-to-support-data-access-eagda-may14pdf

Executive Office of the President Office of Managment and Budget (2013) MEMORANDUM FOR THE HEADS OF EXECUTIVE DEPARTMENTS AND AGENCIES Open Data Policy - Managing Information as an Asset Disponiacutevel na WWW

122

httpsobamawhitehousearchivesgovsitesdefaultfilesombmemoranda2013m-13-13pdf

Fan W amp Bifet A (2012) Mining Bid Data Current Status and Forecast to the Future SIGKDDExplorations 14(2) 1-5 Disponiacutevel na WWW httpwwwkddorgexploration_filesV14-02-01-Fanpdf

Fecher B amp Friesike S (2013) Open Science One Term Five Schools of Thought In Bartling S amp Friesike (Eds) Opening Science (pp 17-47) New York Springer Disponiacutevel na WWW httpswwwresearchgatenetpublication236607487_Open_Science_One_Term_Five_Schools_of_Thought

FIWARE (2015) Porto a city that has become a real-time guide Disponiacutevel na WWW httpswwwfiwareorg20151120porto-a-city-that-has-become-a-real-time-guide

FORCE11 FAIR Data Publishing Group (2014) The FAIR Data Principles Disponiacutevel na WWW httpswwwforce11orggroupfairgroupfairprinciples

Forsstroumlm P amp Haataja J (2016) Open Science as an Instrument for Effective Research Disponiacutevel na WWW httpojstsvfiindexphpsignumarticleviewFile5874120303

FOSTER (2016) About FOSTER portal Disponiacutevel na WWW httpswwwfosteropenscienceeuabout

Fundaccedilatildeo para a Ciecircncia e Tecnologia [FCT] (2014) Poliacutetica sobre a Disponibilizaccedilatildeo de Dados e outros Resultados de Projetos de IampD Financiados Pela FCT Disponiacutevel na WWW httpswwwfctptdocumentosPoliticaAcessoAberto_Dadospdf

G20rsquos Anti-corruption Working Group (2014) G20 Anti-corruption Open Data Principles Disponiacutevel na WWW httpwwwg20utorontoca2015G20-Anti-Corruption-Open-Data-Principlespdf

Garcia M (2015) New businesses around open data smart cities and Fiware European Public Sector Information Platform Topic Report Nordm 201504 Disponiacutevel na WWW httpwwwinvesthorizoneuresourcesdocuments6263232145-New-Businesses-Around-Open-Data-Smart-Cities-FIWAREpdf

Garfield E (2006) The History and Meaning of the Journal Impact Factor Journal of the American Medical Association (JAMA) 293 90-93 Disponiacutevel na WWW httpgarfieldlibraryupennedupapersjifchicago2005pdf

GitHub (2017) Search [Consultado a 18-05-2017] Disponiacutevel na WWW httpsgithubcomsearchutf8=E29C93ampq=portugalamptype=

Gomes A amp Soares D (2014) Open government iniciatives in Europe nothern versus Southern countries analysis In ICEGOV2014 Outubro 27-30 Guimaratildees Portugal Disponiacutevel na WWW httphdlhandlenet182237172

Gonzalez-Zapata F amp Heeks R (2015) The multiple meanings of open government data understanding different stakeholders and their perspectives Government Information Quarterly 32(4) 441-452 Disponiacutevel na WWW httpsdoiorg101016jgiq201509001

123

Granickas K (2013) Understanding the impact of releasing and re-usinf open government data European Public Sector Information Platform Topic Report Nordm 2013 08 Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfileslibrary201308_understanding_the_impact_of_releasing_and_re_using_open_datapdf

Hahnel M amp Hook D (2016) Open by default In Treadway J et al The state of open data a selections of analyses and articles about open data curated by Figshare (pp 3-6) Disponiacutevel na WWW httpsfigsharecomarticlesThe_State_of_Open_Data_Report40363981

Harnad S et al (2004) The AccessImpact Problem and the green and gold roads to Open Access Serials Review 30(4) Disponiacutevel na WWW httpusersecssotonacukharnadTempimpacthtml

Harnad S amp Brody T (2004) Comparing the Impact of Open Access (OA) vs Non-AO Articles in the Same Journals D-Lib Magazine 10(6) Disponiacutevel na WWW httpwwwdliborgdlibjune04harnad06harnadhtml

Hernaacutendez-Peacuterez T (2016) En la era de la web de los datos primero datos abiertos despueacutes datos massivos El profesional de la informacioacuten 25(4) 517-525 Disponiacutevel na WWW httpsdoiorg103145epi2016jul01

Hey T Tansley S amp Tolle K (2009) Jim Gray on eScience A Transformed Scientific Method In Hey T Tansley S amp Tolle K (eds) (2009) The Fourth Paradigm Data-Intensive Scientific Discovery (pp 5-12) Microsoft Research Disponiacutevel na WWW httpwwwastrocaltechedu~georgeaybi1994th_paradigm_book_complete_lrpdf

Hogge B (2010) Open Data Study Open Society Institute Disponiacutevel na WWW httpwwwtransparencyinitiativeorgwpcontentuploads201105open_data_study_finalpdf

Houghton J amp Swan A (2013) Planting the green seeds for a golden harvest Comments and clarifications on ldquoGoing for Goldrdquo D-Lib Magazine 19 1ndash2 Disponiacutevel na WWW httpdoiorg101045january2013-houghton

Huijboom N van den Broek T (2011) Open Data an internacional comparison of strategies European Journal of ePractice 12 4-16 Disponiacutevel na WWW httpsjoinupeceuropaeusitesdefaultfiles76a705ePractice20Journal-20Vol2012-March_April202011pdf

Internacional Council for Science (ICSU) (2014) Open acess to scientific data and literature and the assessement of research by metrics Disponiacutevel na WWW httpwikilibsunaczaimagesbb8Icsu-report-on-open-accesspdf

International Open Data Charter (2015) Open Data Charter Disponiacutevel na WWW httpopendatacharternet

International Workshop on Open Data for Science and Sustainability in Developing Countries (2014) Data Sharing Principles in Developing Countries (The Nairobi Data Sharing Principles)

124

Disponiacutevel na WWW httpswwwrd-allianceorgsitesdefaultfilesattachmentNairobiDataSharingPrinciplespdf

Janssen M (2011) The influence of the PSI directive on open government data an overview of recent developments Government Information Quaterly 28 446-456 Disponiacutevel na WWW httpsdoiorg101016jgiq201101004

Janssen M Charalabidis Y amp Zuiderwijk A (2012) Benefits adoption barriers and myths of open data and open government Information Systems Management 4 258-268 Disponiacutevel na WWW httpwwwtandfonlinecomdoiabs101080105805302012716740

Jenssen K (2012) Open Government Data and the right to information opportunities and obstacles The Journal of Community Informatics 8 (2) Disponiacutevel na WWW httpci-journalnetindexphpciejarticleview952

Koski H (2015) The impact of open data ndash a preliminary study Ministry of Finance publications 15b2015 Disponiacutevel na WWW httpswwww3org2013share-psiwikiimages667Impact_of_Open_Data_in_the_Public_Sector_Koski_2015pdf

Kramer B amp Bosman J (2016) Innovations in Scholarly Communication [Consultado a 24-02-2017] Disponiacutevel na WWW https101innovationswordpresscom

Laakso M (2014) Green open access policies of scholarly journal publishers A study of what when and where self-archiving is allowed Scientometrics 99(2) 475ndash494 Disponiacutevel na WWW httpdoiorg101007s11192-013-1205-3

Laumlmmerhirt D (2016) PASTEUR4OA Briefing Paper Disciplinary differences in opening research data Disponiacutevel na WWW httpwwwpasteur4oaeuresources209

Laney D (2001) 3-D Data Management Controlling DataVolume Velocity and Variety META Group Disponiacutevel na WWW httpswwwnoexperiencenecessarybookcom8VeXJ3d-data-management-controlling-data-volume-velocity-and-varietyhtml

Lei nordm 462007 de 24 de Agosto Regula o acesso aos documentos administrativos e a sua reutilizaccedilatildeo revoga a Lei nordm 6593 de 26 de Agosto com a redaccedilatildeo introduzida pelas Lei nordm 895 de 29 de Marccedilo e 9499 de 16 de Julho e transpotildee para a ordem juriacutedica nacional a Diretiva nordm 200398CE do Parlamento e do Conselho de 17 de Novembro relativa agrave reutilizaccedilatildeo de informaccedilotildees do sector puacuteblico Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 163 (2007) 5680-5687 Disponiacutevel na WWW httpswwwfctptarquivodocsLei46_2007pdf

Lei nordm 362011 de 21 de Junho Estabelece a adopccedilatildeo de normas abertas nos sistemas informaacuteticos do Estado Diaacuterio da Repuacuteblica 1ordf seacuterie mdash Nordm 118 (2011) 3599-3600 Disponiacutevel na WWW httpsm6amaptdocsLei362011-NormasAbertaspdf

Lei nordm 262016 de 22 de Agosto Aprova o regime de acesso agrave informaccedilatildeo administrativa e ambiental e de reutilizaccedilatildeo dos documentos administrativos transpondo a Diretiva 20034CE do Parlamento Europeu e do Conselho de 28 de janeiro e a Diretiva 200398CE do Parlamento Europeu e do Conselho de 17 de novembro Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 160 (2016) 2777-2788 Disponiacutevel na WWW httpsdreptapplicationconteudo75177801

125

Leonelli S (2016) Why open data now Big data knowledge production and the political economy of research In Treadway J et al The state of open data a selections of analyses and articles about open data curated by Figshare (pp 7-11) Disponiacutevel na WWW httpsfigsharecomarticlesThe_State_of_Open_Data_Report40363981

Leonelli S Spichtinger D and Prainsack B (2015) Sticks and carrots encouraging open science at its source Geography and Environment 2 12ndash16 Disponiacutevel na WWW httponlinelibrarywileycomenhancedexportCitationdoi101002geo22

Lisboa Cacircmara Municipal (2016) Smart Open Lisboa Disponiacutevel na WWW httpwwwsmartopenlisboacom

Lisboa Cacircmara Municipal (2017) Lisboa Aberta [Consultado a 12-05-2017] Disponiacutevel na WWW httpdadoscm-lisboaptdataset

Lynch C (2009) Jim Grayrsquos Fourth Paradigm and the Construction of the Scientific Record In Hey T Tansley S amp Tolle K (eds) (2009) The Fourth Paradigm Data-Intensive Scientific Discovery (pp 177-183) Microsoft Research Disponiacutevel na WWW httpwwwastrocaltechedu~georgeaybi1994th_paradigm_book_complete_lrpdf

Machado Jorge (2015) Open Data and Open Science In Albagli S Maciel M amp Abdo A (Eds) Open Science Open Issues 189-214 Brasiacutelia IBICT Rio de Janeiro Unirio Disponiacutevel na WWW httplivroabertoibictbrbitstream110611Open20Science20open20issues_Digitalpdf

Manyika J Chui M Brown B Bughin J Dobbs R Roxburgh C amp Byers A H (2011) Big Dat The next frontier for innovation competition and productivity McKinsey Global Institute Disponiacutevel na WWW httpwwwmckinseycombusiness-functionsdigital-mckinseyour-insightsbig-data-the-next-frontier-for-innovation

Marr B (2014) Big Data The 5 Vs Everyone Must Know Disponiacutevel na WWW httpswwwlinkedincompulse20140306073407-64875646-big-data-the-5-vs-everyone-must-know

Naccedilotildees Unidas (2015) Addis Ababa Action Agenda of the Third International Conference on Financing for Development (Addis Ababa Action Agenda) Disponiacutevel na WWW httpssustainabledevelopmentunorgcontentdocuments2051AAAA_Outcomepdf

National Institutes of Health (NIH) (2008) NIH Guide Notice for Public Access Disponiacutevel na WWW httpgrantsnihgovgrantsguidenotice-filesNOT-OD-08-033html

Nature Springer (2016) Over 600 Springer Nature journals commit to new data sharing policies Disponiacutevel na WWW httpwwwspringernaturecombrgroupmediapress-releasesover-600-springer-nature-journals-commit-to-new-data-sharing-policies11111248

OECD (2007) Principles and Guidelines for Access to Research Data from Public Funding Paris OECD Publishing Disponiacutevel na WWW httpwwwoecdorgstisci-techoecdprinciplesandguidelinesforaccesstoresearchdatafrompublicfundinghtm

126

OECD (2013) Open Government data In Government at a Glance 2013 (pp 140-142) Paris OECD Publishing Disponiacutevel na WWW httpdxdoiorg101787gov_glance-2013-48-en

OECD (2015a) Making Open Science a Reality OECD Science Tecnology and Industy Policy Papers 25 Paris OECD Publications Disponiacutevel na WWW httpdoiorg1017875jrs2f963zs1-en

OECD (2015b) Assessing government initiatives on public sector information A review of the OECD Council Recommendation OECD Digital Economy Papers 248 Paris OECD Publishing Disponiacutevel na WWW httpdxdoiorg1017875js04dr9l47j-en

OECD (2016a) Open Government Data Disponiacutevel na WWW httpwwwoecdorggovdigital-governmentopen-government-datahtm

OECD (2016b) Observatory of Public Sector Innovation Disponiacutevel na WWW httpswwwoecdorggovernanceobservatory-public-sector-innovationhome

Olavsrud T (2013 Abril 05) 10 intriguing real-world uses for big data Computer World Disponiacutevel na WWW httpwwwcomputerworldcomarticle2473691big-data92712-10-Real-World-Big-Data-Deployments-That-Will-Change-Our-Liveshtml

Open Acess Directory (2016) Data repositories [Consultado a 22-02-2017] Disponiacutevel na WWW httpoadsimmonseduoadwikiData_repositories

OpenAIRE Research Data [Consultado a 12-05-2017] Disponiacutevel na WWW httpswwwopenaireeusearchfinddatasetskeyword=

OpenAIRE (2017) About OpenAIRE-Connect Disponiacutevel na WWW httpswwwopenaireeuconnect

Open and Agile Smart Cities (OASC) (2017) Cities [Consultado a 17-05-2017] Disponiacutevel na WWW httpwwwoascitiesorglist-of-cities

Open Data for Development Network (OD4D[a]) About OD4D [Consultado a 16-02-2017] Disponiacutevel na WWW httpod4dcomabout

Open Data for Development Network (OD4D[b]) Open Data Impact Map [Consultado a 16-02-2017] Disponiacutevel na WWW httpopendataimpactmaporgindexhtml

Open Data for Development Network (OD4D) (2016) Summary report and the Second Action Plan for International Collaborations International Open Data Roadmap International Open Data Conference 2016 6-7 outubro Madrid Espanha Disponiacutevel na WWW httpod4dcomroadmapassetsfilesreport-iodc-2016-webpdf

Open Data Institute (ODI) (2012) About the ODI Disponiacutevel na WWW httptheodiorgabout

Open Data Institute (ODI) (2015) Open Data Maturity Model assessing your open data publishing and use Disponiacutevel na WWW httpsptscribdcomdocument260481608ODI-Maturity-Model-Guide-Assessing-your-open-data-publishing-and-use

127

Open Data Soft (2017) A comprehensive list of 2600+ Open Data portals around the world [Consultado a 15-04-2017] Disponiacutevel na WWW httpswwwopendatasoftcoma-comprehensive-list-of-all-open-data-portals-around-the-world

Open Government Partnership (OGP) (2011) Open Government Declaration Disponiacutevel na WWW httpswwwopengovpartnershiporgopen-government-declaration

Open Government Partnership (OGP) (2015) What is the Open Government Partnership Disponiacutevel na WWW httpwwwopengovpartnershiporg

Open Government Partnership (OGP) (2016) PARIS DECLARATION 4th Global Summit of the Open Government Partnership Disponiacutevel na WWW httpwwwopengovpartnershiporgsitesdefaultfilesOGP-Summit_PARIS-DECLARATION_ENpdf

Open Knowledge International (OKI [a]) Open Definition 21 Disponiacutevel na WWW httpopendefinitionorgod21en

Open Knowledge International (OKI [b]) Linked Open Vocabularies [Consultado a 31-01-2017] Disponiacutevel na WWW httplovokfnorgdatasetlov

Open Knowledge International (OKI [c]) Open Data Commons Disponiacutevel na WWW httpopendatacommonsorg

Open Knowledge International (OKI [d]) Datahub [Consultado a 18-02-2017] Disponiacutevel na WWW httpsdatahubio

Open Knowledge International (OKI) (2012a) The Open Data Handbook Disponiacutevel na WWW httpopendatahandbookorgguideen

Open Knowledge International (OKI) (2012b) What is open Disponiacutevel na WWW httpsokfnorgopendata

Open Knowledge International (OKI) (2014) Portugal Open Data Census Disponiacutevel na WWW httppt-citycensusokfnorgyear2014

Open Knowledge International (OKI) (2017) Global Open Data Index Disponiacutevel na WWW httpindexokfnorgplace

Open Knowledge International Working Group on Open Government Data () Open Government Data Disponiacutevel na WWW httpopengovernmentdataorg

Open Science and Research Iniciative (2014) The Open Science and Research Handbook Disponiacutevel na WWW httpsavointiedefidocuments142730Open+Science+and+Research+Handbook+v1050316d5d-440b-4496-b039-2997663afff8

Open Science Monitor (2015) Open Science Monitor Disponiacutevel na WWW httpopendatamonitoreu

128

Pangea (2017) Search [Consultado a 18-05-2017] Disponiacutevel na WWW httpswwwpangaeadeq=Portugal

Panton Principles (2010) Panton Principles Principles for open data in science Disponiacutevel na WWW httppantonprinciplesorg

Pasqueto I Sands A amp Borgman C (2015 novembro) Exploring openess in data and science What is ldquoopenrdquo to whom when and why Apresentado em ASIST 2015 6 - 10 Novembro St Louis MO USA Disponiacutevel na WWW httponlinelibrarywileycomdoi101002pra220151450520100141full

Pontika N Knoth P Cancellieri M amp Pearce S (2015 outubro) Fostering Open Science to Research using a Taxonomy and an eLearning Portal Apresentado em I-KNOW rsquo15 Proceedings of the 15th International Conference on Knowledge Technologies and Data-Driven Busines 21 - 22 Outubro 2015 1ndash8 Graz Austria Disponiacutevel na WWW httpdoiorg10114528095632809571

Pontika N Knoth P Cancellieri M amp Pearce S (2015) Open Science Taxonomy Figshare Disponiacutevel na WWW httpsdxdoiorg106084m9figshare1508606v3

Portal de Dados de Biodiversidade de Portugal (2016) Dados [Consultado a 18-05-2017] Disponiacutevel na WWW httpdadosgbifpt

Portaria nordm 2852015 de 15 de setembro do Ministeacuterio da Educaccedilatildeo e Ciecircncia Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 180 (2015) 8011-8014 Disponiacutevel na WWW httpsdreptapplicationconteudo70297426 Porto Cacircmara Municipal Dados Abertos para uma cidade mais inteligente [Consultado a 22-05-2017] Disponiacutevel na WWW httpdadosabertoscm-portoptabout

Portugal Governo (2017) Portal da Transparecircncia Municipal [Consultado a 20-05-2017] Disponiacutevel na WWW httpswwwportalmunicipalpthomelocale=pt

Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior Ministeacuterio da Cultura (2016) Diretoacuterio dos Repositoacuterios Digitais Disponiacutevel na WWW httprepositorios-conhecimentopt

Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior (MCTES) (2016) Ciecircncia Aberta Conhecimento para todos Princiacutepios orientadores Disponiacutevel na WWW httpwwwportugalgovptmedia1850619920160210-mctes-ciencia-abertapdf

Price D amp Chaytor S (2015) Open Access is a national licence the answer Disponiacutevel na WWW httpwwwhepiacuk20150330open-access-national-licence-answeruna-licencia-nacional-es-la-respuesta

Proumll S Meixner K amp Rauber A (2016) Precise Data Identification Services for Long Tail Research Data Proceedings of International Conference on Digital Preservation Bern Switzerland Disponiacutevel na WWW httpswwwrd-allianceorgsystemfilesdocumentsiPRES2016-Proellpdf

129

Rans J Day M Duke M amp Ball A (2013) Enabling the citation of datasets generated through public health research (DCC) 41 Retrieved from httpswellcomeacuksitesdefaultfilesenabling-citation-of-datasets-through-public-health-research-phrdf-2013PDF

RECODE (2014) Policy recommendations for open access to research data Disponiacutevel na WWW httprecodeprojecteuwp-contentuploads201501recode_guideline_en_web_version_full_FINALpdf

Registry of Open Access Repository Mandates and Policies (ROARMAP) Browse [Consultado a 25-11-2016] Disponiacutevel na WWW httproarmapeprintsorgviewcountry620html

Reitano S (2013) The Benefits of Open Data Royal Roads University Disponiacutevel na WWW httpdocplayernet589190-The-benefits-of-open-datahtml

Resoluccedilatildeo do Conselho de Ministros nordm 912010 Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 225 (2010) 5288-5307 Disponiacutevel na WWW httpsdreptapplicationdirpdf1s201011225000528805307pdf

Resoluccedilatildeo do Conselho de Ministros nordm 212016 Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 70 (2016) 1191-1193 Disponiacutevel na WWW httpsdreptapplicationconteudo74094659

Research Data Alliance (RDA) (2015) 23 Things Libraries for Research Data Disponiacutevel na WWW httpswwwrd-allianceorgsystemfilesdocuments23Things_Libraries_For_Data_Managementpdf

Ribeiro C et al (2016) Projeto TAIL ndash Gestatildeo de dados de investigaccedilatildeo da produccedilatildeo ao depoacutesito e agrave partilha (resultados preliminares) Cadernos BAD 2 (jul-dez) 256-264 Disponiacutevel na WWW httpwwwbadptpublicacoesindexphpcadernosarticleviewFile1603pdf

Rouder J (2016) The what why and how of born-open data Behavior Research Methods 48(3) 1062-1069 Disponiacutevel na WWW httplinkspringercomarticle103758s13428-015-0630-z

Royal Society (2012) Science as an Open Enterprise The Royal Society Policy Centre Report 0212 Disponiacutevel na WWW httpsroyalsocietyorgtopics-policyprojectsscience-public-enterprisereport

Sasse T Smith A Broad E Tennison J Wells P amp Atz U (2017) Recomendations for Open Data Portals from Setup to sustainability Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_s3wp4_sustainability_recommendationspdf

Schiermeier Q (2015 Dezembro 04) Pirate research-paper sites play hide-and-seek with publishers Nature Internacional weekly journal of science Disponiacutevel na WWW httpwwwnaturecomnewspirate-research-paper-sites-play-hide-and-seek-with-publishers-118876

130

Science International (2015) Open Data in a Big Data World Paris International Council for Science (ICSU) International Social Science Council (ISSC) The World Academy of Sciences (TWAS) InterAcademy Partnership (IAP) Disponiacutevel na WWW httpwwwscience-internationalorgsitesdefaultfilesreportsopen-data-in-big-data-world_short_enpdf

Science International (2016) About Science International Disponiacutevel na WWW httpwwwscience-internationalorgabout

ScienceOpen (2017) About ScienceOpen Disponiacutevel na WWW httpaboutscienceopencomcategoryabout-scienceopen

Sci-Hub About Disponiacutevel na WWW httpsci-hubio

Shadbolt N (2016) Foreword In Treadway J et al The state of open data a selections of analyses and articles about open data curated by Figshare (pp 2) Disponiacutevel na WWW httpsfigsharecomarticlesThe_State_of_Open_Data_Report40363981

SHERPAJULIET Research funders open access policies [Consultado a 26-11-2016] Disponiacutevel na WWW httpsherpaacukjulietindexphpla=enampmode=simple

SHERPARoMEO Publisher copyright policies amp self-archiving [Consultado a 26-11-2016] Disponiacutevel na WWW httpsherpaacukromeoindexphpla=enampfIDnum=1109|1ampmode=advanced

Soares N Baptista A amp Lima A (2015) Estudo Open Data Municiacutepios Quadrilaacutetero Disponiacutevel na WWW httpwwwccgptwp-contentuploads201510OpendataQuadrilatero_Estudopdf

SPARC Open Data Disponiacutevel na WWW httpsparcopenorgopen-data

Sponsoring Consortium for Open Access Publishing in Particle Physics (SCOAP3) (2014) What is SCOAP3 Disponiacutevel na WWW httpsscoap3orgwhat-is-scoap3

Statement on Data Sharing in Public Health Emergencies (2016) Disponiacutevel na WWW httpblogsplosorgplos201602statement-on-data-sharing-in-public-health-emergencies

Sturges P Bamkin M Anders J Hubbard B Hussain A amp Heeley M (2015) Research data sharing developing a stakeholder-driven model for journal policies Journal of the Association for Information Science and Technology 66(12) 2445-2455 Disponiacutevel na WWW httponlinelibrarywileycomdoi101002asi23336abstract

Suber P (2008) Open Access News Disponiacutevel na WWW httplegacyearlhamedu~petersfos200808greengold-oa-and-gratislibre-oahtml

Suber P (2009) Ten challenges for open-access journals SPARC Open Access Newsletter 138 Disponiacutevel na WWW httplegacyearlhamedu~petersfosnewsletter10-02-09htm

Suber P (2012) Open Access Cambridge MIT Press Disponiacutevel na WWW httpsmitpressmitedusitesdefaultfiles9780262517638_Open_Access_PDF_Versionpdf

131

Sunlight Foundation (2010) Ten Principles for Opening Up Government Information Disponiacutevel na WWW httpssunlightfoundationcompolicydocumentsten-open-data-principles

Sunlight Foundation (2013) Public Policy for Public Data Disponiacutevel na WWW httpwhatworkscitiessunlightfoundationcomsection-h2-02

Sunlight Foundation (2014) Guidelines for Open Data Policies Disponiacutevel na WWW httpssunlightfoundationcomopendataguidelines

Sunlight Foundation Open Data Policy Collection [Consultado a 12-05-2017] Disponiacutevel na WWW httpwwwopendatapoliciesorgbrowse

Swan A (2010) The open access citation advantage studies and results to date Disponiacutevel na WWW httpeprintssotonacuk2685162Citation_advantage_paperpdf

Swan A (2012) Diretrizes para as Poliacuteticas de desenvolvimento do acesso aberto UNESCO Paris Disponiacutevel na WWW httpunesdocunescoorgimages0021002158215863epdf

Tauberer Joshua (2014) Open Government Data The Book (2ordf ed) Disponiacutevel na WWW httpsopengovdataio20148-principles

Taunabaum G Implementing an Open Data Policy a SPARC Primer for Research Funders Disponiacutevel na WWW httpssparcopenorgwp-contentuploads201601sparc-open-data-primer-finalpdf

Transparecircncia e Integridade Associaccedilatildeo Ciacutevica (2016) Iacutendice de Transparecircncia Municipal Disponiacutevel na WWW httpstransparenciaptindice-de-transparencia-municipal

The UN Secretary Generals Independent Expert Advisory Group on a Data Revolution for Sustainable Development (2014a) UN Data Revolution Disponiacutevel na WWW httpwwwundatarevolutionorg

The UN Secretary Generals Independent Expert Advisory Group on a Data Revolution for Sustainable Development (2014b) A world that counts mobilising the data revolution for sustainable development Disponiacutevel na WWW httpwwwundatarevolutionorgwp-contentuploads201411A-World-That-Countspdf

The World Bank (2016) Open Government Data Toolkit Disponiacutevel na WWW httpopendatatoolkitworldbankorgenindexhtml

Ubaldi B (2013) Open Government Data Towards empirical analysis of open government data initiatives Disponiacutevel na WWW httpwwwoecd-ilibraryorggovernanceopen-government-data_5k46bj4f03s7-en

UK Data Archive (2017) Create amp Manage Data Research Data Lifecycle Disponiacutevel na WWW httpwwwdata-archiveacukcreate-managelife-cycle

UK The National Archives Open Government Licence for Public Sector Information Disponiacutevel na WWW httpwwwnationalarchivesgovukdocopen-government-licenceversion3

132

UNESCO (2015) Concepts of Openness and Open Access Open Access for Researchers Paris UNESCO Disponiacutevel na WWW httpunesdocunescoorgimages0023002322232207Epdf Uniatildeo Europeia (2013) REGULAMENTO (UE) Nordm 12912013 DO PARLAMENTO EUROPEU E DO CONSELHO de 11 de dezembro de 2013 Jornal Oficial da Uniatildeo Europeia Disponiacutevel na WWW httpeceuropaeuresearchparticipantsdatarefh2020legal_basisfph2020-eu-establact_ptpdf

Uniatildeo Europeia (2017) European Union Open Data Portal [Consultado a 12-05-2017] Disponiacutevel na WWW httpdataeuropaeueuodpendata

United Nations Statistics Division (2017) UN data a world of information [Consultado a 13-05-2017] Disponiacutevel na WWW httpdataunorgSearchaspxq=Portugalampt=Data

United States General Services Administration Datagov Disponiacutevel na WWW httpswwwdatagovopen-gov

Universidade do Minho (2017) Open Access Disponiacutevel na WWW httpsopenaccesssdumuminhoptpage_id=352

Universidade do Porto Faculdade de Engenharia (2017) Dendro The convergence between data management and description Disponiacutevel na WWW httpdendrofeupptblogindexphpdendro

Welcome Trust (2013) Open access policy Disponiacutevel na WWW httpswellcomeacukfundingmanaging-grantopen-access-policy

Whyte A amp Donnely M (2016) Common directions in research data policy a briefing for iInstitutions DCC Briefing Papers Edinburgh Digital Curation Centre Disponiacutevel na WWW httpwwwdccacukresourcesbriefing-paperscommon-directions-research-data-policycommon-directions-research-data-pol

World Council on City Data (2016) Data Portal [Consultado a 12-04-2017] Disponiacutevel na WWW httpopendataforcitiesorg

World Wide Web Consortium [W3C] (2014) Data Catalog Vocabulary (DCAT) Disponiacutevel na WWW httpswwww3orgTRvocab-dcat

World Wide Web Consortium [W3C] (2015) Linked Data Disponiacutevel na WWW httpswwww3orgstandardssemanticwebdata

World Wide Web Foundation (2014 maio) Towards common methods for assessing open data workshop report amp draft framework Apresentado em Towards common methods for assessing open data 2014 8 - 9 Maio Nova Iorque EUA Disponiacutevel na WWW httpopendataresearchorgsitesdefaultfilespostsCommon20Assessment20Workshop20Reportpdf

World Wide Web Foundation (2017) ODB Global Report Fourth Edition Disponiacutevel na WWW httpopendatabarometerorgdoc4thEditionODB-4thEdition-GlobalReportpdf

133

Zuiderwijk A Gasco M Parycek P amp Janssen M (2014) Special issue on transparency and open data policies guest editors introduction Journal of theoretical and applied electronic commerce research 9(3) I-IX Disponiacutevel na WWW httpwwwscieloclscielophpscript=sci_arttextamppid=S0718-18762014000300001

Zuiderwijk A amp Janssen M (2014) Open data policies their implementation and impact a comparison Framework Government Information Quaterly 31(1) 17-29 Disponiacutevel na WWW httpwwwsciencedirectcomsciencearticlepiiS0740624X13001202

134

LISTA DE SIGLAS AA - Acesso Aberto AMA - Agecircncia para a Modernizaccedilatildeo Administrativa APC - Article Processing Charge API - Application Programming Interface APIS - Arquivo Portuguecircs de Informaccedilatildeo Social BOAI - Budapest Open Access Initiative CA - Ciecircncia Aberta CADA - Comissatildeo de Aceso aos Documentos Administrativos CC - Creative Commons CERN - European Organization for Nuclear Research CML - Cacircmara Municipal de Lisboa DCAT - Data Catalog Vocabulary DCC - Digital Curation Center DDI - Data Documentation Initiative DGA - Dados Governamentais Abertos DMP - Data Management Plan DOAJ - Directory of Open Access Journals DOI - Digital Object Identifier EAGDA - Expert Advisory Group on Data Access e-IRG - e-Infrastructure Reflection Group EOSC - European Open Science Cloud ERAC - European Research Area and Innovation Committee EU - Uniatildeo Europeia EUA - Estados Unidos da Ameacuterica FCCN - Fundaccedilatildeo para a Computaccedilatildeo Cientiacutefica Nacional FCT - Fundaccedilatildeo para a Ciecircncia e Tecnologia FI - Fator de Impacto FOI - Freedom of Information FOSTER - Facilitate Open Science Training for European Research GBIF - Global Biodiversity Information Facility ICSU - International Council for Science INE - Instituto Nacional de Estatiacutestica IPCB - Instituto Politeacutecnico de Castelo Branco ITM - Iacutendice de Transparecircncia Municipal JISC - Joint Information Systems Committee MCTES - Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior NIH - National Institutes of Health OAI-PMH - Open Archive Initiative ndash Protocol for Metadata Harvesting OD4D - Open Data for Development

135

ODC - Open Data Commons ODIN - Open Data Inventory ODRA - Open Data Readiness Assessment OECD - Organizaccedilatildeo para a Cooperaccedilatildeo e Desenvolvimento Econoacutemico OGD - Open Government data OGL - Open Government Licence OGP - Open Government Partnership OGWG - Open Government Working Group OKI - Open Knowledge International OpenDOAR - Directory of Open Access Repositories PLOS - Public Library of Science PSI - Public Sector Information RCAAP - Repositoacuterio Cientiacutefico de Acesso Aberto de Portugal RDA - Research Data Aliance RDF - Resource Description Framework Re3data - Registry of Research Data Repositories ROARMAP - Registry of Open Access Repository Mandates and Policies SARDC - Serviccedilo de Alojamento de Repositoacuterio de Dados Cientiacuteficos SCOAP3 - Sponsoring Consortium for Open Access Publishing in Particle Physics SNIAmb - Sistema Nacional de Informaccedilatildeo de Ambiente SOAP - Study of Open Access Publishing SPARC - Scholarly Publishing and Academic Resources Coalition W3C - World Wide Web Consortium

136

IacuteNDICE DE FIGURAS

Fig 1 Os pilares da Ciecircncia Aberta 17 Fig 2 As 5 escolas de pensamento das mudanccedilas operadas pela Ciecircncia Aberta 18 Fig 3 Caracteriacutesticas e indicadores do Open Science Monitor 20 Fig 4 Taxonomia da Ciecircncia Aberta 22 Fig 5 Paradigmas da investigaccedilatildeo cientiacutefica 25 Fig 6 Cadeia de abastecimento dos Dados Massivos 27 Fig 7 A cauda longa dos Dados Massivos 28 Fig 8 Ciclo de vida dos dados de investigaccedilatildeo 31 Fig 9 Tipos de dados cientiacuteficos 34 Fig 10 Esquema de classificaccedilatildeo das 5 estrelas para Dados Abertos Ligados 35 Fig 11 Pilares dos Dados Governamentais Abertos 40 Fig 12 Perspetivas da abertura dos dados governamentais 44 Fig 13 Esquema de classificaccedilatildeo das 5 estrelas para as iniciativas de abertura de dados que envolvem os utilizadores 45 Fig 14 Esquema de classificaccedilatildeo das 5 estrelas para os portais de dados 50 Fig 15 Princiacutepios FAIR Data 61 Fig 16 Estrutura de avaliaccedilatildeo de poliacuteticas de Dados Abertos 67

137

IacuteNDICE DE QUADROS

Quadro 1 Princiacutepios de abertura de dados de investigaccedilatildeo mais recomendados 33 Quadro 2 Princiacutepios de abertura mais recomendados pelas iniciativas de Dados Governamentais Abertos 43 Quadro 3 Visatildeo geral sobre o contexto conteuacutedo e desempenho da poliacutetica de Dados Abertos em Portugal com base no esquema delineado por Zuiderwijk e Janssen (2014) 85 Quadro 4 Comparaccedilatildeo dos resultados de abertura de dados atribuiacutedos pelas vaacuterias iniciativas de avaliaccedilatildeo 95 Quadro 5 Portais de dados abertos existentes em Portugal 97

138

IacuteNDICE DE GRAacuteFICOS

Graacutefico 1 Nuacutemero de datasets publicados no SARDC nos anos seguintes agrave sua criaccedilatildeo 80 Graacutefico 2 Maiores fornecedores de dados do portal nacional 87 Graacutefico 3 Tipologia dos fornecedores de dados do portal nacional 88 Graacutefico 4 Tipologia das categorias de dados do portal nacional 88

Page 3: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação

Faculdade de Letras

As poliacuteticas de Open Data em Portugal

Anaacutelise da sua implementaccedilatildeo e impacto

Ficha Teacutecnica

Tipo de trabalho Dissertaccedilatildeo de Mestrado Tiacutetulo As poliacuteticas de Open Data em Portugal anaacutelise da sua

implementaccedilatildeo e impacto Autores Paulo Fernando Pereira da Silva

Orientador Prof Doutora Maria Manuel Borges Coorientador Prof Doutora Daniela de Filippo

Identificaccedilatildeo do Curso 2ordm Ciclo em Ciecircncia da Informaccedilatildeo Data da entrega

Data de realizaccedilatildeo das provas

Membros do Juacuteri Presidente

Vogais

Classificaccedilatildeo

14-06-2017 28-07-2017 Prof Doutora Maria da Graccedila Melo Simotildees Prof Doutora Maria Manuel Lopes Figueiredo Costa Marques Borges Prof Doutor Andreacutes Pandiella Dominique 19

ii

iii

Aos meus pais Gracinda e Fernando

Agrave Sara namorada companheira e amiga

iv

v

AGRADECIMENTOS

O sucesso neste percurso acadeacutemico deve-se tambeacutem a todos os que me apoiaram incentivaram e inspiraram nos melhores e nos piores momentos tornando o caminho mais faacutecil de percorrer Espero que as palavras seguintes faccedilam justiccedila ao sentimento de agradecimento que pretendo transmitir

Agrave Professora Doutora Maria Manuel Borges a quem devo a introduccedilatildeo a este tema pela total disponibilidade pelo aconselhamento acadeacutemico e profissional espiacuterito criacutetico pela confianccedila depositada pela sua amizade e pelo privileacutegio de poder trabalhar com algueacutem por quem se nutre admiraccedilatildeo

Agrave Professora Doutora Daniela de Filippo pelo aconselhamento orientaccedilatildeo espiacuterito criacutetico e amizade que foram importantes durante o uacuteltimo ano

Agrave Sara cujo apoio paciecircncia e amor foram fundamentais ao longo deste percurso

Aos meus pais que nunca me deixaram desistir deste sonho

Agrave Ana Luiacutesa Ribeiro colega e amiga cujo esforccedilo me permitiu assistir a todas as aulas do mestrado

Agrave Cristina Caetano colega de mestrado e amiga pelo apoio incentivo partilha de ideias e espiacuterito criacutetico

Aos colegas Daniel Gonccedilalves Rosa Gomes e Quele pelo companheirismo amizade boa energia e pelas trocas de ideias ao almoccedilo agraves quintas-feiras

A todos os professores deste ciclo acadeacutemico pela mestria e paixatildeo com que transmitiram conhecimentos e me tornaram melhor profissional da informaccedilatildeo

vi

vii

A mente que se abre a uma nova ideia jamais volta ao seu tamanho inicial

Albert Einstein

viii

ix

RESUMO

A abertura de dados cientiacuteficos e de dados do setor puacuteblico eacute garantida por poliacuteticas de Dados Abertos que na sua constituiccedilatildeo recomendam ou mandatam a livre disponibilizaccedilatildeo de dados A um niacutevel macro a Uniatildeo Europeia atraveacutes do seu programa de financiamento de investigaccedilatildeo implementou um piloto de Dados Abertos que atualmente abrange todas as aacutereas de investigaccedilatildeo financiadas O acordo de financiamento mandata a abertura de todos os dados de investigaccedilatildeo subjacentes agraves publicaccedilotildees cientiacuteficas A Uniatildeo Europeia tem tambeacutem publicado legislaccedilatildeo referente agrave abertura de dados do setor puacuteblico que eacute transposta para as normas juriacutedicas de cada estado-membro onde Portugal natildeo eacute exceccedilatildeo Foram tambeacutem observadas as diversas iniciativas que visam medir a abertura de dados puacuteblicos a niacutevel europeu e mundial

O objetivo geral do trabalho eacute analisar a implementaccedilatildeo de poliacuteticas de Dados Abertos em Portugal Dado o diferente enquadramento legislativo relativamente aos dados de investigaccedilatildeo e aos dados do setor puacuteblico foram elencadas as poliacuteticas existentes para os diferentes tipos de dados A abertura de dados de investigaccedilatildeo situa-se ainda numa fase prematura natildeo sendo ainda visiacuteveis resultados da implementaccedilatildeo da Resoluccedilatildeo do Conselho de Ministros nordm212016 Ao niacutevel dos dados do setor puacuteblico abertura processou-se atraveacutes da transposiccedilatildeo da Diretiva 200398CE para as normas juriacutedicas portuguesas em 2007 e novamente em 2016 Usando o modelo de Zuiderwijk e Janssen (2014) foi elaborada uma estrutura para a avaliaccedilatildeo do conteuacutedo contexto e indicadores de desempenho da poliacutetica de abertura de dados do setor puacuteblico permitindo obter uma visatildeo geral do valor puacuteblico alcanccedilado Foram confrontados os resultados obtidos por esta anaacutelise com os indicadores de abertura provenientes de algumas iniciativas de avaliaccedilatildeo de impacto da abertura de dados do setor puacuteblico e com a informaccedilatildeo prestada pela AMA O ecossistema portuguecircs de Dados Governamentais Abertos encontra-se jaacute numa fase mais avanccedilada revelando a existecircncia do portal de dados nacional (dadosgov) e de diversos portais de entidades puacuteblicas e ateacute do setor privado que disponibilizam dados de forma aberta Esses portais foram analisados para se perceber se os conjuntos de dados cumpriam os requisitos de abertura definidos pela Open Knowledge International

Palavras-chave Dados Abertos Dados Governamentais Abertos poliacuteticas de Dados Abertos impacto avaliaccedilatildeo

x

xi

ABSTRACT

The openness of scientific data and public sector data is granted by Open Data policies which recommend or mandate free availability of data At a macro level the European Union through its research funding program implemented an Open Data pilot that now is extended to all the funded research areas The model agreement sets the openness of all the data underlying scientific publications The European Union has also published legislation referring to the openness of public sector information which is transposed to the legal system of each state member where Portugal is no exception We also analysed the different initiatives that aim to measure the openness of public data at European and global level

The main goal of this academic work is to analyse the implementation of Open Data policies in Portugal Given the different legal framework between scientific data and public sector data wersquove considered and listed the policies regarding both type of data The openness of scientific data is still in a premature phase which means that the results of the implementation of Resoluccedilatildeo do Conselho de Ministros nordm212016 are not visible yet In terms of public sector data the openness has started with the transposition of the EU Directive 200398EC to the Portuguese juridical system in 2007 and again in 2016 Using Zuiderwijk e Janssenrsquos (2014) model it was elaborated a structure to assess the context content and performance indicators of public sector open data policies which allows to obtain a general vision of public value achieved The results produce by this analysis were confronted with the openness indicators generated by some public sector data impact assessment initiatives and also with the information disclosed by AMA The Portuguese ecosystem of Open Governmental Data is in a more advanced phase disclosing the existence of a national data portal (dadosgov) and data portals from public institutions and even from the private sector which made data available in an open manner These data portals were analysed to understand if they fulfil all the openness requirements defined by Open Knowledge International

Keywords Open Data Open Government Data Open Data policies impact assessment

xii

xiii

Sumaacuterio

AGRADECIMENTOS v

RESUMO ix

ABSTRACT xi

Introduccedilatildeo 1

Indicaccedilotildees Metodoloacutegicas 6

1 Do Acesso Aberto aos Dados Abertos 8

11 Acesso Aberto 8

111 Via Dourada 14

112 Via Verde 15

12 A Ciecircncia Aberta 17

13 Big Data ou dados massivos 24

14 Dados Abertos 29

15 Dados Abertos Governamentais 40

2 As poliacuteticas de Dados Abertos 53

21 Poliacuteticas Macro 70

22 O caso portuguecircs 78

Conclusatildeo 103

Referecircncias Bibliograacuteficas 115

LISTA DE SIGLAS 134

IacuteNDICE DE FIGURAS 136

IacuteNDICE DE QUADROS 137

IacuteNDICE DE GRAacuteFICOS 138

xiv

1

Introduccedilatildeo

Uma marca distintiva da nossa eacutepoca eacute o crescimento exponencial da produccedilatildeo de informaccedilatildeo com a proliferaccedilatildeo de novas tecnologias de informaccedilatildeo e comunicaccedilatildeo que permitiram o aumento de troca de informaccedilatildeo de nuacutemero de artigos cientiacuteficos publicados e a produccedilatildeo massiva de dados O acesso generalizado agrave internet propiciou uma alteraccedilatildeo no paradigma do acesso e publicaccedilatildeo de conteuacutedos cientiacuteficos Eacute com o intuito de promover o livre acesso agrave informaccedilatildeo cientiacutefica que nasce o movimento de Acesso Aberto (AA) apoiado em trecircs declaraccedilotildees de princiacutepios de abertura Budapeste Bethesda e Berlim

Segundo a Budapest Open Access Initiative (BOAI) entende-se por AA a disponibilizaccedilatildeo na Internet de literatura cientiacutefica permitindo que os utilizadores possam ler copiar distribuir imprimir e pesquisar esta literatura sem barreiras legais teacutecnicas ou financeiras que natildeo o proacuteprio acesso agrave Internet (Budapest Open Access Iniciative [BOAI] 2002 traduccedilatildeo livre) O AA possuiu dois modelos de abertura a via dourada que remete para a publicaccedilatildeo em revistas cientiacuteficas de AA e a via verde que pressupotildee o auto arquivo num repositoacuterio adequado Subjacente a este movimento estaacute a abertura sem qualquer tipo de discriminaccedilatildeo de toda a literatura de investigaccedilatildeo cientiacutefica revista por pares no caso dos postprints como artigos dissertaccedilotildees e teses e mais recentemente dados de investigaccedilatildeo e livros cientiacuteficos (Swan 2012) Existem dois tipos de AA o AA graacutetis que se refere agrave remoccedilatildeo de barreiras de preccedilo e o AA livre que se refere agrave remoccedilatildeo de barreiras de preccedilo e de pelo menos algumas barreiras de permissatildeo (Suber 2012)

O AA enquadra-se num contexto cientiacutefico mais vasto o da Ciecircncia Aberta (CA) O conceito de CA eacute definido como o esforccedilo para disponibilizar todos os resultados da investigaccedilatildeo cientiacutefica que sejam financiados pelo setor puacuteblico (Organizaccedilatildeo para a Cooperaccedilatildeo e Desenvolvimento Econoacutemico [OECD] 2015a) Nesse sentido a Ciecircncia Aberta surge como um termo guarda-chuva referente agrave abertura de todos os resultados da investigaccedilatildeo financiada e que assenta em vaacuterios pilares remoccedilatildeo das barreiras de partilha construccedilatildeo da infraestrutura para a sua concretizaccedilatildeo e como desambiguaccedilatildeo de autores instituiccedilotildees e produccedilatildeo cientiacutefica A CA eacute um meio para garantir um sistema de investigaccedilatildeo mais eficiente atraveacutes da reduccedilatildeo de custos no processo de coleta transferecircncia e reutilizaccedilatildeo de dados do aumento da transparecircncia e qualidade do processo de investigaccedilatildeo da maior rapidez na transferecircncia de conhecimento do aumento do impacto econoacutemico e aproximaccedilatildeo entre ciecircncia e cidadatildeos (OECD 2015a)

A complexidade da abertura dos resultados de investigaccedilatildeo reside no fator cultural na implementaccedilatildeo de um ambiente de partilha Leonelli Spichtinger e Prainsack

2

(201513) defendem que ldquoin addition to the stick of compulsatory mandates carrots are therefore also neededrdquo As recompensas satildeo definidas em trecircs eixos reconhecimento das praacuteticas de partilha nas estruturas de incentivos reconhecimento do papel das meacutetricas alternativas na avaliaccedilatildeo dos investigadores e a criaccedilatildeo de incentivos mais significativos para envolver os investigadores na CA Fecher e Friesike (2013) sintetizaram as mudanccedilas operadas pela CA em cinco escolas de pensamento ao niacutevel da infraestrutura da acessibilidade puacuteblica da avaliaccedilatildeo de impacto do acesso gratuito e da melhoria da eficiecircncia

A Uniatildeo Europeia (EU) tem desempenhado um papel central na promoccedilatildeo da CA quer atraveacutes da criaccedilatildeo de legislaccedilatildeo adequada aos princiacutepios de abertura que defende quer ao niacutevel de financiamento para o AA agraves publicaccedilotildees cientiacuteficas criaccedilatildeo de e-infraestruturas de alojamento de recursos de informaccedilatildeo e programas de treino e apoio Em Portugal apesar da jaacute existecircncia de e-infraestruturas cientiacuteficas como o Repositoacuterio Cientiacutefico de Acesso Aberto de Portugal (RCAAP) e o Serviccedilo de Alojamento de Repositoacuterio de Dados Cientiacuteficos (SARDC) apenas em 2016 se veio a definir os princiacutepios da implementaccedilatildeo da poliacutetica nacional de CA atraveacutes da Resoluccedilatildeo do Conselho de Ministros nordm212016 A estrateacutegia assenta em quatros eixos AA e Dados Abertos infraestruturas e preservaccedilatildeo digital avaliaccedilatildeo cientiacutefica e responsabilidade social cientiacutefica (Comissatildeo Executiva GT-PNCA 2016)

O crescimento exponencial da produccedilatildeo de dados estimado em 40 ao ano (Manyika et al 2011) levou agrave emergecircncia do fenoacutemeno Big Data ou dados massivos atraveacutes do incremento da disponibilizaccedilatildeo de conjuntos de dados e tambeacutem do reconhecimento do potencial valor da combinaccedilatildeo e ligaccedilatildeo de diferentes datasets (Ubaldi 2013) Os dados digitais estatildeo presentes em todos os setores econoacutemicos existindo diversas ferramentas que coletam dados de forma massiva que depois podem ser reutilizados para desenvolver novas investigaccedilotildees ou aplicaccedilotildees1 para benefiacutecio da sociedade O crescimento da disponibilidade de dados originou mudanccedilas no paradigma da investigaccedilatildeo cientiacutefica sendo que Jim Gray considera que vivemos atualmente no 4ordm paradigma caracterizado pelo uso massivo de dados na investigaccedilatildeo cientiacutefica (Lynch 2009) Esta nova ciecircncia assenta em trecircs pilares captura curadoria e anaacutelise de dados (Bell 2009 Royal Society 2012) A influecircncia do Big Data na sociedade manifesta-se a diversos niacuteveis destacando-se o desenvolvimento de projetos na aacuterea da sauacutede transportes agricultura ambiente induacutestria ganho de competecircncias cientiacuteficas mercado de dados e dados abertos

Os dados que produzimos satildeo globais diversificados complexos e sobretudo podem representar um enorme valor cientiacutefico econoacutemico social ou cultural Neste

1 O termo aplicaccedilotildees deve ser aqui entendido de duas formas como aplicaccedilatildeo na inovaccedilatildeo cientiacutefica produzindo por exemplo um avanccedilo meacutedico e tambeacutem como aplicaccedilatildeo no sentido de software fornecendo um serviccedilo com o recurso agrave reutilizaccedilatildeo de dados

3

sentido o AA a dados torna-se um dos pilares da investigaccedilatildeo cientiacutefica do seacuteculo XXI mas tambeacutem um dos pilares do desenvolvimento econoacutemico do envolvimento dos cidadatildeos na ciecircncia atraveacutes da denominada ciecircncia cidadatilde e tambeacutem na auscultaccedilatildeo da transparecircncia governativa com a disponibilizaccedilatildeo em AA de dados governamentais

O mundo acadeacutemico tem vindo a ser pressionado para apoiar a abertura atraveacutes das imposiccedilotildees das entidades de financiamento e do aumento de benefiacutecios dos Dados Abertos embora nem todos os domiacutenios evoluam com a mesma rapidez (Hahnel amp Hook 2016) A Royal Society (2012) sublinha que os dados devem ser geridos de modo proficiente para as instituiccedilotildees obterem os benefiacutecios proporcionados pela abertura de dados e entenderem a enorme mudanccedila cultural necessaacuteria para atingir este objetivo

Existem vaacuterias definiccedilotildees de Dados Abertos apresentando algumas diferenccedilas entre elas embora focando o mesmo objetivo A Royal Society (2012) entende por Open Data os dados que devem ser acessiacuteveis utilizaacuteveis avaliados ou certificados e inteligiacuteveis Contudo ldquoOpenness is not however enough Data must be intelligently openrdquo (Science International 20154) Segundo a Open Definition os Dados Abertos englobam dois tipos diferentes de abertura teacutecnica e legal (Open Knowledge International [a])

Com o objetivo de contribuir para a adoccedilatildeo de padrotildees e poliacuteticas de Dados Abertos de investigaccedilatildeo algumas organizaccedilotildees lanccedilaram iniciativas e princiacutepios de Open Data destinadas agrave recomendaccedilatildeo de boas praacuteticas na publicaccedilatildeo de dados de investigaccedilatildeo obtidos atraveacutes de financiamento puacuteblico Estes princiacutepios foram comparados de forma a obter-se uma visatildeo geral da abertura teacutecnica e legal recomendada

A abertura dos dados governamentais teve a sua origem nas leis de ldquoFreedom of Informationrdquo Os Governos e as sociedades tecircm vindo de forma crescente a apoiar o acesso agrave informaccedilatildeo do setor puacuteblico como forma de aumentar a transparecircncia governativa e o crescimento econoacutemico A abertura de dados assume a preparaccedilatildeo das entidades puacuteblicas para o processo de abertura e que o governo estaacute disposto a efetuar mudanccedilas consideraacuteveis no setor puacuteblico devendo atuar como um sistema aberto que interage com o seu ambiente (Jansen Charalabidis amp Zuiderwijk 2012)

Os Dados Governamentais Abertos (DGA) referem-se agrave informaccedilatildeo coletada produzida ou paga pelo setor puacuteblico guardada em formato que possa ser lido por maacutequina e tornada acessiacutevel de forma livre para reutilizaccedilatildeo para qualquer propoacutesito atraveacutes da publicaccedilatildeo sob uma licenccedila aberta que permite a livre reutilizaccedilatildeo dentro do domiacutenio puacuteblico e privado (Koski 2015 Carrara Oudkerk Steenbergen Tinholt 2016) A Open Knowledge International (OKI) (2012a) identificou as componentes chave da abertura de dados puacuteblicos disponibilidade e acesso reutilizaccedilatildeo e redistribuiccedilatildeo e a participaccedilatildeo universal A abertura dos dados governamentais foi apoiada por vaacuterias iniciativas com o objetivo de estabelecer padrotildees e princiacutepios para a

4

disponibilizaccedilatildeo aberta de dados as quais foram comparadas para obter uma visatildeo geral da abertura teacutecnica e legal recomendada

Para gerar valor ldquodata must be reusable but more importantly actually used (Open Data for Development [OD4D] 20168) O acesso e a reutilizaccedilatildeo dos dados governamentais tecircm um potencial significativo no aumento da eficiecircncia e transparecircncia do setor puacuteblico alavancando atividades de ciecircncia cidadatilde com os dados governamentais aumentando assim o seu valor econoacutemico e social (OECD 2015a) Segundo Ubaldi (2013 traduccedilatildeo livre) podem ser identificadas quatro grandes fases na cadeia de valor dos Dados DGA geraccedilatildeo de dados coleta agregaccedilatildeo e processamento de dados distribuiccedilatildeo e fornecimento de dados e reutilizaccedilatildeo de dados Existem trecircs tipos de valor associados aos DGA valor econoacutemico valor social e transparecircncia puacuteblica (Ubaldi 2013 OECD 2015a)

O acesso a dados sem restriccedilotildees de acesso deve ser garantido por uma poliacutetica de Dados Abertos pois ldquoOpen Data is politicalrdquo (World Wide Web Foundation 201638) Existem poliacuteticas diferenciadas para a abertura de dados governamentais e para a abertura de dados cientiacuteficos sendo que a expressatildeo ldquoPoliacutetica de Dados Abertosrdquo surge frequentemente associada a termos como estrateacutegias programas ou iniciativas de abertura de dados e ainda a poliacuteticas de gestatildeo de dados A contextualizaccedilatildeo das poliacuteticas natildeo eacute clara mas foca-se preferencialmente apenas nos dados provenientes do setor puacuteblico Satildeo associadas poliacuteticas de Dados Abertos de vaacuterios niacuteveis desde o governamental em termos de dados puacuteblicos agraves poliacuteticas editoriais de abertura de dados cientiacuteficos

A niacutevel de dados cientiacuteficos salienta-se a existecircncia de vaacuterias recomendaccedilotildees no sentido de balizar indicadores fundamentais para o desenvolvimento de poliacuteticas de abertura de dados cientiacuteficos e a importacircncia da gestatildeo de dados no seio dessa abertura A mudanccedila cultural a necessidade de treino dos investigadores e a abertura de dados mediante os princiacutepios FAIR que pretendem facilitar o acesso a interoperabilidade e a reutilizaccedilatildeo de dados satildeo outros desafios focados A abertura dos dados de investigaccedilatildeo eacute incluiacuteda no programa de investimento Horizonte 2020 (H2020) da EU com a criaccedilatildeo um projeto-piloto de Dados Abertos para sete aacutereas com opccedilatildeo de natildeo participaccedilatildeo tendo sido alargado a todas as aacutereas cientiacuteficas em projetos iniciados a partir de 2017 O artigo 293 do acordo modelo de financiamento requer o depoacutesito de todos os dados e metadados associados aos resultados finais da investigaccedilatildeo num repositoacuterio devendo estes cumprir os princiacutepios FAIR A este model grant agreement estaacute associada tambeacutem a necessidade obrigatoacuteria de desenvolver um plano de gestatildeo de dados que descreva os dados que seratildeo produzidos e como e quando seratildeo publicados O AA a dados cientiacuteficos possui um contexto legislativo diferenciado dos dados puacuteblicos apresentando-se em Portugal numa fase ainda pouca maturada A primeira poliacutetica de Dados Abertos surge em 2014 atraveacutes da Fundaccedilatildeo

5

para a Ciecircncia e Tecnologia (FCT) com o objetivo de encorajar e promover a disponibilizaccedilatildeo de dados em AA O acesso a dados foi incluiacutedo na poliacutetica cientiacutefica atraveacutes da Resoluccedilatildeo do Conselho de Ministros nordm212016 que integrada na poliacutetica nacional de CA instaura a obrigatoriedade da abertura dos dados cientiacuteficos resultantes de projetos financiados por fundos puacuteblicos

O desenvolvimento de uma poliacutetica de abertura de dados governamentais deve considerar algumas questotildees como a definiccedilatildeo da sua aplicaccedilatildeo e os objetivos dados publicados condiccedilotildees de publicaccedilatildeo de dados local frequecircncia e razatildeo da publicaccedilatildeo devendo ainda ser calculado o impacto e os benefiacutecios da abertura de dados (Carrara et al 2016a) Os objetivos das poliacuteticas de Dados Abertos podem ser sintetizados em trecircs aacutereas principais fomentar a inovaccedilatildeo social e crescimento econoacutemico melhorar a eficiecircncia dos serviccedilos do setor puacuteblico e fortalecer a democracia e aumentar a transparecircncia (Zuiderwijk Gasco Parycek amp Janssen 2014)

A EU e a Comissatildeo Europeia tecircm promovido os DGA atraveacutes da publicaccedilatildeo de Diretivas Europeias (2003 e 2013) que estabeleceram regulamentos para permitir o livre acesso e reutilizaccedilatildeo dos dados produzidos pelas entidades europeias e governamentais Esta legislaccedilatildeo eacute de cariz obrigatoacuterio para todos os estados-membros Foram tambeacutem estabelecidas diversas e-infraestruturas para alojar e apoiar toda a produccedilatildeo de dados produzidos na EU e que indexam os dados existentes nos portais nacionais de cada paiacutes Satildeo abordadas as vaacuterias iniciativas europeias e internacionais de avaliaccedilatildeo de abertura de dados que permitem obter uma vista geral ainda que desfocada do estado de abertura de dados puacuteblicos a niacutevel nacional e europeu

Portugal confere o direito ao acesso agrave informaccedilatildeo puacuteblica desde 1993 As poliacuteticas de abertura de dados governamentais mais recentes foram publicadas em 2007 e 2016 e assentam na transposiccedilatildeo da Diretiva 200398CE para a lei nacional Assinala-se a existecircncia de duas poliacuteticas municipais a criaccedilatildeo do portal nacional e de vaacuterios portais regionais e institucionais Para avaliar a abertura dos dados governamentais em Portugal foi usada a estrutura elencada por Zuiderwijk e Janssen (2014) Atraveacutes da anaacutelise de vaacuterios indicadores esta estrutura fornece uma perspetiva do contexto e ambiente da poliacutetica do seu conteuacutedo e dos indicadores de desempenho permitindo assim inferir o valor puacuteblico alcanccedilado Foi tambeacutem analisada a abertura de dados alojados nos portais de dados portugueses com o recurso agraves caracteriacutesticas de abertura enunciadas na Open Definition

O objetivo geral deste trabalho eacute identificar as poliacuteticas de Dados Abertos em Portugal bem como a analisar a sua implementaccedilatildeo e impacto Neste sentido foram delineados os seguintes objetivos especiacuteficos

6

a) Contextualizar o movimento de Dados Abertos como continuaccedilatildeo do AA e tambeacutem dentro de um modelo mais amplo a CA focando ainda a produccedilatildeo massiva de dados

b) Identificar princiacutepios de abertura de dados cientiacuteficos e dados puacuteblicos c) Contextualizar os modelos de poliacuteticas de Dados Abertos e formas de avaliaccedilatildeo

de impacto das mesmas d) Identificar a constituiccedilatildeo e implementaccedilatildeo de poliacuteticas de abertura de dados

cientiacuteficos e dados puacuteblicos a niacutevel da EU e) Identificar a constituiccedilatildeo de poliacuteticas de abertura de dados cientiacuteficos e dados

puacuteblicos a niacutevel portuguecircs f) Avaliaccedilatildeo da implementaccedilatildeo e do impacto das poliacuteticas de Dados Abertos em

Portugal em termos de dados cientiacuteficos e de dados puacuteblicos

Indicaccedilotildees Metodoloacutegicas

Para cumprir os objetivos estipulados seguiu-se uma abordagem qualitativa baseada na revisatildeo bibliograacutefica de artigos cientiacuteficos recuperados em bases de dados especializadas disponiacuteveis na Universidade de Coimbra articulando a recuperaccedilatildeo de documentos com os documentos mais citados da aacuterea da Ciecircncia Aberta Acesso Aberto e Dados Abertos indexados na Web of Science Foram usados os termos de pesquisa em liacutengua inglesa open science open access open data open government data e scientific open data para situar o tema seguindo-se a pesquisa por open data policies government open data policies e open data impact A base da literatura revista para analisar o desenvolvimento e impacto das poliacuteticas de Dados Abertos em Portugal foi obtida em grande parte com o recurso ao motor de busca Google derivado agrave especificidade da legislaccedilatildeo das comunicaccedilotildees poliacuteticas e institucionais dos portais de dados e tambeacutem agrave escassez de literatura cientiacutefica nesse campo Foi ainda solicitado um esclarecimento de duacutevidas agrave Agecircncia para a Modernizaccedilatildeo Administrativa (AMA) por correio eletroacutenico em termos de conteuacutedos e funcionalidades do portal de dados nacional tendo as respostas do gestor de projeto Andreacute Lapa sido incluiacutedas como contraposiccedilatildeo a algumas afirmaccedilotildees da literatura ou das iniciativas de avaliaccedilatildeo Os Dados Abertos enquanto alvo do nosso estudo satildeo enquadrados na dimensatildeo da Ciecircncia Aberta que defende a abertura de todos os resultados cientiacuteficos e na dimensatildeo de abertura da informaccedilatildeo do setor puacuteblico que defende o acesso do cidadatildeo agrave informaccedilatildeo dos oacutergatildeos puacuteblicos e governativos

Em termos de Dados Abertos e as suas poliacuteticas a oferta de literatura eacute consideravelmente mais curta sendo que apenas os documentos mais antigos apresentam nuacutemero de citaccedilotildees com algum relevo Sempre que necessaacuterio recorreu-se a trabalhos citados nas publicaccedilotildees em estudo A singularidade da aacuterea e o seu raacutepido crescimento levou agrave opccedilatildeo por autores e artigos menos cotados mas

7

diretamente relacionados com o mundo dos Dados Abertos A recolha de literatura para investigaccedilatildeo visou identificar legislaccedilatildeo referente a poliacuteticas de Dados Abertos publicaccedilotildees de organizaccedilotildees internacionais documentos oficiais relacionados com a abertura de dados e tambeacutem comunicaccedilotildees poliacuteticas quer para o caso portuguecircs quer ao niacutevel macro da EU Foi identificado o contexto social e poliacutetico dos Dados Abertos destacando-se as iniciativas com potencial impacto na abertura de dados Foram pesquisados documentos de investigaccedilatildeo relativos a poliacuteticas de dados abertos e formas de anaacutelise das mesmas

A avaliaccedilatildeo de impacto das poliacuteticas de Dados Abertos em Portugal foi feita com base na estrutura elencada por Zuiderwijk e Janssen (2014) A identificaccedilatildeo das respostas aos 27 indicadores foi feita com o recurso agrave literatura legislaccedilatildeo e agraves respostas obtidas a partir da AMA

Para determinar a quantidade de conjuntos de dados existentes em cada portal internacional analisado quando natildeo estava disponiacutevel a possibilidade de pesquisar por paiacutes foi introduzido o termo Portugal na caixa de pesquisa Deste modo recuperaram-se os conjuntos de dados relacionados com o paiacutes embora nem todos os datasets tenham autoria portuguesa A determinaccedilatildeo das caracteriacutesticas dos portais de dados portugueses analisados foi efetuada com base na informaccedilatildeo inscrita no proacuteprio siacutetio web Quando natildeo disponiacuteveis na paacutegina principal dos cataacutelogos de dados procedeu-se agrave pesquisa nas paacuteginas descritivas dos datasets ou no setor dos avisos legais

Procurou-se aqui tambeacutem definir alguns dos termos que iratildeo ser utilizados com frequecircncia na liacutengua inglesa e tambeacutem o seu acircmbito de aplicaccedilatildeo Segundo Borgman (2015) dados satildeo representaccedilotildees de observaccedilotildees objetos ou outras entidades usadas como prova de um fenoacutemeno para fins de investigaccedilatildeo ou acadeacutemicos

O termo dataset designa um conjunto ou coleccedilatildeo de dados publicados ou preservados por um agente uacutenico estando disponiacutevel para acesso ou download em um ou mais formatos (World Wide Web Consortium [W3C] 2014)

Para a contextualizaccedilatildeo e avaliaccedilatildeo de poliacuteticas foi tida em consideraccedilatildeo a definiccedilatildeo do Dicionaacuterio de Cambridge que define poliacutetica como ldquoa set of ideas or a plan of what to do in particular situations that has been agreed to officially by a group of people a business organization a government or a political partyrdquo (Cambridge University Press 2017)

8

1 Do Acesso Aberto aos Dados Abertos

O processo de abertura do conhecimento cientiacutefico comeccedilou em 2002 com o movimento do Acesso Aberto (AA) culminando na abertura da literatura cientiacutefica financiada por fundo puacuteblicos O avanccedilar da tecnologia a produccedilatildeo massiva de dados as redes sociais cientiacuteficas a ciecircncia cidadatilde os recursos educacionais e o coacutedigo aberto em conjunto gerou uma ciecircncia diferente Este conceito mais amplo de ciecircncia definido como Ciecircncia Aberta pretende abrir toda a panoacuteplia de formatos e recursos onde constem resultados cientiacuteficos com destaque para os dados de investigaccedilatildeo financiados publicamente A abertura de dados processa-se tambeacutem a niacutevel puacuteblico com o Governo e vaacuterias instituiccedilotildees puacuteblicas empenhadas em disponibilizar de forma aberta a informaccedilatildeo do setor puacuteblico

11 Acesso Aberto

O acesso ao conhecimento eacute a base do processo cientiacutefico motor do desenvolvimento social econoacutemico e humano O acesso generalizado agrave Internet alterou o paradigma da comunicaccedilatildeo acadeacutemica pela introduccedilatildeo experimental de novas formas de publicaccedilatildeo e disseminaccedilatildeo da ciecircncia Os primoacuterdios do Acesso Aberto (AA) agrave informaccedilatildeo cientiacutefica remontam a iniciativas como o ArXiv2 um servidor de preprints3 e o EPrints um dos softwares usados para a constituiccedilatildeo de repositoacuterios

O movimento de AA surgiu como resposta ao problema conhecido como lsquoCrise dos Perioacutedicosrsquo Na verdade a escalada de preccedilos das assinaturas de revistas cientiacuteficas e as restriccedilotildees colocadas pelas editoras limitando de forma seacuteria o acesso aos resultados de investigaccedilatildeo teve duas consequecircncias limitaccedilatildeo severa no acesso agrave informaccedilatildeo e colateral diminuiccedilatildeo do potencial de impacto de citaccedilatildeo Eacute neste contexto que em 2002 surge a declaraccedilatildeo fundadora do AA a Budapeste Open Access Initiative (BOAI) Segundo a BOAI entende-se por AA a disponibilizaccedilatildeo na Internet de literatura cientiacutefica permitindo que os utilizadores possam ler copiar distribuir imprimir e pesquisar esta literatura sem barreiras legais teacutecnicas ou financeiras que natildeo o proacuteprio acesso agrave Internet (Budapest Open Access Iniciative [BOAI] 2002 traduccedilatildeo livre) A BOAI estabeleceu duas vias para concretizar o AA a publicaccedilatildeo em revistas cientiacuteficas de AA conhecida como a via dourada e o auto arquivo em repositoacuterios cientiacuteficos conhecido como a via verde de AA Para atingir a abertura dos artigos a BOAI sublinha que devem ser cumpridas duas estrateacutegias complementares

2 O arXiv surgiu em 1991 com o intuito de alojar preprints de artigos cientiacuteficos da aacuterea da fiacutesica tendo sido expandido para integrar aacutereas como a matemaacutetica astronomia ciecircncias da computaccedilatildeo biologia e financcedila quantitativa e estatiacutestica Disponiacutevel na WWW httpsarxivorg 3 O preprint eacute uma versatildeo de um artigo cientiacutefico natildeo publicado e ainda natildeo sujeito a revisatildeo por pares

9

Os investigadores devem proceder ao Auto arquivo da versatildeo completa das suas publicaccedilotildees Necessidade de desenvolver uma nova geraccedilatildeo de revistas cientiacuteficas cujo foco seja a publicaccedilatildeo em AA (BOAI 2002)

Seguiram-se mais duas declaraccedilotildees de elevada importacircncia para o estabelecimento do AA a Declaraccedilatildeo de Bethesda sobre a Publicaccedilatildeo em Acesso Aberto e a Declaraccedilatildeo de Berlim sobre Acesso Livre ao Conhecimento nas Ciecircncias e Humanidades ambas em 2003 A Declaraccedilatildeo de Bethesda define o AA agraves publicaccedilotildees quando eacute autorizado o livre acesso uso e redistribuiccedilatildeo e tambeacutem quando eacute fornecida a versatildeo completa incluindo materiais suplementares e respetiva licenccedila de utilizaccedilatildeo em formato digital num repositoacuterio adequado (Declaraccedilatildeo de Bethesda sobre a Publicaccedilatildeo em Acesso Aberto 2003) A Declaraccedilatildeo de Berlim impotildee o cumprimento de duas condiccedilotildees os autoresdetentores dos direitos de autor devem autorizar sob a forma de uma licenccedila qualquer tipo de coacutepia reutilizaccedilatildeo redistribuiccedilatildeo e transmissatildeo sujeito apenas agrave menccedilatildeo de atribuiccedilatildeo de creacutedito e os autores devem depositar uma coacutepia completa do seu trabalho num repositoacuterio que assegure a sua preservaccedilatildeo a longo prazo (Declaraccedilatildeo de Berlim sobre Acesso Livre ao Conhecimento nas Ciecircncias e Humanidades 2003 traduccedilatildeo livre)

Borges (200692) sintetizou outros exemplos de iniciativas de AA desencadeadas a niacutevel global como o Open Archives Forum em 2001 a International Scholarly Communications Alliance ao niacutevel das ldquobibliotecas especializadas de investigaccedilatildeordquo listando ainda princiacutepios editoriais dos Estados Unidos da Ameacuterica (EUA)4 e europeus5 e assinalando tambeacutem a existecircncia do ldquoDAREnet a rede dos Digital Academic Repositoriesrdquo

Em 2012 a BOAI declarou que ldquoNothing in the last ten years makes OA less necessary or less opportunerdquo renovando e definindo recomendaccedilotildees para os proacuteximos 10 anos ao niacutevel de poliacuteticas licenciamento e reutilizaccedilatildeo infraestrutura e sustentabilidade e por fim sobre promoccedilatildeo e coordenaccedilatildeo

A abertura requerida por estas declaraccedilotildees tem por objetivo disponibilizar o AA a todos os que manifestem interesse nele sem distinccedilotildees discriminatoacuterias Suber (2012) um dos promotores do Movimento de Acesso Aberto agrave informaccedilatildeo cientiacutefica afirma que temos de ver o conhecimento como um bem puacuteblico e natildeo como uma mercadoria O AA deve incluir tambeacutem o processamento da informaccedilatildeo por maacutequinas que atraveacutes de teacutecnicas de extraccedilatildeo indexaccedilatildeo ou mistura permitem obter novas inferecircncias de

4 Os princiacutepios foram denominados Washington DC Principles For Free Access to Science em 2004 tendo sido assinados ldquopor uma seacuterie de editores natildeo lucrativos de sociedades cientiacuteficasrdquo (Borges 200692) 5 Borges (2006) indica que a Association of Learned and Professional Society Publishers emitiu princiacutepios semelhantes aos princiacutepios anunciados nos EUA

10

conhecimento (Suber 2012 Swan 2012) Os conteuacutedos comummente abrangidos pelo AA satildeo a literatura de investigaccedilatildeo cientiacutefica revista por pares dissertaccedilotildees teses e mais recentemente os dados de investigaccedilatildeo e livros cientiacuteficos (Swan 2012) aleacutem de manuais software modelos tridimensionais plantas mapas entre outros

As barreiras de preccedilo e de direitos de autor causam danos aos autores por limitarem a audiecircncia e impacto do seu trabalho ao condicionarem o que pode ser lido usado e citado (Suber 2012 traduccedilatildeo livre) O movimento de AA veio ameaccedilar o modelo dominante de publicaccedilatildeo cientiacutefica baseado ateacute entatildeo em subscriccedilotildees de revistas cientiacuteficas de elevado custo mudando o paradigma em termos de pagamento isentando o leitor e cobrando ao autor O AA natildeo eacute acesso sem custos (OECD 2015a) Em 2008 Stevan Harnad e Peter Suber propuseram termos para descrever os dois tipos de livre acesso agrave informaccedilatildeo cientiacutefica que se impuseram como fundamentais e reconhecidos O termo Graacutetis refere-se agrave remoccedilatildeo das barreiras de preccedilo enquanto o termo Livre refere-se agrave retirada das barreiras de preccedilo e de pelo menos algumas barreiras de permissatildeo (Suber 2008 traduccedilatildeo livre)

A viabilidade econoacutemica das infraestruturas de suporte ao AA pode constituir outro obstaacuteculo Contudo as revistas de AA podem optar por vaacuterios modelos de financiamento que lhes garanta a sustentabilidade econoacutemica como ldquosubsiacutedios publicidade taxas de poacutes-processamento do artigo impressotildees outros serviccedilos de publicaccedilatildeo taxas de associado ou combinaccedilotildees destas accedilotildeesrdquo (Universidade do Minho 2017) Jaacute os repositoacuterios de AA satildeo mais limitados em termos de sustentabilidade no entanto tecircm menos custos de manutenccedilatildeo e estatildeo jaacute em grande parte construiacutedos (OECD 2015a) O retorno do investimento que cada instituiccedilatildeo faz num repositoacuterio tem sempre garantia de retorno atraveacutes do conhecimento que aloja atraindo desta forma alunos investigadores e outros potenciais interessados

A complexidade do AA reside na transiccedilatildeo entre o modelo tradicional e o novo modelo de abertura natildeo pelos obstaacuteculos legais teacutecnicos ou financeiros mas sobretudo pelo fator cultural (Suber 2012 traduccedilatildeo livre) O mesmo autor defende que o AA natildeo eacute acesso universal pois mesmo removendo as barreiras de preccedilos e de permissotildees continuam a existir outras barreiras como filtros e censura barreiras de linguagem de acesso a incapacitados e de conectividade

A escolha do local de publicaccedilatildeo por parte do investigador eacute muitas vezes influenciada pelo prestiacutegio da revista na procura da melhor visibilidade para a sua investigaccedilatildeo O prestiacutegio das revistas eacute conseguido atraveacutes do Fator de Impacto (FI) uma medida de avaliaccedilatildeo criada por Eugene Garfield e Irving H Sher ldquoIn addition to helping libraries decide which journals to purchase JIFs are also used by aithors to decide where to submit their articles As a general rule the journals with high impact factors include the most prestigious Some would equate prestige with high impactrdquo (Garfield 200692) O FI do ano de uma revista cientiacutefica eacute calculado atraveacutes da divisatildeo

11

entre o nuacutemero de citaccedilotildees total que os artigos dessa revista receberam nos dois anos anteriores e o nuacutemero total de artigos publicados no mesmo periacuteodo (Garfield 2006) Suber afirmava em 2009 que o FI como medida principal da qualidade da investigaccedilatildeo impede o crescimento das revistas de AA pois segundo o autor pode afastar os investigadores da publicaccedilatildeo em revistas de AA Contudo em 2017 existem jaacute revistas de AA com o mesmo niacutevel de prestiacutegio das revistas tradicionais das puras como eacute o caso daquelas publicadas pela Public Library of Science (PLOS) e BioMed Central ou Hindawi agraves hiacutebridas de outros editores cientiacuteficos

Como incentivos para abertura dos seus trabalhos aleacutem do maior reconhecimento e impacto medido pela contagem de citaccedilotildees os investigadores apenas recebem recompensas menos tangiacuteveis como a promoccedilatildeo na carreira (Suber 2012) Para este autor o sucesso do AA natildeo depende do altruiacutesmo do investigador entendendo que o ganho de audiecircncia e de impacto atraveacutes da publicaccedilatildeo da investigaccedilatildeo em AA eacute do interesse pessoal do investigador

Sendo o AA dirigido agrave literatura cientiacutefica revista por pares seria de esperar que o controlo de qualidade natildeo constituiacutesse um problema Contudo surgiram no mundo editorial as revistas predatoacuterias um termo cunhado por Jeffrey Beall para definir as revistas que aproveitam o modelo dourado do AA em proveito proacuteprio ldquoThese predatory publishers are dishonest and lack transparencyrdquo Constroem siacutetios web semelhantes aos dos ldquolegitimate online publishers and publish journals of questionable and downright low qualityrdquo (Beall 2012) Beall assevera que ldquonow there is a journal willing to accept almost every article as long as the author is willing to pay the feerdquo (Beall 2012) Este tipo de revistas cobra pela publicaccedilatildeo de cada artigo sem no entanto oferecer os mesmos serviccedilos editoriais como a revisatildeo por pares um elemento fundamental para garantir a integridade e qualidade cientiacutefica

O AA acarreta vaacuterios benefiacutecios para a sociedade e comunidade cientiacutefica como o aumento da velocidade eficiecircncia e eficaacutecia da investigaccedilatildeo facilita a investigaccedilatildeo interdisciplinar amplia a visibilidade uso e impacto da investigaccedilatildeo e permite que as comunidades de profissionais empreendedores e o puacuteblico em geral retirem valor da investigaccedilatildeo (Swan 2012 traduccedilatildeo livre) O projeto Study of Open Access Publishing (SOAP) concluiu que cerca de 90 dos investigadores que responderam ao inqueacuterito consideram que o AA eacute beneacutefico para a investigaccedilatildeo cientiacutefica com impacto direto positivo no fluxo da comunicaccedilatildeo acadeacutemica (Dallmeier-Tiessen et al 2011)

De acordo com Harnad e Brody (2004) a melhor forma de calcular o impacto do AA eacute ldquocompare the citation counts of individual OA and non-OA articles appearing in the same (non-OA) journals Such ongoing comparisons are revealing dramatic citation advantages for OA Os mesmos autores enfatizam que o acesso natildeo eacute uma condiccedilatildeo suficiente para a citaccedilatildeo mas eacute uma condiccedilatildeo necessaacuteria Com as publicaccedilotildees em AA a crescer exponencialmente entre as revistas de AA e os repositoacuterios ldquoverdesrdquo eacute natural

12

que o uso e impacto potencial aumentem com variaccedilotildees entre campos de conhecimento decorrentes da sua cultura de partilha

Apoacutes a anaacutelise de 36 estudos sobre o impacto do AA nas citaccedilotildees de artigos Swan (2010) concluiu que 27 desses estudos apresentavam uma clara subida do nuacutemero meacutedio de citaccedilotildees Os artigos cientiacuteficos disponibilizados em AA satildeo mais citados que aqueles que permanecem fechados estando este facto relacionado com o aumento de audiecircncia e visibilidade promovida pelo AA (Suber 2012 Caruso Nicol amp Archambault 2013) Swan (2012) defende que o AA estaacute a nivelar a comunicaccedilatildeo cientiacutefica e o acesso a ela A mesma autora realccedila que a investigaccedilatildeo cientiacutefica tem impacto tambeacutem fora do meio acadeacutemico ao niacutevel empresarial sauacutede ou educaccedilatildeo A OECD (2015a) acrescenta que os artigos satildeo mais citados porque possuem livre acesso e uso e natildeo propriamente pela sua qualidade Um estudo da Science-Metrix concluiu que o AA pode aumentar o nuacutemero de artigos citados e diminuir a citaccedilatildeo de artigos que os investigadores natildeo leram Poreacutem a mesma anaacutelise revelou que apenas 8 dos 28 paiacuteses auscultados conseguiram publicar 50 ou mais dos artigos produzidos em AA (Caruso Nicol amp Archambault 2013)

A distinccedilatildeo entre Graacutetis e Livre natildeo possuiu o mesmo significado que a distinccedilatildeo entre via verde e via dourada Enquanto a primeira distinccedilatildeo se refere aos direitos cedidos aos utilizadores (Quatildeo aberto estaacute) a segunda distinccedilatildeo refere-se ao modo de publicaccedilatildeo (Como eacute entregue) (Suber 2012) Os direitos de autor podem constituir uma barreira de peso ao AA A abertura requerida pelo estatuto de AA Livre deve ser assegurada pela concessatildeo de licenccedilas que informem os utilizadores sobre o que podem e natildeo podem fazer com determinado produto de investigaccedilatildeo cientiacutefica Existem licenccedilas abertas como as Creative Commons (CC) que permitem a criaccedilatildeo de modelos de licenciamento com diferentes niacuteveis de permissotildees podendo desta forma o detentor dos direitos de autor autorizar o niacutevel de permissatildeo que lhe seja mais conveniente

Das 9431 revistas cientiacuteficas de AA listadas no Directory of Open Access Journals (DOAJ) em Maio de 2017 8447 dessas revistas utilizavam licenccedilas CC enquanto 278 revistas possuiacuteam licenccedilas proacuteprias das editoras Os cerca de 90 do nuacutemero total de revistas de AA a utilizar licenccedilas CC representa um crescimento exponencial desde 2012 quando Suber afirmou que apenas 20 das revistas em AA usavam algum tipo de licenccedila CC Nesta mesma data encontram-se listadas no DOAJ 78 revistas de AA de editoras portuguesas sendo que 91 dessas publicaccedilotildees usa licenccedilas CC para permitir o AA Livre (Directory of Open Access Journals [DOAJ] 2017)

A abertura dos resultados de investigaccedilatildeo eacute suportada por poliacuteticas que podem encorajar ou requerer de forma obrigatoacuteria o AA Por norma o encorajamento eacute feito na via dourada enquanto na via verde se definem mandatos Segundo Swan (2012 traduccedilatildeo livre) na formulaccedilatildeo de uma poliacutetica de AA devem ser considerados os

13

seguintes fatores Modo de publicaccedilatildeo (via verde ou dourada) Local de depoacutesito Tipos de conteuacutedos abrangidos Periacuteodos de embargo Permissotildees Niacuteveis de aplicaccedilatildeo Sensibilizaccedilatildeo de apoio agraves poliacuteticas Sanccedilotildees por incumprimento e Isenccedilotildees

De acordo com Suber (2012) existe similitude na abordagem agraves poliacuteticas de AA entre universidades e agecircncias de financiamento que tanto podem encorajar a via dourada como requerer a via verde A Wellcome Trust do Reino Unido e a National Institutes of Health (EUA) satildeo dois casos de sucesso de mandatos verdes requerendo que os investigadores depositem o seu trabalho num repositoacuterio de AA e que retenham o direito de autorizar esse AA o que permite que as instituiccedilotildees disponibilizem de forma aberta todos os resultados de investigaccedilatildeo por si financiados (National Institutes of Health [NIH] 2008 Wellcome Trust 2013)

O mais recente programa de financiamento de ciecircncia e inovaccedilatildeo da Uniatildeo Europeia o Horizonte 2020 detalha no artigo 292 do Model Grant Agreement os requisitos legais na abertura das publicaccedilotildees cientiacuteficas financiadas por este programa onde cada beneficiaacuterio deve assegurar o AA a todas as publicaccedilotildees revistas por pares utilizando para isso as duas vias disponiacuteveis (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016a traduccedilatildeo livre)

Existem tambeacutem serviccedilos com o intuito de facilitar a abertura das publicaccedilotildees cientiacuteficas O Registry of Open Access Repository Mandates and Policies (ROARMAP) lista as poliacuteticas e mandatos de AA ao niacutevel global registados neste diretoacuterio Em novembro de 2016 o ROARMAP conta com 794 mandatos instituiacutedos por vaacuterios tipos de organizaccedilotildees Portugal conta com 21 poliacuteticas de AA por via verde distribuiacutedas na sua maioria por instituiccedilotildees de ensino superior Os serviccedilos SHERPA da Universidade de Nottingham atraveacutes das bases de dados RoMEO e JULIET dispotildeem de valiosos indicadores quanto agraves poliacuteticas de AA das editoras cientiacuteficas e das entidades financiadoras de investigaccedilatildeo Relativamente agraves poliacuteticas editoriais de AA tendo em conta os direitos de autor e o auto arquivo existem em Portugal 127 poliacuteticas segundo o SHERPARoMEO sendo que mais de metade autoriza a publicaccedilatildeo em AA do poacutes-print ou da versatildeo final do editor Jaacute em termos de poliacuteticas de AA requeridas pela instituiccedilatildeo financiadora apenas a Fundaccedilatildeo para a Ciecircncia e Tecnologia (FCT) aparece listada no SHERPAJULIET

O AA envolve vaacuterios intervenientes distintos que cooperam na disponibilizaccedilatildeo dos resultados da investigaccedilatildeo cientiacutefica Assim como intervenientes podemos encontrar os investigadores cujo esforccedilo permite a criaccedilatildeo e difusatildeo de novo conhecimento com valor cientiacutefico a sociedade em geral que pode usufruir e construir em cima do novo conhecimento as universidades e institutos de investigaccedilatildeo que disponibilizam condiccedilotildees adequadas para o decurso da produccedilatildeo cientiacutefica incluindo a construccedilatildeo de infraestruturas de AA as entidades financiadoras de investigaccedilatildeo cientiacutefica as editoras que criam revistas de AA para permitir a difusatildeo acesso ao conhecimento e ainda

14

diversas organizaccedilotildees que dedicam parte das suas atividades agrave promoccedilatildeo de poliacuteticas e praticas de AA Entre as organizaccedilotildees mais relevantes podemos encontrar a UNESCO Wellcome Trust a Joint Information Systems Committee (JISC) a Scholarly Publishing and Academic Resources Coalition (SPARC) a Open Knowledge International (OKI) ou a NIH soacute para citar algumas das organizaccedilotildees mais reconhecidas pelo seu esforccedilo em direccedilatildeo ao AA

Em Portugal os grandes intervenientes do AA satildeo a FCT enquanto entidade financiadora a Fundaccedilatildeo para a Computaccedilatildeo Cientiacutefica Nacional (FCCN) no planeamento e gestatildeo da Rede Ciecircncia Tecnologia e Sociedade (RCTS) a Universidade do Minho pioneira no AA no paiacutes e o Repositoacuterio Cientiacutefico de Acesso Aberto de Portugal vulgo RCAAP que eacute um agregador da informaccedilatildeo cientiacutefica produzida

Segundo Suber (2012 traduccedilatildeo livre) o AA eacute um movimento amplo que abrange todos os campos de conhecimento todos os paiacuteses independentemente da sua realidade econoacutemica inclui a investigaccedilatildeo puacuteblica e privada sem limitaccedilatildeo temporal e natildeo se limita aos conteuacutedos textuais pois frequentemente estende-se aos dados conteuacutedos multimeacutedia e coacutedigo executaacutevel A UNESCO (2015) defende que o AA natildeo eacute um movimento isolado embora tenha caracteriacutesticas uacutenicas

111 Via Dourada

A via dourada do AA eacute a publicaccedilatildeo de artigos cientiacuteficos em revistas de AA que pode envolver o pagamento de custos de processamento - Article Processing Charge (APC) - pelo autor instituiccedilatildeo ou entidade financiadora ficando o artigo disponiacutevel e sem custos para os leitores A publicaccedilatildeo em AA por via dourada eacute compatiacutevel com a qualidade cientiacutefica das editoras tradicionais pois as revistas de AA possuem o serviccedilo de revisatildeo por pares dos artigos sendo que algumas delas jaacute atingiram um alto niacutevel de prestiacutegio O prestiacutegio das revistaseditoras cientiacuteficas eacute um fator que pesa na escolha do local de publicaccedilatildeo por parte dos investigadores Contudo o mundo editorial de AA conta jaacute com editoras de grande qualidade que implementaram sistemas rigorosos de revisatildeo cientiacutefica como satildeo o caso da BioMed Central ou PLoS (Swan 2012) O Sponsoring Consortium for Open Access Publishing in Particle Physics (SCOAP3) eacute um exemplo de sucesso de publicaccedilatildeo em AA dourado Sob orientaccedilatildeo do European Organization for Nuclear Research (CERN) apostou no redireccionamento do dinheiro aplicado nas subscriccedilotildees de revistas cientiacuteficas para efetuar o pagamento dos APCrsquos das revistas de AA da aacuterea da fiacutesica das partiacuteculas (Sponsoring Consortium for Open Access Publishing in Particle Physics [SCOAP3] 2014) Algumas revistas cientiacuteficas utilizam um modelo hiacutebrido que lhes permite dobrar os lucros ao cobrar subscriccedilotildees para acesso aos artigos permitindo contudo que estes fiquem em AA se for pago o APC pelo autor (Swan 2012)

15

O Reino Unido um dos liacutederes mundiais em investigaccedilatildeo concluiu que a implementaccedilatildeo de uma licenccedila nacional pode potenciar o AA ao permitir a negociaccedilatildeo de preccedilos ao mesmo tempo que orienta os investigadores para a publicaccedilatildeo em AA dourado (Price amp Chaytor 2015)

112 Via Verde

De acordo com Harnad et al (2004) a via verde de AA eacute um modo de publicaccedilatildeo em revistas cientiacuteficas de subscriccedilatildeo e o respetivo auto arquivo do trabalho publicado num repositoacuterio de AA O auto arquivo eacute o ato de submeter uma coacutepia de um documento cientiacutefico num repositoacuterio de AA de forma a assegurar a abertura e acesso ao seu conteuacutedo (UNESCO 2015) Existem trecircs tipos de documentos usados na via verde a versatildeo preacute-publicada (manuscrito natildeo sujeito a revisatildeo) a versatildeo poacutes-publicada (artigo aceite para publicaccedilatildeo) e a versatildeo final publicada (Laakso 2014 Bjoumlrk Lakso Welling Paetau 2014) Laakso (2014) sublinha a diferenccedila de quantidade de artigos publicados em AA e indexados pela SCOPUS entre as vaacuterias disciplinas cientiacuteficas com a fiacutesica e as ciecircncias da sauacutede a serem as aacutereas do conhecimento mais abertas por larga margem A falta de cultura de utilizaccedilatildeo do preacute-print a ausecircncia de revistas cientiacuteficas de alta qualidade ou a falta de financiamento para pagar os APCrsquos satildeo algumas das razotildees encontradas por Bjoumlrk et al (2014) para justificar a diferenccedila

Os repositoacuterios de AA satildeo coleccedilotildees ou bases de dados bibliograacuteficas de artigos cientiacuteficos publicados na web mas incluem outros conteuacutedos como teses dissertaccedilotildees datasets ou material didaacutetico oferecendo uma ligaccedilatildeo persistente a assegurando a preservaccedilatildeo a longo-prazo (Suber 2012) Os repositoacuterios natildeo efetuam o serviccedilo de revisatildeo por pares embora alojem artigos publicados em revistas de AA Outro aspeto importante da via verde de AA eacute o facto dos repositoacuterios de AA natildeo poderem gerar permissotildees de utilizaccedilatildeo por geralmente natildeo possuiacuterem esses direitos (Suber 2012 Bjoumlrk et al 2014)

Segundo Houghton amp Swan (2013) a via verde eacute o meio mais sustentaacutevel em termos de custos para todas as partes envolvidas Poreacutem de acordo com Swan (2012) soacute quando o AA por via verde eacute mandatado eacute que se atingem resultados satisfatoacuterios Apesar disso os repositoacuterios podem estimular a sua utilizaccedilatildeo se fornecerem serviccedilos como a contagem de citaccedilotildees ou estatiacutesticas de uso Bjork et al (2014 traduccedilatildeo livre) afirmam que o raacutecio de depoacutesito de artigos revistos pelos pares em repositoacuterios ronda os 12 justificando este baixo nuacutemero com os fracos sistemas de incentivo acadeacutemico com a falta de repositoacuterios adequados com a falta de conhecimento e com o fato de ser uma tarefa que consome tempo

Segundo o Directory of Open Access Repositories (OpenDOAR) existem vaacuterios tipos de repositoacuterios de AA os disciplinares que reuacutenem toda a informaccedilatildeo cientiacutefica de um

16

determinado campo do conhecimento os institucionais que agregam a informaccedilatildeo produzida por uma determinada instituiccedilatildeo os governamentais que alojam informaccedilatildeo proveniente de oacutergatildeos do Governo e os repositoacuterios agregadores Em Novembro de 2016 encontram-se listados no OpenDOAR 49 repositoacuterios de AA localizados em Portugal sendo que cerca de frac34 da totalidade dos repositoacuterios pertence a instituiccedilotildees do ensino superior O Open Archive Initiative ndash Protocol for Metadata Harvesting (OAI-PMH) permite a interoperabilidade entre diferentes plataformas possibilitando aos repositoacuterios de AA formar um sistema central virtual potenciando a descoberta e acessibilidade da informaccedilatildeo cientiacutefica (Suber 2012 Swan 2012 Bjoumlrk et al 2014) A Cybermetrics Lab lanccedilou em 2017 o Ranking de Repositoacuterios Web um grupo de investigaccedilatildeo do Conselho Superior de Investigaccedilatildeo Cientiacutefica de Espanha com o objetivo de apoiar o AA agraves publicaccedilotildees cientiacuteficas

Portugal possui 4 repositoacuterios no grupo dos 223 ldquoTop Portalsrdquo do ranking com o Scielo Portugal a ocupar a 76ordf posiccedilatildeo o Repositoacuterio Comum na 87ordf posiccedilatildeo a Plataforma de Revistas de AA da Universidade de Aveiro na 110ordf posiccedilatildeo e o Depoacutesito de Dissertaccedilotildees e Teses Digitais na 124ordm posiccedilatildeo No ldquoTop Institutionalsrdquo Portugal eacute representado pelo Universidade do Minho Repositorium na 60ordf posiccedilatildeo seguido pelo Repositoacuterio Universidade de Lisboa na 156ordf posiccedilatildeo e Repositoacuterio Aberto Universidade do Porto na 188ordf posiccedilatildeo entre os melhores duzentos classificados Em termos de ranking mundial o Repositorium da Universidade do Minho eacute o repositoacuterio melhor colocado ocupando a 68ordf posiccedilatildeo (Cybermetrics Lab 2017)

A relaccedilatildeo entre a via verde e a via dourada pode ser vista como ldquocomplementary and synergisticrdquo pois a filosofia de criaccedilatildeo e implementaccedilatildeo eacute a mesma (Suber 201258) Para este autor a via verde natildeo necessita de investimento econoacutemico tatildeo elevado para alavancar o AA agraves publicaccedilotildees cientiacuteficas nem infringe a liberdade acadeacutemica podendo ainda cobrir todos os resultados de investigaccedilatildeo de uma instituiccedilatildeo Este modo de disseminaccedilatildeo eacute compatiacutevel com a publicaccedilatildeo nas tradicionais revistas por subscriccedilatildeo podendo ainda alojar outros conteuacutedos que natildeo apenas artigos Jaacute a via dourada possui a vantagem de ser imediata sem periacuteodos de embargo podendo ainda ser classificada como AA Livre se forem dadas as respetivas permissotildees de uso Acrescenta-se o facto de a via dourada possuir o serviccedilo de revisatildeo por pares e fornecer sempre o acesso agrave versatildeo final do artigo Suber (2012 traduccedilatildeo livre) afirma que apenas a conjugaccedilatildeo das vantagens de cada modelo de publicaccedilatildeo garante a complementaridade de publicaccedilatildeo em AA uma vez que por si soacute tanto a via verde como a via dourada natildeo satildeo suficientes para assegurar o pleno AA O autor defende que enquanto a via verde atua melhor no registo e preservaccedilatildeo da investigaccedilatildeo cientiacutefica a via dourada assegura uma melhor distribuiccedilatildeo e certificaccedilatildeo de qualidade Na impossibilidade de publicar por uma das vias o investigador pode optar pela outra via assegurando sempre o AA ao seu trabalho

17

12 A Ciecircncia Aberta

A investigaccedilatildeo cientiacutefica encontra-se numa transiccedilatildeo cultural que abrange os

modelos de publicaccedilatildeo e reutilizaccedilatildeo na procura de uma maior abertura com o cariz digital a impulsionar o acesso aos resultados cientiacuteficos Machado (2015) salienta a necessidade de adotar um conceito mais amplo e que possa alojar na sua definiccedilatildeo toda a panoacuteplia de recursos cientiacuteficos produzidos durante o processo de investigaccedilatildeo A Ciecircncia Aberta (CA) refere-se comummente ao esforccedilo para tornar mais acessiacuteveis os resultados da investigaccedilatildeo cientiacutefica financiada pelo setor puacuteblico em formato digital para a comunidade cientiacutefica setor empresarial ou sociedade em geral (OECD 2015a)

O conceito de CA eacute considerado um termo guarda-chuva que assenta em vaacuterios pilares quer para remoccedilatildeo das barreiras de partilha de qualquer resultado meacutetodo ou ferramenta em qualquer fase do processo de investigaccedilatildeo (Bueno de la Fuente 2016 traduccedilatildeo livre) quer como sua condiccedilatildeo para a sua concretizaccedilatildeo (infraestrutura tecnoloacutegica) quer como desambiguaccedilatildeo de autores instituiccedilotildees e produccedilatildeo cientiacutefica (identificadores uacutenicos) A figura seguinte expressa algumas das vertentes que se enquadram no conceito amplo de CA e que respeita a manifestaccedilotildees muito distintas natildeo apenas da academia como jaacute foi referido mas de todas as esferas da sociedade

Fig 1 Os pilares da Ciecircncia Aberta Fonte adaptado de httpswwwfosteropenscienceeucontentwhat-open-science-introduction

A CA eacute um meio e natildeo um fim Garantir o acesso aos resultados de investigaccedilatildeo cientiacutefica pode tornar o sistema de investigaccedilatildeo mais eficiente ao reduzir custos na coleta transferecircncia e reutilizaccedilatildeo de dados ao aumentar a transparecircncia e qualidade no processo de investigaccedilatildeo acelerar a transferecircncia do conhecimento aumentar a

Ciecircncia Aberta

Acesso Aberto

Dados Abertos

Ciecircncia Cidadatilde

Revisatildeo por Pares Aberta

Coacutedigo Aberto

Blocos de Notas abertos

Recursos Educacionais

Abertos

Redes Sociais Cientiacuteficas

18

repercussatildeo do conhecimento na economia e promover a ligaccedilatildeo entre cidadatildeos e a ciecircncia e a investigaccedilatildeo (OECD 2015a traduccedilatildeo livre) A colaboraccedilatildeo dos cidadatildeos no processo de investigaccedilatildeo eacute denominada ciecircncia cidadatilde sendo o movimento de CA um importante facilitador da participaccedilatildeo puacuteblica na ciecircncia (Leonelli Spichtinger Prainsack 2015) O crescimento da ciecircncia cidadatilde aumentou o nuacutemero de intervenientes na cocriaccedilatildeo de conhecimento contribuindo para a aproximaccedilatildeo da fronteira entre o cientista profissional e o amador (Royal Society 2012 International Science 2015) Segundo a UNESCO (2012) citando dados da PubMed Central 40 do acesso a resultados de investigaccedilatildeo eacute feito por cidadatildeos individuais superando a utilizaccedilatildeo feita por universidades empresas e governo

Segundo a Open Science and Research Initiative (2014) a promoccedilatildeo da CA eacute feita em 4 niacuteveis definiccedilatildeo de poliacuteticas gerais alteraccedilatildeo na cultura de trabalho alteraccedilatildeo nos meacutetodos de trabalho e desenvolvimento de serviccedilos e infraestruturas Fecher amp Friesike (2013) estruturaram as mudanccedilas na CA em cinco escolas de pensamento

Fig 2 As 5 escolas de pensamento das mudanccedilas operadas pela Ciecircncia Aberta Fonte Fecher amp Friesike (2013)

A abertura aos resultados da investigaccedilatildeo eacute segundo a UNESCO (2015) muito requerida no processo de capacitaccedilatildeo dos cidadatildeos sendo que esta noccedilatildeo de abertura acarreta mudanccedilas na sociedade ao fornecer soluccedilotildees sustentaacuteveis para o chamado fosso digital6 Para a CA prosperar a comunidade acadeacutemica deve ter acesso a publicaccedilotildees dados meacutetodos conhecimentos serviccedilos de apoio e colaboraccedilatildeo entre os diversos intervenientes (Open Science and Research Initiative 2014 Leonelli Spichtinger Prainsack 2015 OECD 2015a Resoluccedilatildeo do Conselho de Ministros nordm 212016 2016) O acesso agrave literatura acadeacutemica tem por objetivo transpor a clivagem de conhecimento existente na sociedade fornecendo o Acesso Aberto (AA) atraveacutes de sistemas em linha aos resultados da investigaccedilatildeo financiada com fundos puacuteblicos (UNESCO 2015)

6 Segundo o glossaacuterio estatiacutestico da OCDE o termo fosso digital refere-se agrave desigualdade no acesso agrave informaccedilatildeo tecnologias de comunicaccedilatildeo e uso da Internet entre indiviacuteduos negoacutecios e aacutereas geograacuteficas com diferentes niacuteveis socioeconoacutemicos Disponiacutevel na WWW httpsstatsoecdorgglossarydetailaspID=4719

bull dirigida agrave arquitetura tecnoloacutegica com novas plataformas ferramentas e serviccedilos para os cientistas Infraestrutura

bull dirigida agrave acessibilidade do conhecimento pelo puacuteblico Puacuteblica bull dirigida ao desenvolvimento de uma nova avaliaccedilatildeo alternativa de impacto Avaliaccedilatildeo

bull dirigida ao acesso gratuito ao conhecimento pelo puacuteblico Democraacutetica

bull melhoria da eficiecircncia atraveacutes da investigaccedilatildeo colaborativa Pragmaacutetica

19

O projeto da EU Facilitate Open Science Training for European Research (FOSTER) assume a divisatildeo do conceito de Ciecircncia Aberta em quatro diferentes categorias Acesso Aberto Dados Abertos Coacutedigo Aberto e Investigaccedilatildeo Replicaacutevel Aberta (Pontika Knoth Cancellieri amp Pearce 2015)

A plena implementaccedilatildeo da CA estaacute dependente da resoluccedilatildeo de alguns desafios A Royal Society (2012) afirma que os interesses comerciais e econoacutemicos incluem a propriedade dos dados e os direitos de propriedade intelectual associados as parcerias puacuteblico-privadas e a abertura de informaccedilatildeo comercial de interesse puacuteblico a que se junta a privacidade e a seguranccedila e que constituem limites agrave implementaccedilatildeo da CA Por outro lado os incentivos e as recompensas concedidos agrave comunidade cientiacutefica continuam a ser inexistentes particularmente porque existe (i) falta de infraestruturas para apoiar a abertura (ii) receio que os dados em bruto e meacutetodos sejam mal interpretados ou mal usados (iii) incerteza sobre a propriedade dos dados e (iv) falta de experiecircncia na promoccedilatildeo da CA (Open Science and Research Initiative 2014 traduccedilatildeo livre) Metaforicamente Leonelli Spichtinger Prainsack (201513) defendem que ldquoin addition to the stick of compulsatory mandates carrots are therefore also neededrdquo Os autores sintetizam as ldquocarrotsrdquo ou seja as recompensas em trecircs eixos reconhecimento das praacuteticas de partilha nas estruturas de incentivos criaccedilatildeo de incentivos mais significativos para envolver os investigadores na CA e o reconhecimento do papel das meacutetricas alternativas na avaliaccedilatildeo dos investigadores

A CA proporciona vaacuterios benefiacutecios a todos os intervenientes e partes interessadas do processo de investigaccedilatildeo como o aumento da eficaacutecia da investigaccedilatildeo o aumento do conhecimento do modelo cientiacutefico melhoria do foco e da qualidade dos resultados de investigaccedilatildeo geraccedilatildeo de novas ideias de investigaccedilatildeo aumento do compromisso com a ciecircncia e melhoria da literacia cientiacutefica maior abertura e impacto social e econoacutemico aumento da qualidade visibilidade e impacto da investigaccedilatildeo (Open Science and Research Iniciative 2014 Leonelli Spichtinger Prainsack 2015 Forsstroumlm amp Haataja 2016) Estes benefiacutecios abrangem os investigadores e as suas equipas as organizaccedilotildees os decisores e financiadores e tambeacutem o puacuteblico em geral

A CA clama por uma mudanccedila no comportamento dos investigadores de forma a permitir a abertura de conteuacutedos e a adoccedilatildeo de praacuteticas e estrateacutegias abertas em todo o ciclo de investigaccedilatildeo (Pontika et al 2015) De acordo com Machado (2015) a abertura do conhecimento na sociedade da informaccedilatildeo pode ser uma realidade se essa for a prioridade de qualquer poliacutetica que tenha por objetivo promover a melhoria das condiccedilotildees de vida dos cidadatildeos e a reduccedilatildeo das assimetrias globais Quando falamos de CA aquilo que se vecirc eacute uma realidade jaacute espelhada globalmente inclusivamente em paiacuteses como a China (Price amp Chaytor 2015) onde a abertura poliacutetica natildeo o faria supor

20

A Comissatildeo Europeia desenvolveu o Open Science Monitor como forma de avaliar os desenvolvimentos na CA e as tendecircncias particulares ldquoin open science activities over time and comparatively between countries and scientific disciplinesrdquo (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2017) O Open Science Monitor tem como fonte diversas organizaccedilotildees empenhadas na avaliaccedilatildeo da CA do AA e dos Dados Abertos7 garantindo assim a profundidade e qualidade dos dados O modelo usado pelo Open Science Monitor divide diversos indicadores de avaliaccedilatildeo em trecircs categorias AA agraves publicaccedilotildees AA aos dados de investigaccedilatildeo e formas abertas de comunicaccedilatildeo acadeacutemica como demostrado na figura8 seguinte

Fig 3 Caracteriacutesticas e indicadores do Open Science Monitor Fonte Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2017) Disponiacutevel na WWW httpeceuropaeuresearchopenscienceindexcfmpg=homeampsection=monitor

A implementaccedilatildeo da CA implica alteraccedilotildees ao niacutevel da administraccedilatildeo da investigaccedilatildeo para melhorar a ciecircncia tornando-a crediacutevel replicaacutevel e iacutentegra como explica a Comissatildeo Europeia (2016a) Significa tambeacutem fazer alteraccedilotildees teacutecnicas e desenvolver normas para tornar a ciecircncia mais eficiente ao evitar a duplicaccedilatildeo de 7 Entre as vaacuterias organizaccedilotildees encontram-se a 101 innovations Clarivate Analytics Altimetric arXiv F1000Research figshare OpenAIRE Wiley entre outras 8 Os indicadores assinalados com um asterisco () tambeacutem satildeo considerados como forma de comunicaccedilatildeo acadeacutemica aberta

21

recursos e ao otimizar a reutilizaccedilatildeo de dados Por fim tornar a ciecircncia mais aberta ao melhorar a acessibilidade a dados e ao assegurar as condiccedilotildees legais apropriadas para o desenvolvimento de Text e Data Mining potenciando assim alteraccedilotildees econoacutemicas e legais ao niacutevel do copyright

Os investigadores recorrem cada vez mais agraves plataformas sociais para partilhar e validar os projetos de investigaccedilatildeo enquanto a criaccedilatildeo de plataformas abertas permite a partilha de dados para resoluccedilatildeo de problemas puacuteblicos como eacute o caso do The Humanitarian Data Exchange9 (Open Science and Research Initiative 2014) A ScienceOpen eacute outro exemplo de uma plataforma gratuita de pesquisa de informaccedilatildeo cientiacutefica que oferece contexto agrave investigaccedilatildeo atraveacutes de comentaacuterios recomendaccedilotildees ou revisatildeo por pares apoacutes a publicaccedilatildeo permitindo assim que os investigadores encontrem a informaccedilatildeo mais relevante para as suas pesquisas (ScienceOpen 2017) Nos uacuteltimos anos tecircm surgido outras formas de publicaccedilatildeo em AA normalmente atraveacutes de paacuteginas pessoais ou em siacutetios de comunidades cientiacuteficas como o academiaedu ou o Research Gate que em 2017 foram classificados como liacutederes do ranking ldquoTop Portalsrdquo do Ranking de Repositoacuterios Web pela Cybermetrics Lab Outros resultados interessantes foram obtidos por Kramer e Bosman (2016) apoacutes a anaacutelise dos dados dos mais de 20 mil participantes num inqueacuterito a niacutevel global A CA e o AA satildeo apoiados por 809 e 859 dos inquiridos respetivamente Em termos de publicaccedilatildeo de artigos o estudo indica o Research Gate e os repositoacuterios institucionais como os preferidos Relativamente agrave publicaccedilatildeo de dados a preferecircncia dos inquiridos recaiu no GitHub seguindo-se o Figshare DropBox BitBucket Dataverse Dryad e o Zenodo Poreacutem dos 20 mil inquiridos apenas cerca de 30 respondeu a esta questatildeo Em relaccedilatildeo a Portugal e no caso do apoio agrave CA e ao AA os resultados satildeo extremamente positivos contudo a amostra obtida eacute demasiado pequena para se poder aferir qualquer conclusatildeo definitiva E contrastam de forma gritante com as conclusotildees do relatoacuterio sobre a elaboraccedilatildeo de uma poliacutetica nacional de CA que sublinha a dificuldade de generalizaccedilatildeo das praacuteticas de AA registando por isso limitaccedilotildees nas ldquotaxas de sucesso e cumprimentos das poliacuteticas institucionaisrdquo (Comissatildeo Executiva Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta [Comissatildeo Executiva GT-PNCA] 20169)

A intenccedilatildeo da EU eacute criar uma European Open Science Cloud (EOSC) ou seja um ambiente onde os investigadores possam ter acesso a ferramentas e dados para fins de investigaccedilatildeo inovaccedilatildeo e educaccedilatildeo Esta plataforma eacute considerada uma parte fundamental da transiccedilatildeo europeia para a CA e para tornar a ciecircncia orientada por dados (Comissatildeo Europeia 2016a traduccedilatildeo livre)

Podem observar-se algumas tendecircncias chave na CA e a sua relevacircncia na EOSC como o novo modelo de comunicaccedilatildeo acadeacutemica recompensas modernas e

9 Disponiacutevel na WWW httpsdatahumdataorg

22

reconhecimento aumento da dependecircncia de peritos de dados colaboraccedilatildeo interdisciplinar fomento da transiccedilatildeo de ciecircncia para inovaccedilatildeo desenvolvimento de um complexo sistema de infraestruturas da integridade da investigaccedilatildeo e do processamento do conhecimento por maacutequinas (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016b traduccedilatildeo livre)

O FOSTER desenhou uma interessante taxonomia a partir do termo CA que permite demonstrar a grandeza e os diferentes niacuteveis de impacto do conceito (Pontika et al 2015)

Fig 4 Taxonomia da Ciecircncia Aberta Fonte Knoth Petr Pontika Nancy (2015)

Em termos de poliacuteticas existem trecircs tendecircncias na definiccedilatildeo das poliacuteticas de CA como refere a OECD (2015a traduccedilatildeo livre)

As regras obrigatoacuterias impostas nos contratos de financiamento ou em poliacuteticas nacionais

Os mecanismos de incentivo como o apoio financeiro para publicaccedilatildeo de investigaccedilatildeo a citaccedilatildeo e a progressatildeo na carreira

Os viabilizadores ou seja a infraestrutura que permite o decurso da abertura cientiacutefica

23

A OECD (2015a) acrescenta que as poliacuteticas de AA satildeo mais maduras que as poliacuteticas de Ciecircncia Aberta existentes e sublinha ainda que as poliacuteticas de CA devem ter princiacutepios-base mas que tecircm de ser adaptadas agraves realidades locais

A CA tem estado em foco na agenda poliacutetica dos governos e organizaccedilotildees mundiais Ao niacutevel europeu a Agenda Digital da Comissatildeo Europeia define cinco potenciais linhas de accedilatildeo poliacuteticas (Comissatildeo Europeia 2016a45 traduccedilatildeo livre)

Fomento e criaccedilatildeo de incentivos para a CA atraveacutes do fomento do conceito de abertura em programas de educaccedilatildeo e promoccedilatildeo das melhores praacuteticas de ciecircncia cidadatilde garantindo a qualidade impacto e integridade da investigaccedilatildeo

Remoccedilatildeo de barreiras atraveacutes da revisatildeo de carreiras dos investigadores bem como dos incentivos e recompensas pelos esforccedilos de CA

Generalizaccedilatildeo da promoccedilatildeo de poliacuteticas de AA (artigos e dados de investigaccedilatildeo) Desenvolvimento de infraestruturas de investigaccedilatildeo para a CA de forma a

melhorar o alojamento de dados acesso e governaccedilatildeo com a criaccedilatildeo de uma nuvem europeia de CA (European Open Science Cloud)

Incorporar a Ciecircncia Aberta na sociedade como condutor socioeconoacutemico

De acordo com a Open Science and Research Initiative (2014) a CA tem vaacuterios intervenientes distintos os investigadores e as equipas de investigaccedilatildeo organizaccedilotildeesentidades de investigaccedilatildeo financiadores decisores e puacuteblico em geral A OECD (2015a) acrescenta as bibliotecas editoras cientiacuteficas privadas empresas e entidades supranacionais como a proacutepria OECD Neste contexto a EU tem-se destacado como promotora da CA Nesse sentido criou o jaacute mencionado FOSTER um projeto cujo objetivo eacute produzir um programa de treino que iraacute ajudar investigadores estudantes bibliotecaacuterios e outras partes interessadas a incorporar a CA nas suas metodologias de investigaccedilatildeo O portal FOSTER10 eacute uma plataforma e-learning que agrega conteuacutedos de treino sobre CA para aqueles que precisem de desenvolver estrateacutegias e competecircncias para a implementaccedilatildeo da CA nos fluxos de trabalho diaacuterio (FOSTER 2016) A Uniatildeo Europeia (EU) posiciona-se tambeacutem como financiadora do AA como forma de acesso ao conhecimento Nesse sentido adotou o AA como princiacutepio em 2012 tendo-o definido como obrigatoacuterio em 2013 no novo programa de financiamento da investigaccedilatildeo e inovaccedilatildeo europeu denominado Horizonte 2020 (Uniatildeo Europeia 2013) Financiou ainda um projeto de investigaccedilatildeo exclusivamente dedicado ao alinhamento de estrateacutegias e poliacuteticas de AA o Pasteur4OA Aleacutem disso a EU criou o OpenAIRE uma plataforma que permite agregar toda a literatura cientiacutefica produzida em projetos financiados por fundos europeus A segunda fase do OpenAIRE consiste em facilitar o AA ao fornecer ligaccedilotildees cruzadas entre publicaccedilotildees dados e esquemas de financiamento e iraacute expandir a rede de repositoacuterios para incluir os fornecedores de dados com o objetivo de interligar os dados cientiacuteficos associados

10 Disponiacutevel na WWW httpswwwfosteropenscienceeu

24

(OECD 2015a) A terceira fase do projeto arrancou em Janeiro de 2017 com o OpenAIRE-Connect que visa fornecer pontes tecnoloacutegicas e sociais para aleacutem de disponibilizar serviccedilos de troca de literatura dados ou meacutetodos de investigaccedilatildeo ldquowith semantic links between them across research communities and content providers in scientific communicationrdquo (OpenAIRE 2017) O OpenAIRE-Connect iraacute tambeacutem implementar o conceito de ldquoOpen Science as a Service (OSaaS) on top of the existing OpenAIRE infrastructure delivering out-of-the-box on demand deployable toolsrdquo (OpenAIRE 2017) O projeto eacute uma parceria entre 11 instituiccedilotildees onde consta a Universidade do Minho como representante portuguesa

A UNESCO estaacute ativamente empenhada na promoccedilatildeo da CA e em parceria com a Nature lanccedilou em Novembro de 2014 a Biblioteca Mundial de Ciecircncia11 (WLoS) uma biblioteca cientiacutefica gratuita e multilingue com o objetivo de fornecer acesso agrave investigaccedilatildeo cientiacutefica recente a estudantes e professores de todas as partes do globo Podemos ainda relacionar a CA com o conceito de Ciecircncia 20 que sugere a partilha e a colaboraccedilatildeo como nova abordagem para o uso de informaccedilatildeo incluindo o uso de ferramentas como wikis blogs viacutedeos dados em bruto e novas teorias (Machado 2015 Leonelli Spichtinger Prainsack 2015)

Em Portugal soacute em fevereiro de 2016 se regista a intenccedilatildeo de estabelecer uma poliacutetica nacional de Ciecircncia Aberta com a publicaccedilatildeo dos principiacuteos orientadores para a ldquoCiecircncia Aberta Conhecimento para todosrdquo pelo Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior (MCTES) Em Maio a Resoluccedilatildeo do Conselho de Ministros nordm 212016 vem definir os princiacutepios da implementaccedilatildeo da poliacutetica de Ciecircncia Aberta em Portugal Esta poliacutetica estaacute estruturada em torno de quatro eixos Acesso aberto e dados abertos Infraestruturas e preservaccedilatildeo digital Avaliaccedilatildeo cientiacutefica Responsabilidade social cientiacutefica (Comissatildeo Executiva GT-PNCA 2016)

O MCTES e o Ministeacuterio da Cultura lanccedilaram em 201712 o Diretoacuterio dos Repositoacuterios Digitais uma infraestrutura digital com o objetivo de identificar e constituir um ponto de acesso aos repositoacuterios digitais existentes em Portugal na aacuterea da Ciecircncia e da Cultura de forma a promover a utilizaccedilatildeo dos repositoacuterios digitais bem como a normalizaccedilatildeo teacutecnica e praacuteticas de preservaccedilatildeo digital tal como foi anunciado em 2016 (Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior Ministeacuterio da Cultura 2016)

13 Big Data ou dados massivos

O termo Big Data surge associado aos dados em formato digital que excedem a capacidade de processamento dos sistemas de bases de dados convencionais (Reitano 11 Disponiacutevel na WWW httpwwwnaturecomwlsabout 12 Disponiacutevel na WWW httprepositorios-conhecimentopt

25

2013 Comissatildeo Europeia 2014) Segundo Borgman (2015) o Big Data compreende dados estruturados e natildeo estruturados com tendecircncia agrave homogeneidade e agrave padronizaccedilatildeo Ubaldi (2013 traduccedilatildeo livre) reitera que o Big Data enquanto fenoacutemeno emergiu quando a disponibilidade de datasets produzidos por vaacuterias fontes cresceu e quando os utilizadores de dados reconheceram o valor potencial da combinaccedilatildeo e ligaccedilatildeo de diferentes conjuntos de dados produzidos por diferentes intervenientes

A revoluccedilatildeo digital ocorrida nas uacuteltimas deacutecadas teve repercussotildees profundas na coleta acesso armazenamento e transmissatildeo de dados estando atualmente estimado em 40 o volume de crescimento de dados por ano (Manyika et al 2011) Os dados digitais estatildeo presentes em todos os setores econoacutemicos o nuacutemero de paacuteginas web cresceu exponencialmente surgiram as redes sociais os smartphones e toda uma panoacuteplia de tecnologias que coletam dados que podem ser beneacuteficos para a sociedade como as aplicaccedilotildees surgidas no acircmbito da Internet of Things13 (IoT) que iratildeo avolumar o nuacutemero de dados jaacute produzidos (Fan amp Bifet 2012)

Weacutere drowning in data bits are faster than atoms (Croll 20122)

Large amounts of data are being produced permanently and when these are analyzed and interlinked they have the potential to create new knowledge and intelligent solutions for economy and society (Uniatildeo Europeia 2016)

Lynch (2009) salienta a emergecircncia do 4ordm paradigma da investigaccedilatildeo cientiacutefica termo cunhado por Jim Gray definindo-se como uma ciecircncia intensiva orientada a dados

Fig 5 Paradigmas da investigaccedilatildeo cientiacutefica Fonte traduzido de Lynch (2009)

Esta nova ciecircncia assenta em trecircs pilares captura curadoria e anaacutelise de dados (Bell 2009 Royal Society 2012) A curadoria de dados envolve variadas atividades como ldquofinding the right data structures to map into various storesrdquo (Bell 2009XIII) Inclui o esquema de metadados e os respetivos metadados para a sua preservaccedilatildeo e pesquisa A anaacutelise de dados ldquocovers a whole range of activities throughout the workflow pipeline including the use of databases analysis and modeling and then

13 A Internet Of Things eacute um conceito onde edifiacutecios transportes produtos e pessoas se tornam espaccedilos de informaccedilatildeo ou seja satildeo imbuiacutedos com sensores software ou eletroacutenica que lhes permite coletar e partilhar dados Disponiacutevel na WWW httpwwwtheinternetofthingseuwhat-is-the-internet-of-things

Investigaccedilatildeo teoacuterica

Investigaccedilatildeo empiacuterica

Investigaccedilatildeo computacional

Investigaccedilatildeo orientada a dados

26

data visualizationrdquo (Bell 2009XIV) podendo ser sinoacutenimo de melhores resultados processos e decisotildees (Comissatildeo Europeia 2014)

Dumbill (2012) afirma que para retirar valor destes dados eacute necessaacuterio encontrar formas alternativas de os processar Borgman reitera que os dados tecircm muitos tipos de valor e que esse valor pode natildeo ser visiacutevel ateacute os dados serem coletados curados ou perdidos A autora sublinha que os dados natildeo tecircm valor estando isolados eles fazem parte de uma infraestrutura do conhecimento ldquoan ecology of people pratices technologies institutions material objects and relationshpsrdquo (Borgman 20154) Este volume de dados produzidos pode segundo o Big Data Europe (2016) trazer contribuiccedilotildees relevantes para o progresso teacutecnico dos setores chave da sociedade e ajudar a reformular o mundo dos negoacutecios Ainda segundo a EU ldquowhat is needed are innovative technologies strategies and competencies for the beneficial use of Big Data to address societal needsrdquo

Segundo Manyika et al (2011) os Dados Massivos podem gerar valor de vaacuterias formas criar transparecircncia governativa e empresarial permitir a experimentaccedilatildeo expor variaacuteveis e melhorar o rendimento criar de produtos e serviccedilos para populaccedilotildees especiacuteficas apoiar ou substituir o processo de decisatildeo humana com algoritmos automatizados criar de modelos de negoacutecio produtos e serviccedilos inovadores Verifica-se que um nuacutemero crescente de empresas jaacute usa dados para gerar valor econoacutemico sendo que tambeacutem os governos tecircm a possibilidade de aumentar a sua eficiecircncia e gerar poupanccedila (Manyika et al 2011) A Comissatildeo Europeia (2017a) destaca as aplicaccedilotildees para smartphones ou produtos inteligentes para empresas acrescentando que os Dados Massivos podem fomentar o crescimento de emprego na Europa e melhorar a qualidade de vida dos cidadatildeos europeus

Numa organizaccedilatildeo o valor do Big Data eacute contabilizado em duas categorias uso analiacutetico e desenvolvimento de novos produtos (Dumbill 2012) Croll (20122) afirma a necessidade da sociedade em decidir agir e experimentar com base nas aprendizagens feitas e utilizar esse conhecimento em accedilotildees futuras defendendo que estamos a entrar numa ldquofeedback economyrdquo que iraacute tornar-se a norma em organizaccedilotildees puacuteblicas e no setor empresarial dada a eficiecircncia e a otimizaccedilatildeo de recursos geradas Esta economia de retorno de resultados e respetivas mediccedilotildees de impacto tem por base a cadeia de abastecimento dos Dados Massivos como representado na figura seguinte

27

Fig 6 Cadeia de abastecimento dos Dados Massivos Fonte traduzido de Croll (2012)

ldquoIn this networked world people objects and connections are producing data at unprecedented rates both actively and passivelyrdquo (Science International 2015) Segundo Hey Tansley e Tolle (2009) a Internet pode proporcionar mais do que o acesso aos dados pode agregar todos os dados disponiacuteveis agrave literatura que lhes faz referecircncia aumentando a velocidade da informaccedilatildeo cientiacutefica e a eficiecircncia da investigaccedilatildeo Laney (2001) foi o primeiro a caraterizar a gestatildeo de dados atraveacutes do sistema de trecircs Vrsquos que ajuda a perceber a natureza dos dados e as plataformas disponiacuteveis para os explorar Marr (2014) afirma que atualmente o sistema passou a ser composto por dois Vrsquos adicionais perfazendo um total de cinco Vrsquos

Volume o volume e o tamanho dos dados continuam a aumentar contudo a capacidade de processamento dos nossos sistemas continua baixa

Variedade existecircncia de diversos tipos de dados provenientes de diversas fontes Velocidade obtenccedilatildeo de informaccedilatildeo em tempo real Veracidade refere-se agrave qualidade e correccedilatildeo dos dados Valor ganho de competitividade tomada de decisotildees alavancada em informaccedilatildeo

atualizada

A intensidade da revoluccedilatildeo operada pelo fenoacutemeno dos Dados Massivos ldquohas produced changes in economic and social behaviour e has profound implications for sciencerdquo permitindo a identificaccedilatildeo de padrotildees em fenoacutemenos e demonstrando relaccedilotildees insuspeitas entre dados que ateacute aqui eram desconhecidas (Science International 2015) ldquoContrary to many high-volume big data settings where standardised infrastructure are available there exist other big data settings with less

Coleta de Dados

Extraccedilatildeo e Limpeza

Infra

estruturas

Plataformas

M Learning e Mining

Exploraccedilatildeo humana

Armazena mento

Partilha

Mediccedilatildeo de resultados e criaccedilatildeo de feedback

28

mature processes due to the lack of tools resources and community exchangerdquo (Proumll Meixner ampRauber 2016) Borgman (20158) recorre a um termo utilizado na Estatiacutestica para identificar distribuiccedilotildees de dados a long tail of data14 ou cauda longa dos dados que quando aplicada agrave investigaccedilatildeo acadeacutemica implica que ldquoa small number of research teams work with large volumes of data some teams work with very little data and most fall somewhere in betweenrdquo

Fig 7 A cauda longa dos Dados Massivos Fonte traduzido de Borgman (2015)

A cauda longa dos dados de investigaccedilatildeo abrange grandes porccedilotildees ldquoof data that are highly heterogeneous managed predominantly locally within each researcherrsquos environment and frequently not properly transferred to and managed within well-curated repositoriesrdquo (Proumll Meixner ampRauber 2016) Segundo o e-Infrastructure Reflection Group (e-IRG) (2016) citando Heidorn (2008) o termo long tail of data tem-se tambeacutem aplicado para salientar a variedade na estrutura tema complexidade formato tamanho localizaccedilatildeo e o uso na investigaccedilatildeo dos dados de investigaccedilatildeo

Para capturar todo o potencial gerado pela produccedilatildeo massiva de dados devem ser tidas em conta vaacuterias questotildees (Manyika et al 2011 traduccedilatildeo livre)

Formulaccedilatildeo de poliacuteticas de dados que incluam temas sensiacuteveis como a privacidade seguranccedila credibilidade e propriedade intelectual

Desenvolvimento de novas tecnologias de armazenamento computaccedilatildeo e software analiacutetico aleacutem de novas teacutecnicas de anaacutelise

Mudanccedila na cultura organizacional com a contrataccedilatildeo de peritos que possam retirar informaccedilatildeo e conhecimento dos dados e tambeacutem o estabelecimento de incentivos para otimizar o uso do Big Data induzindo melhorias numa tomada de decisatildeo mais informada

Acesso aos dados para permitir a criaccedilatildeo de novas oportunidades de negoacutecio Intensificaccedilatildeo da estrutura competitiva de empresas e setor puacuteblico para

potenciar a captaccedilatildeo de benefiacutecios da massificaccedilatildeo de dados

14 O termo foi introduzido por Cris Anderson (2004) para comparar o mercado de bens feito ao niacutevel de vendas fiacutesicas e online Disponiacutevel na WWW httpswwwwiredcom200410tail

Volu

me

de d

ados

Nuacutemero de Investigadores

29

O fenoacutemeno do Big Data estaacute intrinsecamente ligado a outro fenoacutemeno o desenvolvimento de software aberto como eacute o caso do Apache Hadoop15 que permite o processamento de grandes quantidades de dados em paralelo atraveacutes ldquolarge clusters of compute nodesrdquo (Fan amp Bifet 20123)

A influecircncia do Big Data na sociedade manifesta-se a diversos niacuteveis destacando-se o desenvolvimento de projetos na aacuterea da sauacutede transportes agricultura ambiente induacutestria ganho de competecircncias cientiacuteficas mercado de dados e dados abertos Num artigo assinado na Computer World Olavsrud (2013) identifica alguns dos usos do Big Data na atualidade fins meacutedicos empresariais tecnoloacutegicos em eventos desportivos ou no desenvolvimento das smart cities A Uniatildeo Europeia tem contribuiacutedo para o alargar da importacircncia e da esfera de influecircncia do fenoacutemeno Big Data financiando entre outros projetos como

DataPitch16 que tem por objetivo acelerar a chegada dos dados ao mercado Open Data Incubator Europe17 (ODINE) que oferece incubaccedilatildeo e tutoria agraves PMEs

na nova geraccedilatildeo de empreendedorismo digital European Data Science Academy18 (EDSA) que avalia o estado do setor de peritos

de dados e oferece ciclos de aprendizagem de habilidades especiacuteficas de acordo com as necessidades detetadas

Big Data Europe que visa coletar informaccedilotildees sobre o desenvolvimento de infraestruturas necessaacuterias agrave praacutetica de uma ciecircncia de dados intensiva para a resoluccedilatildeo de problemas da sociedade possibilitando que as empresas possam construir produtos e serviccedilos inovadores ldquobased on semantically interoperable large-scale multi-lingual data assets and knowledge available under a variety of licenses and business modelsrdquo (Big Data Europe 2016)

14 Dados Abertos

Eacute axiomaacutetico o fato de o conhecimento ser essencial ao processo de decisatildeo agrave inovaccedilatildeo e ao bem-estar social Os dados sempre foram essenciais em muitas aacutereas da investigaccedilatildeo e nos uacuteltimos anos tornaram-se destaque em mais aacutereas cientiacuteficas crescendo substancialmente em escala e complexidade Quando a informaccedilatildeo eacute abundante a proacutepria natureza da investigaccedilatildeo comeccedila a mudar gerando um ciclo de respostas entre investigadores e resultados de investigaccedilatildeo que ldquochanges the pace and direction of discoveryrdquo (Comissatildeo Europeia Grupo de peritos de alto niacutevel em dados de investigaccedilatildeo 20108) Os Dados Abertos permitem que os investigadores produzam anaacutelises e inferecircncias muito aleacutem do que os indiviacuteduos e silos de dados isolados podem

15 Disponiacutevel na WWW httphadoopapacheorg 16 Disponiacutevel na WWW httpcordiseuropaeuprojectrcn206193_enhtml 17 Disponiacutevel na WWW httpsopendataincubatoreu 18 Disponiacutevel na WWW httpcordiseuropaeuprojectrcn194116_enhtml

30

produzir (Shadbolt 2016) O International Council for Science (ICSU) considera que quando o setor publico eacute o responsaacutevel pelos custos da criaccedilatildeo de dados de investigaccedilatildeo eacute do interesse cientiacutefico que seja encorajado o maacuteximo e possiacutevel uso e reuacuteso dos dados (International Council for Science [ICSU] 2014) A abertura dos dados gerados na investigaccedilatildeo cientiacutefica ou pelas entidades puacuteblicas as grandes fontes de dados na atualidade constituem uma oportunidade de gerar valor para a sociedade Segundo Borgman (2015) dados satildeo representaccedilotildees de observaccedilotildees objetos ou outras entidades usadas como prova de um fenoacutemeno para fins de investigaccedilatildeo ou acadeacutemicos Os dados tornam-se informaccedilatildeo quando satildeo combinados de formas que podem revelar padrotildees num determinado fenoacutemeno O conhecimento eacute gerado pela informaccedilatildeo apoiada em dados concretos sobre um fenoacutemeno (Royal Society 2012)

ldquoIn the digital age data is the raw material on which discoveries are built and unfettered access to research datardquo (SPARC) O processo de investigaccedilatildeo eacute dividido em vaacuterias etapas atraveacutes das quais muitas vezes satildeo produzidos dados primaacuterios estatiacutesticas caacutelculos ou anotaccedilotildees seja em forma bruta ou em forma graacutefica que servem de suporte aos artigos cientiacuteficos publicados Contudo dada a variedade de tipologias e formatos por norma os dados natildeo satildeo alvo de publicaccedilatildeo correndo o risco de ser perderem se natildeo forem adequadamente armazenados e preservados Neste sentido a abertura de dados eacute essencial para assegurar a sua preservaccedilatildeo e possiacutevel reutilizaccedilatildeo em benefiacutecio da sociedade

Existem vaacuterias definiccedilotildees de Dados Abertos apresentando algumas diferenccedilas entre elas embora focando o mesmo objetivo Algumas das definiccedilotildees satildeo emitidas no acircmbito da abertura de dados puacuteblicos outras da abertura de dados de investigaccedilatildeo O portal de dados dos EUA define Open Data como os conjuntos de dados de alto valor criados pelo governo federal que possam ser processados por maacutequina e que natildeo sejam privados ou restritos por razotildees de seguranccedila (United States General Services Administration) A Royal Society (2012) entende por Open Data os dados que devem ser acessiacuteveis utilizaacuteveis avaliados ou certificados e inteligiacuteveis A Open Definition sintetiza que os Dados Abertos devem poder ser ldquofreely used modified and shared by anyone for any purposerdquo (Open Knowledge International [a]) Segundo a Open Knowledge International (OKI) (2012b) ldquoOpen Data are the building blocks of open knowledgerdquo O termo Open Data pode ainda referir-se a outros tipos de dados natildeo puacuteblicos que sejam acessiacuteveis de forma livre como os dados dos meacutedia sociais (European Data Portal 2016a)

ldquoOpenness is not however enough Data must be intelligently openrdquo (Science International 20154) O primeiro passo na abertura inteligente dos dados eacute segundo a Royal Society (20127) ldquodata that underpin a journal article should be made concurrently available in a accessible databaserdquo O mundo acadeacutemico tem vindo a ser moldado para apoiar a abertura agrave medida que os benefiacutecios se tornam mais tangiacuteveis e

31

a pressatildeo de retorno de investimento exercida sobre as entidades financiadoras aumenta embora nem todas as aacutereas evoluam com a mesma rapidez (Hahnel amp Hook 2016) A Royal Society (2012) sublinha a necessidade das instituiccedilotildees ligadas agrave investigaccedilatildeo cientiacutefica gerirem os seus dados de modo proficiente para obterem os benefiacutecios proporcionados pela abertura de dados e entenderem a enorme mudanccedila cultural necessaacuteria para atingir este objetivo

A Denton Declaration foi publicada em 2012 com o intuito de promover boas praacuteticas de gestatildeo de dados de investigaccedilatildeo promover a colaboraccedilatildeo transparecircncia e prestaccedilatildeo de contas ao longo das fronteiras organizacionais e disciplinares Esta declaraccedilatildeo estabeleceu treze princiacutepios para promover a cultura de abertura na investigaccedilatildeo estabelecer um padratildeo para arquivo de dados de modo a facilitar a sua pesquisa e acesso desenvolver um regime de financiamento para a construccedilatildeo da infraestrutura necessaacuteria para a gestatildeo de dados adotar padrotildees de metadados preservar a longo prazo os dados subjacentes agraves publicaccedilotildees apoiar os investigadores nas negociaccedilotildees para a abertura dos dados com as editoras e o reconhecer da propriedade intelectual dos investigadores nos dados e em outros produtos de investigaccedilatildeo (Denton Declaration An Open Data Manifesto 2012 traduccedilatildeo livre)

A gestatildeo de informaccedilatildeo e do conhecimento deve ser incluiacuteda nas estrateacutegias organizacionais das instituiccedilotildees (Royal Society 2012) Quando os dados satildeo bem organizados documentados preservados e partilhados tornam-se preciosos no avanccedilo cientiacutefico e no aumento de oportunidades de aprendizagem e inovaccedilatildeo (UK Data Archive 2017) O ciclo de vida dos dados contempla seis fases de gestatildeo incluiacutedas num processo contiacutenuo a cada reutilizaccedilatildeo geram-se novos dados conforme demonstrado na figura seguinte

Fig 8 Ciclo de vida dos dados de investigaccedilatildeo Fonte traduzido de UK Data Archive (2017) Disponiacutevel na WWW httpwwwdata-archiveacukcreate-managelife-cycle

As seis fases do ciclo de vida dos dados comportam diversas accedilotildees necessaacuterias agrave plena execuccedilatildeo de cada ciclo

Criaccedilatildeo

Processa mento

Anaacutelise

Preservaccedilatildeo

Fornecer acesso

Reutilizaccedilatildeo

32

Criaccedilatildeo desenho da investigaccedilatildeo criaccedilatildeo do plano de gestatildeo de dados planear a partilha localizar dados existente coletar dados capturar eou criar metadados

Processamento entrada de dados transcriccedilatildeo traduccedilatildeo validaccedilatildeo limpeza anonimizaccedilatildeo descriccedilatildeo gestatildeo e armazenamento de dados

Anaacutelise interpretaccedilatildeo e derivaccedilatildeo de dados produccedilatildeo de resultados de investigaccedilatildeo publicaccedilatildeo e preparaccedilatildeo dos dados para preservaccedilatildeo

Preservaccedilatildeo migraccedilatildeo de dados para o melhor formato criaccedilatildeo de coacutepia de seguranccedila e armazenamento criaccedilatildeo de metadados e arquivo

Fornecer acesso distribuir e partilhar dados controlar o acesso estabelecer a propriedade intelectual promover os dados

Reutilizaccedilatildeo acompanhamento da investigaccedilatildeo assumir a revisatildeo da investigaccedilatildeo escrutinar os resultados e aprender e ensinar (UK Data Archive 2017)

Com o objetivo de contribuir para a adoccedilatildeo de padrotildees e poliacuteticas de Dados Abertos de investigaccedilatildeo algumas organizaccedilotildees lanccedilaram iniciativas e princiacutepios de Open Data destinadas agrave recomendaccedilatildeo de boas praticas na publicaccedilatildeo de dados de investigaccedilatildeo obtidos atraveacutes de financiamento puacuteblico Apoacutes o lanccedilamento de uma declaraccedilatildeo em 2004 a OECD publicou em 2007 um conjunto de 13 princiacutepios para abertura de dados de investigaccedilatildeo provenientes de financiamento puacuteblico Em 2010 foram lanccedilados os Panton Principles um conjunto de quatro princiacutepios delimitadores da abertura de dados na ciecircncia cujo foco centrou-se no licenciamento de conteuacutedos para garantir uma clara partilha distribuiccedilatildeo e reutilizaccedilatildeo de informaccedilatildeo pelos investigadores (Panton Principles 2010 traduccedilatildeo livre) A Royal Society afirma em 2012 que os dados abertos devem ser acessiacuteveis inteligiacuteveis avaliaacuteveis e reutilizaacuteveis Em 2014 foram publicados os Nairobi Data Sharing Principles um conjunto de dez recomendaccedilotildees destinadas a apoiar a abertura de dados puacuteblicos e de investigaccedilatildeo nos paiacuteses em vias de desenvolvimento por forma a gerar valor econoacutemico social educacional e potenciar a investigaccedilatildeo cientiacutefica (International Workshop on Open Data for Science and Sustainability in Developing Countries 2014)

A Open Definition um projeto da responsabilidade da OKI fixou os princiacutepios que definem a abertura de dados e conteuacutedos assegurando a qualidade e encorajando a compatibilidade de diferentes tipos de conteuacutedos atraveacutes da utilizaccedilatildeo precisa do termo aberto (Open Knowledge International [a] traduccedilatildeo livre) Assim o termo Dados Abertos engloba dois tipos diferentes de abertura

Abertura Teacutecnica os conteuacutedos devem ser publicados sob uma licenccedila aberta ao custo de produccedilatildeo num formato aberto e que possa ser processado por maacutequina

Abertura Legal a licenccedila aberta deve permitir o uso redistribuiccedilatildeo modificaccedilatildeo separaccedilatildeo compilaccedilatildeo propagaccedilatildeo aplicaccedilatildeo para qualquer fim ou propoacutesito sem custos e sem discriminaccedilatildeo contra pessoas ou grupos A mesma licenccedila pode requerer condiccedilotildees de uso como a atribuiccedilatildeo de creacutedito de autoria manutenccedilatildeo

33

da integridade do trabalho original redistribuiccedilatildeo sob a mesma licenccedila do original retenccedilatildeo de notificaccedilotildees de copyright acesso agrave fonte original proibiccedilatildeo de implementaccedilatildeo de restriccedilotildees teacutecnicas e implementaccedilatildeo de regras de natildeo-agressatildeo com a licenccedila original (Open Knowledge International [a]) traduccedilatildeo livre)

A Science International (2016) eacute o conjunto das 4 entidades mais representativas a niacutevel da ciecircncia internacional (International Council for Science ndash ICSU the InterAcademy Partnership ndash IAP The World Academy of Sciences ndash TWAS and the International Social Science Council ndash ISSC) que tecircm por missatildeo representar a comunidade cientiacutefica global na definiccedilatildeo de poliacuteticas cientiacuteficas internacionais Esta organizaccedilatildeo lanccedilou 12 princiacutepios para os Dados Abertos criados com base em outros relatoacuterios da autoria quer dos proacuteprios parceiros da Science International quer de instituiccedilotildees governamentais ou acadeacutemicas Estes princiacutepios assentam em trecircs pilares base as responsabilidades de cada interveniente os limites da abertura e as praacuteticas adequadas (Science International 2015 traduccedilatildeo livre)

Todos estes princiacutepios de abertura de dados de investigaccedilatildeo foram sintetizados no Quadro 1 apresentando-se apenas os princiacutepios mencionados em pelo menos duas recomendaccedilotildees de Open Data

Quadro 1 Princiacutepios de abertura de dados de investigaccedilatildeo mais recomendados

Princiacutepios e recomendaccedilotildees

OECD Princ (2007)

Panton Princ (2010)

Royal Soc

(2012)

Nairobi Princ (2014)

Science Int

(2015)

Open Defini tion

Abertura Acesso Reutilizaccedilatildeo

Citaccedilatildeo de dados Interoperabilidade Sem discriminaccedilatildeo Licenccedilas Abertas Formato Aberto

Processaacuteveis p maacutequina Modificaccedilatildeo

Publicaccedilatildeo imediata Qualidade

Acesso Gratuito Disponibilidade

Sustentabilidade Qualidade

Integridade

Fonte Elaboraccedilatildeo proacutepria

Analisando em detalhe os princiacutepios de abertura dos dados de investigaccedilatildeo eacute possiacutevel retirar algumas ilaccedilotildees sobre quais as recomendaccedilotildees consideradas mais importantes Verifica-se uma grande variedade de princiacutepios propostos sendo que

34

apenas 16 num total de 33 se repetem em 2 ou mais recomendaccedilotildees A abertura legal e teacutecnica dos dados soacute eacute acautelada por metade dos princiacutepios Os princiacutepios considerados mais importantes satildeo o AA aos dados seguido da reutilizaccedilatildeo de dados A citaccedilatildeo de dados interoperabilidade acesso sem discriminaccedilatildeo licenccedilas e formatos abertos a modificaccedilatildeo e o fato de os dados serem processaacuteveis por maacutequina satildeo mencionados apenas em trecircs recomendaccedilotildees tendo a seu favor o fato de terem sido incluiacutedas nas recomendaccedilotildees mais recentes Princiacutepios relevantes como a publicaccedilatildeo imediata a qualidade e a integridade dos dados surgem apenas duas vezes listados

Eacute possiacutevel verificar que a OKI (2012b) coloca os dados de investigaccedilatildeo ao mesmo niacutevel de importacircncia que outros tipos de dados com potencial para novos usos e aplicaccedilotildees para benefiacutecio da sociedade como os dados culturais financeiros estatiacutesticos ambientais e ainda sobre o clima e transportes

A OECD (2015a traduccedilatildeo livre) defende haver quatro tipos de dados cientiacuteficos

Fig 9 Tipos de dados cientiacuteficos Fonte traduzido de OECD (2015a)

A explosatildeo de produccedilatildeo de dados que originou o Big Data possui um segundo pilar os Dados Ligados ou Linked Data A combinaccedilatildeo destas duas abordagens tem o potencial para criar uma nova era de entendimento cientiacutefico relativamente aos maiores problemas subjacentes agrave espeacutecie humana (Science International 2015) O termo Linked Data cunhado por Tim Berners-Lee implica que as ldquorelationships among data should be made availablerdquo (World Wide Web Consortium [W3C] 2015) ou seja conjuntos de dados relacionados com um fenoacutemeno em particular e que estatildeo ligados de uma forma loacutegica podem ser conectados semanticamente dando a possibilidade de um computador poder identificar relaccedilotildees mais profundas entre eles (Science International 2015 traduccedilatildeo livre) Reitano (2013) sublinha que a informaccedilatildeo extraiacuteda de conjuntos de dados conectados eacute a que tem mais impacto na investigaccedilatildeo inovaccedilatildeo e crescimento econoacutemico Berners-Lee (2010) propocircs um esquema de 5 estrelas para classificar as melhores praacuteticas de publicaccedilatildeo de dados na web que permitam a ligaccedilatildeo entre diferentes datasets com cinco niacuteveis de abertura tecnoloacutegica

bullprovenientes de instrumentos como telescoacutepios sateacutelites sensores inqueacuteritos e outras ferramentas que registem informaccedilatildeo sobre fenoacutemenos uacutenicos

Dados de observaccedilatildeo

bullobtidos atraveacutes de maacutequinas de alto rendimento ensaios cliacutenicos ou outras experiecircncias controladas Dados experimentais

bullgerados a partir de simulaccedilotildees computacionais Dados computacionais

bullSatildeo conjunto de dados agrupados de alto niacutevel de uso pela comunidade cientiacutefica recebendo para isso um alto niacutevel de curaccedilatildeo

Coleccedilotildees de dados de referecircncia

35

Fig 10 Esquema de classificaccedilatildeo das 5 estrelas para Dados Abertos Ligados Fonte traduzido de Berners-Lee (2010) Disponiacutevel na WWW httpswwww3orgDesignIssuesLinkedDatahtml

O Linked Data usa teacutecnicas e conceitos da World Wide Web para identificar factos conceitos pessoas lugares fenoacutemenos ou documentos que contenham atributos em comum (Science International 2015 traduccedilatildeo livre) A Royal Society (201234) afirma que o aparecimento de ldquosiloed sections of the web linked datardquo deve-se ao uso de vocabulaacuterios heterogeacuteneos na descriccedilatildeo semacircntica dos dados Neste sentido a OKI desenvolveu um cataacutelogo de vocabulaacuterios de Linked Data onde constam um total de 593 distribuiacutedos por vaacuterios temas sendo os mais populares meacutetodos metadados e cataacutelogos Existem 11 vocabulaacuterios em portuguecircs embora nenhum seja exclusivo sendo mesmo a liacutengua com maior nuacutemero de vocabulaacuterios a par com o inglecircs (OKI [a])

Existem algumas razotildees para limitar a abertura da ciecircncia especialmente em redor de dados que vatildeo aleacutem de questotildees teacutecnicas envolvendo a comunidade de investigadores e a sociedade em geral Embora seja mandatado pelas poliacuteticas de Dados Abertos que todos os dados de investigaccedilatildeo obtidos atraveacutes de financiamento puacuteblico devam ser disponibilizados abertamente o fato eacute que existem exceccedilotildees legiacutetimas como questotildees de privacidade seguranccedila ou questotildees eacuteticas que impedem a total abertura de dados (Concordat on Open Research Data 2016)

Os desafios tecnoloacutegicos natildeo implicam as mesmas preocupaccedilotildees na implementaccedilatildeo do AA a dados de investigaccedilatildeo que geram os desafios financeiros culturais e legais Eacute necessaacuterio ldquoadopt technical and infrastructural solutions that holistically address the above issuesrdquo A atenccedilatildeo eacute dada a padrotildees abertos e interoperaacuteveis pesquisa harmonizada e serviccedilos identificadores permanentes promoccedilatildeo da cultura de gestatildeo de dados reutilizaccedilatildeo de dados de investigaccedilatildeo soluccedilotildees teacutecnicas para a seguranccedila e questotildees legais sobre dados de investigaccedilatildeo abertos (RECODE 20146)

Embora se registe progresso a publicaccedilatildeo de Dados Abertos continua a ser um desafio dado que a distribuiccedilatildeo aberta de dados de investigaccedilatildeo natildeo eacute um comportamento comum sendo necessaacuterio uma mudanccedila cultural (Royal Society 2012 Pontika et al 2015 Science International 2015) A avaliaccedilatildeo e revisatildeo por pares dos dados natildeo tecircm a mesma qualidade quando comparada com as publicaccedilotildees

Colocar os conteuacutedos disponiacuteveis na web (sob uma licenccedila aberta)

Tornar os dados estruturados (Excel em vez de uma imagem)

Usar formatos abertos (CSV em vez de Excel)

Usar URIrsquos para identificar os recursos (para serem indicados)

Ligar os dados a outros dados (para fornecer contexto)

36

tradicionais dado a publicaccedilatildeo de dados natildeo ser ainda uma praacutetica comum (European Research Area and Innovation Committee [ERAC] 2016) Hahnel e Hook (2016) apontam a falha na atribuiccedilatildeo de incentivos e recompensas tangiacuteveis aos investigadores pelas suas contribuiccedilotildees A publicaccedilatildeo de dados de forma aberta envolve tarefas que consomem muito tempo aos investigadores como a mudanccedila do formato dos dados manter a informaccedilatildeo atualizada alinhar os dados com as licenccedilas existentes e com os criteacuterios de publicaccedilatildeo de informaccedilatildeo sensiacutevel (Reitano 2013) A Royal Society (2012) sublinha que uma boa parte dos dados torna-se independente das publicaccedilotildees separando assim a ideia da evidecircncia

Para Hahnel e Hook (2016) a abertura de dados cientiacuteficos natildeo pode ser separada das mudanccedilas no desenvolvimento da investigaccedilatildeo e dos receios dos investigadores Estes receios manifestam-se a dois niacuteveis estrutural (questotildees de permissotildees qualidade licenciamento) e cultural (receio de natildeo ser reconhecido ou ser ultrapassado na investigaccedilatildeo)

A Science International (20156) sublinha que os custos da adaptaccedilatildeo ao ldquodata challengerdquo podem causar problemas aos paiacuteses menos desenvolvidos impedindo-os de participar na ldquoglobal research enterpriserdquo A mesma organizaccedilatildeo aponta falhas na replicabilidade de resultados cientiacuteficos atraveacutes da citaccedilatildeo de trecircs estudos nas aacutereas de oncologia preacute-cliacutenica psicologia social e economia que obtiveram meacutedias de sucesso bem inferiores a 50 Satildeo apontadas falhas como a falsificaccedilatildeo de dados raciociacutenios estatiacutesticos invaacutelidos e ausecircncia total ou parcial de dados ou metadados Eacute tambeacutem sublinhado que a falta de um padratildeo de abertura que permita testar a replicabilidade dos resultados cientiacuteficos pode torna-se uma barreira intransponiacutevel no avanccedilo da ciecircncia (Science International 2015)

O acesso aos dados de investigaccedilatildeo possuiu diversas vantagens como o fomento da inovaccedilatildeo em termos de educaccedilatildeo sauacutede estaacute na base da criaccedilatildeo de novos negoacutecios e progresso cientiacutefico (SPARC World Wide Web Foundation 2016) permite a melhoria da qualidade dos resultados de investigaccedilatildeo evita a duplicaccedilatildeo de trabalho acelera a inovaccedilatildeo aumenta a transparecircncia do progresso cientiacutefico (OECD 2007 Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016b ERAC 2016) A abertura de dados facilita a exploraccedilatildeo de novos toacutepicos natildeo estudados inicialmente reforccedila a diversidade de anaacutelise e opiniatildeo (OECD 2007) potencia o crescimento econoacutemico e a seguranccedila dos resultados da investigaccedilatildeo financiada (OECD 2007 SPARC Concordat on Open Research Data 2016 ERAC 2016) A Royal Society (2012) sublinha que a publicaccedilatildeo de dados experimentais e observacionais permite o escrutiacutenio a replicaccedilatildeo de experiecircncia e a reutilizaccedilatildeo de dados para obtenccedilatildeo de inferecircncias adicionais A mesma instituiccedilatildeo assevera que a abertura de dados permite a identificaccedilatildeo de erros a refinaccedilatildeo ou rejeiccedilatildeo de teorias realccedilando que a anaacutelise rigorosa de dados e teoria eacute o processo mais rigoroso de revisatildeo da qualidade O

37

estudo efetuado por Beagrie e Houghton (2014) a trecircs centros de dados do Reino Unido denota um acreacutescimo significativo ao niacutevel da eficiecircncia da investigaccedilatildeo nos utilizadores que usaram os centros de dados e o valor que os utilizadores retiraram dos dados excede o investimento feito na partilha e curaccedilatildeo de dados tendo os centros de dados aumentado exponencialmente o retorno do investimento feito na criaccedilatildeo e coleta de dados

Para Reitano (2013) o processo de abertura de dados pode fomentar a implementaccedilatildeo de novos padrotildees e tecnologias nas organizaccedilotildees e a mudanccedila de comportamentos culturais O mesmo autor refere que o fenoacutemeno dos Dados Abertos pode dar iniacutecio ao processo de validaccedilatildeo da qualidade dos dados A Science International (2015) sublinha o investimento nas infraestruturas fiacutesicas e tecnoloacutegicas natildeo deve ser muito elevado dado que este natildeo difere muito do exigido para uma base nacional de Ciecircncia Aberta O desenvolvimento desta e-infraestrutura pode trazer benefiacutecios a vaacuterios dos intervenientes da abertura de dados (Comissatildeo Europeia Grupo de Peritos em Dados Cientiacuteficos 2010)

Cidadatildeos beneficiam com os resultados da investigaccedilatildeo e encontram as proacuteprias respostas para questotildees importantes baseadas em provas reais

Financiadores e decisores poliacuteticos tomam decisotildees mais informadas e tecircm mais retorno no seu investimento

Investigadores obteacutem dados e ferramentas com mais facilidade aumentando assim a sua produtividade a investigaccedilatildeo extrapola a sua aacuterea de conhecimento gerando novas inferecircncias e produzindo novas soluccedilotildees

Empresas e induacutestria proporcionam uma base industrial e econoacutemica para a prosperidade usam a melhor informaccedilatildeo disponiacutevel para a sua investigaccedilatildeo e desenvolvimento criam novo conhecimento mercados oportunidades e aumentam as oportunidades de troca de conhecimento

Segundo Borgman (201515) o fluxo de informaccedilatildeo depende cada vez mais de infraestruturas tecnoloacutegicas sendo que ldquosubstantial investments in infrastructure are necessary to acquire sustain and exploit research data today tomorrow and beyondrdquo As bases de dados cientiacuteficas tecircm-se tornado importantes na infraestrutura cientiacutefica global sendo indispensaacuteveis no progresso da ciecircncia De acordo com e-IRG (2016) existem trecircs formas de desenvolver uma infraestrutura de dados de investigaccedilatildeo pelo setor industrial pelo setor puacuteblico ou por comunidades especializadas que recebam financiamento para a construccedilatildeo da sua proacutepria infraestrutura Para melhorar o acesso e uso de datasets a e-IRG recomenda

Impor as mesmas tecnologias e padrotildees a todas a disciplinas Atribuir identificadores persistentes para dados instituiccedilotildees e pessoas

38

Aumentar a pesquisabilidade e descoberta de dados nos repositoacuterios atraveacutes da criaccedilatildeo de registos de datasets e repositoacuterios conectar as publicaccedilotildees aos dados subjacentes e criar uma paacutegina de descritiva do dataset

O Open Access Directory (2016) lista 113 repositoacuterios de dados de investigaccedilatildeo referentes a 15 aacutereas do conhecimento O Registry of Research Data Repositories (re3data) eacute um serviccedilo que regista repositoacuterios de dados de investigaccedilatildeo a niacutevel mundial fornecendo acesso a 1821 repositoacuterios divididos por quatro grandes aacutereas cientiacuteficas Este serviccedilo eacute disponibilizado pelo DataCite (2017a) para fornecer acesso e armazenamento permanente de dados aos investigadores entidades financiadoras editores e instituiccedilotildees acadeacutemicas Portugal conta atualmente com dois repositoacuterios indexados o KiMoSys e o INTEGRALL ambos com ligaccedilatildeo ao ramo da biologia

O Projeto do Genoma Humano19 envolveu uma investigaccedilatildeo intensiva agrave escala global sendo um exemplo de sucesso da disponibilidade de dados abertos na inovaccedilatildeo cientiacutefica Com o intuito de facilitar a pesquisa e reutilizaccedilatildeo de dados o W3C (2014) desenvolveu um vocabulaacuterio especiacutefico para dados o Data Catalog Vocabulary (DCAT) que atraveacutes da tecnologia RDF20 facilita a interoperabilidade entre diferentes cataacutelogos de dados na web Utilizar o DCAT para descrever conjunto de dados em cataacutelogos permite aumentar a pesquisabilidade e a extraccedilatildeo de metadados a partir de outros cataacutelogos Salienta-se tambeacutem a existecircncia do schemaorg uma comunidade colaborativa com a missatildeo de criar manter e promover esquemas para dados estruturados na Internet

A Data Documentation Initiative (DDI) eacute um padratildeo internacional para descrever dados criados por meacutetodos observacionais provenientes das ciecircncias sociais econoacutemicas e da sauacutede O DDI eacute um padratildeo que pode ser utilizado para documentar as diferentes fases do ciclo de vida dos dados de investigaccedilatildeo Descrever dados utilizando o padratildeo DDI facilita a compreensatildeo interpretaccedilatildeo e uso por pessoas software e redes de computadores (Data Documentation Initiative [DDI] 2016)

Ainda em formato beta a OKI oferece um serviccedilo o is it open data21 que permite aos utilizadores inquirirem as entidades detentores de dados sobre a abertura dos seus dados focando-se essencialmente em dados de investigaccedilatildeo

19 Este projeto teve como base os Bermuda Principles que asseguraram que todos dados sobre a sequenciaccedilatildeo geneacutetica gerados por centros financiados para esse fim deveriam estar no domiacutenio puacuteblico com livre acesso Disponiacutevel na WWW httpwebornlgovscitechresourcesHuman_Genomeresearchbermudashtml 20 O Resource Description Framework (RDF) eacute um modelo padratildeo desenvolvido pela W3C que permite que dados estruturados e semiestruturados possam ser misturados expostos e partilhados atraveacutes de diferentes aplicaccedilotildees O RDF facilita a uniatildeo de datasets mesmo que usem estes esquemas diferentes Disponiacutevel na WWW httpswwww3orgRDF 21 Disponiacutevel na WWW httpwwwisitopendataorgabout

39

Verifica-se tambeacutem o lanccedilamento de revistas cientiacuteficas especiacuteficas para a ciecircncia orientada a dados como o Data Science Journal22 Scientific Data23 ou o Geoscience Data Journal possibilitando a publicaccedilatildeo de dados e dos artigos cientiacuteficos que os utilizam apoacutes o serviccedilo de revisatildeo por pares A F1000 Research24 utiliza o conceito de revisatildeo apoacutes a publicaccedilatildeo

Os Dados Abertos tecircm estado em foco quando se debate a resoluccedilatildeo de problemas humanitaacuterios A agenda 2030 definida pelas Naccedilotildees Unidas (2015) visa a erradicaccedilatildeo da pobreza e o desenvolvimento econoacutemico humanitaacuterio e social agrave escala global Os 17 objetivos de desenvolvimento sustentaacutevel contam com a preciosa ajuda da abertura de dados para a monotorizaccedilatildeo e tomada de decisatildeo Em 2016 a abertura de dados em casos de emergecircncias puacuteblicas foi alvo de forte debate com a propagaccedilatildeo de viacuterus como Zica e o Eacutebola na agenda O debate culminou na Statement on Data Sharing in Public Health Emergencies (2016) um compromisso assinado por 33 organizaccedilotildees a niacutevel global com vista agrave partilha de dados de investigaccedilatildeo e ao fomento do financiamento nestas aacutereas sensiacuteveis

Conforme indicado nos princiacutepios de Open Data da Science International (2015) existem diversos intervenientes no processo de abertura de dados sendo que cada um destes intervenientes tem responsabilidades proacuteprias Como intervenientes diretos satildeo apontados os investigadores que recebem financiamentos puacuteblicos as universidades e institutos de investigaccedilatildeo as bibliotecas institucionais agecircncias de financiamento e instituiccedilotildees de investigaccedilatildeo governos e sociedade acadeacutemicas Existem outras iniciativasorganizaccedilotildees envolvidas na promoccedilatildeo da abertura de dados como a EU Naccedilotildees Unidas OECD W3C OKI SPARC Royal Society CODATA Digital Curation Center (DCC) Research Data Aliance (RDA) ou o ICSU que procuram promover o desenvolvimento de sistemas e procedimentos a niacutevel internacional que assegurem o acesso sustentabilidade e interoperabilidade Muitas destas organizaccedilotildees jaacute desenvolveram princiacutepios de abertura e protocolos de dados proacuteprios como eacute o exemplo da EU OECD e da OKI ou formaram grupos de trabalho para a definiccedilatildeo de padrotildees de gestatildeo publicaccedilatildeo citaccedilatildeo interoperabilidade e partilha de dados como a RDA Outras como a Universidade de Edimburgo25 criaram cursos de treino em gestatildeo de dados de investigaccedilatildeo para oferecer aos seus investigadores esse conhecimento

Outras atividades e eventos relacionados com a abertura e gestatildeo de dados vatildeo ocorrendo a niacutevel global como eacute o caso do Love Your Data26 um evento internacional que teve a sua quinta ediccedilatildeo em 2017 com vista a fornecerem conhecimento e ferramentas aos investigadores para que estes possam gerir melhor os seus dados

22 Disponiacutevel na WWW httpdatasciencecodataorg 23 Disponiacutevel na WWW httpwwwnaturecomsdata 24 Disponiacutevel na WWW httpsf1000researchcomabout 25 Disponiacutevel na WWW httpdatalibedinaacukmantra 26 Disponiacutevel na WWW httpsloveyourdatawordpresscomlydw-2017

40

15 Dados Abertos Governamentais

A abertura dos dados governamentais teve a sua origem em leis de Freedom of Information (FOI) Segundo Ubaldi (2013) muitos paiacuteses da OECD adotaram este tipo de leis para assegurar o direito do acesso puacuteblico agrave informaccedilatildeo atraveacutes da publicaccedilatildeo de datasets que possam ser usados e reutilizados Os DGA ou no seu termo mais usual Open Government data (OGD) ldquois a philosophy- and increasingly a set of policies - that promotes transparency accountability and value creation by making government data available to allrdquo (OECD 2016a) Esta filosofia assenta numa nova relaccedilatildeo entre cidadatildeos e Governos atraveacutes da abertura dos dados governamentais onde todas as partes interessadas trabalham em cooperaccedilatildeo na procura de novas respostas para os problemas da sociedade num ldquolearning process of changing the culture of public sector administrationrdquo (Dietrich Cherkasov Susar 201311) Os Governos e as sociedades tecircm vindo de forma crescente a apreciar a importacircncia do acesso agrave informaccedilatildeo do setor puacuteblico para sustentar a boa gestatildeo e estimular o crescimento econoacutemico alavancado no conhecimento Esta situaccedilatildeo mudou a forma como os governos valorizaram gerem usam e partilham informaccedilatildeo sendo apoiada pela atualizaccedilatildeo das poliacuteticas estruturas e praacuteticas para produzir e usar a informaccedilatildeo puacuteblica (Ubaldi 2013 traduccedilatildeo livre) A abertura de dados permite inferir duas questotildees importantes quanto ao governo Aleacutem de assumir a preparaccedilatildeo das entidades puacuteblicas para o processo de abertura tambeacutem assume que o governo estaacute disposto a efetuar mudanccedilas consideraacuteveis no setor puacuteblico devendo atuar como um sistema aberto que interage com o seu ambiente (Jansen Charalabidis amp Zuiderwijk 2012) O objetivo eacute segundo Dietrich (20136) passar do ldquoe-gov to we-govrdquo

Os DGA estatildeo segmentados em duas partes os dados abertos e os dados governamentais ou informaccedilatildeo do setor puacuteblico (Ubaldi 2013 Dietrich Cherkasov e Susar 2013) estando os DGA na interseccedilatildeo entre estes dois tipos de dados

Fig 11 Pilares dos Dados Governamentais Abertos Fonte Dietrich (2013) Disponiacutevel na WWW httpworkspaceunpanorgsitesInternetDocumentsUNPAN95209pdf

Governo Aberto

Dados Governament

Dados Abertos

DGA

41

Os DGA referem-se agrave informaccedilatildeo coletada produzida ou paga pelo setor puacuteblico guardada em formato que possa ser lido por maacutequina e tornada acessiacutevel de forma livre para reutilizaccedilatildeo para qualquer propoacutesito atraveacutes da publicaccedilatildeo sob uma licenccedila aberta que permite a livre reutilizaccedilatildeo dentro do domiacutenio puacuteblico e privado (Koski 2015 Carrara Oudkerk Steenbergen Tinholt 2016) A Informaccedilatildeo do Setor Puacuteblico ou Public Sector Information (PSI) abrange toda a vasta gama de informaccedilatildeo que as entidades puacuteblicas coletam produzem reproduzem e disseminam em vaacuterias aacutereas de atividade no cumprimento das suas tarefas institucionais englobando informaccedilatildeo social econoacutemica geograacutefica meteorologia e informaccedilatildeo de cariz turiacutestico ou empresarial A grande diferenccedila entre os DGA e a PSI eacute que esta uacuteltima refere-se apenas aos dados detidos pelas entidade puacuteblicas podendo a sua reutilizaccedilatildeo ter custos Poreacutem se esta PSI for disponibilizada sob uma licenccedila aberta torna-se entatildeo DGA (Carrara et al 2016a traduccedilatildeo livre)

A reutilizaccedilatildeo e distribuiccedilatildeo de dados devem ser garantidas sob termos que permitam essas atividades (Ubaldi 2013) A abertura dos dados governamentais foi apoiada por vaacuterias iniciativas com o objetivo de estabelecer padrotildees e princiacutepios para a disponibilizaccedilatildeo aberta de dados Em 2007 o Open Government Working Group (OGWG) definiu oito princiacutepios sobre a abertura de Dados Governamentais (Tauberer 2014) Em 2010 foi a vez da Sunlight Foundation publicar 10 princiacutepios para abertura da informaccedilatildeo governamental Em 2012 foram lanccediladas trecircs iniciativas de abertura de dados O Reino Unido lanccedilou o Open Data White Paper que incluiu um conjunto de 14 princiacutepios para a abertura de dados puacuteblicos e assevera que o Reino Unido natildeo pretende implementar legislaccedilatildeo de forma raacutepida mas sim reconhecer e clarificar medidas iniciais que assegurem a partilha de dados (Cabinet Office 2012) O Banco Mundial publicou 13 princiacutepios de abertura de dados integrados no seu Open Government Data Toolkit A OKI (2012a traduccedilatildeo livre) identificou as componentes chave da abertura de dados puacuteblicos

Disponibilidade e acesso ndash os dados devem estar completos e a um preccedilo natildeo superior ao seu custo de reproduccedilatildeo com disponibilidade de acesso pela Internet Devem estar disponiacuteveis de forma conveniente e modificaacutevel

Reutilizaccedilatildeo e redistribuiccedilatildeo ndash os dados devem ser disponibilizadas sob licenccedilas que permitam a reutilizaccedilatildeo redistribuiccedilatildeo e mistura com outros datasets Deve ser assegurado que os dados satildeo passiacuteveis de serem processados por maacutequina

Participaccedilatildeo universal ndash os dados devem ser acessiacuteveis a todos para livre reutilizaccedilatildeo e redistribuiccedilatildeo sem discriminar nenhum campo do conhecimento pessoas ou grupos Natildeo eacute permitido a inclusatildeo de restriccedilotildees adjacentes aos dados

Ubaldi (2013) publicou onze princiacutepios de abertura de dados baseados em dois vetores principais disponibilidade e acessibilidade e a reutilizaccedilatildeo e redistribuiccedilatildeo Nos

42

EUA foram lanccedilados 7 princiacutepios para a abertura de dados atraveacutes do Memorando ldquoOpen Data Policy - Managing Information as an Assetrdquo (Executive Office of the President Office of Management and Budget 2013) O Anti-corruption Working Group do G2027 promoveu em 2014 a abertura de dados como um dos pilares essenciais da transparecircncia do setor puacuteblico estabelecendo seis princiacutepios de abertura de dados para apoiar a luta contra a corrupccedilatildeo (G20rsquos Anti-corruption Working Group 2014)

O G828 iniciou um debate sobre a transparecircncia inovaccedilatildeo e prestaccedilatildeo de contas governamentais culminando na criaccedilatildeo do G8 Open Data Charter (Cabinet Office 2013) ldquowhich outlined a set of five core open data principlesrdquo (International Open Data Charter 2015) ou seja ldquoa summary of visions and principles for creating a transparent Government the opening up of data and its quality and quantityrdquo (Carrara et al 2016a39) O G8 Open Data Charter criou uma lista de 14 categorias de dados a serem publicados de forma aberta empresas e negoacutecios crimes e justiccedila observaccedilatildeo da terra educaccedilatildeo energia e ambiente financcedilas e contratos geoespacial desenvolvimento global sauacutede democracia e contabilidade governativa ciecircncia e investigaccedilatildeo estatiacutesticas mobilidade e bem-estar social e por fim transportes e infraestruturas (Cabinet Office 2013) Poreacutem o sentimento geral era que os princiacutepios deveriam ser redefinidos e melhorados de forma a apoiar a adoccedilatildeo global dos Dados Abertos (International Open Data Charter 2015 traduccedilatildeo livre) Assim em 2015 um grupo de vaacuterios paiacuteses e organizaccedilotildees internacionais desenvolveu a International Open Data Charter uma ldquoGlobal Multi-Stakeholder Action Network with two types of leading members Stewards and Lead Stewardsrdquo tendo como missatildeo fomentar uma maior colaboraccedilatildeo na adoccedilatildeo e implementaccedilatildeo de princiacutepios padrotildees e boas praacuteticas de Dados Abertos em todo o mundo com a adesatildeo de 41 governos (International Open Data Charter 2015) Tim Berners-Lee numa opiniatildeo citada no proacuteprio siacutetio web da International Open Data Charter (2015) vecirc nesta rede o ldquopotential to accelerate progress by placing actionable data in the hands of peoplerdquo Todos os princiacutepios e recomendaccedilotildees de abertura de dados puacuteblicos foram sintetizados apresentando-se no Quadro 2 apenas os princiacutepios mencionados em duas iniciativas de Open Data

27 O G20 eacute um grupo formado pelos 19 paiacuteses mais fortes economicamente mais a Uniatildeo Europeia com o objetivo de obter cooperaccedilatildeo internacional em questotildees financeiras e econoacutemicas Disponiacutevel na WWW httpswwwg20orgWebsG20ENG20FAQsfaq_nodehtml 28 O G8 eacute um grupo constituiacutedo pelas economias mais avanccediladas do mundo que se reuacutenem para debater questotildees econoacutemicas e poliacuteticas a niacutevel global Este grupo eacute formado pelos EUA Itaacutelia Alemanha Reino Unido Franccedila Japatildeo Canadaacute e Ruacutessia embora esta uacuteltima tenha sido expulsa em 2014 apoacutes a anexaccedilatildeo da Crimeia A EU tambeacutem estaacute representada neste grupo embora natildeo seja membro oficial

43

Quadro 2 Princiacutepios de abertura mais recomendados pelas iniciativas de Dados Governamentais Abertos

Princiacutepios e recomendaccedilotildees

OGWG (2007)

Sun Fund (2010)

OKI

(2012)

World Bank

(2012)

White Paper (2012)

Mem EUA

(2013) Ubaldi (2013)

G20

(2014)

IODC

(2015) Abertura Acesso

Publicaccedilatildeo imediata Reutilizaccedilatildeo Completos

Sem discriminaccedilatildeo Processaacuteveis p maacutequina

Licenccedilas Abertas Comparabilidade Formato Aberto Disponibilidade

Abertura p defeito Interoperabilidade

Publicaccedilatildeo de metadados

Gestatildeo poacutes publicaccedilatildeo Custo natildeo superior ao da

produccedilatildeo

Desenvolvimento e inovaccedilatildeo inclusivos

Melhoria governaccedilatildeo e envolvimento cidadatildeos

Linked Data

Modificaccedilatildeo

Fonte Elaboraccedilatildeo proacutepria

Analisando em detalhe os princiacutepios de abertura dos dados puacuteblicos eacute possiacutevel inferir quais as recomendaccedilotildees consideradas mais importantes Tal como nos dados de investigaccedilatildeo verifica-se uma grande variedade de princiacutepios propostos sendo que apenas 19 num total de 36 se repetem em 2 ou mais recomendaccedilotildees Embora se registe uma melhoria significativa na abertura legal e teacutecnica relativamente aos dados de investigaccedilatildeo tambeacutem os princiacutepios propostos para os dados puacuteblicos natildeo abarcam a totalidade desta dupla abertura O acesso a publicaccedilatildeo imediata a reutilizaccedilatildeo e a disponibilizaccedilatildeo de dados de forma completa sem discriminaccedilatildeo e de forma a serem processados por maacutequina satildeo os princiacutepios que reuacutenem mais consenso entre as recomendaccedilotildees analisadas As licenccedilas abertas a comparabilidade de dados os formatos abertos a disponibilidade a abertura por defeito de dados a interoperabilidade publicaccedilatildeo de metadados e a gestatildeo de dados apoacutes a sua publicaccedilatildeo satildeo mencionados em menos de metade das recomendaccedilotildees analisadas apesar de ser indiscutiacutevel a sua importacircncia no processo de abertura de dados

44

Segundo Gonzalez-Zapata e Heeks (2015) podemos sintetizar os DGA em quatro perspetivas sumariadas na figura seguinte

Fig 12 Perspetivas da abertura dos dados governamentais Fonte Gonzalez-Zapata e Heeks (2015)

O movimento dos DGA assenta em dois importantes marcos o lanccedilamento do siacutetio datagov nos EUA em 2009 e do datagovuk no Reino Unido em 2010 tendo-se posteriormente estendido a outros paiacuteses e organizaccedilotildees (Janssen 2012) Neste segmento foi fundada em 2011 a Open Government Partnership (OGP) com o objetivo de ldquoprovide an international platform for domestic reformers committed to making their governments more open accountable and responsive to citizensrdquo (Open Government Partnership [OGP] 2015) Esta organizaccedilatildeo lanccedilou em Setembro de 2011 a Open Government Declaration subscrita por 70 paiacuteses e que assenta em quatro eixos estruturantes Transparecircncia da informaccedilatildeo sobre as atividades governativas apoio agrave participaccedilatildeo ciacutevica implementaccedilatildeo dos mais altos padrotildees da integridade profissional aumento do acesso a novas tecnologias de abertura e da prestaccedilatildeo de contas (OGP 2011) Em Dezembro de 2016 realizou-se a quarta cimeira da OGP culminando com a divulgaccedilatildeo da Paris Declaration for Open Government Partnership que pretende encorajar os Governos e as organizaccedilotildees da sociedade civil a inscreverem-se em accedilotildees coletivas para promover a abertura dos dados governamentais (OGP 2016)

O fenoacutemeno dos Dados Abertos eacute coadjuvado por dois sistemas de avaliaccedilatildeo da abertura dos dados provenientes do setor puacuteblico que auxiliam as entidades puacuteblicas a assumir a abertura e ligaccedilatildeo de dados (Colpaert Sarah Peter Mannens amp Van de Walle 2013) Estes dois sistemas atuam em perspetivas diferentes segundo Colpaert et al (2013) o 5 Stars Linked Open Data de Berners-Lee (2010) fornece uma perspetiva tecnoloacutegica enquanto o 5 Stars Open Data Engagement de Davies (2012) tem um acircmbito social atraveacutes do envolvimento da sociedade O esquema de Davies (2012) eacute um esquema de classificaccedilatildeo por estrelas baseado no esquema criado Tim Berners-Lee para sublinhar os niacuteveis de interaccedilatildeo e colaboraccedilatildeo proporcionados pela publicaccedilatildeo de dados ou seja os ldquokey steps that open data initiatives can take to engage with data usersrdquo

bull Definiccedilatildeo de estrateacutegias regulamentos e processos nas atividades do Governo Burocraacutetica bull Inovaccedilatildeo tecnoloacutegica nos sistemas de dados do

Governo Tecnoloacutegica bull Direito ao livre acesso agrave informaccedilatildeo do setor puacuteblico (dados) Poliacutetica bull Mecanismos para gerar valor econoacutemico atraveacutes do uso de dados Econoacutemica

45

Fig 13 Esquema de classificaccedilatildeo das 5 estrelas para as iniciativas de abertura de dados que envolvem os utilizadores Fonte Davies (2012) Disponiacutevel na WWW httpwwwtimdaviesorguk201201215-stars-of-open-data-engagement

No cumprimento das suas obrigaccedilotildees as entidades governamentais produzem coletam e gerem uma vasta quantidade de dados tendo elevado estes agrave categoria dos bens puacuteblicos mais valiosos Para gerar valor ldquodata must be reusable but more importantly actually used (Open Data for Development [OD4D] 20168) Para a OECD (2015a) permitir o acesso e a reutilizaccedilatildeo dos dados governamentais tem um potencial significativo no aumento da eficiecircncia e transparecircncia do setor puacuteblico suportando atividades de ciecircncia cidadatilde com os dados governamentais aumentando assim o seu valor econoacutemico e social Neste sentido concursos desafios e hackathons29 podem tornar-se uacuteteis se ajudarem a focar os cidadatildeos ldquoon high priority public problemsrdquo (Dawes Vidiasova amp Parkhimovich 201610) Para gerar valor eacute necessaacuterio publicar os dados sendo esta fase precedida uma preparaccedilatildeo teacutecnica de coleta preparaccedilatildeo publicaccedilatildeo e gestatildeo de dados (Carrara et al 2016a)

Criaccedilatildeo de uma infraestrutura de gestatildeo de dados Extraccedilatildeo transformaccedilatildeo (em formato open source e linked data) e publicaccedilatildeo Escolha dos canais de publicaccedilatildeo Implementaccedilatildeo da funccedilatildeo de pesquisa no canal de publicaccedilatildeo Definiccedilatildeo de domiacutenio hospedagem funcionalidades do canal de publicaccedilatildeo

incluindo a gestatildeo desta ferramenta e dos serviccedilos que nela forem incorporados

Segundo Ubaldi (2013 traduccedilatildeo livre) podem ser identificadas quatro grandes fases na cadeia de valor dos Dados Governamentais Abertos

Geraccedilatildeo de dados cobre a criaccedilatildeo de dados puacuteblicos Coleta agregaccedilatildeo e processamento de dados os dados governamentais precisam

de ser agregados ligados e manipulados de forma a adicionar valor para a maior parte dos utilizadores

29 Uma hackathon de dados abertos eacute um evento que reuacutene programadores e outros profissionais do ramo do desenvolvimento de software para reutilizar dados de forma a produzir aplicaccedilotildees de software que sejam a base de produtos e serviccedilos uacuteteis e com valor Servem tambeacutem para promover o trabalho de abertura de dados e os datasets disponiacuteveis (AMA 2016)

Os dados devem ser orientados para a procura

Os dados devem fornecer contexto

Os dados devem gerar conversaccedilatildeo

Publicaccedilatildeo de dados deve gerar envolvimento e ganho de habilidades

Dados como um recurso comum na colaboraccedilatildeo entre investigadores

46

Distribuiccedilatildeo e fornecimento de dados os dados precisam de ser distribuiacutedos aos seus potenciais utilizadores para permitir o acesso e reutilizaccedilatildeo

Uso final de dados os dados governamentais tecircm de ser reutilizados por diferentes pessoas para sustentar a criaccedilatildeo de valor puacuteblico

Perceber os diferentes valores associados aos dados governamentais eacute essencial para identificar que viabilizadores e tipos de dados devem ser tornados prioritaacuterios para atingir o objetivo especiacutefico de criaccedilatildeo de valor (Ubaldi 2013) Podem ser identificados trecircs tipos de valor associados aos DGA (Ubaldi 2013 OECD 2015a)

Valor econoacutemico crescimento e competitividade na economia fomentando a inovaccedilatildeo eficiecircncia e eficaacutecia nos serviccedilos governamentais

Valor Social promove empreendedorismo dos cidadatildeos a participaccedilatildeo social e o envolvimento puacuteblico nas decisotildees poliacuteticas e no fornecimento de serviccedilos

Governanccedila puacuteblica Prestaccedilatildeo de contas transparecircncia responsividade e controlo democraacutetico

A abertura dos dados governamentais eacute um domiacutenio emergente que enfrenta restriccedilotildees de natureza complexa Janssen Charalabidis e Zuiderwijk (2012) sintetizaram as barreiras em seis categorias institucional complexidade da tarefa uso e participaccedilatildeo legislaccedilatildeo qualidade da informaccedilatildeo e questotildees teacutecnicas Reitano (2013) defende que os governos devem modificar as praacuteticas e procedimentos internos de gestatildeo de informaccedilatildeo pois a reutilizaccedilatildeo da informaccedilatildeo estaacute dependente da forma em como ela eacute gerida e publicada O desempenho dos programas de DGA tendem apenas para o registo de dados estatiacutesticos e poucos optam por analisar as aplicaccedilotildees comerciais e os avanccedilos proporcionados pela abertura dos dados governamentais (Dawes Vidiasova amp Parkhimovich 2016) Existem outros pontos sensiacuteveis como o pagamento dos custos da coleta e processamento de dados puacuteblicos quais os incentivos concedidos agraves entidades puacuteblicas para estas manterem e atualizarem os seus dados que conjunto de dados devem ser prioritaacuterios para maximizar a criaccedilatildeo de valor puacuteblico e sobretudo a necessidade de desenvolver uma estrutura de anaacutelise entre custos e benefiacutecios que possa demonstrar as vantagens econoacutemico-sociais dos DGA (Ubaldi 2013 OECD 2013) Contudo segundo a OECD (2015a) para as partes interessadas estes dados continuam muitas vezes inacessiacuteveis quer em termos de acesso quer em termos de custo Isto verifica-se porque os dados enfrentam alguns entraves agrave sua publicaccedilatildeo as organizaccedilotildees e governos natildeo consideram os dados interessantes para reutilizaccedilatildeo ou natildeo conseguem entender os benefiacutecios da abertura pelo receio de terem de responder a um elevado nuacutemero de pedidos de dados ou que os utilizadores retirem conclusotildees superficiais que os dados possam natildeo ter um niacutevel de curaccedilatildeo satisfatoacuterio e que isso manche a reputaccedilatildeo da organizaccedilatildeo e por fim a preocupaccedilatildeo com os custos da conversatildeo de dados para formatos padratildeo (Carrara et al 2016a traduccedilatildeo livre) Existem ainda riscos associados agrave abertura dos dados

47

governamentais como o direito agrave privacidade e ao anonimato que resultam em restriccedilotildees agrave disponibilizaccedilatildeo desta informaccedilatildeo (Koski 2015)

Estabelecer um enquadramento legal eacute essencial para alavancar a abertura dos dados governamentais Dawes Vidiasova e Parkhimovich (2016) defendem que o sucesso dos programas de DGA depende da definiccedilatildeo padrotildees teacutecnicos e de qualidade e de um enquadramento legal que defina responsabilidades e limitaccedilotildees Ainda assim as iniciativas de DGA podem enfrentar problemas com a implementaccedilatildeo desafios teacutecnicos ou atrasos administrativos Restriccedilotildees teacutecnicas e financeiras podem limitar a acessibilidade e reutilizaccedilatildeo dos dados sendo necessaacuterio enfrentar desafios relacionados com poliacuteticas tecnologias financcedilas organizaccedilatildeo e cultura para criar um ecossistema e construir um modelo de negoacutecios sustentaacutevel para as iniciativas de DGA (Ubaldi 2013 traduccedilatildeo livre) Koski (2015) realccedila que uma vez abertos deve haver um esforccedilo para manter a qualidade dos dados e tambeacutem a sua atualizaccedilatildeo Por outro lado sem os conhecimentos e habilidades necessaacuterias para interpretar a vasta gama de conjuntos de dados os cidadatildeos podem natildeo conseguir criar valor a partir desses dados (Janssen 2012 Koski 2015) Segundo Carrara Fischer e Steenbergen (2015) satildeo vaacuterias as capacidades necessaacuterias para lidar com a complexidade dos dados As autoras defendem uma junccedilatildeo entre soft skills e hard skills como a colaboraccedilatildeo comunicaccedilatildeo resoluccedilatildeo de problemas e as competecircncias teacutecnicas estatiacutesticas analiacuteticas e domiacutenio da aacuterea do conhecimento (201512) Satildeo apontados ainda outros desafios como a constante evoluccedilatildeo das poliacuteticas e estrateacutegias de DGA a delegaccedilatildeo da produccedilatildeo e administraccedilatildeo dos dados governamentais a niacutevel regional e a falta de definiccedilotildees comuns agrave escala internacional (OECD 2013)

Dado o contexto de urgecircncia em que muitos dos portais foram criados ldquoas part of a politically driven Open Data Initiative without feasibility studies business case strategy or user researchrdquo os portais enfrentam agora uma seacuterie de desafios e problemas (Sasse et al 20177) Satildeo mencionados problemas como a falta de financiamento falta de qualidade dos dados a falta de apoio poliacutetico na publicaccedilatildeo de dados relevantes e desafios na reutilizaccedilatildeo de dados (Sasse et al 2017)

Um bom entendimento dos benefiacutecios da abertura dos dados governamentais pode acelerar o compromisso com as iniciativas de DGA (Carrara et al 2016a) Os benefiacutecios da abertura de dados podem segundo Janssen Charalabidis e Zuiderwijk (2012) ser contextualizados em trecircs quadrantes poliacutetico e social econoacutemico operacional e teacutecnico A partilha dos dados governamentais com o puacuteblico aumenta a transparecircncia e o reconhecimento puacuteblico das atividades do governo (OECD 2013) dado que os DGA satildeo um recurso estrateacutegico que pode beneficiar vaacuterios intervenientes (OECD 2013 Ubaldi 2013 Dietrich Cherkasov Susar 2013 Koski 2015 Carrara et al 2016a The World Bank 2016)

48

Governo melhora a tomada de decisotildees e a alocaccedilatildeo de recursos de forma a promover a eficiecircncia total das operaccedilotildees do governo e fornecer serviccedilos puacuteblicos mais eficientes efetivos inovadores e personalizados permitindo uma reduccedilatildeo de custos administrativos Aumenta a transparecircncia reforccedilando a prestaccedilatildeo de contas governamentais e a reduccedilatildeo de erros

Cidadatildeos permite participaccedilatildeo puacuteblica e o envolvimento social no desenho de respostas agraves necessidades puacuteblicas e cientiacuteficas (ciecircncia cidadatilde)

Sociedade Civil aumenta a transparecircncia e qualidade dos serviccedilos do Governo Setor Puacuteblico pode estimular um mercado competitivo nos serviccedilos puacuteblicos Setor Privado lanccedilamento de serviccedilos inovadores e com valor acrescentado

O Working Group on Open Government Data da OKI elegeu trecircs vantagens na abertura dos dados governamentais aumento da transparecircncia criaccedilatildeo de valor econoacutemico-social e participaccedilatildeo dos cidadatildeos na governaccedilatildeo Dietrich Cherkasov e Susar (2013) sublinham o papel chave da interoperabilidade na obtenccedilatildeo dos benefiacutecios da abertura na medida em que uma definiccedilatildeo comum de abertura iraacute assegurar a capacidade dos sistemas e organizaccedilotildees cooperarem

O impacto da abertura dos dados governamentais pode ser medido em trecircs dimensotildees econoacutemica poliacutetica e social (Granicas 2013 Koski 2015)

Econoacutemica aumento de receitas provenientes de taxas reduccedilatildeo dos custos de transaccedilatildeo de dados criaccedilatildeo de bens e serviccedilos (Granickas 2013) aumento da eficiecircncia e eficaacutecia do serviccedilo puacuteblico criaccedilatildeo de novas empresas (Granickas 2013 Koski 2015)

Poliacutetica aumento da transparecircncia poliacutetica e da prestaccedilatildeo de contas (Granickas 2013 Koski 2015)

Social aumento da proteccedilatildeo ao direito agrave informaccedilatildeo (Granickas 2013) aumento da inclusatildeo social e da capacitaccedilatildeo de grupos eou indiviacuteduos aumento dos niacuteveis de envolvimento e participaccedilatildeo ciacutevica (Granickas 2013 Koski 2015) e melhorias ao niacutevel educaccedilatildeo sauacutede ambiente ou desenvolvimento sustentaacutevel (Koski 2015)

Koski (20153) defende ser necessaacuterio desenvolver um modelo de avaliaccedilatildeo e monotorizaccedilatildeo seguido da coleta sistemaacutetica de dados para se poder medir com exatidatildeo o impacto dos Dados Abertos A autora sublinha a necessidade de explorar o conhecimento sobre o impacto da abertura de dados bem como os meacutetodos de investigaccedilatildeo e indicadores que podem ser usados para estudar os ldquosocio-economics impacts of open data which types of usable data are already being collected and what are the addionational data needsrdquo

Para Janssen (2012) o movimento dos DGA promoveu uma maior disponibilidade de informaccedilatildeo puacuteblica embora natildeo tenha necessariamente melhorado o acesso agrave informaccedilatildeo De acordo com a mesma autora os DAG estatildeo em voga com os

49

programadores e hackers a desenvolverem aplicaccedilotildees atraveacutes dos dados detidos pelo setor puacuteblico e os ativistas a descobrir o valor dos dados governamentais na defesa das suas causas Se as cidades utilizarem os dados que produzem em proveito proacuteprio publicando-os nos seus portais com as licenccedilas adequadas de reutilizaccedilatildeo podem estimular a criaccedilatildeo de novos serviccedilos e transformar-se em smart cities (Garcia 2015) reduzindo custos e consumo de recursos e melhorando o contacto entre cidadatildeos e governo (Carrara Engbers Nieuwenhuis amp Steenbergen 2016)

No acircmbito da digital transformation ocorrida nas uacuteltimas deacutecadas diversas alteraccedilotildees ocorreram na forma comas organizaccedilotildees produzem vendem e disponibilizam os seus produtos e tambeacutem na forma em como os funcionaacuterios trabalham e comunicam Segundo Carrara Fisher Oudkerk Steenbegen e Tinholt (2015) os Dados Abertos podem ser reutilizados por organizaccedilotildees de diferentes setores da induacutestria cultura e turismo educaccedilatildeo e investigaccedilatildeo energia e utilidades financcedilas e seguros sauacutede fabrico de produtos comunicaccedilatildeo e entretenimento puacuteblico imobiliaacuterio retalho telecomunicaccedilotildees transportes e tecnologias de informaccedilatildeo Davies (2014) afirma que no caso dos EUA e do Reino Unido a enfacircse do discurso puacuteblico passou da melhoria da transparecircncia governativa para o discurso das vantagens econoacutemicas dos Dados Abertos como consequecircncia da crise econoacutemica e da maior maturaccedilatildeo das poliacuteticas de abertura de dados Na EU a linha de pensamento tem evoluiacutedo no mesmo sentido com o estudo econoacutemico feito pelo European Data Portal a indiciar um impacto econoacutemico direto da abertura de dados em 2016 de 553 biliotildees de euros e em 2020 de 757 biliotildees de euros com uma projeccedilatildeo de perto de 100 mil postos de trabalho envolvidos O mesmo estudo indica que o mercado total da abertura de dados contabilizando os impactos diretos e indiretos subiraacute dos 193-209 biliotildees de euros em 2016 para os 265-286 biliotildees de euros em 2020 (Carrara Chan Fischer amp Steenbergen 2015)

Os portais de Dados Abertos satildeo uma parte essencial da infraestrutura ao permitirem o acesso e reutilizaccedilatildeo de dados oferecendo um ponto de acesso uacutenico aos utilizadores aos dados governamentais como os cataacutelogos e portais de dados centralizados Veja-se por exemplo os 304 portais incluiacutedos no cataacutelogo do portal de dados governamentais dos EUA o datagov que aleacutem dos portais de dados de cidades e estados norte-americanos (88) engloba ainda 52 paiacuteses e 164 regiotildees internacionais (United States General Services Administration) O Open Data Soft (2017) lista jaacute mais de 2600 portais de dados oriundos de 194 paiacuteses indicando apenas 6 portais de Dados Abertos em Portugal

Poreacutem de acordo com Colpaert et al (2013) natildeo existe nenhum guia que determine as funcionalidades e possibilidades dos portais de dados Os autores vecircm assim propor um esquema de classificaccedilatildeo para portais de Dados Abertos com o

50

objetivo de impulsionarem as entidades puacuteblicas a criarem o seu proacuteprio portal de dados ou a criarem novas metas para os jaacute existentes

Fig 14 Esquema de classificaccedilatildeo das 5 estrelas para os portais de dados Fonte Colpaert et al (2013) Disponiacutevel na WWW httppieterpm5stardataportals5starsofopendataportalspdf

O relatoacuterio feito pelo Open Data Institute (ODI) para o European Data Portal defende que os portais de dados devem continuar a responder aos desafios utilizando para isso modelos sustentaacuteveis em quatro aacutereas chave gestatildeo financcedilas arquitetura e operaccedilotildees Devem tambeacutem usar meacutetricas que permitam avaliar e melhorar a qualidade e usabilidade dos dados sendo que a mediccedilatildeo de impacto da reutilizaccedilatildeo de Dados Abertos tambeacutem deve ser alvo de financiamento contiacutenuo (Sasse et al 2017)

A OKI desenvolveu um sistema de gestatildeo de dados suportado por uma plataforma aberta o CKAN oferecendo soluccedilotildees que agilizam a publicaccedilatildeo partilha pesquisa e uso dos dados sendo utilizado por 146 portais de dados a niacutevel mundial (CKAN) Usar esta ferramenta para construir um cataacutelogo permite agraves entidades governos e organizaccedilotildees publicar dados e disponibiliza-los de forma aberta facilitando a pesquisa e a visualizaccedilatildeo da informaccedilatildeo A plataforma DataHub oferece acesso a muitos dos serviccedilos do CKAN permitindo o upload pesquisa registo de datasets publicados criaccedilatildeo e gestatildeo de grupos de datasets e receber atualizaccedilotildees de conjuntos de dados em que haja interesse O DataHub aloja 35 datasets relacionados com a palavra-chave ldquoPortugalrdquo sendo 18 desses conjuntos de dados diretamente coletados e disponibilizados por entidades portuguesas Os restantes 17 datasets estatildeo englobados em publicaccedilotildees que abrangem vaacuterios paiacuteses (Open Knowledge International [d]) As entidades puacuteblicas tambeacutem podem desenvolver portais de dados contratando para isso serviccedilos de plataformas como o Socrata30 OpenDataSoft31 ou o DataMarket32 que facilitam a publicaccedilatildeo a partilha e a reutilizaccedilatildeo de dados puacuteblicos

30 Disponiacutevel na WWW httpssocratacom 31 Disponiacutevel na WWW httpswwwopendatasoftptsolucao-de-dados-abertos 32 Disponiacutevel na WWW httpwwwqlikcomusproductsqlik-data-market

Registo de conjuntos de dados (ligaccedilatildeo ao dataset)

Fornecimento de metadados (licenccedila contexto atualizaccedilotildees etc)

Plataforma de cocriaccedilatildeo (interaccedilatildeo desenvolvimento aplicaccedilotildees)

Plataforma de publicaccedilatildeo de dados e metadados em formatos comuns

Central de dados comum (agregaccedilatildeo informaccedilatildeo interna e externa)

51

Em termos de licenciamento de dados embora as licenccedilas Creative Commons possam ser aplicadas aos dados foram criadas licenccedilas abertas especiacuteficas para dados sob a tutela da OKI as Open Data Commons (ODC)

ODC Attribution License (ODC-By) Compatiacutevel com a licenccedila CC BY permite a coacutepia distribuiccedilatildeo modificaccedilatildeo de dados ou bases de dados com a devida menccedilatildeo de atribuiccedilatildeo de autoria devendo ser mantida para trabalhos derivados

ODC Open Database License (ODC-ODbL) Segue os mesmo princiacutepios da licenccedila CC BY-SA aplicando-se no entanto apenas a dados Permite a coacutepia distribuiccedilatildeo modificaccedilatildeo de dados ou bases de dados com a devida menccedilatildeo de atribuiccedilatildeo de autoria devendo os trabalhos derivados aplicar a mesma licenccedila e serem redistribuiacutedos sem restriccedilotildees

Public Domain Dedication and License (PDDL) permite a coacutepia distribuiccedilatildeo modificaccedilatildeo de dados ou bases de dados sem qualquer tipo de restriccedilotildees ou atribuiccedilatildeo de creacutedito uma vez que os dados passam para o domiacutenio puacuteblico Eacute compatiacutevel com a licenccedila CC0 (Open Knowledge International [d] traduccedilatildeo livre)

Existem ainda 2 paiacuteses que definiram a sua proacutepria lincenccedila aberta de forma a garantir a abertura da PSI O Reino Unido desenvolveu a Open Government Licence (OGL) que sendo compativel com as licenccedilas CC e ODC autoriza o uso distribuiccedilatildeo publicaccedilatildeo adaptaccedilatildeo e exploraccedilatildeo comercial e natildeo comercial sob o requerimento de menccedilatildeo da fonte e da proviecircncia da informaccedilatildeo (The National Archives) Tambeacutem a Franccedila desenvolveu a sua Licence Ouverte que avaliza a reproduccedilatildeo uso distribuiccedilatildeo publicaccedilatildeo adaptaccedilatildeo e exploraccedilatildeo comercial requerendo apenas o reconhecimento da fonte e da proviecircncia da informaccedilatildeo Tal como a licenccedila britacircnica a Licence Ouverte eacute compatiacutevel com as licenccedilas CC e ODC e ainda com a proacutepria OGL (Etalab 2011)

A publicaccedilatildeo dos DGA envolve quatro intervenientes diferentes (Carrara et al 2016a traduccedilatildeo livre)

Decisores poliacuteticos normalmente os responsaacuteveis pela validaccedilatildeo de estrateacutegias e iniciativas de Open Data

Gestores de Dados satildeo por norma os responsaacuteveis pela coleta partilha de dados design e implementaccedilatildeo da estrateacutegia de Open Data na qualidade de especialistas

Programadores responsaacuteveis pela implementaccedilatildeo dos requisitos teacutecnicos das estrateacutegias de Dados Abertos

Contribuidores tecircm um papel ativo na coleta preparaccedilatildeo publicaccedilatildeo e manutenccedilatildeo dos dados

Gonzalez-Zapata e Heeks (2015) acrescentam outros intervenientes como os ativistas da sociedade civil as organizaccedilotildees internacionais os fornecedores de tecnologias de informaccedilatildeo e comunicaccedilatildeo e os acadeacutemicos As entidades e organizaccedilotildees internacionais envolvidas no esforccedilo de abertura dos dados

52

governamentais tecircm desenvolvido esforccedilos para promover a abertura de dados governamentais O Open Data Institute (2012) foi criado com o objetivo de ajudar instituiccedilotildees puacuteblicas organizaccedilotildees comerciais e natildeo comerciais a ldquoidentify and address how the web of data will impact their businesses and their sectorsrdquo Neste sentido a ODI tem promovido algumas iniciativas como o Open Data Certificate33 que atraveacutes de um sistema de questionaacuterios consegue demonstrar se os dados foram publicados de forma sustentaacutevel e reutilizaacutevel certificando assim a qualidade e a confianccedila nos mesmos A ODI desenvolveu tambeacutem o Open Data Maturity Model para avaliar o quanto as organizaccedilotildees publicam e consomem Dados Abertos identificando os pontos de melhoria O modelo baseia-se numa escala de cinco temas processos de gestatildeo de dados conhecimento e habilidades envolvimento e apoio ao cliente investimento e performance financeira e por fim visatildeo estrateacutegica Estes cinco temas tecircm cinco niacuteveis de progressatildeo possuindo uma aplicaccedilatildeo34 em linha que facilita a avaliaccedilatildeo (Dodds amp Newman 2015) A ODI dedica-se ainda agrave elaboraccedilatildeo de estudos de caso envolvendo iniciativas de Open Data aleacutem de possuir guias de orientaccedilatildeo para a abertura de dados e cursos de aprendizagem com o mesmo objetivo

O Banco Mundial lanccedilou o Open Government Data Toolkit com o objetivo de ajudar governos bancaacuterios e utilizadores a entender os conceitos baacutesicos da abertura de dados e a planear e implementar um programa de abertura dos dados governamentais Falamos de ferramentas de orientaccedilatildeo para a implementaccedilatildeo de poliacuteticas de dados abertos desde a definiccedilatildeo de Open Data e exemplos do seu uso passando pelo licenciamento e qualidade dos dados e finalizando com assistecircncia teacutecnica e apoio na procura de financiamento Uma das ferramentas disponibilizadas eacute o Open Data Readiness Assessment (ODRA) que pode ser usada para conduzir accedilotildees de anaacutelise da preparaccedilatildeo de um governo ou instituiccedilatildeo para avaliar desenhar e implementar uma iniciativa de Dados Abertos (The World Bank 2016)

Outra iniciativa esta com a chancela da Open Data for Development Network (OD4D[a]) ldquoa global network of leaders in the Open Data community working together to develop open data solutions around the worldrdquo desenvolveu uma base de dados puacuteblica de organizaccedilotildees que usam DGA ao niacutevel global O Open Data Impact Map permite aos governos organizaccedilotildees internacionais e investigadores ter a perceccedilatildeo da procura existente de Dados Abertos O mapa inclui organizaccedilotildees que usam DGA para advogar algo para desenvolver produtos e serviccedilos aprimorar operaccedilotildees prestar informaccedilotildees sobre estrateacutegias ou efetuar investigaccedilatildeo (Open Data for Development Network (OD4D[b] traduccedilatildeo livre) Em fevereiro de 2017 encontram-se listadas 1765 organizaccedilotildees oriundas de 96 paiacuteses concentrados sobretudo na Ameacuterica do Norte Europa e Aacutesia Central sendo que a maioria das entidades estaacute relacionada com o setor das tecnologias de informaccedilatildeo geoespacial negoacutecios 33 Disponiacutevel na WWW httpscertificatestheodiorgen 34 Disponiacutevel na WWW httppathwaytheodiorg

53

consultadoria investigaccedilatildeo e com governabilidade Portugal conta com 4 organizaccedilotildees listadas Fundaccedilatildeo Francisco Manuel dos Santos35 Transparecircncia Hackday36 e Open Knowledge Portugal no setor da governabilidade e a Manufactura Independente37 no setor dos meacutedia e comunicaccedilotildees

A OKI estaacute ativamente envolvida em diversos projetos que visam criar condiccedilotildees e potenciar a abertura de dados Aleacutem da mencionada Open Definition a OKI posiciona-se como coordenadora de outros projetos semelhantes um siacutetio web sobre Dados Governamentais Abertos um guia com enfoque nos aspetos teacutecnicos legais e sociais dos Dados Abertos um cataacutelogo de portais de Dados Abertos a niacutevel global um iacutendice que mede a abertura das poliacuteticas de Open Data e ainda introduziu censos sobre a abertura de dados A OKI oferece ainda um portal sobre dados financeiros38 um portal de e-learning sobre literacia de dados39 um portal sobre gastos puacuteblicos40 uma base de dados de ensaios cliacutenicos41 e o Frictionless Data42 que disponibiliza um Data Package Standard para facilitar o agrupamento e descriccedilatildeo de dados

A EU tem assumido uma dupla funccedilatildeo na abertura dos dados puacuteblicos verificando-se a sua intervenccedilatildeo na elaboraccedilatildeo de leis de apoio aos DGA e na promoccedilatildeo da criaccedilatildeo de infraestruturas de suporte A OECD desenvolveu um Observatoacuterio da PSI que coleta e analisa exemplos e partilha experiecircncias de inovaccedilatildeo do setor puacuteblico com o intuito de fornecer conselhos praacuteticos aos paiacuteses na criaccedilatildeo de inovaccedilatildeo O Observatoacuterio permite a partilha discussatildeo e cooperaccedilatildeo na criaccedilatildeo de soluccedilotildees (OECD 2016b traduccedilatildeo livre)

A disponibilidade e acessibilidade de dados eacute um dos pilares da plena afirmaccedilatildeo da Ciecircncia Aberta e neste acircmbito devem ser definidas poliacuteticas de Dados Abertos que mandatem o livre acesso a este tipo de informaccedilatildeo cientiacutefica e administrativa

2 As poliacuteticas de Dados Abertos

O processo de desenvolvimento de poliacuteticas envolve tradicionalmente a investigaccedilatildeo anaacutelise consulta e siacutentese de informaccedilatildeo para produzir recomendaccedilotildees A abertura de dados sem restriccedilotildees de acesso deve ser garantida por uma poliacutetica de Dados Abertos pois ldquoOpen Data is politicalrdquo (World Wide Web Foundation 201638) ldquoInstitutionalizing open data within larger sectoral initiatives requires ample political

35 Disponiacutevel na WWW httpwwwpordatapt 36 Disponiacutevel na WWW httpwwwtransparenciahackdayorg 37 Disponiacutevel na WWW httpmanufacturaindependenteorg 38 Disponiacutevel na WWW httpnextopenspendingorg 39 Disponiacutevel na WWW httpschoolofdataorg 40 Disponiacutevel na WWW httpopenbudgetseu 41 Disponiacutevel na WWW httpopentrialsnet 42 Disponiacutevel na WWW httpfrictionlessdataio

54

willrdquo (OD4D 2016) O fenoacutemeno dos Dados Abertos eacute tambeacutem teacutecnico e social dada a interaccedilatildeo entre o meio local politico social legal e teacutecnico e as tecnologias que produzem resultados (Davies 2014 Pasqueto Sands amp Borgman 2015)

Da revisatildeo da literatura destaca-se a existecircncia de poliacuteticas diferenciadas para a abertura de dados governamentais e para a abertura de dados cientiacuteficos A maior parte das poliacuteticas e estrateacutegias governamentais concentram-se na abertura dos dados governamentais em detrimentos dos dados de investigaccedilatildeo (RECODE 2014) A expressatildeo ldquoPoliacutetica de Dados Abertosrdquo surge frequentemente associada a termos como estrateacutegias programas ou iniciativas de abertura de dados e ainda a poliacuteticas de gestatildeo de dados A contextualizaccedilatildeo das poliacuteticas natildeo eacute clara referindo-se apenas a Dados Abertos mas focando-se preferencialmente apenas nos dados provenientes do setor puacuteblico Em termos de dados de investigaccedilatildeo eacute possiacutevel encontrar poliacuteticas de quatro intervenientes diferentes Governo entidade financiadora que pode ser ou natildeo governamental instituiccedilotildees de investigaccedilatildeo e ainda as editoras de data journals Em termos de dados puacuteblicos satildeo associadas poliacuteticas governamentais e institucionais As poliacuteticas de dados abertos devem ainda incluir uma poliacutetica de gestatildeo de dados independentemente do seu cariz de investigaccedilatildeo ou puacuteblico

Nos uacuteltimos anos questotildees sobre a gestatildeo preservaccedilatildeo e partilha de dados cientiacuteficos tecircm sido alvo de debate puacuteblico O aumento da criaccedilatildeo de datasets vastos e complexos em todo o processo cientiacutefico estaacute a criar profundos desafios para o armazenamento acesso e interpretaccedilatildeo de dados (EAGDA 2014) As recentes poliacuteticas de Open Data pretendem disponibilizar em livre acesso os datasets da mesma forma que qualquer outra publicaccedilatildeo acadeacutemica sendo para isso necessaacuterio garantir uma infraestrutura de armazenamento acesso pesquisa e a reutilizaccedilatildeo dessa informaccedilatildeo (Rans Day Duke amp Ball 2013) As poliacuteticas satildeo essenciais para o estabelecimento de compromissos comuns (Erway et al 2016) Segundo a Science International (20156) ldquoeffective open data in a data-intensive age can only be realised if there is systemic action at disciplinary national and international levelsrdquo De acordo com Tananbaum num estudo preparado em nome da SPARC ldquoopen data policies promote the accessibility and reuse of the raw data generated during the scientific discovery phaserdquo Estas poliacuteticas abrangem uma gama variada de material natildeo-textual como datasets estatiacutesticas resultados de inqueacuterito e os metadados associados a estes objetos devendo permitir que estes sejam sujeitos a processamento por maacutequina e anaacutelise (Tananbaum) Existem alguns desafios teacutecnicos legais e eacuteticos na criaccedilatildeo de uma poliacutetica de abertura de dados como assegurar a heterogeneidade e interoperabilidade dos dados a acessibilidade e pesquisabilidade a preservaccedilatildeo e curaccedilatildeo a qualidade e avaliaccedilatildeo e tambeacutem a seguranccedila dos dados (RECODE 2014)

A abertura de dados de investigaccedilatildeo em todas as aacutereas cientiacuteficas natildeo pode ter uma abordagem one size fits all pois estas produzem diferentes tipos de dados e tecircm

55

procedimentos de anaacutelise publicaccedilatildeo e arquivo diferenciados (Royal Society 2012 RECODE 2014 ERAC 2016 Laumlmmerhirt 2016) A heterogeneidade verificada entre as poliacuteticas de dados de investigaccedilatildeo ao niacutevel da aplicaccedilatildeo normativa e da gestatildeo de dados implica de acordo com Laumlmmerhirt que o cumprimento das medidas impostas pelas poliacuteticas seja irregular O autor defende que as poliacuteticas de dados abertos devem considerar as praacuteticas normas infraestruturas dentro de cada disciplina cientiacutefica e tambeacutem estabelecer incentivos para a publicaccedilatildeo de dados

A Comissatildeo Europeia aborda a necessidade de desenvolver princiacutepios teacutecnicos legais eacuteticos e semacircnticos de interoperabilidade de assegurar a verificaccedilatildeo e a confianccedila nos dados a niacutevel local regional e nacional de implementar novos incentivos para a partilha e proteccedilatildeo de diferentes tipos de dados e por fim uma estrutura que possa avaliar estes princiacutepios (Comissatildeo Europeia Grupo de peritos de alto niacutevel em dados de investigaccedilatildeo 2010) Shadbolt (2016) ressalva que a aposta deve ser feita em poliacuteticas consistentes que determinem a forma de abertura de dados produzidos sob financiamento puacuteblico sendo essencial sublinhar os seus benefiacutecios e partilhar as melhores praacuteticas Para gerar praacuteticas e uma cultura de abertura ldquowe need incentives as well as mandatesrdquo (Shadbolt 20162) A visatildeo subjacente a este movimento de abertura de dados cientiacuteficos eacute que os dados arriscam-se a ficar sem sentido se forem impedidos de ganhar valor cientiacutefico econoacutemico social ou poliacutetico (Leonelli 2016)

Os governos devem desenvolver poliacuteticas de abertura dos dados cientiacuteficos que complementem as poliacuteticas de abertura dos dados puacuteblicos bem como apoiar a criaccedilatildeo de software e recursos humanos habilitados que satildeo criacuteticos no sucesso de ambas as poliacuteticas (Royal Society 2012) As poliacuteticas de Dados Abertos devem ter um caraacuteter diferenciado das poliacuteticas de AA devido a questotildees como a confidencialidade e seguranccedila Nesse sentido o desenvolvimento de poliacuteticas de Dados Abertos eacute uma tarefa mais complexa devendo por isso ser incorporada como uma extensatildeo das poliacuteticas de AA (Swan 2012) A loacutegica para a definiccedilatildeo de poliacuteticas nacionais de Open Data encontra-se em assegurar o rigor da ciecircncia nacional baseado na acessibilidade e reprodutibilidade dos seus resultados em capturar o valor da abertura de dados para benefiacutecio proacuteprio e como base da colaboraccedilatildeo eficiente na ciecircncia internacional (Science International 2015 traduccedilatildeo livre) Embora a ciecircncia seja um elemento central Pasqueto Sands e Borgman (2015) sublinham que esta loacutegica se centra maioritariamente no domiacutenio econoacutemico

Segundo a SPARC as entidades financiadoras de investigaccedilatildeo devem implementar poliacuteticas de Dados Abertos como forma de aumentar a disponibilidade e reutilizaccedilatildeo de dados enquanto reduzem a duplicaccedilatildeo de investigaccedilatildeo maacute-interpretaccedilatildeo fraude e manipulaccedilatildeo de dados As poliacuteticas devem abranger todos os dados e metadados necessaacuterios agrave verificaccedilatildeo dos resultados de investigaccedilatildeo devendo a sua publicaccedilatildeo ocorrer o mais rapidamente possiacutevel (Tananbaum) O tempo passado entre a criaccedilatildeo e

56

a publicaccedilatildeo de dados eacute uma questatildeo importante na cultura do Open Data Poreacutem a Royal Society (2012) sugere que os investigadores deveriam ter exclusividade do uso dos dados por um curto periacuteodo de tempo de maneira a poderem analisa-los e publicar os seus resultados

A RECODE (2014) sublinha que os dados devem ser depositados num repositoacuterio que garanta a reutilizaccedilatildeo seguranccedila estabilidade estrutura de custos relevacircncia temaacutetica metadados diversos formatos de ficheiros processamento por maacutequina e curadoria de dados As poliacuteticas mais significativas das entidades financiadoras definem o AA a dados com obrigatoacuterio para a investigaccedilatildeo financiada com as exceccedilotildees possiacuteveis por razotildees eacuteticas e legais Requem o depoacutesito de dados que suportam as publicaccedilotildees e outros dados importantes em repositoacuterios certificados Requerem que os investigadores descrevam os dados nos Data Management Plan (DMP) que satildeo submetidos com as propostas de financiamento para serem avaliados Para assegurar a reutilizaccedilatildeo dos dados e a habilidade de identificar e medir o cumprimento das poliacuteticas os financiadores de investigaccedilatildeo introduziram especificaccedilotildees teacutecnicas nas suas poliacuteticas (DOIrsquos padrotildees de metadados especiacuteficos) bem como provisotildees para o licenciamento apropriado Mais importante as poliacuteticas eficientes incluem descriccedilotildees claras das responsabilidades e expectativas para os intervenientes envolvidos (financiadores investigadores centros de dados repositoacuterios e instituiccedilotildees de investigaccedilatildeo) (RECODE 2014)

O sucesso das poliacuteticas dos financiadores depende da criaccedilatildeo de um ambiente com incentivos apropriados que assegurem que os investigadores que gerem datasets de qualidade e os disponibilizem publicamente recebam o devido reconhecimento e recompensa bem como o financiamento adequado para os repositoacuterios e a monitorizaccedilatildeo dos planos de gestatildeo de dados (Expert Advisory Group on Data Access [EAGDA] 2014) Segundo a RECODE (2014) as poliacuteticas das entidades financiadoras devem estabelecer o AA a dados de investigaccedilatildeo por defeito devem definir responsabilidades conteuacutedos alvo os planos de gestatildeo de dados tempo e local de depoacutesito as especificaccedilotildees teacutecnicas para permitir a reutilizaccedilatildeo o licenciamento de dados medidas para garantir o acesso a longo termo e garantir a conformidade com a poliacutetica As instituiccedilotildees de investigaccedilatildeo devem desenvolver poliacuteticas para a partilha de dados e preservaccedilatildeo fornecer treino e apoio aos investigadores para gerirem os seus dados de forma efetiva criar carreiras para os gestores de dados e reconhecer os data outputs nos processos de avaliaccedilatildeo (EAGDA 2014) No Reino Unido um grupo de entidades interessadas na abertura de dados assinou em Julho de 2016 a ldquoConcordat on Open Research Datardquo com o intuito de assegurar que os dados de investigaccedilatildeo gerados e coletados por membros da comunidade de investigaccedilatildeo britacircnica sejam disponibilizados de forma aberta para reutilizaccedilatildeo por outros devendo esta abertura ocorrer de maneira consistente ldquowith relevant legal ethical disciplinary and

57

regulatory frameworks and norms and with due regard to the costs involvedrdquo (Concordat on Open Research Data 20161)

O desenvolvimento de poliacuteticas de abertura de dados permite que as instituiccedilotildees43 salvaguardem o seu investimento intelectual financeiro humano e material e respondam agrave crescente pressatildeo dos financiadores que requerem que os dados produzidos sob financiamento sejam geridos de forma apropriada e com AA (RECODE 2014) As poliacuteticas de abertura de dados das instituiccedilotildees de investigaccedilatildeo devem identificar as funccedilotildees e responsabilidades de cada interveniente tendo ainda um papel importante no desenvolvimento de data science skills sendo a sua funccedilatildeo preparar os investigadores para explorarem dados de forma efetiva oferecer serviccedilos de administraccedilatildeo de dados e tambeacutem a infraestrutura de computaccedilatildeo e armazenamento necessaacuteria (RECODE 2014 Whyte amp Donnally 20166) Rouder (2015) defende que as instituiccedilotildees devem utilizar sistemas automatizados que permitem que os dados sejam criados jaacute abertos eliminando erros na gestatildeo de dados fornecendo coacutepias de seguranccedila automaacuteticas simplificaccedilatildeo da partilha aumento da disponibilidade dos dados a longo termo e proporcionando um local de partilha e armazenamento

Segundo o RECODE (2014) os editores estatildeo interessados na abertura de dados de investigaccedilatildeo porque esta abertura agrega valor aos seus produtos principais (publicaccedilotildees tradicionais) ao melhorar a confianccedila da investigaccedilatildeo publicada atraveacutes da habilidade de a verificar Os editores cientiacuteficos devem estabelecer poliacuteticas para a partilha de dados e processos que permitam a contribuiccedilatildeo de autores individuais nas publicaccedilotildees sejam avaliadas e que requeiram a citaccedilatildeo44 e o reconhecimento dos datasets usados no curso da publicaccedilatildeo (EAGDA 2014 ICSU 2014) Os editores devem ainda requerer que se possa aceder avaliar usar e rastrear os dados subjacentes aos artigos a partir dos mesmos como condiccedilatildeo para a publicaccedilatildeo (Royal Society 2012 EAGDA 2014 ICSU 2014) A emergecircncia de data journals45 deve ser ligada ao esforccedilo de publicar dados de forma separada o que permite que partes essenciais do registo cientiacutefico possam ser disponibilizadas de forma inteligiacutevel para a comunidade cientiacutefica (RECODE 2014) Segundo o estudo de Sturges et al (20152445) ldquoa large percentage of journals have no data sharing policy and that there are inconsistencies between those that are traceablerdquo significando que os investigadores natildeo sabem se devem 43 Um bom exemplo encontra-se no siacutetio do Centro Europeu de Investigaccedilatildeo nuclear que apresenta trecircs grupos de dados produzidos que podem ser reutilizados tendo ainda definido poliacuteticas de acesso externo aos dados reutilizaccedilatildeo e preservaccedilatildeo para os dados provenientes de quatro experiecircncias a decorrer com o Large Hadron Collider (Grande Colisor de Haacutedrons) Disponiacutevel na WWW httpopendatacernchabout 44 De forma a potenciar o creacutedito do autor e a citaccedilatildeo de dados a Royal Society (2012) Altman amp Crosas (2013) Carpenter (2014) Ball amp Duke (2015) aconselham a criaccedilatildeo perfis de autor como o ORCID ou o ISNI permitindo desta forma que os investigadores possam associar todos os seus trabalhos cientiacuteficos num ponto uacutenico 45 Os data journals satildeo plataformas de publicaccedilatildeo de dados em AA com revisatildeo por pares para a publicaccedilatildeo partilha e disseminaccedilatildeo de dados que cobrem uma grande variedade de disciplinas (RECODE 2014)

58

partilhar os dados subjacentes aos seus artigos e tambeacutem natildeo sabem como e onde depositar os dados Contudo o cenaacuterio parece estar a mudar com o grupo editorial Nature Springer46 a anunciar em dezembro de 2016 o compromisso de mais de 600 journals com as novas poliacuteticas de partilha de dados definidas pelo grupo encorajando ou mandatando a partilha arquivo citaccedilatildeo de dados e revisatildeo por pares (Nature Springer 2016)

O Open Science Monitor avalia o impacto da abertura dos dados de investigaccedilatildeo atraveacutes trecircs indicadores nuacutemero de repositoacuterios de Dados Abertos poliacuteticas das agecircncias de financiamento relativas agrave partilha de dados e tambeacutem o comportamento dos investigadores em termos de partilha de dados O modelo de avaliaccedilatildeo usa ferramentas como o r3data e o SHERPAJuliet para determinar o nuacutemero de repositoacuterios e de poliacuteticas de abertura de dados recorrendo ainda a estudos de caso para determinar o comportamento dos investigadores na partilha de dados Foram listadas 105 poliacuteticas de financiadores na EU sendo que 76 das instituiccedilotildees natildeo possuem qualquer poliacutetica de Dados Abertos 10 encoraram o arquivo e 19 entidades financiadores requerem o arquivo de dados Os resultados satildeo altamente influenciados pelo enorme nuacutemero de instituiccedilotildees de financiamento de investigaccedilatildeo que pertencem ao Reino Unido sendo que das 69 instituiccedilotildees listadas 53 natildeo implementaram nenhuma poliacutetica de Dados Abertos Ressalve-se tambeacutem que das 19 poliacuteticas que requerem o arquivo de dados 13 pertencem ao Reino Unido (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2017)

O biosharingorg (2017) elaborou uma lista com as poliacuteticas de abertura de dados de investigaccedilatildeo a niacutevel mundial contando com 96 referecircncias em maio de 2017 As poliacuteticas de Dados Abertos distribuem-se por revista cientiacutefica (68) entidade financiadora (22) projetos (4) e sociedade (2) Ciecircncias da Vida e Ciecircncias Biomeacutedicas satildeo os domiacutenios com mais poliacuteticas Natildeo se encontra nenhuma poliacutetica cientiacutefica portuguesa listada

O RECODE (2014) estabeleceu dez recomendaccedilotildees para a abertura de dados cientiacuteficos

Desenvolver poliacuteticas compreensivas de AA aos dados de investigaccedilatildeo e consistentes com as prioridades nacionais e alinhadas com os requisitos europeus

Assegurar o financiamento apropriado para o AA aos dados de investigaccedilatildeo ao niacutevel do financiamento do desenvolvimento e sustentabilidade a longo prazo das

46 A Scientific Data uma das revistas de AA para descriccedilatildeo de datasets cientiacuteficos da divisatildeo editorial Nature Research englobadas no grupo Nature Springer fornece aos investigadores uma lista de repositoacuterios recomendados para o depoacutesito de dados consoante a sua aacuterea temaacutetica Disponiacutevel na WWW httpswwwnaturecomsdatapoliciesrepositoriessocial

59

infraestruturas de investigaccedilatildeo treino de investigadores bibliotecaacuterios e outros profissionais

Desenvolver poliacuteticas e iniciativas que recompensem os investigadores pelo esforccedilo de partilharem dados de alta qualidade

Identificar os intervenientes-chave e as redes de colaboraccedilatildeo para fomentar o trabalho colaborativo para um ecossistema sustentaacutevel de AA aos dados

Planear a sustentabilidade da curadoria e a preservaccedilatildeo dos dados a longo termo Desenvolver soluccedilotildees teacutecnicas e infraestruturais que possam arcar com a

preservaccedilatildeo de dados de alta qualidade a longo prazo harmonizaccedilatildeo de dados descoberta e acesso preservaccedilatildeo obsolescecircncia tecnoloacutegica documentaccedilatildeo e metadados indicadores de qualidade e relevacircncia e questotildees de seguranccedila

Desenvolver padrotildees teacutecnicos e cientiacuteficos de qualidade para os dados Requerer o uso de estruturas harmonizadas abertas e licenciadas Lidar com os sistemaacuteticos desafios legais e eacuteticos decorrentes do AA a dados Apoiar a transiccedilatildeo para os Dados Abertos atraveacutes do treino e desenvolvimento de

curriacuteculo

A ERAC (2016) desenvolveu um conjunto de recomendaccedilotildees para apoiar o desenvolvimento de poliacuteticas nacionais de abertura de dados de investigaccedilatildeo As recomendaccedilotildees satildeo dirigidas aos diversos intervenientes da abertura de dados estando dividas em quatro categorias

Treino dos intervenientes no processo de abertura de dados mudanccedila cultural treino incentivos e sistemas de recompensa e monitorizaccedilatildeo

Gestatildeo e qualidade de dados aspetos teacutecnicos da avaliaccedilatildeo da qualidade de dados identificaccedilatildeo e citaccedilatildeo de dados e gestatildeo de projetos

Sustentabilidade e financiamento abordagem das infraestruturas e financiamento essenciais

Questotildees legais direitos de propriedade intelectual e questotildees de seguranccedila

A mudanccedila cultural exigida para a abertura plena dos dados passa pela necessidade de estabelecer novas formas de reconhecimento e recompensa aos esforccedilos de gestatildeo preservaccedilatildeo e curaccedilatildeo de dados como forma de envolver investigadores e comunidades na abertura de dados (RECODE 2014 International Science 2015) A mudanccedila cultural tem no entanto encontrado alguns reveses pois o caminho para a abertura de dados natildeo eacute percecionado da mesma forma pelos diferentes intervenientes Isto resulta de conflitos entre cadeias de valor processos paralelos e desconectados especialmente entre as praacuteticas de cada disciplina e os requisitos de cada financiadorinstituiccedilatildeo (RECODE 2014) Segundo o inqueacuterito efetuado pelo EAGDA (2014) os planos de gestatildeo de dados natildeo satildeo avaliados adequadamente e existe pouca monitorizaccedilatildeo da implementaccedilatildeo da partilha de dados Os investigadores natildeo se sentem encorajados pelas instituiccedilotildees a partilhar dados e existe necessidade de

60

proporcionar treino aos investigadores A falta de apoio para a partilha de dados eacute sintomaacutetica com a falta de habilidades na gestatildeo de projetos sendo que os investigadores dedicam poucos cuidados agrave preservaccedilatildeo e curaccedilatildeo de dados Estes acontecimentos contribuem para a falta de conhecimento de metadados limitando a utilidade dos datasets Os investigadores sentem tambeacutem que a partilha de dados natildeo tem influecircncia na progressatildeo na carreira (EAGDA 2014)

A OECD (2015a) considera essencial que os investigadores desenvolvam competecircncias sobre dados que lhes permita natildeo soacute partilhar dados limpos e com metadados adequados como tambeacutem entender e reutilizar dados de terceiros A familiaridade com ferramentas e princiacutepios de gestatildeo de dados deve ser segundo a Royal Society (2012) parte integrante do treino dos cientistas As bibliotecas como parte integrante do mundo da investigaccedilatildeo e os bibliotecaacuterios47 como profissionais de informaccedilatildeo multifacetados podem desempenhar um papel ativo no mundo dos Dados Abertos como facilitadores do processo de investigaccedilatildeo (RECODE 2014 Hahnel e Hook 2016 Erway et al 2016 Hernaacutendez-Peacuterez 2016) Para Erway et al (2016) o plano de gestatildeo de dados eacute um ponto base para os bibliotecaacuterios fornecerem serviccedilos de gestatildeo de dados de investigaccedilatildeo As bibliotecas devem fornecer informaccedilatildeo sobre o processo de gestatildeo de dados incluindo planos de gestatildeo de dados e aconselhamento sobre direitos de propriedade intelectual treino serviccedilos de metadados fornecer um cataacutelogo de dados ou um repositoacuterio de dados oferecer serviccedilos de armazenamento pesquisa e acesso permanente para apoiar o ciclo da investigaccedilatildeo (Christensen-Dalsgaard et al 2012 Erway et al 2016 Hernaacutendez-Peacuterez 2016) Christensen-Dalsgaard et al (2012) acrescenta que as bibliotecas devem participar no desenvolvimento da poliacutetica de Dados Abertos da instituiccedilatildeo e estabelecer colaboraccedilotildees com investigadores grupos de investigaccedilatildeo arquivos e centros de dados para fomentar a interoperabilidade da estrutura de acesso pesquisa e partilha de dados Embora muitas das funccedilotildees sejam idecircnticas Hernaacutendez-Peacuterez (2016) faz a distinccedilatildeo entre os papeacuteis das bibliotecas puacuteblicas e das universitaacuterias O autor ressalva que as bibliotecas puacuteblicas devem centrar a atenccedilatildeo nos Dados Abertos que sejam afetos agrave sua comunidade A RDA publicou em 2015 um documento com uma visatildeo geral sobre as praacuteticas recursos online e ferramentas que podem ajudar as bibliotecas a integrar a gestatildeo de dados nas suas rotinas de trabalho As 23 orientaccedilotildees sugeridas dividem-se em recursos de aprendizagem disseminaccedilatildeo de dados planos de gestatildeo de dados literacia de dados metadados citaccedilatildeo de dados licenciamento e privacidades preservaccedilatildeo digital repositoacuterios de dados e comunidade de praacutetica

Na procura de um padratildeo de abertura de dados que permita potenciar a ciecircncia e a investigaccedilatildeo o Data Publishing Group da FORCE11 criou os FAIR principles Estes

47 Veja-se neste ponto os cursos de formaccedilatildeo sobre gestatildeo de dados para bibliotecaacuterios oferecidos pela Universidade de Edimburgo Disponiacutevel na WWW httpdatalibedinaacukmantralibtraininghtml

61

princiacutepios apresentam-se divididos em quatro facetas relacionadas mas tecnicamente independentes (FORCE11 FAIR Data Publishing Group 2014)

Fig 15 Princiacutepios FAIR Data Fonte Adaptado de FORCE11 FAIR Data Publishing Group 2014 Disponiacutevel na WWW httpswwwforce11orggroupfairgroupfairprinciples

A implementaccedilatildeo destes princiacutepios teacutecnicos na abertura de dados poderaacute potenciar tambeacutem a partilha e por consequente a citaccedilatildeo de dados A citaccedilatildeo de dados48 eacute um assunto que tem vindo a ser debatido na comunidade cientiacutefica nos uacuteltimos anos sendo uma aacuterea em que a FORCE11 tambeacutem jaacute definiu princiacutepios49 que comeccedilam a ser adotados pela comunidade cientiacutefica

Relativamente aos dados puacuteblicos ou do setor puacuteblico a comunidade internacional tem vindo a aumentar o seu interesse no uso destes dados embora nem sempre seja claro que a abertura seja uma prioridade na sua agenda poliacutetica (OD4D 2016) ldquoThe 48 Num mundo onde o Fator de Impacto continua a ser a principal medida de avaliaccedilatildeo do trabalho dos cientistas a citaccedilatildeo de dados e as meacutetricas alternativas denominadas de Altimetrias comeccedilam a ganhar algum destaque na literatura cientiacutefica 49 Os Data Citation Principles foram criados pela FORCE11 com o intuito de disponibilizar um padratildeo de citaccedilatildeo de dados cobrindo o propoacutesito funccedilotildees e atributos da citaccedilatildeo O conjunto de oito princiacutepios inclui a importacircncia da citaccedilatildeo de dados a atribuiccedilatildeo de creacutedito prova de evidecircncia identificador uacutenico acesso persistecircncia especificidade e verificabilidade interoperabilidade e flexibilidade Disponiacutevel na WWW httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

bull F1 - Satildeo atribuiacutedos identificadores persistentes e uacutenicos a cada conjunto de (meta)dados

bull F2 - Os dados satildeo descritos atraveacutes do uso de metadados sofisticados

bull F3 - Os (meta)dados devem ser registadosindexados num motor de pesquisa

bull F4 - Os metadados devem especificar o identificador de dados

Faacuteceis de encontrar

bull A1 - Os (meta)dados satildeo pesquisaacuteveis atraveacutes do seu identificador usando um protocolo de comunicaccedilatildeo padratildeo

bull A11 - O protocolo eacute aberto livre e universalmente implementaacutevel

bull A12 O protocolo requer a autenticaccedilatildeo e concessatildeo de autorizaccedilatildeo quando necessaacuterio

bull A2 - Os metadados permanecem acessiacuteveis mesmo quando os dados jaacute natildeo estatildeo disponiacuteveis

Acessiacuteveis

bull I1 - Os (meta)dados usam uma linguagem formal acessiacutevel partilhada e de aplicaccedilatildeo global

bull I2 - Os (meta)dados usam vocabulaacuterios que sigam os princiacutepios FAIR

bull I3 - Os (meta)dados incluem referecircncias qualificadas a outros (meta)dados

Interoperaacuteveis

bull R1 - Os (meta)dados tecircm uma pluralidade de atributos relevantes e precisos

bull R11 - Os (meta)dados satildeo publicados com uma licenccedila clara de acessibilidade e reutilizaccedilatildeo

bull R12 - Os (meta)dados satildeo associados com a sua origem bull R13 - Os (meta)dados cumprem com os padrotildees comunitaacuterios

relevantes de cada domiacutenio

Reutilizaacuteveis

62

culture of open data policies has to change from a culture in which opening of data is standardly considered (Zuiderwijk amp Janssen 201427)

Devem ser consideradas vaacuterias questotildees na elaboraccedilatildeo de uma poliacutetica de Dados Abertos como a definiccedilatildeo da sua aplicaccedilatildeo e os objetivos que dados iratildeo ser publicados quais as condiccedilotildees de publicaccedilatildeo de dados em que siacutetio qual a frequecircncia e qual a razatildeo da publicaccedilatildeo devendo ainda ser calculado o impacto e os benefiacutecios da abertura de dados (Carrara et al 2016a) Os objetivos das poliacuteticas de Dados Abertos podem ser sintetizados em trecircs aacutereas principais fomentar a inovaccedilatildeo social e crescimento econoacutemico melhorar a eficiecircncia dos serviccedilos do setor puacuteblico e fortalecer a democracia e aumentar a transparecircncia (Zuiderwijk Gasco Parycek amp Janssen 2014) Para alcanccedilar este impacto real os governos necessitam de implementar o fenoacutemeno dos Dados Abertos como uma mudanccedila cultural assegurando que recursos humanos e materiais infraestrutura leis e poliacuteticas satildeo eficientes para a implementaccedilatildeo e extraccedilatildeo de resultados a longo prazo (World Wide Web Foundation 2016)

No contexto das poliacuteticas de Dados Abertos a transparecircncia natildeo deve ser vista como um fim mas sim como um meio para atingir outros objetivos como a inovaccedilatildeo no setor puacuteblico permitindo o envolvimento democraacutetico e fornecendo o acesso a informaccedilatildeo ldquoincluding enhancing the findability usability and intelligibility of open data and providing the possibility to trace governmental processes and policy and decision makingrdquo (Zuiderwijk et al 2014) Dados os benefiacutecios desejados as barreiras agrave sua implementaccedilatildeo e os baixos niacuteveis de exploraccedilatildeo de dados os programas de DGA soacute funcionaratildeo bem se forem desenhados mediante a apreciaccedilatildeo da sua complexidade O programa deve natildeo soacute perceber as necessidades e as capacidades dos fornecedores de dados governamentais e privados como tambeacutem as caracteriacutesticas dos dados e a natureza dos recursos da comunidade e dos intervenientes (Dawes Vidiasova amp Parkhimovich 2016) Num estudo comparativo de cinco poliacuteticas nacionais de Dados Abertos Huijboom e van den Broek (2011) concluiacuteram que faltam provas mais evidentes dos benefiacutecios econoacutemicos sociais e democraacuteticos das poliacuteticas de abertura de dados governamentais Os autores sublinham que as barreiras estatildeo dentro das organizaccedilotildees governamentais as motivaccedilotildees estatildeo predominantemente fora desse espectro (Huijboom amp van den Broek 2011)

A investigaccedilatildeo de Dawes Vidiasova amp Parkhimovich (2016) demonstra a existecircncia de vaacuterias abordagens no desenvolvimento de programas de abertura de dados governamentais com diversas consideraccedilotildees sociais e teacutecnicas

Abordagem orientada a dados ou seja focada nas caracteriacutesticas qualidade e disponibilidade de dados abertos

Abordagem orientada ao programa que foca os objetivos e as funcionalidades das estruturas e operaccedilotildees dos programas de DGA

63

Abordagem orientada ao uso e ao utilizador que se centra nos fatores que influenciam o uso de DGA pela comunidade

Abordagem de desempenho e impacto que foca uma vasta gama de consideraccedilotildees que podem influenciar como os programas de DGA funcionam

Abordagem de ecossistemas e redes que indicam os componentes de um programa de DGA e tambeacutem as relaccedilotildees dinacircmicas existentes e como estas influenciam o desempenho do programa

O Secretaacuterio-geral das Naccedilotildees Unidas atraveacutes do seu grupo de aconselhamento independente efetuou recomendaccedilotildees para possibilitar ldquoa data revolution in sustainable developmentrdquo (The UN Secretary Generals Independent Expert Advisory Group on a Data Revolution for Sustainable Development 2014a traduccedilatildeo livre)

Criaccedilatildeo de normas incentivos e regulamentos para encorajar e requerer que os dados sejam tornados publicamente disponiacuteveis e de forma que possam ser uacuteteis a outros utilizadores

Aumentar a literacia de dados para que mais pessoas usem e analisem dados Criar inovaccedilotildees na forma em como quando e que dados satildeo coletados e

partilhados para que estejam sempre atualizados e sejam relevantes para as pessoas e para os poliacuteticos

Para apoiar o desenvolvimento sustentaacutevel e inclusivo a data revolution deve ser guiada pelos seguintes princiacutepios qualidade e integridade de dados desagregaccedilatildeo de dados publicaccedilatildeo de dados de forma raacutepida transparecircncia e abertura de dados curadoria e usabilidade de dados proteccedilatildeo e privacidade gestatildeo e independecircncia recursos e capacidades tecnoloacutegicas (The UN Secretary Generals Independent Expert Advisory Group on a Data Revolution for Sustainable Development 2014b) O repositoacuterio de dados estatiacutesticos das Naccedilotildees Unidas indexa 60 milhotildees de registos de datasets provenientes de 35 bases de dados de 20 temaacuteticas diferenciadas Ao inserir a palavra ldquoPortugalrdquo no campo de pesquisa do repositoacuterio satildeo recuperados 2172 datasets distribuiacutedos por 25 fontes diferenciadas Estes conjuntos de dados distribuem-se por vaacuterias temaacuteticas sendo o setor industrial o maior fornecedor de dados com 612 datasets (United Nations Statistics Division 2017)

Dawes Vidiasova amp Parkhimovich (20162) defendem ldquothe ecosystem metaphorrdquo como uma abordagem heuriacutestica para o desenho efetivo de programas de abertura de dados governamentais sublinhando a sua utilidade se o ecossistema for dotado de ldquofeedback and adjustment among actors and processesrdquo A chave para um ecossistema de Dados Abertos funcional eacute a implementaccedilatildeo de poliacuteticas que definam ldquothe legal context standards to facilitate data interoperability and a stable and sustainable network for users of the datardquo (Donker amp van Loenen 2017)

64

A Sunlight Foundation publicou em 2014 as ldquoGuidelines for open data policiesrdquo fornecendo aconselhamento ao niacutevel dos dados que devem ser tornados puacuteblicos e como essa abertura deve ser efetuada Para a implementaccedilatildeo de poliacuteticas de DGA a Sunlight Foundation aponta como fundamental criar um autoridade de supervisatildeo criar orientaccedilotildees e outras regulaccedilotildees vinculativas para a implementaccedilatildeo da poliacutetica incorporar a perspetiva puacuteblica na implementaccedilatildeo da poliacutetica definir prazos ambiciosos para a implementaccedilatildeo criar processos que assegurem a qualidade dos dados assegurar financiamento suficiente para a implementaccedilatildeo da poliacutetica criar ou explorar parcerias e mandatar futuras revisotildees da poliacutetica para possiacuteveis ajustamentos (Sunlight Foundation 2014 traduccedilatildeo livre)

De acordo com Dietrich (2013) uma poliacutetica de dados abertos deve

Definir a abertura por defeito Estar alinhada com os principais objetivos nacionais de desenvolvimento de

poliacuteticas Definir uma estrateacutegia nacional e as suas prioridades Tornar a coleta e gestatildeo de dados numa rotina Estabelecer accedilotildees de suporte ao ecossistema de dados abertos

Segundo o Open Data GoldBook todas as poliacuteticas de Dados Abertos devem cobrir os seguintes toacutepicos (Carrara et al 2016a traduccedilatildeo livre)

Lista das categorias de dados da organizaccedilatildeo Avaliaccedilatildeo do estatuto dos dados da organizaccedilatildeo Alinhamento com os aspetos legais Accedilotildees necessaacuterias para atingir os objetivos propostos Implicaccedilotildees teacutecnicas Implicaccedilotildees financeiras Criaccedilatildeo de um grupo de trabalho com responsabilidades e funccedilotildees claras Desenvolvimento de um plano que assegure a criaccedilatildeo do grupo de trabalho e

tambeacutem a sua monotorizaccedilatildeo Definiccedilatildeo de indicadores de performance que possibilitem a mediccedilatildeo do progresso

da poliacutetica relativamente aos objetivos delineados

O Open Data Study (Hogge 2011) aponta como razatildeo de sucesso das estrateacutegias de Open Data no Reino Unido e nos EUA a utilizaccedilatildeo de uma abordagem que envolve trecircs niacuteveis de intervenientes

Sociedade Civil e em particular o pequeno grupo que desenvolve aplicaccedilotildees e serviccedilos a partir de dados puacuteblicos

Um grupo de burocratas governamentais munidos de talento e recursos que lhes permita funcionar como niacutevel intermeacutedio ou de ligaccedilatildeo

Uma administraccedilatildeo poliacutetica recetiva agrave mudanccedila e agrave abertura

65

Em entrevista ao mesmo estudo (Hogge 201110) Tim Berners-Lee sintetiza esta estrateacutegia ldquoIt has to start at the top it has to start in the middle and it has to start at the bottomrdquo reforccedilando a ideia da importacircncia destes trecircs niacuteveis de influecircncia

Atraveacutes do seu Task Force Report o e-IRG (2016) efetuou vaacuterias recomendaccedilotildees para a implementaccedilatildeo de poliacuteticas de Dados Abertos preferecircncia pelas licenccedilas abertas promover a certificaccedilatildeo dos repositoacuterios apresentar os dados como um bem cientiacutefico institucional e societal e por fim ligar dados agraves publicaccedilotildees O OD4D (2016) sublinha que os dados devem ser publicados de forma consistente devem ser comparaacuteveis e interoperaacuteveis e para isso eacute necessaacuterio adotar padrotildees abertos e praacuteticas de publicaccedilatildeo para metadados formatos codificaccedilatildeo de caracteres identificadores vocabulaacuterios e licenciamento

Atraveacutes do estudo efetuado agraves poliacuteticas de Dados Abertos de instituiccedilotildees holandesas Zuiderwijk e Janssen (2014 traduccedilatildeo livre) efetuaram diversas recomendaccedilotildees que podem potenciar melhorias nas poliacuteticas de abertura de dados

Colaboraccedilatildeo entre instituiccedilotildees usando recursos e conhecimento coletivo para apoiar a troca de conhecimentos e a superaccedilatildeo da limitaccedilatildeo de recursos

Foco no impacto criaccedilatildeo de valor puacuteblico e natildeo apenas na publicaccedilatildeo de dados Estiacutemulo do uso de Dados Abertos e comunicaccedilatildeo dos sucessos de reutilizaccedilatildeo Criaccedilatildeo de uma cultura onde a abertura de dados seja incorporada nos processos

de trabalho diaacuterios

Arzberger et al (20041777) elencaram uma estrutura de avaliaccedilatildeo com cinco domiacutenios para promover o acesso a dados tecnoloacutegico institucional e de gestatildeo financeiro e orccedilamental legal e poliacutetico cultural e comportamental Estes domiacutenios podem ajudar na formulaccedilatildeo de poliacuteticas de Dados Abertos dado que satildeo ldquoa framework for locating and analyzing where improvements can be maderdquo Alguns autores destacam a pouca importacircncia que tem sido dedicada agrave implementaccedilatildeo avaliaccedilatildeo e alteraccedilotildees das poliacuteticas de Dados Abertos (Zuiderwijk et al2014) e ao desenvolvimento de investigaccedilatildeo que compare as mesmas poliacuteticas (Zuiderwijk amp Janssen 2014) A avaliaccedilatildeo dos efeitos das poliacuteticas de Dados Abertos pode fornecer inferecircncias importantes sobre as vantagens e desvantagens da abertura de dados e o valor puacuteblico que estas podem criar (Zuiderwijk et al2014) Comparar poliacuteticas de Dados Abertos em diferentes aspetos e a diferentes niacuteveis eacute importante e necessaacuterio para obter ldquoa better understanding of the common and differing elements in the policies and to identify the factors that affect the variation in policies and which influence their impactrdquo (Zuiderwijk amp Janssen 201417-18) Avaliar o estado da abertura de dados pode envolver a avaliaccedilatildeo teacutecnica dos conjuntos de dados das iniciativas de abertura dos dados governamentais atraveacutes da mediccedilatildeo quantitativa de resultados e impacto e julgamentos qualitativos sobre o desempenho da iniciativa de Dados Abertos (World Wide Web Foundation 2014) Um meacutetodo comum de avaliar o

66

efeito das poliacuteticas satildeo as estruturas de avaliaccedilatildeo da maturidade dos Dados Abertos sendo que estas podem ser uma ferramenta importante na melhoria da abertura de dados e no envolvimento da sociedade Estas estruturas satildeo usadas como modelo para comparaccedilatildeo de diferentes setores eou paiacuteses como instrumento de melhoria da qualidade e gestatildeo dos Dados Abertos (World Wide Web Foundation 2014 Donker amp van Loenen 2017) para entender os impactos comerciais e sociais e priorizar determinados tipos de dados (World Wide Web Foundation 2014) A World Wide Web Foundation (2014) enfatiza que a avaliaccedilatildeo das atividades de Dados Abertos deve ter em conta

Contexto em que a abertura de dados eacute feita legal organizacional poliacutetico teacutecnico social e econoacutemico

Natureza e qualidade dos conjuntos de dados acessibilidade legibilidade por maacutequina e licenccedilas abertas dimensatildeo teacutecnica legal social e praacutetica da abertura classificaccedilatildeo de datasets avaliaccedilatildeo da qualidade

Contexto de utilizaccedilatildeo quem satildeo os utilizadores quais os seus propoacutesitos e quais as atividades e modelos de negoacutecio construiacutedos a partir dos Dados Abertos

Benefiacutecios adquiridos pela reutilizaccedilatildeo de Dados Abertos sociais ambientais poliacuteticos e econoacutemicos ou comerciais

Atraveacutes de uma extensa revisatildeo da literatura50 Zuiderwijk e Janssen (2014) elaboraram uma estrutura de comparaccedilatildeo para as poliacuteticas de Dados Abertos baseada em trecircs vetores o ambiente e contexto da poliacutetica o conteuacutedo da poliacutetica os indicadores de desempenho que permitem inferir o valor puacuteblico alcanccedilado Estes vetores dividem-se em 27 indicadores de enquadramento e avaliaccedilatildeo das poliacuteticas de Dados Abertos

50 As autoras mencionam publicaccedilotildees de Huijboom amp Van der Broek (2011) Gibbs et al (2003) Eskelinen et al (2008) De Bruijn et al (2002) Dawes et al (2004) Rothenberg (2012) Public Sector Transparency Board (2012) Dawes Pardo amp Cresswell (2004) Open Government Directive (Obama 2012) Jaeger et al (2012) Zuiderwijk Jeffey amp Janssen (2012) Ono amp Zavodny (2007) Jaeger (2007)

67

Fig 16 Estrutura de avaliaccedilatildeo de poliacuteticas de Dados Abertos Fonte Zuiderwijk e Janssen (2014) Disponiacutevel na WWW httpwwwsciencedirectcomsciencearticlepiiS0740624X13001202

Antes de poder avaliar o sucesso do impacto dos Dados Abertos eacute necessaacuterio avaliar o estado atual da abertura de dados (Donker amp van Loenen 2017) De acordo com Sasse et al (2017) a avaliaccedilatildeo dos produtos de Dados Abertos pode ser difiacutecil Os autores enfatizam que os responsaacuteveis pelos portais de dados querem obter mais informaccedilatildeo atraveacutes da mediccedilatildeo de alguns paracircmetros como os datasets mais acedidos que datasets natildeo satildeo atualizados ou a percentagem de downloads entre outros Estas meacutetricas51 podem servir diversas audiecircncias desde organizaccedilotildees que publiquem dados a utilizadores que pretendam saber quais os conjuntos de dados mais usados Ainda

51 As meacutetricas satildeo uma forma de avaliaccedilatildeo que mede o progresso desempenho qualidade ou quantidade de um projeto serviccedilo ferramenta ou produto (Sasse et al 2017)

bullPaiacutes bullNiacutevel da organizaccedilatildeo e tipo de missatildeo bullMotivaccedilotildees e objectivos bullLanccedilamento da plataforma de Dados Abertos bullAlocaccedilatildeo de recursos e contexto econoacutemico bullLegislaccedilatildeo bullContexto poliacutetico e social

Conteacuteudo e ambiente da poliacutetica

bullEstrateacutegia e princiacutepios de abertura bullMedidas e instrumentos poliacuteticos bullProcessamento de dados antes da publicaccedilatildeo bullQuantidade de Dados Abertos bullTemaacutetica dos Dados Abertos bullFormas de apresentaccedilatildeo de dados bullPreccedilo do acesso aos dados bullGrupos alvo da abertura de dados bullPadrotildees e formatos teacutecnicos para os Dados Abertos bullFornececimento de metadados bullTipos de dados natildeo publicados bullApoio teacutecnico para o uso de dados publicados bullPromoccedilatildeo ativa da reutilizaccedilatildeo de dados bullQualidade dos dados bullLicenciamento de dados bullDisponibilidade de dados sem pedido de registo bullEstrutura da relaccedilatildeo entre os fornecedores de informaccedilatildeo e os utilizadores

Conteuacutedo da poliacutetica (input)

bullUsos dos dados publicados bullRiscos da publicaccedilatildeo de dados bullBenefiacutecios da publicaccedilatildeo de dados

Indicadores de desempenho (output)

Valor puacuteblico alcanccedilado (impacto)

68

segundo Sasse et al (2017) as meacutetricas devem ser integradas num contexto mais vasto para que possam conduzir agrave tomada de decisatildeo e agrave formulaccedilatildeo de poliacuteticas

Entre as iniciativas de Open Data ao niacutevel global a disponibilizaccedilatildeo aberta de dados eacute normalmente feita atraveacutes de cataacutelogos e portais de dados centralizados disponibilizando um ponto de acesso uacutenico aos utilizadores e atraveacutes dos quais se pode inferir o impacto das poliacuteticas de Open Data atraveacutes do regime de abertura dos datasets disponibilizados O DataCatalogs52 agrega os portais de DGA espalhados pelo mundo inteiro contabilizando 520 portais em Dezembro de 2016 sendo 197 localizados na Europa e apenas 5 em Portugal53 cenaacuterio que nos parece extremamente desatualizado tendo em conta os resultados obtidos no Quadro 5

O Open Data Barometer coleta informaccedilatildeo sobre a abertura de dados classificando os paiacuteses conforme o niacutevel de preparaccedilatildeo de poliacuteticas de Open Data a sua respetiva implementaccedilatildeo e tambeacutem o impacto causado por esta abertura oferecendo uma visatildeo global daquilo que eacute o estado de abertura dos dados governamentais A quarta ediccedilatildeo do Open Data Barometer revela algumas conclusotildees preocupantes a niacutevel da abertura dos dados governamentais A disponibilidade de dados que cumprem todos os princiacutepios de abertura caiu dos 10 para 7 e a legibilidade por maacutequina tambeacutem tem tendecircncia negativa Apenas se registou uma melhoria no licenciamento de dados A World Wide Web Foundation (2017) listou ainda um conjunto de problemas na disponibilizaccedilatildeo de Dados Abertos

Foi avaliado que nove em cada dez conjuntos de dados natildeo estatildeo abertos sendo que a recomendaccedilatildeo eacute que estes sejam abertos por princiacutepio

Os dados governamentais satildeo normalmente incompletos e de baixa qualidade A World Wide Web Foundation recomenda a descentralizaccedilatildeo da abertura de dados por todas as agecircncias e departamentos governamentais

A vontade poliacutetica eacute aquilo que distingue o sucesso do insucesso da abertura de dados ldquoGovernments must adopt the Open Data Charter to ensure open data practices are embedded beyond political mandatesrdquo (World Wide Web Foundation 201717)

Os governos natildeo estatildeo a publicar os dados necessaacuterios para restaurar a confianccedila dos cidadatildeos A recomendaccedilatildeo eacute que os governos devem consultar os cidadatildeos e intermediaacuterios para saber que dados devem ser considerados prioritaacuterios

Poucas iniciativas de Dados Abertos realmente promovem a igualdade e a inclusatildeo ldquoGovernments must invest in using open data to improve the lives of marginalised groupsrdquo (World Wide Web Foundation 201721)

52 Disponiacutevel na WWW httpdatacatalogsorg 53 Os portais indexados pelo DataCatalogs satildeo OneStopTransport iGEO Central de Dados Dadosgovpt Despesa Puacuteblica Portugal

69

O Open Data Maturity Model da ODI (201511) fornece uma estrutura para avaliar como as praacuteticas de abertura de dados tecircm impacto nas organizaccedilotildees nomeadamente como os dados satildeo publicados como satildeo geridos e valorizados Este modelo eacute baseado em cinco temas que representam uma vasta aacuterea de atividades

Processos de gestatildeo de dados identificaccedilatildeo dos processos de gestatildeo e publicaccedilatildeo de dados incluindo o controlo de qualidade fluxos de trabalho e adoccedilatildeo de padrotildees teacutecnicos Conhecimentos e habilidades delimitaccedilatildeo dos passos necessaacuterios para criar ldquoa culture of open data within an organizationrdquo identificando a necessaacuteria partilha de conhecimento treino e aprendizagem para entender os benefiacutecios da abertura Apoio e envolvimento do cliente foca a necessidade das organizaccedilotildees de se envolver com as fontes de dados e com os reutilizadores de dados de modo a poder fornecer apoio e obter respostas para tornar a abertura de dados bem-sucedida Investimento e desempenho financeiro cobre a necessidade da organizaccedilatildeo em ter uma visatildeo do valor dos seus dados e do orccedilamento necessaacuterio para suportar a sua publicaccedilatildeo Em termos de consumo de dados as organizaccedilotildees devem entender os custos e o valor associado agrave reutilizaccedilatildeo de dados provenientes de outras fontes Visatildeo estrateacutegica sublinha a necessidade de a organizaccedilatildeo adotar uma estrateacutegia clara sobre a partilha e reutilizaccedilatildeo de dados e nomear uma lideranccedila reconhecida com responsabilidade e capacidade para executar a estrateacutegia (ODI 2015 traduccedilatildeo livre)

A W3C publicou em Janeiro de 2017 como recomendaccedilatildeo uma lista de boas praacuteticas para a publicaccedilatildeo e partilha de dados denominada Data on the Web Best Practices Estas praacuteticas cobrem questotildees como o fornecimento de metadados descritivos e estruturais licenciamento arquivamento enriquecimento e republicaccedilatildeo de dados (W3C 2017) Cada uma das praacuteticas estaacute classificada de acordo com os seus benefiacutecios definidos em oito categorias reutilizaccedilatildeo compreensatildeo conexatildeo a outros dados pesquisabilidade confianccedila acesso interoperabilidade e processamento (W3C 2017) Esta lista de boas praacuteticas eacute complementada por dois vocabulaacuterios controlados um para o uso de datasets54 e outro para a qualidade dos dados55 (W3C 2017)

ldquoUma cidade inteligente eacute conhecedora das suas capacidades do seu territoacuterio e dos seus recursos devendo ser capaz de transformar o seu papel de fornecedor de dados em catalisadora de processos de inovaccedilatildeordquo (Soares Baptista e Lima 2015) A disponibilizaccedilatildeo de dados locais permite aos cidadatildeos acompanharem as decisotildees do setor puacuteblico relativas a despesas aumentando a transparecircncia e estimulando a democracia Contudo eacute necessaacuterio que as cidades desenvolvam uma infraestrutura correta que permita processar e integrar a gestatildeo de dados em diversos serviccedilos

54 Disponiacutevel na WWW httpswwww3orgTRvocab-duv 55 Disponiacutevel na WWW httpswwww3orgTRvocab-dqv

70

criando ainda um sistema de gestatildeo que facilite o armazenamento e publicaccedilatildeo de dados (Carrara et al 2016b) A Sunlight Foundation (2013) desenvolveu o Public Policy for Public Data um guia para ajudar as cidades a desenvolver e implementar poliacuteticas puacuteblicas de Dados Abertos desde as razotildees para a abertura passando pelos objetivos e implementaccedilatildeo ateacute agrave promoccedilatildeo da poliacutetica

De forma a sistematizar as iniciativas de Dados Abertos e melhorar a sua gestatildeo foi publicada em Espanha a UNE 1783012015 Ciudades Inteligentes Datos Abiertos permitindo avaliar a maturidade da publicaccedilatildeo de Dados Abertos das cidades inteligentes atraveacutes de meacutetricas e indicadores Esta norma define cinco grandes domiacutenios associados aos Dados Abertos (estrateacutegico legal organizacional teacutecnico econoacutemico-social) fornecendo ainda vocabulaacuterios concretos para a publicaccedilatildeo de dados (Asociacioacuten Espantildeola de Normalizacioacuten y Certificacioacuten 2015)

O World Council on City Data56 eacute uma das organizaccedilotildees envolvidas na promoccedilatildeo das smart cities e da criaccedilatildeo de padrotildees para os dados provenientes das cidades Em 2014 foi publicada a norma internacional ISO 37120 com o tiacutetulo ldquoSustainable development of communities -- Indicators for city services and quality of liferdquo incluindo 100 indicadores que medem indicadores sociais econoacutemicos e ambientais Estes indicadores estatildeo divididos em 17 categorias de dados economia educaccedilatildeo energia ambiente financcedilas governaccedilatildeo fogo e emergecircncias respostas sauacutede recreaccedilatildeo seguranccedila abrigos desperdiacutecios soacutelidos telecomunicaccedilotildees e inovaccedilatildeo transportes planeamento urbano desperdiacutecio de aacutegua e aacutegua e saneamento (Carrara et al 2016b) O World Council on City Data (2016) permite comparar a abertura de dados em diferentes cidades utilizando os indicadores da ISO 3720 Em termos de cidades listadas pelo mapa desta organizaccedilatildeo o Porto eacute o uacutenico representante portuguecircs destacando-se a sauacutede e transportes como aacutereas com maior abertura

21 Poliacuteticas Macro

A promessa de uma ciecircncia orientada a dados ldquohas renewed the vigour of policy efforts to catalyse innovationrdquo (Whyte amp Donnely 20161) No acircmbito da abertura de dados estatildeo a ser desenvolvidas poliacuteticas por governos agecircncias de financiamento e editoras cientiacuteficas57 que assegurem que os dados de investigaccedilatildeo estejam disponiacuteveis em repositoacuterios puacuteblicos A EU tem desempenhado uma dupla funccedilatildeo na abertura de dados cientiacuteficos ao requerer a abertura de dados nos seus programas de investimento e ao coordenar a implementaccedilatildeo de praacuteticas de abertura de dados nos

56 Disponiacutevel na WWW httpwwwdataforcitiesorg 57 O Open Acess Directory possui uma lista ainda em desenvolvimento com as revistas cientiacuteficas que implementaram uma poliacutetica de Dados Abertos Disponiacutevel na WWW httpoadsimmonseduoadwikiJournal_open-data_policies

71

estados membros (ERAC 2016) As agecircncias de financiamento58 tecircm vindo paulatinamente a definir poliacuteticas de AA que exigem a garantia que os dados de investigaccedilatildeo subjacentes agrave publicaccedilatildeo textual satildeo depositados em repositoacuterios adequados de forma a permitir a verificaccedilatildeo dos resultados de investigaccedilatildeo e futuros uso e interpretaccedilotildees (UNESCO 2015) O raacutepido desenvolvimento da abertura e gestatildeo de dados cientiacuteficos nos EUA e no Reino Unido satildeo resultados de mandatos dos financiadores como o Research Council United Kingdom National Science Foundation e da National Institutes of Health (RECODE 2014) As instituiccedilotildees de financiamento reconhecem a dificuldade na mudanccedila da cultura de partilha de dados sendo que a tendecircncia deveraacute passar por aumentar os niacuteveis de monotorizaccedilatildeo das poliacuteticas como a monotorizaccedilatildeo dos DMPrsquos auditorias institucionais monotorizaccedilatildeo de resultados produzidos e recompensas para o apoio na gestatildeo de dados (Whyte e Donnally 2016)

Em 2010 a Comissatildeo Europeia desenhou uma visatildeo que tinha por objetivo o desenvolvimento de uma e-infraestrutura cientiacutefica que potenciasse o acesso uso e reuacuteso bem como a qualidade dos dados dando o impulso para a EU formular poliacuteticas para a construccedilatildeo da infraestrutura de investigaccedilatildeo dentro do enquadramento da agenda digital Foca-se na infraestrutura necessaacuteria para a gestatildeo de dados cientiacuteficos e identifica os benefiacutecios de acelerar o desenvolvimento de uma completa e funcional infraestrutura para os dados cientiacuteficos O relatoacuterio faz seis recomendaccedilotildees destacando-se o papel governamental no desenvolvimento e uso de novas maneiras de medir o valor dos dados a necessidade de recompensar os que contribuem para tal treinar uma nova geraccedilatildeo de cientistas de dados e fomentar o entendimento puacuteblico (Comissatildeo Europeia Grupo de peritos de alto niacutevel em dados de investigaccedilatildeo 2010) No mesmo documento a Comissatildeo Europeia salienta que existem desafios que satildeo necessaacuterios superar na construccedilatildeo da e-infraestrutura estando estes ao niacutevel da coleta qualidade usabilidade interoperabilidade diversidade seguranccedila dos dados educaccedilatildeo e treino publicaccedilatildeo e acesso de dados exploraccedilatildeo comercial preservaccedilatildeo e sustentabilidade e novos paradigmas sociais

Em 2011 a Comissatildeo Europeia emitiu a COM (2011) 882 onde declara que a abertura de dados cientiacuteficos eacute vital para a Europa pelo seu poder de promover negoacutecios e oportunidades econoacutemicas resolver problemas da sociedade e acelerar o progresso cientiacutefico sendo necessaacuterio atuar a niacutevel local regional nacional e a niacutevel europeu (Comissatildeo Europeia 2011)

A recomendaccedilatildeo da Comissatildeo Europeia sobre o acesso agrave informaccedilatildeo cientiacutefica e a sua preservaccedilatildeo (2012417UE) pede aos Estados Membros que desenvolvam poliacuteticas e estrateacutegias que assegurem o AA a publicaccedilotildees e dados de investigaccedilatildeo provenientes

58 A Universidade de Cambridge apresenta uma lista com as 18 entidades financiadoras a niacutevel internacional que possuem poliacuteticas de Dados Abertos Disponiacutevel na WWW httpwwwdatacamacukfunders

72

de financiamento puacuteblico Estas poliacuteticas devem prever os objetivos e os indicadores de avaliaccedilatildeo o plano de execuccedilatildeo e o plano financeiro garantindo que os dados resultantes de financiamento puacuteblico sejam acessiacuteveis e reutilizaacuteveis ldquothrough digital e-infrastructuresrdquo e sejam facilmente identificados e ligados a outros conjuntos de dados As instituiccedilotildees nacionais devem promover a poliacutetica nacional atraveacutes de mecanismos que permitam e recompensem ldquothe sharing of research datardquo (EUR-Lex 201241-42) A poliacutetica instaurada em 2015 pela Comissatildeo Europeia denominada Digital Single Market propocircs a implementaccedilatildeo de uma ldquocopyright exception that would permit researchers to analyse on a large scale scientific data to which they have lawful accessrdquo (Comissatildeo Europeia 2016b) Esta exceccedilatildeo iraacute permitir que os investigadores europeus usem meacutetodos de ldquoText e Data Miningrdquo para analisar e extrair conhecimento de grandes quantidades de informaccedilatildeo atraveacutes de teacutecnicas computacionais (Comissatildeo Europeia 2016a51) Atraveacutes da implementaccedilatildeo deste Digital Single Market a EU tem envidado esforccedilos para desenvolver uma economia baseada em dados Esta economia de dados caracteriza-se por um ldquoecossistema de diferentes tipos de intervenientes no mercado como fabricantes investigadores e fornecedores de infraestruturas que colaboram para garantir que os dados satildeo acessiacuteveis e utilizaacuteveisrdquo Deste modo os intervenientes do mercado podem retirar valor desses dados ldquoatraveacutes da criaccedilatildeo de um leque de aplicaccedilotildees com um grande potencial de melhoria da vida quotidianardquo (Comissatildeo Europeia 2017c)

Com a ambiccedilatildeo de tornar a Europa liacuteder mundial numa economia baseada em dados a Comissatildeo Europeia (2016c) pretende ldquodisponibilizar serviccedilos baseados na computaccedilatildeo em nuvem e infraestruturas de dados de craveira mundialrdquo que forneccedilam vantagens competitivas a investigadores empresaacuterios e instituiccedilotildees puacuteblicas baseadas na utilizaccedilatildeo de grandes volumes de dados Neste sentido foram delineadas quatro metas a cumprir ateacute 2020 (Comissatildeo Europeia 2016d)

ldquoA partir de 2016 Criaccedilatildeo de uma nuvem europeia para a ciecircncia aberta destinada aos investigadores europeus e seus colaboradores cientiacuteficosrdquo A estrateacutegia definida inclui a ldquointegraccedilatildeo e consolidaccedilatildeo das plataformas de infraestruturas eletroacutenicas da agregaccedilatildeo das atuais nuvens cientiacuteficas e infraestruturas de investigaccedilatildeordquo e tambeacutem o apoio agrave criaccedilatildeo de ldquoserviccedilos baseados na computaccedilatildeo em nuvemrdquo

2017 Definiccedilatildeo de abertura por princiacutepio de todos os dados cientiacuteficos gerados em futuros projetos financiados pelo quadro atual de financiamento (H2020) para garantir a reutilizaccedilatildeo do volume massivo de dados produzidos pela comunidade cientiacutefica

2018 Lanccedilamento de uma iniciativa para acelerar o desenvolvimento de ldquotecnologias quacircnticas que estatildeo na base da proacutexima geraccedilatildeo de supercomputadoresrdquo

73

Ateacute 2020 desenvolvimento e implantaccedilatildeo em larga escala de uma infraestrutura europeia de computaccedilatildeo de alto desempenho armazenamento de dados e redesrdquo onde se destaca a ldquocriaccedilatildeo de um centro europeu de grandes volumes de dadosrdquo e a melhoria do GEANT59 ldquoa rede de base de investigaccedilatildeo e inovaccedilatildeordquo

A aposta na criaccedilatildeo de poliacuteticas de abertura de dados de acordo com os objetivos europeus relativamente agrave CA reflete-se no atual programa de financiamento da investigaccedilatildeo e inovaccedilatildeo da EU o Horizonte 2020 (H2020) Este programa criou um projeto-piloto de dados abertos com o objetivo de maximizar o acesso e reutilizaccedilatildeo de dados de investigaccedilatildeo nas aacutereas cientiacuteficas selecionadas60 embora todas as outras aacutereas sejam convidadas a participar (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016a) Sob o artigo 293 do Model Grant Agreement o projeto-piloto de abertura de dados requer o depoacutesito num repositoacuterio de AA de todos os dados e metadados associados que sejam subjacentes aos resultados finais da investigaccedilatildeo permitindo assim o seu acesso exploraccedilatildeo por maacutequina reproduccedilatildeo e disseminaccedilatildeo sem custos para os utilizadores Os investigadores devem fornecer informaccedilatildeo sobre as ferramentas e instrumentos necessaacuterios para validar os resultados Aos participantes em projetos financiados por fundos europeus eacute exigido a elaboraccedilatildeo de um DMP uma ferramenta para a gestatildeo publicaccedilatildeo e reutilizaccedilatildeo de dados permitindo descrever os conjuntos de dados gerados no processo de investigaccedilatildeo e como e quando seratildeo publicados A gestatildeo de dados deve ser efetuada segundo os princiacutepios FAIR tornando os dados faacuteceis de encontrar acessiacuteveis interoperaacuteveis e reutilizaacuteveis (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016c)

Com a extensatildeo do projeto-piloto a todas as aacutereas de investigaccedilatildeo financiadas a abertura de dados de investigaccedilatildeo passou a ser a norma por princiacutepio Poreacutem existe a opccedilatildeo de natildeo participaccedilatildeo (Comissatildeo Europeia 2017b) tendo sido implementado o lema ldquoas open as possible as closed as necessaryrdquo (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016b8) O opt out ou as exceccedilotildees de natildeo participaccedilatildeo podem ser exercidas em caso de incompatibilidade com a obrigaccedilatildeo de proteger resultados com razotildees de seguranccedila com regras de proteccedilatildeo de dados pessoais pelo fato de o objetivo do projeto ser colocado em causa de o projeto natildeo gerar ou coletar dados e ainda outras razotildees legiacutetimas que possam ser apresentadas (Comissatildeo Europeia 2017b)

59 O GEacuteANT eacute um elemento fundamental na infraestrutura europeia fornecendo uma rede para a criaccedilatildeo de investigaccedilatildeo educaccedilatildeo inovaccedilatildeo e perfeiccedilatildeo cientiacutefica Disponiacutevel na WWW httpswwwgeantorgAbout 60 As aacutereas cientiacuteficas selecionadas satildeo Tecnologias emergentes e futuras infraestruturas de investigaccedilatildeo lideranccedila na melhoria de tecnologias industriais (tenologias de informaccedilatildeo e comunicaccedilatildeo) nano e biotecnologias seguranccedila alimentar sustentabilidade de recursos agriacutecolas marinhos e mariacutetimos ambiente e eficiecircncia de recursos sociedades inovadoras e inclusivas ciecircncia de e para a sociedade e cidades inteligentes

74

A abertura dos dados de investigaccedilatildeo criados com financiamento puacuteblico conta com o apoio dos projetos do OpenAIRE+ e do OpenAIRE-Connect visam estimular a abertura de dados funcionando ldquoas a knowledge bank and Open Access web-portalrdquo (ERAC 201667) O portal do OpenAIRE agrega em Maio de 2017 um total de 46238 conjuntos de dados sendo que Portugal contribui com 1968 datasets distribuiacutedos por quatro entidades embora o Instituto Politeacutecnico de Castelo Branco seja o fornecedor de mais de 95 dos dados

O projeto EUDAT financiado pelo H2020 visa fornecer uma infraestrutura de dados colaborativa aos investigadores europeus de qualquer disciplina cientiacutefica onde possam preservar pesquisar aceder e processar dados como parte da EUDAT Collaborative Data Infrastructure uma rede de colaboraccedilatildeo e centros de cooperaccedilatildeo O EUDAT fornece acesso a sete serviccedilos diferentes relativos agrave gestatildeo de dados (EUDAT[a]) Atraveacutes do serviccedilo B2FIND61 eacute possiacutevel pesquisar os dados armazenados atraveacutes do serviccedilo B2SHARE62 verificando-se a existecircncia de 484795 conjuntos de dados (EUDAT[b])

Vaacuterios programas de abertura de dados governamentais foram lanccedilados em diversos paiacuteses e sistemas poliacuteticos tendo-se expandido tambeacutem ao niacutevel subnacional e local sendo que estes programas compreendem diretivas regras e praacuteticas com aplicaccedilatildeo em todos ou na maior parte dos setores do governo (Dawes Vidiasova amp Parkhimovich 2016) Estas iniciativas satildeo idecircnticas numa primeira anaacutelise atraveacutes da construccedilatildeo de um portal na seleccedilatildeo de datasets semelhantes sendo que tambeacutem recorrem aos mesmos tipos de eventos como os hackathons para preparar e divulgar o lanccedilamento de programas de DGA (Davies 2014) Contudo estas iniciativas diferem no seu estado de maturaccedilatildeo estruturas poliacuteticas e as suas prioridades puacuteblicas (Davies 2014) e nos princiacutepios de abertura na quantidade e tipos de dados publicados nos metadados fornecidos e no apoio agrave reutilizaccedilatildeo de dados (Zuiderwijk amp Janssen 2014) De facto uma simples comparaccedilatildeo dos vaacuterios iacutendices de avaliaccedilatildeo permitiraacute perceber os diferentes niacuteveis de maturidade das poliacuteticas de Dados Abertos e a niacutevel europeu e mundial

Os Dados Abertos estatildeo na agenda europeia haacute mais de uma deacutecada tendo o primeiro passo sido dado em 2003 com a publicaccedilatildeo da Diretiva 200398EC sobre a reutilizaccedilatildeo da PSI (EUR-Lex 2003a) e da Diretiva 20034CE relativa ao acesso puacuteblico agrave informaccedilatildeo ambiental (EUR-Lex 2003b) Esta Diretiva aplica-se agrave reutilizaccedilatildeo dos documentos detidos pelo setor puacuteblico poreacutem natildeo obriga os estados membros a publicar dados do setor puacuteblico para estimular o mercado da informaccedilatildeo apenas os aconselha a tornar disponiacuteveis nem impotildee nenhuma obrigaccedilatildeo de autorizaccedilatildeo de reutilizaccedilatildeo dos dados (Janssen 2011) Janssen (2011) sublinha que apesar do sucesso

61 Disponiacutevel na WWW httpb2findeudateudatasetq= 62 Disponiacutevel na WWW httpsb2shareeudateu

75

da abertura dos dados governamentais ter a contribuiccedilatildeo da Diretiva Europeia as iniciativas mais bem-sucedidas referem-se a princiacutepios de transparecircncia e prestaccedilatildeo de contas e natildeo agrave Diretiva em si

A EU adotou ainda uma estrutura compreensiva para o acesso e reutilizaccedilatildeo de informaccedilatildeo geoespacial incluindo as infraestruturas eletroacutenicas atraveacutes da INSPIRE Directive63 e fomentou a disseminaccedilatildeo do patrimoacutenio cultural atraveacutes da Europeana ldquothe European digital library for cultural objectsrdquo e o acesso a informaccedilatildeo ambientalrdquo (Comissatildeo Europeia 20132)

A Diretiva 2011833EU sobre a reutilizaccedilatildeo de documentos publicados pela Comissatildeo Europeia veio autorizar salvo nas exceccedilotildees previstas a utilizaccedilatildeo comercial e natildeo comercial sem custos e sem necessidade de pedido da informaccedilatildeo produzida pela EU ou em seu nome (EUR-Lex 2011) A Diretiva estabelece as condiccedilotildees de reutilizaccedilatildeo formatos em que os documentos devem ser disponibilizados regras de custos transparecircncia e natildeo discriminaccedilatildeo

A Diretiva 201337EU veio reformular a autorizaccedilatildeo da reutilizaccedilatildeo da PSI A nova diretiva requer que a informaccedilatildeo puacuteblica seja disponibilizada ldquothrough open and machine-readable formats and together with their metadata at the best level of precision and granularity in a format that ensures interoperabilityrdquo incluindo agora entidades como bibliotecas arquivos e museus na esfera da abertura de dados (EUR-Lex 20133) Esta diretiva tornou obrigatoacuteria a disponibilizaccedilatildeo de informaccedilatildeo proveniente das entidades puacuteblicas para reutilizaccedilatildeo ao custo de reproduccedilatildeo de preferecircncia num portal e sob licenccedilas de formatos digitais O artigo 9ordm sublinha que os Estados-Membros devem fornecer instrumentos que facilitem a pesquisa de dados como inventaacuterios dos documentos com os respetivos metadados disponibilizando-os se possiacutevel em linha em formato legiacutevel por maacutequina bem como a ligaccedilatildeo entre o portal e o inventaacuterio Os objetivos passam por estimular o desenvolvimento de um mercado europeu de serviccedilos baseados na PSI melhorar o uso e aplicaccedilatildeo da PSI nos processos de negoacutecio fortalecer a competitividade no mercado interno e para resolver divergecircncias sobre regras de reutilizaccedilatildeo entre Estados Membros

De forma a promover a abertura dos seus proacuteprios dados em Junho de 2013 a EU adotou os princiacutepios do G8 Open Data Charter comprometendo-se a

Identificar e tornar disponiacuteveis os datasets fundamentais ao niacutevel da EU Identificar e tornar disponiacuteveis os datasets de alto valor ao niacutevel da EU Publicar os dados no EU Open Data Portal

63A INSPIRE Directive eacute a Diretiva 20072EC do Parlamento Europeu e do Conselho de 14 Marccedilo 2007 que veio estabelecer uma Infraestrutura para a informaccedilatildeo espacial na Comunidade Europeia Disponiacutevel na WWW httpinspireeceuropaeuinspire-legislation26

76

Aplicar os princiacutepios do G8 Open Data Charter em todos os 28 estados-membros atraveacutes da revisatildeo da Diretiva sobre a PSI e de guias de orientaccedilatildeo

Apoiar atividades consultadoria e a participaccedilatildeo Partilhar experiecircncias na aacuterea dos Dados Abertos (Comissatildeo Europeia 2013)

Em 2016 entrou em vigor o novo Regulamento Geral sobre a Proteccedilatildeo de Dados que eacute relativo ao tratamento de dados pessoais e agrave livre circulaccedilatildeo dos mesmos O regulamente veio implementar o direito de pedido de esquecimento por parte do cidadatildeo a portabilidade de dados que permite migrar dados pessoais entre sistemas ou empresas multas para os incumpridores entre outras novidades A implementaccedilatildeo do regulamento seraacute obrigatoacuteria ateacute maio de 2018 sendo as legislaccedilotildees nacionais substituiacutedas por uma regulamentaccedilatildeo europeia (EUR-Lex 2016)

A EU criou em 2012 um portal para alojar dados puacuteblicos e de investigaccedilatildeo que provecircm de organizaccedilotildees europeias ou de projetos financiados pela EU O European Union Data Portal aloja dados afetos a vinte categorias contendo 10746 datasets em Maio de 2017 com o Eurostat a assumir a lideranccedila destacada em termos de nuacutemero de datasets Os dados satildeo classificados em domiacutenios com o recurso a metadados controlados provenientes de vocabulaacuterios controlados como o EuroVoc64 com a ciecircncia (1906) emprego e condiccedilotildees de trabalho (1795) questotildees sociais (1599) a destacarem-se como os domiacutenios com mais datasets publicados Em termos de formatos de dados os primeiros trecircs lugares satildeo ocupados pelos formatos ZIP (8072) HTML (7024) e texttab-separated-values (6762) O primeiro formato estruturado o XML aparece apenas em quinto lugar com 595 ficheiros seguido do primeiro formato aberto o CSV com apenas 360 (Uniatildeo Europeia 2017) Eacute importante tecer duas consideraccedilotildees sobre os formatos dos datasets disponibilizados O formato ZIP eacute um formato de compressatildeo de documentos e natildeo um formato de documento em si portanto estes 8072 ficheiros deveratildeo ser distribuiacutedos por outros tipos de formatos Em segundo lugar verifica-se uma fraca percentagem de dados a utilizarem formatos estruturados eou abertos que permitam a ligaccedilatildeo com outros dados Este portal apresenta 2663 datasets com ligaccedilatildeo a Portugal em grande parte das categorias de Ciecircncia e do Ambiente (Uniatildeo Europeia 2017)

O Public Sector Information Scoreboard eacute uma ferramenta ldquocrowd sourcedrdquo utilizada para medir o estado da abertura de dados e da PSI da EU Este painel de avaliaccedilatildeo atraveacutes do uso de 27 indicadores mede sete aspetos da reutilizaccedilatildeo da informaccedilatildeo puacuteblica implementaccedilatildeo da Diretiva europeia referente agrave PSI praacuteticas de reuacuteso preccedilo formatos acordos exclusivos informaccedilatildeo puacuteblica local e por fim eventos e atividades (ePSI Scoreboard 2013)

64 O EuroVoc eacute um vocabulaacuterio controlado multilingue e pluridisciplinar sobre as atividades da EU Disponiacutevel na WWW httpeurovoceuropaeudrupalq=pt

77

O Open Data Monitor um projeto financiado pela Comissatildeo Europeia que decorreu entre 2013 e 2015 teve por objetivo a extraccedilatildeo harmonizaccedilatildeo mediccedilatildeo e monitorizaccedilatildeo anaacutelise e visualizaccedilatildeo automaacutetica de metadados dos datasets disponibilizados nos cataacutelogos a niacutevel regional nacional e europeu (Sasse et al 2017) Os datasets ldquoharvested from portals across Europerdquo (Sasse et al 201759) satildeo estudados atraveacutes de meacutetricas quantitativas e qualitativas (Open Data Monitor 2015) A sua plataforma permite que os utilizadores tenham uma visatildeo dos conjuntos de dados e dos 173 cataacutelogos de dados identificados apresentando os resultados em termos do nuacutemero de datasets existentes tamanho de armazenamento a sua disponibilidade a posse de uma licenccedila aberta o uso por maacutequina e por fim a exaustividade dos metadados (Open Data Monitor 2015)

O European Data Portal uma plataforma criada em 2015 pela EU tem por objetivo melhorar a acessibilidade e aumentar o valor dos Dados Abertos abrangendo toda a cadeia de valor desde a publicaccedilatildeo de dados ateacute agrave sua reutilizaccedilatildeo Para isso coleta metadados da PSI disponiacutevel em portais de dados nos paiacuteses europeus incluindo a informaccedilatildeo sobre a disponibilizaccedilatildeo de dados e os benefiacutecios de reutilizaccedilatildeo fornecendo ainda aacutereas dedicadas agrave pesquisa de datasets disponibilizaccedilatildeo de dados uso de dados treino e biblioteca de dados (Carrara et al 2016a Carrara Nieuwenhuis amp Vollers 2016 Sasse et al 2017) O European Data Portal criou o Open Data Maturity para avaliar o desenvolvimento de poliacuteticas nacionais e portais na Europa usando a informaccedilatildeo coletada para elaborar um iacutendice de maturidade das poliacuteticas de Open Data baseado na preparaccedilatildeo poliacutetica e na maturidade do portal de dados (Carrara Nieuwenhuis amp Vollers 2016) Em termos de preparaccedilatildeo poliacutetica eacute avaliada a presenccedila de uma poliacutetica de Dados Abertos especiacutefica normas de licenciamento extensatildeo da coordenaccedilatildeo a niacutevel nacional uso de dados e impacto poliacutetico social e econoacutemico A maturidade dos portais eacute avaliada de acordo com a sua usabilidade a reutilizaccedilatildeo dos dados alojados no portal e inclusatildeo de dados de diferentes domiacutenios Segundo a informaccedilatildeo apurada no relatoacuterio a maioria dos paiacuteses europeus ainda natildeo atingiram a maturidade por completo Em 2016 houve um aumento do nuacutemero de paiacuteses que completaram a sua demanda na abertura de dados sendo agora de 566 entre os 31 avaliados O nuacutemero de paiacuteses com uma poliacutetica de Dados Abertos estabelecida passou de 23 para 28 O uso de dados chegou em 2016 aos 493 e o impacto da abertura de dados aos 463 sendo que a maturidade dos portais estabeleceu-se nos 643 Contudo os paiacuteses necessitam de elevar o reconhecimento poliacutetico sobre os Dados Abertos aumentar os processos automatizados nos seus portais para aumentar a usabilidade e reutilizaccedilatildeo dos dados e tambeacutem organizar mais eventos e treinos para apoiar as iniciativas nacionais e locais (Carrara Nieuwenhuis amp Vollers 2016) O relatoacuterio conclui que os paiacuteses europeus estatildeo a enfrentar barreiras legais financeiras de qualidade de dados e de poliacuteticas sublinhando que os poliacuteticos natildeo conhecem os benefiacutecios da abertura de dados e que por isso os Dados Abertos natildeo satildeo estabelecidos como uma prioridade poliacutetica Satildeo

78

deixadas ainda algumas recomendaccedilotildees para ajudar os paiacuteses a avanccedilar no processo de abertura de dados implementar uma estrateacutegia de Dados Abertos que estimula a criaccedilatildeo de uma poliacutetica adicionar funcionalidades ao portal e melhorar a qualidade dos dados aumentar o reconhecimento sobre os Dados Abertos monitorizar as atividades relacionadas com o Open Data (Carrara Nieuwenhuis amp Vollers 2016)

22 O caso portuguecircs

O primeiro sinal de abertura cientiacutefica eacute dado pelo artigo 50ordm do Decreto-Lei nordm 1152013 de 7 de agosto veio regulamentar a obrigatoriedade da inclusatildeo de trabalhos acadeacutemicos no RCAAP sendo posteriormente reforccedilado com a entrada em vigor da Portaria nordm 2852015 de 15 de setembro que aprova o Regulamento Teacutecnico de Depoacutesito de Teses e Trabalhos de Doutoramento e de Dissertaccedilotildees e Trabalhos de Mestrado Os Dados Abertos entram finalmente na poliacutetica cientiacutefica portuguesa em 2014 A FCT definiu e adotou uma poliacutetica que visa encorajar e promover a disponibilizaccedilatildeo em ldquobases de dados de AA apropriadasrdquo dos dados cientiacuteficos e outros materiais de investigaccedilatildeo criados em projetos financiados pela instituiccedilatildeo (Fundaccedilatildeo para a Ciecircncia e Tecnologia [FCT] 2014) Contudo a poliacutetica da FCT ldquonatildeo estaacute alinhada com os requisitos relativamente aos dados de investigaccedilatildeo do H2020rdquo (Comissatildeo Executiva GT-PNCA 2016)

Os princiacutepios orientadores para uma poliacutetica nacional de Ciecircncia Aberta definidos em fevereiro de 2016 pelo Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior delinearam algumas metas a curto-prazo sendo que na componente dos Dados Abertos apenas se regista a sensibilizaccedilatildeo para a importacircncia da partilha de dados ldquocomo um valor essencial agrave ciecircncia especialmente no que respeita agrave investigaccedilatildeo beneficiaacuteria de financiamento puacuteblicordquo (Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior [MCTES] 20163) Foram tambeacutem definidas metas a atingir ateacute 2018 dentro das quais se destacam as que se referem a dados de investigaccedilatildeo

ldquoCumprimento a 100 da publicaccedilatildeo de dados resultantes de projetos com financiamento puacuteblico num repositoacuterio em acesso abertordquo

Incluir ldquoa verificaccedilatildeo contiacutenua da publicaccedilatildeo de dados e de resultados da investigaccedilatildeo financiada com fundos puacuteblicosrdquo nos modelos de avaliaccedilatildeo da CA

Eliminar o ldquoduplo financiamento de publicaccedilotildeesdados em acesso abertordquo para racionalizar os custos puacuteblicos com ciecircncia

ldquoOferta regular de accedilotildees de formaccedilatildeo e esclarecimento em mateacuteria de publicaccedilatildeo de dados e resultados de investigaccedilatildeo em acesso aberto propriedade intelectual e proteccedilatildeo de dadosrdquo (Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior [MCTES] 2016 20164)

79

O acesso aos dados de investigaccedilatildeo eacute finalmente incluiacutedo na poliacutetica cientiacutefica atraveacutes da Resoluccedilatildeo do Conselho de Ministros nordm 212016 de 11 de abril No acircmbito da definiccedilatildeo de uma poliacutetica de Ciecircncia Aberta eacute incluiacuteda a obrigatoriedade do AA aos ldquodados cientiacuteficos resultantes de investigaccedilatildeo financiada por fundos puacuteblicosrdquo e sua respetiva preservaccedilatildeo ldquopor forma a permitir a sua reutilizaccedilatildeo e o acesso continuadordquo (Resoluccedilatildeo do Conselho de Ministros nordm 212016 2016)

Em dezembro de 2016 foi criado o Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta (GT-PNCA) atraveacutes do Despacho nordm 153892016 cujo objetivo se centra na elaboraccedilatildeo de uma poliacutetica nacional de CA e onde a abertura de dados de investigaccedilatildeo eacute parte integrante A Comissatildeo Executiva do GT-PNCA foi dividida em quatro conjuntos de temas acesso aberto e dados abertos infraestruturas e preservaccedilatildeo digital avaliaccedilatildeo cientiacutefica e responsabilidade social cientiacutefica (Despacho nordm 153892016 de 12 de dezembro do Ministeacuterio das Financcedilas e da Secretaria de Estado da Cultura e Ciecircncia Tecnologia e Ensino Superior 2016)

A abertura de dados cientiacuteficos estaacute ainda numa fase precoce O primeiro relatoacuterio da Comissatildeo Executiva do Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta constatou que em termos de gestatildeo e partilha de dados existem algumas iniciativas e experiecircncias de ldquoacircmbito disciplinar nomeadamente no contexto de projetosrdquo sendo expectaacutevel que o Roteiro Nacional de Infraestruturas de Investigaccedilatildeo de Interesse Estrateacutegico traga ldquoprogressos significativosrdquo (Comissatildeo Executiva GT-PNCA 20167) O mesmo relatoacuterio sublinha que ao niacutevel das instituiccedilotildees de investigaccedilatildeo e de ensino superior as iniciativas de partilha e gestatildeo de dados satildeo quase inexistentes

Em termos de dados de investigaccedilatildeo o ecossistema eacute bem mais concentrado a niacutevel disciplinar e inferior em nuacutemero de e-infraestruturas se comparado com o ecossistema de dados do setor puacuteblico Integrado no projeto RCAAP que visa a agregaccedilatildeo de conteuacutedos cientiacuteficos produzidos no paiacutes surge em 2011 o Serviccedilo de Alojamento de Repositoacuterios de Dados Cientiacuteficos65 (SARDC) uma plataforma de livre acesso que visa agregar os dados de investigaccedilatildeo de instituiccedilotildees nacionais Poreacutem com jaacute cerca de seis anos de existecircncia o SARDC apresenta apenas 2007 datasets em Maio de 2017 que correspondem a 42 categorias de assunto Os conjuntos disponibilizados satildeo provenientes de apenas duas instituiccedilotildees o Arquivo Portuguecircs de Informaccedilatildeo Social (APIS) com 37 e o Instituto Politeacutecnico de Castelo Branco (IPCB) com 1970 conjuntos de dados sendo que o SARDC apenas aloja os dados do APIS Embora exista um espaccedilo atribuiacutedo a mais duas instituiccedilotildees o Laboratoacuterio Nacional de Engenharia Civil e Universidade Catoacutelica Portuguesa nenhuma das entidades publicou ateacute agora dados atraveacutes desta plataforma O portal nacional de dados cientiacuteficos eacute extremamente limitado em termos de funcionalidades permitindo apenas a buscar

65 Disponiacutevel na WWW httpsdadosrcaappt

80

por autor data titulo assunto e tipo de documento Natildeo eacute possiacutevel perceber a legalidade da reutilizaccedilatildeo de dados pois natildeo eacute referido qualquer tipo de licenciamento A qualidade dos dados apresentados pelo SARDC eacute uma incoacutegnita pela falta de indicaccedilatildeo do uso de formatos abertos e estruturados e tambeacutem de um esquema padratildeo de metadados Aleacutem do SARDC os repositoacuterios de dados cientiacuteficos existentes em Portugal satildeo em grande parte do domiacutenio das Ciecircncias da Vida como se poderaacute constatar no Quadro 5 com exceccedilatildeo do Repositoacuterio Cientiacutefico do Instituto Politeacutecnico de Castelo Branco que tem um caraacutecter geral Depois da criaccedilatildeo do repositoacuterio de dados cientiacuteficos e da colocaccedilatildeo em massa de conjuntos de dados verifica-se que o depoacutesito de datasets decresceu de forma extrema

Graacutefico 1 Nuacutemero de datasets publicados no SARDC nos anos seguintes agrave sua criaccedilatildeo Fonte Adaptado de SARDC (2017)

A tendecircncia de abertura de dados cientiacuteficos parece estar ligada agrave cultura disciplinar Algumas disciplinas provenientes das ciecircncias naturais e das ciecircncias exatas possuem jaacute uma estrutura uniformizada de bases de dados onde a partilha e reutilizaccedilatildeo de datasets se encontra mais avanccedilada do que se verifica nas restantes disciplinas cientiacuteficas O Registry of Research Data Repositories (re3data) indexa apenas 2 repositoacuterios de dados cientiacuteficos portugueses o INTEGRALL66 e o KiMoSys67 sendo que ambos pertencem ao ramo da biologia (DataCite 2017a) O Biosharingorg (2017) indexou cinco bases de dados cientiacuteficas com origem em Portugal havendo participaccedilatildeo portuguesa em outras duas bases de dados internacionais Estas pertencem todas ao domiacutenio das Ciecircncias da Vida e da Biologia com exceccedilatildeo de uma conotada com as Ciecircncias da Terra O DataCite68 (2017b) criou um Digital Object Identifier (DOI) para 18632 datasets relacionados com o termo Portugal sendo a grande maioria de autores portugueses e provenientes da Global Biodiversity Information Facility (GBIF) tambeacutem da aacuterea da biologia A GBIF possui um noacute

66 Disponiacutevel na WWW httpintegrallbiouapt 67 Disponiacutevel na WWW httpwwwkimosysorg 68 Os dados obtidos relativamente ao DataCite Pangea e GitHub foram obtidos atraveacutes da inscriccedilatildeo do termo Portugal na caixa de pesquisa de cada repositoacuterio

13

3 1

2 1

2012 2013 2014 2015 2016 0 2 4 6 8

10 12 14

Nordm datasets

81

portuguecircs que aloja 2681051 ocorrecircncias de biodiversidade com Portugal a fornecer de 23 conjuntos de dados que correspondem a 448136 ocorrecircncias (Portal de Dados de Biodiversidade de Portugal 2016) Destaca-se ainda os 2772 datasets sobre Portugal muitos criados por autores portugueses alojados no Pangea (2017) que preserva dados relacionados com as ciecircncias da terra e do ambiente ou o GitHub (2017) que armazena 1324 registos sobre software relacionados com o termo Portugal

Portugal tem um consoacutercio denominado ELIXIR Portugal69 que eacute constituiacutedo por quatro70 instituiccedilotildees de investigaccedilatildeo que satildeo parte da rede nacional de informaccedilatildeo bioloacutegica - BioDatapt71 O ELIXIR Portugal (2015) ldquoaims to provide data tools standards and training in this domain and thus contribute to build an ELIXIR framework that is of added-value to all woody plant based industriesrdquo O BioDatapt fornece acesso a duas bases de dados disciplinares uma ontologia para descrever experiecircncias bioloacutegicas baseadas em plantas 4 softwares e 5 conjuntos de dados

O interesse na abertura de dados de investigaccedilatildeo tem crescido no discurso poliacutetico e cientiacutefico verificando-se jaacute a organizaccedilatildeo de uma conferecircncia de dados de investigaccedilatildeo e CA72 em 2016 e de dois foacuteruns de gestatildeo de dados de investigaccedilatildeo73 o uacuteltimo jaacute em 2017 Estes eventos tecircm a chancela direta do MCTES em coorganizaccedilatildeo com a FCT a Universidade do Minho e FCCN embora esta uacuteltima apenas no caso da conferecircncia Foi lanccedilado na Faculdade de Engenharia da Universidade do Porto o projeto TAIL com o objetivo de otimizar o processo de gestatildeo de dados de investigaccedilatildeo desde a sua produccedilatildeo ateacute ao depoacutesito e partilha Este projeto a decorrer de 2016 ateacute 2019 ldquovai construir um portfoacutelio de exemplos de gestatildeo de dados em diversos domiacutenios que poderatildeo ser usados pelos investigadores para avaliar o esforccedilo requerido e as compensaccedilotildees a obter com esta atividaderdquo (Ribeiro et al 2016256-257) Os resultados seratildeo avaliados atraveacutes da utilizaccedilatildeo da plataforma Dendro ldquodesigned to help researchers use concepts from domain-specific ontologies to collaboratively describe and share datasets within their groupsrdquo (Universidade do Porto Faculdade de Engenharia 2017)

69 Este consoacutercio eacute o noacute portuguecircs de uma organizaccedilatildeo intergovernamental denominada ELIXIR que pretende reunir os recursos europeus relacionados com as ciecircncias da vida Os recursos incluem bases de dados software material de treino armazenamento na nuvem e supercomputadores Disponiacutevel na WWW httpswwwelixir-europeorgabout-us 70 As organizaccedilotildees envolvidas no BioDatapt satildeo Instituto Gulbenkian de Ciecircncia Universidade do Minho Instituto de Biologia Experimental e Tecnoloacutegica e o Instituto de Biotecnologia e Bioengenharia 71 O BioDatapt faz parte do Roteiro das Infraestruturas de Investigaccedilatildeo de Portugal Disponiacutevel na WWW httpswwwfctptapoiosequipamentoroteiro 72 A conferecircncia ldquoDados de investigaccedilatildeo e Ciecircncia Aberta rumo a uma estrateacutegia nacionalrdquo apresentou-se com o objetivo de ldquoestabelecer as linhas orientadoras da estrateacutegia nacional para os dados de investigaccedilatildeordquo Disponiacutevel na WWW httpsconfdadosrcaappt 73 O objetivo dos foacuteruns sobre gestatildeo de dados de investigaccedilatildeo eacute de desenvolver competecircncias teacutecnicas e capitalizar saberes e praacuteticas nos investigadores e comunidade cientiacutefica Disponiacutevel na WWW httpforumgdircaappt2forum

82

O RCAAP publicou em Abril de 2017 um documento de apoio agrave abertura e gestatildeo de dados de investigaccedilatildeo O ldquoKit de Dados de Investigaccedilatildeordquo tem por objetivo prestar apoio e informaccedilatildeo aos ldquogestores de repositoacuterios da comunidade RCAAPrdquo e fornecer ajuda semelhante a ldquoinvestigadores gestores de ciecircncia e outros parceiros envolvidos em atividades de suporte agrave gestatildeo de dados de investigaccedilatildeordquo (Carvalho Furtado Priacutencipe 20175) Este documento seraacute a base da formaccedilatildeo que o RCAAP iraacute disponibilizar fornecendo uma contextualizaccedilatildeo sobre Dados Abertos Big Data preservaccedilatildeo digital e informaccedilatildeo sobre ciclos de gestatildeo de dados planos de gestatildeo de dados direitos de autor licenciamento e privacidade de dados poliacuteticas e diretrizes de abertura de dados de investigaccedilatildeo recursos de apoio e aplicaccedilatildeo nos recursos RCAAP

Os dados do setor puacuteblico tecircm uma contextualizaccedilatildeo legislativa diferenciada daquela que eacute aplicada aos dados de investigaccedilatildeo O direito ao acesso agrave informaccedilatildeo puacuteblica em Portugal foi estabelecido pelo artigo 268ordm da Constituiccedilatildeo de 1976 Poreacutem apenas em 1993 o estado portuguecircs legislou no sentido da abertura dos documentos administrativos com a publicaccedilatildeo da Lei nordm 6593 de 26 de Agosto a Lei do Acesso aos Documentos Administrativos (LADA) posteriormente alterada pelas leis nordm 895 de 29 de Marccedilo e 9499 de 16 de Julho

A evoluccedilatildeo da conjuntura de acesso aos documentos administrativos eacute derivada da imposiccedilatildeo das Diretivas Europeias a que Portugal como membro da EU estaacute obrigado A Lei 462007 de 24 de Agosto viraacute revogar da Lei nordm 6593 e as suas alteraccedilotildees ldquotranspondo para a ordem juriacutedica nacional a Diretiva nordm 200398CE do Parlamento e do Conselho de 17 de Novembro relativa agrave reutilizaccedilatildeo de informaccedilotildees do sector puacuteblicordquo O artigo 24ordm postula a obrigaccedilatildeo das entidades puacuteblicas em publicar documentos administrativos de forma eletroacutenica para que possam ser acedidos e reutilizados O artigo 27ordm nordm 1 vem criar a Comissatildeo de Aceso aos Documentos Administrativos (CADA) ldquouma entidade administrativa independente que funciona junto da Assembleia da Repuacuteblica e tem como fim zelar nos termos da Lei pelo cumprimento das disposiccedilotildees legais referentes ao acesso agrave informaccedilatildeo administrativardquo (Comissatildeo de Acesso aos Documentos Administrativos [CADA])

A Resoluccedilatildeo do Conselho de Ministros nordm 912010 (20105296) veio implementar a Agenda Digital 2015 O ponto 23 da Resoluccedilatildeo no acircmbito da transparecircncia na administraccedilatildeo puacuteblica tinha como objetivo ldquodesenvolver um programa de administraccedilatildeo aberta para a publicaccedilatildeo e agregaccedilatildeo em formatos reutilizaacuteveis da informaccedilatildeo produzida pela Administraccedilatildeo Puacuteblicardquo Eacute neste sentido que eacute proposta a criaccedilatildeo do siacutetio web dadosgovpt ldquopara publicar e agregar a informaccedilatildeo produzida pela Administraccedilatildeo Puacuteblica em formatos que possam ser lidos e reutilizados por qualquer cidadatildeordquo Esta medida teve o intuito de ldquofacilitar o acesso dos cidadatildeos e empresas agrave informaccedilatildeo relevante sobre os serviccedilos puacuteblicos com o desenvolvimento de novas aplicaccedilotildees com valor acrescentadordquo A Lei nordm 362011 de 21 de Junho veio

83

estabelecer a implementaccedilatildeo de normas abertas nos sistemas informaacuteticos do Estado contribuindo assim para a adoccedilatildeo de formatos de dados abertos

Em 2016 a Lei nordm 262016 de 22 de Agosto revogou a Lei 462007 de 24 de Agosto aprovando ldquoo regime de acesso agrave informaccedilatildeo administrativa e ambiental e de reutilizaccedilatildeo dos documentos administrativos transpondo a Diretiva 20034CE do Parlamento Europeu e do Conselho de 28 de janeiro e a Diretiva 200398CE do Parlamento Europeu e do Conselho de 17 de novembrordquo O artigo 3ordm mandata a abertura dos dados ambientais agrave comunidade incluindo-os na definiccedilatildeo de documento administrativo devendo a sua publicaccedilatildeo ser feita num formato aberto e legiacutevel por maacutequina O artigo 10ordm sobre a divulgaccedilatildeo ativa de informaccedilatildeo prevecirc que sejam publicados ldquoos documentos administrativos dados ou listas que os inventariem que entendam disponibilizar livremente para acesso e reutilizaccedilatildeo nos termos da presente lei sem prejuiacutezo do regime legal de proteccedilatildeo de dados pessoaisrdquo Tambeacutem deve ser garantida a abertura da informaccedilatildeo cujo ldquoconhecimento seja relevante para garantir a transparecircncia da atividade relacionada com o seu funcionamentordquo sobretudo ao niacutevel de planos de atividades orccedilamentos relatoacuterios de atividades e contas balanccedilo social e outros instrumentos de gestatildeo similaresrdquo e tambeacutem de despachos normativos internos circulares e orientaccedilotildees que comportem enquadramento estrateacutegico da atividade administrativardquo (Lei nordm 262016 de 22 de Agosto 20162780) O artigo 23ordm apenas prevecirc a reutilizaccedilatildeo dos dados para fins educativos e para fins de investigaccedilatildeo e desenvolvimento deixando de lado a reutilizaccedilatildeo comercial Contudo o dadosgov atribuiu aos dados que aloja a licenccedila CC BY 30 o que natildeo impede a reutilizaccedilatildeo comercial dos dados Eacute tambeacutem impossiacutevel natildeo questionar a razatildeo de natildeo ter sido transposta a nova Diretiva 201337EU que veio revogar precisamente a Diretiva que a Lei nordm 262016 de 22 de Agosto implementa

A AMA (2016) defende que as poliacuteticas de Dados Abertos devem ldquoprivilegiar o interesse e pertinecircncia dos dados para o cidadatildeo em geral ou para setores da sociedade especiacuteficosrdquo Ao niacutevel local apenas Lisboa e Porto parecem ter definido uma poliacutetica de abertura de dados A Carta de Princiacutepios da Politica de Dados Abertos do Municiacutepio de Lisboa tem por objetivo aumentar o envolvimento dos cidadatildeos aumentar a transparecircncia e o desenvolvimento econoacutemico aleacutem da melhoria da eficiecircncia dos serviccedilos A Cacircmara Municipal de Lisboa (CML) (2016) compromete-se a atualizar ldquoanualmente a poliacutetica de disponibilizaccedilatildeo puacuteblica de dados abertos indicando quais os dados a libertar ao longo do ano e em que formatordquo A poliacutetica abrangeraacute todas as unidades orgacircnicas do municiacutepio que produzam dados sendo que a CML incentivaraacute as Juntas de Freguesia e as empresas municipais a publicarem os seus dados A publicaccedilatildeo de todos os dados eacute feita no portal do municiacutepio como ponto de acesso uacutenico estando disponiacuteveis sem qualquer pedido de registo A carta de princiacutepios sublinha que os dados devem ser atualizados legiacuteveis por maacutequina deter uma licenccedila aberta que permita a reutilizaccedilatildeo comercial e ainda respeitar as leis de

84

privacidade e seguranccedila A CML compromete-se a publicar inventaacuterios das coleccedilotildees de dados e a promover a reutilizaccedilatildeo de dados atraveacutes de iniciativas de estiacutemulo ao desenvolvimento de aplicaccedilotildees e participaccedilatildeo puacuteblica (Lisboa Cacircmara Municipal [CML] 2016)

A poliacutetica de Dados Abertos no Porto eacute enquadrada na Agenda Digital para a Europa tendo como visatildeo a ldquodisponibilizaccedilatildeo e uso de dados e informaccedilatildeo do Municiacutepio do Porto contribuindo deste modo para a competitividade do Municiacutepio do Porto e da regiatildeo para visitar para residir captar e realizar negoacutecios no mercado nacional e internacionalrdquo (Porto Cacircmara Municipal)

Utilizando a estrutura de avaliaccedilatildeo de poliacuteticas de Dados Abertos de Zuiderwijk e Janssen (2014) foi elaborado um quadro para avaliar o estado da implementaccedilatildeo da poliacutetica de Dados Abertos em Portugal e o seu impacto Os dados foram recolhidos com base na Lei nordm 262016 de 22 de Agosto na informaccedilatildeo disponiacutevel no portal de dados nacional atraveacutes de um gestor de projeto da AMA Andreacute Lapa e tambeacutem em alguma literatura

85

Quadro 3 Visatildeo geral sobre o contexto conteuacutedo e desempenho da poliacutetica de Dados Abertos em Portugal com base no esquema delineado por Zuiderwijk e Janssen (2014) Aspetos da poliacutetica de Dados Abertos Acircmbito de aplicaccedilatildeo

Conteuacutedo e ambiente da

poliacutetica

Paiacutes Portugal

Niacutevel de organizaccedilatildeo e tipo de missatildeo Poliacutetica nacional de cariz regulamentar que eacute aplicada a entidades governamentais e puacuteblicas (art 4ordm)

Motivaccedilotildees e objetivos Econoacutemica e poliacutetica via EU Facilitar o acesso e reutilizaccedilatildeo da informaccedilatildeo por parte dos cidadatildeos e garantir a transparecircncia da atividade administrativa (art 2ordm)

Lanccedilamento da plataforma de dados Lanccedilamento do portal nacional em 2011

Alocaccedilatildeo de recursos e contexto econoacutemico

Abertura alicerccedilada em duas instituiccedilotildees puacuteblicas a CADA responsaacutevel pelo cumprimento da lei e a AMA que fornece a e-infraestrutura e apoio teacutecnico Os custos de abertura de informaccedilatildeo do setor puacuteblico satildeo financiados pelo Plano Global Estrateacutegico para a racionalizaccedilatildeo de custos com as TIC na Administraccedilatildeo Puacuteblica (OECD 2015)

Legislaccedilatildeo Lei nordm 262016 de 22 de Agosto que transpotildee a Diretiva 200398CE

Contexto poliacutetico e social Cumprimento da Diretiva europeia Disponibilizaccedilatildeo de informaccedilatildeo uacutetil para o cidadatildeo

Aspetos da poliacutetica de Dados Abertos Acircmbito de aplicaccedilatildeo

Conteuacutedo da poliacutetica

Estrateacutegia e princiacutepios de abertura

Cumprimento do princiacutepio da administraccedilatildeo aberta que advoga que o acesso aos dados deve ser feito mediantes princiacutepios de igualdade da proporcionalidade da justiccedila da imparcialidade O acesso deve ser livre e universal bem como a acessibilidade a interoperabilidade a qualidade a integridade e a autenticidade dos dados publicados e ainda a sua identificaccedilatildeo e localizaccedilatildeo (art 2ordm) A publicaccedilatildeo de dados deve ser feita num formato aberto e legiacutevel por maacutequina (art 3ordm)

Medidas e instrumentos poliacuteticos Portal nacional Natildeo satildeo conhecidas meacutetricas de avaliaccedilatildeo nem multas ou recompensas

Processamento de dados antes da publicaccedilatildeo Validaccedilatildeo da integridade das tabelas Natildeo existe verificaccedilatildeo de metadados (Lapa 2017)

Quantidade de dados Abertos 802 Conjuntos de dados no portal nacional Mas a contabilidade eacute bastante mais elevada com a adiccedilatildeo dos dados alojados em outros portais puacuteblicos e privados

Temaacutetica dos Dados Abertos Diversa mas com maior incidecircncia na Economia e Financcedilas

Formas de apresentaccedilatildeo de dados Faacutecil acesso e compreensatildeo

Preccedilo do acesso Gratuito

Grupos-alvo Developers programadores jornalistas de dados investigadores acadeacutemicos administraccedilatildeo puacuteblica (central ou local) empresas e sociedade civil (Lapa 2017)

Padrotildees e formatos teacutecnicos Todos os dados no dadosgov estatildeo disponiacuteveis em pdf csv xlsx e atraveacutes de serviccedilos REST (que inclui formatos como odata JSON ou KML e RDF se aplicaacutevel) (Lapa 2017)

86

Aspetos da poliacutetica de Dados Abertos Acircmbito de aplicaccedilatildeo

Conteuacutedo da poliacutetica (cont)

Fornecimento de metadados Natildeo existe um esquema padratildeo de metadados a ser utilizado sendo que estes tambeacutem natildeo satildeo verificados antes da publicaccedilatildeo dos dados (Lapa 2017)

Tipos de dados natildeo publicados Desconhecido

Apoio teacutecnico para o uso de dados publicados Sim fornecido pela AMA mediante pedido

Promoccedilatildeo ativa da reutilizaccedilatildeo de dados A uacuteltima grande atividade de promoccedilatildeo de reutilizaccedilatildeo Government as a Developer ocorreu em 2014-2015 natildeo se conhecendo para novas atividades previstas (Lapa 2017)

Qualidade dos Dados A uacuteltima mediccedilatildeo data de 2014 onde foram encontrados alguns problemas que natildeo foram totalmente resolvidos junto dos fornecedores (Lapa 2017)

Licenciamento Eacute aplicada a licenccedila CC BY 30 a todos os datasets

Disponibilidade dos dados sem registo Todos os dados no dadosgov estatildeo disponiacuteveis para download sem necessidade de pedido ou registo

Estrutura da relaccedilatildeo entre fornecedores de dados e os utilizadores Limitada

Aspetos da poliacutetica de Dados Abertos Acircmbito de aplicaccedilatildeo

Indicadores de

desempenho

Uso de dados publicados Existem 2 aplicaccedilotildees elaboradas a partir de Dados Abertos disponibilizados pela AMA e Direcccedilatildeo-Geral das Autarquias Locais

Riscos da publicaccedilatildeo de dados Privacidade seguranccedila maacute utilizaccedilatildeo (ainda sem casos reportados) (Lapa 2017)

Benefiacutecios da publicaccedilatildeo de dados Fraco impacto poliacutetico econoacutemico e social segundo o Open Data Barometer O estudo de Gomes e Soares (2014) conclui que a transparecircncia eacute o uacutenico benefiacutecio real

Valor puacuteblico alcanccedilado

Transparecircncia governativa e disponibilidade de dados Faltam indicadores de reutilizaccedilatildeo e estudos de impacto para uma avaliaccedilatildeo concreta do valor alcanccedilado

Fonte Elaboraccedilatildeo proacutepria

87

Em adiccedilatildeo agraves poliacuteticas de abertura de dados puacuteblicos um dos componentes principais do ecossistema de Dados Abertos eacute o desenvolvimento de e-infraestruturas que possam alojar e permitir a livre reutilizaccedilatildeo de dados O PORDATA criado em 2010 foi o primeiro portal de dados abertos em Portugal disponibilizando dados estatiacutesticos sobre os municiacutepios portugueses sobre o paiacutes e sobre a Europa A niacutevel puacuteblico a abertura de dados em Portugal iniciou-se com a abertura do portal de dados puacuteblicos e do portal de dados de investigaccedilatildeo Criado em 2011 depois da sua aprovaccedilatildeo poliacutetica o dadosgov eacute uma responsabilidade da AMA (2016a31) e ldquoeacute o ponto central na estrateacutegia nacional de Dados Abertos constituindo-se como a porta central de acesso online ao repositoacuterio de dados abertos disponibilizados pelas vaacuterias instituiccedilotildeesrdquo puacuteblicas em Portugal Em termos estrateacutegicos o gestor de projeto Andreacute Lapa declara que a AMA jaacute assumiu a necessidade do estabelecimento de uma relaccedilatildeo forte entre portal central e portais sectoriais regionais e locais sendo que a funccedilatildeo do dadosgov deve passar por alojar dados e por apontar para dados existentes noutros portais embora esta uacuteltima ainda natildeo tenha sido implementada (A Lapa comunicaccedilatildeo pessoal 2017) Eacute possiacutevel retirar algumas conclusotildees estatiacutesticas sobre os dados disponibilizados no dadosgov Os 802 conjuntos de dados existentes pertencem a 26 fornecedores de dados diferenciados embora os dados sejam maioritariamente publicados por apenas alguns dos fornecedores com o Instituto Nacional de Estatiacutestica a fornecer metade dos dados disponibilizados como se pode ver no graacutefico seguinte

Graacutefico 2 Maiores fornecedores de dados do portal nacional Fonte AMA (2016b)

Relativamente agrave tipologia dos fornecedores de dados do portal nacional esta apresenta-se concentrada em dois tipos de entidade

328 51

129 20

86 13

38 6 34 5 33 5

Instituto Nacional de Estatiacutestica (INE) Agecircncia Modernizaccedilatildeo Administrativa (AMA) Portal do SNS (Aacuterea da Transparecircncia) Direcccedilatildeo-Geral das Autarquias Locais (DGAL) Fundaccedilatildeo para a Computaccedilatildeo Cientiacutefica Nacional (FCCN) Comissatildeo Nacional de Eleiccediloes (CNE)

88

Graacutefico 3 Tipologia dos fornecedores de dados do portal nacional Fonte AMA (2016b)

Em termos de categorias de dados disponibilizados verifica-se uma maior dispersatildeo embora a Economia e Financcedilas assumam 13 dos dados existentes

Graacutefico 4 Tipologia das categorias de dados do portal nacional Fonte AMA (2016b)

O ecossistema de abertura de dados tem aumentado dentro e fora do espectro poliacutetico Aleacutem do portal nacional de dados puacuteblicos um grande nuacutemero de organizaccedilotildees puacuteblicas tem criado os seus portais de dados eou tem publicado os mesmos no dadosgov Por outro lado existem vaacuterios portais de dados com origem na sociedade civil com o selo da Transparecircncia Hackday Portugal74 Organizar eventos eacute

74 Transparecircncia Hackday Portugal eacute um movimento que nasceu no Porto e rdquose define como um grupo de trabalho entusiasmado com informaccedilatildeo puacuteblica dados abertos e as interaccedilotildees possiacuteveis entre

468 59

21 3

300 38 Entidades puacuteblicas Corpos de supervisatildeo

Municipalidades

Entidades governamentais

281 36

102 13 86 11 67 9

60 8 58 7

51 6

34 4 24 3 12 2

10 1 2 0

2 0

Economia e Financcedilas

Governo Eleiccedilotildees e Assuntos Parlamentares Sauacutede

Estatiacutesticas Gerais

Educaccedilatildeo Ciecircncia e Tecnologia

Administraccedilatildeo Local

Outras

Emprego e Seguranccedila Social

Justiccedila e Tribunais

Ambiente Geografia e Ordenamento Transportes Infra-estruturas e Telecomunicaccedilotildees Agricultura e Pescas

Cultura

89

uma forma de promover o reconhecimento nacional sobre a abertura de dados entre organizaccedilotildees e cidadatildeos (Carrara Nieuwenhuis amp Vollers 2016) Em Portugal tecircm existido diversas iniciativas a este niacutevel hackathons como o Date with Data organizados pela Transparecircncia Hackday Portugal e com o apoio da Open Knowledge Portugal com o intuito de alertar informar e formar a comunidade para este novo paradigma na disponibilizaccedilatildeo da informaccedilatildeo A Open Knowledge Portugal organiza em Lisboa o Lisbon Open Data Maker Night75 tendo em 2017 decorrido a terceira ediccedilatildeo A Porto Digital estaacute a organizar um hackathon76 sobre utilizaccedilatildeo de dados abertos no desenvolvimento de novas aplicaccedilotildees que ocorreraacute em Julho de 2017

Verifica-se tambeacutem que as entidades governamentais estatildeo a apostar na criaccedilatildeo de linhas de orientaccedilatildeo para abertura e gestatildeo de dados puacuteblicos A AMA criou em 2016 um guia de Dados Abertos para apoiar a abertura dos dados puacuteblicos O guia centra-se em quatro eixos

Definiccedilatildeo de Dados Abertos e enunciaccedilatildeo dos seus benefiacutecios bem como as questotildees de privacidade

Potencial dos Dados Abertos a niacutevel econoacutemico e no aumento da transparecircncia e da participaccedilatildeo ciacutevica

Estrateacutegia de abertura que aborda o planeamento escolha de dados tipos de utilizadores dados prioritaacuterios disponibilizaccedilatildeo de dados estrateacutegias de divulgaccedilatildeo e manutenccedilatildeo de dados

Princiacutepios que possibilitem a reutilizaccedilatildeo de dados como os formatos e as licenccedilas abertas aleacutem da forma de as escolher e publicar a estrutura de dados e metadados (AMA 2016a traduccedilatildeo livre)

A AMA assume a publicaccedilatildeo de dados como um compromisso com o cidadatildeo devendo a publicaccedilatildeo ser orientada por princiacutepios que potenciem a reutilizaccedilatildeo dos dados A disponibilizaccedilatildeo de dados deve abranger conjuntos de dados constantes ou sem continuidade regular e conjuntos de dados em seacuterie ou seja com continuidade temporal A relevacircncia dos dados eacute justificada quando ldquotem potencial para ser explorado por um grande nuacutemero de utilizadores ou quando o benefiacutecio potencial da sua utilizaccedilatildeo eacute elevadordquo (AMA 2016a20)

As duas principais cidades portuguesas Lisboa e Porto tecircm abordagens distintas relativamente agraves suas estrateacutegias de abertura de dados Lisboa possui uma parceria com a AMA e disponibiliza no seu portal77 ldquodatasets sobre a cidade nas mais diversas aacutereas de modo a potenciar a sua utilizaccedilatildeo em trabalhos de investigaccedilatildeo ou no tecnologia e cidadaniardquo O Transparecircncia Hackday Portugal estaacute envolvido em vaacuterios projetos de abertura de dados entre os quais se destacam a Central de Dados e a Democratica Disponiacutevel na WWW httpwwwtransparenciahackdayorgacerca 75 Disponiacutevel na WWW httpflipsideorgnotesopen-data-maker-night-III 76 Disponiacutevel na WWW httpshackacityeuporto 77 Disponiacutevel na WWW httpdadosabertoscm-lisboapt

90

desenvolvimento de aplicaccedilotildees informaacuteticasrdquo (Soares Baptista e Lima 201517) Os dados disponibilizados no portal ldquosatildeo produzidos no acircmbito de sistemas de informaccedilatildeordquo que pertencem a diversos organismos registando-se jaacute diversas aplicaccedilotildees78 que utilizam esses dados para criar valor para o cidadatildeo e visitante de Lisboa na aacuterea do turismo ambiente urbanismo (Soares Baptista e Lima 201518) Lisboa implementou tambeacutem o programa Smart Open Lisboa que visa dar apoio a start ups na validaccedilatildeo de ldquosolutions using real data in a live environment and work directly with your potential customers or partnersrdquo O apoio eacute dirigido a soluccedilotildees na aacuterea da mobilidade envolvimento dos cidadatildeos turismo cultura e sustentabilidade (Lisboa Cacircmara Municipal 2016) A estrateacutegia do Porto passa pela promoccedilatildeo de conjuntos de Application Programming Interface (API)79 permitindo a disponibilizaccedilatildeo de alguns serviccedilos na web como a disponibilizaccedilatildeo de ldquoconteuacutedos dos Portal de Turismordquo ou do BDRT80 entre outros que indica pontos de interesse na cidade A abertura de dados eacute centrada na ldquodimensatildeo turismo e negligencia pelo menos aparentemente as restantesrdquo (Soares Baptista e Lima 201518) Esta conclusatildeo pode ser reforccedilada com a anaacutelise do portal de dados do Porto onde apenas constam cinco conjuntos de dados sendo estes pertencentes ao turismo ou relacionados numa perspetiva de visita ou mudanccedila como enuncia a estrateacutegia de abertura de dados publicada pelo municiacutepio

O Porto Lisboa Fundatildeo Palmela Penela e Aacutegueda estatildeo entre as cidades que integram o Open and Agile Smart Cities (OASC) (2017) uma iniciativa com o objetivo de desenvolver mercados para as cidades inteligentes baseados nas necessidades das cidades e das comunidades O Porto eacute destaque nesta iniciativa pela utilizaccedilatildeo da tecnologia FIWARE81 que ajuda a melhorar o uso de dados abertos e a partilha conhecimentos e tecnologias entre cidades A FIWARE (2015) sintetizou o impacto da abertura de dados em tempo real no Porto ldquoImagine walking or driving through a city and the city itself tells you which trendy spots to check out where to park your car in that moment or which areas to avoid because of air quality or traffic congestionrdquo Na realidade a cidade do Porto jaacute consegue comunicar com os residentes turistas ou empresas que utilizem ldquoFIWARE standards and the UrbanSense platform82rdquo

A publicaccedilatildeo de Dados Abertos e a respetiva mediccedilatildeo de impacto podem ser avaliadas atraveacutes das vaacuterias iniciativas que visam medir o estado de abertura de dados 78 As aplicaccedilotildees referidas satildeo SPOT in Lisbon Lisboa Verde Lisboa NAV e Lisboa 360 79 De acordo com a Wikipeacutedia uma API eacute um conjunto de definiccedilotildees protocolos e ferramentas para construir aplicaccedilotildees de software Disponiacutevel em httpsenwikipediaorgwikiApplication_programming_interface 80 Disponiacutevel na WWW httpbdrtcm-portoptpt 81 A missatildeo da FIWARE eacute construir um ldquosustainable ecosystem around public royalty-free and implementation-driven software platform standards that will ease the development of new Smart Applications in multiple sectorsrdquo Disponiacutevel na WWW httpswwwfiwareorgabout-us 82 A plataforma Urbansense estaacute integrada no projeto futurecitiesup da Universidade do Porto sendo uma plataforma para a monitorizaccedilatildeo ambiental nas cidades composta por 20 unidades que coletam dados em pontos relevantes da cidade Disponiacutevel na WWW httpfuturecitiesupptsitehybrid-sensor-networking-testbed

91

algumas das quais jaacute mencionadas permitindo assim retirar conclusotildees especiacuteficas quanto ao estado dos Dados Abertos em Portugal A anaacutelise feita por Soares Baptista e Lima (2015) sobre a abertura de dados em quatro cidades do norte do paiacutes Braga Barcelos Guimaratildees e Vila Nova de Famalicatildeo concluiu que a disponibilizaccedilatildeo de dados ao niacutevel local eacute feita apenas ao niacutevel de ldquocontratos municipais orccedilamento anual gastos resultados eleitorais qualidade do ar horaacuterios de transporte orccedilamento participativo e lista de empresasrdquo A abertura de dados destas categorias eacute feita com a ajuda da ldquoadministraccedilatildeo central e algumas instituiccedilotildees transversais ao territoacuteriordquo sendo que existem aacutereas onde nenhum dos municiacutepios analisados possuiu Dados Abertos como os ldquotransportes em tempo real instalaccedilotildees puacuteblicas estatiacutesticas criminais seguranccedila e higiene alimentar acidentes de tracircnsito permissotildees de construccedilatildeo requisiccedilotildees de serviccedilos e licenccedilas comerciaisrdquo (Soares Baptista e Lima 201522) O estudo revela ainda que as cidades analisadas tecircm a maior taxa de abertura no Open Data Census pelo facto de serem a uacutenicas onde a informaccedilatildeo estaacute completa pois os resultados obtidos no estudo foram registados no censo

O Portal da Transparecircncia Municipal eacute uma ferramenta que permite avaliar vaacuterios indicadores da governaccedilatildeo dos municiacutepios portugueses com o recurso agrave disponibilizaccedilatildeo de dados estatiacutesticos Os indicadores abordam a gestatildeo financeira e administrativa decisotildees fiscais dinacircmica econoacutemica do municiacutepio serviccedilos municipais e participaccedilatildeo eleitoral autaacuterquica (Portugal Governo 2017) Contudo a disponibilidade de dados em cada indicador natildeo eacute totalmente uniforme em termos temporais e registam-se algumas falhas de coleta ou cedecircncia de dados

O Open Data Census83 responsabilidade da OKI coleta informaccedilatildeo sobre a performance de cada paiacutes e respetivas cidades em termos de abertura de dados acessibilidade disponibilidade licenciamento processamento por maacutequina e transparecircncia Existem dados de 2014 para Portugal com um total de 178 datasets provenientes de 51 cidades distribuiacutedos por aacutereas como a qualidade do ar transportes orccedilamentos contratos puacuteblicos despesas e eleiccedilotildees sendo Braga e Guimaratildees as cidades mais abertas Contudo apenas um desses conjuntos de dados possui a totalidade da abertura desejada (OKI 2014) Para 2015 e 2016 natildeo satildeo apresentados resultados relativos agrave abertura de dados nas cidades portuguesas

O Global Open Data Index eacute um iacutendice que mede o estado de abertura dos dados governamentais ao niacutevel global Este iacutendice coleta informaccedilatildeo sobre a abertura dos dados governamentais desde 2013 ano em que Portugal se encontrava no 16ordm lugar em 60 paiacuteses com uma taxa de abertura84 calculada em 56 Em 2014 Portugal desce

83 Disponiacutevel na WWW httpcensusokfnorgenlatest 84 O Global Open Data Index considera 9 criteacuterios na sua avaliaccedilatildeo para os dados serem denominados totalmente abertos Licenccedila aberta dados em formatos que sejam processaacuteveis por maacutequinas acesso sem custos disponibilidade do dataset completa para download disponibilizaccedilatildeo de forma raacutepida e

92

para o 36ordm lugar em 97 paiacuteses registando uma taxa de abertura para 47 Em 2015 nova descida do paiacutes no ranking ateacute ao 54ordm lugar num total de 122 paiacuteses com uma taxa de abertura estimada em 34 Para o ano de 2016 as categorias das estatiacutesticas nacionais limites administrativos e aquisiccedilotildees possuem a taxa de abertura mais elevada apenas indicando como falha o licenciamento mas que implica que nenhum dos datasets seja verdadeiramente aberto A taxa de abertura calculada situa-se agora nos 37 com Portugal a subir para 46ordm lugar (OKI 2017)

O Public Sector Information Scoreboard coloca Portugal em 25ordm lugar num total de 31 paiacuteses pontuados sendo alguns destes resultados obtidos com base na LADA cuja uacuteltima revisatildeo data de 1999 Este painel de avaliaccedilatildeo destaca pela positiva as praacuteticas de reutilizaccedilatildeo os formatos os acordos exclusivos e os eventos e atividades Pela negativa destaca a publicaccedilatildeo de informaccedilatildeo puacuteblica local a natildeo implementaccedilatildeo da Diretiva europeia (ePSI Scoreboard 2013) o que natildeo corresponde agrave realidade pois a Lei nordm 462007 de 24 de agosto entretanto revogada pela Lei nordm 262016 de 22 de agosto transpocircs para a ordem juriacutedica nacional a Diretiva nordm 200398CE

O Open Data Barometer coloca Portugal em 2016 no 34ordm lugar do ranking entre 92 paiacuteses caindo trecircs posiccedilotildees relativamente a 2015 Destaca-se pela positiva a prontidatildeo da publicaccedilatildeo de dados com 58 e pela negativa o impacto poliacutetico econoacutemico e social da abertura com apenas 16 com uma meacutedia total de 42 de abertura Eacute assinalada a maior abertura de dados geograacuteficos censos transportes puacuteblicos comeacutercio internacional desempenho do setor da sauacutede estatiacutesticas sobre educaccedilatildeo crimes ambiente e informaccedilatildeo sobre contratos puacuteblicos No sentido oposto a posse de terras informaccedilatildeo orccedilamental e gastos governamentais o registo de empresas legislaccedilatildeo e resultados de eleiccedilotildees satildeo apontados como os dados com menos abertura (World Wide Web Foundation 2017)

O Open Data Maturity divide os paiacuteses em vaacuterios segmentos liacutederes seguidores raacutepidos seguidores e iniciantes Portugal encontra-se no grupo dos seguidores o que indicia o desenvolvimento de uma poliacutetica baacutesica de Dados Abertos e um portal com funcionalidades avanccediladas O impacto da abertura de dados eacute baixo verificando-se apenas resultados positivos na transparecircncia e eficiecircncia poliacutetica Ao niacutevel social eacute denotado um baixo impacto praticamente nulo na sustentabilidade ambiental e na inclusatildeo de grupos marginalizados A niacutevel econoacutemico apenas a aplicaccedilatildeo do modelo de custo marginal para a abertura de dados merece destaque Em termos de preparaccedilatildeo para a abertura de dados Portugal desce de pontuaccedilatildeo em relaccedilatildeo a 2015 o que eacute explicado pela fase de transiccedilatildeo para uma nova estrateacutegia de Dados Abertos Jaacute a maturidade do portal nacional cresceu mais de 20 em 2016 rondando agora os 70 Segundo os dados recolhidos pelo Open Data Maturity o uso de Dados Abertos

imediata disponibilidade dos dados sem conexatildeo agrave internet disponibilizaccedilatildeo dos dados em formato digital disponibilidade puacuteblica dos dados e por fim a confirmaccedilatildeo da existecircncia dos dados

93

em 2016 em Portugal decaiu ligeiramente em relaccedilatildeo ao ano anterior rondando os 35 O estudo indica que o paiacutes natildeo tem uma poliacutetica de Dados Abertos e que apenas vai transpor a Diretiva europeia em 2016 apesar de jaacute o ter feito na Lei nordm 462007 de 24 de agosto sendo mencionado que a estrateacutegia a 5 anos estaacute a ser revista (Carrara Nieuwenhuis amp Vollers 2016) O Open Data Maturity aponta diversas barreiras em termos de publicaccedilatildeo de dados como a falta de apoio politico para a abertura de dados valiosos e relevantes a falta de recursos humanos teacutecnicos e financeiros e falta de conhecimentos relativos a padrotildees e boas praacuteticas de partilha de dados puacuteblicos O relatoacuterio afirma que ldquosome countries have a policy framework that does not necessarily require them to add a specific licence per data setrdquo apontando Portugal entre outros paiacuteses como exemplo (Carrara Nieuwenhuis amp Vollers 201624) Contudo a consulta dos avisos legais do portal dadosgov indica que todos os conjuntos de dados disponibilizados possuem uma licenccedila aberta Creative Commons Atribuiccedilatildeo 30 Portugal (CC-BY) (AMA 2016b)

O projeto Open Data Inventory (ODIN) monitoriza o progresso das poliacuteticas de abertura dos dados puacuteblicos medindo o seu sucesso e impacto e fornece suporte agrave implementaccedilatildeo de sistemas de dados Fruto deste acompanhamento o ODIN desenvolveu um ranking global com vista a avaliar a cobertura da abertura de dados e a abertura em si De acordo com os resultados de 2016 Portugal situa-se em 15ordm lugar entre os 173 paiacuteses cujas poliacuteticas de abertura de dados puacuteblicos foram avaliadas com uma cobertura de 58 e abertura de 75 perfazendo um total calculado de 67 Este ranking foi obtido depois da avaliaccedilatildeo da abertura de estatiacutesticas sociais (62) econoacutemicas (70) e ambientais (69) retirados do siacutetio web do Instituto Nacional de Estatiacutestica (INE) (Open Data Watch 2016)

Uma iniciativa de avaliaccedilatildeo dos programas de abertura da informaccedilatildeo do setor puacuteblico da OECD (2015b) fornece informaccedilatildeo uacutetil relativa ao estado dos Dados Abertos em Portugal Segundo esta organizaccedilatildeo os custos de abertura de informaccedilatildeo do setor puacuteblico satildeo financiados como parte do Plano Global Estrateacutegico para a racionalizaccedilatildeo de custos com tecnologias de informaccedilatildeo e comunicaccedilatildeo na Administraccedilatildeo Puacuteblica A legibilidade de dados por maacutequina eacute apontada como uma falha na avaliaccedilatildeo teacutecnica da abertura embora Andreacute Lapa da AMA tenha confirmado que todos os dados existentes no portal dadosgov tecircm essa caracteriacutestica (A Lapa comunicaccedilatildeo pessoal 27 Marccedilo 2017) Os resultados satildeo muitos positivos em termos de formatos abertos com a totalidade dos dados a deter esse estatuto e tambeacutem na interoperabilidade onde a OECD indica que esta caracteriacutestica teacutecnica iraacute ser implementada como obrigatoacuteria A niacutevel de licenciamento em Portugal eacute atribuiacuteda a Licenccedila CC BY 30 agrave totalidade de dados alojados no portal nacional (OECD 2015b AMA 2016b)

Referindo-se a dados de 2015 o portal do Open Data Monitor indica que apenas foi indexado um portal de dados em Portugal com um total de 656 datasets disponiacuteveis

94

sem contudo indicar qual Em termos de resultados apurados eacute indicado que Portugal apenas cumpre no capiacutetulo da exaustividade (50) tendo os campos da disponibilidade uso por maacutequina e do licenciamento aberto com uma percentagem de 0 o que explicaraacute os 13 de qualidade global atribuiacutedos pelo Open Data Monitor

Em Maio de 2017 o cataacutelogo do European Data Portal oferece o acesso a um total 633680 datasets provenientes de 34 paiacuteses europeus Portugal ocupa o 18ordm lugar com um total de 1635 conjuntos de dados disponibilizados oriundos dos trecircs portais indexados o dadosgovpt o portal do Sistema Nacional de Informaccedilatildeo de Ambiente (SNIAmb) e o Lisboa Aberta (European Data Portal 2017) Verifica-se uma discrepacircncia entre o nuacutemero de datasets disponibilizados no cataacutelogo do European Data Portal e o nuacutemero real existente nos cataacutelogos dos portais mencionados O portal dadosgovpt apresenta 802 conjuntos de dados no cataacutelogo (AMA 2016) enquanto o European Data Portal assinala 832 datasets O SNIAmb regista um total de 1991 datasets (Agecircncia Portuguesa do Ambiente 2017) contra os 439 indexados pelo European Data Portal Apenas os nuacutemeros referentes ao portal Lisboa Aberta satildeo coincidentes com o registo de 364 conjuntos de dados (Lisboa Cacircmara Municipal 2017)

Num estudo comparativo de seis iniciativas do norte e do sul da Europa Gomes e Soares (2014) analisaram diversos indicadores relativos aos portais de dados nacionais como o cumprimento dos princiacutepios de abertura de dados governamentais o niacutevel de atividade do portal e os benefiacutecios observaacuteveis da abertura de dados Segundo este estudo o portal portuguecircs tem nota eacute positiva no cumprimento dos princiacutepios de abertura A anaacutelise da atividade do portal eacute negativa com a atividade dos visitantes o desenvolvimento de aplicaccedilotildees a atividade geradora de novo conhecimento e a utilizaccedilatildeo de recursos do portal a serem classificadas como pobres Neste indicador apenas a atividade dos fornecedores no portal eacute satisfatoacuteria Em termos de benefiacutecios observaacuteveis da abertura de dados governamentais o estudo apenas regista bons niacuteveis de transparecircncia governativa enquanto a participaccedilatildeo puacuteblica a inovaccedilatildeo e o empreendedorismo e a eficiecircncia governativas natildeo revelam impactos satisfatoacuterios

Portugal possui ainda o Iacutendice de Transparecircncia Municipal (ITM) (2016) que mede o grau de transparecircncia das Cacircmaras Municipais atraveacutes de uma anaacutelise da informaccedilatildeo disponibilizada nas suas paacuteginas web O ITM eacute composto por 76 indicadores divididos em sete dimensotildees85 contudo este iacutendice eacute baseado no tipo de dados disponibilizados e natildeo em que contexto de abertura estes foram publicados

O cruzamento da informaccedilatildeo obtida atraveacutes das vaacuterias iniciativas de avaliaccedilatildeo da abertura de dados permite inferir algumas conclusotildees e revelar algumas disparidades

85 As dimensotildees satildeo Informaccedilatildeo sobre a Organizaccedilatildeo Composiccedilatildeo Social e Funcionamento do Municiacutepio Planos e Relatoacuterios Impostos Taxas Tarifas Preccedilos e Regulamentos Relaccedilatildeo com a Sociedade Contrataccedilatildeo Puacuteblica Transparecircncia Econoacutemico-Financeira Transparecircncia na aacuterea do Urbanismo Disponiacutevel na WWW httpstransparenciaptprojetosindice-de-transparencia-municipal

95

O Open Data Barometer e o Open Data Maturity apontam o baixo impacto econoacutemico e social da abertura de dados em Portugal Gomes e Soares (2014) concluem que o problema em Portugal natildeo eacute quantidade de dados disponibilizados mas sim a quantidade de dados que satildeo reutilizados e como satildeo reutilizados O Public Sector Information Scoreboard e o Open Data Maturity afirmam que Portugal natildeo possui uma poliacutetica de Dados Abertos o que como vimos natildeo corresponde agrave verdade Entre as vaacuterias iniciativas de avaliaccedilatildeo do estado de abertura de dados apenas trecircs publicaram informaccedilatildeo relativa a 2016

Quadro 4 Comparaccedilatildeo dos resultados de abertura de dados atribuiacutedos pelas vaacuterias iniciativas de avaliaccedilatildeo Iniciativa Ranking Taxa de Abertura

Global Open Data Index 46ordm122 Paiacuteses 37

Open Data Barometer

34ordm114 Paiacuteses 42

Open Data Inventory 15ordm173 Paiacuteses 67

Fonte Elaboraccedilatildeo proacutepria

Apesar da equivalecircncia de ranking e taxa de abertura entre duas das iniciativas eacute redundante inferir qualquer conclusatildeo dado que estas natildeo medem o mesmo nuacutemero paracircmetros nem estes coincidem na maioria dos casos O Open Data Inventory refere-se a dados avaliados apenas do portal do INE para calcular a sua taxa de abertura pelo que tambeacutem deve ser relativizado

Como pontos positivos satildeo apontados a abertura de dados de diferentes domiacutenios o fato de todos os dados disponibilizados no portal estarem num formato processaacutevel por maacutequina (Carrara Nieuwenhuis amp Vollers 2016) ao contraacuterio do que afirma a OECD (2015b) e o Open Data Inventory Apesar de a AMA natildeo deter dados concretos do impacto da reutilizaccedilatildeo de dados existentes no dadosgov existem pelo menos 2 aplicaccedilotildees Mapa do Cidadatildeo e Portal da Transparecircncia Municipal que utilizam dados do portal como fonte da informaccedilatildeo que disponibilizam (Lapa 2017) O Open Data Goldbook for Data Holders and Data Managers faz referecircncia a Portugal como um exemplo de boas praacuteticas ao niacutevel da abertura dos dados governamentais destacando a aplicaccedilatildeo moacutevel e a plataforma online86 da AMA que permite aos cidadatildeos aceder a um mapa que conteacutem a localizaccedilatildeo de todos os serviccedilos puacuteblicos (Carrara et al 2016a) A Infraestrutura de Dados Espaciais do Algarve disponibiliza atraveacutes do seu portal acesso a quatro aplicaccedilotildees87 que reutilizam Dados Abertos para fornecer informaccedilatildeo de acircmbito regional os cidadatildeos

86 Disponiacutevel na WWW httpswwwmapadocidadaopt 87 As aplicaccedilotildees satildeo ldquoSiacutetios Lugares e Ruasrdquo ldquoCarta Regional de Equipamentordquo ldquoReserva Ecoloacutegica Nacionalrdquo e ldquoPlanos Municipais de Ordenamento de Territoacuteriordquo Disponiacutevel na WWW httpidealgccdr-algptaplicacoesaspx

96

Relativamente agrave usabilidade do portal o Open Data Maturity refere que natildeo eacute possiacutevel contribuir para o portal o que parece natildeo corresponder agrave realidade Citando Andreacute Lapa da AMA organizaccedilatildeo responsaacutevel pelo portal nacional existem fornecedores com acesso direto ao backoffice e que publicam os seus dados (Lapa 2017) embora o mesmo natildeo se verifique relativamente aos cidadatildeos O Open Data Maturity avalia tambeacutem a usabilidade de dados referindo que natildeo eacute possiacutevel saber a maioria dos formatos dos ficheiros existentes no portal nacional Recorrendo agrave informaccedilatildeo disponibilizada por Lapa (2017) todos os dados no dadosgov estatildeo disponiacuteveis em pdf csv xlsx e atraveacutes de serviccedilos REST incluindo assim formatos como odata JSON ou KML e RDF se aplicaacutevel A disponibilizaccedilatildeo dos formatos enunciados garante que todos os dados que o portal disponibiliza cumprem pelo menos as 3 estrelas da classificaccedilatildeo de Tim Berners-Lee (Lapa 2017) O Open Data Maturity afirma ainda que natildeo existe uma licenccedila atribuiacuteda contudo a AMA (2016b) enuncia que todos os seus dados estatildeo disponiacuteveis com uma licenccedila CC BY 30 O portal dadosgov possui algumas funcionalidades como a disponibilizaccedilatildeo de uma API que permite efetuar consultas baacutesicas relativas ao cataacutelogo de dados e tem capacidades de coleta automatizada para o caso dos dados disponibilizados atraveacutes de web services sendo que os restantes satildeo atualizados de forma manual (Lapa 2017)

Em Maio de 2017 contabilizam-se 60 portais de dados abertos em Portugal distribuiacutedos por uma variada gama de aacutereas Foi elaborado um quadro com dados recolhidos atraveacutes desses portais para tentar identificar as e-infraestruturas que disponibilizam Dados Abertos que cumprem os requisitos inscritos na Open Definition nomeadamente em termos de licenccedila legibilidade por maacutequina esquema de metadados padratildeo e formatos abertos Todos os conjuntos de dados tecircm acesso gratuito atraveacutes da web razatildeo pela qual esse requisito natildeo foi incluiacutedo no quadro de avaliaccedilatildeo Atraveacutes deste quadro foi possiacutevel retirar algumas conclusotildees Existem apenas 11 portais de dados de investigaccedilatildeo com os restantes 49 a conter dados do setor puacuteblico Os dados estatiacutesticos satildeo os grandes dominadores do panorama nacional com 13 siacutetios web seguidos dos dados econoacutemicos com 6 Dos 60 portais analisados apenas 33 disponibilizam dados legiacuteveis por maacutequina sendo que alguns portais natildeo o fazem totalmente Apenas 16 portais indicam usar uma licenccedila aberta que permita a livre reutilizaccedilatildeo dos dados e apenas 3 fornecem a indicaccedilatildeo do padratildeo de metadados usado embora alguns dos portais pareccedilam usar um esquema proacuteprio de descriccedilatildeo de datasets Existem 17 portais que fornecem dados em formatos estruturados e 17 portais que natildeo utilizam formatos abertos ou natildeo indicam sequer o tipo de formato

97

Quadro 5 Portais de dados abertos existentes em Portugal

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Repositoacuterio de dados cientiacuteficos

RCAAP FCTFCCN Acadeacutemico 2007 IPCB ndash CC BY-NC APIS ndash CC BY 30 Sim Sem indicaccedilatildeo

IPCB ndash XLS APIS - PDF XML SAV

Repositoacuterio Cientiacutefico do Instituto Politeacutecnico de

Castelo Branco

IPCB Acadeacutemico 1970 CC BY-NC Sim Sem indicaccedilatildeo XLS

Qualidade da aacutegua da Albufeira do Roxo na

dinacircmica dos solos e das culturas agriacutecolas

Assoc Benefic do Roxo Inst

Politeacutecnico de Beja Univ Eacutevora

Agricultura Recursos Hiacutedricos

10 Sem licenccedila especiacutefica Sim ISO-19139

Metadata CSV KML Shapefile

Portal de dados da biodiversidade de Portugal

Instituto Superior de Agronomia

Biologia 23 CC BY 30 CC BY-NC 30

Sem indicaccedilatildeo

Esquema proacuteprio Sem indicaccedilatildeo

Biodatapt ELIXIR Portugal Biologia 5 Sem indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo Vaacuterios

Yeastract Inst Superior Teacutecnico - Lisboa

Ciecircncias da Vida Biologia

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

Cork Oak DB Instituto

Gulbenkian de Ciecircncia

Ciecircncias da Vida Biologia

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo HTML

Mitobreak Universidade do Porto

Ciecircncias da Vida Biologia

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

Haeckaliens Instituto

Gulbenkian de Ciecircncia

Ciecircncias da Vida Biologia

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Vaacuterios

Integrall Univ Aveiro Ciecircncias da Vida Biologia 8843 Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

Kymosys INESC-ID Lisboa Ciecircncias da Vida Biologia 42 CC BY 40 Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

98

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Geodados CM Lisboa Informaccedilatildeo Geograacutefica 257 PDDL Sim Esquema

proacuteprio CSV KLM

iGEO APA DGTerritoacuterio Informaccedilatildeo Geograacutefica 99 Sem indicaccedilatildeo Sem

indicaccedilatildeo Esquema proacuteprio HTML

IDEAlg CCDR Algarve Informaccedilatildeo Geograacutefica

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

Mapa de Obras ndash Portal do Muniacutecipe De Vila do Bispo

CM Vila do Bispo Autaacuterquico Informaccedilatildeo geograacutefica Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Aplicaccedilatildeo web

Portal de Dados Abertos do Porto

CM Porto Autaacuterquico 5 CC BY Sim Esquema proacuteprio SHP XLS

Lisboa Aberta CM Lisboa Autaacuterquico 365 CC0 e CC BY Sim (natildeo a 100)

Esquema proacuteprio

Diversos a maioria satildeo estruturados

Dados Abertos Aacutegueda CM Aacutegueda Autaacuterquico 47 CC0 CC BY-SA e CC BY

Sim (natildeo a 100)

Esquema proacuteprio

Diversosnem todos satildeo estruturados

SNIAmb APA Ambiente 1991 Sem indicaccedilatildeo Sim Esquema proacuteprio XML

SNIRH APA Ambiente

Recursos Hiacutedricos

7210 Resultados Sem indicaccedilatildeo Sim Sem indicaccedilatildeo CSV TSV

DadosGov AMA Agregador de Dados 802 CC BY 30 Sim Esquema

proacuteprio Diversos a maioria satildeo estruturados

Dados Abertos BNP Biblioteca Nacional Bibliograacutefico 12 CC0 10 Sim UNIMARC

Dublin Core Mods

RDF XML RDF TURTLE e Dublin Core XML

Simplex + - Dados Abertos AMA Burocraacutetico

Serviccedilos Puacuteblicos

1

Sem licenccedila especiacutefica autoriza

a reproduccedilatildeo de conteuacutedos

Sim Sem indicaccedilatildeo JSON

Mapa do Cidadatildeo AMA Burocraacutetico

Serviccedilos Puacuteblicos

Informaccedilatildeo geograacutefica Sem indicaccedilatildeo Sim Sem indicaccedilatildeo Aplicaccedilatildeo web e

moacutevel

99

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Instituto Nacional de Estatiacutestica

INE Estatiacutesticas Nacionais 8340

CC BY 30 (nos dados existentes no

dadosgov) Sim Esquema

proacuteprio XLS CSV

Estatiacutesticas Cultura GEPAC Cultura Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica autoriza a reproduccedilatildeo natildeo

comercial de conteuacutedos

Natildeo Sem indicaccedilatildeo PDF

AICEP - Estatiacutesticas AICEP Comeacutercio e Investimento

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo PDF

BPStat Banco de Portugal Economia Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sem

indicaccedilatildeo Esquema proacuteprio Sem indicaccedilatildeo

Portugal Economy Probe Vaacuterios Economia Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim (natildeo a

100) Sem indicaccedilatildeo PDF XLS

Estatiacutesticas Economia GEE Economia Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica autoriza a coacutepia mediante citaccedilatildeo da fonte

Sim Sem indicaccedilatildeo XLXS

Portal de Transparecircncia Municipal

AMA e DGAL Economia Financcedilas

Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica indica

que a coacutepia importaccedilatildeo ou

utilizaccedilatildeo satildeo graacutetis

Sim Sem indicaccedilatildeo XML CSV

Base INCI Economia Compras Puacuteblicas

766326 Resultados

CC BY 30 (nos dados existentes no

dadosgov) Natildeo Esquema

proacuteprio HTML PDF

Estatiacutesticas Empresariais MJ Estatiacutesticas Empresariais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim Sem indicaccedilatildeo PDF XLS

100

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

PORDATA

Fundaccedilatildeo Manuel dos Santos

Estatiacutesticas Nacionais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim Esquema

proacuteprio HTML PDF XLS

PORDATA Kids

Fundaccedilatildeo Manuel dos Santos

Estatiacutesticas Nacionais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim Esquema

proacuteprio HTML PDF XLS

CCDR-N - Indicadores Regionais

CCDR Norte Estatiacutesticas Regionais 8 Sem indicaccedilatildeo Sim Sem indicaccedilatildeo XLS

Observatoacuterio DR CCDR Alentejo Estatiacutesticas Regionais

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo PDF XLS

Datacentro CCDR-Centro Estatiacutesticas Regionais

Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica autoriza a reproduccedilatildeo natildeo

comercial de conteuacutedos desde que identifique a

fonte

Natildeo Sem indicaccedilatildeo HTML

Estatiacutesticas dos Accedilores

Governo dos Accedilores

Estatiacutesticas Regionais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Esquema

proacuteprio HTML PDF

Estatiacutesticas da Madeira

Governo da Madeira

Estatiacutesticas Regionais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sem

indicaccedilatildeo Esquema

usado pelo INE PDF XLS

Quarenta anos de Abstenccedilatildeo

Transparecircncia Hackday Portugal Open Knowledge

Portugal

Estatiacutesticas Poliacuteticas

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo HTML

Central de dados

Transparecircncia Hackday Portugal

Estatiacutesticas Poliacuteticas e

Sociais 9 PDDL Sim Esquema

proacuteprio CSV JSON

Um Paiacutes como noacutes UBI U Aveiro Estatiacutesticas Sociais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo Aplicaccedilatildeo web

Dados e estatiacutesticas de cursos superiores

MEC Educaccedilatildeo Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim (natildeo a

100) Sem indicaccedilatildeo HTML XLXS ODS

101

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Estatiacutesticas Educaccedilatildeo e Ciecircncia

DGEEC Educaccedilatildeo e Ciecircncia

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim (natildeo a

100) Sem indicaccedilatildeo PDF XLXS ODS

Estatiacutesticas Justiccedila DGPJ-MJ Justiccedila Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim (natildeo a

100) Sem indicaccedilatildeo HTML PDF XLS

Sistema de informaccedilatildeo dos certificados de oacutebitos

M Sauacutede Oacutebitos Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo HTML

Serviccedilo Nacional de Sauacutede SNS Sauacutede 126 Sem indicaccedilatildeo Sim Esquema proacuteprio Vaacuterios

Estatiacutesticas Sauacutede DGS Sauacutede Sem indicaccedilatildeo Sem indicaccedilatildeo Sim Sem indicaccedilatildeo PDF CSV

Dashboard da Sauacutede DGS Sauacutede Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo HTML

Relatoacuterios Sinistralidade ANSR Seguranccedila Rodoviaacuteria

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo PDF

Portal Opiniatildeo Puacuteblica

Fundaccedilatildeo Francisco Manuel dos Santos

Sondagens Opiniatildeo

Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica autoriza a reproduccedilatildeo natildeo

comercial de conteuacutedos desde que identifique a

fonte

Sim Sem indicaccedilatildeo HTML PDF XLS

Estatiacutesticas SegSocial ISS Seg Social Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo HTML PDF

O Preccedilo Certo em Votos

Transparecircncia Hackday Portugal Open Knowledge

Portugal

Estatiacutesticas Poliacuteticas

Informaccedilatildeo estatiacutestica

General Public License v20

Sem indicaccedilatildeo Sem indicaccedilatildeo HTML

Arquivo Portuguecircs de Informaccedilatildeo Social

APIS Informaccedilatildeo social 37 CC BY 30 Sim Padratildeo do DDI PDF XML SAV

102

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Mila

Transparecircncia Hackday Portugal Aplicaccedilatildeo 78

Resultados Sem indicaccedilatildeo Sim Sem indicaccedilatildeo Aplicaccedilatildeo web

GeoDevolutas

Transparecircncia Hackday Portugal Aplicaccedilatildeo 250

Resultados Sem indicaccedilatildeo Sim Sem indicaccedilatildeo Aplicaccedilatildeo web

(tambeacutem disponiacutevel em CSV)

Open Food Facts

Open Food Facts - Portugal Aplicaccedilatildeo

Informaccedilatildeo estatiacutestica

e descritiva CC BY 40 Sim Sem indicaccedilatildeo Aplicaccedilatildeo web e

moacutevel

Invasatildeo dos hamburgueres

Transparecircncia Hackday Portugal Aplicaccedilatildeo Informaccedilatildeo

geograacutefica Sem indicaccedilatildeo Sim Sem indicaccedilatildeo

Aplicaccedilatildeo web (tambeacutem disponiacutevel em PDF CSV ODS

XLXS TSV)

103

Conclusatildeo

O conhecimento eacute inseparaacutevel do progresso cientiacutefico do processo de decisatildeo da inovaccedilatildeo e do bem-estar social Apesar de natildeo ser objetivo principal deste estudo natildeo deixaacutemos de constatar que o ecossistema portuguecircs de AA parece estar a amadurecer Aleacutem do RCAAP existem largas dezenas de repositoacuterios pertencentes a universidades e institutos de investigaccedilatildeo alguns incluiacutedos no ranking Top Portals O ROARMAP lista 21 poliacuteticas de AA por via verde em instituiccedilotildees do ensino superior o DOAJ (2017) indexa 78 revistas de AA com 91 a publicarem sob uma licenccedila CC que permite a sua livre reutilizaccedilatildeo O SHERPARoMEO listou 127 poliacuteticas editoriais de AA em Portugal sendo que mais de metade autoriza a publicaccedilatildeo em AA do posprint ou da versatildeo final do editor Nota ainda para a existecircncia de uma poliacutetica de AA da FCT por via do artigo 292 do acordo de financiamento que mandata a abertura de todos as publicaccedilotildees cientiacuteficas produzidos sob financiamento do programa H2020 Contudo os parcos resultados obtidos atraveacutes da literatura explorada natildeo permitem inferir a dimensatildeo cultural da implementaccedilatildeo do AA em Portugal

A plena implementaccedilatildeo do conceito de CA em Portugal parece ainda longe da realidade O estabelecimento de uma poliacutetica de CA apenas comeccedilou a ser desenhado em fevereiro de 2016 com a publicaccedilatildeo dos principiacuteos orientadores para a ldquoCiecircncia Aberta Conhecimento para todosrdquo pelo MCTES Em Maio a Resoluccedilatildeo do Conselho de Ministros nordm 212016 definiu os princiacutepios da implementaccedilatildeo da poliacutetica de CA em Portugal estruturada em torno de quatro eixos AA e Dados Abertos Infraestruturas e preservaccedilatildeo digital Avaliaccedilatildeo cientiacutefica Responsabilidade social cientiacutefica (Comissatildeo Executiva GT-PNCA 2016)

Hoje aplicamos o termo Dados Abertos referindo-nos a dados de investigaccedilatildeo e a dados do setor puacuteblico A origem da abertura destes dois tipos de dados tem contextos muito diferenciados e independentes embora os objetivos possam ser semelhantes Os dados sempre foram essenciais em muitas aacutereas da investigaccedilatildeo e nos uacuteltimos anos tornaram-se destaque em mais aacutereas cientiacuteficas crescendo substancialmente em escala e complexidade A niacutevel mundial verifica-se uma atenccedilatildeo crescente para o fenoacutemeno da abertura de dados de investigaccedilatildeo sobretudo quando se debate a resoluccedilatildeo de problemas agrave escala global Existem tambeacutem iniciativas e organizaccedilotildees internacionais envolvidas na promoccedilatildeo da abertura de dados que procuram fomentar o desenvolvimento de sistemas e procedimentos a niacutevel internacional que assegurem o acesso sustentabilidade e interoperabilidade Muitas destas organizaccedilotildees jaacute desenvolveram princiacutepios de abertura e protocolos de dados proacuteprios formaram grupos de trabalho para a definiccedilatildeo de padrotildees de gestatildeo publicaccedilatildeo citaccedilatildeo interoperabilidade e partilha de dados ou criaram cursos de treino em gestatildeo de dados de investigaccedilatildeo para oferecer aos seus investigadores Analisando em detalhe os

104

princiacutepios propostos para a abertura dos dados de investigaccedilatildeo verifica-se que aleacutem da grande variedade de princiacutepios propostos a abertura legal e teacutecnica dos dados soacute eacute acautelada em metade das recomendaccedilotildees Destacam-se o AA aos dados e a reutilizaccedilatildeo de dados em nuacutemero de menccedilotildees Em contrapartida a citaccedilatildeo de dados a interoperabilidade o acesso sem discriminaccedilatildeo as licenccedilas e formatos abertos a modificaccedilatildeo e legibilidade por maacutequina satildeo mencionados apenas em trecircs recomendaccedilotildees tendo a seu favor o facto de terem sido incluiacutedas nas recomendaccedilotildees mais recentes Princiacutepios relevantes como a publicaccedilatildeo imediata a qualidade e a integridade dos dados surgem apenas duas vezes listados Verifica-se tambeacutem o lanccedilamento de revistas cientiacuteficas especiacuteficas para a ciecircncia orientada a dados possibilitando a publicaccedilatildeo de dados e dos artigos cientiacuteficos que os utilizam apoacutes o serviccedilo de revisatildeo por pares

Apesar do progresso a literatura examinada aponta no sentido de que a abertura a dados de investigaccedilatildeo natildeo ser ainda um comportamento comum sendo necessaacuterio uma mudanccedila cultural (Royal Society 2012 Pontika et al 2015 Science International 2015) Verificam-se trecircs fatores que parecem estar a atrasar esta mudanccedila no comportamento dos investigadores

a) A OKI (2012b) coloca os dados de investigaccedilatildeo ao mesmo niacutevel de importacircncia que outros tipos de dados como os dados culturais financeiros estatiacutesticos ambientais e ainda sobre o clima e transportes sem lhes atribuir qualquer destaque ou importacircncia especial

b) A avaliaccedilatildeo e revisatildeo por pares dos dados natildeo tecircm a mesma qualidade quando comparada com as publicaccedilotildees tradicionais dado a publicaccedilatildeo de dados natildeo ser ainda uma praacutetica comum (ERAC 2016)

c) Hahnel e Hook (2016) apontam a falha na atribuiccedilatildeo de incentivos e recompensas tangiacuteveis aos investigadores pelas suas contribuiccedilotildees A publicaccedilatildeo de dados de forma aberta envolve tarefas que consomem muito tempo aos investigadores como a mudanccedila do formato dos dados manter a informaccedilatildeo atualizada alinhar os dados com as licenccedilas existentes e com os criteacuterios de publicaccedilatildeo de informaccedilatildeo sensiacutevel (Reitano 2013)

O debate sobre a abertura dos dados governamentais tem mais de uma deacutecada Diversas iniciativas e organizaccedilotildees internacionais tecircm promovido princiacutepios de abertura de dados do setor puacuteblico como a OKI (2012a) que identificou as componentes chave da abertura de dados puacuteblicos disponibilidade e acesso reutilizaccedilatildeo e redistribuiccedilatildeo participaccedilatildeo universal Foram analisados princiacutepios de abertura de dados puacuteblicos de nove organizaccedilotildees e tal como em relaccedilatildeo aos dados de investigaccedilatildeo verifica-se uma grande variedade de princiacutepios propostos Embora se registe uma melhoria significativa na abertura legal e teacutecnica relativamente aos dados de investigaccedilatildeo tambeacutem os princiacutepios propostos para os dados puacuteblicos natildeo abarcam

105

a totalidade desta dupla abertura O acesso a publicaccedilatildeo imediata a reutilizaccedilatildeo e a disponibilizaccedilatildeo de dados de forma completa sem discriminaccedilatildeo e de forma a serem processados por maacutequina satildeo os princiacutepios que reuacutenem mais consenso entre as recomendaccedilotildees analisadas As licenccedilas abertas a comparabilidade de dados os formatos abertos a disponibilidade a abertura por defeito de dados a interoperabilidade publicaccedilatildeo de metadados e a gestatildeo de dados apoacutes a sua publicaccedilatildeo satildeo mencionados em menos de metade das recomendaccedilotildees analisadas apesar de ser indiscutiacutevel a sua importacircncia no processo de abertura de dados

A abertura dos dados governamentais enfrenta restriccedilotildees complexas a niacutevel institucional da complexidade da tarefa uso e participaccedilatildeo legislaccedilatildeo qualidade da informaccedilatildeo e questotildees teacutecnicas (Janssen Charalabidis e Zuiderwijk 2012) Os governos devem modificar as praacuteticas e procedimentos internos de gestatildeo de informaccedilatildeo pois a reutilizaccedilatildeo da informaccedilatildeo estaacute dependente da forma como eacute gerida e publicada (Reitano 2013) A OECD (2015a) declara que estes dados continuam muitas vezes inacessiacuteveis quer em termos de acesso quer em termos de custo Satildeo apontados alguns entraves agrave sua publicaccedilatildeo derivados de questotildees culturais (Carrara et al 2016a) restriccedilotildees teacutecnicas e financeiras (Ubaldi 2013 Carrara et al 2016a) sendo necessaacuterio enfrentar desafios relacionados com poliacuteticas tecnologias financcedilas organizaccedilatildeo e cultura para criar um ecossistema e construir um modelo de negoacutecios sustentaacutevel para as iniciativas de DGA (Ubaldi 2013 traduccedilatildeo livre) Por outro lado devem ser fornecidos aos cidadatildeos os conhecimentos e habilidades necessaacuterias para interpretar a vasta gama de conjuntos de dados e gerar valor a partir desses dados (Janssen 2012 Koski 2015)

O impacto da abertura dos dados governamentais pode ser medido em trecircs dimensotildees econoacutemica poliacutetica e social (Granicas 2013 Koski 2015) Koski (20153) defende ser necessaacuterio desenvolver um modelo de avaliaccedilatildeo e monotorizaccedilatildeo seguido da coleta sistemaacutetica de dados para medir com exatidatildeo o impacto dos Dados Abertos

A abertura de dados sem restriccedilotildees de acesso deve ser garantida por uma poliacutetica de Dados Abertos pois ldquoOpen Data is politicalrdquo (World Wide Web Foundation 201638) O fenoacutemeno dos Dados Abertos eacute tambeacutem teacutecnico e social dada a interaccedilatildeo entre o meio local politico social legal e teacutecnico e as tecnologias que produzem resultados (Davies 2014 Pasqueto Sands amp Borgman 2015) A literatura destaca a existecircncia de poliacuteticas diferenciadas para a abertura de dados governamentais e para a abertura de dados cientiacuteficos com maior enfoque poliacutetico na abertura dos dados governamentais (RECODE 2014) Em termos de dados de investigaccedilatildeo eacute possiacutevel encontrar poliacuteticas de quatro intervenientes diferentes Governo entidade financiadora que pode ser ou natildeo governamental instituiccedilotildees de investigaccedilatildeo e ainda as editoras de data journals Ao niacutevel dos dados puacuteblicos satildeo associadas poliacuteticas

106

governamentais e institucionais As poliacuteticas de dados abertos devem ainda incluir uma poliacutetica de gestatildeo de dados independentemente do cariz dos dados

As recentes poliacuteticas de Open Data pretendem disponibilizar em livre acesso os datasets da mesma forma que qualquer outra publicaccedilatildeo acadeacutemica sendo para isso necessaacuterio garantir uma infraestrutura de armazenamento acesso pesquisa e a reutilizaccedilatildeo dessa informaccedilatildeo (Rans Day Duke amp Ball 2013) Segundo a Science International (20156) ldquoeffective open data in a data-intensive age can only be realised if there is systemic action at disciplinary national and international levelsrdquo

Exige-se uma mudanccedila cultural para atingir a abertura plena dos dados de investigaccedilatildeo sendo necessaacuterio estabelecer novas formas de reconhecimento e recompensa aos esforccedilos de gestatildeo preservaccedilatildeo e curadoria de dados como forma de envolver investigadores e comunidades na abertura de dados (RECODE 2014 Internacional Science 2015) Eacute essencial que os investigadores desenvolvam competecircncias que lhes permita natildeo soacute partilhar dados com metadados adequados como tambeacutem entender e reutilizar dados de terceiros (OECD 2015a) A familiaridade com ferramentas e princiacutepios de gestatildeo de dados deve ser segundo a Royal Society (2012) parte integrante do treino dos cientistas As bibliotecas e os bibliotecaacuterios como profissionais de informaccedilatildeo multifacetados podem desempenhar um papel ativo no mundo dos Dados Abertos como facilitadores do processo de investigaccedilatildeo (RECODE 2014 Hahnel e Hook 2016 Erway et al 2016 Hernaacutendez-Peacuterez 2016)

A implementaccedilatildeo de uma poliacutetica de abertura de dados puacuteblicos deve ter em conta a definiccedilatildeo da sua aplicaccedilatildeo e os objetivos que dados iratildeo ser publicados quais as condiccedilotildees de publicaccedilatildeo de dados em que siacutetio qual a frequecircncia e qual a razatildeo da publicaccedilatildeo devendo ainda ser calculado o impacto e os benefiacutecios da abertura de dados (Carrara et al 2016a) ldquoThe culture of open data policies has to change from a culture in which opening of data is standardly consideredrdquo (Zuiderwijk amp Janssen 201427) Os governos necessitam de implementar o fenoacutemeno dos Dados Abertos como uma mudanccedila cultural assegurando que recursos humanos e materiais infraestrutura leis e poliacuteticas satildeo eficientes para a implementaccedilatildeo e extraccedilatildeo de resultados a longo prazo (World Wide Web Foundation 2016) A literatura indica algumas estruturas de avaliaccedilatildeo da abertura de dados puacuteblicos tendo o nosso enfoque recaiacutedo no modelo criado Zuiderwijk e Janssen (2014) que aborda o contexto conteuacutedo e indicadores de desempenho da poliacutetica de dados abertos para calcular o valor alcanccedilado pela abertura de dados Destaque ainda para o Open Data Barometer que revela algumas conclusotildees preocupantes a niacutevel da abertura dos dados governamentais A disponibilidade de dados que cumprem todos os princiacutepios de abertura caiu dos 10 para 7 em 2016 e a legibilidade por maacutequina tambeacutem tem tendecircncia negativa Apenas se registou uma melhoria no licenciamento de dados

107

Ao niacutevel macro a EU tem estado ativa na recomendaccedilatildeo e implementaccedilatildeo de poliacuteticas de abertura de dados de investigaccedilatildeo e governamentais Em 2015 no acircmbito da criaccedilatildeo do Mercado Digital Uacutenico propocircs a implementaccedilatildeo de uma ldquocopyright exception that would permit researchers to analyse on a large scale scientific data to which they have lawful accessrdquo (Comissatildeo Europeia 2016b) Com a ambiccedilatildeo de tornar a Europa liacuteder mundial numa economia baseada em dados a Comissatildeo Europeia (2016c) pretende ldquodisponibilizar serviccedilos baseados na computaccedilatildeo em nuvem e infraestruturas de dados de craveira mundialrdquo que forneccedilam vantagens competitivas a investigadores empresaacuterios e instituiccedilotildees puacuteblicas baseadas na utilizaccedilatildeo de grandes volumes de dados

A aposta na criaccedilatildeo de poliacuteticas de abertura de dados de acordo com os objetivos europeus relativamente agrave CA reflete-se no atual programa de financiamento da investigaccedilatildeo e inovaccedilatildeo da EU o Horizonte 2020 (H2020) Foi criado um projeto-piloto de dados abertos com o objetivo de maximizar o acesso e reutilizaccedilatildeo de dados de investigaccedilatildeo nas aacutereas cientiacuteficas selecionadas tendo sido expandido em 2017 a todas as aacutereas sob financiamento do H2020 O artigo 293 do Model Grant Agreement requer o depoacutesito num repositoacuterio de AA de todos os dados e metadados associados permitindo assim o seu acesso exploraccedilatildeo por maacutequina reproduccedilatildeo e disseminaccedilatildeo sem custos para os utilizadores Os investigadores devem tambeacutem fornecer informaccedilatildeo sobre as ferramentas e instrumentos necessaacuterios para validar os resultados e elaborar um Data Management Plan para descrever os conjuntos de dados gerados no processo de investigaccedilatildeo e como e quando seratildeo publicados A gestatildeo de dados deve ser efetuada segundo os princiacutepios FAIR tornando os dados faacuteceis de encontrar acessiacuteveis interoperaacuteveis e reutilizaacuteveis (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016c) A implementaccedilatildeo dos princiacutepios FAIR na gestatildeo e abertura de dados de investigaccedilatildeo poderaacute potenciar tambeacutem a partilha e por conseguinte a citaccedilatildeo de dados

Em termos de dados puacuteblicos a EU implementou uma nova Diretiva (201337EU) que requer que a informaccedilatildeo puacuteblica seja disponibilizada ldquothrough open and machine-readable formats and together with their metadata at the best level of precision and granularity in a format that ensures interoperabilityrdquo incluindo agora entidades como bibliotecas arquivos e museus na esfera da abertura de dados (EUR-Lex 20133) Esta diretiva tornou obrigatoacuteria a disponibilizaccedilatildeo de informaccedilatildeo proveniente das entidades puacuteblicas para reutilizaccedilatildeo ao custo de reproduccedilatildeo de preferecircncia num portal e sob licenccedilas de formatos digitais

A EU criou tambeacutem o Open Data Maturity para avaliar o desenvolvimento de poliacuteticas nacionais e portais na Europa usando a informaccedilatildeo coletada para elaborar um iacutendice de maturidade das poliacuteticas de Open Data baseado na preparaccedilatildeo poliacutetica e na maturidade do portal de dados (Carrara Nieuwenhuis amp Vollers 2016) Em termos

108

de preparaccedilatildeo poliacutetica eacute avaliada a presenccedila de uma poliacutetica de Dados Abertos especiacutefica normas de licenciamento extensatildeo da coordenaccedilatildeo a niacutevel nacional uso de dados e impacto poliacutetico social e econoacutemico A maturidade dos portais eacute avaliada de acordo com a sua usabilidade a reutilizaccedilatildeo dos dados alojados no portal e inclusatildeo de dados de diferentes domiacutenios Segundo a informaccedilatildeo apurada no relatoacuterio apesar da melhoria do nuacutemero de poliacuteticas de Dados Abertos no uso de dados e impacto da abertura de dados a maioria dos paiacuteses europeus ainda natildeo atingiu a maturidade por completo Os paiacuteses necessitam de elevar o reconhecimento poliacutetico sobre os Dados Abertos aumentar os processos automatizados nos seus portais para aumentar a usabilidade e reutilizaccedilatildeo dos dados e tambeacutem organizar mais eventos e treinos para apoiar as iniciativas nacionais e locais O relatoacuterio do Open Data Maturity conclui que os paiacuteses europeus estatildeo a enfrentar barreiras legais financeiras de qualidade de dados e de poliacuteticas sublinhando que os poliacuteticos natildeo conhecem os benefiacutecios da abertura de dados e que por isso os Dados Abertos natildeo satildeo estabelecidos como uma prioridade poliacutetica (Carrara Nieuwenhuis amp Vollers 2016)

Em Portugal as poliacuteticas de abertura de dados de investigaccedilatildeo e do setor puacuteblico apresentam estados de maturidade diferentes Apenas em 2014 foi definida uma poliacutetica de AA aos dados de investigaccedilatildeo atraveacutes da FCT enquanto entidade financiadora de investigaccedilatildeo Contudo esta poliacutetica ldquonatildeo estaacute alinhada com os requisitos relativamente aos dados de investigaccedilatildeo do H2020rdquo (Comissatildeo Executiva GT-PNCA 2016) pois apenas recomenda a abertura de dados sem no entanto mencionar onde os depositar o tipo de licenccedilas a utilizar que tipo de metadados inserir que formatos utilizar

A abertura de dados de investigaccedilatildeo em Portugal foi enquadrada no acircmbito da definiccedilatildeo de uma poliacutetica de CA tendo sido delineadas algumas metas a atingir ateacute 2018 pelo Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior (2016) publicaccedilatildeo de 100 dos dados criados com financiamento puacuteblico num repositoacuterio de AA verificaccedilatildeo contiacutenua da publicaccedilatildeo de dados eliminaccedilatildeo do duplo financiamento para colocar publicaccedilotildees e dados em AA oferta regular de formaccedilatildeo relativa a publicaccedilatildeo de dados em AA propriedade intelectual e proteccedilatildeo de dados

A Resoluccedilatildeo do Conselho de Ministros nordm 212016 de 11 de abril vem finalmente incluir o AA aos dados de investigaccedilatildeo na poliacutetica cientiacutefica No acircmbito da definiccedilatildeo de uma poliacutetica de Ciecircncia Aberta eacute incluiacuteda a obrigatoriedade do AA aos ldquodados cientiacuteficos resultantes de investigaccedilatildeo financiada por fundos puacuteblicosrdquo e sua respetiva preservaccedilatildeo ldquopor forma a permitir a sua reutilizaccedilatildeo e o acesso continuadordquo (Resoluccedilatildeo do Conselho de Ministros nordm 212016 2016) O interesse na abertura de dados de investigaccedilatildeo tem crescido no discurso poliacutetico e cientiacutefico verificando-se jaacute a organizaccedilatildeo de uma conferecircncia de dados de investigaccedilatildeo e CA em 2016 e de dois foacuteruns de gestatildeo de dados de investigaccedilatildeo o uacuteltimo jaacute em 2017

109

O primeiro relatoacuterio da Comissatildeo Executiva do Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta constatou que em termos de gestatildeo e partilha de dados existem algumas iniciativas e experiecircncias de ldquoacircmbito disciplinar nomeadamente no contexto de projetosrdquo sendo expectaacutevel que o Roteiro Nacional de Infraestruturas de Investigaccedilatildeo de Interesse Estrateacutegico traga ldquoprogressos significativosrdquo (Comissatildeo Executiva GT-PNCA 20167) O mesmo relatoacuterio sublinha que ao niacutevel das instituiccedilotildees de investigaccedilatildeo e de ensino superior as iniciativas de partilha e gestatildeo de dados satildeo quase inexistentes De facto apenas se regista a existecircncia do projeto TAIL lanccedilado na Faculdade de Engenharia da Universidade do Porto com o objetivo de otimizar o processo de gestatildeo de dados de investigaccedilatildeo desde a sua produccedilatildeo ateacute ao depoacutesito e partilha Este projeto a decorrer de 2016 ateacute 2019 ldquovai construir um portfoacutelio de exemplos de gestatildeo de dados em diversos domiacutenios que poderatildeo ser usados pelos investigadores para avaliar o esforccedilo requerido e as compensaccedilotildees a obter com esta atividaderdquo (Ribeiro et al 2016256-257) Os resultados seratildeo avaliados atraveacutes da utilizaccedilatildeo da plataforma Dendro ldquodesigned to help researchers use concepts from domain-specific ontologies to collaboratively describe and share datasets within their groupsrdquo (Universidade do Porto Faculdade de Engenharia 2017)

O ecossistema dos dados de investigaccedilatildeo em Portugal eacute concentrado a niacutevel disciplinar e inferior em nuacutemero de e-infraestruturas relativamente aos dados puacuteblicos Regista-se a existecircncia do SARDC com jaacute cerca de seis anos de existecircncia e que apresenta apenas 2007 datasets em maio de 2017 Depois da sua criaccedilatildeo e da colocaccedilatildeo em massa de conjuntos de dados verifica-se que o depoacutesito de datasets decresceu de forma extrema Os conjuntos disponibilizados satildeo provenientes de apenas duas instituiccedilotildees o APIS com 37 e o IPCB com 1970 conjuntos de dados Embora exista um espaccedilo atribuiacutedo a mais duas instituiccedilotildees nenhuma dessas entidades publicou ateacute agora dados atraveacutes desta plataforma O SARDC eacute limitado em termos de funcionalidades permitindo apenas a busca por autor data titulo assunto e tipo de documento Natildeo eacute possiacutevel perceber a legalidade da reutilizaccedilatildeo de dados pois natildeo eacute referido qualquer tipo de licenciamento A qualidade dos dados apresentados pelo SARDC eacute uma incoacutegnita pela falta de indicaccedilatildeo do uso de formatos abertos e tambeacutem de um esquema padratildeo de metadados A niacutevel das instituiccedilotildees de investigaccedilatildeo apenas o IPCB possui um repositoacuterio de Dados Abertos

A tendecircncia de abertura de dados de investigaccedilatildeo parece estar ligada agrave cultura disciplinar com os repositoacuterios de dados cientiacuteficos existentes em Portugal a conotarem-se no domiacutenio das Ciecircncias da Vida O re3data indexa apenas 2 repositoacuterios de dados cientiacuteficos portugueses o INTEGRALL e o KiMoSys sendo que ambos pertencem ao ramo da biologia (DataCite 2017a) O Biosharingorg (2017) indexou cinco bases de dados cientiacuteficas com origem portuguesa havendo participaccedilatildeo nacional em outras duas bases de dados internacionais Estas pertencem todas ao domiacutenio das Ciecircncias da Vida e da Biologia com exceccedilatildeo de uma conotada com as

110

Ciecircncias da Terra A GBIF possui um noacute portuguecircs que aloja 23 conjuntos de dados que correspondem a 448136 ocorrecircncias (Portal de Dados de Biodiversidade de Portugal 2016) A rede nacional de informaccedilatildeo bioloacutegica - BioDatapt fornece acesso a duas bases de dados disciplinares uma ontologia para descrever experiecircncias bioloacutegicas baseadas em plantas quatro ferramentas de software e cinco conjuntos de dados

Em suma eacute necessaacuterio desenvolver por completo a poliacutetica de abertura de dados cientiacuteficos clarificando questotildees como o local de depoacutesito licenccedilas metadados e formatos a utilizar Ao niacutevel do ecossistema eacute necessaacuterio melhorar a visibilidade do SARDC abrir totalmente os dados isto eacute de forma legal e teacutecnica e construir mais repositoacuterios de dados Em termos de impacto eacute imperiosa uma mudanccedila cultural que passe pelo treino dos investigadores para a gestatildeo e partilha de dados pela definiccedilatildeo de recompensas e incentivos para os investigadores que partilhem dados e tambeacutem pela criaccedilatildeo de mais iniciativas de promoccedilatildeo da abertura de dados

A evoluccedilatildeo da conjuntura de acesso aos documentos administrativos do setor puacuteblico eacute derivada da imposiccedilatildeo das Diretivas Europeias a que Portugal como membro da EU estaacute obrigado A Lei 462007 de 24 de Agosto viraacute transpor para a ordem juriacutedica nacional a Diretiva nordm 200398CE legislando a obrigaccedilatildeo das entidades puacuteblicas publicar documentos administrativos de forma eletroacutenica para que possam ser acedidos e reutilizados Foi tambeacutem criada a CADA para supervisionar o cumprimento das disposiccedilotildees legais referentes ao acesso agrave informaccedilatildeo administrativardquo (Comissatildeo de Acesso aos Documentos Administrativos [CADA])

A Lei nordm 262016 de 22 de Agosto revoga e transpotildee a novamente a Diretiva 200398EC O artigo 3ordm mandata a abertura dos dados ambientais agrave comunidade incluindo-os na definiccedilatildeo de documento administrativo devendo a sua publicaccedilatildeo ser feita num formato aberto e legiacutevel por maacutequina O artigo 23ordm apenas prevecirc a reutilizaccedilatildeo dos dados para fins educativos e para fins de investigaccedilatildeo e desenvolvimento deixando de lado a reutilizaccedilatildeo comercial Contudo o dadosgov atribuiu aos dados que aloja a licenccedila CC BY 30 o que natildeo impede a reutilizaccedilatildeo comercial dos dados Perante este contexto eacute impossiacutevel natildeo questionar a razatildeo de natildeo ter sido transposta a nova Diretiva 201337EU que facilita a reutilizaccedilatildeo de dados ao tornar obrigatoacuteria a disponibilizaccedilatildeo de informaccedilatildeo proveniente das entidades puacuteblicas para reutilizaccedilatildeo ao custo de reproduccedilatildeo de preferecircncia num portal e sob licenccedilas de formatos digitais Um desenvolvimento interessante seria o de criar um legislaccedilatildeo apropriada para a abertura de dados governamentais que fosse estabelecida tendo em conta as necessidades dos utilizadores e os objetivos governamentais em vez da simples transposiccedilatildeo da Diretiva da Uniatildeo Europeia

Ao niacutevel local apenas Lisboa e Porto parecem ter definido uma poliacutetica de abertura de dados com estrateacutegias diferenciadas Lisboa aposta na publicaccedilatildeo de dados municipais que promovam o envolvimento dos cidadatildeos aumentem a transparecircncia e

111

o desenvolvimento econoacutemico aleacutem da melhoria da eficiecircncia dos serviccedilos devendo os dados ser atualizados legiacuteveis por maacutequina com licenccedila aberta que permita a reutilizaccedilatildeo comercial (Lisboa Cacircmara Municipal 2016) Os dados disponibilizados no portal ldquosatildeo produzidos no acircmbito de sistemas de informaccedilatildeordquo que pertencem a diversos organismos registando-se jaacute diversas aplicaccedilotildees que utilizam esses dados para criar valor para o cidadatildeo e visitante de Lisboa na aacuterea do turismo ambiente urbanismo (Soares Baptista e Lima 201518) Jaacute o Porto parece concentrado na publicaccedilatildeo de dados que contribuam para a ldquocompetitividade do Municiacutepio do Porto e da regiatildeo para visitar para residir captar e realizar negoacutecios no mercado nacional e internacionalrdquo (Porto Cacircmara Municipal) De acordo com a opiniatildeo de Soares Baptista e Lima (201518) a abertura de dados eacute centrada na ldquodimensatildeo turismo e negligencia pelo menos aparentemente as restantesrdquo Esta conclusatildeo pode ser reforccedilada com a anaacutelise do portal de dados do Porto onde apenas constam cinco conjuntos de dados sendo estes pertencentes ao turismo ou relacionados

O ecossistema de abertura de dados tem aumentado dentro e fora do espectro poliacutetico Aleacutem do portal nacional de dados puacuteblicos um grande nuacutemero de organizaccedilotildees puacuteblicas tem criado os seus portais de dados eou tem publicado os mesmos no dadosgov Por outro lado existem vaacuterios portais de dados com origem na sociedade civil com o selo da Transparecircncia Hackday Portugal Em Portugal tecircm existido diversas iniciativas a este niacutevel hackathons como o Date with Data com o intuito de alertar informar e formar a comunidade para este novo paradigma na disponibilizaccedilatildeo da informaccedilatildeo conferecircncias de Dados Abertos

O Porto Lisboa Fundatildeo Palmela Penela e Aacutegueda estatildeo entre as cidades que integram o Open and Agile Smart Cities (OASC) (2017) uma iniciativa com o objetivo de desenvolver mercados para as cidades inteligentes baseados nas necessidades das cidades e das comunidades O Porto eacute destaque nesta iniciativa pela utilizaccedilatildeo da tecnologia FIWARE que ajuda a melhorar o uso de dados abertos e a partilha conhecimentos e tecnologias entre cidades

A anaacutelise feita por Soares Baptista e Lima (2015) sobre a abertura de dados em quatro cidades do norte do paiacutes Braga Barcelos Guimaratildees e Vila Nova de Famalicatildeo concluiu que a disponibilizaccedilatildeo de dados ao niacutevel local eacute feita apenas ao niacutevel de ldquocontratos municipais orccedilamento anual gastos resultados eleitorais qualidade do ar horaacuterios de transporte orccedilamento participativo e lista de empresasrdquo

A avaliaccedilatildeo da transparecircncia governativa local pode tambeacutem ser obtida atraveacutes do Portal da Transparecircncia Municipal uma ferramenta que permite avaliar vaacuterios indicadores da governaccedilatildeo dos municiacutepios portugueses com o recurso agrave disponibilizaccedilatildeo de dados estatiacutesticos Os indicadores abordam a gestatildeo financeira e administrativa decisotildees fiscais dinacircmica econoacutemica do municiacutepio serviccedilos municipais e participaccedilatildeo eleitoral autaacuterquica (Portugal Governo 2017)

112

Utilizando a estrutura de avaliaccedilatildeo de poliacuteticas de Dados Abertos de Zuiderwijk e Janssen (2014) eacute possiacutevel tirar algumas ilaccedilotildees sobre o contexto conteuacutedo e indicadores de desempenho da poliacutetica de abertura de dados do setor puacuteblico bem como sobre o valor puacuteblico alcanccedilado A niacutevel de contexto da poliacutetica de Dados Abertos a Lei nordm 262016 de 22 de Agosto transpotildee a Diretiva 200398CE tendo como motivaccedilatildeo para a sua implementaccedilatildeo eacute sobretudo econoacutemica e poliacutetica via EU A poliacutetica tambeacutem pretende facilitar o acesso e reutilizaccedilatildeo da informaccedilatildeo por parte dos cidadatildeos e garantir a transparecircncia da atividade administrativa A abertura de dados do setor puacuteblico eacute garantida pela CADA responsaacutevel pelo cumprimento da lei e a AMA que fornece a e-infraestrutura e apoio teacutecnico Tambeacutem os custos de abertura de dados governamentais parecem estar assegurados num plano de racionalizaccedilatildeo de custos da Administraccedilatildeo Puacuteblica (OECD 2015)

Em termos de conteuacutedo a poliacutetica de Dados Abertos enuncia na sua constituiccedilatildeo alguns princiacutepios de abertura bastante importantes como o acesso livre e universal a acessibilidade a interoperabilidade a qualidade a integridade e a autenticidade dos dados publicados e ainda a sua identificaccedilatildeo e localizaccedilatildeo (art 2ordm) A publicaccedilatildeo de dados deve ser feita num formato aberto e legiacutevel por maacutequina (art 3ordm)

Relativamente ao contexto o acesso eacute gratuito e de faacutecil compreensatildeo sendo que todos os dados no dadosgov estatildeo disponiacuteveis para download sem necessidade de pedido ou registo Eacute aplicada a licenccedila CC BY 30 a todos os datasets alojados no portal permitindo assim a sua reutilizaccedilatildeo com apenas a restriccedilatildeo de mencionar a fonte dos dados Todos os dados no dadosgov estatildeo disponiacuteveis em formatos abertos podendo ser classificados com 3 estrelas segundo o conceito de dados abertos conectados de Tim Berners-Lee (2010)

Contudo natildeo existe esquema padratildeo de metadados nem existe verificaccedilatildeo dos metadados antes da publicaccedilatildeo de cada dataset (Lapa 2017) Natildeo satildeo conhecidas meacutetricas de avaliaccedilatildeo nem multas ou recompensas no ecossistema portuguecircs de Dados Abertos A uacuteltima mediccedilatildeo da qualidade dos dados data de 2014 onde foram encontrados alguns problemas que natildeo foram totalmente resolvidos junto dos fornecedores A uacuteltima grande atividade de promoccedilatildeo de reutilizaccedilatildeo de dados do setor puacuteblico ocorreu em 2014-2015 natildeo se conhecendo para jaacute novas atividades previstas (Lapa 2017)

Em termos de disponibilidade de dados Portugal apresenta 802 conjuntos de dados no portal nacional de temaacutetica diversa mas com maior incidecircncia na Economia e Financcedilas Mas se considerarmos os dados alojado em outros portais puacuteblicos e natildeo que ainda natildeo constam no portal nacional a contabilidade eacute bastante mais elevada

Os indicadores de desempenho satildeo modestos Apesar do espetro alargado de destinataacuterios da abertura de dados registam-se apenas 2 aplicaccedilotildees elaboradas a

113

partir de Dados Abertos disponibilizados pela AMA e Direcccedilatildeo-Geral das Autarquias Locais (Lapa 2017) Natildeo eacute por isso surpreendente o fraco impacto poliacutetico econoacutemico e social apontado pelo Open Data Barometer e pelo Open Data Maturity O estudo de Gomes e Soares (2014) conclui que a transparecircncia eacute o uacutenico benefiacutecio real

Em termos de valor puacuteblico alcanccedilado apenas conseguimos identificar a transparecircncia governativa e disponibilidade de dados Mesmo que a poliacutetica mandate a abertura de dados mediante como a interoperabilidade e a qualidade se natildeo existe verificaccedilatildeo nem mediccedilatildeo quem pode assegurar que estes estatildeo a ser cumpridos A disponibilidade de dados existe o que natildeo se verifica eacute grande reutilizaccedilatildeo dos dados puacuteblicos Poderaacute esta falta de verificaccedilatildeo da qualidade dos dados estar a interferir com a sua reutilizaccedilatildeo Faltam claramente indicadores de reutilizaccedilatildeo de dados do setor puacuteblico e estudos de impacto para uma avaliaccedilatildeo concreta do valor alcanccedilado

Gomes e Soares (2014) apenas atribuem nota positiva ao dadosgov no cumprimento dos princiacutepios de abertura A atividade dos visitantes o desenvolvimento de aplicaccedilotildees a atividade geradora de novo conhecimento e a utilizaccedilatildeo de recursos do portal satildeo classificadas como pobres Neste indicador apenas a atividade dos fornecedores no portal eacute satisfatoacuteria Em termos de benefiacutecios observaacuteveis da abertura de dados governamentais o estudo apenas regista bons niacuteveis de transparecircncia governativa enquanto a participaccedilatildeo puacuteblica a inovaccedilatildeo e o empreendedorismo e a eficiecircncia governativas natildeo revelam impactos satisfatoacuterios

O cruzamento da informaccedilatildeo obtida atraveacutes das vaacuterias iniciativas de avaliaccedilatildeo da abertura de dados permite inferir algumas conclusotildees e tambeacutem revelar algumas disparidades O Open Data Barometer e o Open Data Maturity apontam o baixo impacto econoacutemico e social da abertura de dados em Portugal Gomes e Soares (2014) concluem que o problema em Portugal natildeo eacute quantidade de dados disponibilizados mas sim a quantidade de dados que satildeo reutilizados e como satildeo reutilizados

O Public Sector Information Scoreboard e o Open Data Maturity afirmam que Portugal natildeo possui uma poliacutetica de Dados Abertos o que como vimos natildeo corresponde agrave verdade Entre as vaacuterias iniciativas de avaliaccedilatildeo do estado de abertura de dados apenas trecircs publicaram informaccedilatildeo relativa a 2016 Apesar da equivalecircncia de ranking e taxa de abertura entre duas das iniciativas eacute redundante inferir qualquer conclusatildeo dado que estas natildeo medem o mesmo nuacutemero paracircmetros nem estes coincidem na maioria dos casos O Open Data Inventory refere-se a dados avaliados apenas do portal do INE para calcular a sua taxa de abertura pelo que tambeacutem deve ser relativizado

Como pontos positivos satildeo apontados a abertura de dados de diferentes domiacutenios o fato de todos os dados disponibilizados no portal estarem num formato processaacutevel

114

por maacutequina (Carrara Nieuwenhuis amp Vollers 2016) ao contraacuterio do que afirma a OECD (2015b) e o Open Data Inventory

Todos os iacutendices de avaliaccedilatildeo da maturidade do estado das iniciativas e poliacuteticas de Dados Abertos satildeo relativos a dados puacuteblicos natildeo tendo sido encontrada nenhuma estrutura de avaliaccedilatildeo das poliacuteticas de abertura de dados de investigaccedilatildeo

Tendo em conta o Quadro 5 eacute possiacutevel verificar a qualidade da abertura dos dados dos 60 portais de dados portugueses encontrados na web e inferir algumas conclusotildees Em termos de portais de dados de investigaccedilatildeo foram encontrados apenas 11 com os restantes 49 a conter dados do setor publico Os portais de dados estatiacutesticos satildeo os grandes dominadores do panorama nacional com 13 siacutetios web seguidos dos portais de dados econoacutemicos com 6 Dos 60 portais analisados apenas 33 disponibilizam dados legiacuteveis por maacutequina sendo que alguns portais natildeo o fazem totalmente Apenas 16 portais indicam usar uma licenccedila aberta que permita a livre reutilizaccedilatildeo dos dados e apenas 3 fornecem a indicaccedilatildeo do padratildeo de metadados usado Denota-se que alguns dos portais parecem usar um esquema proacuteprio de descriccedilatildeo de datasets no entanto estes natildeo parecem corresponder aos padrotildees de metadados mais reconhecidos Existem 17 portais que natildeo utilizam formatos abertos ou natildeo indicam sequer o tipo de formato Eacute possiacutevel jaacute encontrar jaacute tambeacutem 17 portais que fornecem dados em formatos estruturados

Em suma eacute necessaacuterio transpor a Diretiva da EU de 2013 e criar mais poliacuteticas municipais e institucionais mandatar a total abertura legal e teacutecnica de dados e a sua verificaccedilatildeo da qualidade O niacutevel de reutilizaccedilatildeo de dados e as atividades de treino e envolvimento dos cidadatildeos devem ser aumentados

O sucesso das poliacuteticas de Dados Abertos depende como vimos da criaccedilatildeo de um ecossistema sustentaacutevel e tambeacutem do impacto e reutilizaccedilatildeo que estes tipos de informaccedilatildeo possam induzir O impacto dos Dados abertos pode ser medido atraveacutes da citaccedilatildeo de dados ou atraveacutes de indicadores altimeacutetricos que permitem uma observaccedilatildeo mais clara e detalhada dos possiacuteveis impactos dos conjuntos de dados disponibilizados em AA sejam eles provenientes do setor puacuteblico ou das entidades de investigaccedilatildeo

115

Referecircncias Bibliograacuteficas

Agecircncia para a Modernizaccedilatildeo Administrativa (AMA) (2016a) Guia Dados Abertos Disponiacutevel na WWW httpwwwdadosgovptmedia46120guia_dados_abertos_amapdf

Agecircncia para a Modernizaccedilatildeo Administrativa (AMA) (2016b) Dadosgov [Consultado a 11-05-2017] Disponiacutevel na WWW httpwwwdadosgovpt

Agecircncia Portuguesa do Ambiente (2017) SNIAmb - Sistema Nacional de Informaccedilatildeo de Ambiente [Consultado a 12-05-2017] Disponiacutevel na WWW httpsniambapambienteptHomeDefaulthtm

Arzberger P et al (2004) An international framework to promote access to data Science 303(5665) 1777-1778 Disponiacutevel na WWW httpsciencesciencemagorgcontent30356651777full

Asociacioacuten Espantildeola de Normalizacioacuten y Certificacioacuten (2015) UNE 178301 Ciudades Inteligentes Datos Abiertos (Open Data) Madrid AENOR Beagrie C amp Houghton J (2014) The Value and Impact of Data Sharing and Curation A synthesis of three recent studies of UK research data centres Disponiacutevel na WWW httprepositoryjiscacuk55681iDF308_-_Digital_Infrastructure_Directions_Report2C_Jan14_v1-04pdf

Beall J (2012) Predatory publishers are corrupting open access Nature 489(7415) 179 Disponiacutevel na WWW httpswwwnaturecomnewspredatory-publishers-are-corrupting-open-access-111385

Bell G (2009) Foreword In Hey T Tansley S amp Tolle K (eds) (2009) The Fourth Paradigm Data-Intensive Scientific Discovery (pp XI-XV) Microsoft Research Disponiacutevel na WWW httpwwwastrocaltechedu~georgeaybi1994th_paradigm_book_complete_lrpdf

Berners-Lee Tim (2010) Is your Linked Open Data 5 Star Disponiacutevel na WWW httpswwww3orgDesignIssuesLinkedDatahtml

Big Data Europe (2016) Big Data Europe Empowering Communities with Data Technologies [Consultado a 22-11-2016] Disponiacutevel na WWW httpswwwbig-data-europeeu

BioDatapt Recursos [Consultado a 18-05-2017] Disponiacutevel na WWW httpwwwbiodataptresourceshtml

Biosharingorg (2017) Policies [Consultado a 22-05-2017] Disponiacutevel na WWW httpsbiosharingorgpolicies

Bjoumlrk B-C Laakso M Welling P amp Paetau P (2014) Anatomy of green open access Journal of the American Society for Information Science and Technology 65 237ndash250 Disponiacutevel na WWW httponlinelibrarywileycomwol1doi101002asi22963full

BOAI - Budapest Open Access Initiative (2002) Disponiacutevel na WWW httpwwwbudapestopenaccessinitiativeorg

116

BOAI - Budapest Open Access Initiative (2012) Ten years on from the Budapest Open Access Initiative setting the default to open Disponiacutevel na WWW httpwwwbudapestopenaccessinitiativeorgboai-10-recommendations

Borges M M (2006) A esfera comunicaccedilatildeo acadeacutemica e novos meacutedia (Tese de Doutoramento) Faculdade de Letras Universidade de Coimbra Portugal Disponiacutevel na WWW httpsestudogeralsibucptjspuibitstream1031685575MMBorges_tesepdf

Borgman C L (2015) Big Data Little Data No Data Scholarship in the Networked World The MIT Press

Bueno de la Fuente G (2016) What is Open Science Introduction Disponiacutevel na WWW httpswwwfosteropenscienceeucontentwhat-open-science-introduction

Cabinet Office (2012) Open Data White Paper Unleashing the Potential Disponiacutevel na WWW httpsdatagovuksitesdefaultfilesOpen_data_White_Paperpdf

Cabinet Office (2013) G8 Open Data Charter and Technical Annex Disponiacutevel na WWW httpswwwgovukgovernmentpublicationsopen-data-charterg8-open-data-charter-and-technical-annex

Cambridge University Press (2017) Cambridge Dictionary Disponiacutevel na WWW httpdictionarycambridgeorgdictionaryenglishpolicy

Carrara W Chan W S Fischer S Steenbergen E (2015) Creating Value through Open Data Study on the Impact of Re-use of Public Data Resources Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_creating_value_through_open_data_0pdf

Carrara W Fischer S Oudkerk F S Steenbergen E amp Tinholt D (2015) Analytical Report 1 Digital Transformations and Open Data Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_analytical_report_n1_-_digital_transformationpdf Carrara W Fischer S Steenbergen E (2015) Analytical Report 2 E-skills and Open Data Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_analytical_report_n2_-_e-skillspdf Carrara W Nieuwenhuis M amp Vollers H (2016) Open Data Maturity in Europe 2016 Insights into the European state of play Disponiacutevel na WWW httpswwwcapgemini-consultingcomresource-file-accessresourcepdfopen_data_maturity_in_europe_2016_final_v10_0pdf

Carrara W Oudkerk F Steenbergen E Tinholt D (2016a) European Data Portal Open Data Goldbook for Data Managers and Data Holders Capgemini Consulting Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesgoldbookpdf

117

Carrara W Engbers W Nieuwenhuis M amp Steenbergen E (2016b) Analytical report nordm4 Open Data in Cities Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_analytical_report_n4_-_open_data_in_cities_v10_finalpdf

Caruso J Nicol A amp Archambault Eacute (2013) Open Access Strategies in the European Research Area (August) 1ndash46 Retrieved from httpeuropaeurapidpress-release_IP-13-786_enhtmlocale=ennhttpwwwscience-metrixcompdfSM_EC_OA_Policiespdf

Carvalho J Furtado F amp Priacutencipe P (2017) WP4 ndash D25 ndash Kit sobre dados de investigaccedilatildeo RCAAP Disponiacutevel na WWW httpprojectorcaapptindexphplang-ptconsultar-recursos-de-apoioremositoryfunc=finishdownampid=395

Christensen-Dalsgaard B et al (2012) Ten recommendations for libraries to get started with research data management Final report of the LIBER working group on E-Science Research Data Management Disponiacutevel na WWW httplibereuropeeuwp-contentuploadsThe20research20data20group20201220v720finalpdf

CKAN CKAN The open source data portal software Disponiacutevel na WWW httpckanorg

Colpaert P Sarah J Peter M Mannens E Van de Walle R (2013) The 5 star of open data portals 7th internacional conference on methodologies Technologies and tools enabling e-Government (MeTTeG) 61-67 Disponiacutevel na WWW httppieterpm5stardataportals5starsofopendataportalspdf

Comissatildeo de Acesso aos Documentos Administrativos (CADA) Quem somos Disponiacutevel na WWW httpwwwcadapt

Comissatildeo Europeia (2011) Open data an engine for innovation growth and transparent governance Communication from the Commission to the European Parliament the Council the European economic and social committee and the committee of the regions (COM [2011] 882) Disponiacutevel na WWW httpwwweuroparleuropaeuRegDatadocs_autres_institutionscommission_europeennecom20110882COM_COM282011290882_ENpdf

Comissatildeo Europeia (2012) COMUNICACcedilAtildeO DA COMISSAtildeO AO PARLAMENTO EUROPEU AO CONSELHO AO COMITEacute ECONOacuteMICO E SOCIAL EUROPEU E AO COMITEacute DAS REGIOtildeES - Melhorar o acesso agrave informaccedilatildeo cientiacutefica rentabilizar o investimento puacuteblico em investigaccedilatildeo COM (2012) 401 final Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentENTXTuri=COM20120401FIN

Comissatildeo Europeia (2013) EU implementation of the G8 Open Data Charter Disponiacutevel na WWW httpseceuropaeudigital-single-marketnewseu-implementation-g8-open-data-charter

Comissatildeo Europeia (2014) COMUNICACcedilAtildeO DA COMISSAtildeO AO PARLAMENTO EUROPEU AO CONSELHO AO COMITEacute ECONOacuteMICO E SOCIAL EUROPEU E AO COMITEacute DAS REGIOtildeES - Para

118

uma economia dos dados proacutespera COM(2014) 442 final Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentENTXTuri=COM20140442FIN

Comissatildeo Europeia (2016a) Open innovation Open Science open to the world A vision for Europe Brussels European Commission Directorate-General for Research and Innovation Disponiacutevel na WWW httpbookshopeuropaeuenopen-innovation-open-science-open-to-the-world-pbKI0416263

Comissatildeo Europeia (2016b) Research amp Innovation News Alert Commission proposes copyright exception for researchers Disponiacutevel na WWW httpeceuropaeuresearchindexcfmpg=newsalertampyear=2016ampna=na-140916

Comissatildeo Europeia (2016c) COMUNICACcedilAtildeO DA COMISSAtildeO AO PARLAMENTO EUROPEU AO CONSELHO AO COMITEacute ECONOacuteMICO E SOCIAL EUROPEU E AO COMITEacute DAS REGIOtildeES ndash Iniciativa Europeia para a Nuvem ndash Construir uma economia de dados e conhecimento competitiva na Europa COM(2016) 178 final Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentPTALLuri=CELEX52016DC0178

Comissatildeo Europeia (2016d) Europa liacuteder mundial da economia baseada nos dados graccedilas agrave iniciativa europeia para a computaccedilatildeo em nuvem Comissatildeo Europeia comunicado de imprensa Disponiacutevel na WWW httpeuropaeurapidpress-release_IP-16-1408_pthtm

Comissatildeo Europeia (2017a) Digital Single Market Digital Economy amp Society Disponiacutevel na WWW httpseceuropaeudigital-single-marketenwhat-big-data-can-do-you

Comissatildeo Europeia (2017b) H2020 Programme AGA ndash Annotated Model Grant Agreement Disponiacutevel na WWW httpeceuropaeuresearchparticipantsdatarefh2020grants_manualamgah2020-amga_enpdf

Comissatildeo Europeia (2017c) COMUNICACcedilAtildeO DA COMISSAtildeO AO PARLAMENTO EUROPEU AO CONSELHO AO COMITEacute ECONOacuteMICO E SOCIAL EUROPEU E AO COMITEacute DAS REGIOtildeES - Construir uma economia de dados proacutespera COM(2017) 9 final Disponiacutevel na WWW httpeceuropaeutransparencyregdocrep12017PTCOM-2017-9-F1-PT-MAIN-PART-1PDF

Comissatildeo Europeia Grupo de peritos de alto niacutevel em dados de investigaccedilatildeo (2010) Riding the wave how Europe can gain from the rising tide of scientific data Disponiacutevel na WWW httpeceuropaeuinformation_societynewsroomcfitemlongdetailcfmitem_id=6204

Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2016a) H2020 Programme Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020 Disponiacutevel na WWW httpseceuropaeuresearchparticipantsdatarefh2020grants_manualhioa_piloth2020-hi-oa-pilot-guide_enpdf

Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2016b) Realising the European Open Science Cloud First report and recommendations Group of the Commission

119

High Level Expert Cloud on the European Open Science Luxemburgo Publications Office of the European Union Disponiacutevel na WWW httpseceuropaeuresearchopensciencepdfrealising_the_european_open_science_cloud_2016pdf

Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2016c) H2020 Programme Guidelines on FAIR Data Management in Horizon 2020 Disponiacutevel na WWW httpeceuropaeuresearchparticipantsdatarefh2020grants_manualhioa_piloth2020-hi-oa-data-mgt_enpdf

Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2017) Open Science Monitor Disponiacutevel na WWW httpeceuropaeuresearchopenscienceindexcfmpg=aboutampsection=monitor

Comissatildeo Executiva Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta (Comissatildeo Executiva GT-PNCA) (2016) Primeiro Relatoacuterio da Comissatildeo Executiva Grupo de Trabalho Para a Poliacutetica Nacional de Ciecircncia Aberta Disponiacutevel na WWW httpmediawixcomugda8bd7c_1ca622bff7f34abbad228ac94e1eda16pdf

Concordat on Open Research Data (2016) Disponiacutevel na WWW httpwwwrcukacukdocumentsdocumentsconcordatonopenresearchdata-pdf

Croll A (2012) The feedback economy In Planning for big data (pp 1-8) Sebastepol OacuteReilly Media

Cybermetrics Lab (2017) Ranking web of repositories [Consultado a 02-02-2017] Disponiacutevel na WWW httprepositorieswebometricsinfoen

Dallmeier-Tiessen et al (2011) Highlights from the SOAP project survey What Scientists Think about Open Access Publishing arXiv11015260 [Cs] 14 httpsarxivorgabs11015260

DataCite (2017a) re3data registry of research data repositories [Consultado a 02-05-2017] Disponiacutevel na WWW httpwwwre3dataorg

DataCite (2017b) Search [Consultado a 02-05-2017] Disponiacutevel na WWW httpssearchdataciteorg

Data Documention Iniciative (DDI) (2016) Document Discover and Interoperate Disponiacutevel na WWW httpwwwddiallianceorg

DataHub Datasets [Consultado a 03-01-2017] Disponiacutevel na WWW httpsdatahubiodatasetq=portugalamppage=1

DataCite (2017) Search [Consultado a 18-05-2017] Disponiacutevel na WWW httpssearchdataciteorg

Davies T (2012) 5-Stars of Open Data Engagement Disponiacutevel na WWW httpwwwtimdaviesorguk201201215-stars-of-open-data-engagement

Davies T (2014) Open data policies and practice an internacional comparison Paper for European Consortium for Political Research Panel P356 ndashThe Impacts of Open Data Disponiacutevel na WWW httpsecpreuFilestorePaperProposald591e267-cbee-4d5d-b699-7d0bda633e2epdf

120

Dawes S Vidiasova L amp Parkhimovich O (2016) Planning and designing open government data programs An ecosystem approach Government Information Quarterly 33(1) 15-27 Disponiacutevel na WWW httpwwwsciencedirectcomsciencearticlepiiS0740624X1630003X

Declaraccedilatildeo de Bethesda sobre a Publicaccedilatildeo em Acesso Aberto (2003) Disponiacutevel na WWW httplegacyearlhamedu~petersfosbethesdahtm

Declaraccedilatildeo de Berlim sobre Acesso Livre ao Conhecimento nas Ciecircncias e Humanidades (2003) Disponiacutevel na WWW httpsrepositoriumsdumuminhoptaboutDeclaracaoBerlimhtm

Decreto-Lei nordm 1152013 de 7 de agosto do Ministeacuterio da Educaccedilatildeo e Ciecircncia Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 151 (2013) 4749-4772 Disponiacutevel na WWW httpsdreptapplicationdirpdf1sdip201308151000474904772pdf

Despacho nordm 153892016 de 12 de dezembro do Ministeacuterio das Financcedilas e da Secretaria de Estado da Cultura e Ciecircncia Tecnologia e Ensino Superior Diaacuterio da Repuacuteblica nordm 2442016 Seacuterie II Nordm 244 (2016) 37155 ndash 37156 Disponiacutevel na WWW httpsdreptapplicationfilea105580126

Dietrich D (2013) Open Government Data principles concepts amp best practice Disponiacutevel na WWW httpworkspaceunpanorgsitesInternetDocumentsUNPAN95209pdf

Dietrich D Cherkasov V Susar D (2013) Open Government Data for Citizen Engagement in Managing Development Disponiacutevel na WWW httpworkspaceunpanorgsitesInternetDocumentsOGDCE20Toolkit20v113-Feb2013pdf

Directory of Open Access Journals (DOAJ) (2017) Search [Consultado a 27-05-2017] Disponiacutevel na WWW httpsdoajorg

Dodds L Newman A (2015) Open Data Maturity Model ed 10 Disponiacutevel na WWW httptheodiorgguidesmaturity-model

Donker F amp van Loenen B (2017) How to assess the sucess of the open data ecossystem Internacional journal of digital eart 10(3) 284-306 Disponiacutevel na WWW httpwwwtandfonlinecomdoifull1010801753894720161224938

Dumbill E (2012) What is Big Data In Planning for big data (pp 9-16) Sebastepol OacuteReilly Media Disponiacutevel na WWW httpeecswsuedu~yinghuimatcoursesfall202015resourcesplanning-for-big-datapdf

e-Infraestruture Reflection Group (e-IRG) (2016) Long Tail of Data e-IRG Task Force Report Disponiacutevel na WWW httpe-irgeudocuments10920238968LongTailOfData2016pdf

ELIXIR Portugal (2015) What is ELIXIR Portugal Disponiacutevel na WWW httpelixir-portugalorg

ePSI Scoreboard (2013) ePSI platform scoreboard Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesoverview_page_-_epsi_platform_scoreboardpdf

Etalab (2011) Licence Ouvert Disponiacutevel na WWW httpswwwetalabgouvfrenlicence-ouverte-open-licence

EUDAT(a) What is EUDAT Disponiacutevel na WWW httpseudateuwhat-eudat

121

EUDAT(b) B2FIND [Consultado a 22-05-2017] Disponiacutevel na WWW httpb2findeudateu

EUR-Lex (2003a) Directive 200398EC of the European Parliament and of the Council of 17 November 2003 on the re-use of public sector information Official Journal of the European Union 90-96 Disponiacutevel na WWW httpeur-lexeuropaeuLexUriServLexUriServdouri=OJL200334500900096enPDF

EUR-Lex (2003b) Directive 20034EC of the European Parliament and of the Council of 28 January 2003 on public access to environmental information and repealing Council Directive 90313EEC Official Journal of the European Union 26-32 Disponiacutevel na WWW httpeur-lexeuropaeuLexUriServLexUriServdouri=OJL200304100260032ENPDF

EUR-Lex (2011) COMMISSION DECISION of 12 December 2011 on the reuse of Commission documents (2011833EU) Official Journal of the European Union 39-42 Disponiacutevel na WWW httpeur-lexeuropaeuLexUriServLexUriServdouri=OJL201133000390042ENPDF

EUR-Lex (2012) COMMISSION RECOMMENDATION of 17 July 2012 on access to and preservation of scientific information (2012417EU) Official Journal of the European Union 39-43 Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentENTXTuri=celex3A32012H0417

EUR-Lex (2013) Directive 201337EU of the European Parliament and of the Council of 26 June 2013 amending Directive 200398EC on the re-use of public sector information Official Journal of the European Union 1ndash8 Disponiacutevel na WWW httpeur-lexeuropaeuLexUriServLexUriServdouri=OJL201317500010008ENPDF

EUR-Lex (2016) REGULAMENTO (UE) 2016679 DO PARLAMENTO EUROPEU E DO CONSELHO de 27 de abril de 2016 relativo agrave proteccedilatildeo das pessoas singulares no que diz respeito ao tratamento de dados pessoais e agrave livre circulaccedilatildeo desses dados e que revoga a Diretiva 9546CE (Regulamento Geral sobre a Proteccedilatildeo de Dados) Jornal Oficial da Uniatildeo Europeia 1-88 Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentPTTXTPDFuri=CELEX32016R0679ampfrom=PT

European Data Portal (2016) Conjuntos de dados [Consultado a 12-05-2017] Disponiacutevel na WWW httpswwweuropeandataportaleudataptdataset

European Research Area and Innovation Committee (ERAC) (2016) ERAC opinion on open research data (ERAC 120216) Disponiacutevel na WWW httpwwweartoeufileadmincontentWebsiteERAC_Opinion_on_Open_Research_DataPDF

Erway R Horton L Nurnberger A Otsuji R amp Rushing A (2016) Building blocks laying the foundation for a research data management program Dublin Ohio OCLC Research Disponiacutevel na WWW httpswwwoclcorgcontentdamresearchpublications2016oclcresearch-data-management-building-blocks-2016pdf

Expert Advisory Group on Data Acess (EAGDA) (2014) Establishing Incentives and changing cultures to support data acess Disponiacutevel na WWW httpswellcomeacuksitesdefaultfilesestablishing-incentives-and-changing-cultures-to-support-data-access-eagda-may14pdf

Executive Office of the President Office of Managment and Budget (2013) MEMORANDUM FOR THE HEADS OF EXECUTIVE DEPARTMENTS AND AGENCIES Open Data Policy - Managing Information as an Asset Disponiacutevel na WWW

122

httpsobamawhitehousearchivesgovsitesdefaultfilesombmemoranda2013m-13-13pdf

Fan W amp Bifet A (2012) Mining Bid Data Current Status and Forecast to the Future SIGKDDExplorations 14(2) 1-5 Disponiacutevel na WWW httpwwwkddorgexploration_filesV14-02-01-Fanpdf

Fecher B amp Friesike S (2013) Open Science One Term Five Schools of Thought In Bartling S amp Friesike (Eds) Opening Science (pp 17-47) New York Springer Disponiacutevel na WWW httpswwwresearchgatenetpublication236607487_Open_Science_One_Term_Five_Schools_of_Thought

FIWARE (2015) Porto a city that has become a real-time guide Disponiacutevel na WWW httpswwwfiwareorg20151120porto-a-city-that-has-become-a-real-time-guide

FORCE11 FAIR Data Publishing Group (2014) The FAIR Data Principles Disponiacutevel na WWW httpswwwforce11orggroupfairgroupfairprinciples

Forsstroumlm P amp Haataja J (2016) Open Science as an Instrument for Effective Research Disponiacutevel na WWW httpojstsvfiindexphpsignumarticleviewFile5874120303

FOSTER (2016) About FOSTER portal Disponiacutevel na WWW httpswwwfosteropenscienceeuabout

Fundaccedilatildeo para a Ciecircncia e Tecnologia [FCT] (2014) Poliacutetica sobre a Disponibilizaccedilatildeo de Dados e outros Resultados de Projetos de IampD Financiados Pela FCT Disponiacutevel na WWW httpswwwfctptdocumentosPoliticaAcessoAberto_Dadospdf

G20rsquos Anti-corruption Working Group (2014) G20 Anti-corruption Open Data Principles Disponiacutevel na WWW httpwwwg20utorontoca2015G20-Anti-Corruption-Open-Data-Principlespdf

Garcia M (2015) New businesses around open data smart cities and Fiware European Public Sector Information Platform Topic Report Nordm 201504 Disponiacutevel na WWW httpwwwinvesthorizoneuresourcesdocuments6263232145-New-Businesses-Around-Open-Data-Smart-Cities-FIWAREpdf

Garfield E (2006) The History and Meaning of the Journal Impact Factor Journal of the American Medical Association (JAMA) 293 90-93 Disponiacutevel na WWW httpgarfieldlibraryupennedupapersjifchicago2005pdf

GitHub (2017) Search [Consultado a 18-05-2017] Disponiacutevel na WWW httpsgithubcomsearchutf8=E29C93ampq=portugalamptype=

Gomes A amp Soares D (2014) Open government iniciatives in Europe nothern versus Southern countries analysis In ICEGOV2014 Outubro 27-30 Guimaratildees Portugal Disponiacutevel na WWW httphdlhandlenet182237172

Gonzalez-Zapata F amp Heeks R (2015) The multiple meanings of open government data understanding different stakeholders and their perspectives Government Information Quarterly 32(4) 441-452 Disponiacutevel na WWW httpsdoiorg101016jgiq201509001

123

Granickas K (2013) Understanding the impact of releasing and re-usinf open government data European Public Sector Information Platform Topic Report Nordm 2013 08 Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfileslibrary201308_understanding_the_impact_of_releasing_and_re_using_open_datapdf

Hahnel M amp Hook D (2016) Open by default In Treadway J et al The state of open data a selections of analyses and articles about open data curated by Figshare (pp 3-6) Disponiacutevel na WWW httpsfigsharecomarticlesThe_State_of_Open_Data_Report40363981

Harnad S et al (2004) The AccessImpact Problem and the green and gold roads to Open Access Serials Review 30(4) Disponiacutevel na WWW httpusersecssotonacukharnadTempimpacthtml

Harnad S amp Brody T (2004) Comparing the Impact of Open Access (OA) vs Non-AO Articles in the Same Journals D-Lib Magazine 10(6) Disponiacutevel na WWW httpwwwdliborgdlibjune04harnad06harnadhtml

Hernaacutendez-Peacuterez T (2016) En la era de la web de los datos primero datos abiertos despueacutes datos massivos El profesional de la informacioacuten 25(4) 517-525 Disponiacutevel na WWW httpsdoiorg103145epi2016jul01

Hey T Tansley S amp Tolle K (2009) Jim Gray on eScience A Transformed Scientific Method In Hey T Tansley S amp Tolle K (eds) (2009) The Fourth Paradigm Data-Intensive Scientific Discovery (pp 5-12) Microsoft Research Disponiacutevel na WWW httpwwwastrocaltechedu~georgeaybi1994th_paradigm_book_complete_lrpdf

Hogge B (2010) Open Data Study Open Society Institute Disponiacutevel na WWW httpwwwtransparencyinitiativeorgwpcontentuploads201105open_data_study_finalpdf

Houghton J amp Swan A (2013) Planting the green seeds for a golden harvest Comments and clarifications on ldquoGoing for Goldrdquo D-Lib Magazine 19 1ndash2 Disponiacutevel na WWW httpdoiorg101045january2013-houghton

Huijboom N van den Broek T (2011) Open Data an internacional comparison of strategies European Journal of ePractice 12 4-16 Disponiacutevel na WWW httpsjoinupeceuropaeusitesdefaultfiles76a705ePractice20Journal-20Vol2012-March_April202011pdf

Internacional Council for Science (ICSU) (2014) Open acess to scientific data and literature and the assessement of research by metrics Disponiacutevel na WWW httpwikilibsunaczaimagesbb8Icsu-report-on-open-accesspdf

International Open Data Charter (2015) Open Data Charter Disponiacutevel na WWW httpopendatacharternet

International Workshop on Open Data for Science and Sustainability in Developing Countries (2014) Data Sharing Principles in Developing Countries (The Nairobi Data Sharing Principles)

124

Disponiacutevel na WWW httpswwwrd-allianceorgsitesdefaultfilesattachmentNairobiDataSharingPrinciplespdf

Janssen M (2011) The influence of the PSI directive on open government data an overview of recent developments Government Information Quaterly 28 446-456 Disponiacutevel na WWW httpsdoiorg101016jgiq201101004

Janssen M Charalabidis Y amp Zuiderwijk A (2012) Benefits adoption barriers and myths of open data and open government Information Systems Management 4 258-268 Disponiacutevel na WWW httpwwwtandfonlinecomdoiabs101080105805302012716740

Jenssen K (2012) Open Government Data and the right to information opportunities and obstacles The Journal of Community Informatics 8 (2) Disponiacutevel na WWW httpci-journalnetindexphpciejarticleview952

Koski H (2015) The impact of open data ndash a preliminary study Ministry of Finance publications 15b2015 Disponiacutevel na WWW httpswwww3org2013share-psiwikiimages667Impact_of_Open_Data_in_the_Public_Sector_Koski_2015pdf

Kramer B amp Bosman J (2016) Innovations in Scholarly Communication [Consultado a 24-02-2017] Disponiacutevel na WWW https101innovationswordpresscom

Laakso M (2014) Green open access policies of scholarly journal publishers A study of what when and where self-archiving is allowed Scientometrics 99(2) 475ndash494 Disponiacutevel na WWW httpdoiorg101007s11192-013-1205-3

Laumlmmerhirt D (2016) PASTEUR4OA Briefing Paper Disciplinary differences in opening research data Disponiacutevel na WWW httpwwwpasteur4oaeuresources209

Laney D (2001) 3-D Data Management Controlling DataVolume Velocity and Variety META Group Disponiacutevel na WWW httpswwwnoexperiencenecessarybookcom8VeXJ3d-data-management-controlling-data-volume-velocity-and-varietyhtml

Lei nordm 462007 de 24 de Agosto Regula o acesso aos documentos administrativos e a sua reutilizaccedilatildeo revoga a Lei nordm 6593 de 26 de Agosto com a redaccedilatildeo introduzida pelas Lei nordm 895 de 29 de Marccedilo e 9499 de 16 de Julho e transpotildee para a ordem juriacutedica nacional a Diretiva nordm 200398CE do Parlamento e do Conselho de 17 de Novembro relativa agrave reutilizaccedilatildeo de informaccedilotildees do sector puacuteblico Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 163 (2007) 5680-5687 Disponiacutevel na WWW httpswwwfctptarquivodocsLei46_2007pdf

Lei nordm 362011 de 21 de Junho Estabelece a adopccedilatildeo de normas abertas nos sistemas informaacuteticos do Estado Diaacuterio da Repuacuteblica 1ordf seacuterie mdash Nordm 118 (2011) 3599-3600 Disponiacutevel na WWW httpsm6amaptdocsLei362011-NormasAbertaspdf

Lei nordm 262016 de 22 de Agosto Aprova o regime de acesso agrave informaccedilatildeo administrativa e ambiental e de reutilizaccedilatildeo dos documentos administrativos transpondo a Diretiva 20034CE do Parlamento Europeu e do Conselho de 28 de janeiro e a Diretiva 200398CE do Parlamento Europeu e do Conselho de 17 de novembro Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 160 (2016) 2777-2788 Disponiacutevel na WWW httpsdreptapplicationconteudo75177801

125

Leonelli S (2016) Why open data now Big data knowledge production and the political economy of research In Treadway J et al The state of open data a selections of analyses and articles about open data curated by Figshare (pp 7-11) Disponiacutevel na WWW httpsfigsharecomarticlesThe_State_of_Open_Data_Report40363981

Leonelli S Spichtinger D and Prainsack B (2015) Sticks and carrots encouraging open science at its source Geography and Environment 2 12ndash16 Disponiacutevel na WWW httponlinelibrarywileycomenhancedexportCitationdoi101002geo22

Lisboa Cacircmara Municipal (2016) Smart Open Lisboa Disponiacutevel na WWW httpwwwsmartopenlisboacom

Lisboa Cacircmara Municipal (2017) Lisboa Aberta [Consultado a 12-05-2017] Disponiacutevel na WWW httpdadoscm-lisboaptdataset

Lynch C (2009) Jim Grayrsquos Fourth Paradigm and the Construction of the Scientific Record In Hey T Tansley S amp Tolle K (eds) (2009) The Fourth Paradigm Data-Intensive Scientific Discovery (pp 177-183) Microsoft Research Disponiacutevel na WWW httpwwwastrocaltechedu~georgeaybi1994th_paradigm_book_complete_lrpdf

Machado Jorge (2015) Open Data and Open Science In Albagli S Maciel M amp Abdo A (Eds) Open Science Open Issues 189-214 Brasiacutelia IBICT Rio de Janeiro Unirio Disponiacutevel na WWW httplivroabertoibictbrbitstream110611Open20Science20open20issues_Digitalpdf

Manyika J Chui M Brown B Bughin J Dobbs R Roxburgh C amp Byers A H (2011) Big Dat The next frontier for innovation competition and productivity McKinsey Global Institute Disponiacutevel na WWW httpwwwmckinseycombusiness-functionsdigital-mckinseyour-insightsbig-data-the-next-frontier-for-innovation

Marr B (2014) Big Data The 5 Vs Everyone Must Know Disponiacutevel na WWW httpswwwlinkedincompulse20140306073407-64875646-big-data-the-5-vs-everyone-must-know

Naccedilotildees Unidas (2015) Addis Ababa Action Agenda of the Third International Conference on Financing for Development (Addis Ababa Action Agenda) Disponiacutevel na WWW httpssustainabledevelopmentunorgcontentdocuments2051AAAA_Outcomepdf

National Institutes of Health (NIH) (2008) NIH Guide Notice for Public Access Disponiacutevel na WWW httpgrantsnihgovgrantsguidenotice-filesNOT-OD-08-033html

Nature Springer (2016) Over 600 Springer Nature journals commit to new data sharing policies Disponiacutevel na WWW httpwwwspringernaturecombrgroupmediapress-releasesover-600-springer-nature-journals-commit-to-new-data-sharing-policies11111248

OECD (2007) Principles and Guidelines for Access to Research Data from Public Funding Paris OECD Publishing Disponiacutevel na WWW httpwwwoecdorgstisci-techoecdprinciplesandguidelinesforaccesstoresearchdatafrompublicfundinghtm

126

OECD (2013) Open Government data In Government at a Glance 2013 (pp 140-142) Paris OECD Publishing Disponiacutevel na WWW httpdxdoiorg101787gov_glance-2013-48-en

OECD (2015a) Making Open Science a Reality OECD Science Tecnology and Industy Policy Papers 25 Paris OECD Publications Disponiacutevel na WWW httpdoiorg1017875jrs2f963zs1-en

OECD (2015b) Assessing government initiatives on public sector information A review of the OECD Council Recommendation OECD Digital Economy Papers 248 Paris OECD Publishing Disponiacutevel na WWW httpdxdoiorg1017875js04dr9l47j-en

OECD (2016a) Open Government Data Disponiacutevel na WWW httpwwwoecdorggovdigital-governmentopen-government-datahtm

OECD (2016b) Observatory of Public Sector Innovation Disponiacutevel na WWW httpswwwoecdorggovernanceobservatory-public-sector-innovationhome

Olavsrud T (2013 Abril 05) 10 intriguing real-world uses for big data Computer World Disponiacutevel na WWW httpwwwcomputerworldcomarticle2473691big-data92712-10-Real-World-Big-Data-Deployments-That-Will-Change-Our-Liveshtml

Open Acess Directory (2016) Data repositories [Consultado a 22-02-2017] Disponiacutevel na WWW httpoadsimmonseduoadwikiData_repositories

OpenAIRE Research Data [Consultado a 12-05-2017] Disponiacutevel na WWW httpswwwopenaireeusearchfinddatasetskeyword=

OpenAIRE (2017) About OpenAIRE-Connect Disponiacutevel na WWW httpswwwopenaireeuconnect

Open and Agile Smart Cities (OASC) (2017) Cities [Consultado a 17-05-2017] Disponiacutevel na WWW httpwwwoascitiesorglist-of-cities

Open Data for Development Network (OD4D[a]) About OD4D [Consultado a 16-02-2017] Disponiacutevel na WWW httpod4dcomabout

Open Data for Development Network (OD4D[b]) Open Data Impact Map [Consultado a 16-02-2017] Disponiacutevel na WWW httpopendataimpactmaporgindexhtml

Open Data for Development Network (OD4D) (2016) Summary report and the Second Action Plan for International Collaborations International Open Data Roadmap International Open Data Conference 2016 6-7 outubro Madrid Espanha Disponiacutevel na WWW httpod4dcomroadmapassetsfilesreport-iodc-2016-webpdf

Open Data Institute (ODI) (2012) About the ODI Disponiacutevel na WWW httptheodiorgabout

Open Data Institute (ODI) (2015) Open Data Maturity Model assessing your open data publishing and use Disponiacutevel na WWW httpsptscribdcomdocument260481608ODI-Maturity-Model-Guide-Assessing-your-open-data-publishing-and-use

127

Open Data Soft (2017) A comprehensive list of 2600+ Open Data portals around the world [Consultado a 15-04-2017] Disponiacutevel na WWW httpswwwopendatasoftcoma-comprehensive-list-of-all-open-data-portals-around-the-world

Open Government Partnership (OGP) (2011) Open Government Declaration Disponiacutevel na WWW httpswwwopengovpartnershiporgopen-government-declaration

Open Government Partnership (OGP) (2015) What is the Open Government Partnership Disponiacutevel na WWW httpwwwopengovpartnershiporg

Open Government Partnership (OGP) (2016) PARIS DECLARATION 4th Global Summit of the Open Government Partnership Disponiacutevel na WWW httpwwwopengovpartnershiporgsitesdefaultfilesOGP-Summit_PARIS-DECLARATION_ENpdf

Open Knowledge International (OKI [a]) Open Definition 21 Disponiacutevel na WWW httpopendefinitionorgod21en

Open Knowledge International (OKI [b]) Linked Open Vocabularies [Consultado a 31-01-2017] Disponiacutevel na WWW httplovokfnorgdatasetlov

Open Knowledge International (OKI [c]) Open Data Commons Disponiacutevel na WWW httpopendatacommonsorg

Open Knowledge International (OKI [d]) Datahub [Consultado a 18-02-2017] Disponiacutevel na WWW httpsdatahubio

Open Knowledge International (OKI) (2012a) The Open Data Handbook Disponiacutevel na WWW httpopendatahandbookorgguideen

Open Knowledge International (OKI) (2012b) What is open Disponiacutevel na WWW httpsokfnorgopendata

Open Knowledge International (OKI) (2014) Portugal Open Data Census Disponiacutevel na WWW httppt-citycensusokfnorgyear2014

Open Knowledge International (OKI) (2017) Global Open Data Index Disponiacutevel na WWW httpindexokfnorgplace

Open Knowledge International Working Group on Open Government Data () Open Government Data Disponiacutevel na WWW httpopengovernmentdataorg

Open Science and Research Iniciative (2014) The Open Science and Research Handbook Disponiacutevel na WWW httpsavointiedefidocuments142730Open+Science+and+Research+Handbook+v1050316d5d-440b-4496-b039-2997663afff8

Open Science Monitor (2015) Open Science Monitor Disponiacutevel na WWW httpopendatamonitoreu

128

Pangea (2017) Search [Consultado a 18-05-2017] Disponiacutevel na WWW httpswwwpangaeadeq=Portugal

Panton Principles (2010) Panton Principles Principles for open data in science Disponiacutevel na WWW httppantonprinciplesorg

Pasqueto I Sands A amp Borgman C (2015 novembro) Exploring openess in data and science What is ldquoopenrdquo to whom when and why Apresentado em ASIST 2015 6 - 10 Novembro St Louis MO USA Disponiacutevel na WWW httponlinelibrarywileycomdoi101002pra220151450520100141full

Pontika N Knoth P Cancellieri M amp Pearce S (2015 outubro) Fostering Open Science to Research using a Taxonomy and an eLearning Portal Apresentado em I-KNOW rsquo15 Proceedings of the 15th International Conference on Knowledge Technologies and Data-Driven Busines 21 - 22 Outubro 2015 1ndash8 Graz Austria Disponiacutevel na WWW httpdoiorg10114528095632809571

Pontika N Knoth P Cancellieri M amp Pearce S (2015) Open Science Taxonomy Figshare Disponiacutevel na WWW httpsdxdoiorg106084m9figshare1508606v3

Portal de Dados de Biodiversidade de Portugal (2016) Dados [Consultado a 18-05-2017] Disponiacutevel na WWW httpdadosgbifpt

Portaria nordm 2852015 de 15 de setembro do Ministeacuterio da Educaccedilatildeo e Ciecircncia Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 180 (2015) 8011-8014 Disponiacutevel na WWW httpsdreptapplicationconteudo70297426 Porto Cacircmara Municipal Dados Abertos para uma cidade mais inteligente [Consultado a 22-05-2017] Disponiacutevel na WWW httpdadosabertoscm-portoptabout

Portugal Governo (2017) Portal da Transparecircncia Municipal [Consultado a 20-05-2017] Disponiacutevel na WWW httpswwwportalmunicipalpthomelocale=pt

Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior Ministeacuterio da Cultura (2016) Diretoacuterio dos Repositoacuterios Digitais Disponiacutevel na WWW httprepositorios-conhecimentopt

Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior (MCTES) (2016) Ciecircncia Aberta Conhecimento para todos Princiacutepios orientadores Disponiacutevel na WWW httpwwwportugalgovptmedia1850619920160210-mctes-ciencia-abertapdf

Price D amp Chaytor S (2015) Open Access is a national licence the answer Disponiacutevel na WWW httpwwwhepiacuk20150330open-access-national-licence-answeruna-licencia-nacional-es-la-respuesta

Proumll S Meixner K amp Rauber A (2016) Precise Data Identification Services for Long Tail Research Data Proceedings of International Conference on Digital Preservation Bern Switzerland Disponiacutevel na WWW httpswwwrd-allianceorgsystemfilesdocumentsiPRES2016-Proellpdf

129

Rans J Day M Duke M amp Ball A (2013) Enabling the citation of datasets generated through public health research (DCC) 41 Retrieved from httpswellcomeacuksitesdefaultfilesenabling-citation-of-datasets-through-public-health-research-phrdf-2013PDF

RECODE (2014) Policy recommendations for open access to research data Disponiacutevel na WWW httprecodeprojecteuwp-contentuploads201501recode_guideline_en_web_version_full_FINALpdf

Registry of Open Access Repository Mandates and Policies (ROARMAP) Browse [Consultado a 25-11-2016] Disponiacutevel na WWW httproarmapeprintsorgviewcountry620html

Reitano S (2013) The Benefits of Open Data Royal Roads University Disponiacutevel na WWW httpdocplayernet589190-The-benefits-of-open-datahtml

Resoluccedilatildeo do Conselho de Ministros nordm 912010 Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 225 (2010) 5288-5307 Disponiacutevel na WWW httpsdreptapplicationdirpdf1s201011225000528805307pdf

Resoluccedilatildeo do Conselho de Ministros nordm 212016 Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 70 (2016) 1191-1193 Disponiacutevel na WWW httpsdreptapplicationconteudo74094659

Research Data Alliance (RDA) (2015) 23 Things Libraries for Research Data Disponiacutevel na WWW httpswwwrd-allianceorgsystemfilesdocuments23Things_Libraries_For_Data_Managementpdf

Ribeiro C et al (2016) Projeto TAIL ndash Gestatildeo de dados de investigaccedilatildeo da produccedilatildeo ao depoacutesito e agrave partilha (resultados preliminares) Cadernos BAD 2 (jul-dez) 256-264 Disponiacutevel na WWW httpwwwbadptpublicacoesindexphpcadernosarticleviewFile1603pdf

Rouder J (2016) The what why and how of born-open data Behavior Research Methods 48(3) 1062-1069 Disponiacutevel na WWW httplinkspringercomarticle103758s13428-015-0630-z

Royal Society (2012) Science as an Open Enterprise The Royal Society Policy Centre Report 0212 Disponiacutevel na WWW httpsroyalsocietyorgtopics-policyprojectsscience-public-enterprisereport

Sasse T Smith A Broad E Tennison J Wells P amp Atz U (2017) Recomendations for Open Data Portals from Setup to sustainability Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_s3wp4_sustainability_recommendationspdf

Schiermeier Q (2015 Dezembro 04) Pirate research-paper sites play hide-and-seek with publishers Nature Internacional weekly journal of science Disponiacutevel na WWW httpwwwnaturecomnewspirate-research-paper-sites-play-hide-and-seek-with-publishers-118876

130

Science International (2015) Open Data in a Big Data World Paris International Council for Science (ICSU) International Social Science Council (ISSC) The World Academy of Sciences (TWAS) InterAcademy Partnership (IAP) Disponiacutevel na WWW httpwwwscience-internationalorgsitesdefaultfilesreportsopen-data-in-big-data-world_short_enpdf

Science International (2016) About Science International Disponiacutevel na WWW httpwwwscience-internationalorgabout

ScienceOpen (2017) About ScienceOpen Disponiacutevel na WWW httpaboutscienceopencomcategoryabout-scienceopen

Sci-Hub About Disponiacutevel na WWW httpsci-hubio

Shadbolt N (2016) Foreword In Treadway J et al The state of open data a selections of analyses and articles about open data curated by Figshare (pp 2) Disponiacutevel na WWW httpsfigsharecomarticlesThe_State_of_Open_Data_Report40363981

SHERPAJULIET Research funders open access policies [Consultado a 26-11-2016] Disponiacutevel na WWW httpsherpaacukjulietindexphpla=enampmode=simple

SHERPARoMEO Publisher copyright policies amp self-archiving [Consultado a 26-11-2016] Disponiacutevel na WWW httpsherpaacukromeoindexphpla=enampfIDnum=1109|1ampmode=advanced

Soares N Baptista A amp Lima A (2015) Estudo Open Data Municiacutepios Quadrilaacutetero Disponiacutevel na WWW httpwwwccgptwp-contentuploads201510OpendataQuadrilatero_Estudopdf

SPARC Open Data Disponiacutevel na WWW httpsparcopenorgopen-data

Sponsoring Consortium for Open Access Publishing in Particle Physics (SCOAP3) (2014) What is SCOAP3 Disponiacutevel na WWW httpsscoap3orgwhat-is-scoap3

Statement on Data Sharing in Public Health Emergencies (2016) Disponiacutevel na WWW httpblogsplosorgplos201602statement-on-data-sharing-in-public-health-emergencies

Sturges P Bamkin M Anders J Hubbard B Hussain A amp Heeley M (2015) Research data sharing developing a stakeholder-driven model for journal policies Journal of the Association for Information Science and Technology 66(12) 2445-2455 Disponiacutevel na WWW httponlinelibrarywileycomdoi101002asi23336abstract

Suber P (2008) Open Access News Disponiacutevel na WWW httplegacyearlhamedu~petersfos200808greengold-oa-and-gratislibre-oahtml

Suber P (2009) Ten challenges for open-access journals SPARC Open Access Newsletter 138 Disponiacutevel na WWW httplegacyearlhamedu~petersfosnewsletter10-02-09htm

Suber P (2012) Open Access Cambridge MIT Press Disponiacutevel na WWW httpsmitpressmitedusitesdefaultfiles9780262517638_Open_Access_PDF_Versionpdf

131

Sunlight Foundation (2010) Ten Principles for Opening Up Government Information Disponiacutevel na WWW httpssunlightfoundationcompolicydocumentsten-open-data-principles

Sunlight Foundation (2013) Public Policy for Public Data Disponiacutevel na WWW httpwhatworkscitiessunlightfoundationcomsection-h2-02

Sunlight Foundation (2014) Guidelines for Open Data Policies Disponiacutevel na WWW httpssunlightfoundationcomopendataguidelines

Sunlight Foundation Open Data Policy Collection [Consultado a 12-05-2017] Disponiacutevel na WWW httpwwwopendatapoliciesorgbrowse

Swan A (2010) The open access citation advantage studies and results to date Disponiacutevel na WWW httpeprintssotonacuk2685162Citation_advantage_paperpdf

Swan A (2012) Diretrizes para as Poliacuteticas de desenvolvimento do acesso aberto UNESCO Paris Disponiacutevel na WWW httpunesdocunescoorgimages0021002158215863epdf

Tauberer Joshua (2014) Open Government Data The Book (2ordf ed) Disponiacutevel na WWW httpsopengovdataio20148-principles

Taunabaum G Implementing an Open Data Policy a SPARC Primer for Research Funders Disponiacutevel na WWW httpssparcopenorgwp-contentuploads201601sparc-open-data-primer-finalpdf

Transparecircncia e Integridade Associaccedilatildeo Ciacutevica (2016) Iacutendice de Transparecircncia Municipal Disponiacutevel na WWW httpstransparenciaptindice-de-transparencia-municipal

The UN Secretary Generals Independent Expert Advisory Group on a Data Revolution for Sustainable Development (2014a) UN Data Revolution Disponiacutevel na WWW httpwwwundatarevolutionorg

The UN Secretary Generals Independent Expert Advisory Group on a Data Revolution for Sustainable Development (2014b) A world that counts mobilising the data revolution for sustainable development Disponiacutevel na WWW httpwwwundatarevolutionorgwp-contentuploads201411A-World-That-Countspdf

The World Bank (2016) Open Government Data Toolkit Disponiacutevel na WWW httpopendatatoolkitworldbankorgenindexhtml

Ubaldi B (2013) Open Government Data Towards empirical analysis of open government data initiatives Disponiacutevel na WWW httpwwwoecd-ilibraryorggovernanceopen-government-data_5k46bj4f03s7-en

UK Data Archive (2017) Create amp Manage Data Research Data Lifecycle Disponiacutevel na WWW httpwwwdata-archiveacukcreate-managelife-cycle

UK The National Archives Open Government Licence for Public Sector Information Disponiacutevel na WWW httpwwwnationalarchivesgovukdocopen-government-licenceversion3

132

UNESCO (2015) Concepts of Openness and Open Access Open Access for Researchers Paris UNESCO Disponiacutevel na WWW httpunesdocunescoorgimages0023002322232207Epdf Uniatildeo Europeia (2013) REGULAMENTO (UE) Nordm 12912013 DO PARLAMENTO EUROPEU E DO CONSELHO de 11 de dezembro de 2013 Jornal Oficial da Uniatildeo Europeia Disponiacutevel na WWW httpeceuropaeuresearchparticipantsdatarefh2020legal_basisfph2020-eu-establact_ptpdf

Uniatildeo Europeia (2017) European Union Open Data Portal [Consultado a 12-05-2017] Disponiacutevel na WWW httpdataeuropaeueuodpendata

United Nations Statistics Division (2017) UN data a world of information [Consultado a 13-05-2017] Disponiacutevel na WWW httpdataunorgSearchaspxq=Portugalampt=Data

United States General Services Administration Datagov Disponiacutevel na WWW httpswwwdatagovopen-gov

Universidade do Minho (2017) Open Access Disponiacutevel na WWW httpsopenaccesssdumuminhoptpage_id=352

Universidade do Porto Faculdade de Engenharia (2017) Dendro The convergence between data management and description Disponiacutevel na WWW httpdendrofeupptblogindexphpdendro

Welcome Trust (2013) Open access policy Disponiacutevel na WWW httpswellcomeacukfundingmanaging-grantopen-access-policy

Whyte A amp Donnely M (2016) Common directions in research data policy a briefing for iInstitutions DCC Briefing Papers Edinburgh Digital Curation Centre Disponiacutevel na WWW httpwwwdccacukresourcesbriefing-paperscommon-directions-research-data-policycommon-directions-research-data-pol

World Council on City Data (2016) Data Portal [Consultado a 12-04-2017] Disponiacutevel na WWW httpopendataforcitiesorg

World Wide Web Consortium [W3C] (2014) Data Catalog Vocabulary (DCAT) Disponiacutevel na WWW httpswwww3orgTRvocab-dcat

World Wide Web Consortium [W3C] (2015) Linked Data Disponiacutevel na WWW httpswwww3orgstandardssemanticwebdata

World Wide Web Foundation (2014 maio) Towards common methods for assessing open data workshop report amp draft framework Apresentado em Towards common methods for assessing open data 2014 8 - 9 Maio Nova Iorque EUA Disponiacutevel na WWW httpopendataresearchorgsitesdefaultfilespostsCommon20Assessment20Workshop20Reportpdf

World Wide Web Foundation (2017) ODB Global Report Fourth Edition Disponiacutevel na WWW httpopendatabarometerorgdoc4thEditionODB-4thEdition-GlobalReportpdf

133

Zuiderwijk A Gasco M Parycek P amp Janssen M (2014) Special issue on transparency and open data policies guest editors introduction Journal of theoretical and applied electronic commerce research 9(3) I-IX Disponiacutevel na WWW httpwwwscieloclscielophpscript=sci_arttextamppid=S0718-18762014000300001

Zuiderwijk A amp Janssen M (2014) Open data policies their implementation and impact a comparison Framework Government Information Quaterly 31(1) 17-29 Disponiacutevel na WWW httpwwwsciencedirectcomsciencearticlepiiS0740624X13001202

134

LISTA DE SIGLAS AA - Acesso Aberto AMA - Agecircncia para a Modernizaccedilatildeo Administrativa APC - Article Processing Charge API - Application Programming Interface APIS - Arquivo Portuguecircs de Informaccedilatildeo Social BOAI - Budapest Open Access Initiative CA - Ciecircncia Aberta CADA - Comissatildeo de Aceso aos Documentos Administrativos CC - Creative Commons CERN - European Organization for Nuclear Research CML - Cacircmara Municipal de Lisboa DCAT - Data Catalog Vocabulary DCC - Digital Curation Center DDI - Data Documentation Initiative DGA - Dados Governamentais Abertos DMP - Data Management Plan DOAJ - Directory of Open Access Journals DOI - Digital Object Identifier EAGDA - Expert Advisory Group on Data Access e-IRG - e-Infrastructure Reflection Group EOSC - European Open Science Cloud ERAC - European Research Area and Innovation Committee EU - Uniatildeo Europeia EUA - Estados Unidos da Ameacuterica FCCN - Fundaccedilatildeo para a Computaccedilatildeo Cientiacutefica Nacional FCT - Fundaccedilatildeo para a Ciecircncia e Tecnologia FI - Fator de Impacto FOI - Freedom of Information FOSTER - Facilitate Open Science Training for European Research GBIF - Global Biodiversity Information Facility ICSU - International Council for Science INE - Instituto Nacional de Estatiacutestica IPCB - Instituto Politeacutecnico de Castelo Branco ITM - Iacutendice de Transparecircncia Municipal JISC - Joint Information Systems Committee MCTES - Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior NIH - National Institutes of Health OAI-PMH - Open Archive Initiative ndash Protocol for Metadata Harvesting OD4D - Open Data for Development

135

ODC - Open Data Commons ODIN - Open Data Inventory ODRA - Open Data Readiness Assessment OECD - Organizaccedilatildeo para a Cooperaccedilatildeo e Desenvolvimento Econoacutemico OGD - Open Government data OGL - Open Government Licence OGP - Open Government Partnership OGWG - Open Government Working Group OKI - Open Knowledge International OpenDOAR - Directory of Open Access Repositories PLOS - Public Library of Science PSI - Public Sector Information RCAAP - Repositoacuterio Cientiacutefico de Acesso Aberto de Portugal RDA - Research Data Aliance RDF - Resource Description Framework Re3data - Registry of Research Data Repositories ROARMAP - Registry of Open Access Repository Mandates and Policies SARDC - Serviccedilo de Alojamento de Repositoacuterio de Dados Cientiacuteficos SCOAP3 - Sponsoring Consortium for Open Access Publishing in Particle Physics SNIAmb - Sistema Nacional de Informaccedilatildeo de Ambiente SOAP - Study of Open Access Publishing SPARC - Scholarly Publishing and Academic Resources Coalition W3C - World Wide Web Consortium

136

IacuteNDICE DE FIGURAS

Fig 1 Os pilares da Ciecircncia Aberta 17 Fig 2 As 5 escolas de pensamento das mudanccedilas operadas pela Ciecircncia Aberta 18 Fig 3 Caracteriacutesticas e indicadores do Open Science Monitor 20 Fig 4 Taxonomia da Ciecircncia Aberta 22 Fig 5 Paradigmas da investigaccedilatildeo cientiacutefica 25 Fig 6 Cadeia de abastecimento dos Dados Massivos 27 Fig 7 A cauda longa dos Dados Massivos 28 Fig 8 Ciclo de vida dos dados de investigaccedilatildeo 31 Fig 9 Tipos de dados cientiacuteficos 34 Fig 10 Esquema de classificaccedilatildeo das 5 estrelas para Dados Abertos Ligados 35 Fig 11 Pilares dos Dados Governamentais Abertos 40 Fig 12 Perspetivas da abertura dos dados governamentais 44 Fig 13 Esquema de classificaccedilatildeo das 5 estrelas para as iniciativas de abertura de dados que envolvem os utilizadores 45 Fig 14 Esquema de classificaccedilatildeo das 5 estrelas para os portais de dados 50 Fig 15 Princiacutepios FAIR Data 61 Fig 16 Estrutura de avaliaccedilatildeo de poliacuteticas de Dados Abertos 67

137

IacuteNDICE DE QUADROS

Quadro 1 Princiacutepios de abertura de dados de investigaccedilatildeo mais recomendados 33 Quadro 2 Princiacutepios de abertura mais recomendados pelas iniciativas de Dados Governamentais Abertos 43 Quadro 3 Visatildeo geral sobre o contexto conteuacutedo e desempenho da poliacutetica de Dados Abertos em Portugal com base no esquema delineado por Zuiderwijk e Janssen (2014) 85 Quadro 4 Comparaccedilatildeo dos resultados de abertura de dados atribuiacutedos pelas vaacuterias iniciativas de avaliaccedilatildeo 95 Quadro 5 Portais de dados abertos existentes em Portugal 97

138

IacuteNDICE DE GRAacuteFICOS

Graacutefico 1 Nuacutemero de datasets publicados no SARDC nos anos seguintes agrave sua criaccedilatildeo 80 Graacutefico 2 Maiores fornecedores de dados do portal nacional 87 Graacutefico 3 Tipologia dos fornecedores de dados do portal nacional 88 Graacutefico 4 Tipologia das categorias de dados do portal nacional 88

Page 4: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação

ii

iii

Aos meus pais Gracinda e Fernando

Agrave Sara namorada companheira e amiga

iv

v

AGRADECIMENTOS

O sucesso neste percurso acadeacutemico deve-se tambeacutem a todos os que me apoiaram incentivaram e inspiraram nos melhores e nos piores momentos tornando o caminho mais faacutecil de percorrer Espero que as palavras seguintes faccedilam justiccedila ao sentimento de agradecimento que pretendo transmitir

Agrave Professora Doutora Maria Manuel Borges a quem devo a introduccedilatildeo a este tema pela total disponibilidade pelo aconselhamento acadeacutemico e profissional espiacuterito criacutetico pela confianccedila depositada pela sua amizade e pelo privileacutegio de poder trabalhar com algueacutem por quem se nutre admiraccedilatildeo

Agrave Professora Doutora Daniela de Filippo pelo aconselhamento orientaccedilatildeo espiacuterito criacutetico e amizade que foram importantes durante o uacuteltimo ano

Agrave Sara cujo apoio paciecircncia e amor foram fundamentais ao longo deste percurso

Aos meus pais que nunca me deixaram desistir deste sonho

Agrave Ana Luiacutesa Ribeiro colega e amiga cujo esforccedilo me permitiu assistir a todas as aulas do mestrado

Agrave Cristina Caetano colega de mestrado e amiga pelo apoio incentivo partilha de ideias e espiacuterito criacutetico

Aos colegas Daniel Gonccedilalves Rosa Gomes e Quele pelo companheirismo amizade boa energia e pelas trocas de ideias ao almoccedilo agraves quintas-feiras

A todos os professores deste ciclo acadeacutemico pela mestria e paixatildeo com que transmitiram conhecimentos e me tornaram melhor profissional da informaccedilatildeo

vi

vii

A mente que se abre a uma nova ideia jamais volta ao seu tamanho inicial

Albert Einstein

viii

ix

RESUMO

A abertura de dados cientiacuteficos e de dados do setor puacuteblico eacute garantida por poliacuteticas de Dados Abertos que na sua constituiccedilatildeo recomendam ou mandatam a livre disponibilizaccedilatildeo de dados A um niacutevel macro a Uniatildeo Europeia atraveacutes do seu programa de financiamento de investigaccedilatildeo implementou um piloto de Dados Abertos que atualmente abrange todas as aacutereas de investigaccedilatildeo financiadas O acordo de financiamento mandata a abertura de todos os dados de investigaccedilatildeo subjacentes agraves publicaccedilotildees cientiacuteficas A Uniatildeo Europeia tem tambeacutem publicado legislaccedilatildeo referente agrave abertura de dados do setor puacuteblico que eacute transposta para as normas juriacutedicas de cada estado-membro onde Portugal natildeo eacute exceccedilatildeo Foram tambeacutem observadas as diversas iniciativas que visam medir a abertura de dados puacuteblicos a niacutevel europeu e mundial

O objetivo geral do trabalho eacute analisar a implementaccedilatildeo de poliacuteticas de Dados Abertos em Portugal Dado o diferente enquadramento legislativo relativamente aos dados de investigaccedilatildeo e aos dados do setor puacuteblico foram elencadas as poliacuteticas existentes para os diferentes tipos de dados A abertura de dados de investigaccedilatildeo situa-se ainda numa fase prematura natildeo sendo ainda visiacuteveis resultados da implementaccedilatildeo da Resoluccedilatildeo do Conselho de Ministros nordm212016 Ao niacutevel dos dados do setor puacuteblico abertura processou-se atraveacutes da transposiccedilatildeo da Diretiva 200398CE para as normas juriacutedicas portuguesas em 2007 e novamente em 2016 Usando o modelo de Zuiderwijk e Janssen (2014) foi elaborada uma estrutura para a avaliaccedilatildeo do conteuacutedo contexto e indicadores de desempenho da poliacutetica de abertura de dados do setor puacuteblico permitindo obter uma visatildeo geral do valor puacuteblico alcanccedilado Foram confrontados os resultados obtidos por esta anaacutelise com os indicadores de abertura provenientes de algumas iniciativas de avaliaccedilatildeo de impacto da abertura de dados do setor puacuteblico e com a informaccedilatildeo prestada pela AMA O ecossistema portuguecircs de Dados Governamentais Abertos encontra-se jaacute numa fase mais avanccedilada revelando a existecircncia do portal de dados nacional (dadosgov) e de diversos portais de entidades puacuteblicas e ateacute do setor privado que disponibilizam dados de forma aberta Esses portais foram analisados para se perceber se os conjuntos de dados cumpriam os requisitos de abertura definidos pela Open Knowledge International

Palavras-chave Dados Abertos Dados Governamentais Abertos poliacuteticas de Dados Abertos impacto avaliaccedilatildeo

x

xi

ABSTRACT

The openness of scientific data and public sector data is granted by Open Data policies which recommend or mandate free availability of data At a macro level the European Union through its research funding program implemented an Open Data pilot that now is extended to all the funded research areas The model agreement sets the openness of all the data underlying scientific publications The European Union has also published legislation referring to the openness of public sector information which is transposed to the legal system of each state member where Portugal is no exception We also analysed the different initiatives that aim to measure the openness of public data at European and global level

The main goal of this academic work is to analyse the implementation of Open Data policies in Portugal Given the different legal framework between scientific data and public sector data wersquove considered and listed the policies regarding both type of data The openness of scientific data is still in a premature phase which means that the results of the implementation of Resoluccedilatildeo do Conselho de Ministros nordm212016 are not visible yet In terms of public sector data the openness has started with the transposition of the EU Directive 200398EC to the Portuguese juridical system in 2007 and again in 2016 Using Zuiderwijk e Janssenrsquos (2014) model it was elaborated a structure to assess the context content and performance indicators of public sector open data policies which allows to obtain a general vision of public value achieved The results produce by this analysis were confronted with the openness indicators generated by some public sector data impact assessment initiatives and also with the information disclosed by AMA The Portuguese ecosystem of Open Governmental Data is in a more advanced phase disclosing the existence of a national data portal (dadosgov) and data portals from public institutions and even from the private sector which made data available in an open manner These data portals were analysed to understand if they fulfil all the openness requirements defined by Open Knowledge International

Keywords Open Data Open Government Data Open Data policies impact assessment

xii

xiii

Sumaacuterio

AGRADECIMENTOS v

RESUMO ix

ABSTRACT xi

Introduccedilatildeo 1

Indicaccedilotildees Metodoloacutegicas 6

1 Do Acesso Aberto aos Dados Abertos 8

11 Acesso Aberto 8

111 Via Dourada 14

112 Via Verde 15

12 A Ciecircncia Aberta 17

13 Big Data ou dados massivos 24

14 Dados Abertos 29

15 Dados Abertos Governamentais 40

2 As poliacuteticas de Dados Abertos 53

21 Poliacuteticas Macro 70

22 O caso portuguecircs 78

Conclusatildeo 103

Referecircncias Bibliograacuteficas 115

LISTA DE SIGLAS 134

IacuteNDICE DE FIGURAS 136

IacuteNDICE DE QUADROS 137

IacuteNDICE DE GRAacuteFICOS 138

xiv

1

Introduccedilatildeo

Uma marca distintiva da nossa eacutepoca eacute o crescimento exponencial da produccedilatildeo de informaccedilatildeo com a proliferaccedilatildeo de novas tecnologias de informaccedilatildeo e comunicaccedilatildeo que permitiram o aumento de troca de informaccedilatildeo de nuacutemero de artigos cientiacuteficos publicados e a produccedilatildeo massiva de dados O acesso generalizado agrave internet propiciou uma alteraccedilatildeo no paradigma do acesso e publicaccedilatildeo de conteuacutedos cientiacuteficos Eacute com o intuito de promover o livre acesso agrave informaccedilatildeo cientiacutefica que nasce o movimento de Acesso Aberto (AA) apoiado em trecircs declaraccedilotildees de princiacutepios de abertura Budapeste Bethesda e Berlim

Segundo a Budapest Open Access Initiative (BOAI) entende-se por AA a disponibilizaccedilatildeo na Internet de literatura cientiacutefica permitindo que os utilizadores possam ler copiar distribuir imprimir e pesquisar esta literatura sem barreiras legais teacutecnicas ou financeiras que natildeo o proacuteprio acesso agrave Internet (Budapest Open Access Iniciative [BOAI] 2002 traduccedilatildeo livre) O AA possuiu dois modelos de abertura a via dourada que remete para a publicaccedilatildeo em revistas cientiacuteficas de AA e a via verde que pressupotildee o auto arquivo num repositoacuterio adequado Subjacente a este movimento estaacute a abertura sem qualquer tipo de discriminaccedilatildeo de toda a literatura de investigaccedilatildeo cientiacutefica revista por pares no caso dos postprints como artigos dissertaccedilotildees e teses e mais recentemente dados de investigaccedilatildeo e livros cientiacuteficos (Swan 2012) Existem dois tipos de AA o AA graacutetis que se refere agrave remoccedilatildeo de barreiras de preccedilo e o AA livre que se refere agrave remoccedilatildeo de barreiras de preccedilo e de pelo menos algumas barreiras de permissatildeo (Suber 2012)

O AA enquadra-se num contexto cientiacutefico mais vasto o da Ciecircncia Aberta (CA) O conceito de CA eacute definido como o esforccedilo para disponibilizar todos os resultados da investigaccedilatildeo cientiacutefica que sejam financiados pelo setor puacuteblico (Organizaccedilatildeo para a Cooperaccedilatildeo e Desenvolvimento Econoacutemico [OECD] 2015a) Nesse sentido a Ciecircncia Aberta surge como um termo guarda-chuva referente agrave abertura de todos os resultados da investigaccedilatildeo financiada e que assenta em vaacuterios pilares remoccedilatildeo das barreiras de partilha construccedilatildeo da infraestrutura para a sua concretizaccedilatildeo e como desambiguaccedilatildeo de autores instituiccedilotildees e produccedilatildeo cientiacutefica A CA eacute um meio para garantir um sistema de investigaccedilatildeo mais eficiente atraveacutes da reduccedilatildeo de custos no processo de coleta transferecircncia e reutilizaccedilatildeo de dados do aumento da transparecircncia e qualidade do processo de investigaccedilatildeo da maior rapidez na transferecircncia de conhecimento do aumento do impacto econoacutemico e aproximaccedilatildeo entre ciecircncia e cidadatildeos (OECD 2015a)

A complexidade da abertura dos resultados de investigaccedilatildeo reside no fator cultural na implementaccedilatildeo de um ambiente de partilha Leonelli Spichtinger e Prainsack

2

(201513) defendem que ldquoin addition to the stick of compulsatory mandates carrots are therefore also neededrdquo As recompensas satildeo definidas em trecircs eixos reconhecimento das praacuteticas de partilha nas estruturas de incentivos reconhecimento do papel das meacutetricas alternativas na avaliaccedilatildeo dos investigadores e a criaccedilatildeo de incentivos mais significativos para envolver os investigadores na CA Fecher e Friesike (2013) sintetizaram as mudanccedilas operadas pela CA em cinco escolas de pensamento ao niacutevel da infraestrutura da acessibilidade puacuteblica da avaliaccedilatildeo de impacto do acesso gratuito e da melhoria da eficiecircncia

A Uniatildeo Europeia (EU) tem desempenhado um papel central na promoccedilatildeo da CA quer atraveacutes da criaccedilatildeo de legislaccedilatildeo adequada aos princiacutepios de abertura que defende quer ao niacutevel de financiamento para o AA agraves publicaccedilotildees cientiacuteficas criaccedilatildeo de e-infraestruturas de alojamento de recursos de informaccedilatildeo e programas de treino e apoio Em Portugal apesar da jaacute existecircncia de e-infraestruturas cientiacuteficas como o Repositoacuterio Cientiacutefico de Acesso Aberto de Portugal (RCAAP) e o Serviccedilo de Alojamento de Repositoacuterio de Dados Cientiacuteficos (SARDC) apenas em 2016 se veio a definir os princiacutepios da implementaccedilatildeo da poliacutetica nacional de CA atraveacutes da Resoluccedilatildeo do Conselho de Ministros nordm212016 A estrateacutegia assenta em quatros eixos AA e Dados Abertos infraestruturas e preservaccedilatildeo digital avaliaccedilatildeo cientiacutefica e responsabilidade social cientiacutefica (Comissatildeo Executiva GT-PNCA 2016)

O crescimento exponencial da produccedilatildeo de dados estimado em 40 ao ano (Manyika et al 2011) levou agrave emergecircncia do fenoacutemeno Big Data ou dados massivos atraveacutes do incremento da disponibilizaccedilatildeo de conjuntos de dados e tambeacutem do reconhecimento do potencial valor da combinaccedilatildeo e ligaccedilatildeo de diferentes datasets (Ubaldi 2013) Os dados digitais estatildeo presentes em todos os setores econoacutemicos existindo diversas ferramentas que coletam dados de forma massiva que depois podem ser reutilizados para desenvolver novas investigaccedilotildees ou aplicaccedilotildees1 para benefiacutecio da sociedade O crescimento da disponibilidade de dados originou mudanccedilas no paradigma da investigaccedilatildeo cientiacutefica sendo que Jim Gray considera que vivemos atualmente no 4ordm paradigma caracterizado pelo uso massivo de dados na investigaccedilatildeo cientiacutefica (Lynch 2009) Esta nova ciecircncia assenta em trecircs pilares captura curadoria e anaacutelise de dados (Bell 2009 Royal Society 2012) A influecircncia do Big Data na sociedade manifesta-se a diversos niacuteveis destacando-se o desenvolvimento de projetos na aacuterea da sauacutede transportes agricultura ambiente induacutestria ganho de competecircncias cientiacuteficas mercado de dados e dados abertos

Os dados que produzimos satildeo globais diversificados complexos e sobretudo podem representar um enorme valor cientiacutefico econoacutemico social ou cultural Neste

1 O termo aplicaccedilotildees deve ser aqui entendido de duas formas como aplicaccedilatildeo na inovaccedilatildeo cientiacutefica produzindo por exemplo um avanccedilo meacutedico e tambeacutem como aplicaccedilatildeo no sentido de software fornecendo um serviccedilo com o recurso agrave reutilizaccedilatildeo de dados

3

sentido o AA a dados torna-se um dos pilares da investigaccedilatildeo cientiacutefica do seacuteculo XXI mas tambeacutem um dos pilares do desenvolvimento econoacutemico do envolvimento dos cidadatildeos na ciecircncia atraveacutes da denominada ciecircncia cidadatilde e tambeacutem na auscultaccedilatildeo da transparecircncia governativa com a disponibilizaccedilatildeo em AA de dados governamentais

O mundo acadeacutemico tem vindo a ser pressionado para apoiar a abertura atraveacutes das imposiccedilotildees das entidades de financiamento e do aumento de benefiacutecios dos Dados Abertos embora nem todos os domiacutenios evoluam com a mesma rapidez (Hahnel amp Hook 2016) A Royal Society (2012) sublinha que os dados devem ser geridos de modo proficiente para as instituiccedilotildees obterem os benefiacutecios proporcionados pela abertura de dados e entenderem a enorme mudanccedila cultural necessaacuteria para atingir este objetivo

Existem vaacuterias definiccedilotildees de Dados Abertos apresentando algumas diferenccedilas entre elas embora focando o mesmo objetivo A Royal Society (2012) entende por Open Data os dados que devem ser acessiacuteveis utilizaacuteveis avaliados ou certificados e inteligiacuteveis Contudo ldquoOpenness is not however enough Data must be intelligently openrdquo (Science International 20154) Segundo a Open Definition os Dados Abertos englobam dois tipos diferentes de abertura teacutecnica e legal (Open Knowledge International [a])

Com o objetivo de contribuir para a adoccedilatildeo de padrotildees e poliacuteticas de Dados Abertos de investigaccedilatildeo algumas organizaccedilotildees lanccedilaram iniciativas e princiacutepios de Open Data destinadas agrave recomendaccedilatildeo de boas praacuteticas na publicaccedilatildeo de dados de investigaccedilatildeo obtidos atraveacutes de financiamento puacuteblico Estes princiacutepios foram comparados de forma a obter-se uma visatildeo geral da abertura teacutecnica e legal recomendada

A abertura dos dados governamentais teve a sua origem nas leis de ldquoFreedom of Informationrdquo Os Governos e as sociedades tecircm vindo de forma crescente a apoiar o acesso agrave informaccedilatildeo do setor puacuteblico como forma de aumentar a transparecircncia governativa e o crescimento econoacutemico A abertura de dados assume a preparaccedilatildeo das entidades puacuteblicas para o processo de abertura e que o governo estaacute disposto a efetuar mudanccedilas consideraacuteveis no setor puacuteblico devendo atuar como um sistema aberto que interage com o seu ambiente (Jansen Charalabidis amp Zuiderwijk 2012)

Os Dados Governamentais Abertos (DGA) referem-se agrave informaccedilatildeo coletada produzida ou paga pelo setor puacuteblico guardada em formato que possa ser lido por maacutequina e tornada acessiacutevel de forma livre para reutilizaccedilatildeo para qualquer propoacutesito atraveacutes da publicaccedilatildeo sob uma licenccedila aberta que permite a livre reutilizaccedilatildeo dentro do domiacutenio puacuteblico e privado (Koski 2015 Carrara Oudkerk Steenbergen Tinholt 2016) A Open Knowledge International (OKI) (2012a) identificou as componentes chave da abertura de dados puacuteblicos disponibilidade e acesso reutilizaccedilatildeo e redistribuiccedilatildeo e a participaccedilatildeo universal A abertura dos dados governamentais foi apoiada por vaacuterias iniciativas com o objetivo de estabelecer padrotildees e princiacutepios para a

4

disponibilizaccedilatildeo aberta de dados as quais foram comparadas para obter uma visatildeo geral da abertura teacutecnica e legal recomendada

Para gerar valor ldquodata must be reusable but more importantly actually used (Open Data for Development [OD4D] 20168) O acesso e a reutilizaccedilatildeo dos dados governamentais tecircm um potencial significativo no aumento da eficiecircncia e transparecircncia do setor puacuteblico alavancando atividades de ciecircncia cidadatilde com os dados governamentais aumentando assim o seu valor econoacutemico e social (OECD 2015a) Segundo Ubaldi (2013 traduccedilatildeo livre) podem ser identificadas quatro grandes fases na cadeia de valor dos Dados DGA geraccedilatildeo de dados coleta agregaccedilatildeo e processamento de dados distribuiccedilatildeo e fornecimento de dados e reutilizaccedilatildeo de dados Existem trecircs tipos de valor associados aos DGA valor econoacutemico valor social e transparecircncia puacuteblica (Ubaldi 2013 OECD 2015a)

O acesso a dados sem restriccedilotildees de acesso deve ser garantido por uma poliacutetica de Dados Abertos pois ldquoOpen Data is politicalrdquo (World Wide Web Foundation 201638) Existem poliacuteticas diferenciadas para a abertura de dados governamentais e para a abertura de dados cientiacuteficos sendo que a expressatildeo ldquoPoliacutetica de Dados Abertosrdquo surge frequentemente associada a termos como estrateacutegias programas ou iniciativas de abertura de dados e ainda a poliacuteticas de gestatildeo de dados A contextualizaccedilatildeo das poliacuteticas natildeo eacute clara mas foca-se preferencialmente apenas nos dados provenientes do setor puacuteblico Satildeo associadas poliacuteticas de Dados Abertos de vaacuterios niacuteveis desde o governamental em termos de dados puacuteblicos agraves poliacuteticas editoriais de abertura de dados cientiacuteficos

A niacutevel de dados cientiacuteficos salienta-se a existecircncia de vaacuterias recomendaccedilotildees no sentido de balizar indicadores fundamentais para o desenvolvimento de poliacuteticas de abertura de dados cientiacuteficos e a importacircncia da gestatildeo de dados no seio dessa abertura A mudanccedila cultural a necessidade de treino dos investigadores e a abertura de dados mediante os princiacutepios FAIR que pretendem facilitar o acesso a interoperabilidade e a reutilizaccedilatildeo de dados satildeo outros desafios focados A abertura dos dados de investigaccedilatildeo eacute incluiacuteda no programa de investimento Horizonte 2020 (H2020) da EU com a criaccedilatildeo um projeto-piloto de Dados Abertos para sete aacutereas com opccedilatildeo de natildeo participaccedilatildeo tendo sido alargado a todas as aacutereas cientiacuteficas em projetos iniciados a partir de 2017 O artigo 293 do acordo modelo de financiamento requer o depoacutesito de todos os dados e metadados associados aos resultados finais da investigaccedilatildeo num repositoacuterio devendo estes cumprir os princiacutepios FAIR A este model grant agreement estaacute associada tambeacutem a necessidade obrigatoacuteria de desenvolver um plano de gestatildeo de dados que descreva os dados que seratildeo produzidos e como e quando seratildeo publicados O AA a dados cientiacuteficos possui um contexto legislativo diferenciado dos dados puacuteblicos apresentando-se em Portugal numa fase ainda pouca maturada A primeira poliacutetica de Dados Abertos surge em 2014 atraveacutes da Fundaccedilatildeo

5

para a Ciecircncia e Tecnologia (FCT) com o objetivo de encorajar e promover a disponibilizaccedilatildeo de dados em AA O acesso a dados foi incluiacutedo na poliacutetica cientiacutefica atraveacutes da Resoluccedilatildeo do Conselho de Ministros nordm212016 que integrada na poliacutetica nacional de CA instaura a obrigatoriedade da abertura dos dados cientiacuteficos resultantes de projetos financiados por fundos puacuteblicos

O desenvolvimento de uma poliacutetica de abertura de dados governamentais deve considerar algumas questotildees como a definiccedilatildeo da sua aplicaccedilatildeo e os objetivos dados publicados condiccedilotildees de publicaccedilatildeo de dados local frequecircncia e razatildeo da publicaccedilatildeo devendo ainda ser calculado o impacto e os benefiacutecios da abertura de dados (Carrara et al 2016a) Os objetivos das poliacuteticas de Dados Abertos podem ser sintetizados em trecircs aacutereas principais fomentar a inovaccedilatildeo social e crescimento econoacutemico melhorar a eficiecircncia dos serviccedilos do setor puacuteblico e fortalecer a democracia e aumentar a transparecircncia (Zuiderwijk Gasco Parycek amp Janssen 2014)

A EU e a Comissatildeo Europeia tecircm promovido os DGA atraveacutes da publicaccedilatildeo de Diretivas Europeias (2003 e 2013) que estabeleceram regulamentos para permitir o livre acesso e reutilizaccedilatildeo dos dados produzidos pelas entidades europeias e governamentais Esta legislaccedilatildeo eacute de cariz obrigatoacuterio para todos os estados-membros Foram tambeacutem estabelecidas diversas e-infraestruturas para alojar e apoiar toda a produccedilatildeo de dados produzidos na EU e que indexam os dados existentes nos portais nacionais de cada paiacutes Satildeo abordadas as vaacuterias iniciativas europeias e internacionais de avaliaccedilatildeo de abertura de dados que permitem obter uma vista geral ainda que desfocada do estado de abertura de dados puacuteblicos a niacutevel nacional e europeu

Portugal confere o direito ao acesso agrave informaccedilatildeo puacuteblica desde 1993 As poliacuteticas de abertura de dados governamentais mais recentes foram publicadas em 2007 e 2016 e assentam na transposiccedilatildeo da Diretiva 200398CE para a lei nacional Assinala-se a existecircncia de duas poliacuteticas municipais a criaccedilatildeo do portal nacional e de vaacuterios portais regionais e institucionais Para avaliar a abertura dos dados governamentais em Portugal foi usada a estrutura elencada por Zuiderwijk e Janssen (2014) Atraveacutes da anaacutelise de vaacuterios indicadores esta estrutura fornece uma perspetiva do contexto e ambiente da poliacutetica do seu conteuacutedo e dos indicadores de desempenho permitindo assim inferir o valor puacuteblico alcanccedilado Foi tambeacutem analisada a abertura de dados alojados nos portais de dados portugueses com o recurso agraves caracteriacutesticas de abertura enunciadas na Open Definition

O objetivo geral deste trabalho eacute identificar as poliacuteticas de Dados Abertos em Portugal bem como a analisar a sua implementaccedilatildeo e impacto Neste sentido foram delineados os seguintes objetivos especiacuteficos

6

a) Contextualizar o movimento de Dados Abertos como continuaccedilatildeo do AA e tambeacutem dentro de um modelo mais amplo a CA focando ainda a produccedilatildeo massiva de dados

b) Identificar princiacutepios de abertura de dados cientiacuteficos e dados puacuteblicos c) Contextualizar os modelos de poliacuteticas de Dados Abertos e formas de avaliaccedilatildeo

de impacto das mesmas d) Identificar a constituiccedilatildeo e implementaccedilatildeo de poliacuteticas de abertura de dados

cientiacuteficos e dados puacuteblicos a niacutevel da EU e) Identificar a constituiccedilatildeo de poliacuteticas de abertura de dados cientiacuteficos e dados

puacuteblicos a niacutevel portuguecircs f) Avaliaccedilatildeo da implementaccedilatildeo e do impacto das poliacuteticas de Dados Abertos em

Portugal em termos de dados cientiacuteficos e de dados puacuteblicos

Indicaccedilotildees Metodoloacutegicas

Para cumprir os objetivos estipulados seguiu-se uma abordagem qualitativa baseada na revisatildeo bibliograacutefica de artigos cientiacuteficos recuperados em bases de dados especializadas disponiacuteveis na Universidade de Coimbra articulando a recuperaccedilatildeo de documentos com os documentos mais citados da aacuterea da Ciecircncia Aberta Acesso Aberto e Dados Abertos indexados na Web of Science Foram usados os termos de pesquisa em liacutengua inglesa open science open access open data open government data e scientific open data para situar o tema seguindo-se a pesquisa por open data policies government open data policies e open data impact A base da literatura revista para analisar o desenvolvimento e impacto das poliacuteticas de Dados Abertos em Portugal foi obtida em grande parte com o recurso ao motor de busca Google derivado agrave especificidade da legislaccedilatildeo das comunicaccedilotildees poliacuteticas e institucionais dos portais de dados e tambeacutem agrave escassez de literatura cientiacutefica nesse campo Foi ainda solicitado um esclarecimento de duacutevidas agrave Agecircncia para a Modernizaccedilatildeo Administrativa (AMA) por correio eletroacutenico em termos de conteuacutedos e funcionalidades do portal de dados nacional tendo as respostas do gestor de projeto Andreacute Lapa sido incluiacutedas como contraposiccedilatildeo a algumas afirmaccedilotildees da literatura ou das iniciativas de avaliaccedilatildeo Os Dados Abertos enquanto alvo do nosso estudo satildeo enquadrados na dimensatildeo da Ciecircncia Aberta que defende a abertura de todos os resultados cientiacuteficos e na dimensatildeo de abertura da informaccedilatildeo do setor puacuteblico que defende o acesso do cidadatildeo agrave informaccedilatildeo dos oacutergatildeos puacuteblicos e governativos

Em termos de Dados Abertos e as suas poliacuteticas a oferta de literatura eacute consideravelmente mais curta sendo que apenas os documentos mais antigos apresentam nuacutemero de citaccedilotildees com algum relevo Sempre que necessaacuterio recorreu-se a trabalhos citados nas publicaccedilotildees em estudo A singularidade da aacuterea e o seu raacutepido crescimento levou agrave opccedilatildeo por autores e artigos menos cotados mas

7

diretamente relacionados com o mundo dos Dados Abertos A recolha de literatura para investigaccedilatildeo visou identificar legislaccedilatildeo referente a poliacuteticas de Dados Abertos publicaccedilotildees de organizaccedilotildees internacionais documentos oficiais relacionados com a abertura de dados e tambeacutem comunicaccedilotildees poliacuteticas quer para o caso portuguecircs quer ao niacutevel macro da EU Foi identificado o contexto social e poliacutetico dos Dados Abertos destacando-se as iniciativas com potencial impacto na abertura de dados Foram pesquisados documentos de investigaccedilatildeo relativos a poliacuteticas de dados abertos e formas de anaacutelise das mesmas

A avaliaccedilatildeo de impacto das poliacuteticas de Dados Abertos em Portugal foi feita com base na estrutura elencada por Zuiderwijk e Janssen (2014) A identificaccedilatildeo das respostas aos 27 indicadores foi feita com o recurso agrave literatura legislaccedilatildeo e agraves respostas obtidas a partir da AMA

Para determinar a quantidade de conjuntos de dados existentes em cada portal internacional analisado quando natildeo estava disponiacutevel a possibilidade de pesquisar por paiacutes foi introduzido o termo Portugal na caixa de pesquisa Deste modo recuperaram-se os conjuntos de dados relacionados com o paiacutes embora nem todos os datasets tenham autoria portuguesa A determinaccedilatildeo das caracteriacutesticas dos portais de dados portugueses analisados foi efetuada com base na informaccedilatildeo inscrita no proacuteprio siacutetio web Quando natildeo disponiacuteveis na paacutegina principal dos cataacutelogos de dados procedeu-se agrave pesquisa nas paacuteginas descritivas dos datasets ou no setor dos avisos legais

Procurou-se aqui tambeacutem definir alguns dos termos que iratildeo ser utilizados com frequecircncia na liacutengua inglesa e tambeacutem o seu acircmbito de aplicaccedilatildeo Segundo Borgman (2015) dados satildeo representaccedilotildees de observaccedilotildees objetos ou outras entidades usadas como prova de um fenoacutemeno para fins de investigaccedilatildeo ou acadeacutemicos

O termo dataset designa um conjunto ou coleccedilatildeo de dados publicados ou preservados por um agente uacutenico estando disponiacutevel para acesso ou download em um ou mais formatos (World Wide Web Consortium [W3C] 2014)

Para a contextualizaccedilatildeo e avaliaccedilatildeo de poliacuteticas foi tida em consideraccedilatildeo a definiccedilatildeo do Dicionaacuterio de Cambridge que define poliacutetica como ldquoa set of ideas or a plan of what to do in particular situations that has been agreed to officially by a group of people a business organization a government or a political partyrdquo (Cambridge University Press 2017)

8

1 Do Acesso Aberto aos Dados Abertos

O processo de abertura do conhecimento cientiacutefico comeccedilou em 2002 com o movimento do Acesso Aberto (AA) culminando na abertura da literatura cientiacutefica financiada por fundo puacuteblicos O avanccedilar da tecnologia a produccedilatildeo massiva de dados as redes sociais cientiacuteficas a ciecircncia cidadatilde os recursos educacionais e o coacutedigo aberto em conjunto gerou uma ciecircncia diferente Este conceito mais amplo de ciecircncia definido como Ciecircncia Aberta pretende abrir toda a panoacuteplia de formatos e recursos onde constem resultados cientiacuteficos com destaque para os dados de investigaccedilatildeo financiados publicamente A abertura de dados processa-se tambeacutem a niacutevel puacuteblico com o Governo e vaacuterias instituiccedilotildees puacuteblicas empenhadas em disponibilizar de forma aberta a informaccedilatildeo do setor puacuteblico

11 Acesso Aberto

O acesso ao conhecimento eacute a base do processo cientiacutefico motor do desenvolvimento social econoacutemico e humano O acesso generalizado agrave Internet alterou o paradigma da comunicaccedilatildeo acadeacutemica pela introduccedilatildeo experimental de novas formas de publicaccedilatildeo e disseminaccedilatildeo da ciecircncia Os primoacuterdios do Acesso Aberto (AA) agrave informaccedilatildeo cientiacutefica remontam a iniciativas como o ArXiv2 um servidor de preprints3 e o EPrints um dos softwares usados para a constituiccedilatildeo de repositoacuterios

O movimento de AA surgiu como resposta ao problema conhecido como lsquoCrise dos Perioacutedicosrsquo Na verdade a escalada de preccedilos das assinaturas de revistas cientiacuteficas e as restriccedilotildees colocadas pelas editoras limitando de forma seacuteria o acesso aos resultados de investigaccedilatildeo teve duas consequecircncias limitaccedilatildeo severa no acesso agrave informaccedilatildeo e colateral diminuiccedilatildeo do potencial de impacto de citaccedilatildeo Eacute neste contexto que em 2002 surge a declaraccedilatildeo fundadora do AA a Budapeste Open Access Initiative (BOAI) Segundo a BOAI entende-se por AA a disponibilizaccedilatildeo na Internet de literatura cientiacutefica permitindo que os utilizadores possam ler copiar distribuir imprimir e pesquisar esta literatura sem barreiras legais teacutecnicas ou financeiras que natildeo o proacuteprio acesso agrave Internet (Budapest Open Access Iniciative [BOAI] 2002 traduccedilatildeo livre) A BOAI estabeleceu duas vias para concretizar o AA a publicaccedilatildeo em revistas cientiacuteficas de AA conhecida como a via dourada e o auto arquivo em repositoacuterios cientiacuteficos conhecido como a via verde de AA Para atingir a abertura dos artigos a BOAI sublinha que devem ser cumpridas duas estrateacutegias complementares

2 O arXiv surgiu em 1991 com o intuito de alojar preprints de artigos cientiacuteficos da aacuterea da fiacutesica tendo sido expandido para integrar aacutereas como a matemaacutetica astronomia ciecircncias da computaccedilatildeo biologia e financcedila quantitativa e estatiacutestica Disponiacutevel na WWW httpsarxivorg 3 O preprint eacute uma versatildeo de um artigo cientiacutefico natildeo publicado e ainda natildeo sujeito a revisatildeo por pares

9

Os investigadores devem proceder ao Auto arquivo da versatildeo completa das suas publicaccedilotildees Necessidade de desenvolver uma nova geraccedilatildeo de revistas cientiacuteficas cujo foco seja a publicaccedilatildeo em AA (BOAI 2002)

Seguiram-se mais duas declaraccedilotildees de elevada importacircncia para o estabelecimento do AA a Declaraccedilatildeo de Bethesda sobre a Publicaccedilatildeo em Acesso Aberto e a Declaraccedilatildeo de Berlim sobre Acesso Livre ao Conhecimento nas Ciecircncias e Humanidades ambas em 2003 A Declaraccedilatildeo de Bethesda define o AA agraves publicaccedilotildees quando eacute autorizado o livre acesso uso e redistribuiccedilatildeo e tambeacutem quando eacute fornecida a versatildeo completa incluindo materiais suplementares e respetiva licenccedila de utilizaccedilatildeo em formato digital num repositoacuterio adequado (Declaraccedilatildeo de Bethesda sobre a Publicaccedilatildeo em Acesso Aberto 2003) A Declaraccedilatildeo de Berlim impotildee o cumprimento de duas condiccedilotildees os autoresdetentores dos direitos de autor devem autorizar sob a forma de uma licenccedila qualquer tipo de coacutepia reutilizaccedilatildeo redistribuiccedilatildeo e transmissatildeo sujeito apenas agrave menccedilatildeo de atribuiccedilatildeo de creacutedito e os autores devem depositar uma coacutepia completa do seu trabalho num repositoacuterio que assegure a sua preservaccedilatildeo a longo prazo (Declaraccedilatildeo de Berlim sobre Acesso Livre ao Conhecimento nas Ciecircncias e Humanidades 2003 traduccedilatildeo livre)

Borges (200692) sintetizou outros exemplos de iniciativas de AA desencadeadas a niacutevel global como o Open Archives Forum em 2001 a International Scholarly Communications Alliance ao niacutevel das ldquobibliotecas especializadas de investigaccedilatildeordquo listando ainda princiacutepios editoriais dos Estados Unidos da Ameacuterica (EUA)4 e europeus5 e assinalando tambeacutem a existecircncia do ldquoDAREnet a rede dos Digital Academic Repositoriesrdquo

Em 2012 a BOAI declarou que ldquoNothing in the last ten years makes OA less necessary or less opportunerdquo renovando e definindo recomendaccedilotildees para os proacuteximos 10 anos ao niacutevel de poliacuteticas licenciamento e reutilizaccedilatildeo infraestrutura e sustentabilidade e por fim sobre promoccedilatildeo e coordenaccedilatildeo

A abertura requerida por estas declaraccedilotildees tem por objetivo disponibilizar o AA a todos os que manifestem interesse nele sem distinccedilotildees discriminatoacuterias Suber (2012) um dos promotores do Movimento de Acesso Aberto agrave informaccedilatildeo cientiacutefica afirma que temos de ver o conhecimento como um bem puacuteblico e natildeo como uma mercadoria O AA deve incluir tambeacutem o processamento da informaccedilatildeo por maacutequinas que atraveacutes de teacutecnicas de extraccedilatildeo indexaccedilatildeo ou mistura permitem obter novas inferecircncias de

4 Os princiacutepios foram denominados Washington DC Principles For Free Access to Science em 2004 tendo sido assinados ldquopor uma seacuterie de editores natildeo lucrativos de sociedades cientiacuteficasrdquo (Borges 200692) 5 Borges (2006) indica que a Association of Learned and Professional Society Publishers emitiu princiacutepios semelhantes aos princiacutepios anunciados nos EUA

10

conhecimento (Suber 2012 Swan 2012) Os conteuacutedos comummente abrangidos pelo AA satildeo a literatura de investigaccedilatildeo cientiacutefica revista por pares dissertaccedilotildees teses e mais recentemente os dados de investigaccedilatildeo e livros cientiacuteficos (Swan 2012) aleacutem de manuais software modelos tridimensionais plantas mapas entre outros

As barreiras de preccedilo e de direitos de autor causam danos aos autores por limitarem a audiecircncia e impacto do seu trabalho ao condicionarem o que pode ser lido usado e citado (Suber 2012 traduccedilatildeo livre) O movimento de AA veio ameaccedilar o modelo dominante de publicaccedilatildeo cientiacutefica baseado ateacute entatildeo em subscriccedilotildees de revistas cientiacuteficas de elevado custo mudando o paradigma em termos de pagamento isentando o leitor e cobrando ao autor O AA natildeo eacute acesso sem custos (OECD 2015a) Em 2008 Stevan Harnad e Peter Suber propuseram termos para descrever os dois tipos de livre acesso agrave informaccedilatildeo cientiacutefica que se impuseram como fundamentais e reconhecidos O termo Graacutetis refere-se agrave remoccedilatildeo das barreiras de preccedilo enquanto o termo Livre refere-se agrave retirada das barreiras de preccedilo e de pelo menos algumas barreiras de permissatildeo (Suber 2008 traduccedilatildeo livre)

A viabilidade econoacutemica das infraestruturas de suporte ao AA pode constituir outro obstaacuteculo Contudo as revistas de AA podem optar por vaacuterios modelos de financiamento que lhes garanta a sustentabilidade econoacutemica como ldquosubsiacutedios publicidade taxas de poacutes-processamento do artigo impressotildees outros serviccedilos de publicaccedilatildeo taxas de associado ou combinaccedilotildees destas accedilotildeesrdquo (Universidade do Minho 2017) Jaacute os repositoacuterios de AA satildeo mais limitados em termos de sustentabilidade no entanto tecircm menos custos de manutenccedilatildeo e estatildeo jaacute em grande parte construiacutedos (OECD 2015a) O retorno do investimento que cada instituiccedilatildeo faz num repositoacuterio tem sempre garantia de retorno atraveacutes do conhecimento que aloja atraindo desta forma alunos investigadores e outros potenciais interessados

A complexidade do AA reside na transiccedilatildeo entre o modelo tradicional e o novo modelo de abertura natildeo pelos obstaacuteculos legais teacutecnicos ou financeiros mas sobretudo pelo fator cultural (Suber 2012 traduccedilatildeo livre) O mesmo autor defende que o AA natildeo eacute acesso universal pois mesmo removendo as barreiras de preccedilos e de permissotildees continuam a existir outras barreiras como filtros e censura barreiras de linguagem de acesso a incapacitados e de conectividade

A escolha do local de publicaccedilatildeo por parte do investigador eacute muitas vezes influenciada pelo prestiacutegio da revista na procura da melhor visibilidade para a sua investigaccedilatildeo O prestiacutegio das revistas eacute conseguido atraveacutes do Fator de Impacto (FI) uma medida de avaliaccedilatildeo criada por Eugene Garfield e Irving H Sher ldquoIn addition to helping libraries decide which journals to purchase JIFs are also used by aithors to decide where to submit their articles As a general rule the journals with high impact factors include the most prestigious Some would equate prestige with high impactrdquo (Garfield 200692) O FI do ano de uma revista cientiacutefica eacute calculado atraveacutes da divisatildeo

11

entre o nuacutemero de citaccedilotildees total que os artigos dessa revista receberam nos dois anos anteriores e o nuacutemero total de artigos publicados no mesmo periacuteodo (Garfield 2006) Suber afirmava em 2009 que o FI como medida principal da qualidade da investigaccedilatildeo impede o crescimento das revistas de AA pois segundo o autor pode afastar os investigadores da publicaccedilatildeo em revistas de AA Contudo em 2017 existem jaacute revistas de AA com o mesmo niacutevel de prestiacutegio das revistas tradicionais das puras como eacute o caso daquelas publicadas pela Public Library of Science (PLOS) e BioMed Central ou Hindawi agraves hiacutebridas de outros editores cientiacuteficos

Como incentivos para abertura dos seus trabalhos aleacutem do maior reconhecimento e impacto medido pela contagem de citaccedilotildees os investigadores apenas recebem recompensas menos tangiacuteveis como a promoccedilatildeo na carreira (Suber 2012) Para este autor o sucesso do AA natildeo depende do altruiacutesmo do investigador entendendo que o ganho de audiecircncia e de impacto atraveacutes da publicaccedilatildeo da investigaccedilatildeo em AA eacute do interesse pessoal do investigador

Sendo o AA dirigido agrave literatura cientiacutefica revista por pares seria de esperar que o controlo de qualidade natildeo constituiacutesse um problema Contudo surgiram no mundo editorial as revistas predatoacuterias um termo cunhado por Jeffrey Beall para definir as revistas que aproveitam o modelo dourado do AA em proveito proacuteprio ldquoThese predatory publishers are dishonest and lack transparencyrdquo Constroem siacutetios web semelhantes aos dos ldquolegitimate online publishers and publish journals of questionable and downright low qualityrdquo (Beall 2012) Beall assevera que ldquonow there is a journal willing to accept almost every article as long as the author is willing to pay the feerdquo (Beall 2012) Este tipo de revistas cobra pela publicaccedilatildeo de cada artigo sem no entanto oferecer os mesmos serviccedilos editoriais como a revisatildeo por pares um elemento fundamental para garantir a integridade e qualidade cientiacutefica

O AA acarreta vaacuterios benefiacutecios para a sociedade e comunidade cientiacutefica como o aumento da velocidade eficiecircncia e eficaacutecia da investigaccedilatildeo facilita a investigaccedilatildeo interdisciplinar amplia a visibilidade uso e impacto da investigaccedilatildeo e permite que as comunidades de profissionais empreendedores e o puacuteblico em geral retirem valor da investigaccedilatildeo (Swan 2012 traduccedilatildeo livre) O projeto Study of Open Access Publishing (SOAP) concluiu que cerca de 90 dos investigadores que responderam ao inqueacuterito consideram que o AA eacute beneacutefico para a investigaccedilatildeo cientiacutefica com impacto direto positivo no fluxo da comunicaccedilatildeo acadeacutemica (Dallmeier-Tiessen et al 2011)

De acordo com Harnad e Brody (2004) a melhor forma de calcular o impacto do AA eacute ldquocompare the citation counts of individual OA and non-OA articles appearing in the same (non-OA) journals Such ongoing comparisons are revealing dramatic citation advantages for OA Os mesmos autores enfatizam que o acesso natildeo eacute uma condiccedilatildeo suficiente para a citaccedilatildeo mas eacute uma condiccedilatildeo necessaacuteria Com as publicaccedilotildees em AA a crescer exponencialmente entre as revistas de AA e os repositoacuterios ldquoverdesrdquo eacute natural

12

que o uso e impacto potencial aumentem com variaccedilotildees entre campos de conhecimento decorrentes da sua cultura de partilha

Apoacutes a anaacutelise de 36 estudos sobre o impacto do AA nas citaccedilotildees de artigos Swan (2010) concluiu que 27 desses estudos apresentavam uma clara subida do nuacutemero meacutedio de citaccedilotildees Os artigos cientiacuteficos disponibilizados em AA satildeo mais citados que aqueles que permanecem fechados estando este facto relacionado com o aumento de audiecircncia e visibilidade promovida pelo AA (Suber 2012 Caruso Nicol amp Archambault 2013) Swan (2012) defende que o AA estaacute a nivelar a comunicaccedilatildeo cientiacutefica e o acesso a ela A mesma autora realccedila que a investigaccedilatildeo cientiacutefica tem impacto tambeacutem fora do meio acadeacutemico ao niacutevel empresarial sauacutede ou educaccedilatildeo A OECD (2015a) acrescenta que os artigos satildeo mais citados porque possuem livre acesso e uso e natildeo propriamente pela sua qualidade Um estudo da Science-Metrix concluiu que o AA pode aumentar o nuacutemero de artigos citados e diminuir a citaccedilatildeo de artigos que os investigadores natildeo leram Poreacutem a mesma anaacutelise revelou que apenas 8 dos 28 paiacuteses auscultados conseguiram publicar 50 ou mais dos artigos produzidos em AA (Caruso Nicol amp Archambault 2013)

A distinccedilatildeo entre Graacutetis e Livre natildeo possuiu o mesmo significado que a distinccedilatildeo entre via verde e via dourada Enquanto a primeira distinccedilatildeo se refere aos direitos cedidos aos utilizadores (Quatildeo aberto estaacute) a segunda distinccedilatildeo refere-se ao modo de publicaccedilatildeo (Como eacute entregue) (Suber 2012) Os direitos de autor podem constituir uma barreira de peso ao AA A abertura requerida pelo estatuto de AA Livre deve ser assegurada pela concessatildeo de licenccedilas que informem os utilizadores sobre o que podem e natildeo podem fazer com determinado produto de investigaccedilatildeo cientiacutefica Existem licenccedilas abertas como as Creative Commons (CC) que permitem a criaccedilatildeo de modelos de licenciamento com diferentes niacuteveis de permissotildees podendo desta forma o detentor dos direitos de autor autorizar o niacutevel de permissatildeo que lhe seja mais conveniente

Das 9431 revistas cientiacuteficas de AA listadas no Directory of Open Access Journals (DOAJ) em Maio de 2017 8447 dessas revistas utilizavam licenccedilas CC enquanto 278 revistas possuiacuteam licenccedilas proacuteprias das editoras Os cerca de 90 do nuacutemero total de revistas de AA a utilizar licenccedilas CC representa um crescimento exponencial desde 2012 quando Suber afirmou que apenas 20 das revistas em AA usavam algum tipo de licenccedila CC Nesta mesma data encontram-se listadas no DOAJ 78 revistas de AA de editoras portuguesas sendo que 91 dessas publicaccedilotildees usa licenccedilas CC para permitir o AA Livre (Directory of Open Access Journals [DOAJ] 2017)

A abertura dos resultados de investigaccedilatildeo eacute suportada por poliacuteticas que podem encorajar ou requerer de forma obrigatoacuteria o AA Por norma o encorajamento eacute feito na via dourada enquanto na via verde se definem mandatos Segundo Swan (2012 traduccedilatildeo livre) na formulaccedilatildeo de uma poliacutetica de AA devem ser considerados os

13

seguintes fatores Modo de publicaccedilatildeo (via verde ou dourada) Local de depoacutesito Tipos de conteuacutedos abrangidos Periacuteodos de embargo Permissotildees Niacuteveis de aplicaccedilatildeo Sensibilizaccedilatildeo de apoio agraves poliacuteticas Sanccedilotildees por incumprimento e Isenccedilotildees

De acordo com Suber (2012) existe similitude na abordagem agraves poliacuteticas de AA entre universidades e agecircncias de financiamento que tanto podem encorajar a via dourada como requerer a via verde A Wellcome Trust do Reino Unido e a National Institutes of Health (EUA) satildeo dois casos de sucesso de mandatos verdes requerendo que os investigadores depositem o seu trabalho num repositoacuterio de AA e que retenham o direito de autorizar esse AA o que permite que as instituiccedilotildees disponibilizem de forma aberta todos os resultados de investigaccedilatildeo por si financiados (National Institutes of Health [NIH] 2008 Wellcome Trust 2013)

O mais recente programa de financiamento de ciecircncia e inovaccedilatildeo da Uniatildeo Europeia o Horizonte 2020 detalha no artigo 292 do Model Grant Agreement os requisitos legais na abertura das publicaccedilotildees cientiacuteficas financiadas por este programa onde cada beneficiaacuterio deve assegurar o AA a todas as publicaccedilotildees revistas por pares utilizando para isso as duas vias disponiacuteveis (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016a traduccedilatildeo livre)

Existem tambeacutem serviccedilos com o intuito de facilitar a abertura das publicaccedilotildees cientiacuteficas O Registry of Open Access Repository Mandates and Policies (ROARMAP) lista as poliacuteticas e mandatos de AA ao niacutevel global registados neste diretoacuterio Em novembro de 2016 o ROARMAP conta com 794 mandatos instituiacutedos por vaacuterios tipos de organizaccedilotildees Portugal conta com 21 poliacuteticas de AA por via verde distribuiacutedas na sua maioria por instituiccedilotildees de ensino superior Os serviccedilos SHERPA da Universidade de Nottingham atraveacutes das bases de dados RoMEO e JULIET dispotildeem de valiosos indicadores quanto agraves poliacuteticas de AA das editoras cientiacuteficas e das entidades financiadoras de investigaccedilatildeo Relativamente agraves poliacuteticas editoriais de AA tendo em conta os direitos de autor e o auto arquivo existem em Portugal 127 poliacuteticas segundo o SHERPARoMEO sendo que mais de metade autoriza a publicaccedilatildeo em AA do poacutes-print ou da versatildeo final do editor Jaacute em termos de poliacuteticas de AA requeridas pela instituiccedilatildeo financiadora apenas a Fundaccedilatildeo para a Ciecircncia e Tecnologia (FCT) aparece listada no SHERPAJULIET

O AA envolve vaacuterios intervenientes distintos que cooperam na disponibilizaccedilatildeo dos resultados da investigaccedilatildeo cientiacutefica Assim como intervenientes podemos encontrar os investigadores cujo esforccedilo permite a criaccedilatildeo e difusatildeo de novo conhecimento com valor cientiacutefico a sociedade em geral que pode usufruir e construir em cima do novo conhecimento as universidades e institutos de investigaccedilatildeo que disponibilizam condiccedilotildees adequadas para o decurso da produccedilatildeo cientiacutefica incluindo a construccedilatildeo de infraestruturas de AA as entidades financiadoras de investigaccedilatildeo cientiacutefica as editoras que criam revistas de AA para permitir a difusatildeo acesso ao conhecimento e ainda

14

diversas organizaccedilotildees que dedicam parte das suas atividades agrave promoccedilatildeo de poliacuteticas e praticas de AA Entre as organizaccedilotildees mais relevantes podemos encontrar a UNESCO Wellcome Trust a Joint Information Systems Committee (JISC) a Scholarly Publishing and Academic Resources Coalition (SPARC) a Open Knowledge International (OKI) ou a NIH soacute para citar algumas das organizaccedilotildees mais reconhecidas pelo seu esforccedilo em direccedilatildeo ao AA

Em Portugal os grandes intervenientes do AA satildeo a FCT enquanto entidade financiadora a Fundaccedilatildeo para a Computaccedilatildeo Cientiacutefica Nacional (FCCN) no planeamento e gestatildeo da Rede Ciecircncia Tecnologia e Sociedade (RCTS) a Universidade do Minho pioneira no AA no paiacutes e o Repositoacuterio Cientiacutefico de Acesso Aberto de Portugal vulgo RCAAP que eacute um agregador da informaccedilatildeo cientiacutefica produzida

Segundo Suber (2012 traduccedilatildeo livre) o AA eacute um movimento amplo que abrange todos os campos de conhecimento todos os paiacuteses independentemente da sua realidade econoacutemica inclui a investigaccedilatildeo puacuteblica e privada sem limitaccedilatildeo temporal e natildeo se limita aos conteuacutedos textuais pois frequentemente estende-se aos dados conteuacutedos multimeacutedia e coacutedigo executaacutevel A UNESCO (2015) defende que o AA natildeo eacute um movimento isolado embora tenha caracteriacutesticas uacutenicas

111 Via Dourada

A via dourada do AA eacute a publicaccedilatildeo de artigos cientiacuteficos em revistas de AA que pode envolver o pagamento de custos de processamento - Article Processing Charge (APC) - pelo autor instituiccedilatildeo ou entidade financiadora ficando o artigo disponiacutevel e sem custos para os leitores A publicaccedilatildeo em AA por via dourada eacute compatiacutevel com a qualidade cientiacutefica das editoras tradicionais pois as revistas de AA possuem o serviccedilo de revisatildeo por pares dos artigos sendo que algumas delas jaacute atingiram um alto niacutevel de prestiacutegio O prestiacutegio das revistaseditoras cientiacuteficas eacute um fator que pesa na escolha do local de publicaccedilatildeo por parte dos investigadores Contudo o mundo editorial de AA conta jaacute com editoras de grande qualidade que implementaram sistemas rigorosos de revisatildeo cientiacutefica como satildeo o caso da BioMed Central ou PLoS (Swan 2012) O Sponsoring Consortium for Open Access Publishing in Particle Physics (SCOAP3) eacute um exemplo de sucesso de publicaccedilatildeo em AA dourado Sob orientaccedilatildeo do European Organization for Nuclear Research (CERN) apostou no redireccionamento do dinheiro aplicado nas subscriccedilotildees de revistas cientiacuteficas para efetuar o pagamento dos APCrsquos das revistas de AA da aacuterea da fiacutesica das partiacuteculas (Sponsoring Consortium for Open Access Publishing in Particle Physics [SCOAP3] 2014) Algumas revistas cientiacuteficas utilizam um modelo hiacutebrido que lhes permite dobrar os lucros ao cobrar subscriccedilotildees para acesso aos artigos permitindo contudo que estes fiquem em AA se for pago o APC pelo autor (Swan 2012)

15

O Reino Unido um dos liacutederes mundiais em investigaccedilatildeo concluiu que a implementaccedilatildeo de uma licenccedila nacional pode potenciar o AA ao permitir a negociaccedilatildeo de preccedilos ao mesmo tempo que orienta os investigadores para a publicaccedilatildeo em AA dourado (Price amp Chaytor 2015)

112 Via Verde

De acordo com Harnad et al (2004) a via verde de AA eacute um modo de publicaccedilatildeo em revistas cientiacuteficas de subscriccedilatildeo e o respetivo auto arquivo do trabalho publicado num repositoacuterio de AA O auto arquivo eacute o ato de submeter uma coacutepia de um documento cientiacutefico num repositoacuterio de AA de forma a assegurar a abertura e acesso ao seu conteuacutedo (UNESCO 2015) Existem trecircs tipos de documentos usados na via verde a versatildeo preacute-publicada (manuscrito natildeo sujeito a revisatildeo) a versatildeo poacutes-publicada (artigo aceite para publicaccedilatildeo) e a versatildeo final publicada (Laakso 2014 Bjoumlrk Lakso Welling Paetau 2014) Laakso (2014) sublinha a diferenccedila de quantidade de artigos publicados em AA e indexados pela SCOPUS entre as vaacuterias disciplinas cientiacuteficas com a fiacutesica e as ciecircncias da sauacutede a serem as aacutereas do conhecimento mais abertas por larga margem A falta de cultura de utilizaccedilatildeo do preacute-print a ausecircncia de revistas cientiacuteficas de alta qualidade ou a falta de financiamento para pagar os APCrsquos satildeo algumas das razotildees encontradas por Bjoumlrk et al (2014) para justificar a diferenccedila

Os repositoacuterios de AA satildeo coleccedilotildees ou bases de dados bibliograacuteficas de artigos cientiacuteficos publicados na web mas incluem outros conteuacutedos como teses dissertaccedilotildees datasets ou material didaacutetico oferecendo uma ligaccedilatildeo persistente a assegurando a preservaccedilatildeo a longo-prazo (Suber 2012) Os repositoacuterios natildeo efetuam o serviccedilo de revisatildeo por pares embora alojem artigos publicados em revistas de AA Outro aspeto importante da via verde de AA eacute o facto dos repositoacuterios de AA natildeo poderem gerar permissotildees de utilizaccedilatildeo por geralmente natildeo possuiacuterem esses direitos (Suber 2012 Bjoumlrk et al 2014)

Segundo Houghton amp Swan (2013) a via verde eacute o meio mais sustentaacutevel em termos de custos para todas as partes envolvidas Poreacutem de acordo com Swan (2012) soacute quando o AA por via verde eacute mandatado eacute que se atingem resultados satisfatoacuterios Apesar disso os repositoacuterios podem estimular a sua utilizaccedilatildeo se fornecerem serviccedilos como a contagem de citaccedilotildees ou estatiacutesticas de uso Bjork et al (2014 traduccedilatildeo livre) afirmam que o raacutecio de depoacutesito de artigos revistos pelos pares em repositoacuterios ronda os 12 justificando este baixo nuacutemero com os fracos sistemas de incentivo acadeacutemico com a falta de repositoacuterios adequados com a falta de conhecimento e com o fato de ser uma tarefa que consome tempo

Segundo o Directory of Open Access Repositories (OpenDOAR) existem vaacuterios tipos de repositoacuterios de AA os disciplinares que reuacutenem toda a informaccedilatildeo cientiacutefica de um

16

determinado campo do conhecimento os institucionais que agregam a informaccedilatildeo produzida por uma determinada instituiccedilatildeo os governamentais que alojam informaccedilatildeo proveniente de oacutergatildeos do Governo e os repositoacuterios agregadores Em Novembro de 2016 encontram-se listados no OpenDOAR 49 repositoacuterios de AA localizados em Portugal sendo que cerca de frac34 da totalidade dos repositoacuterios pertence a instituiccedilotildees do ensino superior O Open Archive Initiative ndash Protocol for Metadata Harvesting (OAI-PMH) permite a interoperabilidade entre diferentes plataformas possibilitando aos repositoacuterios de AA formar um sistema central virtual potenciando a descoberta e acessibilidade da informaccedilatildeo cientiacutefica (Suber 2012 Swan 2012 Bjoumlrk et al 2014) A Cybermetrics Lab lanccedilou em 2017 o Ranking de Repositoacuterios Web um grupo de investigaccedilatildeo do Conselho Superior de Investigaccedilatildeo Cientiacutefica de Espanha com o objetivo de apoiar o AA agraves publicaccedilotildees cientiacuteficas

Portugal possui 4 repositoacuterios no grupo dos 223 ldquoTop Portalsrdquo do ranking com o Scielo Portugal a ocupar a 76ordf posiccedilatildeo o Repositoacuterio Comum na 87ordf posiccedilatildeo a Plataforma de Revistas de AA da Universidade de Aveiro na 110ordf posiccedilatildeo e o Depoacutesito de Dissertaccedilotildees e Teses Digitais na 124ordm posiccedilatildeo No ldquoTop Institutionalsrdquo Portugal eacute representado pelo Universidade do Minho Repositorium na 60ordf posiccedilatildeo seguido pelo Repositoacuterio Universidade de Lisboa na 156ordf posiccedilatildeo e Repositoacuterio Aberto Universidade do Porto na 188ordf posiccedilatildeo entre os melhores duzentos classificados Em termos de ranking mundial o Repositorium da Universidade do Minho eacute o repositoacuterio melhor colocado ocupando a 68ordf posiccedilatildeo (Cybermetrics Lab 2017)

A relaccedilatildeo entre a via verde e a via dourada pode ser vista como ldquocomplementary and synergisticrdquo pois a filosofia de criaccedilatildeo e implementaccedilatildeo eacute a mesma (Suber 201258) Para este autor a via verde natildeo necessita de investimento econoacutemico tatildeo elevado para alavancar o AA agraves publicaccedilotildees cientiacuteficas nem infringe a liberdade acadeacutemica podendo ainda cobrir todos os resultados de investigaccedilatildeo de uma instituiccedilatildeo Este modo de disseminaccedilatildeo eacute compatiacutevel com a publicaccedilatildeo nas tradicionais revistas por subscriccedilatildeo podendo ainda alojar outros conteuacutedos que natildeo apenas artigos Jaacute a via dourada possui a vantagem de ser imediata sem periacuteodos de embargo podendo ainda ser classificada como AA Livre se forem dadas as respetivas permissotildees de uso Acrescenta-se o facto de a via dourada possuir o serviccedilo de revisatildeo por pares e fornecer sempre o acesso agrave versatildeo final do artigo Suber (2012 traduccedilatildeo livre) afirma que apenas a conjugaccedilatildeo das vantagens de cada modelo de publicaccedilatildeo garante a complementaridade de publicaccedilatildeo em AA uma vez que por si soacute tanto a via verde como a via dourada natildeo satildeo suficientes para assegurar o pleno AA O autor defende que enquanto a via verde atua melhor no registo e preservaccedilatildeo da investigaccedilatildeo cientiacutefica a via dourada assegura uma melhor distribuiccedilatildeo e certificaccedilatildeo de qualidade Na impossibilidade de publicar por uma das vias o investigador pode optar pela outra via assegurando sempre o AA ao seu trabalho

17

12 A Ciecircncia Aberta

A investigaccedilatildeo cientiacutefica encontra-se numa transiccedilatildeo cultural que abrange os

modelos de publicaccedilatildeo e reutilizaccedilatildeo na procura de uma maior abertura com o cariz digital a impulsionar o acesso aos resultados cientiacuteficos Machado (2015) salienta a necessidade de adotar um conceito mais amplo e que possa alojar na sua definiccedilatildeo toda a panoacuteplia de recursos cientiacuteficos produzidos durante o processo de investigaccedilatildeo A Ciecircncia Aberta (CA) refere-se comummente ao esforccedilo para tornar mais acessiacuteveis os resultados da investigaccedilatildeo cientiacutefica financiada pelo setor puacuteblico em formato digital para a comunidade cientiacutefica setor empresarial ou sociedade em geral (OECD 2015a)

O conceito de CA eacute considerado um termo guarda-chuva que assenta em vaacuterios pilares quer para remoccedilatildeo das barreiras de partilha de qualquer resultado meacutetodo ou ferramenta em qualquer fase do processo de investigaccedilatildeo (Bueno de la Fuente 2016 traduccedilatildeo livre) quer como sua condiccedilatildeo para a sua concretizaccedilatildeo (infraestrutura tecnoloacutegica) quer como desambiguaccedilatildeo de autores instituiccedilotildees e produccedilatildeo cientiacutefica (identificadores uacutenicos) A figura seguinte expressa algumas das vertentes que se enquadram no conceito amplo de CA e que respeita a manifestaccedilotildees muito distintas natildeo apenas da academia como jaacute foi referido mas de todas as esferas da sociedade

Fig 1 Os pilares da Ciecircncia Aberta Fonte adaptado de httpswwwfosteropenscienceeucontentwhat-open-science-introduction

A CA eacute um meio e natildeo um fim Garantir o acesso aos resultados de investigaccedilatildeo cientiacutefica pode tornar o sistema de investigaccedilatildeo mais eficiente ao reduzir custos na coleta transferecircncia e reutilizaccedilatildeo de dados ao aumentar a transparecircncia e qualidade no processo de investigaccedilatildeo acelerar a transferecircncia do conhecimento aumentar a

Ciecircncia Aberta

Acesso Aberto

Dados Abertos

Ciecircncia Cidadatilde

Revisatildeo por Pares Aberta

Coacutedigo Aberto

Blocos de Notas abertos

Recursos Educacionais

Abertos

Redes Sociais Cientiacuteficas

18

repercussatildeo do conhecimento na economia e promover a ligaccedilatildeo entre cidadatildeos e a ciecircncia e a investigaccedilatildeo (OECD 2015a traduccedilatildeo livre) A colaboraccedilatildeo dos cidadatildeos no processo de investigaccedilatildeo eacute denominada ciecircncia cidadatilde sendo o movimento de CA um importante facilitador da participaccedilatildeo puacuteblica na ciecircncia (Leonelli Spichtinger Prainsack 2015) O crescimento da ciecircncia cidadatilde aumentou o nuacutemero de intervenientes na cocriaccedilatildeo de conhecimento contribuindo para a aproximaccedilatildeo da fronteira entre o cientista profissional e o amador (Royal Society 2012 International Science 2015) Segundo a UNESCO (2012) citando dados da PubMed Central 40 do acesso a resultados de investigaccedilatildeo eacute feito por cidadatildeos individuais superando a utilizaccedilatildeo feita por universidades empresas e governo

Segundo a Open Science and Research Initiative (2014) a promoccedilatildeo da CA eacute feita em 4 niacuteveis definiccedilatildeo de poliacuteticas gerais alteraccedilatildeo na cultura de trabalho alteraccedilatildeo nos meacutetodos de trabalho e desenvolvimento de serviccedilos e infraestruturas Fecher amp Friesike (2013) estruturaram as mudanccedilas na CA em cinco escolas de pensamento

Fig 2 As 5 escolas de pensamento das mudanccedilas operadas pela Ciecircncia Aberta Fonte Fecher amp Friesike (2013)

A abertura aos resultados da investigaccedilatildeo eacute segundo a UNESCO (2015) muito requerida no processo de capacitaccedilatildeo dos cidadatildeos sendo que esta noccedilatildeo de abertura acarreta mudanccedilas na sociedade ao fornecer soluccedilotildees sustentaacuteveis para o chamado fosso digital6 Para a CA prosperar a comunidade acadeacutemica deve ter acesso a publicaccedilotildees dados meacutetodos conhecimentos serviccedilos de apoio e colaboraccedilatildeo entre os diversos intervenientes (Open Science and Research Initiative 2014 Leonelli Spichtinger Prainsack 2015 OECD 2015a Resoluccedilatildeo do Conselho de Ministros nordm 212016 2016) O acesso agrave literatura acadeacutemica tem por objetivo transpor a clivagem de conhecimento existente na sociedade fornecendo o Acesso Aberto (AA) atraveacutes de sistemas em linha aos resultados da investigaccedilatildeo financiada com fundos puacuteblicos (UNESCO 2015)

6 Segundo o glossaacuterio estatiacutestico da OCDE o termo fosso digital refere-se agrave desigualdade no acesso agrave informaccedilatildeo tecnologias de comunicaccedilatildeo e uso da Internet entre indiviacuteduos negoacutecios e aacutereas geograacuteficas com diferentes niacuteveis socioeconoacutemicos Disponiacutevel na WWW httpsstatsoecdorgglossarydetailaspID=4719

bull dirigida agrave arquitetura tecnoloacutegica com novas plataformas ferramentas e serviccedilos para os cientistas Infraestrutura

bull dirigida agrave acessibilidade do conhecimento pelo puacuteblico Puacuteblica bull dirigida ao desenvolvimento de uma nova avaliaccedilatildeo alternativa de impacto Avaliaccedilatildeo

bull dirigida ao acesso gratuito ao conhecimento pelo puacuteblico Democraacutetica

bull melhoria da eficiecircncia atraveacutes da investigaccedilatildeo colaborativa Pragmaacutetica

19

O projeto da EU Facilitate Open Science Training for European Research (FOSTER) assume a divisatildeo do conceito de Ciecircncia Aberta em quatro diferentes categorias Acesso Aberto Dados Abertos Coacutedigo Aberto e Investigaccedilatildeo Replicaacutevel Aberta (Pontika Knoth Cancellieri amp Pearce 2015)

A plena implementaccedilatildeo da CA estaacute dependente da resoluccedilatildeo de alguns desafios A Royal Society (2012) afirma que os interesses comerciais e econoacutemicos incluem a propriedade dos dados e os direitos de propriedade intelectual associados as parcerias puacuteblico-privadas e a abertura de informaccedilatildeo comercial de interesse puacuteblico a que se junta a privacidade e a seguranccedila e que constituem limites agrave implementaccedilatildeo da CA Por outro lado os incentivos e as recompensas concedidos agrave comunidade cientiacutefica continuam a ser inexistentes particularmente porque existe (i) falta de infraestruturas para apoiar a abertura (ii) receio que os dados em bruto e meacutetodos sejam mal interpretados ou mal usados (iii) incerteza sobre a propriedade dos dados e (iv) falta de experiecircncia na promoccedilatildeo da CA (Open Science and Research Initiative 2014 traduccedilatildeo livre) Metaforicamente Leonelli Spichtinger Prainsack (201513) defendem que ldquoin addition to the stick of compulsatory mandates carrots are therefore also neededrdquo Os autores sintetizam as ldquocarrotsrdquo ou seja as recompensas em trecircs eixos reconhecimento das praacuteticas de partilha nas estruturas de incentivos criaccedilatildeo de incentivos mais significativos para envolver os investigadores na CA e o reconhecimento do papel das meacutetricas alternativas na avaliaccedilatildeo dos investigadores

A CA proporciona vaacuterios benefiacutecios a todos os intervenientes e partes interessadas do processo de investigaccedilatildeo como o aumento da eficaacutecia da investigaccedilatildeo o aumento do conhecimento do modelo cientiacutefico melhoria do foco e da qualidade dos resultados de investigaccedilatildeo geraccedilatildeo de novas ideias de investigaccedilatildeo aumento do compromisso com a ciecircncia e melhoria da literacia cientiacutefica maior abertura e impacto social e econoacutemico aumento da qualidade visibilidade e impacto da investigaccedilatildeo (Open Science and Research Iniciative 2014 Leonelli Spichtinger Prainsack 2015 Forsstroumlm amp Haataja 2016) Estes benefiacutecios abrangem os investigadores e as suas equipas as organizaccedilotildees os decisores e financiadores e tambeacutem o puacuteblico em geral

A CA clama por uma mudanccedila no comportamento dos investigadores de forma a permitir a abertura de conteuacutedos e a adoccedilatildeo de praacuteticas e estrateacutegias abertas em todo o ciclo de investigaccedilatildeo (Pontika et al 2015) De acordo com Machado (2015) a abertura do conhecimento na sociedade da informaccedilatildeo pode ser uma realidade se essa for a prioridade de qualquer poliacutetica que tenha por objetivo promover a melhoria das condiccedilotildees de vida dos cidadatildeos e a reduccedilatildeo das assimetrias globais Quando falamos de CA aquilo que se vecirc eacute uma realidade jaacute espelhada globalmente inclusivamente em paiacuteses como a China (Price amp Chaytor 2015) onde a abertura poliacutetica natildeo o faria supor

20

A Comissatildeo Europeia desenvolveu o Open Science Monitor como forma de avaliar os desenvolvimentos na CA e as tendecircncias particulares ldquoin open science activities over time and comparatively between countries and scientific disciplinesrdquo (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2017) O Open Science Monitor tem como fonte diversas organizaccedilotildees empenhadas na avaliaccedilatildeo da CA do AA e dos Dados Abertos7 garantindo assim a profundidade e qualidade dos dados O modelo usado pelo Open Science Monitor divide diversos indicadores de avaliaccedilatildeo em trecircs categorias AA agraves publicaccedilotildees AA aos dados de investigaccedilatildeo e formas abertas de comunicaccedilatildeo acadeacutemica como demostrado na figura8 seguinte

Fig 3 Caracteriacutesticas e indicadores do Open Science Monitor Fonte Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2017) Disponiacutevel na WWW httpeceuropaeuresearchopenscienceindexcfmpg=homeampsection=monitor

A implementaccedilatildeo da CA implica alteraccedilotildees ao niacutevel da administraccedilatildeo da investigaccedilatildeo para melhorar a ciecircncia tornando-a crediacutevel replicaacutevel e iacutentegra como explica a Comissatildeo Europeia (2016a) Significa tambeacutem fazer alteraccedilotildees teacutecnicas e desenvolver normas para tornar a ciecircncia mais eficiente ao evitar a duplicaccedilatildeo de 7 Entre as vaacuterias organizaccedilotildees encontram-se a 101 innovations Clarivate Analytics Altimetric arXiv F1000Research figshare OpenAIRE Wiley entre outras 8 Os indicadores assinalados com um asterisco () tambeacutem satildeo considerados como forma de comunicaccedilatildeo acadeacutemica aberta

21

recursos e ao otimizar a reutilizaccedilatildeo de dados Por fim tornar a ciecircncia mais aberta ao melhorar a acessibilidade a dados e ao assegurar as condiccedilotildees legais apropriadas para o desenvolvimento de Text e Data Mining potenciando assim alteraccedilotildees econoacutemicas e legais ao niacutevel do copyright

Os investigadores recorrem cada vez mais agraves plataformas sociais para partilhar e validar os projetos de investigaccedilatildeo enquanto a criaccedilatildeo de plataformas abertas permite a partilha de dados para resoluccedilatildeo de problemas puacuteblicos como eacute o caso do The Humanitarian Data Exchange9 (Open Science and Research Initiative 2014) A ScienceOpen eacute outro exemplo de uma plataforma gratuita de pesquisa de informaccedilatildeo cientiacutefica que oferece contexto agrave investigaccedilatildeo atraveacutes de comentaacuterios recomendaccedilotildees ou revisatildeo por pares apoacutes a publicaccedilatildeo permitindo assim que os investigadores encontrem a informaccedilatildeo mais relevante para as suas pesquisas (ScienceOpen 2017) Nos uacuteltimos anos tecircm surgido outras formas de publicaccedilatildeo em AA normalmente atraveacutes de paacuteginas pessoais ou em siacutetios de comunidades cientiacuteficas como o academiaedu ou o Research Gate que em 2017 foram classificados como liacutederes do ranking ldquoTop Portalsrdquo do Ranking de Repositoacuterios Web pela Cybermetrics Lab Outros resultados interessantes foram obtidos por Kramer e Bosman (2016) apoacutes a anaacutelise dos dados dos mais de 20 mil participantes num inqueacuterito a niacutevel global A CA e o AA satildeo apoiados por 809 e 859 dos inquiridos respetivamente Em termos de publicaccedilatildeo de artigos o estudo indica o Research Gate e os repositoacuterios institucionais como os preferidos Relativamente agrave publicaccedilatildeo de dados a preferecircncia dos inquiridos recaiu no GitHub seguindo-se o Figshare DropBox BitBucket Dataverse Dryad e o Zenodo Poreacutem dos 20 mil inquiridos apenas cerca de 30 respondeu a esta questatildeo Em relaccedilatildeo a Portugal e no caso do apoio agrave CA e ao AA os resultados satildeo extremamente positivos contudo a amostra obtida eacute demasiado pequena para se poder aferir qualquer conclusatildeo definitiva E contrastam de forma gritante com as conclusotildees do relatoacuterio sobre a elaboraccedilatildeo de uma poliacutetica nacional de CA que sublinha a dificuldade de generalizaccedilatildeo das praacuteticas de AA registando por isso limitaccedilotildees nas ldquotaxas de sucesso e cumprimentos das poliacuteticas institucionaisrdquo (Comissatildeo Executiva Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta [Comissatildeo Executiva GT-PNCA] 20169)

A intenccedilatildeo da EU eacute criar uma European Open Science Cloud (EOSC) ou seja um ambiente onde os investigadores possam ter acesso a ferramentas e dados para fins de investigaccedilatildeo inovaccedilatildeo e educaccedilatildeo Esta plataforma eacute considerada uma parte fundamental da transiccedilatildeo europeia para a CA e para tornar a ciecircncia orientada por dados (Comissatildeo Europeia 2016a traduccedilatildeo livre)

Podem observar-se algumas tendecircncias chave na CA e a sua relevacircncia na EOSC como o novo modelo de comunicaccedilatildeo acadeacutemica recompensas modernas e

9 Disponiacutevel na WWW httpsdatahumdataorg

22

reconhecimento aumento da dependecircncia de peritos de dados colaboraccedilatildeo interdisciplinar fomento da transiccedilatildeo de ciecircncia para inovaccedilatildeo desenvolvimento de um complexo sistema de infraestruturas da integridade da investigaccedilatildeo e do processamento do conhecimento por maacutequinas (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016b traduccedilatildeo livre)

O FOSTER desenhou uma interessante taxonomia a partir do termo CA que permite demonstrar a grandeza e os diferentes niacuteveis de impacto do conceito (Pontika et al 2015)

Fig 4 Taxonomia da Ciecircncia Aberta Fonte Knoth Petr Pontika Nancy (2015)

Em termos de poliacuteticas existem trecircs tendecircncias na definiccedilatildeo das poliacuteticas de CA como refere a OECD (2015a traduccedilatildeo livre)

As regras obrigatoacuterias impostas nos contratos de financiamento ou em poliacuteticas nacionais

Os mecanismos de incentivo como o apoio financeiro para publicaccedilatildeo de investigaccedilatildeo a citaccedilatildeo e a progressatildeo na carreira

Os viabilizadores ou seja a infraestrutura que permite o decurso da abertura cientiacutefica

23

A OECD (2015a) acrescenta que as poliacuteticas de AA satildeo mais maduras que as poliacuteticas de Ciecircncia Aberta existentes e sublinha ainda que as poliacuteticas de CA devem ter princiacutepios-base mas que tecircm de ser adaptadas agraves realidades locais

A CA tem estado em foco na agenda poliacutetica dos governos e organizaccedilotildees mundiais Ao niacutevel europeu a Agenda Digital da Comissatildeo Europeia define cinco potenciais linhas de accedilatildeo poliacuteticas (Comissatildeo Europeia 2016a45 traduccedilatildeo livre)

Fomento e criaccedilatildeo de incentivos para a CA atraveacutes do fomento do conceito de abertura em programas de educaccedilatildeo e promoccedilatildeo das melhores praacuteticas de ciecircncia cidadatilde garantindo a qualidade impacto e integridade da investigaccedilatildeo

Remoccedilatildeo de barreiras atraveacutes da revisatildeo de carreiras dos investigadores bem como dos incentivos e recompensas pelos esforccedilos de CA

Generalizaccedilatildeo da promoccedilatildeo de poliacuteticas de AA (artigos e dados de investigaccedilatildeo) Desenvolvimento de infraestruturas de investigaccedilatildeo para a CA de forma a

melhorar o alojamento de dados acesso e governaccedilatildeo com a criaccedilatildeo de uma nuvem europeia de CA (European Open Science Cloud)

Incorporar a Ciecircncia Aberta na sociedade como condutor socioeconoacutemico

De acordo com a Open Science and Research Initiative (2014) a CA tem vaacuterios intervenientes distintos os investigadores e as equipas de investigaccedilatildeo organizaccedilotildeesentidades de investigaccedilatildeo financiadores decisores e puacuteblico em geral A OECD (2015a) acrescenta as bibliotecas editoras cientiacuteficas privadas empresas e entidades supranacionais como a proacutepria OECD Neste contexto a EU tem-se destacado como promotora da CA Nesse sentido criou o jaacute mencionado FOSTER um projeto cujo objetivo eacute produzir um programa de treino que iraacute ajudar investigadores estudantes bibliotecaacuterios e outras partes interessadas a incorporar a CA nas suas metodologias de investigaccedilatildeo O portal FOSTER10 eacute uma plataforma e-learning que agrega conteuacutedos de treino sobre CA para aqueles que precisem de desenvolver estrateacutegias e competecircncias para a implementaccedilatildeo da CA nos fluxos de trabalho diaacuterio (FOSTER 2016) A Uniatildeo Europeia (EU) posiciona-se tambeacutem como financiadora do AA como forma de acesso ao conhecimento Nesse sentido adotou o AA como princiacutepio em 2012 tendo-o definido como obrigatoacuterio em 2013 no novo programa de financiamento da investigaccedilatildeo e inovaccedilatildeo europeu denominado Horizonte 2020 (Uniatildeo Europeia 2013) Financiou ainda um projeto de investigaccedilatildeo exclusivamente dedicado ao alinhamento de estrateacutegias e poliacuteticas de AA o Pasteur4OA Aleacutem disso a EU criou o OpenAIRE uma plataforma que permite agregar toda a literatura cientiacutefica produzida em projetos financiados por fundos europeus A segunda fase do OpenAIRE consiste em facilitar o AA ao fornecer ligaccedilotildees cruzadas entre publicaccedilotildees dados e esquemas de financiamento e iraacute expandir a rede de repositoacuterios para incluir os fornecedores de dados com o objetivo de interligar os dados cientiacuteficos associados

10 Disponiacutevel na WWW httpswwwfosteropenscienceeu

24

(OECD 2015a) A terceira fase do projeto arrancou em Janeiro de 2017 com o OpenAIRE-Connect que visa fornecer pontes tecnoloacutegicas e sociais para aleacutem de disponibilizar serviccedilos de troca de literatura dados ou meacutetodos de investigaccedilatildeo ldquowith semantic links between them across research communities and content providers in scientific communicationrdquo (OpenAIRE 2017) O OpenAIRE-Connect iraacute tambeacutem implementar o conceito de ldquoOpen Science as a Service (OSaaS) on top of the existing OpenAIRE infrastructure delivering out-of-the-box on demand deployable toolsrdquo (OpenAIRE 2017) O projeto eacute uma parceria entre 11 instituiccedilotildees onde consta a Universidade do Minho como representante portuguesa

A UNESCO estaacute ativamente empenhada na promoccedilatildeo da CA e em parceria com a Nature lanccedilou em Novembro de 2014 a Biblioteca Mundial de Ciecircncia11 (WLoS) uma biblioteca cientiacutefica gratuita e multilingue com o objetivo de fornecer acesso agrave investigaccedilatildeo cientiacutefica recente a estudantes e professores de todas as partes do globo Podemos ainda relacionar a CA com o conceito de Ciecircncia 20 que sugere a partilha e a colaboraccedilatildeo como nova abordagem para o uso de informaccedilatildeo incluindo o uso de ferramentas como wikis blogs viacutedeos dados em bruto e novas teorias (Machado 2015 Leonelli Spichtinger Prainsack 2015)

Em Portugal soacute em fevereiro de 2016 se regista a intenccedilatildeo de estabelecer uma poliacutetica nacional de Ciecircncia Aberta com a publicaccedilatildeo dos principiacuteos orientadores para a ldquoCiecircncia Aberta Conhecimento para todosrdquo pelo Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior (MCTES) Em Maio a Resoluccedilatildeo do Conselho de Ministros nordm 212016 vem definir os princiacutepios da implementaccedilatildeo da poliacutetica de Ciecircncia Aberta em Portugal Esta poliacutetica estaacute estruturada em torno de quatro eixos Acesso aberto e dados abertos Infraestruturas e preservaccedilatildeo digital Avaliaccedilatildeo cientiacutefica Responsabilidade social cientiacutefica (Comissatildeo Executiva GT-PNCA 2016)

O MCTES e o Ministeacuterio da Cultura lanccedilaram em 201712 o Diretoacuterio dos Repositoacuterios Digitais uma infraestrutura digital com o objetivo de identificar e constituir um ponto de acesso aos repositoacuterios digitais existentes em Portugal na aacuterea da Ciecircncia e da Cultura de forma a promover a utilizaccedilatildeo dos repositoacuterios digitais bem como a normalizaccedilatildeo teacutecnica e praacuteticas de preservaccedilatildeo digital tal como foi anunciado em 2016 (Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior Ministeacuterio da Cultura 2016)

13 Big Data ou dados massivos

O termo Big Data surge associado aos dados em formato digital que excedem a capacidade de processamento dos sistemas de bases de dados convencionais (Reitano 11 Disponiacutevel na WWW httpwwwnaturecomwlsabout 12 Disponiacutevel na WWW httprepositorios-conhecimentopt

25

2013 Comissatildeo Europeia 2014) Segundo Borgman (2015) o Big Data compreende dados estruturados e natildeo estruturados com tendecircncia agrave homogeneidade e agrave padronizaccedilatildeo Ubaldi (2013 traduccedilatildeo livre) reitera que o Big Data enquanto fenoacutemeno emergiu quando a disponibilidade de datasets produzidos por vaacuterias fontes cresceu e quando os utilizadores de dados reconheceram o valor potencial da combinaccedilatildeo e ligaccedilatildeo de diferentes conjuntos de dados produzidos por diferentes intervenientes

A revoluccedilatildeo digital ocorrida nas uacuteltimas deacutecadas teve repercussotildees profundas na coleta acesso armazenamento e transmissatildeo de dados estando atualmente estimado em 40 o volume de crescimento de dados por ano (Manyika et al 2011) Os dados digitais estatildeo presentes em todos os setores econoacutemicos o nuacutemero de paacuteginas web cresceu exponencialmente surgiram as redes sociais os smartphones e toda uma panoacuteplia de tecnologias que coletam dados que podem ser beneacuteficos para a sociedade como as aplicaccedilotildees surgidas no acircmbito da Internet of Things13 (IoT) que iratildeo avolumar o nuacutemero de dados jaacute produzidos (Fan amp Bifet 2012)

Weacutere drowning in data bits are faster than atoms (Croll 20122)

Large amounts of data are being produced permanently and when these are analyzed and interlinked they have the potential to create new knowledge and intelligent solutions for economy and society (Uniatildeo Europeia 2016)

Lynch (2009) salienta a emergecircncia do 4ordm paradigma da investigaccedilatildeo cientiacutefica termo cunhado por Jim Gray definindo-se como uma ciecircncia intensiva orientada a dados

Fig 5 Paradigmas da investigaccedilatildeo cientiacutefica Fonte traduzido de Lynch (2009)

Esta nova ciecircncia assenta em trecircs pilares captura curadoria e anaacutelise de dados (Bell 2009 Royal Society 2012) A curadoria de dados envolve variadas atividades como ldquofinding the right data structures to map into various storesrdquo (Bell 2009XIII) Inclui o esquema de metadados e os respetivos metadados para a sua preservaccedilatildeo e pesquisa A anaacutelise de dados ldquocovers a whole range of activities throughout the workflow pipeline including the use of databases analysis and modeling and then

13 A Internet Of Things eacute um conceito onde edifiacutecios transportes produtos e pessoas se tornam espaccedilos de informaccedilatildeo ou seja satildeo imbuiacutedos com sensores software ou eletroacutenica que lhes permite coletar e partilhar dados Disponiacutevel na WWW httpwwwtheinternetofthingseuwhat-is-the-internet-of-things

Investigaccedilatildeo teoacuterica

Investigaccedilatildeo empiacuterica

Investigaccedilatildeo computacional

Investigaccedilatildeo orientada a dados

26

data visualizationrdquo (Bell 2009XIV) podendo ser sinoacutenimo de melhores resultados processos e decisotildees (Comissatildeo Europeia 2014)

Dumbill (2012) afirma que para retirar valor destes dados eacute necessaacuterio encontrar formas alternativas de os processar Borgman reitera que os dados tecircm muitos tipos de valor e que esse valor pode natildeo ser visiacutevel ateacute os dados serem coletados curados ou perdidos A autora sublinha que os dados natildeo tecircm valor estando isolados eles fazem parte de uma infraestrutura do conhecimento ldquoan ecology of people pratices technologies institutions material objects and relationshpsrdquo (Borgman 20154) Este volume de dados produzidos pode segundo o Big Data Europe (2016) trazer contribuiccedilotildees relevantes para o progresso teacutecnico dos setores chave da sociedade e ajudar a reformular o mundo dos negoacutecios Ainda segundo a EU ldquowhat is needed are innovative technologies strategies and competencies for the beneficial use of Big Data to address societal needsrdquo

Segundo Manyika et al (2011) os Dados Massivos podem gerar valor de vaacuterias formas criar transparecircncia governativa e empresarial permitir a experimentaccedilatildeo expor variaacuteveis e melhorar o rendimento criar de produtos e serviccedilos para populaccedilotildees especiacuteficas apoiar ou substituir o processo de decisatildeo humana com algoritmos automatizados criar de modelos de negoacutecio produtos e serviccedilos inovadores Verifica-se que um nuacutemero crescente de empresas jaacute usa dados para gerar valor econoacutemico sendo que tambeacutem os governos tecircm a possibilidade de aumentar a sua eficiecircncia e gerar poupanccedila (Manyika et al 2011) A Comissatildeo Europeia (2017a) destaca as aplicaccedilotildees para smartphones ou produtos inteligentes para empresas acrescentando que os Dados Massivos podem fomentar o crescimento de emprego na Europa e melhorar a qualidade de vida dos cidadatildeos europeus

Numa organizaccedilatildeo o valor do Big Data eacute contabilizado em duas categorias uso analiacutetico e desenvolvimento de novos produtos (Dumbill 2012) Croll (20122) afirma a necessidade da sociedade em decidir agir e experimentar com base nas aprendizagens feitas e utilizar esse conhecimento em accedilotildees futuras defendendo que estamos a entrar numa ldquofeedback economyrdquo que iraacute tornar-se a norma em organizaccedilotildees puacuteblicas e no setor empresarial dada a eficiecircncia e a otimizaccedilatildeo de recursos geradas Esta economia de retorno de resultados e respetivas mediccedilotildees de impacto tem por base a cadeia de abastecimento dos Dados Massivos como representado na figura seguinte

27

Fig 6 Cadeia de abastecimento dos Dados Massivos Fonte traduzido de Croll (2012)

ldquoIn this networked world people objects and connections are producing data at unprecedented rates both actively and passivelyrdquo (Science International 2015) Segundo Hey Tansley e Tolle (2009) a Internet pode proporcionar mais do que o acesso aos dados pode agregar todos os dados disponiacuteveis agrave literatura que lhes faz referecircncia aumentando a velocidade da informaccedilatildeo cientiacutefica e a eficiecircncia da investigaccedilatildeo Laney (2001) foi o primeiro a caraterizar a gestatildeo de dados atraveacutes do sistema de trecircs Vrsquos que ajuda a perceber a natureza dos dados e as plataformas disponiacuteveis para os explorar Marr (2014) afirma que atualmente o sistema passou a ser composto por dois Vrsquos adicionais perfazendo um total de cinco Vrsquos

Volume o volume e o tamanho dos dados continuam a aumentar contudo a capacidade de processamento dos nossos sistemas continua baixa

Variedade existecircncia de diversos tipos de dados provenientes de diversas fontes Velocidade obtenccedilatildeo de informaccedilatildeo em tempo real Veracidade refere-se agrave qualidade e correccedilatildeo dos dados Valor ganho de competitividade tomada de decisotildees alavancada em informaccedilatildeo

atualizada

A intensidade da revoluccedilatildeo operada pelo fenoacutemeno dos Dados Massivos ldquohas produced changes in economic and social behaviour e has profound implications for sciencerdquo permitindo a identificaccedilatildeo de padrotildees em fenoacutemenos e demonstrando relaccedilotildees insuspeitas entre dados que ateacute aqui eram desconhecidas (Science International 2015) ldquoContrary to many high-volume big data settings where standardised infrastructure are available there exist other big data settings with less

Coleta de Dados

Extraccedilatildeo e Limpeza

Infra

estruturas

Plataformas

M Learning e Mining

Exploraccedilatildeo humana

Armazena mento

Partilha

Mediccedilatildeo de resultados e criaccedilatildeo de feedback

28

mature processes due to the lack of tools resources and community exchangerdquo (Proumll Meixner ampRauber 2016) Borgman (20158) recorre a um termo utilizado na Estatiacutestica para identificar distribuiccedilotildees de dados a long tail of data14 ou cauda longa dos dados que quando aplicada agrave investigaccedilatildeo acadeacutemica implica que ldquoa small number of research teams work with large volumes of data some teams work with very little data and most fall somewhere in betweenrdquo

Fig 7 A cauda longa dos Dados Massivos Fonte traduzido de Borgman (2015)

A cauda longa dos dados de investigaccedilatildeo abrange grandes porccedilotildees ldquoof data that are highly heterogeneous managed predominantly locally within each researcherrsquos environment and frequently not properly transferred to and managed within well-curated repositoriesrdquo (Proumll Meixner ampRauber 2016) Segundo o e-Infrastructure Reflection Group (e-IRG) (2016) citando Heidorn (2008) o termo long tail of data tem-se tambeacutem aplicado para salientar a variedade na estrutura tema complexidade formato tamanho localizaccedilatildeo e o uso na investigaccedilatildeo dos dados de investigaccedilatildeo

Para capturar todo o potencial gerado pela produccedilatildeo massiva de dados devem ser tidas em conta vaacuterias questotildees (Manyika et al 2011 traduccedilatildeo livre)

Formulaccedilatildeo de poliacuteticas de dados que incluam temas sensiacuteveis como a privacidade seguranccedila credibilidade e propriedade intelectual

Desenvolvimento de novas tecnologias de armazenamento computaccedilatildeo e software analiacutetico aleacutem de novas teacutecnicas de anaacutelise

Mudanccedila na cultura organizacional com a contrataccedilatildeo de peritos que possam retirar informaccedilatildeo e conhecimento dos dados e tambeacutem o estabelecimento de incentivos para otimizar o uso do Big Data induzindo melhorias numa tomada de decisatildeo mais informada

Acesso aos dados para permitir a criaccedilatildeo de novas oportunidades de negoacutecio Intensificaccedilatildeo da estrutura competitiva de empresas e setor puacuteblico para

potenciar a captaccedilatildeo de benefiacutecios da massificaccedilatildeo de dados

14 O termo foi introduzido por Cris Anderson (2004) para comparar o mercado de bens feito ao niacutevel de vendas fiacutesicas e online Disponiacutevel na WWW httpswwwwiredcom200410tail

Volu

me

de d

ados

Nuacutemero de Investigadores

29

O fenoacutemeno do Big Data estaacute intrinsecamente ligado a outro fenoacutemeno o desenvolvimento de software aberto como eacute o caso do Apache Hadoop15 que permite o processamento de grandes quantidades de dados em paralelo atraveacutes ldquolarge clusters of compute nodesrdquo (Fan amp Bifet 20123)

A influecircncia do Big Data na sociedade manifesta-se a diversos niacuteveis destacando-se o desenvolvimento de projetos na aacuterea da sauacutede transportes agricultura ambiente induacutestria ganho de competecircncias cientiacuteficas mercado de dados e dados abertos Num artigo assinado na Computer World Olavsrud (2013) identifica alguns dos usos do Big Data na atualidade fins meacutedicos empresariais tecnoloacutegicos em eventos desportivos ou no desenvolvimento das smart cities A Uniatildeo Europeia tem contribuiacutedo para o alargar da importacircncia e da esfera de influecircncia do fenoacutemeno Big Data financiando entre outros projetos como

DataPitch16 que tem por objetivo acelerar a chegada dos dados ao mercado Open Data Incubator Europe17 (ODINE) que oferece incubaccedilatildeo e tutoria agraves PMEs

na nova geraccedilatildeo de empreendedorismo digital European Data Science Academy18 (EDSA) que avalia o estado do setor de peritos

de dados e oferece ciclos de aprendizagem de habilidades especiacuteficas de acordo com as necessidades detetadas

Big Data Europe que visa coletar informaccedilotildees sobre o desenvolvimento de infraestruturas necessaacuterias agrave praacutetica de uma ciecircncia de dados intensiva para a resoluccedilatildeo de problemas da sociedade possibilitando que as empresas possam construir produtos e serviccedilos inovadores ldquobased on semantically interoperable large-scale multi-lingual data assets and knowledge available under a variety of licenses and business modelsrdquo (Big Data Europe 2016)

14 Dados Abertos

Eacute axiomaacutetico o fato de o conhecimento ser essencial ao processo de decisatildeo agrave inovaccedilatildeo e ao bem-estar social Os dados sempre foram essenciais em muitas aacutereas da investigaccedilatildeo e nos uacuteltimos anos tornaram-se destaque em mais aacutereas cientiacuteficas crescendo substancialmente em escala e complexidade Quando a informaccedilatildeo eacute abundante a proacutepria natureza da investigaccedilatildeo comeccedila a mudar gerando um ciclo de respostas entre investigadores e resultados de investigaccedilatildeo que ldquochanges the pace and direction of discoveryrdquo (Comissatildeo Europeia Grupo de peritos de alto niacutevel em dados de investigaccedilatildeo 20108) Os Dados Abertos permitem que os investigadores produzam anaacutelises e inferecircncias muito aleacutem do que os indiviacuteduos e silos de dados isolados podem

15 Disponiacutevel na WWW httphadoopapacheorg 16 Disponiacutevel na WWW httpcordiseuropaeuprojectrcn206193_enhtml 17 Disponiacutevel na WWW httpsopendataincubatoreu 18 Disponiacutevel na WWW httpcordiseuropaeuprojectrcn194116_enhtml

30

produzir (Shadbolt 2016) O International Council for Science (ICSU) considera que quando o setor publico eacute o responsaacutevel pelos custos da criaccedilatildeo de dados de investigaccedilatildeo eacute do interesse cientiacutefico que seja encorajado o maacuteximo e possiacutevel uso e reuacuteso dos dados (International Council for Science [ICSU] 2014) A abertura dos dados gerados na investigaccedilatildeo cientiacutefica ou pelas entidades puacuteblicas as grandes fontes de dados na atualidade constituem uma oportunidade de gerar valor para a sociedade Segundo Borgman (2015) dados satildeo representaccedilotildees de observaccedilotildees objetos ou outras entidades usadas como prova de um fenoacutemeno para fins de investigaccedilatildeo ou acadeacutemicos Os dados tornam-se informaccedilatildeo quando satildeo combinados de formas que podem revelar padrotildees num determinado fenoacutemeno O conhecimento eacute gerado pela informaccedilatildeo apoiada em dados concretos sobre um fenoacutemeno (Royal Society 2012)

ldquoIn the digital age data is the raw material on which discoveries are built and unfettered access to research datardquo (SPARC) O processo de investigaccedilatildeo eacute dividido em vaacuterias etapas atraveacutes das quais muitas vezes satildeo produzidos dados primaacuterios estatiacutesticas caacutelculos ou anotaccedilotildees seja em forma bruta ou em forma graacutefica que servem de suporte aos artigos cientiacuteficos publicados Contudo dada a variedade de tipologias e formatos por norma os dados natildeo satildeo alvo de publicaccedilatildeo correndo o risco de ser perderem se natildeo forem adequadamente armazenados e preservados Neste sentido a abertura de dados eacute essencial para assegurar a sua preservaccedilatildeo e possiacutevel reutilizaccedilatildeo em benefiacutecio da sociedade

Existem vaacuterias definiccedilotildees de Dados Abertos apresentando algumas diferenccedilas entre elas embora focando o mesmo objetivo Algumas das definiccedilotildees satildeo emitidas no acircmbito da abertura de dados puacuteblicos outras da abertura de dados de investigaccedilatildeo O portal de dados dos EUA define Open Data como os conjuntos de dados de alto valor criados pelo governo federal que possam ser processados por maacutequina e que natildeo sejam privados ou restritos por razotildees de seguranccedila (United States General Services Administration) A Royal Society (2012) entende por Open Data os dados que devem ser acessiacuteveis utilizaacuteveis avaliados ou certificados e inteligiacuteveis A Open Definition sintetiza que os Dados Abertos devem poder ser ldquofreely used modified and shared by anyone for any purposerdquo (Open Knowledge International [a]) Segundo a Open Knowledge International (OKI) (2012b) ldquoOpen Data are the building blocks of open knowledgerdquo O termo Open Data pode ainda referir-se a outros tipos de dados natildeo puacuteblicos que sejam acessiacuteveis de forma livre como os dados dos meacutedia sociais (European Data Portal 2016a)

ldquoOpenness is not however enough Data must be intelligently openrdquo (Science International 20154) O primeiro passo na abertura inteligente dos dados eacute segundo a Royal Society (20127) ldquodata that underpin a journal article should be made concurrently available in a accessible databaserdquo O mundo acadeacutemico tem vindo a ser moldado para apoiar a abertura agrave medida que os benefiacutecios se tornam mais tangiacuteveis e

31

a pressatildeo de retorno de investimento exercida sobre as entidades financiadoras aumenta embora nem todas as aacutereas evoluam com a mesma rapidez (Hahnel amp Hook 2016) A Royal Society (2012) sublinha a necessidade das instituiccedilotildees ligadas agrave investigaccedilatildeo cientiacutefica gerirem os seus dados de modo proficiente para obterem os benefiacutecios proporcionados pela abertura de dados e entenderem a enorme mudanccedila cultural necessaacuteria para atingir este objetivo

A Denton Declaration foi publicada em 2012 com o intuito de promover boas praacuteticas de gestatildeo de dados de investigaccedilatildeo promover a colaboraccedilatildeo transparecircncia e prestaccedilatildeo de contas ao longo das fronteiras organizacionais e disciplinares Esta declaraccedilatildeo estabeleceu treze princiacutepios para promover a cultura de abertura na investigaccedilatildeo estabelecer um padratildeo para arquivo de dados de modo a facilitar a sua pesquisa e acesso desenvolver um regime de financiamento para a construccedilatildeo da infraestrutura necessaacuteria para a gestatildeo de dados adotar padrotildees de metadados preservar a longo prazo os dados subjacentes agraves publicaccedilotildees apoiar os investigadores nas negociaccedilotildees para a abertura dos dados com as editoras e o reconhecer da propriedade intelectual dos investigadores nos dados e em outros produtos de investigaccedilatildeo (Denton Declaration An Open Data Manifesto 2012 traduccedilatildeo livre)

A gestatildeo de informaccedilatildeo e do conhecimento deve ser incluiacuteda nas estrateacutegias organizacionais das instituiccedilotildees (Royal Society 2012) Quando os dados satildeo bem organizados documentados preservados e partilhados tornam-se preciosos no avanccedilo cientiacutefico e no aumento de oportunidades de aprendizagem e inovaccedilatildeo (UK Data Archive 2017) O ciclo de vida dos dados contempla seis fases de gestatildeo incluiacutedas num processo contiacutenuo a cada reutilizaccedilatildeo geram-se novos dados conforme demonstrado na figura seguinte

Fig 8 Ciclo de vida dos dados de investigaccedilatildeo Fonte traduzido de UK Data Archive (2017) Disponiacutevel na WWW httpwwwdata-archiveacukcreate-managelife-cycle

As seis fases do ciclo de vida dos dados comportam diversas accedilotildees necessaacuterias agrave plena execuccedilatildeo de cada ciclo

Criaccedilatildeo

Processa mento

Anaacutelise

Preservaccedilatildeo

Fornecer acesso

Reutilizaccedilatildeo

32

Criaccedilatildeo desenho da investigaccedilatildeo criaccedilatildeo do plano de gestatildeo de dados planear a partilha localizar dados existente coletar dados capturar eou criar metadados

Processamento entrada de dados transcriccedilatildeo traduccedilatildeo validaccedilatildeo limpeza anonimizaccedilatildeo descriccedilatildeo gestatildeo e armazenamento de dados

Anaacutelise interpretaccedilatildeo e derivaccedilatildeo de dados produccedilatildeo de resultados de investigaccedilatildeo publicaccedilatildeo e preparaccedilatildeo dos dados para preservaccedilatildeo

Preservaccedilatildeo migraccedilatildeo de dados para o melhor formato criaccedilatildeo de coacutepia de seguranccedila e armazenamento criaccedilatildeo de metadados e arquivo

Fornecer acesso distribuir e partilhar dados controlar o acesso estabelecer a propriedade intelectual promover os dados

Reutilizaccedilatildeo acompanhamento da investigaccedilatildeo assumir a revisatildeo da investigaccedilatildeo escrutinar os resultados e aprender e ensinar (UK Data Archive 2017)

Com o objetivo de contribuir para a adoccedilatildeo de padrotildees e poliacuteticas de Dados Abertos de investigaccedilatildeo algumas organizaccedilotildees lanccedilaram iniciativas e princiacutepios de Open Data destinadas agrave recomendaccedilatildeo de boas praticas na publicaccedilatildeo de dados de investigaccedilatildeo obtidos atraveacutes de financiamento puacuteblico Apoacutes o lanccedilamento de uma declaraccedilatildeo em 2004 a OECD publicou em 2007 um conjunto de 13 princiacutepios para abertura de dados de investigaccedilatildeo provenientes de financiamento puacuteblico Em 2010 foram lanccedilados os Panton Principles um conjunto de quatro princiacutepios delimitadores da abertura de dados na ciecircncia cujo foco centrou-se no licenciamento de conteuacutedos para garantir uma clara partilha distribuiccedilatildeo e reutilizaccedilatildeo de informaccedilatildeo pelos investigadores (Panton Principles 2010 traduccedilatildeo livre) A Royal Society afirma em 2012 que os dados abertos devem ser acessiacuteveis inteligiacuteveis avaliaacuteveis e reutilizaacuteveis Em 2014 foram publicados os Nairobi Data Sharing Principles um conjunto de dez recomendaccedilotildees destinadas a apoiar a abertura de dados puacuteblicos e de investigaccedilatildeo nos paiacuteses em vias de desenvolvimento por forma a gerar valor econoacutemico social educacional e potenciar a investigaccedilatildeo cientiacutefica (International Workshop on Open Data for Science and Sustainability in Developing Countries 2014)

A Open Definition um projeto da responsabilidade da OKI fixou os princiacutepios que definem a abertura de dados e conteuacutedos assegurando a qualidade e encorajando a compatibilidade de diferentes tipos de conteuacutedos atraveacutes da utilizaccedilatildeo precisa do termo aberto (Open Knowledge International [a] traduccedilatildeo livre) Assim o termo Dados Abertos engloba dois tipos diferentes de abertura

Abertura Teacutecnica os conteuacutedos devem ser publicados sob uma licenccedila aberta ao custo de produccedilatildeo num formato aberto e que possa ser processado por maacutequina

Abertura Legal a licenccedila aberta deve permitir o uso redistribuiccedilatildeo modificaccedilatildeo separaccedilatildeo compilaccedilatildeo propagaccedilatildeo aplicaccedilatildeo para qualquer fim ou propoacutesito sem custos e sem discriminaccedilatildeo contra pessoas ou grupos A mesma licenccedila pode requerer condiccedilotildees de uso como a atribuiccedilatildeo de creacutedito de autoria manutenccedilatildeo

33

da integridade do trabalho original redistribuiccedilatildeo sob a mesma licenccedila do original retenccedilatildeo de notificaccedilotildees de copyright acesso agrave fonte original proibiccedilatildeo de implementaccedilatildeo de restriccedilotildees teacutecnicas e implementaccedilatildeo de regras de natildeo-agressatildeo com a licenccedila original (Open Knowledge International [a]) traduccedilatildeo livre)

A Science International (2016) eacute o conjunto das 4 entidades mais representativas a niacutevel da ciecircncia internacional (International Council for Science ndash ICSU the InterAcademy Partnership ndash IAP The World Academy of Sciences ndash TWAS and the International Social Science Council ndash ISSC) que tecircm por missatildeo representar a comunidade cientiacutefica global na definiccedilatildeo de poliacuteticas cientiacuteficas internacionais Esta organizaccedilatildeo lanccedilou 12 princiacutepios para os Dados Abertos criados com base em outros relatoacuterios da autoria quer dos proacuteprios parceiros da Science International quer de instituiccedilotildees governamentais ou acadeacutemicas Estes princiacutepios assentam em trecircs pilares base as responsabilidades de cada interveniente os limites da abertura e as praacuteticas adequadas (Science International 2015 traduccedilatildeo livre)

Todos estes princiacutepios de abertura de dados de investigaccedilatildeo foram sintetizados no Quadro 1 apresentando-se apenas os princiacutepios mencionados em pelo menos duas recomendaccedilotildees de Open Data

Quadro 1 Princiacutepios de abertura de dados de investigaccedilatildeo mais recomendados

Princiacutepios e recomendaccedilotildees

OECD Princ (2007)

Panton Princ (2010)

Royal Soc

(2012)

Nairobi Princ (2014)

Science Int

(2015)

Open Defini tion

Abertura Acesso Reutilizaccedilatildeo

Citaccedilatildeo de dados Interoperabilidade Sem discriminaccedilatildeo Licenccedilas Abertas Formato Aberto

Processaacuteveis p maacutequina Modificaccedilatildeo

Publicaccedilatildeo imediata Qualidade

Acesso Gratuito Disponibilidade

Sustentabilidade Qualidade

Integridade

Fonte Elaboraccedilatildeo proacutepria

Analisando em detalhe os princiacutepios de abertura dos dados de investigaccedilatildeo eacute possiacutevel retirar algumas ilaccedilotildees sobre quais as recomendaccedilotildees consideradas mais importantes Verifica-se uma grande variedade de princiacutepios propostos sendo que

34

apenas 16 num total de 33 se repetem em 2 ou mais recomendaccedilotildees A abertura legal e teacutecnica dos dados soacute eacute acautelada por metade dos princiacutepios Os princiacutepios considerados mais importantes satildeo o AA aos dados seguido da reutilizaccedilatildeo de dados A citaccedilatildeo de dados interoperabilidade acesso sem discriminaccedilatildeo licenccedilas e formatos abertos a modificaccedilatildeo e o fato de os dados serem processaacuteveis por maacutequina satildeo mencionados apenas em trecircs recomendaccedilotildees tendo a seu favor o fato de terem sido incluiacutedas nas recomendaccedilotildees mais recentes Princiacutepios relevantes como a publicaccedilatildeo imediata a qualidade e a integridade dos dados surgem apenas duas vezes listados

Eacute possiacutevel verificar que a OKI (2012b) coloca os dados de investigaccedilatildeo ao mesmo niacutevel de importacircncia que outros tipos de dados com potencial para novos usos e aplicaccedilotildees para benefiacutecio da sociedade como os dados culturais financeiros estatiacutesticos ambientais e ainda sobre o clima e transportes

A OECD (2015a traduccedilatildeo livre) defende haver quatro tipos de dados cientiacuteficos

Fig 9 Tipos de dados cientiacuteficos Fonte traduzido de OECD (2015a)

A explosatildeo de produccedilatildeo de dados que originou o Big Data possui um segundo pilar os Dados Ligados ou Linked Data A combinaccedilatildeo destas duas abordagens tem o potencial para criar uma nova era de entendimento cientiacutefico relativamente aos maiores problemas subjacentes agrave espeacutecie humana (Science International 2015) O termo Linked Data cunhado por Tim Berners-Lee implica que as ldquorelationships among data should be made availablerdquo (World Wide Web Consortium [W3C] 2015) ou seja conjuntos de dados relacionados com um fenoacutemeno em particular e que estatildeo ligados de uma forma loacutegica podem ser conectados semanticamente dando a possibilidade de um computador poder identificar relaccedilotildees mais profundas entre eles (Science International 2015 traduccedilatildeo livre) Reitano (2013) sublinha que a informaccedilatildeo extraiacuteda de conjuntos de dados conectados eacute a que tem mais impacto na investigaccedilatildeo inovaccedilatildeo e crescimento econoacutemico Berners-Lee (2010) propocircs um esquema de 5 estrelas para classificar as melhores praacuteticas de publicaccedilatildeo de dados na web que permitam a ligaccedilatildeo entre diferentes datasets com cinco niacuteveis de abertura tecnoloacutegica

bullprovenientes de instrumentos como telescoacutepios sateacutelites sensores inqueacuteritos e outras ferramentas que registem informaccedilatildeo sobre fenoacutemenos uacutenicos

Dados de observaccedilatildeo

bullobtidos atraveacutes de maacutequinas de alto rendimento ensaios cliacutenicos ou outras experiecircncias controladas Dados experimentais

bullgerados a partir de simulaccedilotildees computacionais Dados computacionais

bullSatildeo conjunto de dados agrupados de alto niacutevel de uso pela comunidade cientiacutefica recebendo para isso um alto niacutevel de curaccedilatildeo

Coleccedilotildees de dados de referecircncia

35

Fig 10 Esquema de classificaccedilatildeo das 5 estrelas para Dados Abertos Ligados Fonte traduzido de Berners-Lee (2010) Disponiacutevel na WWW httpswwww3orgDesignIssuesLinkedDatahtml

O Linked Data usa teacutecnicas e conceitos da World Wide Web para identificar factos conceitos pessoas lugares fenoacutemenos ou documentos que contenham atributos em comum (Science International 2015 traduccedilatildeo livre) A Royal Society (201234) afirma que o aparecimento de ldquosiloed sections of the web linked datardquo deve-se ao uso de vocabulaacuterios heterogeacuteneos na descriccedilatildeo semacircntica dos dados Neste sentido a OKI desenvolveu um cataacutelogo de vocabulaacuterios de Linked Data onde constam um total de 593 distribuiacutedos por vaacuterios temas sendo os mais populares meacutetodos metadados e cataacutelogos Existem 11 vocabulaacuterios em portuguecircs embora nenhum seja exclusivo sendo mesmo a liacutengua com maior nuacutemero de vocabulaacuterios a par com o inglecircs (OKI [a])

Existem algumas razotildees para limitar a abertura da ciecircncia especialmente em redor de dados que vatildeo aleacutem de questotildees teacutecnicas envolvendo a comunidade de investigadores e a sociedade em geral Embora seja mandatado pelas poliacuteticas de Dados Abertos que todos os dados de investigaccedilatildeo obtidos atraveacutes de financiamento puacuteblico devam ser disponibilizados abertamente o fato eacute que existem exceccedilotildees legiacutetimas como questotildees de privacidade seguranccedila ou questotildees eacuteticas que impedem a total abertura de dados (Concordat on Open Research Data 2016)

Os desafios tecnoloacutegicos natildeo implicam as mesmas preocupaccedilotildees na implementaccedilatildeo do AA a dados de investigaccedilatildeo que geram os desafios financeiros culturais e legais Eacute necessaacuterio ldquoadopt technical and infrastructural solutions that holistically address the above issuesrdquo A atenccedilatildeo eacute dada a padrotildees abertos e interoperaacuteveis pesquisa harmonizada e serviccedilos identificadores permanentes promoccedilatildeo da cultura de gestatildeo de dados reutilizaccedilatildeo de dados de investigaccedilatildeo soluccedilotildees teacutecnicas para a seguranccedila e questotildees legais sobre dados de investigaccedilatildeo abertos (RECODE 20146)

Embora se registe progresso a publicaccedilatildeo de Dados Abertos continua a ser um desafio dado que a distribuiccedilatildeo aberta de dados de investigaccedilatildeo natildeo eacute um comportamento comum sendo necessaacuterio uma mudanccedila cultural (Royal Society 2012 Pontika et al 2015 Science International 2015) A avaliaccedilatildeo e revisatildeo por pares dos dados natildeo tecircm a mesma qualidade quando comparada com as publicaccedilotildees

Colocar os conteuacutedos disponiacuteveis na web (sob uma licenccedila aberta)

Tornar os dados estruturados (Excel em vez de uma imagem)

Usar formatos abertos (CSV em vez de Excel)

Usar URIrsquos para identificar os recursos (para serem indicados)

Ligar os dados a outros dados (para fornecer contexto)

36

tradicionais dado a publicaccedilatildeo de dados natildeo ser ainda uma praacutetica comum (European Research Area and Innovation Committee [ERAC] 2016) Hahnel e Hook (2016) apontam a falha na atribuiccedilatildeo de incentivos e recompensas tangiacuteveis aos investigadores pelas suas contribuiccedilotildees A publicaccedilatildeo de dados de forma aberta envolve tarefas que consomem muito tempo aos investigadores como a mudanccedila do formato dos dados manter a informaccedilatildeo atualizada alinhar os dados com as licenccedilas existentes e com os criteacuterios de publicaccedilatildeo de informaccedilatildeo sensiacutevel (Reitano 2013) A Royal Society (2012) sublinha que uma boa parte dos dados torna-se independente das publicaccedilotildees separando assim a ideia da evidecircncia

Para Hahnel e Hook (2016) a abertura de dados cientiacuteficos natildeo pode ser separada das mudanccedilas no desenvolvimento da investigaccedilatildeo e dos receios dos investigadores Estes receios manifestam-se a dois niacuteveis estrutural (questotildees de permissotildees qualidade licenciamento) e cultural (receio de natildeo ser reconhecido ou ser ultrapassado na investigaccedilatildeo)

A Science International (20156) sublinha que os custos da adaptaccedilatildeo ao ldquodata challengerdquo podem causar problemas aos paiacuteses menos desenvolvidos impedindo-os de participar na ldquoglobal research enterpriserdquo A mesma organizaccedilatildeo aponta falhas na replicabilidade de resultados cientiacuteficos atraveacutes da citaccedilatildeo de trecircs estudos nas aacutereas de oncologia preacute-cliacutenica psicologia social e economia que obtiveram meacutedias de sucesso bem inferiores a 50 Satildeo apontadas falhas como a falsificaccedilatildeo de dados raciociacutenios estatiacutesticos invaacutelidos e ausecircncia total ou parcial de dados ou metadados Eacute tambeacutem sublinhado que a falta de um padratildeo de abertura que permita testar a replicabilidade dos resultados cientiacuteficos pode torna-se uma barreira intransponiacutevel no avanccedilo da ciecircncia (Science International 2015)

O acesso aos dados de investigaccedilatildeo possuiu diversas vantagens como o fomento da inovaccedilatildeo em termos de educaccedilatildeo sauacutede estaacute na base da criaccedilatildeo de novos negoacutecios e progresso cientiacutefico (SPARC World Wide Web Foundation 2016) permite a melhoria da qualidade dos resultados de investigaccedilatildeo evita a duplicaccedilatildeo de trabalho acelera a inovaccedilatildeo aumenta a transparecircncia do progresso cientiacutefico (OECD 2007 Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016b ERAC 2016) A abertura de dados facilita a exploraccedilatildeo de novos toacutepicos natildeo estudados inicialmente reforccedila a diversidade de anaacutelise e opiniatildeo (OECD 2007) potencia o crescimento econoacutemico e a seguranccedila dos resultados da investigaccedilatildeo financiada (OECD 2007 SPARC Concordat on Open Research Data 2016 ERAC 2016) A Royal Society (2012) sublinha que a publicaccedilatildeo de dados experimentais e observacionais permite o escrutiacutenio a replicaccedilatildeo de experiecircncia e a reutilizaccedilatildeo de dados para obtenccedilatildeo de inferecircncias adicionais A mesma instituiccedilatildeo assevera que a abertura de dados permite a identificaccedilatildeo de erros a refinaccedilatildeo ou rejeiccedilatildeo de teorias realccedilando que a anaacutelise rigorosa de dados e teoria eacute o processo mais rigoroso de revisatildeo da qualidade O

37

estudo efetuado por Beagrie e Houghton (2014) a trecircs centros de dados do Reino Unido denota um acreacutescimo significativo ao niacutevel da eficiecircncia da investigaccedilatildeo nos utilizadores que usaram os centros de dados e o valor que os utilizadores retiraram dos dados excede o investimento feito na partilha e curaccedilatildeo de dados tendo os centros de dados aumentado exponencialmente o retorno do investimento feito na criaccedilatildeo e coleta de dados

Para Reitano (2013) o processo de abertura de dados pode fomentar a implementaccedilatildeo de novos padrotildees e tecnologias nas organizaccedilotildees e a mudanccedila de comportamentos culturais O mesmo autor refere que o fenoacutemeno dos Dados Abertos pode dar iniacutecio ao processo de validaccedilatildeo da qualidade dos dados A Science International (2015) sublinha o investimento nas infraestruturas fiacutesicas e tecnoloacutegicas natildeo deve ser muito elevado dado que este natildeo difere muito do exigido para uma base nacional de Ciecircncia Aberta O desenvolvimento desta e-infraestrutura pode trazer benefiacutecios a vaacuterios dos intervenientes da abertura de dados (Comissatildeo Europeia Grupo de Peritos em Dados Cientiacuteficos 2010)

Cidadatildeos beneficiam com os resultados da investigaccedilatildeo e encontram as proacuteprias respostas para questotildees importantes baseadas em provas reais

Financiadores e decisores poliacuteticos tomam decisotildees mais informadas e tecircm mais retorno no seu investimento

Investigadores obteacutem dados e ferramentas com mais facilidade aumentando assim a sua produtividade a investigaccedilatildeo extrapola a sua aacuterea de conhecimento gerando novas inferecircncias e produzindo novas soluccedilotildees

Empresas e induacutestria proporcionam uma base industrial e econoacutemica para a prosperidade usam a melhor informaccedilatildeo disponiacutevel para a sua investigaccedilatildeo e desenvolvimento criam novo conhecimento mercados oportunidades e aumentam as oportunidades de troca de conhecimento

Segundo Borgman (201515) o fluxo de informaccedilatildeo depende cada vez mais de infraestruturas tecnoloacutegicas sendo que ldquosubstantial investments in infrastructure are necessary to acquire sustain and exploit research data today tomorrow and beyondrdquo As bases de dados cientiacuteficas tecircm-se tornado importantes na infraestrutura cientiacutefica global sendo indispensaacuteveis no progresso da ciecircncia De acordo com e-IRG (2016) existem trecircs formas de desenvolver uma infraestrutura de dados de investigaccedilatildeo pelo setor industrial pelo setor puacuteblico ou por comunidades especializadas que recebam financiamento para a construccedilatildeo da sua proacutepria infraestrutura Para melhorar o acesso e uso de datasets a e-IRG recomenda

Impor as mesmas tecnologias e padrotildees a todas a disciplinas Atribuir identificadores persistentes para dados instituiccedilotildees e pessoas

38

Aumentar a pesquisabilidade e descoberta de dados nos repositoacuterios atraveacutes da criaccedilatildeo de registos de datasets e repositoacuterios conectar as publicaccedilotildees aos dados subjacentes e criar uma paacutegina de descritiva do dataset

O Open Access Directory (2016) lista 113 repositoacuterios de dados de investigaccedilatildeo referentes a 15 aacutereas do conhecimento O Registry of Research Data Repositories (re3data) eacute um serviccedilo que regista repositoacuterios de dados de investigaccedilatildeo a niacutevel mundial fornecendo acesso a 1821 repositoacuterios divididos por quatro grandes aacutereas cientiacuteficas Este serviccedilo eacute disponibilizado pelo DataCite (2017a) para fornecer acesso e armazenamento permanente de dados aos investigadores entidades financiadoras editores e instituiccedilotildees acadeacutemicas Portugal conta atualmente com dois repositoacuterios indexados o KiMoSys e o INTEGRALL ambos com ligaccedilatildeo ao ramo da biologia

O Projeto do Genoma Humano19 envolveu uma investigaccedilatildeo intensiva agrave escala global sendo um exemplo de sucesso da disponibilidade de dados abertos na inovaccedilatildeo cientiacutefica Com o intuito de facilitar a pesquisa e reutilizaccedilatildeo de dados o W3C (2014) desenvolveu um vocabulaacuterio especiacutefico para dados o Data Catalog Vocabulary (DCAT) que atraveacutes da tecnologia RDF20 facilita a interoperabilidade entre diferentes cataacutelogos de dados na web Utilizar o DCAT para descrever conjunto de dados em cataacutelogos permite aumentar a pesquisabilidade e a extraccedilatildeo de metadados a partir de outros cataacutelogos Salienta-se tambeacutem a existecircncia do schemaorg uma comunidade colaborativa com a missatildeo de criar manter e promover esquemas para dados estruturados na Internet

A Data Documentation Initiative (DDI) eacute um padratildeo internacional para descrever dados criados por meacutetodos observacionais provenientes das ciecircncias sociais econoacutemicas e da sauacutede O DDI eacute um padratildeo que pode ser utilizado para documentar as diferentes fases do ciclo de vida dos dados de investigaccedilatildeo Descrever dados utilizando o padratildeo DDI facilita a compreensatildeo interpretaccedilatildeo e uso por pessoas software e redes de computadores (Data Documentation Initiative [DDI] 2016)

Ainda em formato beta a OKI oferece um serviccedilo o is it open data21 que permite aos utilizadores inquirirem as entidades detentores de dados sobre a abertura dos seus dados focando-se essencialmente em dados de investigaccedilatildeo

19 Este projeto teve como base os Bermuda Principles que asseguraram que todos dados sobre a sequenciaccedilatildeo geneacutetica gerados por centros financiados para esse fim deveriam estar no domiacutenio puacuteblico com livre acesso Disponiacutevel na WWW httpwebornlgovscitechresourcesHuman_Genomeresearchbermudashtml 20 O Resource Description Framework (RDF) eacute um modelo padratildeo desenvolvido pela W3C que permite que dados estruturados e semiestruturados possam ser misturados expostos e partilhados atraveacutes de diferentes aplicaccedilotildees O RDF facilita a uniatildeo de datasets mesmo que usem estes esquemas diferentes Disponiacutevel na WWW httpswwww3orgRDF 21 Disponiacutevel na WWW httpwwwisitopendataorgabout

39

Verifica-se tambeacutem o lanccedilamento de revistas cientiacuteficas especiacuteficas para a ciecircncia orientada a dados como o Data Science Journal22 Scientific Data23 ou o Geoscience Data Journal possibilitando a publicaccedilatildeo de dados e dos artigos cientiacuteficos que os utilizam apoacutes o serviccedilo de revisatildeo por pares A F1000 Research24 utiliza o conceito de revisatildeo apoacutes a publicaccedilatildeo

Os Dados Abertos tecircm estado em foco quando se debate a resoluccedilatildeo de problemas humanitaacuterios A agenda 2030 definida pelas Naccedilotildees Unidas (2015) visa a erradicaccedilatildeo da pobreza e o desenvolvimento econoacutemico humanitaacuterio e social agrave escala global Os 17 objetivos de desenvolvimento sustentaacutevel contam com a preciosa ajuda da abertura de dados para a monotorizaccedilatildeo e tomada de decisatildeo Em 2016 a abertura de dados em casos de emergecircncias puacuteblicas foi alvo de forte debate com a propagaccedilatildeo de viacuterus como Zica e o Eacutebola na agenda O debate culminou na Statement on Data Sharing in Public Health Emergencies (2016) um compromisso assinado por 33 organizaccedilotildees a niacutevel global com vista agrave partilha de dados de investigaccedilatildeo e ao fomento do financiamento nestas aacutereas sensiacuteveis

Conforme indicado nos princiacutepios de Open Data da Science International (2015) existem diversos intervenientes no processo de abertura de dados sendo que cada um destes intervenientes tem responsabilidades proacuteprias Como intervenientes diretos satildeo apontados os investigadores que recebem financiamentos puacuteblicos as universidades e institutos de investigaccedilatildeo as bibliotecas institucionais agecircncias de financiamento e instituiccedilotildees de investigaccedilatildeo governos e sociedade acadeacutemicas Existem outras iniciativasorganizaccedilotildees envolvidas na promoccedilatildeo da abertura de dados como a EU Naccedilotildees Unidas OECD W3C OKI SPARC Royal Society CODATA Digital Curation Center (DCC) Research Data Aliance (RDA) ou o ICSU que procuram promover o desenvolvimento de sistemas e procedimentos a niacutevel internacional que assegurem o acesso sustentabilidade e interoperabilidade Muitas destas organizaccedilotildees jaacute desenvolveram princiacutepios de abertura e protocolos de dados proacuteprios como eacute o exemplo da EU OECD e da OKI ou formaram grupos de trabalho para a definiccedilatildeo de padrotildees de gestatildeo publicaccedilatildeo citaccedilatildeo interoperabilidade e partilha de dados como a RDA Outras como a Universidade de Edimburgo25 criaram cursos de treino em gestatildeo de dados de investigaccedilatildeo para oferecer aos seus investigadores esse conhecimento

Outras atividades e eventos relacionados com a abertura e gestatildeo de dados vatildeo ocorrendo a niacutevel global como eacute o caso do Love Your Data26 um evento internacional que teve a sua quinta ediccedilatildeo em 2017 com vista a fornecerem conhecimento e ferramentas aos investigadores para que estes possam gerir melhor os seus dados

22 Disponiacutevel na WWW httpdatasciencecodataorg 23 Disponiacutevel na WWW httpwwwnaturecomsdata 24 Disponiacutevel na WWW httpsf1000researchcomabout 25 Disponiacutevel na WWW httpdatalibedinaacukmantra 26 Disponiacutevel na WWW httpsloveyourdatawordpresscomlydw-2017

40

15 Dados Abertos Governamentais

A abertura dos dados governamentais teve a sua origem em leis de Freedom of Information (FOI) Segundo Ubaldi (2013) muitos paiacuteses da OECD adotaram este tipo de leis para assegurar o direito do acesso puacuteblico agrave informaccedilatildeo atraveacutes da publicaccedilatildeo de datasets que possam ser usados e reutilizados Os DGA ou no seu termo mais usual Open Government data (OGD) ldquois a philosophy- and increasingly a set of policies - that promotes transparency accountability and value creation by making government data available to allrdquo (OECD 2016a) Esta filosofia assenta numa nova relaccedilatildeo entre cidadatildeos e Governos atraveacutes da abertura dos dados governamentais onde todas as partes interessadas trabalham em cooperaccedilatildeo na procura de novas respostas para os problemas da sociedade num ldquolearning process of changing the culture of public sector administrationrdquo (Dietrich Cherkasov Susar 201311) Os Governos e as sociedades tecircm vindo de forma crescente a apreciar a importacircncia do acesso agrave informaccedilatildeo do setor puacuteblico para sustentar a boa gestatildeo e estimular o crescimento econoacutemico alavancado no conhecimento Esta situaccedilatildeo mudou a forma como os governos valorizaram gerem usam e partilham informaccedilatildeo sendo apoiada pela atualizaccedilatildeo das poliacuteticas estruturas e praacuteticas para produzir e usar a informaccedilatildeo puacuteblica (Ubaldi 2013 traduccedilatildeo livre) A abertura de dados permite inferir duas questotildees importantes quanto ao governo Aleacutem de assumir a preparaccedilatildeo das entidades puacuteblicas para o processo de abertura tambeacutem assume que o governo estaacute disposto a efetuar mudanccedilas consideraacuteveis no setor puacuteblico devendo atuar como um sistema aberto que interage com o seu ambiente (Jansen Charalabidis amp Zuiderwijk 2012) O objetivo eacute segundo Dietrich (20136) passar do ldquoe-gov to we-govrdquo

Os DGA estatildeo segmentados em duas partes os dados abertos e os dados governamentais ou informaccedilatildeo do setor puacuteblico (Ubaldi 2013 Dietrich Cherkasov e Susar 2013) estando os DGA na interseccedilatildeo entre estes dois tipos de dados

Fig 11 Pilares dos Dados Governamentais Abertos Fonte Dietrich (2013) Disponiacutevel na WWW httpworkspaceunpanorgsitesInternetDocumentsUNPAN95209pdf

Governo Aberto

Dados Governament

Dados Abertos

DGA

41

Os DGA referem-se agrave informaccedilatildeo coletada produzida ou paga pelo setor puacuteblico guardada em formato que possa ser lido por maacutequina e tornada acessiacutevel de forma livre para reutilizaccedilatildeo para qualquer propoacutesito atraveacutes da publicaccedilatildeo sob uma licenccedila aberta que permite a livre reutilizaccedilatildeo dentro do domiacutenio puacuteblico e privado (Koski 2015 Carrara Oudkerk Steenbergen Tinholt 2016) A Informaccedilatildeo do Setor Puacuteblico ou Public Sector Information (PSI) abrange toda a vasta gama de informaccedilatildeo que as entidades puacuteblicas coletam produzem reproduzem e disseminam em vaacuterias aacutereas de atividade no cumprimento das suas tarefas institucionais englobando informaccedilatildeo social econoacutemica geograacutefica meteorologia e informaccedilatildeo de cariz turiacutestico ou empresarial A grande diferenccedila entre os DGA e a PSI eacute que esta uacuteltima refere-se apenas aos dados detidos pelas entidade puacuteblicas podendo a sua reutilizaccedilatildeo ter custos Poreacutem se esta PSI for disponibilizada sob uma licenccedila aberta torna-se entatildeo DGA (Carrara et al 2016a traduccedilatildeo livre)

A reutilizaccedilatildeo e distribuiccedilatildeo de dados devem ser garantidas sob termos que permitam essas atividades (Ubaldi 2013) A abertura dos dados governamentais foi apoiada por vaacuterias iniciativas com o objetivo de estabelecer padrotildees e princiacutepios para a disponibilizaccedilatildeo aberta de dados Em 2007 o Open Government Working Group (OGWG) definiu oito princiacutepios sobre a abertura de Dados Governamentais (Tauberer 2014) Em 2010 foi a vez da Sunlight Foundation publicar 10 princiacutepios para abertura da informaccedilatildeo governamental Em 2012 foram lanccediladas trecircs iniciativas de abertura de dados O Reino Unido lanccedilou o Open Data White Paper que incluiu um conjunto de 14 princiacutepios para a abertura de dados puacuteblicos e assevera que o Reino Unido natildeo pretende implementar legislaccedilatildeo de forma raacutepida mas sim reconhecer e clarificar medidas iniciais que assegurem a partilha de dados (Cabinet Office 2012) O Banco Mundial publicou 13 princiacutepios de abertura de dados integrados no seu Open Government Data Toolkit A OKI (2012a traduccedilatildeo livre) identificou as componentes chave da abertura de dados puacuteblicos

Disponibilidade e acesso ndash os dados devem estar completos e a um preccedilo natildeo superior ao seu custo de reproduccedilatildeo com disponibilidade de acesso pela Internet Devem estar disponiacuteveis de forma conveniente e modificaacutevel

Reutilizaccedilatildeo e redistribuiccedilatildeo ndash os dados devem ser disponibilizadas sob licenccedilas que permitam a reutilizaccedilatildeo redistribuiccedilatildeo e mistura com outros datasets Deve ser assegurado que os dados satildeo passiacuteveis de serem processados por maacutequina

Participaccedilatildeo universal ndash os dados devem ser acessiacuteveis a todos para livre reutilizaccedilatildeo e redistribuiccedilatildeo sem discriminar nenhum campo do conhecimento pessoas ou grupos Natildeo eacute permitido a inclusatildeo de restriccedilotildees adjacentes aos dados

Ubaldi (2013) publicou onze princiacutepios de abertura de dados baseados em dois vetores principais disponibilidade e acessibilidade e a reutilizaccedilatildeo e redistribuiccedilatildeo Nos

42

EUA foram lanccedilados 7 princiacutepios para a abertura de dados atraveacutes do Memorando ldquoOpen Data Policy - Managing Information as an Assetrdquo (Executive Office of the President Office of Management and Budget 2013) O Anti-corruption Working Group do G2027 promoveu em 2014 a abertura de dados como um dos pilares essenciais da transparecircncia do setor puacuteblico estabelecendo seis princiacutepios de abertura de dados para apoiar a luta contra a corrupccedilatildeo (G20rsquos Anti-corruption Working Group 2014)

O G828 iniciou um debate sobre a transparecircncia inovaccedilatildeo e prestaccedilatildeo de contas governamentais culminando na criaccedilatildeo do G8 Open Data Charter (Cabinet Office 2013) ldquowhich outlined a set of five core open data principlesrdquo (International Open Data Charter 2015) ou seja ldquoa summary of visions and principles for creating a transparent Government the opening up of data and its quality and quantityrdquo (Carrara et al 2016a39) O G8 Open Data Charter criou uma lista de 14 categorias de dados a serem publicados de forma aberta empresas e negoacutecios crimes e justiccedila observaccedilatildeo da terra educaccedilatildeo energia e ambiente financcedilas e contratos geoespacial desenvolvimento global sauacutede democracia e contabilidade governativa ciecircncia e investigaccedilatildeo estatiacutesticas mobilidade e bem-estar social e por fim transportes e infraestruturas (Cabinet Office 2013) Poreacutem o sentimento geral era que os princiacutepios deveriam ser redefinidos e melhorados de forma a apoiar a adoccedilatildeo global dos Dados Abertos (International Open Data Charter 2015 traduccedilatildeo livre) Assim em 2015 um grupo de vaacuterios paiacuteses e organizaccedilotildees internacionais desenvolveu a International Open Data Charter uma ldquoGlobal Multi-Stakeholder Action Network with two types of leading members Stewards and Lead Stewardsrdquo tendo como missatildeo fomentar uma maior colaboraccedilatildeo na adoccedilatildeo e implementaccedilatildeo de princiacutepios padrotildees e boas praacuteticas de Dados Abertos em todo o mundo com a adesatildeo de 41 governos (International Open Data Charter 2015) Tim Berners-Lee numa opiniatildeo citada no proacuteprio siacutetio web da International Open Data Charter (2015) vecirc nesta rede o ldquopotential to accelerate progress by placing actionable data in the hands of peoplerdquo Todos os princiacutepios e recomendaccedilotildees de abertura de dados puacuteblicos foram sintetizados apresentando-se no Quadro 2 apenas os princiacutepios mencionados em duas iniciativas de Open Data

27 O G20 eacute um grupo formado pelos 19 paiacuteses mais fortes economicamente mais a Uniatildeo Europeia com o objetivo de obter cooperaccedilatildeo internacional em questotildees financeiras e econoacutemicas Disponiacutevel na WWW httpswwwg20orgWebsG20ENG20FAQsfaq_nodehtml 28 O G8 eacute um grupo constituiacutedo pelas economias mais avanccediladas do mundo que se reuacutenem para debater questotildees econoacutemicas e poliacuteticas a niacutevel global Este grupo eacute formado pelos EUA Itaacutelia Alemanha Reino Unido Franccedila Japatildeo Canadaacute e Ruacutessia embora esta uacuteltima tenha sido expulsa em 2014 apoacutes a anexaccedilatildeo da Crimeia A EU tambeacutem estaacute representada neste grupo embora natildeo seja membro oficial

43

Quadro 2 Princiacutepios de abertura mais recomendados pelas iniciativas de Dados Governamentais Abertos

Princiacutepios e recomendaccedilotildees

OGWG (2007)

Sun Fund (2010)

OKI

(2012)

World Bank

(2012)

White Paper (2012)

Mem EUA

(2013) Ubaldi (2013)

G20

(2014)

IODC

(2015) Abertura Acesso

Publicaccedilatildeo imediata Reutilizaccedilatildeo Completos

Sem discriminaccedilatildeo Processaacuteveis p maacutequina

Licenccedilas Abertas Comparabilidade Formato Aberto Disponibilidade

Abertura p defeito Interoperabilidade

Publicaccedilatildeo de metadados

Gestatildeo poacutes publicaccedilatildeo Custo natildeo superior ao da

produccedilatildeo

Desenvolvimento e inovaccedilatildeo inclusivos

Melhoria governaccedilatildeo e envolvimento cidadatildeos

Linked Data

Modificaccedilatildeo

Fonte Elaboraccedilatildeo proacutepria

Analisando em detalhe os princiacutepios de abertura dos dados puacuteblicos eacute possiacutevel inferir quais as recomendaccedilotildees consideradas mais importantes Tal como nos dados de investigaccedilatildeo verifica-se uma grande variedade de princiacutepios propostos sendo que apenas 19 num total de 36 se repetem em 2 ou mais recomendaccedilotildees Embora se registe uma melhoria significativa na abertura legal e teacutecnica relativamente aos dados de investigaccedilatildeo tambeacutem os princiacutepios propostos para os dados puacuteblicos natildeo abarcam a totalidade desta dupla abertura O acesso a publicaccedilatildeo imediata a reutilizaccedilatildeo e a disponibilizaccedilatildeo de dados de forma completa sem discriminaccedilatildeo e de forma a serem processados por maacutequina satildeo os princiacutepios que reuacutenem mais consenso entre as recomendaccedilotildees analisadas As licenccedilas abertas a comparabilidade de dados os formatos abertos a disponibilidade a abertura por defeito de dados a interoperabilidade publicaccedilatildeo de metadados e a gestatildeo de dados apoacutes a sua publicaccedilatildeo satildeo mencionados em menos de metade das recomendaccedilotildees analisadas apesar de ser indiscutiacutevel a sua importacircncia no processo de abertura de dados

44

Segundo Gonzalez-Zapata e Heeks (2015) podemos sintetizar os DGA em quatro perspetivas sumariadas na figura seguinte

Fig 12 Perspetivas da abertura dos dados governamentais Fonte Gonzalez-Zapata e Heeks (2015)

O movimento dos DGA assenta em dois importantes marcos o lanccedilamento do siacutetio datagov nos EUA em 2009 e do datagovuk no Reino Unido em 2010 tendo-se posteriormente estendido a outros paiacuteses e organizaccedilotildees (Janssen 2012) Neste segmento foi fundada em 2011 a Open Government Partnership (OGP) com o objetivo de ldquoprovide an international platform for domestic reformers committed to making their governments more open accountable and responsive to citizensrdquo (Open Government Partnership [OGP] 2015) Esta organizaccedilatildeo lanccedilou em Setembro de 2011 a Open Government Declaration subscrita por 70 paiacuteses e que assenta em quatro eixos estruturantes Transparecircncia da informaccedilatildeo sobre as atividades governativas apoio agrave participaccedilatildeo ciacutevica implementaccedilatildeo dos mais altos padrotildees da integridade profissional aumento do acesso a novas tecnologias de abertura e da prestaccedilatildeo de contas (OGP 2011) Em Dezembro de 2016 realizou-se a quarta cimeira da OGP culminando com a divulgaccedilatildeo da Paris Declaration for Open Government Partnership que pretende encorajar os Governos e as organizaccedilotildees da sociedade civil a inscreverem-se em accedilotildees coletivas para promover a abertura dos dados governamentais (OGP 2016)

O fenoacutemeno dos Dados Abertos eacute coadjuvado por dois sistemas de avaliaccedilatildeo da abertura dos dados provenientes do setor puacuteblico que auxiliam as entidades puacuteblicas a assumir a abertura e ligaccedilatildeo de dados (Colpaert Sarah Peter Mannens amp Van de Walle 2013) Estes dois sistemas atuam em perspetivas diferentes segundo Colpaert et al (2013) o 5 Stars Linked Open Data de Berners-Lee (2010) fornece uma perspetiva tecnoloacutegica enquanto o 5 Stars Open Data Engagement de Davies (2012) tem um acircmbito social atraveacutes do envolvimento da sociedade O esquema de Davies (2012) eacute um esquema de classificaccedilatildeo por estrelas baseado no esquema criado Tim Berners-Lee para sublinhar os niacuteveis de interaccedilatildeo e colaboraccedilatildeo proporcionados pela publicaccedilatildeo de dados ou seja os ldquokey steps that open data initiatives can take to engage with data usersrdquo

bull Definiccedilatildeo de estrateacutegias regulamentos e processos nas atividades do Governo Burocraacutetica bull Inovaccedilatildeo tecnoloacutegica nos sistemas de dados do

Governo Tecnoloacutegica bull Direito ao livre acesso agrave informaccedilatildeo do setor puacuteblico (dados) Poliacutetica bull Mecanismos para gerar valor econoacutemico atraveacutes do uso de dados Econoacutemica

45

Fig 13 Esquema de classificaccedilatildeo das 5 estrelas para as iniciativas de abertura de dados que envolvem os utilizadores Fonte Davies (2012) Disponiacutevel na WWW httpwwwtimdaviesorguk201201215-stars-of-open-data-engagement

No cumprimento das suas obrigaccedilotildees as entidades governamentais produzem coletam e gerem uma vasta quantidade de dados tendo elevado estes agrave categoria dos bens puacuteblicos mais valiosos Para gerar valor ldquodata must be reusable but more importantly actually used (Open Data for Development [OD4D] 20168) Para a OECD (2015a) permitir o acesso e a reutilizaccedilatildeo dos dados governamentais tem um potencial significativo no aumento da eficiecircncia e transparecircncia do setor puacuteblico suportando atividades de ciecircncia cidadatilde com os dados governamentais aumentando assim o seu valor econoacutemico e social Neste sentido concursos desafios e hackathons29 podem tornar-se uacuteteis se ajudarem a focar os cidadatildeos ldquoon high priority public problemsrdquo (Dawes Vidiasova amp Parkhimovich 201610) Para gerar valor eacute necessaacuterio publicar os dados sendo esta fase precedida uma preparaccedilatildeo teacutecnica de coleta preparaccedilatildeo publicaccedilatildeo e gestatildeo de dados (Carrara et al 2016a)

Criaccedilatildeo de uma infraestrutura de gestatildeo de dados Extraccedilatildeo transformaccedilatildeo (em formato open source e linked data) e publicaccedilatildeo Escolha dos canais de publicaccedilatildeo Implementaccedilatildeo da funccedilatildeo de pesquisa no canal de publicaccedilatildeo Definiccedilatildeo de domiacutenio hospedagem funcionalidades do canal de publicaccedilatildeo

incluindo a gestatildeo desta ferramenta e dos serviccedilos que nela forem incorporados

Segundo Ubaldi (2013 traduccedilatildeo livre) podem ser identificadas quatro grandes fases na cadeia de valor dos Dados Governamentais Abertos

Geraccedilatildeo de dados cobre a criaccedilatildeo de dados puacuteblicos Coleta agregaccedilatildeo e processamento de dados os dados governamentais precisam

de ser agregados ligados e manipulados de forma a adicionar valor para a maior parte dos utilizadores

29 Uma hackathon de dados abertos eacute um evento que reuacutene programadores e outros profissionais do ramo do desenvolvimento de software para reutilizar dados de forma a produzir aplicaccedilotildees de software que sejam a base de produtos e serviccedilos uacuteteis e com valor Servem tambeacutem para promover o trabalho de abertura de dados e os datasets disponiacuteveis (AMA 2016)

Os dados devem ser orientados para a procura

Os dados devem fornecer contexto

Os dados devem gerar conversaccedilatildeo

Publicaccedilatildeo de dados deve gerar envolvimento e ganho de habilidades

Dados como um recurso comum na colaboraccedilatildeo entre investigadores

46

Distribuiccedilatildeo e fornecimento de dados os dados precisam de ser distribuiacutedos aos seus potenciais utilizadores para permitir o acesso e reutilizaccedilatildeo

Uso final de dados os dados governamentais tecircm de ser reutilizados por diferentes pessoas para sustentar a criaccedilatildeo de valor puacuteblico

Perceber os diferentes valores associados aos dados governamentais eacute essencial para identificar que viabilizadores e tipos de dados devem ser tornados prioritaacuterios para atingir o objetivo especiacutefico de criaccedilatildeo de valor (Ubaldi 2013) Podem ser identificados trecircs tipos de valor associados aos DGA (Ubaldi 2013 OECD 2015a)

Valor econoacutemico crescimento e competitividade na economia fomentando a inovaccedilatildeo eficiecircncia e eficaacutecia nos serviccedilos governamentais

Valor Social promove empreendedorismo dos cidadatildeos a participaccedilatildeo social e o envolvimento puacuteblico nas decisotildees poliacuteticas e no fornecimento de serviccedilos

Governanccedila puacuteblica Prestaccedilatildeo de contas transparecircncia responsividade e controlo democraacutetico

A abertura dos dados governamentais eacute um domiacutenio emergente que enfrenta restriccedilotildees de natureza complexa Janssen Charalabidis e Zuiderwijk (2012) sintetizaram as barreiras em seis categorias institucional complexidade da tarefa uso e participaccedilatildeo legislaccedilatildeo qualidade da informaccedilatildeo e questotildees teacutecnicas Reitano (2013) defende que os governos devem modificar as praacuteticas e procedimentos internos de gestatildeo de informaccedilatildeo pois a reutilizaccedilatildeo da informaccedilatildeo estaacute dependente da forma em como ela eacute gerida e publicada O desempenho dos programas de DGA tendem apenas para o registo de dados estatiacutesticos e poucos optam por analisar as aplicaccedilotildees comerciais e os avanccedilos proporcionados pela abertura dos dados governamentais (Dawes Vidiasova amp Parkhimovich 2016) Existem outros pontos sensiacuteveis como o pagamento dos custos da coleta e processamento de dados puacuteblicos quais os incentivos concedidos agraves entidades puacuteblicas para estas manterem e atualizarem os seus dados que conjunto de dados devem ser prioritaacuterios para maximizar a criaccedilatildeo de valor puacuteblico e sobretudo a necessidade de desenvolver uma estrutura de anaacutelise entre custos e benefiacutecios que possa demonstrar as vantagens econoacutemico-sociais dos DGA (Ubaldi 2013 OECD 2013) Contudo segundo a OECD (2015a) para as partes interessadas estes dados continuam muitas vezes inacessiacuteveis quer em termos de acesso quer em termos de custo Isto verifica-se porque os dados enfrentam alguns entraves agrave sua publicaccedilatildeo as organizaccedilotildees e governos natildeo consideram os dados interessantes para reutilizaccedilatildeo ou natildeo conseguem entender os benefiacutecios da abertura pelo receio de terem de responder a um elevado nuacutemero de pedidos de dados ou que os utilizadores retirem conclusotildees superficiais que os dados possam natildeo ter um niacutevel de curaccedilatildeo satisfatoacuterio e que isso manche a reputaccedilatildeo da organizaccedilatildeo e por fim a preocupaccedilatildeo com os custos da conversatildeo de dados para formatos padratildeo (Carrara et al 2016a traduccedilatildeo livre) Existem ainda riscos associados agrave abertura dos dados

47

governamentais como o direito agrave privacidade e ao anonimato que resultam em restriccedilotildees agrave disponibilizaccedilatildeo desta informaccedilatildeo (Koski 2015)

Estabelecer um enquadramento legal eacute essencial para alavancar a abertura dos dados governamentais Dawes Vidiasova e Parkhimovich (2016) defendem que o sucesso dos programas de DGA depende da definiccedilatildeo padrotildees teacutecnicos e de qualidade e de um enquadramento legal que defina responsabilidades e limitaccedilotildees Ainda assim as iniciativas de DGA podem enfrentar problemas com a implementaccedilatildeo desafios teacutecnicos ou atrasos administrativos Restriccedilotildees teacutecnicas e financeiras podem limitar a acessibilidade e reutilizaccedilatildeo dos dados sendo necessaacuterio enfrentar desafios relacionados com poliacuteticas tecnologias financcedilas organizaccedilatildeo e cultura para criar um ecossistema e construir um modelo de negoacutecios sustentaacutevel para as iniciativas de DGA (Ubaldi 2013 traduccedilatildeo livre) Koski (2015) realccedila que uma vez abertos deve haver um esforccedilo para manter a qualidade dos dados e tambeacutem a sua atualizaccedilatildeo Por outro lado sem os conhecimentos e habilidades necessaacuterias para interpretar a vasta gama de conjuntos de dados os cidadatildeos podem natildeo conseguir criar valor a partir desses dados (Janssen 2012 Koski 2015) Segundo Carrara Fischer e Steenbergen (2015) satildeo vaacuterias as capacidades necessaacuterias para lidar com a complexidade dos dados As autoras defendem uma junccedilatildeo entre soft skills e hard skills como a colaboraccedilatildeo comunicaccedilatildeo resoluccedilatildeo de problemas e as competecircncias teacutecnicas estatiacutesticas analiacuteticas e domiacutenio da aacuterea do conhecimento (201512) Satildeo apontados ainda outros desafios como a constante evoluccedilatildeo das poliacuteticas e estrateacutegias de DGA a delegaccedilatildeo da produccedilatildeo e administraccedilatildeo dos dados governamentais a niacutevel regional e a falta de definiccedilotildees comuns agrave escala internacional (OECD 2013)

Dado o contexto de urgecircncia em que muitos dos portais foram criados ldquoas part of a politically driven Open Data Initiative without feasibility studies business case strategy or user researchrdquo os portais enfrentam agora uma seacuterie de desafios e problemas (Sasse et al 20177) Satildeo mencionados problemas como a falta de financiamento falta de qualidade dos dados a falta de apoio poliacutetico na publicaccedilatildeo de dados relevantes e desafios na reutilizaccedilatildeo de dados (Sasse et al 2017)

Um bom entendimento dos benefiacutecios da abertura dos dados governamentais pode acelerar o compromisso com as iniciativas de DGA (Carrara et al 2016a) Os benefiacutecios da abertura de dados podem segundo Janssen Charalabidis e Zuiderwijk (2012) ser contextualizados em trecircs quadrantes poliacutetico e social econoacutemico operacional e teacutecnico A partilha dos dados governamentais com o puacuteblico aumenta a transparecircncia e o reconhecimento puacuteblico das atividades do governo (OECD 2013) dado que os DGA satildeo um recurso estrateacutegico que pode beneficiar vaacuterios intervenientes (OECD 2013 Ubaldi 2013 Dietrich Cherkasov Susar 2013 Koski 2015 Carrara et al 2016a The World Bank 2016)

48

Governo melhora a tomada de decisotildees e a alocaccedilatildeo de recursos de forma a promover a eficiecircncia total das operaccedilotildees do governo e fornecer serviccedilos puacuteblicos mais eficientes efetivos inovadores e personalizados permitindo uma reduccedilatildeo de custos administrativos Aumenta a transparecircncia reforccedilando a prestaccedilatildeo de contas governamentais e a reduccedilatildeo de erros

Cidadatildeos permite participaccedilatildeo puacuteblica e o envolvimento social no desenho de respostas agraves necessidades puacuteblicas e cientiacuteficas (ciecircncia cidadatilde)

Sociedade Civil aumenta a transparecircncia e qualidade dos serviccedilos do Governo Setor Puacuteblico pode estimular um mercado competitivo nos serviccedilos puacuteblicos Setor Privado lanccedilamento de serviccedilos inovadores e com valor acrescentado

O Working Group on Open Government Data da OKI elegeu trecircs vantagens na abertura dos dados governamentais aumento da transparecircncia criaccedilatildeo de valor econoacutemico-social e participaccedilatildeo dos cidadatildeos na governaccedilatildeo Dietrich Cherkasov e Susar (2013) sublinham o papel chave da interoperabilidade na obtenccedilatildeo dos benefiacutecios da abertura na medida em que uma definiccedilatildeo comum de abertura iraacute assegurar a capacidade dos sistemas e organizaccedilotildees cooperarem

O impacto da abertura dos dados governamentais pode ser medido em trecircs dimensotildees econoacutemica poliacutetica e social (Granicas 2013 Koski 2015)

Econoacutemica aumento de receitas provenientes de taxas reduccedilatildeo dos custos de transaccedilatildeo de dados criaccedilatildeo de bens e serviccedilos (Granickas 2013) aumento da eficiecircncia e eficaacutecia do serviccedilo puacuteblico criaccedilatildeo de novas empresas (Granickas 2013 Koski 2015)

Poliacutetica aumento da transparecircncia poliacutetica e da prestaccedilatildeo de contas (Granickas 2013 Koski 2015)

Social aumento da proteccedilatildeo ao direito agrave informaccedilatildeo (Granickas 2013) aumento da inclusatildeo social e da capacitaccedilatildeo de grupos eou indiviacuteduos aumento dos niacuteveis de envolvimento e participaccedilatildeo ciacutevica (Granickas 2013 Koski 2015) e melhorias ao niacutevel educaccedilatildeo sauacutede ambiente ou desenvolvimento sustentaacutevel (Koski 2015)

Koski (20153) defende ser necessaacuterio desenvolver um modelo de avaliaccedilatildeo e monotorizaccedilatildeo seguido da coleta sistemaacutetica de dados para se poder medir com exatidatildeo o impacto dos Dados Abertos A autora sublinha a necessidade de explorar o conhecimento sobre o impacto da abertura de dados bem como os meacutetodos de investigaccedilatildeo e indicadores que podem ser usados para estudar os ldquosocio-economics impacts of open data which types of usable data are already being collected and what are the addionational data needsrdquo

Para Janssen (2012) o movimento dos DGA promoveu uma maior disponibilidade de informaccedilatildeo puacuteblica embora natildeo tenha necessariamente melhorado o acesso agrave informaccedilatildeo De acordo com a mesma autora os DAG estatildeo em voga com os

49

programadores e hackers a desenvolverem aplicaccedilotildees atraveacutes dos dados detidos pelo setor puacuteblico e os ativistas a descobrir o valor dos dados governamentais na defesa das suas causas Se as cidades utilizarem os dados que produzem em proveito proacuteprio publicando-os nos seus portais com as licenccedilas adequadas de reutilizaccedilatildeo podem estimular a criaccedilatildeo de novos serviccedilos e transformar-se em smart cities (Garcia 2015) reduzindo custos e consumo de recursos e melhorando o contacto entre cidadatildeos e governo (Carrara Engbers Nieuwenhuis amp Steenbergen 2016)

No acircmbito da digital transformation ocorrida nas uacuteltimas deacutecadas diversas alteraccedilotildees ocorreram na forma comas organizaccedilotildees produzem vendem e disponibilizam os seus produtos e tambeacutem na forma em como os funcionaacuterios trabalham e comunicam Segundo Carrara Fisher Oudkerk Steenbegen e Tinholt (2015) os Dados Abertos podem ser reutilizados por organizaccedilotildees de diferentes setores da induacutestria cultura e turismo educaccedilatildeo e investigaccedilatildeo energia e utilidades financcedilas e seguros sauacutede fabrico de produtos comunicaccedilatildeo e entretenimento puacuteblico imobiliaacuterio retalho telecomunicaccedilotildees transportes e tecnologias de informaccedilatildeo Davies (2014) afirma que no caso dos EUA e do Reino Unido a enfacircse do discurso puacuteblico passou da melhoria da transparecircncia governativa para o discurso das vantagens econoacutemicas dos Dados Abertos como consequecircncia da crise econoacutemica e da maior maturaccedilatildeo das poliacuteticas de abertura de dados Na EU a linha de pensamento tem evoluiacutedo no mesmo sentido com o estudo econoacutemico feito pelo European Data Portal a indiciar um impacto econoacutemico direto da abertura de dados em 2016 de 553 biliotildees de euros e em 2020 de 757 biliotildees de euros com uma projeccedilatildeo de perto de 100 mil postos de trabalho envolvidos O mesmo estudo indica que o mercado total da abertura de dados contabilizando os impactos diretos e indiretos subiraacute dos 193-209 biliotildees de euros em 2016 para os 265-286 biliotildees de euros em 2020 (Carrara Chan Fischer amp Steenbergen 2015)

Os portais de Dados Abertos satildeo uma parte essencial da infraestrutura ao permitirem o acesso e reutilizaccedilatildeo de dados oferecendo um ponto de acesso uacutenico aos utilizadores aos dados governamentais como os cataacutelogos e portais de dados centralizados Veja-se por exemplo os 304 portais incluiacutedos no cataacutelogo do portal de dados governamentais dos EUA o datagov que aleacutem dos portais de dados de cidades e estados norte-americanos (88) engloba ainda 52 paiacuteses e 164 regiotildees internacionais (United States General Services Administration) O Open Data Soft (2017) lista jaacute mais de 2600 portais de dados oriundos de 194 paiacuteses indicando apenas 6 portais de Dados Abertos em Portugal

Poreacutem de acordo com Colpaert et al (2013) natildeo existe nenhum guia que determine as funcionalidades e possibilidades dos portais de dados Os autores vecircm assim propor um esquema de classificaccedilatildeo para portais de Dados Abertos com o

50

objetivo de impulsionarem as entidades puacuteblicas a criarem o seu proacuteprio portal de dados ou a criarem novas metas para os jaacute existentes

Fig 14 Esquema de classificaccedilatildeo das 5 estrelas para os portais de dados Fonte Colpaert et al (2013) Disponiacutevel na WWW httppieterpm5stardataportals5starsofopendataportalspdf

O relatoacuterio feito pelo Open Data Institute (ODI) para o European Data Portal defende que os portais de dados devem continuar a responder aos desafios utilizando para isso modelos sustentaacuteveis em quatro aacutereas chave gestatildeo financcedilas arquitetura e operaccedilotildees Devem tambeacutem usar meacutetricas que permitam avaliar e melhorar a qualidade e usabilidade dos dados sendo que a mediccedilatildeo de impacto da reutilizaccedilatildeo de Dados Abertos tambeacutem deve ser alvo de financiamento contiacutenuo (Sasse et al 2017)

A OKI desenvolveu um sistema de gestatildeo de dados suportado por uma plataforma aberta o CKAN oferecendo soluccedilotildees que agilizam a publicaccedilatildeo partilha pesquisa e uso dos dados sendo utilizado por 146 portais de dados a niacutevel mundial (CKAN) Usar esta ferramenta para construir um cataacutelogo permite agraves entidades governos e organizaccedilotildees publicar dados e disponibiliza-los de forma aberta facilitando a pesquisa e a visualizaccedilatildeo da informaccedilatildeo A plataforma DataHub oferece acesso a muitos dos serviccedilos do CKAN permitindo o upload pesquisa registo de datasets publicados criaccedilatildeo e gestatildeo de grupos de datasets e receber atualizaccedilotildees de conjuntos de dados em que haja interesse O DataHub aloja 35 datasets relacionados com a palavra-chave ldquoPortugalrdquo sendo 18 desses conjuntos de dados diretamente coletados e disponibilizados por entidades portuguesas Os restantes 17 datasets estatildeo englobados em publicaccedilotildees que abrangem vaacuterios paiacuteses (Open Knowledge International [d]) As entidades puacuteblicas tambeacutem podem desenvolver portais de dados contratando para isso serviccedilos de plataformas como o Socrata30 OpenDataSoft31 ou o DataMarket32 que facilitam a publicaccedilatildeo a partilha e a reutilizaccedilatildeo de dados puacuteblicos

30 Disponiacutevel na WWW httpssocratacom 31 Disponiacutevel na WWW httpswwwopendatasoftptsolucao-de-dados-abertos 32 Disponiacutevel na WWW httpwwwqlikcomusproductsqlik-data-market

Registo de conjuntos de dados (ligaccedilatildeo ao dataset)

Fornecimento de metadados (licenccedila contexto atualizaccedilotildees etc)

Plataforma de cocriaccedilatildeo (interaccedilatildeo desenvolvimento aplicaccedilotildees)

Plataforma de publicaccedilatildeo de dados e metadados em formatos comuns

Central de dados comum (agregaccedilatildeo informaccedilatildeo interna e externa)

51

Em termos de licenciamento de dados embora as licenccedilas Creative Commons possam ser aplicadas aos dados foram criadas licenccedilas abertas especiacuteficas para dados sob a tutela da OKI as Open Data Commons (ODC)

ODC Attribution License (ODC-By) Compatiacutevel com a licenccedila CC BY permite a coacutepia distribuiccedilatildeo modificaccedilatildeo de dados ou bases de dados com a devida menccedilatildeo de atribuiccedilatildeo de autoria devendo ser mantida para trabalhos derivados

ODC Open Database License (ODC-ODbL) Segue os mesmo princiacutepios da licenccedila CC BY-SA aplicando-se no entanto apenas a dados Permite a coacutepia distribuiccedilatildeo modificaccedilatildeo de dados ou bases de dados com a devida menccedilatildeo de atribuiccedilatildeo de autoria devendo os trabalhos derivados aplicar a mesma licenccedila e serem redistribuiacutedos sem restriccedilotildees

Public Domain Dedication and License (PDDL) permite a coacutepia distribuiccedilatildeo modificaccedilatildeo de dados ou bases de dados sem qualquer tipo de restriccedilotildees ou atribuiccedilatildeo de creacutedito uma vez que os dados passam para o domiacutenio puacuteblico Eacute compatiacutevel com a licenccedila CC0 (Open Knowledge International [d] traduccedilatildeo livre)

Existem ainda 2 paiacuteses que definiram a sua proacutepria lincenccedila aberta de forma a garantir a abertura da PSI O Reino Unido desenvolveu a Open Government Licence (OGL) que sendo compativel com as licenccedilas CC e ODC autoriza o uso distribuiccedilatildeo publicaccedilatildeo adaptaccedilatildeo e exploraccedilatildeo comercial e natildeo comercial sob o requerimento de menccedilatildeo da fonte e da proviecircncia da informaccedilatildeo (The National Archives) Tambeacutem a Franccedila desenvolveu a sua Licence Ouverte que avaliza a reproduccedilatildeo uso distribuiccedilatildeo publicaccedilatildeo adaptaccedilatildeo e exploraccedilatildeo comercial requerendo apenas o reconhecimento da fonte e da proviecircncia da informaccedilatildeo Tal como a licenccedila britacircnica a Licence Ouverte eacute compatiacutevel com as licenccedilas CC e ODC e ainda com a proacutepria OGL (Etalab 2011)

A publicaccedilatildeo dos DGA envolve quatro intervenientes diferentes (Carrara et al 2016a traduccedilatildeo livre)

Decisores poliacuteticos normalmente os responsaacuteveis pela validaccedilatildeo de estrateacutegias e iniciativas de Open Data

Gestores de Dados satildeo por norma os responsaacuteveis pela coleta partilha de dados design e implementaccedilatildeo da estrateacutegia de Open Data na qualidade de especialistas

Programadores responsaacuteveis pela implementaccedilatildeo dos requisitos teacutecnicos das estrateacutegias de Dados Abertos

Contribuidores tecircm um papel ativo na coleta preparaccedilatildeo publicaccedilatildeo e manutenccedilatildeo dos dados

Gonzalez-Zapata e Heeks (2015) acrescentam outros intervenientes como os ativistas da sociedade civil as organizaccedilotildees internacionais os fornecedores de tecnologias de informaccedilatildeo e comunicaccedilatildeo e os acadeacutemicos As entidades e organizaccedilotildees internacionais envolvidas no esforccedilo de abertura dos dados

52

governamentais tecircm desenvolvido esforccedilos para promover a abertura de dados governamentais O Open Data Institute (2012) foi criado com o objetivo de ajudar instituiccedilotildees puacuteblicas organizaccedilotildees comerciais e natildeo comerciais a ldquoidentify and address how the web of data will impact their businesses and their sectorsrdquo Neste sentido a ODI tem promovido algumas iniciativas como o Open Data Certificate33 que atraveacutes de um sistema de questionaacuterios consegue demonstrar se os dados foram publicados de forma sustentaacutevel e reutilizaacutevel certificando assim a qualidade e a confianccedila nos mesmos A ODI desenvolveu tambeacutem o Open Data Maturity Model para avaliar o quanto as organizaccedilotildees publicam e consomem Dados Abertos identificando os pontos de melhoria O modelo baseia-se numa escala de cinco temas processos de gestatildeo de dados conhecimento e habilidades envolvimento e apoio ao cliente investimento e performance financeira e por fim visatildeo estrateacutegica Estes cinco temas tecircm cinco niacuteveis de progressatildeo possuindo uma aplicaccedilatildeo34 em linha que facilita a avaliaccedilatildeo (Dodds amp Newman 2015) A ODI dedica-se ainda agrave elaboraccedilatildeo de estudos de caso envolvendo iniciativas de Open Data aleacutem de possuir guias de orientaccedilatildeo para a abertura de dados e cursos de aprendizagem com o mesmo objetivo

O Banco Mundial lanccedilou o Open Government Data Toolkit com o objetivo de ajudar governos bancaacuterios e utilizadores a entender os conceitos baacutesicos da abertura de dados e a planear e implementar um programa de abertura dos dados governamentais Falamos de ferramentas de orientaccedilatildeo para a implementaccedilatildeo de poliacuteticas de dados abertos desde a definiccedilatildeo de Open Data e exemplos do seu uso passando pelo licenciamento e qualidade dos dados e finalizando com assistecircncia teacutecnica e apoio na procura de financiamento Uma das ferramentas disponibilizadas eacute o Open Data Readiness Assessment (ODRA) que pode ser usada para conduzir accedilotildees de anaacutelise da preparaccedilatildeo de um governo ou instituiccedilatildeo para avaliar desenhar e implementar uma iniciativa de Dados Abertos (The World Bank 2016)

Outra iniciativa esta com a chancela da Open Data for Development Network (OD4D[a]) ldquoa global network of leaders in the Open Data community working together to develop open data solutions around the worldrdquo desenvolveu uma base de dados puacuteblica de organizaccedilotildees que usam DGA ao niacutevel global O Open Data Impact Map permite aos governos organizaccedilotildees internacionais e investigadores ter a perceccedilatildeo da procura existente de Dados Abertos O mapa inclui organizaccedilotildees que usam DGA para advogar algo para desenvolver produtos e serviccedilos aprimorar operaccedilotildees prestar informaccedilotildees sobre estrateacutegias ou efetuar investigaccedilatildeo (Open Data for Development Network (OD4D[b] traduccedilatildeo livre) Em fevereiro de 2017 encontram-se listadas 1765 organizaccedilotildees oriundas de 96 paiacuteses concentrados sobretudo na Ameacuterica do Norte Europa e Aacutesia Central sendo que a maioria das entidades estaacute relacionada com o setor das tecnologias de informaccedilatildeo geoespacial negoacutecios 33 Disponiacutevel na WWW httpscertificatestheodiorgen 34 Disponiacutevel na WWW httppathwaytheodiorg

53

consultadoria investigaccedilatildeo e com governabilidade Portugal conta com 4 organizaccedilotildees listadas Fundaccedilatildeo Francisco Manuel dos Santos35 Transparecircncia Hackday36 e Open Knowledge Portugal no setor da governabilidade e a Manufactura Independente37 no setor dos meacutedia e comunicaccedilotildees

A OKI estaacute ativamente envolvida em diversos projetos que visam criar condiccedilotildees e potenciar a abertura de dados Aleacutem da mencionada Open Definition a OKI posiciona-se como coordenadora de outros projetos semelhantes um siacutetio web sobre Dados Governamentais Abertos um guia com enfoque nos aspetos teacutecnicos legais e sociais dos Dados Abertos um cataacutelogo de portais de Dados Abertos a niacutevel global um iacutendice que mede a abertura das poliacuteticas de Open Data e ainda introduziu censos sobre a abertura de dados A OKI oferece ainda um portal sobre dados financeiros38 um portal de e-learning sobre literacia de dados39 um portal sobre gastos puacuteblicos40 uma base de dados de ensaios cliacutenicos41 e o Frictionless Data42 que disponibiliza um Data Package Standard para facilitar o agrupamento e descriccedilatildeo de dados

A EU tem assumido uma dupla funccedilatildeo na abertura dos dados puacuteblicos verificando-se a sua intervenccedilatildeo na elaboraccedilatildeo de leis de apoio aos DGA e na promoccedilatildeo da criaccedilatildeo de infraestruturas de suporte A OECD desenvolveu um Observatoacuterio da PSI que coleta e analisa exemplos e partilha experiecircncias de inovaccedilatildeo do setor puacuteblico com o intuito de fornecer conselhos praacuteticos aos paiacuteses na criaccedilatildeo de inovaccedilatildeo O Observatoacuterio permite a partilha discussatildeo e cooperaccedilatildeo na criaccedilatildeo de soluccedilotildees (OECD 2016b traduccedilatildeo livre)

A disponibilidade e acessibilidade de dados eacute um dos pilares da plena afirmaccedilatildeo da Ciecircncia Aberta e neste acircmbito devem ser definidas poliacuteticas de Dados Abertos que mandatem o livre acesso a este tipo de informaccedilatildeo cientiacutefica e administrativa

2 As poliacuteticas de Dados Abertos

O processo de desenvolvimento de poliacuteticas envolve tradicionalmente a investigaccedilatildeo anaacutelise consulta e siacutentese de informaccedilatildeo para produzir recomendaccedilotildees A abertura de dados sem restriccedilotildees de acesso deve ser garantida por uma poliacutetica de Dados Abertos pois ldquoOpen Data is politicalrdquo (World Wide Web Foundation 201638) ldquoInstitutionalizing open data within larger sectoral initiatives requires ample political

35 Disponiacutevel na WWW httpwwwpordatapt 36 Disponiacutevel na WWW httpwwwtransparenciahackdayorg 37 Disponiacutevel na WWW httpmanufacturaindependenteorg 38 Disponiacutevel na WWW httpnextopenspendingorg 39 Disponiacutevel na WWW httpschoolofdataorg 40 Disponiacutevel na WWW httpopenbudgetseu 41 Disponiacutevel na WWW httpopentrialsnet 42 Disponiacutevel na WWW httpfrictionlessdataio

54

willrdquo (OD4D 2016) O fenoacutemeno dos Dados Abertos eacute tambeacutem teacutecnico e social dada a interaccedilatildeo entre o meio local politico social legal e teacutecnico e as tecnologias que produzem resultados (Davies 2014 Pasqueto Sands amp Borgman 2015)

Da revisatildeo da literatura destaca-se a existecircncia de poliacuteticas diferenciadas para a abertura de dados governamentais e para a abertura de dados cientiacuteficos A maior parte das poliacuteticas e estrateacutegias governamentais concentram-se na abertura dos dados governamentais em detrimentos dos dados de investigaccedilatildeo (RECODE 2014) A expressatildeo ldquoPoliacutetica de Dados Abertosrdquo surge frequentemente associada a termos como estrateacutegias programas ou iniciativas de abertura de dados e ainda a poliacuteticas de gestatildeo de dados A contextualizaccedilatildeo das poliacuteticas natildeo eacute clara referindo-se apenas a Dados Abertos mas focando-se preferencialmente apenas nos dados provenientes do setor puacuteblico Em termos de dados de investigaccedilatildeo eacute possiacutevel encontrar poliacuteticas de quatro intervenientes diferentes Governo entidade financiadora que pode ser ou natildeo governamental instituiccedilotildees de investigaccedilatildeo e ainda as editoras de data journals Em termos de dados puacuteblicos satildeo associadas poliacuteticas governamentais e institucionais As poliacuteticas de dados abertos devem ainda incluir uma poliacutetica de gestatildeo de dados independentemente do seu cariz de investigaccedilatildeo ou puacuteblico

Nos uacuteltimos anos questotildees sobre a gestatildeo preservaccedilatildeo e partilha de dados cientiacuteficos tecircm sido alvo de debate puacuteblico O aumento da criaccedilatildeo de datasets vastos e complexos em todo o processo cientiacutefico estaacute a criar profundos desafios para o armazenamento acesso e interpretaccedilatildeo de dados (EAGDA 2014) As recentes poliacuteticas de Open Data pretendem disponibilizar em livre acesso os datasets da mesma forma que qualquer outra publicaccedilatildeo acadeacutemica sendo para isso necessaacuterio garantir uma infraestrutura de armazenamento acesso pesquisa e a reutilizaccedilatildeo dessa informaccedilatildeo (Rans Day Duke amp Ball 2013) As poliacuteticas satildeo essenciais para o estabelecimento de compromissos comuns (Erway et al 2016) Segundo a Science International (20156) ldquoeffective open data in a data-intensive age can only be realised if there is systemic action at disciplinary national and international levelsrdquo De acordo com Tananbaum num estudo preparado em nome da SPARC ldquoopen data policies promote the accessibility and reuse of the raw data generated during the scientific discovery phaserdquo Estas poliacuteticas abrangem uma gama variada de material natildeo-textual como datasets estatiacutesticas resultados de inqueacuterito e os metadados associados a estes objetos devendo permitir que estes sejam sujeitos a processamento por maacutequina e anaacutelise (Tananbaum) Existem alguns desafios teacutecnicos legais e eacuteticos na criaccedilatildeo de uma poliacutetica de abertura de dados como assegurar a heterogeneidade e interoperabilidade dos dados a acessibilidade e pesquisabilidade a preservaccedilatildeo e curaccedilatildeo a qualidade e avaliaccedilatildeo e tambeacutem a seguranccedila dos dados (RECODE 2014)

A abertura de dados de investigaccedilatildeo em todas as aacutereas cientiacuteficas natildeo pode ter uma abordagem one size fits all pois estas produzem diferentes tipos de dados e tecircm

55

procedimentos de anaacutelise publicaccedilatildeo e arquivo diferenciados (Royal Society 2012 RECODE 2014 ERAC 2016 Laumlmmerhirt 2016) A heterogeneidade verificada entre as poliacuteticas de dados de investigaccedilatildeo ao niacutevel da aplicaccedilatildeo normativa e da gestatildeo de dados implica de acordo com Laumlmmerhirt que o cumprimento das medidas impostas pelas poliacuteticas seja irregular O autor defende que as poliacuteticas de dados abertos devem considerar as praacuteticas normas infraestruturas dentro de cada disciplina cientiacutefica e tambeacutem estabelecer incentivos para a publicaccedilatildeo de dados

A Comissatildeo Europeia aborda a necessidade de desenvolver princiacutepios teacutecnicos legais eacuteticos e semacircnticos de interoperabilidade de assegurar a verificaccedilatildeo e a confianccedila nos dados a niacutevel local regional e nacional de implementar novos incentivos para a partilha e proteccedilatildeo de diferentes tipos de dados e por fim uma estrutura que possa avaliar estes princiacutepios (Comissatildeo Europeia Grupo de peritos de alto niacutevel em dados de investigaccedilatildeo 2010) Shadbolt (2016) ressalva que a aposta deve ser feita em poliacuteticas consistentes que determinem a forma de abertura de dados produzidos sob financiamento puacuteblico sendo essencial sublinhar os seus benefiacutecios e partilhar as melhores praacuteticas Para gerar praacuteticas e uma cultura de abertura ldquowe need incentives as well as mandatesrdquo (Shadbolt 20162) A visatildeo subjacente a este movimento de abertura de dados cientiacuteficos eacute que os dados arriscam-se a ficar sem sentido se forem impedidos de ganhar valor cientiacutefico econoacutemico social ou poliacutetico (Leonelli 2016)

Os governos devem desenvolver poliacuteticas de abertura dos dados cientiacuteficos que complementem as poliacuteticas de abertura dos dados puacuteblicos bem como apoiar a criaccedilatildeo de software e recursos humanos habilitados que satildeo criacuteticos no sucesso de ambas as poliacuteticas (Royal Society 2012) As poliacuteticas de Dados Abertos devem ter um caraacuteter diferenciado das poliacuteticas de AA devido a questotildees como a confidencialidade e seguranccedila Nesse sentido o desenvolvimento de poliacuteticas de Dados Abertos eacute uma tarefa mais complexa devendo por isso ser incorporada como uma extensatildeo das poliacuteticas de AA (Swan 2012) A loacutegica para a definiccedilatildeo de poliacuteticas nacionais de Open Data encontra-se em assegurar o rigor da ciecircncia nacional baseado na acessibilidade e reprodutibilidade dos seus resultados em capturar o valor da abertura de dados para benefiacutecio proacuteprio e como base da colaboraccedilatildeo eficiente na ciecircncia internacional (Science International 2015 traduccedilatildeo livre) Embora a ciecircncia seja um elemento central Pasqueto Sands e Borgman (2015) sublinham que esta loacutegica se centra maioritariamente no domiacutenio econoacutemico

Segundo a SPARC as entidades financiadoras de investigaccedilatildeo devem implementar poliacuteticas de Dados Abertos como forma de aumentar a disponibilidade e reutilizaccedilatildeo de dados enquanto reduzem a duplicaccedilatildeo de investigaccedilatildeo maacute-interpretaccedilatildeo fraude e manipulaccedilatildeo de dados As poliacuteticas devem abranger todos os dados e metadados necessaacuterios agrave verificaccedilatildeo dos resultados de investigaccedilatildeo devendo a sua publicaccedilatildeo ocorrer o mais rapidamente possiacutevel (Tananbaum) O tempo passado entre a criaccedilatildeo e

56

a publicaccedilatildeo de dados eacute uma questatildeo importante na cultura do Open Data Poreacutem a Royal Society (2012) sugere que os investigadores deveriam ter exclusividade do uso dos dados por um curto periacuteodo de tempo de maneira a poderem analisa-los e publicar os seus resultados

A RECODE (2014) sublinha que os dados devem ser depositados num repositoacuterio que garanta a reutilizaccedilatildeo seguranccedila estabilidade estrutura de custos relevacircncia temaacutetica metadados diversos formatos de ficheiros processamento por maacutequina e curadoria de dados As poliacuteticas mais significativas das entidades financiadoras definem o AA a dados com obrigatoacuterio para a investigaccedilatildeo financiada com as exceccedilotildees possiacuteveis por razotildees eacuteticas e legais Requem o depoacutesito de dados que suportam as publicaccedilotildees e outros dados importantes em repositoacuterios certificados Requerem que os investigadores descrevam os dados nos Data Management Plan (DMP) que satildeo submetidos com as propostas de financiamento para serem avaliados Para assegurar a reutilizaccedilatildeo dos dados e a habilidade de identificar e medir o cumprimento das poliacuteticas os financiadores de investigaccedilatildeo introduziram especificaccedilotildees teacutecnicas nas suas poliacuteticas (DOIrsquos padrotildees de metadados especiacuteficos) bem como provisotildees para o licenciamento apropriado Mais importante as poliacuteticas eficientes incluem descriccedilotildees claras das responsabilidades e expectativas para os intervenientes envolvidos (financiadores investigadores centros de dados repositoacuterios e instituiccedilotildees de investigaccedilatildeo) (RECODE 2014)

O sucesso das poliacuteticas dos financiadores depende da criaccedilatildeo de um ambiente com incentivos apropriados que assegurem que os investigadores que gerem datasets de qualidade e os disponibilizem publicamente recebam o devido reconhecimento e recompensa bem como o financiamento adequado para os repositoacuterios e a monitorizaccedilatildeo dos planos de gestatildeo de dados (Expert Advisory Group on Data Access [EAGDA] 2014) Segundo a RECODE (2014) as poliacuteticas das entidades financiadoras devem estabelecer o AA a dados de investigaccedilatildeo por defeito devem definir responsabilidades conteuacutedos alvo os planos de gestatildeo de dados tempo e local de depoacutesito as especificaccedilotildees teacutecnicas para permitir a reutilizaccedilatildeo o licenciamento de dados medidas para garantir o acesso a longo termo e garantir a conformidade com a poliacutetica As instituiccedilotildees de investigaccedilatildeo devem desenvolver poliacuteticas para a partilha de dados e preservaccedilatildeo fornecer treino e apoio aos investigadores para gerirem os seus dados de forma efetiva criar carreiras para os gestores de dados e reconhecer os data outputs nos processos de avaliaccedilatildeo (EAGDA 2014) No Reino Unido um grupo de entidades interessadas na abertura de dados assinou em Julho de 2016 a ldquoConcordat on Open Research Datardquo com o intuito de assegurar que os dados de investigaccedilatildeo gerados e coletados por membros da comunidade de investigaccedilatildeo britacircnica sejam disponibilizados de forma aberta para reutilizaccedilatildeo por outros devendo esta abertura ocorrer de maneira consistente ldquowith relevant legal ethical disciplinary and

57

regulatory frameworks and norms and with due regard to the costs involvedrdquo (Concordat on Open Research Data 20161)

O desenvolvimento de poliacuteticas de abertura de dados permite que as instituiccedilotildees43 salvaguardem o seu investimento intelectual financeiro humano e material e respondam agrave crescente pressatildeo dos financiadores que requerem que os dados produzidos sob financiamento sejam geridos de forma apropriada e com AA (RECODE 2014) As poliacuteticas de abertura de dados das instituiccedilotildees de investigaccedilatildeo devem identificar as funccedilotildees e responsabilidades de cada interveniente tendo ainda um papel importante no desenvolvimento de data science skills sendo a sua funccedilatildeo preparar os investigadores para explorarem dados de forma efetiva oferecer serviccedilos de administraccedilatildeo de dados e tambeacutem a infraestrutura de computaccedilatildeo e armazenamento necessaacuteria (RECODE 2014 Whyte amp Donnally 20166) Rouder (2015) defende que as instituiccedilotildees devem utilizar sistemas automatizados que permitem que os dados sejam criados jaacute abertos eliminando erros na gestatildeo de dados fornecendo coacutepias de seguranccedila automaacuteticas simplificaccedilatildeo da partilha aumento da disponibilidade dos dados a longo termo e proporcionando um local de partilha e armazenamento

Segundo o RECODE (2014) os editores estatildeo interessados na abertura de dados de investigaccedilatildeo porque esta abertura agrega valor aos seus produtos principais (publicaccedilotildees tradicionais) ao melhorar a confianccedila da investigaccedilatildeo publicada atraveacutes da habilidade de a verificar Os editores cientiacuteficos devem estabelecer poliacuteticas para a partilha de dados e processos que permitam a contribuiccedilatildeo de autores individuais nas publicaccedilotildees sejam avaliadas e que requeiram a citaccedilatildeo44 e o reconhecimento dos datasets usados no curso da publicaccedilatildeo (EAGDA 2014 ICSU 2014) Os editores devem ainda requerer que se possa aceder avaliar usar e rastrear os dados subjacentes aos artigos a partir dos mesmos como condiccedilatildeo para a publicaccedilatildeo (Royal Society 2012 EAGDA 2014 ICSU 2014) A emergecircncia de data journals45 deve ser ligada ao esforccedilo de publicar dados de forma separada o que permite que partes essenciais do registo cientiacutefico possam ser disponibilizadas de forma inteligiacutevel para a comunidade cientiacutefica (RECODE 2014) Segundo o estudo de Sturges et al (20152445) ldquoa large percentage of journals have no data sharing policy and that there are inconsistencies between those that are traceablerdquo significando que os investigadores natildeo sabem se devem 43 Um bom exemplo encontra-se no siacutetio do Centro Europeu de Investigaccedilatildeo nuclear que apresenta trecircs grupos de dados produzidos que podem ser reutilizados tendo ainda definido poliacuteticas de acesso externo aos dados reutilizaccedilatildeo e preservaccedilatildeo para os dados provenientes de quatro experiecircncias a decorrer com o Large Hadron Collider (Grande Colisor de Haacutedrons) Disponiacutevel na WWW httpopendatacernchabout 44 De forma a potenciar o creacutedito do autor e a citaccedilatildeo de dados a Royal Society (2012) Altman amp Crosas (2013) Carpenter (2014) Ball amp Duke (2015) aconselham a criaccedilatildeo perfis de autor como o ORCID ou o ISNI permitindo desta forma que os investigadores possam associar todos os seus trabalhos cientiacuteficos num ponto uacutenico 45 Os data journals satildeo plataformas de publicaccedilatildeo de dados em AA com revisatildeo por pares para a publicaccedilatildeo partilha e disseminaccedilatildeo de dados que cobrem uma grande variedade de disciplinas (RECODE 2014)

58

partilhar os dados subjacentes aos seus artigos e tambeacutem natildeo sabem como e onde depositar os dados Contudo o cenaacuterio parece estar a mudar com o grupo editorial Nature Springer46 a anunciar em dezembro de 2016 o compromisso de mais de 600 journals com as novas poliacuteticas de partilha de dados definidas pelo grupo encorajando ou mandatando a partilha arquivo citaccedilatildeo de dados e revisatildeo por pares (Nature Springer 2016)

O Open Science Monitor avalia o impacto da abertura dos dados de investigaccedilatildeo atraveacutes trecircs indicadores nuacutemero de repositoacuterios de Dados Abertos poliacuteticas das agecircncias de financiamento relativas agrave partilha de dados e tambeacutem o comportamento dos investigadores em termos de partilha de dados O modelo de avaliaccedilatildeo usa ferramentas como o r3data e o SHERPAJuliet para determinar o nuacutemero de repositoacuterios e de poliacuteticas de abertura de dados recorrendo ainda a estudos de caso para determinar o comportamento dos investigadores na partilha de dados Foram listadas 105 poliacuteticas de financiadores na EU sendo que 76 das instituiccedilotildees natildeo possuem qualquer poliacutetica de Dados Abertos 10 encoraram o arquivo e 19 entidades financiadores requerem o arquivo de dados Os resultados satildeo altamente influenciados pelo enorme nuacutemero de instituiccedilotildees de financiamento de investigaccedilatildeo que pertencem ao Reino Unido sendo que das 69 instituiccedilotildees listadas 53 natildeo implementaram nenhuma poliacutetica de Dados Abertos Ressalve-se tambeacutem que das 19 poliacuteticas que requerem o arquivo de dados 13 pertencem ao Reino Unido (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2017)

O biosharingorg (2017) elaborou uma lista com as poliacuteticas de abertura de dados de investigaccedilatildeo a niacutevel mundial contando com 96 referecircncias em maio de 2017 As poliacuteticas de Dados Abertos distribuem-se por revista cientiacutefica (68) entidade financiadora (22) projetos (4) e sociedade (2) Ciecircncias da Vida e Ciecircncias Biomeacutedicas satildeo os domiacutenios com mais poliacuteticas Natildeo se encontra nenhuma poliacutetica cientiacutefica portuguesa listada

O RECODE (2014) estabeleceu dez recomendaccedilotildees para a abertura de dados cientiacuteficos

Desenvolver poliacuteticas compreensivas de AA aos dados de investigaccedilatildeo e consistentes com as prioridades nacionais e alinhadas com os requisitos europeus

Assegurar o financiamento apropriado para o AA aos dados de investigaccedilatildeo ao niacutevel do financiamento do desenvolvimento e sustentabilidade a longo prazo das

46 A Scientific Data uma das revistas de AA para descriccedilatildeo de datasets cientiacuteficos da divisatildeo editorial Nature Research englobadas no grupo Nature Springer fornece aos investigadores uma lista de repositoacuterios recomendados para o depoacutesito de dados consoante a sua aacuterea temaacutetica Disponiacutevel na WWW httpswwwnaturecomsdatapoliciesrepositoriessocial

59

infraestruturas de investigaccedilatildeo treino de investigadores bibliotecaacuterios e outros profissionais

Desenvolver poliacuteticas e iniciativas que recompensem os investigadores pelo esforccedilo de partilharem dados de alta qualidade

Identificar os intervenientes-chave e as redes de colaboraccedilatildeo para fomentar o trabalho colaborativo para um ecossistema sustentaacutevel de AA aos dados

Planear a sustentabilidade da curadoria e a preservaccedilatildeo dos dados a longo termo Desenvolver soluccedilotildees teacutecnicas e infraestruturais que possam arcar com a

preservaccedilatildeo de dados de alta qualidade a longo prazo harmonizaccedilatildeo de dados descoberta e acesso preservaccedilatildeo obsolescecircncia tecnoloacutegica documentaccedilatildeo e metadados indicadores de qualidade e relevacircncia e questotildees de seguranccedila

Desenvolver padrotildees teacutecnicos e cientiacuteficos de qualidade para os dados Requerer o uso de estruturas harmonizadas abertas e licenciadas Lidar com os sistemaacuteticos desafios legais e eacuteticos decorrentes do AA a dados Apoiar a transiccedilatildeo para os Dados Abertos atraveacutes do treino e desenvolvimento de

curriacuteculo

A ERAC (2016) desenvolveu um conjunto de recomendaccedilotildees para apoiar o desenvolvimento de poliacuteticas nacionais de abertura de dados de investigaccedilatildeo As recomendaccedilotildees satildeo dirigidas aos diversos intervenientes da abertura de dados estando dividas em quatro categorias

Treino dos intervenientes no processo de abertura de dados mudanccedila cultural treino incentivos e sistemas de recompensa e monitorizaccedilatildeo

Gestatildeo e qualidade de dados aspetos teacutecnicos da avaliaccedilatildeo da qualidade de dados identificaccedilatildeo e citaccedilatildeo de dados e gestatildeo de projetos

Sustentabilidade e financiamento abordagem das infraestruturas e financiamento essenciais

Questotildees legais direitos de propriedade intelectual e questotildees de seguranccedila

A mudanccedila cultural exigida para a abertura plena dos dados passa pela necessidade de estabelecer novas formas de reconhecimento e recompensa aos esforccedilos de gestatildeo preservaccedilatildeo e curaccedilatildeo de dados como forma de envolver investigadores e comunidades na abertura de dados (RECODE 2014 International Science 2015) A mudanccedila cultural tem no entanto encontrado alguns reveses pois o caminho para a abertura de dados natildeo eacute percecionado da mesma forma pelos diferentes intervenientes Isto resulta de conflitos entre cadeias de valor processos paralelos e desconectados especialmente entre as praacuteticas de cada disciplina e os requisitos de cada financiadorinstituiccedilatildeo (RECODE 2014) Segundo o inqueacuterito efetuado pelo EAGDA (2014) os planos de gestatildeo de dados natildeo satildeo avaliados adequadamente e existe pouca monitorizaccedilatildeo da implementaccedilatildeo da partilha de dados Os investigadores natildeo se sentem encorajados pelas instituiccedilotildees a partilhar dados e existe necessidade de

60

proporcionar treino aos investigadores A falta de apoio para a partilha de dados eacute sintomaacutetica com a falta de habilidades na gestatildeo de projetos sendo que os investigadores dedicam poucos cuidados agrave preservaccedilatildeo e curaccedilatildeo de dados Estes acontecimentos contribuem para a falta de conhecimento de metadados limitando a utilidade dos datasets Os investigadores sentem tambeacutem que a partilha de dados natildeo tem influecircncia na progressatildeo na carreira (EAGDA 2014)

A OECD (2015a) considera essencial que os investigadores desenvolvam competecircncias sobre dados que lhes permita natildeo soacute partilhar dados limpos e com metadados adequados como tambeacutem entender e reutilizar dados de terceiros A familiaridade com ferramentas e princiacutepios de gestatildeo de dados deve ser segundo a Royal Society (2012) parte integrante do treino dos cientistas As bibliotecas como parte integrante do mundo da investigaccedilatildeo e os bibliotecaacuterios47 como profissionais de informaccedilatildeo multifacetados podem desempenhar um papel ativo no mundo dos Dados Abertos como facilitadores do processo de investigaccedilatildeo (RECODE 2014 Hahnel e Hook 2016 Erway et al 2016 Hernaacutendez-Peacuterez 2016) Para Erway et al (2016) o plano de gestatildeo de dados eacute um ponto base para os bibliotecaacuterios fornecerem serviccedilos de gestatildeo de dados de investigaccedilatildeo As bibliotecas devem fornecer informaccedilatildeo sobre o processo de gestatildeo de dados incluindo planos de gestatildeo de dados e aconselhamento sobre direitos de propriedade intelectual treino serviccedilos de metadados fornecer um cataacutelogo de dados ou um repositoacuterio de dados oferecer serviccedilos de armazenamento pesquisa e acesso permanente para apoiar o ciclo da investigaccedilatildeo (Christensen-Dalsgaard et al 2012 Erway et al 2016 Hernaacutendez-Peacuterez 2016) Christensen-Dalsgaard et al (2012) acrescenta que as bibliotecas devem participar no desenvolvimento da poliacutetica de Dados Abertos da instituiccedilatildeo e estabelecer colaboraccedilotildees com investigadores grupos de investigaccedilatildeo arquivos e centros de dados para fomentar a interoperabilidade da estrutura de acesso pesquisa e partilha de dados Embora muitas das funccedilotildees sejam idecircnticas Hernaacutendez-Peacuterez (2016) faz a distinccedilatildeo entre os papeacuteis das bibliotecas puacuteblicas e das universitaacuterias O autor ressalva que as bibliotecas puacuteblicas devem centrar a atenccedilatildeo nos Dados Abertos que sejam afetos agrave sua comunidade A RDA publicou em 2015 um documento com uma visatildeo geral sobre as praacuteticas recursos online e ferramentas que podem ajudar as bibliotecas a integrar a gestatildeo de dados nas suas rotinas de trabalho As 23 orientaccedilotildees sugeridas dividem-se em recursos de aprendizagem disseminaccedilatildeo de dados planos de gestatildeo de dados literacia de dados metadados citaccedilatildeo de dados licenciamento e privacidades preservaccedilatildeo digital repositoacuterios de dados e comunidade de praacutetica

Na procura de um padratildeo de abertura de dados que permita potenciar a ciecircncia e a investigaccedilatildeo o Data Publishing Group da FORCE11 criou os FAIR principles Estes

47 Veja-se neste ponto os cursos de formaccedilatildeo sobre gestatildeo de dados para bibliotecaacuterios oferecidos pela Universidade de Edimburgo Disponiacutevel na WWW httpdatalibedinaacukmantralibtraininghtml

61

princiacutepios apresentam-se divididos em quatro facetas relacionadas mas tecnicamente independentes (FORCE11 FAIR Data Publishing Group 2014)

Fig 15 Princiacutepios FAIR Data Fonte Adaptado de FORCE11 FAIR Data Publishing Group 2014 Disponiacutevel na WWW httpswwwforce11orggroupfairgroupfairprinciples

A implementaccedilatildeo destes princiacutepios teacutecnicos na abertura de dados poderaacute potenciar tambeacutem a partilha e por consequente a citaccedilatildeo de dados A citaccedilatildeo de dados48 eacute um assunto que tem vindo a ser debatido na comunidade cientiacutefica nos uacuteltimos anos sendo uma aacuterea em que a FORCE11 tambeacutem jaacute definiu princiacutepios49 que comeccedilam a ser adotados pela comunidade cientiacutefica

Relativamente aos dados puacuteblicos ou do setor puacuteblico a comunidade internacional tem vindo a aumentar o seu interesse no uso destes dados embora nem sempre seja claro que a abertura seja uma prioridade na sua agenda poliacutetica (OD4D 2016) ldquoThe 48 Num mundo onde o Fator de Impacto continua a ser a principal medida de avaliaccedilatildeo do trabalho dos cientistas a citaccedilatildeo de dados e as meacutetricas alternativas denominadas de Altimetrias comeccedilam a ganhar algum destaque na literatura cientiacutefica 49 Os Data Citation Principles foram criados pela FORCE11 com o intuito de disponibilizar um padratildeo de citaccedilatildeo de dados cobrindo o propoacutesito funccedilotildees e atributos da citaccedilatildeo O conjunto de oito princiacutepios inclui a importacircncia da citaccedilatildeo de dados a atribuiccedilatildeo de creacutedito prova de evidecircncia identificador uacutenico acesso persistecircncia especificidade e verificabilidade interoperabilidade e flexibilidade Disponiacutevel na WWW httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

bull F1 - Satildeo atribuiacutedos identificadores persistentes e uacutenicos a cada conjunto de (meta)dados

bull F2 - Os dados satildeo descritos atraveacutes do uso de metadados sofisticados

bull F3 - Os (meta)dados devem ser registadosindexados num motor de pesquisa

bull F4 - Os metadados devem especificar o identificador de dados

Faacuteceis de encontrar

bull A1 - Os (meta)dados satildeo pesquisaacuteveis atraveacutes do seu identificador usando um protocolo de comunicaccedilatildeo padratildeo

bull A11 - O protocolo eacute aberto livre e universalmente implementaacutevel

bull A12 O protocolo requer a autenticaccedilatildeo e concessatildeo de autorizaccedilatildeo quando necessaacuterio

bull A2 - Os metadados permanecem acessiacuteveis mesmo quando os dados jaacute natildeo estatildeo disponiacuteveis

Acessiacuteveis

bull I1 - Os (meta)dados usam uma linguagem formal acessiacutevel partilhada e de aplicaccedilatildeo global

bull I2 - Os (meta)dados usam vocabulaacuterios que sigam os princiacutepios FAIR

bull I3 - Os (meta)dados incluem referecircncias qualificadas a outros (meta)dados

Interoperaacuteveis

bull R1 - Os (meta)dados tecircm uma pluralidade de atributos relevantes e precisos

bull R11 - Os (meta)dados satildeo publicados com uma licenccedila clara de acessibilidade e reutilizaccedilatildeo

bull R12 - Os (meta)dados satildeo associados com a sua origem bull R13 - Os (meta)dados cumprem com os padrotildees comunitaacuterios

relevantes de cada domiacutenio

Reutilizaacuteveis

62

culture of open data policies has to change from a culture in which opening of data is standardly considered (Zuiderwijk amp Janssen 201427)

Devem ser consideradas vaacuterias questotildees na elaboraccedilatildeo de uma poliacutetica de Dados Abertos como a definiccedilatildeo da sua aplicaccedilatildeo e os objetivos que dados iratildeo ser publicados quais as condiccedilotildees de publicaccedilatildeo de dados em que siacutetio qual a frequecircncia e qual a razatildeo da publicaccedilatildeo devendo ainda ser calculado o impacto e os benefiacutecios da abertura de dados (Carrara et al 2016a) Os objetivos das poliacuteticas de Dados Abertos podem ser sintetizados em trecircs aacutereas principais fomentar a inovaccedilatildeo social e crescimento econoacutemico melhorar a eficiecircncia dos serviccedilos do setor puacuteblico e fortalecer a democracia e aumentar a transparecircncia (Zuiderwijk Gasco Parycek amp Janssen 2014) Para alcanccedilar este impacto real os governos necessitam de implementar o fenoacutemeno dos Dados Abertos como uma mudanccedila cultural assegurando que recursos humanos e materiais infraestrutura leis e poliacuteticas satildeo eficientes para a implementaccedilatildeo e extraccedilatildeo de resultados a longo prazo (World Wide Web Foundation 2016)

No contexto das poliacuteticas de Dados Abertos a transparecircncia natildeo deve ser vista como um fim mas sim como um meio para atingir outros objetivos como a inovaccedilatildeo no setor puacuteblico permitindo o envolvimento democraacutetico e fornecendo o acesso a informaccedilatildeo ldquoincluding enhancing the findability usability and intelligibility of open data and providing the possibility to trace governmental processes and policy and decision makingrdquo (Zuiderwijk et al 2014) Dados os benefiacutecios desejados as barreiras agrave sua implementaccedilatildeo e os baixos niacuteveis de exploraccedilatildeo de dados os programas de DGA soacute funcionaratildeo bem se forem desenhados mediante a apreciaccedilatildeo da sua complexidade O programa deve natildeo soacute perceber as necessidades e as capacidades dos fornecedores de dados governamentais e privados como tambeacutem as caracteriacutesticas dos dados e a natureza dos recursos da comunidade e dos intervenientes (Dawes Vidiasova amp Parkhimovich 2016) Num estudo comparativo de cinco poliacuteticas nacionais de Dados Abertos Huijboom e van den Broek (2011) concluiacuteram que faltam provas mais evidentes dos benefiacutecios econoacutemicos sociais e democraacuteticos das poliacuteticas de abertura de dados governamentais Os autores sublinham que as barreiras estatildeo dentro das organizaccedilotildees governamentais as motivaccedilotildees estatildeo predominantemente fora desse espectro (Huijboom amp van den Broek 2011)

A investigaccedilatildeo de Dawes Vidiasova amp Parkhimovich (2016) demonstra a existecircncia de vaacuterias abordagens no desenvolvimento de programas de abertura de dados governamentais com diversas consideraccedilotildees sociais e teacutecnicas

Abordagem orientada a dados ou seja focada nas caracteriacutesticas qualidade e disponibilidade de dados abertos

Abordagem orientada ao programa que foca os objetivos e as funcionalidades das estruturas e operaccedilotildees dos programas de DGA

63

Abordagem orientada ao uso e ao utilizador que se centra nos fatores que influenciam o uso de DGA pela comunidade

Abordagem de desempenho e impacto que foca uma vasta gama de consideraccedilotildees que podem influenciar como os programas de DGA funcionam

Abordagem de ecossistemas e redes que indicam os componentes de um programa de DGA e tambeacutem as relaccedilotildees dinacircmicas existentes e como estas influenciam o desempenho do programa

O Secretaacuterio-geral das Naccedilotildees Unidas atraveacutes do seu grupo de aconselhamento independente efetuou recomendaccedilotildees para possibilitar ldquoa data revolution in sustainable developmentrdquo (The UN Secretary Generals Independent Expert Advisory Group on a Data Revolution for Sustainable Development 2014a traduccedilatildeo livre)

Criaccedilatildeo de normas incentivos e regulamentos para encorajar e requerer que os dados sejam tornados publicamente disponiacuteveis e de forma que possam ser uacuteteis a outros utilizadores

Aumentar a literacia de dados para que mais pessoas usem e analisem dados Criar inovaccedilotildees na forma em como quando e que dados satildeo coletados e

partilhados para que estejam sempre atualizados e sejam relevantes para as pessoas e para os poliacuteticos

Para apoiar o desenvolvimento sustentaacutevel e inclusivo a data revolution deve ser guiada pelos seguintes princiacutepios qualidade e integridade de dados desagregaccedilatildeo de dados publicaccedilatildeo de dados de forma raacutepida transparecircncia e abertura de dados curadoria e usabilidade de dados proteccedilatildeo e privacidade gestatildeo e independecircncia recursos e capacidades tecnoloacutegicas (The UN Secretary Generals Independent Expert Advisory Group on a Data Revolution for Sustainable Development 2014b) O repositoacuterio de dados estatiacutesticos das Naccedilotildees Unidas indexa 60 milhotildees de registos de datasets provenientes de 35 bases de dados de 20 temaacuteticas diferenciadas Ao inserir a palavra ldquoPortugalrdquo no campo de pesquisa do repositoacuterio satildeo recuperados 2172 datasets distribuiacutedos por 25 fontes diferenciadas Estes conjuntos de dados distribuem-se por vaacuterias temaacuteticas sendo o setor industrial o maior fornecedor de dados com 612 datasets (United Nations Statistics Division 2017)

Dawes Vidiasova amp Parkhimovich (20162) defendem ldquothe ecosystem metaphorrdquo como uma abordagem heuriacutestica para o desenho efetivo de programas de abertura de dados governamentais sublinhando a sua utilidade se o ecossistema for dotado de ldquofeedback and adjustment among actors and processesrdquo A chave para um ecossistema de Dados Abertos funcional eacute a implementaccedilatildeo de poliacuteticas que definam ldquothe legal context standards to facilitate data interoperability and a stable and sustainable network for users of the datardquo (Donker amp van Loenen 2017)

64

A Sunlight Foundation publicou em 2014 as ldquoGuidelines for open data policiesrdquo fornecendo aconselhamento ao niacutevel dos dados que devem ser tornados puacuteblicos e como essa abertura deve ser efetuada Para a implementaccedilatildeo de poliacuteticas de DGA a Sunlight Foundation aponta como fundamental criar um autoridade de supervisatildeo criar orientaccedilotildees e outras regulaccedilotildees vinculativas para a implementaccedilatildeo da poliacutetica incorporar a perspetiva puacuteblica na implementaccedilatildeo da poliacutetica definir prazos ambiciosos para a implementaccedilatildeo criar processos que assegurem a qualidade dos dados assegurar financiamento suficiente para a implementaccedilatildeo da poliacutetica criar ou explorar parcerias e mandatar futuras revisotildees da poliacutetica para possiacuteveis ajustamentos (Sunlight Foundation 2014 traduccedilatildeo livre)

De acordo com Dietrich (2013) uma poliacutetica de dados abertos deve

Definir a abertura por defeito Estar alinhada com os principais objetivos nacionais de desenvolvimento de

poliacuteticas Definir uma estrateacutegia nacional e as suas prioridades Tornar a coleta e gestatildeo de dados numa rotina Estabelecer accedilotildees de suporte ao ecossistema de dados abertos

Segundo o Open Data GoldBook todas as poliacuteticas de Dados Abertos devem cobrir os seguintes toacutepicos (Carrara et al 2016a traduccedilatildeo livre)

Lista das categorias de dados da organizaccedilatildeo Avaliaccedilatildeo do estatuto dos dados da organizaccedilatildeo Alinhamento com os aspetos legais Accedilotildees necessaacuterias para atingir os objetivos propostos Implicaccedilotildees teacutecnicas Implicaccedilotildees financeiras Criaccedilatildeo de um grupo de trabalho com responsabilidades e funccedilotildees claras Desenvolvimento de um plano que assegure a criaccedilatildeo do grupo de trabalho e

tambeacutem a sua monotorizaccedilatildeo Definiccedilatildeo de indicadores de performance que possibilitem a mediccedilatildeo do progresso

da poliacutetica relativamente aos objetivos delineados

O Open Data Study (Hogge 2011) aponta como razatildeo de sucesso das estrateacutegias de Open Data no Reino Unido e nos EUA a utilizaccedilatildeo de uma abordagem que envolve trecircs niacuteveis de intervenientes

Sociedade Civil e em particular o pequeno grupo que desenvolve aplicaccedilotildees e serviccedilos a partir de dados puacuteblicos

Um grupo de burocratas governamentais munidos de talento e recursos que lhes permita funcionar como niacutevel intermeacutedio ou de ligaccedilatildeo

Uma administraccedilatildeo poliacutetica recetiva agrave mudanccedila e agrave abertura

65

Em entrevista ao mesmo estudo (Hogge 201110) Tim Berners-Lee sintetiza esta estrateacutegia ldquoIt has to start at the top it has to start in the middle and it has to start at the bottomrdquo reforccedilando a ideia da importacircncia destes trecircs niacuteveis de influecircncia

Atraveacutes do seu Task Force Report o e-IRG (2016) efetuou vaacuterias recomendaccedilotildees para a implementaccedilatildeo de poliacuteticas de Dados Abertos preferecircncia pelas licenccedilas abertas promover a certificaccedilatildeo dos repositoacuterios apresentar os dados como um bem cientiacutefico institucional e societal e por fim ligar dados agraves publicaccedilotildees O OD4D (2016) sublinha que os dados devem ser publicados de forma consistente devem ser comparaacuteveis e interoperaacuteveis e para isso eacute necessaacuterio adotar padrotildees abertos e praacuteticas de publicaccedilatildeo para metadados formatos codificaccedilatildeo de caracteres identificadores vocabulaacuterios e licenciamento

Atraveacutes do estudo efetuado agraves poliacuteticas de Dados Abertos de instituiccedilotildees holandesas Zuiderwijk e Janssen (2014 traduccedilatildeo livre) efetuaram diversas recomendaccedilotildees que podem potenciar melhorias nas poliacuteticas de abertura de dados

Colaboraccedilatildeo entre instituiccedilotildees usando recursos e conhecimento coletivo para apoiar a troca de conhecimentos e a superaccedilatildeo da limitaccedilatildeo de recursos

Foco no impacto criaccedilatildeo de valor puacuteblico e natildeo apenas na publicaccedilatildeo de dados Estiacutemulo do uso de Dados Abertos e comunicaccedilatildeo dos sucessos de reutilizaccedilatildeo Criaccedilatildeo de uma cultura onde a abertura de dados seja incorporada nos processos

de trabalho diaacuterios

Arzberger et al (20041777) elencaram uma estrutura de avaliaccedilatildeo com cinco domiacutenios para promover o acesso a dados tecnoloacutegico institucional e de gestatildeo financeiro e orccedilamental legal e poliacutetico cultural e comportamental Estes domiacutenios podem ajudar na formulaccedilatildeo de poliacuteticas de Dados Abertos dado que satildeo ldquoa framework for locating and analyzing where improvements can be maderdquo Alguns autores destacam a pouca importacircncia que tem sido dedicada agrave implementaccedilatildeo avaliaccedilatildeo e alteraccedilotildees das poliacuteticas de Dados Abertos (Zuiderwijk et al2014) e ao desenvolvimento de investigaccedilatildeo que compare as mesmas poliacuteticas (Zuiderwijk amp Janssen 2014) A avaliaccedilatildeo dos efeitos das poliacuteticas de Dados Abertos pode fornecer inferecircncias importantes sobre as vantagens e desvantagens da abertura de dados e o valor puacuteblico que estas podem criar (Zuiderwijk et al2014) Comparar poliacuteticas de Dados Abertos em diferentes aspetos e a diferentes niacuteveis eacute importante e necessaacuterio para obter ldquoa better understanding of the common and differing elements in the policies and to identify the factors that affect the variation in policies and which influence their impactrdquo (Zuiderwijk amp Janssen 201417-18) Avaliar o estado da abertura de dados pode envolver a avaliaccedilatildeo teacutecnica dos conjuntos de dados das iniciativas de abertura dos dados governamentais atraveacutes da mediccedilatildeo quantitativa de resultados e impacto e julgamentos qualitativos sobre o desempenho da iniciativa de Dados Abertos (World Wide Web Foundation 2014) Um meacutetodo comum de avaliar o

66

efeito das poliacuteticas satildeo as estruturas de avaliaccedilatildeo da maturidade dos Dados Abertos sendo que estas podem ser uma ferramenta importante na melhoria da abertura de dados e no envolvimento da sociedade Estas estruturas satildeo usadas como modelo para comparaccedilatildeo de diferentes setores eou paiacuteses como instrumento de melhoria da qualidade e gestatildeo dos Dados Abertos (World Wide Web Foundation 2014 Donker amp van Loenen 2017) para entender os impactos comerciais e sociais e priorizar determinados tipos de dados (World Wide Web Foundation 2014) A World Wide Web Foundation (2014) enfatiza que a avaliaccedilatildeo das atividades de Dados Abertos deve ter em conta

Contexto em que a abertura de dados eacute feita legal organizacional poliacutetico teacutecnico social e econoacutemico

Natureza e qualidade dos conjuntos de dados acessibilidade legibilidade por maacutequina e licenccedilas abertas dimensatildeo teacutecnica legal social e praacutetica da abertura classificaccedilatildeo de datasets avaliaccedilatildeo da qualidade

Contexto de utilizaccedilatildeo quem satildeo os utilizadores quais os seus propoacutesitos e quais as atividades e modelos de negoacutecio construiacutedos a partir dos Dados Abertos

Benefiacutecios adquiridos pela reutilizaccedilatildeo de Dados Abertos sociais ambientais poliacuteticos e econoacutemicos ou comerciais

Atraveacutes de uma extensa revisatildeo da literatura50 Zuiderwijk e Janssen (2014) elaboraram uma estrutura de comparaccedilatildeo para as poliacuteticas de Dados Abertos baseada em trecircs vetores o ambiente e contexto da poliacutetica o conteuacutedo da poliacutetica os indicadores de desempenho que permitem inferir o valor puacuteblico alcanccedilado Estes vetores dividem-se em 27 indicadores de enquadramento e avaliaccedilatildeo das poliacuteticas de Dados Abertos

50 As autoras mencionam publicaccedilotildees de Huijboom amp Van der Broek (2011) Gibbs et al (2003) Eskelinen et al (2008) De Bruijn et al (2002) Dawes et al (2004) Rothenberg (2012) Public Sector Transparency Board (2012) Dawes Pardo amp Cresswell (2004) Open Government Directive (Obama 2012) Jaeger et al (2012) Zuiderwijk Jeffey amp Janssen (2012) Ono amp Zavodny (2007) Jaeger (2007)

67

Fig 16 Estrutura de avaliaccedilatildeo de poliacuteticas de Dados Abertos Fonte Zuiderwijk e Janssen (2014) Disponiacutevel na WWW httpwwwsciencedirectcomsciencearticlepiiS0740624X13001202

Antes de poder avaliar o sucesso do impacto dos Dados Abertos eacute necessaacuterio avaliar o estado atual da abertura de dados (Donker amp van Loenen 2017) De acordo com Sasse et al (2017) a avaliaccedilatildeo dos produtos de Dados Abertos pode ser difiacutecil Os autores enfatizam que os responsaacuteveis pelos portais de dados querem obter mais informaccedilatildeo atraveacutes da mediccedilatildeo de alguns paracircmetros como os datasets mais acedidos que datasets natildeo satildeo atualizados ou a percentagem de downloads entre outros Estas meacutetricas51 podem servir diversas audiecircncias desde organizaccedilotildees que publiquem dados a utilizadores que pretendam saber quais os conjuntos de dados mais usados Ainda

51 As meacutetricas satildeo uma forma de avaliaccedilatildeo que mede o progresso desempenho qualidade ou quantidade de um projeto serviccedilo ferramenta ou produto (Sasse et al 2017)

bullPaiacutes bullNiacutevel da organizaccedilatildeo e tipo de missatildeo bullMotivaccedilotildees e objectivos bullLanccedilamento da plataforma de Dados Abertos bullAlocaccedilatildeo de recursos e contexto econoacutemico bullLegislaccedilatildeo bullContexto poliacutetico e social

Conteacuteudo e ambiente da poliacutetica

bullEstrateacutegia e princiacutepios de abertura bullMedidas e instrumentos poliacuteticos bullProcessamento de dados antes da publicaccedilatildeo bullQuantidade de Dados Abertos bullTemaacutetica dos Dados Abertos bullFormas de apresentaccedilatildeo de dados bullPreccedilo do acesso aos dados bullGrupos alvo da abertura de dados bullPadrotildees e formatos teacutecnicos para os Dados Abertos bullFornececimento de metadados bullTipos de dados natildeo publicados bullApoio teacutecnico para o uso de dados publicados bullPromoccedilatildeo ativa da reutilizaccedilatildeo de dados bullQualidade dos dados bullLicenciamento de dados bullDisponibilidade de dados sem pedido de registo bullEstrutura da relaccedilatildeo entre os fornecedores de informaccedilatildeo e os utilizadores

Conteuacutedo da poliacutetica (input)

bullUsos dos dados publicados bullRiscos da publicaccedilatildeo de dados bullBenefiacutecios da publicaccedilatildeo de dados

Indicadores de desempenho (output)

Valor puacuteblico alcanccedilado (impacto)

68

segundo Sasse et al (2017) as meacutetricas devem ser integradas num contexto mais vasto para que possam conduzir agrave tomada de decisatildeo e agrave formulaccedilatildeo de poliacuteticas

Entre as iniciativas de Open Data ao niacutevel global a disponibilizaccedilatildeo aberta de dados eacute normalmente feita atraveacutes de cataacutelogos e portais de dados centralizados disponibilizando um ponto de acesso uacutenico aos utilizadores e atraveacutes dos quais se pode inferir o impacto das poliacuteticas de Open Data atraveacutes do regime de abertura dos datasets disponibilizados O DataCatalogs52 agrega os portais de DGA espalhados pelo mundo inteiro contabilizando 520 portais em Dezembro de 2016 sendo 197 localizados na Europa e apenas 5 em Portugal53 cenaacuterio que nos parece extremamente desatualizado tendo em conta os resultados obtidos no Quadro 5

O Open Data Barometer coleta informaccedilatildeo sobre a abertura de dados classificando os paiacuteses conforme o niacutevel de preparaccedilatildeo de poliacuteticas de Open Data a sua respetiva implementaccedilatildeo e tambeacutem o impacto causado por esta abertura oferecendo uma visatildeo global daquilo que eacute o estado de abertura dos dados governamentais A quarta ediccedilatildeo do Open Data Barometer revela algumas conclusotildees preocupantes a niacutevel da abertura dos dados governamentais A disponibilidade de dados que cumprem todos os princiacutepios de abertura caiu dos 10 para 7 e a legibilidade por maacutequina tambeacutem tem tendecircncia negativa Apenas se registou uma melhoria no licenciamento de dados A World Wide Web Foundation (2017) listou ainda um conjunto de problemas na disponibilizaccedilatildeo de Dados Abertos

Foi avaliado que nove em cada dez conjuntos de dados natildeo estatildeo abertos sendo que a recomendaccedilatildeo eacute que estes sejam abertos por princiacutepio

Os dados governamentais satildeo normalmente incompletos e de baixa qualidade A World Wide Web Foundation recomenda a descentralizaccedilatildeo da abertura de dados por todas as agecircncias e departamentos governamentais

A vontade poliacutetica eacute aquilo que distingue o sucesso do insucesso da abertura de dados ldquoGovernments must adopt the Open Data Charter to ensure open data practices are embedded beyond political mandatesrdquo (World Wide Web Foundation 201717)

Os governos natildeo estatildeo a publicar os dados necessaacuterios para restaurar a confianccedila dos cidadatildeos A recomendaccedilatildeo eacute que os governos devem consultar os cidadatildeos e intermediaacuterios para saber que dados devem ser considerados prioritaacuterios

Poucas iniciativas de Dados Abertos realmente promovem a igualdade e a inclusatildeo ldquoGovernments must invest in using open data to improve the lives of marginalised groupsrdquo (World Wide Web Foundation 201721)

52 Disponiacutevel na WWW httpdatacatalogsorg 53 Os portais indexados pelo DataCatalogs satildeo OneStopTransport iGEO Central de Dados Dadosgovpt Despesa Puacuteblica Portugal

69

O Open Data Maturity Model da ODI (201511) fornece uma estrutura para avaliar como as praacuteticas de abertura de dados tecircm impacto nas organizaccedilotildees nomeadamente como os dados satildeo publicados como satildeo geridos e valorizados Este modelo eacute baseado em cinco temas que representam uma vasta aacuterea de atividades

Processos de gestatildeo de dados identificaccedilatildeo dos processos de gestatildeo e publicaccedilatildeo de dados incluindo o controlo de qualidade fluxos de trabalho e adoccedilatildeo de padrotildees teacutecnicos Conhecimentos e habilidades delimitaccedilatildeo dos passos necessaacuterios para criar ldquoa culture of open data within an organizationrdquo identificando a necessaacuteria partilha de conhecimento treino e aprendizagem para entender os benefiacutecios da abertura Apoio e envolvimento do cliente foca a necessidade das organizaccedilotildees de se envolver com as fontes de dados e com os reutilizadores de dados de modo a poder fornecer apoio e obter respostas para tornar a abertura de dados bem-sucedida Investimento e desempenho financeiro cobre a necessidade da organizaccedilatildeo em ter uma visatildeo do valor dos seus dados e do orccedilamento necessaacuterio para suportar a sua publicaccedilatildeo Em termos de consumo de dados as organizaccedilotildees devem entender os custos e o valor associado agrave reutilizaccedilatildeo de dados provenientes de outras fontes Visatildeo estrateacutegica sublinha a necessidade de a organizaccedilatildeo adotar uma estrateacutegia clara sobre a partilha e reutilizaccedilatildeo de dados e nomear uma lideranccedila reconhecida com responsabilidade e capacidade para executar a estrateacutegia (ODI 2015 traduccedilatildeo livre)

A W3C publicou em Janeiro de 2017 como recomendaccedilatildeo uma lista de boas praacuteticas para a publicaccedilatildeo e partilha de dados denominada Data on the Web Best Practices Estas praacuteticas cobrem questotildees como o fornecimento de metadados descritivos e estruturais licenciamento arquivamento enriquecimento e republicaccedilatildeo de dados (W3C 2017) Cada uma das praacuteticas estaacute classificada de acordo com os seus benefiacutecios definidos em oito categorias reutilizaccedilatildeo compreensatildeo conexatildeo a outros dados pesquisabilidade confianccedila acesso interoperabilidade e processamento (W3C 2017) Esta lista de boas praacuteticas eacute complementada por dois vocabulaacuterios controlados um para o uso de datasets54 e outro para a qualidade dos dados55 (W3C 2017)

ldquoUma cidade inteligente eacute conhecedora das suas capacidades do seu territoacuterio e dos seus recursos devendo ser capaz de transformar o seu papel de fornecedor de dados em catalisadora de processos de inovaccedilatildeordquo (Soares Baptista e Lima 2015) A disponibilizaccedilatildeo de dados locais permite aos cidadatildeos acompanharem as decisotildees do setor puacuteblico relativas a despesas aumentando a transparecircncia e estimulando a democracia Contudo eacute necessaacuterio que as cidades desenvolvam uma infraestrutura correta que permita processar e integrar a gestatildeo de dados em diversos serviccedilos

54 Disponiacutevel na WWW httpswwww3orgTRvocab-duv 55 Disponiacutevel na WWW httpswwww3orgTRvocab-dqv

70

criando ainda um sistema de gestatildeo que facilite o armazenamento e publicaccedilatildeo de dados (Carrara et al 2016b) A Sunlight Foundation (2013) desenvolveu o Public Policy for Public Data um guia para ajudar as cidades a desenvolver e implementar poliacuteticas puacuteblicas de Dados Abertos desde as razotildees para a abertura passando pelos objetivos e implementaccedilatildeo ateacute agrave promoccedilatildeo da poliacutetica

De forma a sistematizar as iniciativas de Dados Abertos e melhorar a sua gestatildeo foi publicada em Espanha a UNE 1783012015 Ciudades Inteligentes Datos Abiertos permitindo avaliar a maturidade da publicaccedilatildeo de Dados Abertos das cidades inteligentes atraveacutes de meacutetricas e indicadores Esta norma define cinco grandes domiacutenios associados aos Dados Abertos (estrateacutegico legal organizacional teacutecnico econoacutemico-social) fornecendo ainda vocabulaacuterios concretos para a publicaccedilatildeo de dados (Asociacioacuten Espantildeola de Normalizacioacuten y Certificacioacuten 2015)

O World Council on City Data56 eacute uma das organizaccedilotildees envolvidas na promoccedilatildeo das smart cities e da criaccedilatildeo de padrotildees para os dados provenientes das cidades Em 2014 foi publicada a norma internacional ISO 37120 com o tiacutetulo ldquoSustainable development of communities -- Indicators for city services and quality of liferdquo incluindo 100 indicadores que medem indicadores sociais econoacutemicos e ambientais Estes indicadores estatildeo divididos em 17 categorias de dados economia educaccedilatildeo energia ambiente financcedilas governaccedilatildeo fogo e emergecircncias respostas sauacutede recreaccedilatildeo seguranccedila abrigos desperdiacutecios soacutelidos telecomunicaccedilotildees e inovaccedilatildeo transportes planeamento urbano desperdiacutecio de aacutegua e aacutegua e saneamento (Carrara et al 2016b) O World Council on City Data (2016) permite comparar a abertura de dados em diferentes cidades utilizando os indicadores da ISO 3720 Em termos de cidades listadas pelo mapa desta organizaccedilatildeo o Porto eacute o uacutenico representante portuguecircs destacando-se a sauacutede e transportes como aacutereas com maior abertura

21 Poliacuteticas Macro

A promessa de uma ciecircncia orientada a dados ldquohas renewed the vigour of policy efforts to catalyse innovationrdquo (Whyte amp Donnely 20161) No acircmbito da abertura de dados estatildeo a ser desenvolvidas poliacuteticas por governos agecircncias de financiamento e editoras cientiacuteficas57 que assegurem que os dados de investigaccedilatildeo estejam disponiacuteveis em repositoacuterios puacuteblicos A EU tem desempenhado uma dupla funccedilatildeo na abertura de dados cientiacuteficos ao requerer a abertura de dados nos seus programas de investimento e ao coordenar a implementaccedilatildeo de praacuteticas de abertura de dados nos

56 Disponiacutevel na WWW httpwwwdataforcitiesorg 57 O Open Acess Directory possui uma lista ainda em desenvolvimento com as revistas cientiacuteficas que implementaram uma poliacutetica de Dados Abertos Disponiacutevel na WWW httpoadsimmonseduoadwikiJournal_open-data_policies

71

estados membros (ERAC 2016) As agecircncias de financiamento58 tecircm vindo paulatinamente a definir poliacuteticas de AA que exigem a garantia que os dados de investigaccedilatildeo subjacentes agrave publicaccedilatildeo textual satildeo depositados em repositoacuterios adequados de forma a permitir a verificaccedilatildeo dos resultados de investigaccedilatildeo e futuros uso e interpretaccedilotildees (UNESCO 2015) O raacutepido desenvolvimento da abertura e gestatildeo de dados cientiacuteficos nos EUA e no Reino Unido satildeo resultados de mandatos dos financiadores como o Research Council United Kingdom National Science Foundation e da National Institutes of Health (RECODE 2014) As instituiccedilotildees de financiamento reconhecem a dificuldade na mudanccedila da cultura de partilha de dados sendo que a tendecircncia deveraacute passar por aumentar os niacuteveis de monotorizaccedilatildeo das poliacuteticas como a monotorizaccedilatildeo dos DMPrsquos auditorias institucionais monotorizaccedilatildeo de resultados produzidos e recompensas para o apoio na gestatildeo de dados (Whyte e Donnally 2016)

Em 2010 a Comissatildeo Europeia desenhou uma visatildeo que tinha por objetivo o desenvolvimento de uma e-infraestrutura cientiacutefica que potenciasse o acesso uso e reuacuteso bem como a qualidade dos dados dando o impulso para a EU formular poliacuteticas para a construccedilatildeo da infraestrutura de investigaccedilatildeo dentro do enquadramento da agenda digital Foca-se na infraestrutura necessaacuteria para a gestatildeo de dados cientiacuteficos e identifica os benefiacutecios de acelerar o desenvolvimento de uma completa e funcional infraestrutura para os dados cientiacuteficos O relatoacuterio faz seis recomendaccedilotildees destacando-se o papel governamental no desenvolvimento e uso de novas maneiras de medir o valor dos dados a necessidade de recompensar os que contribuem para tal treinar uma nova geraccedilatildeo de cientistas de dados e fomentar o entendimento puacuteblico (Comissatildeo Europeia Grupo de peritos de alto niacutevel em dados de investigaccedilatildeo 2010) No mesmo documento a Comissatildeo Europeia salienta que existem desafios que satildeo necessaacuterios superar na construccedilatildeo da e-infraestrutura estando estes ao niacutevel da coleta qualidade usabilidade interoperabilidade diversidade seguranccedila dos dados educaccedilatildeo e treino publicaccedilatildeo e acesso de dados exploraccedilatildeo comercial preservaccedilatildeo e sustentabilidade e novos paradigmas sociais

Em 2011 a Comissatildeo Europeia emitiu a COM (2011) 882 onde declara que a abertura de dados cientiacuteficos eacute vital para a Europa pelo seu poder de promover negoacutecios e oportunidades econoacutemicas resolver problemas da sociedade e acelerar o progresso cientiacutefico sendo necessaacuterio atuar a niacutevel local regional nacional e a niacutevel europeu (Comissatildeo Europeia 2011)

A recomendaccedilatildeo da Comissatildeo Europeia sobre o acesso agrave informaccedilatildeo cientiacutefica e a sua preservaccedilatildeo (2012417UE) pede aos Estados Membros que desenvolvam poliacuteticas e estrateacutegias que assegurem o AA a publicaccedilotildees e dados de investigaccedilatildeo provenientes

58 A Universidade de Cambridge apresenta uma lista com as 18 entidades financiadoras a niacutevel internacional que possuem poliacuteticas de Dados Abertos Disponiacutevel na WWW httpwwwdatacamacukfunders

72

de financiamento puacuteblico Estas poliacuteticas devem prever os objetivos e os indicadores de avaliaccedilatildeo o plano de execuccedilatildeo e o plano financeiro garantindo que os dados resultantes de financiamento puacuteblico sejam acessiacuteveis e reutilizaacuteveis ldquothrough digital e-infrastructuresrdquo e sejam facilmente identificados e ligados a outros conjuntos de dados As instituiccedilotildees nacionais devem promover a poliacutetica nacional atraveacutes de mecanismos que permitam e recompensem ldquothe sharing of research datardquo (EUR-Lex 201241-42) A poliacutetica instaurada em 2015 pela Comissatildeo Europeia denominada Digital Single Market propocircs a implementaccedilatildeo de uma ldquocopyright exception that would permit researchers to analyse on a large scale scientific data to which they have lawful accessrdquo (Comissatildeo Europeia 2016b) Esta exceccedilatildeo iraacute permitir que os investigadores europeus usem meacutetodos de ldquoText e Data Miningrdquo para analisar e extrair conhecimento de grandes quantidades de informaccedilatildeo atraveacutes de teacutecnicas computacionais (Comissatildeo Europeia 2016a51) Atraveacutes da implementaccedilatildeo deste Digital Single Market a EU tem envidado esforccedilos para desenvolver uma economia baseada em dados Esta economia de dados caracteriza-se por um ldquoecossistema de diferentes tipos de intervenientes no mercado como fabricantes investigadores e fornecedores de infraestruturas que colaboram para garantir que os dados satildeo acessiacuteveis e utilizaacuteveisrdquo Deste modo os intervenientes do mercado podem retirar valor desses dados ldquoatraveacutes da criaccedilatildeo de um leque de aplicaccedilotildees com um grande potencial de melhoria da vida quotidianardquo (Comissatildeo Europeia 2017c)

Com a ambiccedilatildeo de tornar a Europa liacuteder mundial numa economia baseada em dados a Comissatildeo Europeia (2016c) pretende ldquodisponibilizar serviccedilos baseados na computaccedilatildeo em nuvem e infraestruturas de dados de craveira mundialrdquo que forneccedilam vantagens competitivas a investigadores empresaacuterios e instituiccedilotildees puacuteblicas baseadas na utilizaccedilatildeo de grandes volumes de dados Neste sentido foram delineadas quatro metas a cumprir ateacute 2020 (Comissatildeo Europeia 2016d)

ldquoA partir de 2016 Criaccedilatildeo de uma nuvem europeia para a ciecircncia aberta destinada aos investigadores europeus e seus colaboradores cientiacuteficosrdquo A estrateacutegia definida inclui a ldquointegraccedilatildeo e consolidaccedilatildeo das plataformas de infraestruturas eletroacutenicas da agregaccedilatildeo das atuais nuvens cientiacuteficas e infraestruturas de investigaccedilatildeordquo e tambeacutem o apoio agrave criaccedilatildeo de ldquoserviccedilos baseados na computaccedilatildeo em nuvemrdquo

2017 Definiccedilatildeo de abertura por princiacutepio de todos os dados cientiacuteficos gerados em futuros projetos financiados pelo quadro atual de financiamento (H2020) para garantir a reutilizaccedilatildeo do volume massivo de dados produzidos pela comunidade cientiacutefica

2018 Lanccedilamento de uma iniciativa para acelerar o desenvolvimento de ldquotecnologias quacircnticas que estatildeo na base da proacutexima geraccedilatildeo de supercomputadoresrdquo

73

Ateacute 2020 desenvolvimento e implantaccedilatildeo em larga escala de uma infraestrutura europeia de computaccedilatildeo de alto desempenho armazenamento de dados e redesrdquo onde se destaca a ldquocriaccedilatildeo de um centro europeu de grandes volumes de dadosrdquo e a melhoria do GEANT59 ldquoa rede de base de investigaccedilatildeo e inovaccedilatildeordquo

A aposta na criaccedilatildeo de poliacuteticas de abertura de dados de acordo com os objetivos europeus relativamente agrave CA reflete-se no atual programa de financiamento da investigaccedilatildeo e inovaccedilatildeo da EU o Horizonte 2020 (H2020) Este programa criou um projeto-piloto de dados abertos com o objetivo de maximizar o acesso e reutilizaccedilatildeo de dados de investigaccedilatildeo nas aacutereas cientiacuteficas selecionadas60 embora todas as outras aacutereas sejam convidadas a participar (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016a) Sob o artigo 293 do Model Grant Agreement o projeto-piloto de abertura de dados requer o depoacutesito num repositoacuterio de AA de todos os dados e metadados associados que sejam subjacentes aos resultados finais da investigaccedilatildeo permitindo assim o seu acesso exploraccedilatildeo por maacutequina reproduccedilatildeo e disseminaccedilatildeo sem custos para os utilizadores Os investigadores devem fornecer informaccedilatildeo sobre as ferramentas e instrumentos necessaacuterios para validar os resultados Aos participantes em projetos financiados por fundos europeus eacute exigido a elaboraccedilatildeo de um DMP uma ferramenta para a gestatildeo publicaccedilatildeo e reutilizaccedilatildeo de dados permitindo descrever os conjuntos de dados gerados no processo de investigaccedilatildeo e como e quando seratildeo publicados A gestatildeo de dados deve ser efetuada segundo os princiacutepios FAIR tornando os dados faacuteceis de encontrar acessiacuteveis interoperaacuteveis e reutilizaacuteveis (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016c)

Com a extensatildeo do projeto-piloto a todas as aacutereas de investigaccedilatildeo financiadas a abertura de dados de investigaccedilatildeo passou a ser a norma por princiacutepio Poreacutem existe a opccedilatildeo de natildeo participaccedilatildeo (Comissatildeo Europeia 2017b) tendo sido implementado o lema ldquoas open as possible as closed as necessaryrdquo (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016b8) O opt out ou as exceccedilotildees de natildeo participaccedilatildeo podem ser exercidas em caso de incompatibilidade com a obrigaccedilatildeo de proteger resultados com razotildees de seguranccedila com regras de proteccedilatildeo de dados pessoais pelo fato de o objetivo do projeto ser colocado em causa de o projeto natildeo gerar ou coletar dados e ainda outras razotildees legiacutetimas que possam ser apresentadas (Comissatildeo Europeia 2017b)

59 O GEacuteANT eacute um elemento fundamental na infraestrutura europeia fornecendo uma rede para a criaccedilatildeo de investigaccedilatildeo educaccedilatildeo inovaccedilatildeo e perfeiccedilatildeo cientiacutefica Disponiacutevel na WWW httpswwwgeantorgAbout 60 As aacutereas cientiacuteficas selecionadas satildeo Tecnologias emergentes e futuras infraestruturas de investigaccedilatildeo lideranccedila na melhoria de tecnologias industriais (tenologias de informaccedilatildeo e comunicaccedilatildeo) nano e biotecnologias seguranccedila alimentar sustentabilidade de recursos agriacutecolas marinhos e mariacutetimos ambiente e eficiecircncia de recursos sociedades inovadoras e inclusivas ciecircncia de e para a sociedade e cidades inteligentes

74

A abertura dos dados de investigaccedilatildeo criados com financiamento puacuteblico conta com o apoio dos projetos do OpenAIRE+ e do OpenAIRE-Connect visam estimular a abertura de dados funcionando ldquoas a knowledge bank and Open Access web-portalrdquo (ERAC 201667) O portal do OpenAIRE agrega em Maio de 2017 um total de 46238 conjuntos de dados sendo que Portugal contribui com 1968 datasets distribuiacutedos por quatro entidades embora o Instituto Politeacutecnico de Castelo Branco seja o fornecedor de mais de 95 dos dados

O projeto EUDAT financiado pelo H2020 visa fornecer uma infraestrutura de dados colaborativa aos investigadores europeus de qualquer disciplina cientiacutefica onde possam preservar pesquisar aceder e processar dados como parte da EUDAT Collaborative Data Infrastructure uma rede de colaboraccedilatildeo e centros de cooperaccedilatildeo O EUDAT fornece acesso a sete serviccedilos diferentes relativos agrave gestatildeo de dados (EUDAT[a]) Atraveacutes do serviccedilo B2FIND61 eacute possiacutevel pesquisar os dados armazenados atraveacutes do serviccedilo B2SHARE62 verificando-se a existecircncia de 484795 conjuntos de dados (EUDAT[b])

Vaacuterios programas de abertura de dados governamentais foram lanccedilados em diversos paiacuteses e sistemas poliacuteticos tendo-se expandido tambeacutem ao niacutevel subnacional e local sendo que estes programas compreendem diretivas regras e praacuteticas com aplicaccedilatildeo em todos ou na maior parte dos setores do governo (Dawes Vidiasova amp Parkhimovich 2016) Estas iniciativas satildeo idecircnticas numa primeira anaacutelise atraveacutes da construccedilatildeo de um portal na seleccedilatildeo de datasets semelhantes sendo que tambeacutem recorrem aos mesmos tipos de eventos como os hackathons para preparar e divulgar o lanccedilamento de programas de DGA (Davies 2014) Contudo estas iniciativas diferem no seu estado de maturaccedilatildeo estruturas poliacuteticas e as suas prioridades puacuteblicas (Davies 2014) e nos princiacutepios de abertura na quantidade e tipos de dados publicados nos metadados fornecidos e no apoio agrave reutilizaccedilatildeo de dados (Zuiderwijk amp Janssen 2014) De facto uma simples comparaccedilatildeo dos vaacuterios iacutendices de avaliaccedilatildeo permitiraacute perceber os diferentes niacuteveis de maturidade das poliacuteticas de Dados Abertos e a niacutevel europeu e mundial

Os Dados Abertos estatildeo na agenda europeia haacute mais de uma deacutecada tendo o primeiro passo sido dado em 2003 com a publicaccedilatildeo da Diretiva 200398EC sobre a reutilizaccedilatildeo da PSI (EUR-Lex 2003a) e da Diretiva 20034CE relativa ao acesso puacuteblico agrave informaccedilatildeo ambiental (EUR-Lex 2003b) Esta Diretiva aplica-se agrave reutilizaccedilatildeo dos documentos detidos pelo setor puacuteblico poreacutem natildeo obriga os estados membros a publicar dados do setor puacuteblico para estimular o mercado da informaccedilatildeo apenas os aconselha a tornar disponiacuteveis nem impotildee nenhuma obrigaccedilatildeo de autorizaccedilatildeo de reutilizaccedilatildeo dos dados (Janssen 2011) Janssen (2011) sublinha que apesar do sucesso

61 Disponiacutevel na WWW httpb2findeudateudatasetq= 62 Disponiacutevel na WWW httpsb2shareeudateu

75

da abertura dos dados governamentais ter a contribuiccedilatildeo da Diretiva Europeia as iniciativas mais bem-sucedidas referem-se a princiacutepios de transparecircncia e prestaccedilatildeo de contas e natildeo agrave Diretiva em si

A EU adotou ainda uma estrutura compreensiva para o acesso e reutilizaccedilatildeo de informaccedilatildeo geoespacial incluindo as infraestruturas eletroacutenicas atraveacutes da INSPIRE Directive63 e fomentou a disseminaccedilatildeo do patrimoacutenio cultural atraveacutes da Europeana ldquothe European digital library for cultural objectsrdquo e o acesso a informaccedilatildeo ambientalrdquo (Comissatildeo Europeia 20132)

A Diretiva 2011833EU sobre a reutilizaccedilatildeo de documentos publicados pela Comissatildeo Europeia veio autorizar salvo nas exceccedilotildees previstas a utilizaccedilatildeo comercial e natildeo comercial sem custos e sem necessidade de pedido da informaccedilatildeo produzida pela EU ou em seu nome (EUR-Lex 2011) A Diretiva estabelece as condiccedilotildees de reutilizaccedilatildeo formatos em que os documentos devem ser disponibilizados regras de custos transparecircncia e natildeo discriminaccedilatildeo

A Diretiva 201337EU veio reformular a autorizaccedilatildeo da reutilizaccedilatildeo da PSI A nova diretiva requer que a informaccedilatildeo puacuteblica seja disponibilizada ldquothrough open and machine-readable formats and together with their metadata at the best level of precision and granularity in a format that ensures interoperabilityrdquo incluindo agora entidades como bibliotecas arquivos e museus na esfera da abertura de dados (EUR-Lex 20133) Esta diretiva tornou obrigatoacuteria a disponibilizaccedilatildeo de informaccedilatildeo proveniente das entidades puacuteblicas para reutilizaccedilatildeo ao custo de reproduccedilatildeo de preferecircncia num portal e sob licenccedilas de formatos digitais O artigo 9ordm sublinha que os Estados-Membros devem fornecer instrumentos que facilitem a pesquisa de dados como inventaacuterios dos documentos com os respetivos metadados disponibilizando-os se possiacutevel em linha em formato legiacutevel por maacutequina bem como a ligaccedilatildeo entre o portal e o inventaacuterio Os objetivos passam por estimular o desenvolvimento de um mercado europeu de serviccedilos baseados na PSI melhorar o uso e aplicaccedilatildeo da PSI nos processos de negoacutecio fortalecer a competitividade no mercado interno e para resolver divergecircncias sobre regras de reutilizaccedilatildeo entre Estados Membros

De forma a promover a abertura dos seus proacuteprios dados em Junho de 2013 a EU adotou os princiacutepios do G8 Open Data Charter comprometendo-se a

Identificar e tornar disponiacuteveis os datasets fundamentais ao niacutevel da EU Identificar e tornar disponiacuteveis os datasets de alto valor ao niacutevel da EU Publicar os dados no EU Open Data Portal

63A INSPIRE Directive eacute a Diretiva 20072EC do Parlamento Europeu e do Conselho de 14 Marccedilo 2007 que veio estabelecer uma Infraestrutura para a informaccedilatildeo espacial na Comunidade Europeia Disponiacutevel na WWW httpinspireeceuropaeuinspire-legislation26

76

Aplicar os princiacutepios do G8 Open Data Charter em todos os 28 estados-membros atraveacutes da revisatildeo da Diretiva sobre a PSI e de guias de orientaccedilatildeo

Apoiar atividades consultadoria e a participaccedilatildeo Partilhar experiecircncias na aacuterea dos Dados Abertos (Comissatildeo Europeia 2013)

Em 2016 entrou em vigor o novo Regulamento Geral sobre a Proteccedilatildeo de Dados que eacute relativo ao tratamento de dados pessoais e agrave livre circulaccedilatildeo dos mesmos O regulamente veio implementar o direito de pedido de esquecimento por parte do cidadatildeo a portabilidade de dados que permite migrar dados pessoais entre sistemas ou empresas multas para os incumpridores entre outras novidades A implementaccedilatildeo do regulamento seraacute obrigatoacuteria ateacute maio de 2018 sendo as legislaccedilotildees nacionais substituiacutedas por uma regulamentaccedilatildeo europeia (EUR-Lex 2016)

A EU criou em 2012 um portal para alojar dados puacuteblicos e de investigaccedilatildeo que provecircm de organizaccedilotildees europeias ou de projetos financiados pela EU O European Union Data Portal aloja dados afetos a vinte categorias contendo 10746 datasets em Maio de 2017 com o Eurostat a assumir a lideranccedila destacada em termos de nuacutemero de datasets Os dados satildeo classificados em domiacutenios com o recurso a metadados controlados provenientes de vocabulaacuterios controlados como o EuroVoc64 com a ciecircncia (1906) emprego e condiccedilotildees de trabalho (1795) questotildees sociais (1599) a destacarem-se como os domiacutenios com mais datasets publicados Em termos de formatos de dados os primeiros trecircs lugares satildeo ocupados pelos formatos ZIP (8072) HTML (7024) e texttab-separated-values (6762) O primeiro formato estruturado o XML aparece apenas em quinto lugar com 595 ficheiros seguido do primeiro formato aberto o CSV com apenas 360 (Uniatildeo Europeia 2017) Eacute importante tecer duas consideraccedilotildees sobre os formatos dos datasets disponibilizados O formato ZIP eacute um formato de compressatildeo de documentos e natildeo um formato de documento em si portanto estes 8072 ficheiros deveratildeo ser distribuiacutedos por outros tipos de formatos Em segundo lugar verifica-se uma fraca percentagem de dados a utilizarem formatos estruturados eou abertos que permitam a ligaccedilatildeo com outros dados Este portal apresenta 2663 datasets com ligaccedilatildeo a Portugal em grande parte das categorias de Ciecircncia e do Ambiente (Uniatildeo Europeia 2017)

O Public Sector Information Scoreboard eacute uma ferramenta ldquocrowd sourcedrdquo utilizada para medir o estado da abertura de dados e da PSI da EU Este painel de avaliaccedilatildeo atraveacutes do uso de 27 indicadores mede sete aspetos da reutilizaccedilatildeo da informaccedilatildeo puacuteblica implementaccedilatildeo da Diretiva europeia referente agrave PSI praacuteticas de reuacuteso preccedilo formatos acordos exclusivos informaccedilatildeo puacuteblica local e por fim eventos e atividades (ePSI Scoreboard 2013)

64 O EuroVoc eacute um vocabulaacuterio controlado multilingue e pluridisciplinar sobre as atividades da EU Disponiacutevel na WWW httpeurovoceuropaeudrupalq=pt

77

O Open Data Monitor um projeto financiado pela Comissatildeo Europeia que decorreu entre 2013 e 2015 teve por objetivo a extraccedilatildeo harmonizaccedilatildeo mediccedilatildeo e monitorizaccedilatildeo anaacutelise e visualizaccedilatildeo automaacutetica de metadados dos datasets disponibilizados nos cataacutelogos a niacutevel regional nacional e europeu (Sasse et al 2017) Os datasets ldquoharvested from portals across Europerdquo (Sasse et al 201759) satildeo estudados atraveacutes de meacutetricas quantitativas e qualitativas (Open Data Monitor 2015) A sua plataforma permite que os utilizadores tenham uma visatildeo dos conjuntos de dados e dos 173 cataacutelogos de dados identificados apresentando os resultados em termos do nuacutemero de datasets existentes tamanho de armazenamento a sua disponibilidade a posse de uma licenccedila aberta o uso por maacutequina e por fim a exaustividade dos metadados (Open Data Monitor 2015)

O European Data Portal uma plataforma criada em 2015 pela EU tem por objetivo melhorar a acessibilidade e aumentar o valor dos Dados Abertos abrangendo toda a cadeia de valor desde a publicaccedilatildeo de dados ateacute agrave sua reutilizaccedilatildeo Para isso coleta metadados da PSI disponiacutevel em portais de dados nos paiacuteses europeus incluindo a informaccedilatildeo sobre a disponibilizaccedilatildeo de dados e os benefiacutecios de reutilizaccedilatildeo fornecendo ainda aacutereas dedicadas agrave pesquisa de datasets disponibilizaccedilatildeo de dados uso de dados treino e biblioteca de dados (Carrara et al 2016a Carrara Nieuwenhuis amp Vollers 2016 Sasse et al 2017) O European Data Portal criou o Open Data Maturity para avaliar o desenvolvimento de poliacuteticas nacionais e portais na Europa usando a informaccedilatildeo coletada para elaborar um iacutendice de maturidade das poliacuteticas de Open Data baseado na preparaccedilatildeo poliacutetica e na maturidade do portal de dados (Carrara Nieuwenhuis amp Vollers 2016) Em termos de preparaccedilatildeo poliacutetica eacute avaliada a presenccedila de uma poliacutetica de Dados Abertos especiacutefica normas de licenciamento extensatildeo da coordenaccedilatildeo a niacutevel nacional uso de dados e impacto poliacutetico social e econoacutemico A maturidade dos portais eacute avaliada de acordo com a sua usabilidade a reutilizaccedilatildeo dos dados alojados no portal e inclusatildeo de dados de diferentes domiacutenios Segundo a informaccedilatildeo apurada no relatoacuterio a maioria dos paiacuteses europeus ainda natildeo atingiram a maturidade por completo Em 2016 houve um aumento do nuacutemero de paiacuteses que completaram a sua demanda na abertura de dados sendo agora de 566 entre os 31 avaliados O nuacutemero de paiacuteses com uma poliacutetica de Dados Abertos estabelecida passou de 23 para 28 O uso de dados chegou em 2016 aos 493 e o impacto da abertura de dados aos 463 sendo que a maturidade dos portais estabeleceu-se nos 643 Contudo os paiacuteses necessitam de elevar o reconhecimento poliacutetico sobre os Dados Abertos aumentar os processos automatizados nos seus portais para aumentar a usabilidade e reutilizaccedilatildeo dos dados e tambeacutem organizar mais eventos e treinos para apoiar as iniciativas nacionais e locais (Carrara Nieuwenhuis amp Vollers 2016) O relatoacuterio conclui que os paiacuteses europeus estatildeo a enfrentar barreiras legais financeiras de qualidade de dados e de poliacuteticas sublinhando que os poliacuteticos natildeo conhecem os benefiacutecios da abertura de dados e que por isso os Dados Abertos natildeo satildeo estabelecidos como uma prioridade poliacutetica Satildeo

78

deixadas ainda algumas recomendaccedilotildees para ajudar os paiacuteses a avanccedilar no processo de abertura de dados implementar uma estrateacutegia de Dados Abertos que estimula a criaccedilatildeo de uma poliacutetica adicionar funcionalidades ao portal e melhorar a qualidade dos dados aumentar o reconhecimento sobre os Dados Abertos monitorizar as atividades relacionadas com o Open Data (Carrara Nieuwenhuis amp Vollers 2016)

22 O caso portuguecircs

O primeiro sinal de abertura cientiacutefica eacute dado pelo artigo 50ordm do Decreto-Lei nordm 1152013 de 7 de agosto veio regulamentar a obrigatoriedade da inclusatildeo de trabalhos acadeacutemicos no RCAAP sendo posteriormente reforccedilado com a entrada em vigor da Portaria nordm 2852015 de 15 de setembro que aprova o Regulamento Teacutecnico de Depoacutesito de Teses e Trabalhos de Doutoramento e de Dissertaccedilotildees e Trabalhos de Mestrado Os Dados Abertos entram finalmente na poliacutetica cientiacutefica portuguesa em 2014 A FCT definiu e adotou uma poliacutetica que visa encorajar e promover a disponibilizaccedilatildeo em ldquobases de dados de AA apropriadasrdquo dos dados cientiacuteficos e outros materiais de investigaccedilatildeo criados em projetos financiados pela instituiccedilatildeo (Fundaccedilatildeo para a Ciecircncia e Tecnologia [FCT] 2014) Contudo a poliacutetica da FCT ldquonatildeo estaacute alinhada com os requisitos relativamente aos dados de investigaccedilatildeo do H2020rdquo (Comissatildeo Executiva GT-PNCA 2016)

Os princiacutepios orientadores para uma poliacutetica nacional de Ciecircncia Aberta definidos em fevereiro de 2016 pelo Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior delinearam algumas metas a curto-prazo sendo que na componente dos Dados Abertos apenas se regista a sensibilizaccedilatildeo para a importacircncia da partilha de dados ldquocomo um valor essencial agrave ciecircncia especialmente no que respeita agrave investigaccedilatildeo beneficiaacuteria de financiamento puacuteblicordquo (Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior [MCTES] 20163) Foram tambeacutem definidas metas a atingir ateacute 2018 dentro das quais se destacam as que se referem a dados de investigaccedilatildeo

ldquoCumprimento a 100 da publicaccedilatildeo de dados resultantes de projetos com financiamento puacuteblico num repositoacuterio em acesso abertordquo

Incluir ldquoa verificaccedilatildeo contiacutenua da publicaccedilatildeo de dados e de resultados da investigaccedilatildeo financiada com fundos puacuteblicosrdquo nos modelos de avaliaccedilatildeo da CA

Eliminar o ldquoduplo financiamento de publicaccedilotildeesdados em acesso abertordquo para racionalizar os custos puacuteblicos com ciecircncia

ldquoOferta regular de accedilotildees de formaccedilatildeo e esclarecimento em mateacuteria de publicaccedilatildeo de dados e resultados de investigaccedilatildeo em acesso aberto propriedade intelectual e proteccedilatildeo de dadosrdquo (Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior [MCTES] 2016 20164)

79

O acesso aos dados de investigaccedilatildeo eacute finalmente incluiacutedo na poliacutetica cientiacutefica atraveacutes da Resoluccedilatildeo do Conselho de Ministros nordm 212016 de 11 de abril No acircmbito da definiccedilatildeo de uma poliacutetica de Ciecircncia Aberta eacute incluiacuteda a obrigatoriedade do AA aos ldquodados cientiacuteficos resultantes de investigaccedilatildeo financiada por fundos puacuteblicosrdquo e sua respetiva preservaccedilatildeo ldquopor forma a permitir a sua reutilizaccedilatildeo e o acesso continuadordquo (Resoluccedilatildeo do Conselho de Ministros nordm 212016 2016)

Em dezembro de 2016 foi criado o Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta (GT-PNCA) atraveacutes do Despacho nordm 153892016 cujo objetivo se centra na elaboraccedilatildeo de uma poliacutetica nacional de CA e onde a abertura de dados de investigaccedilatildeo eacute parte integrante A Comissatildeo Executiva do GT-PNCA foi dividida em quatro conjuntos de temas acesso aberto e dados abertos infraestruturas e preservaccedilatildeo digital avaliaccedilatildeo cientiacutefica e responsabilidade social cientiacutefica (Despacho nordm 153892016 de 12 de dezembro do Ministeacuterio das Financcedilas e da Secretaria de Estado da Cultura e Ciecircncia Tecnologia e Ensino Superior 2016)

A abertura de dados cientiacuteficos estaacute ainda numa fase precoce O primeiro relatoacuterio da Comissatildeo Executiva do Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta constatou que em termos de gestatildeo e partilha de dados existem algumas iniciativas e experiecircncias de ldquoacircmbito disciplinar nomeadamente no contexto de projetosrdquo sendo expectaacutevel que o Roteiro Nacional de Infraestruturas de Investigaccedilatildeo de Interesse Estrateacutegico traga ldquoprogressos significativosrdquo (Comissatildeo Executiva GT-PNCA 20167) O mesmo relatoacuterio sublinha que ao niacutevel das instituiccedilotildees de investigaccedilatildeo e de ensino superior as iniciativas de partilha e gestatildeo de dados satildeo quase inexistentes

Em termos de dados de investigaccedilatildeo o ecossistema eacute bem mais concentrado a niacutevel disciplinar e inferior em nuacutemero de e-infraestruturas se comparado com o ecossistema de dados do setor puacuteblico Integrado no projeto RCAAP que visa a agregaccedilatildeo de conteuacutedos cientiacuteficos produzidos no paiacutes surge em 2011 o Serviccedilo de Alojamento de Repositoacuterios de Dados Cientiacuteficos65 (SARDC) uma plataforma de livre acesso que visa agregar os dados de investigaccedilatildeo de instituiccedilotildees nacionais Poreacutem com jaacute cerca de seis anos de existecircncia o SARDC apresenta apenas 2007 datasets em Maio de 2017 que correspondem a 42 categorias de assunto Os conjuntos disponibilizados satildeo provenientes de apenas duas instituiccedilotildees o Arquivo Portuguecircs de Informaccedilatildeo Social (APIS) com 37 e o Instituto Politeacutecnico de Castelo Branco (IPCB) com 1970 conjuntos de dados sendo que o SARDC apenas aloja os dados do APIS Embora exista um espaccedilo atribuiacutedo a mais duas instituiccedilotildees o Laboratoacuterio Nacional de Engenharia Civil e Universidade Catoacutelica Portuguesa nenhuma das entidades publicou ateacute agora dados atraveacutes desta plataforma O portal nacional de dados cientiacuteficos eacute extremamente limitado em termos de funcionalidades permitindo apenas a buscar

65 Disponiacutevel na WWW httpsdadosrcaappt

80

por autor data titulo assunto e tipo de documento Natildeo eacute possiacutevel perceber a legalidade da reutilizaccedilatildeo de dados pois natildeo eacute referido qualquer tipo de licenciamento A qualidade dos dados apresentados pelo SARDC eacute uma incoacutegnita pela falta de indicaccedilatildeo do uso de formatos abertos e estruturados e tambeacutem de um esquema padratildeo de metadados Aleacutem do SARDC os repositoacuterios de dados cientiacuteficos existentes em Portugal satildeo em grande parte do domiacutenio das Ciecircncias da Vida como se poderaacute constatar no Quadro 5 com exceccedilatildeo do Repositoacuterio Cientiacutefico do Instituto Politeacutecnico de Castelo Branco que tem um caraacutecter geral Depois da criaccedilatildeo do repositoacuterio de dados cientiacuteficos e da colocaccedilatildeo em massa de conjuntos de dados verifica-se que o depoacutesito de datasets decresceu de forma extrema

Graacutefico 1 Nuacutemero de datasets publicados no SARDC nos anos seguintes agrave sua criaccedilatildeo Fonte Adaptado de SARDC (2017)

A tendecircncia de abertura de dados cientiacuteficos parece estar ligada agrave cultura disciplinar Algumas disciplinas provenientes das ciecircncias naturais e das ciecircncias exatas possuem jaacute uma estrutura uniformizada de bases de dados onde a partilha e reutilizaccedilatildeo de datasets se encontra mais avanccedilada do que se verifica nas restantes disciplinas cientiacuteficas O Registry of Research Data Repositories (re3data) indexa apenas 2 repositoacuterios de dados cientiacuteficos portugueses o INTEGRALL66 e o KiMoSys67 sendo que ambos pertencem ao ramo da biologia (DataCite 2017a) O Biosharingorg (2017) indexou cinco bases de dados cientiacuteficas com origem em Portugal havendo participaccedilatildeo portuguesa em outras duas bases de dados internacionais Estas pertencem todas ao domiacutenio das Ciecircncias da Vida e da Biologia com exceccedilatildeo de uma conotada com as Ciecircncias da Terra O DataCite68 (2017b) criou um Digital Object Identifier (DOI) para 18632 datasets relacionados com o termo Portugal sendo a grande maioria de autores portugueses e provenientes da Global Biodiversity Information Facility (GBIF) tambeacutem da aacuterea da biologia A GBIF possui um noacute

66 Disponiacutevel na WWW httpintegrallbiouapt 67 Disponiacutevel na WWW httpwwwkimosysorg 68 Os dados obtidos relativamente ao DataCite Pangea e GitHub foram obtidos atraveacutes da inscriccedilatildeo do termo Portugal na caixa de pesquisa de cada repositoacuterio

13

3 1

2 1

2012 2013 2014 2015 2016 0 2 4 6 8

10 12 14

Nordm datasets

81

portuguecircs que aloja 2681051 ocorrecircncias de biodiversidade com Portugal a fornecer de 23 conjuntos de dados que correspondem a 448136 ocorrecircncias (Portal de Dados de Biodiversidade de Portugal 2016) Destaca-se ainda os 2772 datasets sobre Portugal muitos criados por autores portugueses alojados no Pangea (2017) que preserva dados relacionados com as ciecircncias da terra e do ambiente ou o GitHub (2017) que armazena 1324 registos sobre software relacionados com o termo Portugal

Portugal tem um consoacutercio denominado ELIXIR Portugal69 que eacute constituiacutedo por quatro70 instituiccedilotildees de investigaccedilatildeo que satildeo parte da rede nacional de informaccedilatildeo bioloacutegica - BioDatapt71 O ELIXIR Portugal (2015) ldquoaims to provide data tools standards and training in this domain and thus contribute to build an ELIXIR framework that is of added-value to all woody plant based industriesrdquo O BioDatapt fornece acesso a duas bases de dados disciplinares uma ontologia para descrever experiecircncias bioloacutegicas baseadas em plantas 4 softwares e 5 conjuntos de dados

O interesse na abertura de dados de investigaccedilatildeo tem crescido no discurso poliacutetico e cientiacutefico verificando-se jaacute a organizaccedilatildeo de uma conferecircncia de dados de investigaccedilatildeo e CA72 em 2016 e de dois foacuteruns de gestatildeo de dados de investigaccedilatildeo73 o uacuteltimo jaacute em 2017 Estes eventos tecircm a chancela direta do MCTES em coorganizaccedilatildeo com a FCT a Universidade do Minho e FCCN embora esta uacuteltima apenas no caso da conferecircncia Foi lanccedilado na Faculdade de Engenharia da Universidade do Porto o projeto TAIL com o objetivo de otimizar o processo de gestatildeo de dados de investigaccedilatildeo desde a sua produccedilatildeo ateacute ao depoacutesito e partilha Este projeto a decorrer de 2016 ateacute 2019 ldquovai construir um portfoacutelio de exemplos de gestatildeo de dados em diversos domiacutenios que poderatildeo ser usados pelos investigadores para avaliar o esforccedilo requerido e as compensaccedilotildees a obter com esta atividaderdquo (Ribeiro et al 2016256-257) Os resultados seratildeo avaliados atraveacutes da utilizaccedilatildeo da plataforma Dendro ldquodesigned to help researchers use concepts from domain-specific ontologies to collaboratively describe and share datasets within their groupsrdquo (Universidade do Porto Faculdade de Engenharia 2017)

69 Este consoacutercio eacute o noacute portuguecircs de uma organizaccedilatildeo intergovernamental denominada ELIXIR que pretende reunir os recursos europeus relacionados com as ciecircncias da vida Os recursos incluem bases de dados software material de treino armazenamento na nuvem e supercomputadores Disponiacutevel na WWW httpswwwelixir-europeorgabout-us 70 As organizaccedilotildees envolvidas no BioDatapt satildeo Instituto Gulbenkian de Ciecircncia Universidade do Minho Instituto de Biologia Experimental e Tecnoloacutegica e o Instituto de Biotecnologia e Bioengenharia 71 O BioDatapt faz parte do Roteiro das Infraestruturas de Investigaccedilatildeo de Portugal Disponiacutevel na WWW httpswwwfctptapoiosequipamentoroteiro 72 A conferecircncia ldquoDados de investigaccedilatildeo e Ciecircncia Aberta rumo a uma estrateacutegia nacionalrdquo apresentou-se com o objetivo de ldquoestabelecer as linhas orientadoras da estrateacutegia nacional para os dados de investigaccedilatildeordquo Disponiacutevel na WWW httpsconfdadosrcaappt 73 O objetivo dos foacuteruns sobre gestatildeo de dados de investigaccedilatildeo eacute de desenvolver competecircncias teacutecnicas e capitalizar saberes e praacuteticas nos investigadores e comunidade cientiacutefica Disponiacutevel na WWW httpforumgdircaappt2forum

82

O RCAAP publicou em Abril de 2017 um documento de apoio agrave abertura e gestatildeo de dados de investigaccedilatildeo O ldquoKit de Dados de Investigaccedilatildeordquo tem por objetivo prestar apoio e informaccedilatildeo aos ldquogestores de repositoacuterios da comunidade RCAAPrdquo e fornecer ajuda semelhante a ldquoinvestigadores gestores de ciecircncia e outros parceiros envolvidos em atividades de suporte agrave gestatildeo de dados de investigaccedilatildeordquo (Carvalho Furtado Priacutencipe 20175) Este documento seraacute a base da formaccedilatildeo que o RCAAP iraacute disponibilizar fornecendo uma contextualizaccedilatildeo sobre Dados Abertos Big Data preservaccedilatildeo digital e informaccedilatildeo sobre ciclos de gestatildeo de dados planos de gestatildeo de dados direitos de autor licenciamento e privacidade de dados poliacuteticas e diretrizes de abertura de dados de investigaccedilatildeo recursos de apoio e aplicaccedilatildeo nos recursos RCAAP

Os dados do setor puacuteblico tecircm uma contextualizaccedilatildeo legislativa diferenciada daquela que eacute aplicada aos dados de investigaccedilatildeo O direito ao acesso agrave informaccedilatildeo puacuteblica em Portugal foi estabelecido pelo artigo 268ordm da Constituiccedilatildeo de 1976 Poreacutem apenas em 1993 o estado portuguecircs legislou no sentido da abertura dos documentos administrativos com a publicaccedilatildeo da Lei nordm 6593 de 26 de Agosto a Lei do Acesso aos Documentos Administrativos (LADA) posteriormente alterada pelas leis nordm 895 de 29 de Marccedilo e 9499 de 16 de Julho

A evoluccedilatildeo da conjuntura de acesso aos documentos administrativos eacute derivada da imposiccedilatildeo das Diretivas Europeias a que Portugal como membro da EU estaacute obrigado A Lei 462007 de 24 de Agosto viraacute revogar da Lei nordm 6593 e as suas alteraccedilotildees ldquotranspondo para a ordem juriacutedica nacional a Diretiva nordm 200398CE do Parlamento e do Conselho de 17 de Novembro relativa agrave reutilizaccedilatildeo de informaccedilotildees do sector puacuteblicordquo O artigo 24ordm postula a obrigaccedilatildeo das entidades puacuteblicas em publicar documentos administrativos de forma eletroacutenica para que possam ser acedidos e reutilizados O artigo 27ordm nordm 1 vem criar a Comissatildeo de Aceso aos Documentos Administrativos (CADA) ldquouma entidade administrativa independente que funciona junto da Assembleia da Repuacuteblica e tem como fim zelar nos termos da Lei pelo cumprimento das disposiccedilotildees legais referentes ao acesso agrave informaccedilatildeo administrativardquo (Comissatildeo de Acesso aos Documentos Administrativos [CADA])

A Resoluccedilatildeo do Conselho de Ministros nordm 912010 (20105296) veio implementar a Agenda Digital 2015 O ponto 23 da Resoluccedilatildeo no acircmbito da transparecircncia na administraccedilatildeo puacuteblica tinha como objetivo ldquodesenvolver um programa de administraccedilatildeo aberta para a publicaccedilatildeo e agregaccedilatildeo em formatos reutilizaacuteveis da informaccedilatildeo produzida pela Administraccedilatildeo Puacuteblicardquo Eacute neste sentido que eacute proposta a criaccedilatildeo do siacutetio web dadosgovpt ldquopara publicar e agregar a informaccedilatildeo produzida pela Administraccedilatildeo Puacuteblica em formatos que possam ser lidos e reutilizados por qualquer cidadatildeordquo Esta medida teve o intuito de ldquofacilitar o acesso dos cidadatildeos e empresas agrave informaccedilatildeo relevante sobre os serviccedilos puacuteblicos com o desenvolvimento de novas aplicaccedilotildees com valor acrescentadordquo A Lei nordm 362011 de 21 de Junho veio

83

estabelecer a implementaccedilatildeo de normas abertas nos sistemas informaacuteticos do Estado contribuindo assim para a adoccedilatildeo de formatos de dados abertos

Em 2016 a Lei nordm 262016 de 22 de Agosto revogou a Lei 462007 de 24 de Agosto aprovando ldquoo regime de acesso agrave informaccedilatildeo administrativa e ambiental e de reutilizaccedilatildeo dos documentos administrativos transpondo a Diretiva 20034CE do Parlamento Europeu e do Conselho de 28 de janeiro e a Diretiva 200398CE do Parlamento Europeu e do Conselho de 17 de novembrordquo O artigo 3ordm mandata a abertura dos dados ambientais agrave comunidade incluindo-os na definiccedilatildeo de documento administrativo devendo a sua publicaccedilatildeo ser feita num formato aberto e legiacutevel por maacutequina O artigo 10ordm sobre a divulgaccedilatildeo ativa de informaccedilatildeo prevecirc que sejam publicados ldquoos documentos administrativos dados ou listas que os inventariem que entendam disponibilizar livremente para acesso e reutilizaccedilatildeo nos termos da presente lei sem prejuiacutezo do regime legal de proteccedilatildeo de dados pessoaisrdquo Tambeacutem deve ser garantida a abertura da informaccedilatildeo cujo ldquoconhecimento seja relevante para garantir a transparecircncia da atividade relacionada com o seu funcionamentordquo sobretudo ao niacutevel de planos de atividades orccedilamentos relatoacuterios de atividades e contas balanccedilo social e outros instrumentos de gestatildeo similaresrdquo e tambeacutem de despachos normativos internos circulares e orientaccedilotildees que comportem enquadramento estrateacutegico da atividade administrativardquo (Lei nordm 262016 de 22 de Agosto 20162780) O artigo 23ordm apenas prevecirc a reutilizaccedilatildeo dos dados para fins educativos e para fins de investigaccedilatildeo e desenvolvimento deixando de lado a reutilizaccedilatildeo comercial Contudo o dadosgov atribuiu aos dados que aloja a licenccedila CC BY 30 o que natildeo impede a reutilizaccedilatildeo comercial dos dados Eacute tambeacutem impossiacutevel natildeo questionar a razatildeo de natildeo ter sido transposta a nova Diretiva 201337EU que veio revogar precisamente a Diretiva que a Lei nordm 262016 de 22 de Agosto implementa

A AMA (2016) defende que as poliacuteticas de Dados Abertos devem ldquoprivilegiar o interesse e pertinecircncia dos dados para o cidadatildeo em geral ou para setores da sociedade especiacuteficosrdquo Ao niacutevel local apenas Lisboa e Porto parecem ter definido uma poliacutetica de abertura de dados A Carta de Princiacutepios da Politica de Dados Abertos do Municiacutepio de Lisboa tem por objetivo aumentar o envolvimento dos cidadatildeos aumentar a transparecircncia e o desenvolvimento econoacutemico aleacutem da melhoria da eficiecircncia dos serviccedilos A Cacircmara Municipal de Lisboa (CML) (2016) compromete-se a atualizar ldquoanualmente a poliacutetica de disponibilizaccedilatildeo puacuteblica de dados abertos indicando quais os dados a libertar ao longo do ano e em que formatordquo A poliacutetica abrangeraacute todas as unidades orgacircnicas do municiacutepio que produzam dados sendo que a CML incentivaraacute as Juntas de Freguesia e as empresas municipais a publicarem os seus dados A publicaccedilatildeo de todos os dados eacute feita no portal do municiacutepio como ponto de acesso uacutenico estando disponiacuteveis sem qualquer pedido de registo A carta de princiacutepios sublinha que os dados devem ser atualizados legiacuteveis por maacutequina deter uma licenccedila aberta que permita a reutilizaccedilatildeo comercial e ainda respeitar as leis de

84

privacidade e seguranccedila A CML compromete-se a publicar inventaacuterios das coleccedilotildees de dados e a promover a reutilizaccedilatildeo de dados atraveacutes de iniciativas de estiacutemulo ao desenvolvimento de aplicaccedilotildees e participaccedilatildeo puacuteblica (Lisboa Cacircmara Municipal [CML] 2016)

A poliacutetica de Dados Abertos no Porto eacute enquadrada na Agenda Digital para a Europa tendo como visatildeo a ldquodisponibilizaccedilatildeo e uso de dados e informaccedilatildeo do Municiacutepio do Porto contribuindo deste modo para a competitividade do Municiacutepio do Porto e da regiatildeo para visitar para residir captar e realizar negoacutecios no mercado nacional e internacionalrdquo (Porto Cacircmara Municipal)

Utilizando a estrutura de avaliaccedilatildeo de poliacuteticas de Dados Abertos de Zuiderwijk e Janssen (2014) foi elaborado um quadro para avaliar o estado da implementaccedilatildeo da poliacutetica de Dados Abertos em Portugal e o seu impacto Os dados foram recolhidos com base na Lei nordm 262016 de 22 de Agosto na informaccedilatildeo disponiacutevel no portal de dados nacional atraveacutes de um gestor de projeto da AMA Andreacute Lapa e tambeacutem em alguma literatura

85

Quadro 3 Visatildeo geral sobre o contexto conteuacutedo e desempenho da poliacutetica de Dados Abertos em Portugal com base no esquema delineado por Zuiderwijk e Janssen (2014) Aspetos da poliacutetica de Dados Abertos Acircmbito de aplicaccedilatildeo

Conteuacutedo e ambiente da

poliacutetica

Paiacutes Portugal

Niacutevel de organizaccedilatildeo e tipo de missatildeo Poliacutetica nacional de cariz regulamentar que eacute aplicada a entidades governamentais e puacuteblicas (art 4ordm)

Motivaccedilotildees e objetivos Econoacutemica e poliacutetica via EU Facilitar o acesso e reutilizaccedilatildeo da informaccedilatildeo por parte dos cidadatildeos e garantir a transparecircncia da atividade administrativa (art 2ordm)

Lanccedilamento da plataforma de dados Lanccedilamento do portal nacional em 2011

Alocaccedilatildeo de recursos e contexto econoacutemico

Abertura alicerccedilada em duas instituiccedilotildees puacuteblicas a CADA responsaacutevel pelo cumprimento da lei e a AMA que fornece a e-infraestrutura e apoio teacutecnico Os custos de abertura de informaccedilatildeo do setor puacuteblico satildeo financiados pelo Plano Global Estrateacutegico para a racionalizaccedilatildeo de custos com as TIC na Administraccedilatildeo Puacuteblica (OECD 2015)

Legislaccedilatildeo Lei nordm 262016 de 22 de Agosto que transpotildee a Diretiva 200398CE

Contexto poliacutetico e social Cumprimento da Diretiva europeia Disponibilizaccedilatildeo de informaccedilatildeo uacutetil para o cidadatildeo

Aspetos da poliacutetica de Dados Abertos Acircmbito de aplicaccedilatildeo

Conteuacutedo da poliacutetica

Estrateacutegia e princiacutepios de abertura

Cumprimento do princiacutepio da administraccedilatildeo aberta que advoga que o acesso aos dados deve ser feito mediantes princiacutepios de igualdade da proporcionalidade da justiccedila da imparcialidade O acesso deve ser livre e universal bem como a acessibilidade a interoperabilidade a qualidade a integridade e a autenticidade dos dados publicados e ainda a sua identificaccedilatildeo e localizaccedilatildeo (art 2ordm) A publicaccedilatildeo de dados deve ser feita num formato aberto e legiacutevel por maacutequina (art 3ordm)

Medidas e instrumentos poliacuteticos Portal nacional Natildeo satildeo conhecidas meacutetricas de avaliaccedilatildeo nem multas ou recompensas

Processamento de dados antes da publicaccedilatildeo Validaccedilatildeo da integridade das tabelas Natildeo existe verificaccedilatildeo de metadados (Lapa 2017)

Quantidade de dados Abertos 802 Conjuntos de dados no portal nacional Mas a contabilidade eacute bastante mais elevada com a adiccedilatildeo dos dados alojados em outros portais puacuteblicos e privados

Temaacutetica dos Dados Abertos Diversa mas com maior incidecircncia na Economia e Financcedilas

Formas de apresentaccedilatildeo de dados Faacutecil acesso e compreensatildeo

Preccedilo do acesso Gratuito

Grupos-alvo Developers programadores jornalistas de dados investigadores acadeacutemicos administraccedilatildeo puacuteblica (central ou local) empresas e sociedade civil (Lapa 2017)

Padrotildees e formatos teacutecnicos Todos os dados no dadosgov estatildeo disponiacuteveis em pdf csv xlsx e atraveacutes de serviccedilos REST (que inclui formatos como odata JSON ou KML e RDF se aplicaacutevel) (Lapa 2017)

86

Aspetos da poliacutetica de Dados Abertos Acircmbito de aplicaccedilatildeo

Conteuacutedo da poliacutetica (cont)

Fornecimento de metadados Natildeo existe um esquema padratildeo de metadados a ser utilizado sendo que estes tambeacutem natildeo satildeo verificados antes da publicaccedilatildeo dos dados (Lapa 2017)

Tipos de dados natildeo publicados Desconhecido

Apoio teacutecnico para o uso de dados publicados Sim fornecido pela AMA mediante pedido

Promoccedilatildeo ativa da reutilizaccedilatildeo de dados A uacuteltima grande atividade de promoccedilatildeo de reutilizaccedilatildeo Government as a Developer ocorreu em 2014-2015 natildeo se conhecendo para novas atividades previstas (Lapa 2017)

Qualidade dos Dados A uacuteltima mediccedilatildeo data de 2014 onde foram encontrados alguns problemas que natildeo foram totalmente resolvidos junto dos fornecedores (Lapa 2017)

Licenciamento Eacute aplicada a licenccedila CC BY 30 a todos os datasets

Disponibilidade dos dados sem registo Todos os dados no dadosgov estatildeo disponiacuteveis para download sem necessidade de pedido ou registo

Estrutura da relaccedilatildeo entre fornecedores de dados e os utilizadores Limitada

Aspetos da poliacutetica de Dados Abertos Acircmbito de aplicaccedilatildeo

Indicadores de

desempenho

Uso de dados publicados Existem 2 aplicaccedilotildees elaboradas a partir de Dados Abertos disponibilizados pela AMA e Direcccedilatildeo-Geral das Autarquias Locais

Riscos da publicaccedilatildeo de dados Privacidade seguranccedila maacute utilizaccedilatildeo (ainda sem casos reportados) (Lapa 2017)

Benefiacutecios da publicaccedilatildeo de dados Fraco impacto poliacutetico econoacutemico e social segundo o Open Data Barometer O estudo de Gomes e Soares (2014) conclui que a transparecircncia eacute o uacutenico benefiacutecio real

Valor puacuteblico alcanccedilado

Transparecircncia governativa e disponibilidade de dados Faltam indicadores de reutilizaccedilatildeo e estudos de impacto para uma avaliaccedilatildeo concreta do valor alcanccedilado

Fonte Elaboraccedilatildeo proacutepria

87

Em adiccedilatildeo agraves poliacuteticas de abertura de dados puacuteblicos um dos componentes principais do ecossistema de Dados Abertos eacute o desenvolvimento de e-infraestruturas que possam alojar e permitir a livre reutilizaccedilatildeo de dados O PORDATA criado em 2010 foi o primeiro portal de dados abertos em Portugal disponibilizando dados estatiacutesticos sobre os municiacutepios portugueses sobre o paiacutes e sobre a Europa A niacutevel puacuteblico a abertura de dados em Portugal iniciou-se com a abertura do portal de dados puacuteblicos e do portal de dados de investigaccedilatildeo Criado em 2011 depois da sua aprovaccedilatildeo poliacutetica o dadosgov eacute uma responsabilidade da AMA (2016a31) e ldquoeacute o ponto central na estrateacutegia nacional de Dados Abertos constituindo-se como a porta central de acesso online ao repositoacuterio de dados abertos disponibilizados pelas vaacuterias instituiccedilotildeesrdquo puacuteblicas em Portugal Em termos estrateacutegicos o gestor de projeto Andreacute Lapa declara que a AMA jaacute assumiu a necessidade do estabelecimento de uma relaccedilatildeo forte entre portal central e portais sectoriais regionais e locais sendo que a funccedilatildeo do dadosgov deve passar por alojar dados e por apontar para dados existentes noutros portais embora esta uacuteltima ainda natildeo tenha sido implementada (A Lapa comunicaccedilatildeo pessoal 2017) Eacute possiacutevel retirar algumas conclusotildees estatiacutesticas sobre os dados disponibilizados no dadosgov Os 802 conjuntos de dados existentes pertencem a 26 fornecedores de dados diferenciados embora os dados sejam maioritariamente publicados por apenas alguns dos fornecedores com o Instituto Nacional de Estatiacutestica a fornecer metade dos dados disponibilizados como se pode ver no graacutefico seguinte

Graacutefico 2 Maiores fornecedores de dados do portal nacional Fonte AMA (2016b)

Relativamente agrave tipologia dos fornecedores de dados do portal nacional esta apresenta-se concentrada em dois tipos de entidade

328 51

129 20

86 13

38 6 34 5 33 5

Instituto Nacional de Estatiacutestica (INE) Agecircncia Modernizaccedilatildeo Administrativa (AMA) Portal do SNS (Aacuterea da Transparecircncia) Direcccedilatildeo-Geral das Autarquias Locais (DGAL) Fundaccedilatildeo para a Computaccedilatildeo Cientiacutefica Nacional (FCCN) Comissatildeo Nacional de Eleiccediloes (CNE)

88

Graacutefico 3 Tipologia dos fornecedores de dados do portal nacional Fonte AMA (2016b)

Em termos de categorias de dados disponibilizados verifica-se uma maior dispersatildeo embora a Economia e Financcedilas assumam 13 dos dados existentes

Graacutefico 4 Tipologia das categorias de dados do portal nacional Fonte AMA (2016b)

O ecossistema de abertura de dados tem aumentado dentro e fora do espectro poliacutetico Aleacutem do portal nacional de dados puacuteblicos um grande nuacutemero de organizaccedilotildees puacuteblicas tem criado os seus portais de dados eou tem publicado os mesmos no dadosgov Por outro lado existem vaacuterios portais de dados com origem na sociedade civil com o selo da Transparecircncia Hackday Portugal74 Organizar eventos eacute

74 Transparecircncia Hackday Portugal eacute um movimento que nasceu no Porto e rdquose define como um grupo de trabalho entusiasmado com informaccedilatildeo puacuteblica dados abertos e as interaccedilotildees possiacuteveis entre

468 59

21 3

300 38 Entidades puacuteblicas Corpos de supervisatildeo

Municipalidades

Entidades governamentais

281 36

102 13 86 11 67 9

60 8 58 7

51 6

34 4 24 3 12 2

10 1 2 0

2 0

Economia e Financcedilas

Governo Eleiccedilotildees e Assuntos Parlamentares Sauacutede

Estatiacutesticas Gerais

Educaccedilatildeo Ciecircncia e Tecnologia

Administraccedilatildeo Local

Outras

Emprego e Seguranccedila Social

Justiccedila e Tribunais

Ambiente Geografia e Ordenamento Transportes Infra-estruturas e Telecomunicaccedilotildees Agricultura e Pescas

Cultura

89

uma forma de promover o reconhecimento nacional sobre a abertura de dados entre organizaccedilotildees e cidadatildeos (Carrara Nieuwenhuis amp Vollers 2016) Em Portugal tecircm existido diversas iniciativas a este niacutevel hackathons como o Date with Data organizados pela Transparecircncia Hackday Portugal e com o apoio da Open Knowledge Portugal com o intuito de alertar informar e formar a comunidade para este novo paradigma na disponibilizaccedilatildeo da informaccedilatildeo A Open Knowledge Portugal organiza em Lisboa o Lisbon Open Data Maker Night75 tendo em 2017 decorrido a terceira ediccedilatildeo A Porto Digital estaacute a organizar um hackathon76 sobre utilizaccedilatildeo de dados abertos no desenvolvimento de novas aplicaccedilotildees que ocorreraacute em Julho de 2017

Verifica-se tambeacutem que as entidades governamentais estatildeo a apostar na criaccedilatildeo de linhas de orientaccedilatildeo para abertura e gestatildeo de dados puacuteblicos A AMA criou em 2016 um guia de Dados Abertos para apoiar a abertura dos dados puacuteblicos O guia centra-se em quatro eixos

Definiccedilatildeo de Dados Abertos e enunciaccedilatildeo dos seus benefiacutecios bem como as questotildees de privacidade

Potencial dos Dados Abertos a niacutevel econoacutemico e no aumento da transparecircncia e da participaccedilatildeo ciacutevica

Estrateacutegia de abertura que aborda o planeamento escolha de dados tipos de utilizadores dados prioritaacuterios disponibilizaccedilatildeo de dados estrateacutegias de divulgaccedilatildeo e manutenccedilatildeo de dados

Princiacutepios que possibilitem a reutilizaccedilatildeo de dados como os formatos e as licenccedilas abertas aleacutem da forma de as escolher e publicar a estrutura de dados e metadados (AMA 2016a traduccedilatildeo livre)

A AMA assume a publicaccedilatildeo de dados como um compromisso com o cidadatildeo devendo a publicaccedilatildeo ser orientada por princiacutepios que potenciem a reutilizaccedilatildeo dos dados A disponibilizaccedilatildeo de dados deve abranger conjuntos de dados constantes ou sem continuidade regular e conjuntos de dados em seacuterie ou seja com continuidade temporal A relevacircncia dos dados eacute justificada quando ldquotem potencial para ser explorado por um grande nuacutemero de utilizadores ou quando o benefiacutecio potencial da sua utilizaccedilatildeo eacute elevadordquo (AMA 2016a20)

As duas principais cidades portuguesas Lisboa e Porto tecircm abordagens distintas relativamente agraves suas estrateacutegias de abertura de dados Lisboa possui uma parceria com a AMA e disponibiliza no seu portal77 ldquodatasets sobre a cidade nas mais diversas aacutereas de modo a potenciar a sua utilizaccedilatildeo em trabalhos de investigaccedilatildeo ou no tecnologia e cidadaniardquo O Transparecircncia Hackday Portugal estaacute envolvido em vaacuterios projetos de abertura de dados entre os quais se destacam a Central de Dados e a Democratica Disponiacutevel na WWW httpwwwtransparenciahackdayorgacerca 75 Disponiacutevel na WWW httpflipsideorgnotesopen-data-maker-night-III 76 Disponiacutevel na WWW httpshackacityeuporto 77 Disponiacutevel na WWW httpdadosabertoscm-lisboapt

90

desenvolvimento de aplicaccedilotildees informaacuteticasrdquo (Soares Baptista e Lima 201517) Os dados disponibilizados no portal ldquosatildeo produzidos no acircmbito de sistemas de informaccedilatildeordquo que pertencem a diversos organismos registando-se jaacute diversas aplicaccedilotildees78 que utilizam esses dados para criar valor para o cidadatildeo e visitante de Lisboa na aacuterea do turismo ambiente urbanismo (Soares Baptista e Lima 201518) Lisboa implementou tambeacutem o programa Smart Open Lisboa que visa dar apoio a start ups na validaccedilatildeo de ldquosolutions using real data in a live environment and work directly with your potential customers or partnersrdquo O apoio eacute dirigido a soluccedilotildees na aacuterea da mobilidade envolvimento dos cidadatildeos turismo cultura e sustentabilidade (Lisboa Cacircmara Municipal 2016) A estrateacutegia do Porto passa pela promoccedilatildeo de conjuntos de Application Programming Interface (API)79 permitindo a disponibilizaccedilatildeo de alguns serviccedilos na web como a disponibilizaccedilatildeo de ldquoconteuacutedos dos Portal de Turismordquo ou do BDRT80 entre outros que indica pontos de interesse na cidade A abertura de dados eacute centrada na ldquodimensatildeo turismo e negligencia pelo menos aparentemente as restantesrdquo (Soares Baptista e Lima 201518) Esta conclusatildeo pode ser reforccedilada com a anaacutelise do portal de dados do Porto onde apenas constam cinco conjuntos de dados sendo estes pertencentes ao turismo ou relacionados numa perspetiva de visita ou mudanccedila como enuncia a estrateacutegia de abertura de dados publicada pelo municiacutepio

O Porto Lisboa Fundatildeo Palmela Penela e Aacutegueda estatildeo entre as cidades que integram o Open and Agile Smart Cities (OASC) (2017) uma iniciativa com o objetivo de desenvolver mercados para as cidades inteligentes baseados nas necessidades das cidades e das comunidades O Porto eacute destaque nesta iniciativa pela utilizaccedilatildeo da tecnologia FIWARE81 que ajuda a melhorar o uso de dados abertos e a partilha conhecimentos e tecnologias entre cidades A FIWARE (2015) sintetizou o impacto da abertura de dados em tempo real no Porto ldquoImagine walking or driving through a city and the city itself tells you which trendy spots to check out where to park your car in that moment or which areas to avoid because of air quality or traffic congestionrdquo Na realidade a cidade do Porto jaacute consegue comunicar com os residentes turistas ou empresas que utilizem ldquoFIWARE standards and the UrbanSense platform82rdquo

A publicaccedilatildeo de Dados Abertos e a respetiva mediccedilatildeo de impacto podem ser avaliadas atraveacutes das vaacuterias iniciativas que visam medir o estado de abertura de dados 78 As aplicaccedilotildees referidas satildeo SPOT in Lisbon Lisboa Verde Lisboa NAV e Lisboa 360 79 De acordo com a Wikipeacutedia uma API eacute um conjunto de definiccedilotildees protocolos e ferramentas para construir aplicaccedilotildees de software Disponiacutevel em httpsenwikipediaorgwikiApplication_programming_interface 80 Disponiacutevel na WWW httpbdrtcm-portoptpt 81 A missatildeo da FIWARE eacute construir um ldquosustainable ecosystem around public royalty-free and implementation-driven software platform standards that will ease the development of new Smart Applications in multiple sectorsrdquo Disponiacutevel na WWW httpswwwfiwareorgabout-us 82 A plataforma Urbansense estaacute integrada no projeto futurecitiesup da Universidade do Porto sendo uma plataforma para a monitorizaccedilatildeo ambiental nas cidades composta por 20 unidades que coletam dados em pontos relevantes da cidade Disponiacutevel na WWW httpfuturecitiesupptsitehybrid-sensor-networking-testbed

91

algumas das quais jaacute mencionadas permitindo assim retirar conclusotildees especiacuteficas quanto ao estado dos Dados Abertos em Portugal A anaacutelise feita por Soares Baptista e Lima (2015) sobre a abertura de dados em quatro cidades do norte do paiacutes Braga Barcelos Guimaratildees e Vila Nova de Famalicatildeo concluiu que a disponibilizaccedilatildeo de dados ao niacutevel local eacute feita apenas ao niacutevel de ldquocontratos municipais orccedilamento anual gastos resultados eleitorais qualidade do ar horaacuterios de transporte orccedilamento participativo e lista de empresasrdquo A abertura de dados destas categorias eacute feita com a ajuda da ldquoadministraccedilatildeo central e algumas instituiccedilotildees transversais ao territoacuteriordquo sendo que existem aacutereas onde nenhum dos municiacutepios analisados possuiu Dados Abertos como os ldquotransportes em tempo real instalaccedilotildees puacuteblicas estatiacutesticas criminais seguranccedila e higiene alimentar acidentes de tracircnsito permissotildees de construccedilatildeo requisiccedilotildees de serviccedilos e licenccedilas comerciaisrdquo (Soares Baptista e Lima 201522) O estudo revela ainda que as cidades analisadas tecircm a maior taxa de abertura no Open Data Census pelo facto de serem a uacutenicas onde a informaccedilatildeo estaacute completa pois os resultados obtidos no estudo foram registados no censo

O Portal da Transparecircncia Municipal eacute uma ferramenta que permite avaliar vaacuterios indicadores da governaccedilatildeo dos municiacutepios portugueses com o recurso agrave disponibilizaccedilatildeo de dados estatiacutesticos Os indicadores abordam a gestatildeo financeira e administrativa decisotildees fiscais dinacircmica econoacutemica do municiacutepio serviccedilos municipais e participaccedilatildeo eleitoral autaacuterquica (Portugal Governo 2017) Contudo a disponibilidade de dados em cada indicador natildeo eacute totalmente uniforme em termos temporais e registam-se algumas falhas de coleta ou cedecircncia de dados

O Open Data Census83 responsabilidade da OKI coleta informaccedilatildeo sobre a performance de cada paiacutes e respetivas cidades em termos de abertura de dados acessibilidade disponibilidade licenciamento processamento por maacutequina e transparecircncia Existem dados de 2014 para Portugal com um total de 178 datasets provenientes de 51 cidades distribuiacutedos por aacutereas como a qualidade do ar transportes orccedilamentos contratos puacuteblicos despesas e eleiccedilotildees sendo Braga e Guimaratildees as cidades mais abertas Contudo apenas um desses conjuntos de dados possui a totalidade da abertura desejada (OKI 2014) Para 2015 e 2016 natildeo satildeo apresentados resultados relativos agrave abertura de dados nas cidades portuguesas

O Global Open Data Index eacute um iacutendice que mede o estado de abertura dos dados governamentais ao niacutevel global Este iacutendice coleta informaccedilatildeo sobre a abertura dos dados governamentais desde 2013 ano em que Portugal se encontrava no 16ordm lugar em 60 paiacuteses com uma taxa de abertura84 calculada em 56 Em 2014 Portugal desce

83 Disponiacutevel na WWW httpcensusokfnorgenlatest 84 O Global Open Data Index considera 9 criteacuterios na sua avaliaccedilatildeo para os dados serem denominados totalmente abertos Licenccedila aberta dados em formatos que sejam processaacuteveis por maacutequinas acesso sem custos disponibilidade do dataset completa para download disponibilizaccedilatildeo de forma raacutepida e

92

para o 36ordm lugar em 97 paiacuteses registando uma taxa de abertura para 47 Em 2015 nova descida do paiacutes no ranking ateacute ao 54ordm lugar num total de 122 paiacuteses com uma taxa de abertura estimada em 34 Para o ano de 2016 as categorias das estatiacutesticas nacionais limites administrativos e aquisiccedilotildees possuem a taxa de abertura mais elevada apenas indicando como falha o licenciamento mas que implica que nenhum dos datasets seja verdadeiramente aberto A taxa de abertura calculada situa-se agora nos 37 com Portugal a subir para 46ordm lugar (OKI 2017)

O Public Sector Information Scoreboard coloca Portugal em 25ordm lugar num total de 31 paiacuteses pontuados sendo alguns destes resultados obtidos com base na LADA cuja uacuteltima revisatildeo data de 1999 Este painel de avaliaccedilatildeo destaca pela positiva as praacuteticas de reutilizaccedilatildeo os formatos os acordos exclusivos e os eventos e atividades Pela negativa destaca a publicaccedilatildeo de informaccedilatildeo puacuteblica local a natildeo implementaccedilatildeo da Diretiva europeia (ePSI Scoreboard 2013) o que natildeo corresponde agrave realidade pois a Lei nordm 462007 de 24 de agosto entretanto revogada pela Lei nordm 262016 de 22 de agosto transpocircs para a ordem juriacutedica nacional a Diretiva nordm 200398CE

O Open Data Barometer coloca Portugal em 2016 no 34ordm lugar do ranking entre 92 paiacuteses caindo trecircs posiccedilotildees relativamente a 2015 Destaca-se pela positiva a prontidatildeo da publicaccedilatildeo de dados com 58 e pela negativa o impacto poliacutetico econoacutemico e social da abertura com apenas 16 com uma meacutedia total de 42 de abertura Eacute assinalada a maior abertura de dados geograacuteficos censos transportes puacuteblicos comeacutercio internacional desempenho do setor da sauacutede estatiacutesticas sobre educaccedilatildeo crimes ambiente e informaccedilatildeo sobre contratos puacuteblicos No sentido oposto a posse de terras informaccedilatildeo orccedilamental e gastos governamentais o registo de empresas legislaccedilatildeo e resultados de eleiccedilotildees satildeo apontados como os dados com menos abertura (World Wide Web Foundation 2017)

O Open Data Maturity divide os paiacuteses em vaacuterios segmentos liacutederes seguidores raacutepidos seguidores e iniciantes Portugal encontra-se no grupo dos seguidores o que indicia o desenvolvimento de uma poliacutetica baacutesica de Dados Abertos e um portal com funcionalidades avanccediladas O impacto da abertura de dados eacute baixo verificando-se apenas resultados positivos na transparecircncia e eficiecircncia poliacutetica Ao niacutevel social eacute denotado um baixo impacto praticamente nulo na sustentabilidade ambiental e na inclusatildeo de grupos marginalizados A niacutevel econoacutemico apenas a aplicaccedilatildeo do modelo de custo marginal para a abertura de dados merece destaque Em termos de preparaccedilatildeo para a abertura de dados Portugal desce de pontuaccedilatildeo em relaccedilatildeo a 2015 o que eacute explicado pela fase de transiccedilatildeo para uma nova estrateacutegia de Dados Abertos Jaacute a maturidade do portal nacional cresceu mais de 20 em 2016 rondando agora os 70 Segundo os dados recolhidos pelo Open Data Maturity o uso de Dados Abertos

imediata disponibilidade dos dados sem conexatildeo agrave internet disponibilizaccedilatildeo dos dados em formato digital disponibilidade puacuteblica dos dados e por fim a confirmaccedilatildeo da existecircncia dos dados

93

em 2016 em Portugal decaiu ligeiramente em relaccedilatildeo ao ano anterior rondando os 35 O estudo indica que o paiacutes natildeo tem uma poliacutetica de Dados Abertos e que apenas vai transpor a Diretiva europeia em 2016 apesar de jaacute o ter feito na Lei nordm 462007 de 24 de agosto sendo mencionado que a estrateacutegia a 5 anos estaacute a ser revista (Carrara Nieuwenhuis amp Vollers 2016) O Open Data Maturity aponta diversas barreiras em termos de publicaccedilatildeo de dados como a falta de apoio politico para a abertura de dados valiosos e relevantes a falta de recursos humanos teacutecnicos e financeiros e falta de conhecimentos relativos a padrotildees e boas praacuteticas de partilha de dados puacuteblicos O relatoacuterio afirma que ldquosome countries have a policy framework that does not necessarily require them to add a specific licence per data setrdquo apontando Portugal entre outros paiacuteses como exemplo (Carrara Nieuwenhuis amp Vollers 201624) Contudo a consulta dos avisos legais do portal dadosgov indica que todos os conjuntos de dados disponibilizados possuem uma licenccedila aberta Creative Commons Atribuiccedilatildeo 30 Portugal (CC-BY) (AMA 2016b)

O projeto Open Data Inventory (ODIN) monitoriza o progresso das poliacuteticas de abertura dos dados puacuteblicos medindo o seu sucesso e impacto e fornece suporte agrave implementaccedilatildeo de sistemas de dados Fruto deste acompanhamento o ODIN desenvolveu um ranking global com vista a avaliar a cobertura da abertura de dados e a abertura em si De acordo com os resultados de 2016 Portugal situa-se em 15ordm lugar entre os 173 paiacuteses cujas poliacuteticas de abertura de dados puacuteblicos foram avaliadas com uma cobertura de 58 e abertura de 75 perfazendo um total calculado de 67 Este ranking foi obtido depois da avaliaccedilatildeo da abertura de estatiacutesticas sociais (62) econoacutemicas (70) e ambientais (69) retirados do siacutetio web do Instituto Nacional de Estatiacutestica (INE) (Open Data Watch 2016)

Uma iniciativa de avaliaccedilatildeo dos programas de abertura da informaccedilatildeo do setor puacuteblico da OECD (2015b) fornece informaccedilatildeo uacutetil relativa ao estado dos Dados Abertos em Portugal Segundo esta organizaccedilatildeo os custos de abertura de informaccedilatildeo do setor puacuteblico satildeo financiados como parte do Plano Global Estrateacutegico para a racionalizaccedilatildeo de custos com tecnologias de informaccedilatildeo e comunicaccedilatildeo na Administraccedilatildeo Puacuteblica A legibilidade de dados por maacutequina eacute apontada como uma falha na avaliaccedilatildeo teacutecnica da abertura embora Andreacute Lapa da AMA tenha confirmado que todos os dados existentes no portal dadosgov tecircm essa caracteriacutestica (A Lapa comunicaccedilatildeo pessoal 27 Marccedilo 2017) Os resultados satildeo muitos positivos em termos de formatos abertos com a totalidade dos dados a deter esse estatuto e tambeacutem na interoperabilidade onde a OECD indica que esta caracteriacutestica teacutecnica iraacute ser implementada como obrigatoacuteria A niacutevel de licenciamento em Portugal eacute atribuiacuteda a Licenccedila CC BY 30 agrave totalidade de dados alojados no portal nacional (OECD 2015b AMA 2016b)

Referindo-se a dados de 2015 o portal do Open Data Monitor indica que apenas foi indexado um portal de dados em Portugal com um total de 656 datasets disponiacuteveis

94

sem contudo indicar qual Em termos de resultados apurados eacute indicado que Portugal apenas cumpre no capiacutetulo da exaustividade (50) tendo os campos da disponibilidade uso por maacutequina e do licenciamento aberto com uma percentagem de 0 o que explicaraacute os 13 de qualidade global atribuiacutedos pelo Open Data Monitor

Em Maio de 2017 o cataacutelogo do European Data Portal oferece o acesso a um total 633680 datasets provenientes de 34 paiacuteses europeus Portugal ocupa o 18ordm lugar com um total de 1635 conjuntos de dados disponibilizados oriundos dos trecircs portais indexados o dadosgovpt o portal do Sistema Nacional de Informaccedilatildeo de Ambiente (SNIAmb) e o Lisboa Aberta (European Data Portal 2017) Verifica-se uma discrepacircncia entre o nuacutemero de datasets disponibilizados no cataacutelogo do European Data Portal e o nuacutemero real existente nos cataacutelogos dos portais mencionados O portal dadosgovpt apresenta 802 conjuntos de dados no cataacutelogo (AMA 2016) enquanto o European Data Portal assinala 832 datasets O SNIAmb regista um total de 1991 datasets (Agecircncia Portuguesa do Ambiente 2017) contra os 439 indexados pelo European Data Portal Apenas os nuacutemeros referentes ao portal Lisboa Aberta satildeo coincidentes com o registo de 364 conjuntos de dados (Lisboa Cacircmara Municipal 2017)

Num estudo comparativo de seis iniciativas do norte e do sul da Europa Gomes e Soares (2014) analisaram diversos indicadores relativos aos portais de dados nacionais como o cumprimento dos princiacutepios de abertura de dados governamentais o niacutevel de atividade do portal e os benefiacutecios observaacuteveis da abertura de dados Segundo este estudo o portal portuguecircs tem nota eacute positiva no cumprimento dos princiacutepios de abertura A anaacutelise da atividade do portal eacute negativa com a atividade dos visitantes o desenvolvimento de aplicaccedilotildees a atividade geradora de novo conhecimento e a utilizaccedilatildeo de recursos do portal a serem classificadas como pobres Neste indicador apenas a atividade dos fornecedores no portal eacute satisfatoacuteria Em termos de benefiacutecios observaacuteveis da abertura de dados governamentais o estudo apenas regista bons niacuteveis de transparecircncia governativa enquanto a participaccedilatildeo puacuteblica a inovaccedilatildeo e o empreendedorismo e a eficiecircncia governativas natildeo revelam impactos satisfatoacuterios

Portugal possui ainda o Iacutendice de Transparecircncia Municipal (ITM) (2016) que mede o grau de transparecircncia das Cacircmaras Municipais atraveacutes de uma anaacutelise da informaccedilatildeo disponibilizada nas suas paacuteginas web O ITM eacute composto por 76 indicadores divididos em sete dimensotildees85 contudo este iacutendice eacute baseado no tipo de dados disponibilizados e natildeo em que contexto de abertura estes foram publicados

O cruzamento da informaccedilatildeo obtida atraveacutes das vaacuterias iniciativas de avaliaccedilatildeo da abertura de dados permite inferir algumas conclusotildees e revelar algumas disparidades

85 As dimensotildees satildeo Informaccedilatildeo sobre a Organizaccedilatildeo Composiccedilatildeo Social e Funcionamento do Municiacutepio Planos e Relatoacuterios Impostos Taxas Tarifas Preccedilos e Regulamentos Relaccedilatildeo com a Sociedade Contrataccedilatildeo Puacuteblica Transparecircncia Econoacutemico-Financeira Transparecircncia na aacuterea do Urbanismo Disponiacutevel na WWW httpstransparenciaptprojetosindice-de-transparencia-municipal

95

O Open Data Barometer e o Open Data Maturity apontam o baixo impacto econoacutemico e social da abertura de dados em Portugal Gomes e Soares (2014) concluem que o problema em Portugal natildeo eacute quantidade de dados disponibilizados mas sim a quantidade de dados que satildeo reutilizados e como satildeo reutilizados O Public Sector Information Scoreboard e o Open Data Maturity afirmam que Portugal natildeo possui uma poliacutetica de Dados Abertos o que como vimos natildeo corresponde agrave verdade Entre as vaacuterias iniciativas de avaliaccedilatildeo do estado de abertura de dados apenas trecircs publicaram informaccedilatildeo relativa a 2016

Quadro 4 Comparaccedilatildeo dos resultados de abertura de dados atribuiacutedos pelas vaacuterias iniciativas de avaliaccedilatildeo Iniciativa Ranking Taxa de Abertura

Global Open Data Index 46ordm122 Paiacuteses 37

Open Data Barometer

34ordm114 Paiacuteses 42

Open Data Inventory 15ordm173 Paiacuteses 67

Fonte Elaboraccedilatildeo proacutepria

Apesar da equivalecircncia de ranking e taxa de abertura entre duas das iniciativas eacute redundante inferir qualquer conclusatildeo dado que estas natildeo medem o mesmo nuacutemero paracircmetros nem estes coincidem na maioria dos casos O Open Data Inventory refere-se a dados avaliados apenas do portal do INE para calcular a sua taxa de abertura pelo que tambeacutem deve ser relativizado

Como pontos positivos satildeo apontados a abertura de dados de diferentes domiacutenios o fato de todos os dados disponibilizados no portal estarem num formato processaacutevel por maacutequina (Carrara Nieuwenhuis amp Vollers 2016) ao contraacuterio do que afirma a OECD (2015b) e o Open Data Inventory Apesar de a AMA natildeo deter dados concretos do impacto da reutilizaccedilatildeo de dados existentes no dadosgov existem pelo menos 2 aplicaccedilotildees Mapa do Cidadatildeo e Portal da Transparecircncia Municipal que utilizam dados do portal como fonte da informaccedilatildeo que disponibilizam (Lapa 2017) O Open Data Goldbook for Data Holders and Data Managers faz referecircncia a Portugal como um exemplo de boas praacuteticas ao niacutevel da abertura dos dados governamentais destacando a aplicaccedilatildeo moacutevel e a plataforma online86 da AMA que permite aos cidadatildeos aceder a um mapa que conteacutem a localizaccedilatildeo de todos os serviccedilos puacuteblicos (Carrara et al 2016a) A Infraestrutura de Dados Espaciais do Algarve disponibiliza atraveacutes do seu portal acesso a quatro aplicaccedilotildees87 que reutilizam Dados Abertos para fornecer informaccedilatildeo de acircmbito regional os cidadatildeos

86 Disponiacutevel na WWW httpswwwmapadocidadaopt 87 As aplicaccedilotildees satildeo ldquoSiacutetios Lugares e Ruasrdquo ldquoCarta Regional de Equipamentordquo ldquoReserva Ecoloacutegica Nacionalrdquo e ldquoPlanos Municipais de Ordenamento de Territoacuteriordquo Disponiacutevel na WWW httpidealgccdr-algptaplicacoesaspx

96

Relativamente agrave usabilidade do portal o Open Data Maturity refere que natildeo eacute possiacutevel contribuir para o portal o que parece natildeo corresponder agrave realidade Citando Andreacute Lapa da AMA organizaccedilatildeo responsaacutevel pelo portal nacional existem fornecedores com acesso direto ao backoffice e que publicam os seus dados (Lapa 2017) embora o mesmo natildeo se verifique relativamente aos cidadatildeos O Open Data Maturity avalia tambeacutem a usabilidade de dados referindo que natildeo eacute possiacutevel saber a maioria dos formatos dos ficheiros existentes no portal nacional Recorrendo agrave informaccedilatildeo disponibilizada por Lapa (2017) todos os dados no dadosgov estatildeo disponiacuteveis em pdf csv xlsx e atraveacutes de serviccedilos REST incluindo assim formatos como odata JSON ou KML e RDF se aplicaacutevel A disponibilizaccedilatildeo dos formatos enunciados garante que todos os dados que o portal disponibiliza cumprem pelo menos as 3 estrelas da classificaccedilatildeo de Tim Berners-Lee (Lapa 2017) O Open Data Maturity afirma ainda que natildeo existe uma licenccedila atribuiacuteda contudo a AMA (2016b) enuncia que todos os seus dados estatildeo disponiacuteveis com uma licenccedila CC BY 30 O portal dadosgov possui algumas funcionalidades como a disponibilizaccedilatildeo de uma API que permite efetuar consultas baacutesicas relativas ao cataacutelogo de dados e tem capacidades de coleta automatizada para o caso dos dados disponibilizados atraveacutes de web services sendo que os restantes satildeo atualizados de forma manual (Lapa 2017)

Em Maio de 2017 contabilizam-se 60 portais de dados abertos em Portugal distribuiacutedos por uma variada gama de aacutereas Foi elaborado um quadro com dados recolhidos atraveacutes desses portais para tentar identificar as e-infraestruturas que disponibilizam Dados Abertos que cumprem os requisitos inscritos na Open Definition nomeadamente em termos de licenccedila legibilidade por maacutequina esquema de metadados padratildeo e formatos abertos Todos os conjuntos de dados tecircm acesso gratuito atraveacutes da web razatildeo pela qual esse requisito natildeo foi incluiacutedo no quadro de avaliaccedilatildeo Atraveacutes deste quadro foi possiacutevel retirar algumas conclusotildees Existem apenas 11 portais de dados de investigaccedilatildeo com os restantes 49 a conter dados do setor puacuteblico Os dados estatiacutesticos satildeo os grandes dominadores do panorama nacional com 13 siacutetios web seguidos dos dados econoacutemicos com 6 Dos 60 portais analisados apenas 33 disponibilizam dados legiacuteveis por maacutequina sendo que alguns portais natildeo o fazem totalmente Apenas 16 portais indicam usar uma licenccedila aberta que permita a livre reutilizaccedilatildeo dos dados e apenas 3 fornecem a indicaccedilatildeo do padratildeo de metadados usado embora alguns dos portais pareccedilam usar um esquema proacuteprio de descriccedilatildeo de datasets Existem 17 portais que fornecem dados em formatos estruturados e 17 portais que natildeo utilizam formatos abertos ou natildeo indicam sequer o tipo de formato

97

Quadro 5 Portais de dados abertos existentes em Portugal

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Repositoacuterio de dados cientiacuteficos

RCAAP FCTFCCN Acadeacutemico 2007 IPCB ndash CC BY-NC APIS ndash CC BY 30 Sim Sem indicaccedilatildeo

IPCB ndash XLS APIS - PDF XML SAV

Repositoacuterio Cientiacutefico do Instituto Politeacutecnico de

Castelo Branco

IPCB Acadeacutemico 1970 CC BY-NC Sim Sem indicaccedilatildeo XLS

Qualidade da aacutegua da Albufeira do Roxo na

dinacircmica dos solos e das culturas agriacutecolas

Assoc Benefic do Roxo Inst

Politeacutecnico de Beja Univ Eacutevora

Agricultura Recursos Hiacutedricos

10 Sem licenccedila especiacutefica Sim ISO-19139

Metadata CSV KML Shapefile

Portal de dados da biodiversidade de Portugal

Instituto Superior de Agronomia

Biologia 23 CC BY 30 CC BY-NC 30

Sem indicaccedilatildeo

Esquema proacuteprio Sem indicaccedilatildeo

Biodatapt ELIXIR Portugal Biologia 5 Sem indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo Vaacuterios

Yeastract Inst Superior Teacutecnico - Lisboa

Ciecircncias da Vida Biologia

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

Cork Oak DB Instituto

Gulbenkian de Ciecircncia

Ciecircncias da Vida Biologia

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo HTML

Mitobreak Universidade do Porto

Ciecircncias da Vida Biologia

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

Haeckaliens Instituto

Gulbenkian de Ciecircncia

Ciecircncias da Vida Biologia

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Vaacuterios

Integrall Univ Aveiro Ciecircncias da Vida Biologia 8843 Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

Kymosys INESC-ID Lisboa Ciecircncias da Vida Biologia 42 CC BY 40 Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

98

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Geodados CM Lisboa Informaccedilatildeo Geograacutefica 257 PDDL Sim Esquema

proacuteprio CSV KLM

iGEO APA DGTerritoacuterio Informaccedilatildeo Geograacutefica 99 Sem indicaccedilatildeo Sem

indicaccedilatildeo Esquema proacuteprio HTML

IDEAlg CCDR Algarve Informaccedilatildeo Geograacutefica

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

Mapa de Obras ndash Portal do Muniacutecipe De Vila do Bispo

CM Vila do Bispo Autaacuterquico Informaccedilatildeo geograacutefica Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Aplicaccedilatildeo web

Portal de Dados Abertos do Porto

CM Porto Autaacuterquico 5 CC BY Sim Esquema proacuteprio SHP XLS

Lisboa Aberta CM Lisboa Autaacuterquico 365 CC0 e CC BY Sim (natildeo a 100)

Esquema proacuteprio

Diversos a maioria satildeo estruturados

Dados Abertos Aacutegueda CM Aacutegueda Autaacuterquico 47 CC0 CC BY-SA e CC BY

Sim (natildeo a 100)

Esquema proacuteprio

Diversosnem todos satildeo estruturados

SNIAmb APA Ambiente 1991 Sem indicaccedilatildeo Sim Esquema proacuteprio XML

SNIRH APA Ambiente

Recursos Hiacutedricos

7210 Resultados Sem indicaccedilatildeo Sim Sem indicaccedilatildeo CSV TSV

DadosGov AMA Agregador de Dados 802 CC BY 30 Sim Esquema

proacuteprio Diversos a maioria satildeo estruturados

Dados Abertos BNP Biblioteca Nacional Bibliograacutefico 12 CC0 10 Sim UNIMARC

Dublin Core Mods

RDF XML RDF TURTLE e Dublin Core XML

Simplex + - Dados Abertos AMA Burocraacutetico

Serviccedilos Puacuteblicos

1

Sem licenccedila especiacutefica autoriza

a reproduccedilatildeo de conteuacutedos

Sim Sem indicaccedilatildeo JSON

Mapa do Cidadatildeo AMA Burocraacutetico

Serviccedilos Puacuteblicos

Informaccedilatildeo geograacutefica Sem indicaccedilatildeo Sim Sem indicaccedilatildeo Aplicaccedilatildeo web e

moacutevel

99

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Instituto Nacional de Estatiacutestica

INE Estatiacutesticas Nacionais 8340

CC BY 30 (nos dados existentes no

dadosgov) Sim Esquema

proacuteprio XLS CSV

Estatiacutesticas Cultura GEPAC Cultura Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica autoriza a reproduccedilatildeo natildeo

comercial de conteuacutedos

Natildeo Sem indicaccedilatildeo PDF

AICEP - Estatiacutesticas AICEP Comeacutercio e Investimento

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo PDF

BPStat Banco de Portugal Economia Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sem

indicaccedilatildeo Esquema proacuteprio Sem indicaccedilatildeo

Portugal Economy Probe Vaacuterios Economia Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim (natildeo a

100) Sem indicaccedilatildeo PDF XLS

Estatiacutesticas Economia GEE Economia Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica autoriza a coacutepia mediante citaccedilatildeo da fonte

Sim Sem indicaccedilatildeo XLXS

Portal de Transparecircncia Municipal

AMA e DGAL Economia Financcedilas

Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica indica

que a coacutepia importaccedilatildeo ou

utilizaccedilatildeo satildeo graacutetis

Sim Sem indicaccedilatildeo XML CSV

Base INCI Economia Compras Puacuteblicas

766326 Resultados

CC BY 30 (nos dados existentes no

dadosgov) Natildeo Esquema

proacuteprio HTML PDF

Estatiacutesticas Empresariais MJ Estatiacutesticas Empresariais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim Sem indicaccedilatildeo PDF XLS

100

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

PORDATA

Fundaccedilatildeo Manuel dos Santos

Estatiacutesticas Nacionais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim Esquema

proacuteprio HTML PDF XLS

PORDATA Kids

Fundaccedilatildeo Manuel dos Santos

Estatiacutesticas Nacionais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim Esquema

proacuteprio HTML PDF XLS

CCDR-N - Indicadores Regionais

CCDR Norte Estatiacutesticas Regionais 8 Sem indicaccedilatildeo Sim Sem indicaccedilatildeo XLS

Observatoacuterio DR CCDR Alentejo Estatiacutesticas Regionais

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo PDF XLS

Datacentro CCDR-Centro Estatiacutesticas Regionais

Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica autoriza a reproduccedilatildeo natildeo

comercial de conteuacutedos desde que identifique a

fonte

Natildeo Sem indicaccedilatildeo HTML

Estatiacutesticas dos Accedilores

Governo dos Accedilores

Estatiacutesticas Regionais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Esquema

proacuteprio HTML PDF

Estatiacutesticas da Madeira

Governo da Madeira

Estatiacutesticas Regionais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sem

indicaccedilatildeo Esquema

usado pelo INE PDF XLS

Quarenta anos de Abstenccedilatildeo

Transparecircncia Hackday Portugal Open Knowledge

Portugal

Estatiacutesticas Poliacuteticas

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo HTML

Central de dados

Transparecircncia Hackday Portugal

Estatiacutesticas Poliacuteticas e

Sociais 9 PDDL Sim Esquema

proacuteprio CSV JSON

Um Paiacutes como noacutes UBI U Aveiro Estatiacutesticas Sociais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo Aplicaccedilatildeo web

Dados e estatiacutesticas de cursos superiores

MEC Educaccedilatildeo Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim (natildeo a

100) Sem indicaccedilatildeo HTML XLXS ODS

101

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Estatiacutesticas Educaccedilatildeo e Ciecircncia

DGEEC Educaccedilatildeo e Ciecircncia

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim (natildeo a

100) Sem indicaccedilatildeo PDF XLXS ODS

Estatiacutesticas Justiccedila DGPJ-MJ Justiccedila Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim (natildeo a

100) Sem indicaccedilatildeo HTML PDF XLS

Sistema de informaccedilatildeo dos certificados de oacutebitos

M Sauacutede Oacutebitos Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo HTML

Serviccedilo Nacional de Sauacutede SNS Sauacutede 126 Sem indicaccedilatildeo Sim Esquema proacuteprio Vaacuterios

Estatiacutesticas Sauacutede DGS Sauacutede Sem indicaccedilatildeo Sem indicaccedilatildeo Sim Sem indicaccedilatildeo PDF CSV

Dashboard da Sauacutede DGS Sauacutede Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo HTML

Relatoacuterios Sinistralidade ANSR Seguranccedila Rodoviaacuteria

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo PDF

Portal Opiniatildeo Puacuteblica

Fundaccedilatildeo Francisco Manuel dos Santos

Sondagens Opiniatildeo

Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica autoriza a reproduccedilatildeo natildeo

comercial de conteuacutedos desde que identifique a

fonte

Sim Sem indicaccedilatildeo HTML PDF XLS

Estatiacutesticas SegSocial ISS Seg Social Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo HTML PDF

O Preccedilo Certo em Votos

Transparecircncia Hackday Portugal Open Knowledge

Portugal

Estatiacutesticas Poliacuteticas

Informaccedilatildeo estatiacutestica

General Public License v20

Sem indicaccedilatildeo Sem indicaccedilatildeo HTML

Arquivo Portuguecircs de Informaccedilatildeo Social

APIS Informaccedilatildeo social 37 CC BY 30 Sim Padratildeo do DDI PDF XML SAV

102

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Mila

Transparecircncia Hackday Portugal Aplicaccedilatildeo 78

Resultados Sem indicaccedilatildeo Sim Sem indicaccedilatildeo Aplicaccedilatildeo web

GeoDevolutas

Transparecircncia Hackday Portugal Aplicaccedilatildeo 250

Resultados Sem indicaccedilatildeo Sim Sem indicaccedilatildeo Aplicaccedilatildeo web

(tambeacutem disponiacutevel em CSV)

Open Food Facts

Open Food Facts - Portugal Aplicaccedilatildeo

Informaccedilatildeo estatiacutestica

e descritiva CC BY 40 Sim Sem indicaccedilatildeo Aplicaccedilatildeo web e

moacutevel

Invasatildeo dos hamburgueres

Transparecircncia Hackday Portugal Aplicaccedilatildeo Informaccedilatildeo

geograacutefica Sem indicaccedilatildeo Sim Sem indicaccedilatildeo

Aplicaccedilatildeo web (tambeacutem disponiacutevel em PDF CSV ODS

XLXS TSV)

103

Conclusatildeo

O conhecimento eacute inseparaacutevel do progresso cientiacutefico do processo de decisatildeo da inovaccedilatildeo e do bem-estar social Apesar de natildeo ser objetivo principal deste estudo natildeo deixaacutemos de constatar que o ecossistema portuguecircs de AA parece estar a amadurecer Aleacutem do RCAAP existem largas dezenas de repositoacuterios pertencentes a universidades e institutos de investigaccedilatildeo alguns incluiacutedos no ranking Top Portals O ROARMAP lista 21 poliacuteticas de AA por via verde em instituiccedilotildees do ensino superior o DOAJ (2017) indexa 78 revistas de AA com 91 a publicarem sob uma licenccedila CC que permite a sua livre reutilizaccedilatildeo O SHERPARoMEO listou 127 poliacuteticas editoriais de AA em Portugal sendo que mais de metade autoriza a publicaccedilatildeo em AA do posprint ou da versatildeo final do editor Nota ainda para a existecircncia de uma poliacutetica de AA da FCT por via do artigo 292 do acordo de financiamento que mandata a abertura de todos as publicaccedilotildees cientiacuteficas produzidos sob financiamento do programa H2020 Contudo os parcos resultados obtidos atraveacutes da literatura explorada natildeo permitem inferir a dimensatildeo cultural da implementaccedilatildeo do AA em Portugal

A plena implementaccedilatildeo do conceito de CA em Portugal parece ainda longe da realidade O estabelecimento de uma poliacutetica de CA apenas comeccedilou a ser desenhado em fevereiro de 2016 com a publicaccedilatildeo dos principiacuteos orientadores para a ldquoCiecircncia Aberta Conhecimento para todosrdquo pelo MCTES Em Maio a Resoluccedilatildeo do Conselho de Ministros nordm 212016 definiu os princiacutepios da implementaccedilatildeo da poliacutetica de CA em Portugal estruturada em torno de quatro eixos AA e Dados Abertos Infraestruturas e preservaccedilatildeo digital Avaliaccedilatildeo cientiacutefica Responsabilidade social cientiacutefica (Comissatildeo Executiva GT-PNCA 2016)

Hoje aplicamos o termo Dados Abertos referindo-nos a dados de investigaccedilatildeo e a dados do setor puacuteblico A origem da abertura destes dois tipos de dados tem contextos muito diferenciados e independentes embora os objetivos possam ser semelhantes Os dados sempre foram essenciais em muitas aacutereas da investigaccedilatildeo e nos uacuteltimos anos tornaram-se destaque em mais aacutereas cientiacuteficas crescendo substancialmente em escala e complexidade A niacutevel mundial verifica-se uma atenccedilatildeo crescente para o fenoacutemeno da abertura de dados de investigaccedilatildeo sobretudo quando se debate a resoluccedilatildeo de problemas agrave escala global Existem tambeacutem iniciativas e organizaccedilotildees internacionais envolvidas na promoccedilatildeo da abertura de dados que procuram fomentar o desenvolvimento de sistemas e procedimentos a niacutevel internacional que assegurem o acesso sustentabilidade e interoperabilidade Muitas destas organizaccedilotildees jaacute desenvolveram princiacutepios de abertura e protocolos de dados proacuteprios formaram grupos de trabalho para a definiccedilatildeo de padrotildees de gestatildeo publicaccedilatildeo citaccedilatildeo interoperabilidade e partilha de dados ou criaram cursos de treino em gestatildeo de dados de investigaccedilatildeo para oferecer aos seus investigadores Analisando em detalhe os

104

princiacutepios propostos para a abertura dos dados de investigaccedilatildeo verifica-se que aleacutem da grande variedade de princiacutepios propostos a abertura legal e teacutecnica dos dados soacute eacute acautelada em metade das recomendaccedilotildees Destacam-se o AA aos dados e a reutilizaccedilatildeo de dados em nuacutemero de menccedilotildees Em contrapartida a citaccedilatildeo de dados a interoperabilidade o acesso sem discriminaccedilatildeo as licenccedilas e formatos abertos a modificaccedilatildeo e legibilidade por maacutequina satildeo mencionados apenas em trecircs recomendaccedilotildees tendo a seu favor o facto de terem sido incluiacutedas nas recomendaccedilotildees mais recentes Princiacutepios relevantes como a publicaccedilatildeo imediata a qualidade e a integridade dos dados surgem apenas duas vezes listados Verifica-se tambeacutem o lanccedilamento de revistas cientiacuteficas especiacuteficas para a ciecircncia orientada a dados possibilitando a publicaccedilatildeo de dados e dos artigos cientiacuteficos que os utilizam apoacutes o serviccedilo de revisatildeo por pares

Apesar do progresso a literatura examinada aponta no sentido de que a abertura a dados de investigaccedilatildeo natildeo ser ainda um comportamento comum sendo necessaacuterio uma mudanccedila cultural (Royal Society 2012 Pontika et al 2015 Science International 2015) Verificam-se trecircs fatores que parecem estar a atrasar esta mudanccedila no comportamento dos investigadores

a) A OKI (2012b) coloca os dados de investigaccedilatildeo ao mesmo niacutevel de importacircncia que outros tipos de dados como os dados culturais financeiros estatiacutesticos ambientais e ainda sobre o clima e transportes sem lhes atribuir qualquer destaque ou importacircncia especial

b) A avaliaccedilatildeo e revisatildeo por pares dos dados natildeo tecircm a mesma qualidade quando comparada com as publicaccedilotildees tradicionais dado a publicaccedilatildeo de dados natildeo ser ainda uma praacutetica comum (ERAC 2016)

c) Hahnel e Hook (2016) apontam a falha na atribuiccedilatildeo de incentivos e recompensas tangiacuteveis aos investigadores pelas suas contribuiccedilotildees A publicaccedilatildeo de dados de forma aberta envolve tarefas que consomem muito tempo aos investigadores como a mudanccedila do formato dos dados manter a informaccedilatildeo atualizada alinhar os dados com as licenccedilas existentes e com os criteacuterios de publicaccedilatildeo de informaccedilatildeo sensiacutevel (Reitano 2013)

O debate sobre a abertura dos dados governamentais tem mais de uma deacutecada Diversas iniciativas e organizaccedilotildees internacionais tecircm promovido princiacutepios de abertura de dados do setor puacuteblico como a OKI (2012a) que identificou as componentes chave da abertura de dados puacuteblicos disponibilidade e acesso reutilizaccedilatildeo e redistribuiccedilatildeo participaccedilatildeo universal Foram analisados princiacutepios de abertura de dados puacuteblicos de nove organizaccedilotildees e tal como em relaccedilatildeo aos dados de investigaccedilatildeo verifica-se uma grande variedade de princiacutepios propostos Embora se registe uma melhoria significativa na abertura legal e teacutecnica relativamente aos dados de investigaccedilatildeo tambeacutem os princiacutepios propostos para os dados puacuteblicos natildeo abarcam

105

a totalidade desta dupla abertura O acesso a publicaccedilatildeo imediata a reutilizaccedilatildeo e a disponibilizaccedilatildeo de dados de forma completa sem discriminaccedilatildeo e de forma a serem processados por maacutequina satildeo os princiacutepios que reuacutenem mais consenso entre as recomendaccedilotildees analisadas As licenccedilas abertas a comparabilidade de dados os formatos abertos a disponibilidade a abertura por defeito de dados a interoperabilidade publicaccedilatildeo de metadados e a gestatildeo de dados apoacutes a sua publicaccedilatildeo satildeo mencionados em menos de metade das recomendaccedilotildees analisadas apesar de ser indiscutiacutevel a sua importacircncia no processo de abertura de dados

A abertura dos dados governamentais enfrenta restriccedilotildees complexas a niacutevel institucional da complexidade da tarefa uso e participaccedilatildeo legislaccedilatildeo qualidade da informaccedilatildeo e questotildees teacutecnicas (Janssen Charalabidis e Zuiderwijk 2012) Os governos devem modificar as praacuteticas e procedimentos internos de gestatildeo de informaccedilatildeo pois a reutilizaccedilatildeo da informaccedilatildeo estaacute dependente da forma como eacute gerida e publicada (Reitano 2013) A OECD (2015a) declara que estes dados continuam muitas vezes inacessiacuteveis quer em termos de acesso quer em termos de custo Satildeo apontados alguns entraves agrave sua publicaccedilatildeo derivados de questotildees culturais (Carrara et al 2016a) restriccedilotildees teacutecnicas e financeiras (Ubaldi 2013 Carrara et al 2016a) sendo necessaacuterio enfrentar desafios relacionados com poliacuteticas tecnologias financcedilas organizaccedilatildeo e cultura para criar um ecossistema e construir um modelo de negoacutecios sustentaacutevel para as iniciativas de DGA (Ubaldi 2013 traduccedilatildeo livre) Por outro lado devem ser fornecidos aos cidadatildeos os conhecimentos e habilidades necessaacuterias para interpretar a vasta gama de conjuntos de dados e gerar valor a partir desses dados (Janssen 2012 Koski 2015)

O impacto da abertura dos dados governamentais pode ser medido em trecircs dimensotildees econoacutemica poliacutetica e social (Granicas 2013 Koski 2015) Koski (20153) defende ser necessaacuterio desenvolver um modelo de avaliaccedilatildeo e monotorizaccedilatildeo seguido da coleta sistemaacutetica de dados para medir com exatidatildeo o impacto dos Dados Abertos

A abertura de dados sem restriccedilotildees de acesso deve ser garantida por uma poliacutetica de Dados Abertos pois ldquoOpen Data is politicalrdquo (World Wide Web Foundation 201638) O fenoacutemeno dos Dados Abertos eacute tambeacutem teacutecnico e social dada a interaccedilatildeo entre o meio local politico social legal e teacutecnico e as tecnologias que produzem resultados (Davies 2014 Pasqueto Sands amp Borgman 2015) A literatura destaca a existecircncia de poliacuteticas diferenciadas para a abertura de dados governamentais e para a abertura de dados cientiacuteficos com maior enfoque poliacutetico na abertura dos dados governamentais (RECODE 2014) Em termos de dados de investigaccedilatildeo eacute possiacutevel encontrar poliacuteticas de quatro intervenientes diferentes Governo entidade financiadora que pode ser ou natildeo governamental instituiccedilotildees de investigaccedilatildeo e ainda as editoras de data journals Ao niacutevel dos dados puacuteblicos satildeo associadas poliacuteticas

106

governamentais e institucionais As poliacuteticas de dados abertos devem ainda incluir uma poliacutetica de gestatildeo de dados independentemente do cariz dos dados

As recentes poliacuteticas de Open Data pretendem disponibilizar em livre acesso os datasets da mesma forma que qualquer outra publicaccedilatildeo acadeacutemica sendo para isso necessaacuterio garantir uma infraestrutura de armazenamento acesso pesquisa e a reutilizaccedilatildeo dessa informaccedilatildeo (Rans Day Duke amp Ball 2013) Segundo a Science International (20156) ldquoeffective open data in a data-intensive age can only be realised if there is systemic action at disciplinary national and international levelsrdquo

Exige-se uma mudanccedila cultural para atingir a abertura plena dos dados de investigaccedilatildeo sendo necessaacuterio estabelecer novas formas de reconhecimento e recompensa aos esforccedilos de gestatildeo preservaccedilatildeo e curadoria de dados como forma de envolver investigadores e comunidades na abertura de dados (RECODE 2014 Internacional Science 2015) Eacute essencial que os investigadores desenvolvam competecircncias que lhes permita natildeo soacute partilhar dados com metadados adequados como tambeacutem entender e reutilizar dados de terceiros (OECD 2015a) A familiaridade com ferramentas e princiacutepios de gestatildeo de dados deve ser segundo a Royal Society (2012) parte integrante do treino dos cientistas As bibliotecas e os bibliotecaacuterios como profissionais de informaccedilatildeo multifacetados podem desempenhar um papel ativo no mundo dos Dados Abertos como facilitadores do processo de investigaccedilatildeo (RECODE 2014 Hahnel e Hook 2016 Erway et al 2016 Hernaacutendez-Peacuterez 2016)

A implementaccedilatildeo de uma poliacutetica de abertura de dados puacuteblicos deve ter em conta a definiccedilatildeo da sua aplicaccedilatildeo e os objetivos que dados iratildeo ser publicados quais as condiccedilotildees de publicaccedilatildeo de dados em que siacutetio qual a frequecircncia e qual a razatildeo da publicaccedilatildeo devendo ainda ser calculado o impacto e os benefiacutecios da abertura de dados (Carrara et al 2016a) ldquoThe culture of open data policies has to change from a culture in which opening of data is standardly consideredrdquo (Zuiderwijk amp Janssen 201427) Os governos necessitam de implementar o fenoacutemeno dos Dados Abertos como uma mudanccedila cultural assegurando que recursos humanos e materiais infraestrutura leis e poliacuteticas satildeo eficientes para a implementaccedilatildeo e extraccedilatildeo de resultados a longo prazo (World Wide Web Foundation 2016) A literatura indica algumas estruturas de avaliaccedilatildeo da abertura de dados puacuteblicos tendo o nosso enfoque recaiacutedo no modelo criado Zuiderwijk e Janssen (2014) que aborda o contexto conteuacutedo e indicadores de desempenho da poliacutetica de dados abertos para calcular o valor alcanccedilado pela abertura de dados Destaque ainda para o Open Data Barometer que revela algumas conclusotildees preocupantes a niacutevel da abertura dos dados governamentais A disponibilidade de dados que cumprem todos os princiacutepios de abertura caiu dos 10 para 7 em 2016 e a legibilidade por maacutequina tambeacutem tem tendecircncia negativa Apenas se registou uma melhoria no licenciamento de dados

107

Ao niacutevel macro a EU tem estado ativa na recomendaccedilatildeo e implementaccedilatildeo de poliacuteticas de abertura de dados de investigaccedilatildeo e governamentais Em 2015 no acircmbito da criaccedilatildeo do Mercado Digital Uacutenico propocircs a implementaccedilatildeo de uma ldquocopyright exception that would permit researchers to analyse on a large scale scientific data to which they have lawful accessrdquo (Comissatildeo Europeia 2016b) Com a ambiccedilatildeo de tornar a Europa liacuteder mundial numa economia baseada em dados a Comissatildeo Europeia (2016c) pretende ldquodisponibilizar serviccedilos baseados na computaccedilatildeo em nuvem e infraestruturas de dados de craveira mundialrdquo que forneccedilam vantagens competitivas a investigadores empresaacuterios e instituiccedilotildees puacuteblicas baseadas na utilizaccedilatildeo de grandes volumes de dados

A aposta na criaccedilatildeo de poliacuteticas de abertura de dados de acordo com os objetivos europeus relativamente agrave CA reflete-se no atual programa de financiamento da investigaccedilatildeo e inovaccedilatildeo da EU o Horizonte 2020 (H2020) Foi criado um projeto-piloto de dados abertos com o objetivo de maximizar o acesso e reutilizaccedilatildeo de dados de investigaccedilatildeo nas aacutereas cientiacuteficas selecionadas tendo sido expandido em 2017 a todas as aacutereas sob financiamento do H2020 O artigo 293 do Model Grant Agreement requer o depoacutesito num repositoacuterio de AA de todos os dados e metadados associados permitindo assim o seu acesso exploraccedilatildeo por maacutequina reproduccedilatildeo e disseminaccedilatildeo sem custos para os utilizadores Os investigadores devem tambeacutem fornecer informaccedilatildeo sobre as ferramentas e instrumentos necessaacuterios para validar os resultados e elaborar um Data Management Plan para descrever os conjuntos de dados gerados no processo de investigaccedilatildeo e como e quando seratildeo publicados A gestatildeo de dados deve ser efetuada segundo os princiacutepios FAIR tornando os dados faacuteceis de encontrar acessiacuteveis interoperaacuteveis e reutilizaacuteveis (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016c) A implementaccedilatildeo dos princiacutepios FAIR na gestatildeo e abertura de dados de investigaccedilatildeo poderaacute potenciar tambeacutem a partilha e por conseguinte a citaccedilatildeo de dados

Em termos de dados puacuteblicos a EU implementou uma nova Diretiva (201337EU) que requer que a informaccedilatildeo puacuteblica seja disponibilizada ldquothrough open and machine-readable formats and together with their metadata at the best level of precision and granularity in a format that ensures interoperabilityrdquo incluindo agora entidades como bibliotecas arquivos e museus na esfera da abertura de dados (EUR-Lex 20133) Esta diretiva tornou obrigatoacuteria a disponibilizaccedilatildeo de informaccedilatildeo proveniente das entidades puacuteblicas para reutilizaccedilatildeo ao custo de reproduccedilatildeo de preferecircncia num portal e sob licenccedilas de formatos digitais

A EU criou tambeacutem o Open Data Maturity para avaliar o desenvolvimento de poliacuteticas nacionais e portais na Europa usando a informaccedilatildeo coletada para elaborar um iacutendice de maturidade das poliacuteticas de Open Data baseado na preparaccedilatildeo poliacutetica e na maturidade do portal de dados (Carrara Nieuwenhuis amp Vollers 2016) Em termos

108

de preparaccedilatildeo poliacutetica eacute avaliada a presenccedila de uma poliacutetica de Dados Abertos especiacutefica normas de licenciamento extensatildeo da coordenaccedilatildeo a niacutevel nacional uso de dados e impacto poliacutetico social e econoacutemico A maturidade dos portais eacute avaliada de acordo com a sua usabilidade a reutilizaccedilatildeo dos dados alojados no portal e inclusatildeo de dados de diferentes domiacutenios Segundo a informaccedilatildeo apurada no relatoacuterio apesar da melhoria do nuacutemero de poliacuteticas de Dados Abertos no uso de dados e impacto da abertura de dados a maioria dos paiacuteses europeus ainda natildeo atingiu a maturidade por completo Os paiacuteses necessitam de elevar o reconhecimento poliacutetico sobre os Dados Abertos aumentar os processos automatizados nos seus portais para aumentar a usabilidade e reutilizaccedilatildeo dos dados e tambeacutem organizar mais eventos e treinos para apoiar as iniciativas nacionais e locais O relatoacuterio do Open Data Maturity conclui que os paiacuteses europeus estatildeo a enfrentar barreiras legais financeiras de qualidade de dados e de poliacuteticas sublinhando que os poliacuteticos natildeo conhecem os benefiacutecios da abertura de dados e que por isso os Dados Abertos natildeo satildeo estabelecidos como uma prioridade poliacutetica (Carrara Nieuwenhuis amp Vollers 2016)

Em Portugal as poliacuteticas de abertura de dados de investigaccedilatildeo e do setor puacuteblico apresentam estados de maturidade diferentes Apenas em 2014 foi definida uma poliacutetica de AA aos dados de investigaccedilatildeo atraveacutes da FCT enquanto entidade financiadora de investigaccedilatildeo Contudo esta poliacutetica ldquonatildeo estaacute alinhada com os requisitos relativamente aos dados de investigaccedilatildeo do H2020rdquo (Comissatildeo Executiva GT-PNCA 2016) pois apenas recomenda a abertura de dados sem no entanto mencionar onde os depositar o tipo de licenccedilas a utilizar que tipo de metadados inserir que formatos utilizar

A abertura de dados de investigaccedilatildeo em Portugal foi enquadrada no acircmbito da definiccedilatildeo de uma poliacutetica de CA tendo sido delineadas algumas metas a atingir ateacute 2018 pelo Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior (2016) publicaccedilatildeo de 100 dos dados criados com financiamento puacuteblico num repositoacuterio de AA verificaccedilatildeo contiacutenua da publicaccedilatildeo de dados eliminaccedilatildeo do duplo financiamento para colocar publicaccedilotildees e dados em AA oferta regular de formaccedilatildeo relativa a publicaccedilatildeo de dados em AA propriedade intelectual e proteccedilatildeo de dados

A Resoluccedilatildeo do Conselho de Ministros nordm 212016 de 11 de abril vem finalmente incluir o AA aos dados de investigaccedilatildeo na poliacutetica cientiacutefica No acircmbito da definiccedilatildeo de uma poliacutetica de Ciecircncia Aberta eacute incluiacuteda a obrigatoriedade do AA aos ldquodados cientiacuteficos resultantes de investigaccedilatildeo financiada por fundos puacuteblicosrdquo e sua respetiva preservaccedilatildeo ldquopor forma a permitir a sua reutilizaccedilatildeo e o acesso continuadordquo (Resoluccedilatildeo do Conselho de Ministros nordm 212016 2016) O interesse na abertura de dados de investigaccedilatildeo tem crescido no discurso poliacutetico e cientiacutefico verificando-se jaacute a organizaccedilatildeo de uma conferecircncia de dados de investigaccedilatildeo e CA em 2016 e de dois foacuteruns de gestatildeo de dados de investigaccedilatildeo o uacuteltimo jaacute em 2017

109

O primeiro relatoacuterio da Comissatildeo Executiva do Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta constatou que em termos de gestatildeo e partilha de dados existem algumas iniciativas e experiecircncias de ldquoacircmbito disciplinar nomeadamente no contexto de projetosrdquo sendo expectaacutevel que o Roteiro Nacional de Infraestruturas de Investigaccedilatildeo de Interesse Estrateacutegico traga ldquoprogressos significativosrdquo (Comissatildeo Executiva GT-PNCA 20167) O mesmo relatoacuterio sublinha que ao niacutevel das instituiccedilotildees de investigaccedilatildeo e de ensino superior as iniciativas de partilha e gestatildeo de dados satildeo quase inexistentes De facto apenas se regista a existecircncia do projeto TAIL lanccedilado na Faculdade de Engenharia da Universidade do Porto com o objetivo de otimizar o processo de gestatildeo de dados de investigaccedilatildeo desde a sua produccedilatildeo ateacute ao depoacutesito e partilha Este projeto a decorrer de 2016 ateacute 2019 ldquovai construir um portfoacutelio de exemplos de gestatildeo de dados em diversos domiacutenios que poderatildeo ser usados pelos investigadores para avaliar o esforccedilo requerido e as compensaccedilotildees a obter com esta atividaderdquo (Ribeiro et al 2016256-257) Os resultados seratildeo avaliados atraveacutes da utilizaccedilatildeo da plataforma Dendro ldquodesigned to help researchers use concepts from domain-specific ontologies to collaboratively describe and share datasets within their groupsrdquo (Universidade do Porto Faculdade de Engenharia 2017)

O ecossistema dos dados de investigaccedilatildeo em Portugal eacute concentrado a niacutevel disciplinar e inferior em nuacutemero de e-infraestruturas relativamente aos dados puacuteblicos Regista-se a existecircncia do SARDC com jaacute cerca de seis anos de existecircncia e que apresenta apenas 2007 datasets em maio de 2017 Depois da sua criaccedilatildeo e da colocaccedilatildeo em massa de conjuntos de dados verifica-se que o depoacutesito de datasets decresceu de forma extrema Os conjuntos disponibilizados satildeo provenientes de apenas duas instituiccedilotildees o APIS com 37 e o IPCB com 1970 conjuntos de dados Embora exista um espaccedilo atribuiacutedo a mais duas instituiccedilotildees nenhuma dessas entidades publicou ateacute agora dados atraveacutes desta plataforma O SARDC eacute limitado em termos de funcionalidades permitindo apenas a busca por autor data titulo assunto e tipo de documento Natildeo eacute possiacutevel perceber a legalidade da reutilizaccedilatildeo de dados pois natildeo eacute referido qualquer tipo de licenciamento A qualidade dos dados apresentados pelo SARDC eacute uma incoacutegnita pela falta de indicaccedilatildeo do uso de formatos abertos e tambeacutem de um esquema padratildeo de metadados A niacutevel das instituiccedilotildees de investigaccedilatildeo apenas o IPCB possui um repositoacuterio de Dados Abertos

A tendecircncia de abertura de dados de investigaccedilatildeo parece estar ligada agrave cultura disciplinar com os repositoacuterios de dados cientiacuteficos existentes em Portugal a conotarem-se no domiacutenio das Ciecircncias da Vida O re3data indexa apenas 2 repositoacuterios de dados cientiacuteficos portugueses o INTEGRALL e o KiMoSys sendo que ambos pertencem ao ramo da biologia (DataCite 2017a) O Biosharingorg (2017) indexou cinco bases de dados cientiacuteficas com origem portuguesa havendo participaccedilatildeo nacional em outras duas bases de dados internacionais Estas pertencem todas ao domiacutenio das Ciecircncias da Vida e da Biologia com exceccedilatildeo de uma conotada com as

110

Ciecircncias da Terra A GBIF possui um noacute portuguecircs que aloja 23 conjuntos de dados que correspondem a 448136 ocorrecircncias (Portal de Dados de Biodiversidade de Portugal 2016) A rede nacional de informaccedilatildeo bioloacutegica - BioDatapt fornece acesso a duas bases de dados disciplinares uma ontologia para descrever experiecircncias bioloacutegicas baseadas em plantas quatro ferramentas de software e cinco conjuntos de dados

Em suma eacute necessaacuterio desenvolver por completo a poliacutetica de abertura de dados cientiacuteficos clarificando questotildees como o local de depoacutesito licenccedilas metadados e formatos a utilizar Ao niacutevel do ecossistema eacute necessaacuterio melhorar a visibilidade do SARDC abrir totalmente os dados isto eacute de forma legal e teacutecnica e construir mais repositoacuterios de dados Em termos de impacto eacute imperiosa uma mudanccedila cultural que passe pelo treino dos investigadores para a gestatildeo e partilha de dados pela definiccedilatildeo de recompensas e incentivos para os investigadores que partilhem dados e tambeacutem pela criaccedilatildeo de mais iniciativas de promoccedilatildeo da abertura de dados

A evoluccedilatildeo da conjuntura de acesso aos documentos administrativos do setor puacuteblico eacute derivada da imposiccedilatildeo das Diretivas Europeias a que Portugal como membro da EU estaacute obrigado A Lei 462007 de 24 de Agosto viraacute transpor para a ordem juriacutedica nacional a Diretiva nordm 200398CE legislando a obrigaccedilatildeo das entidades puacuteblicas publicar documentos administrativos de forma eletroacutenica para que possam ser acedidos e reutilizados Foi tambeacutem criada a CADA para supervisionar o cumprimento das disposiccedilotildees legais referentes ao acesso agrave informaccedilatildeo administrativardquo (Comissatildeo de Acesso aos Documentos Administrativos [CADA])

A Lei nordm 262016 de 22 de Agosto revoga e transpotildee a novamente a Diretiva 200398EC O artigo 3ordm mandata a abertura dos dados ambientais agrave comunidade incluindo-os na definiccedilatildeo de documento administrativo devendo a sua publicaccedilatildeo ser feita num formato aberto e legiacutevel por maacutequina O artigo 23ordm apenas prevecirc a reutilizaccedilatildeo dos dados para fins educativos e para fins de investigaccedilatildeo e desenvolvimento deixando de lado a reutilizaccedilatildeo comercial Contudo o dadosgov atribuiu aos dados que aloja a licenccedila CC BY 30 o que natildeo impede a reutilizaccedilatildeo comercial dos dados Perante este contexto eacute impossiacutevel natildeo questionar a razatildeo de natildeo ter sido transposta a nova Diretiva 201337EU que facilita a reutilizaccedilatildeo de dados ao tornar obrigatoacuteria a disponibilizaccedilatildeo de informaccedilatildeo proveniente das entidades puacuteblicas para reutilizaccedilatildeo ao custo de reproduccedilatildeo de preferecircncia num portal e sob licenccedilas de formatos digitais Um desenvolvimento interessante seria o de criar um legislaccedilatildeo apropriada para a abertura de dados governamentais que fosse estabelecida tendo em conta as necessidades dos utilizadores e os objetivos governamentais em vez da simples transposiccedilatildeo da Diretiva da Uniatildeo Europeia

Ao niacutevel local apenas Lisboa e Porto parecem ter definido uma poliacutetica de abertura de dados com estrateacutegias diferenciadas Lisboa aposta na publicaccedilatildeo de dados municipais que promovam o envolvimento dos cidadatildeos aumentem a transparecircncia e

111

o desenvolvimento econoacutemico aleacutem da melhoria da eficiecircncia dos serviccedilos devendo os dados ser atualizados legiacuteveis por maacutequina com licenccedila aberta que permita a reutilizaccedilatildeo comercial (Lisboa Cacircmara Municipal 2016) Os dados disponibilizados no portal ldquosatildeo produzidos no acircmbito de sistemas de informaccedilatildeordquo que pertencem a diversos organismos registando-se jaacute diversas aplicaccedilotildees que utilizam esses dados para criar valor para o cidadatildeo e visitante de Lisboa na aacuterea do turismo ambiente urbanismo (Soares Baptista e Lima 201518) Jaacute o Porto parece concentrado na publicaccedilatildeo de dados que contribuam para a ldquocompetitividade do Municiacutepio do Porto e da regiatildeo para visitar para residir captar e realizar negoacutecios no mercado nacional e internacionalrdquo (Porto Cacircmara Municipal) De acordo com a opiniatildeo de Soares Baptista e Lima (201518) a abertura de dados eacute centrada na ldquodimensatildeo turismo e negligencia pelo menos aparentemente as restantesrdquo Esta conclusatildeo pode ser reforccedilada com a anaacutelise do portal de dados do Porto onde apenas constam cinco conjuntos de dados sendo estes pertencentes ao turismo ou relacionados

O ecossistema de abertura de dados tem aumentado dentro e fora do espectro poliacutetico Aleacutem do portal nacional de dados puacuteblicos um grande nuacutemero de organizaccedilotildees puacuteblicas tem criado os seus portais de dados eou tem publicado os mesmos no dadosgov Por outro lado existem vaacuterios portais de dados com origem na sociedade civil com o selo da Transparecircncia Hackday Portugal Em Portugal tecircm existido diversas iniciativas a este niacutevel hackathons como o Date with Data com o intuito de alertar informar e formar a comunidade para este novo paradigma na disponibilizaccedilatildeo da informaccedilatildeo conferecircncias de Dados Abertos

O Porto Lisboa Fundatildeo Palmela Penela e Aacutegueda estatildeo entre as cidades que integram o Open and Agile Smart Cities (OASC) (2017) uma iniciativa com o objetivo de desenvolver mercados para as cidades inteligentes baseados nas necessidades das cidades e das comunidades O Porto eacute destaque nesta iniciativa pela utilizaccedilatildeo da tecnologia FIWARE que ajuda a melhorar o uso de dados abertos e a partilha conhecimentos e tecnologias entre cidades

A anaacutelise feita por Soares Baptista e Lima (2015) sobre a abertura de dados em quatro cidades do norte do paiacutes Braga Barcelos Guimaratildees e Vila Nova de Famalicatildeo concluiu que a disponibilizaccedilatildeo de dados ao niacutevel local eacute feita apenas ao niacutevel de ldquocontratos municipais orccedilamento anual gastos resultados eleitorais qualidade do ar horaacuterios de transporte orccedilamento participativo e lista de empresasrdquo

A avaliaccedilatildeo da transparecircncia governativa local pode tambeacutem ser obtida atraveacutes do Portal da Transparecircncia Municipal uma ferramenta que permite avaliar vaacuterios indicadores da governaccedilatildeo dos municiacutepios portugueses com o recurso agrave disponibilizaccedilatildeo de dados estatiacutesticos Os indicadores abordam a gestatildeo financeira e administrativa decisotildees fiscais dinacircmica econoacutemica do municiacutepio serviccedilos municipais e participaccedilatildeo eleitoral autaacuterquica (Portugal Governo 2017)

112

Utilizando a estrutura de avaliaccedilatildeo de poliacuteticas de Dados Abertos de Zuiderwijk e Janssen (2014) eacute possiacutevel tirar algumas ilaccedilotildees sobre o contexto conteuacutedo e indicadores de desempenho da poliacutetica de abertura de dados do setor puacuteblico bem como sobre o valor puacuteblico alcanccedilado A niacutevel de contexto da poliacutetica de Dados Abertos a Lei nordm 262016 de 22 de Agosto transpotildee a Diretiva 200398CE tendo como motivaccedilatildeo para a sua implementaccedilatildeo eacute sobretudo econoacutemica e poliacutetica via EU A poliacutetica tambeacutem pretende facilitar o acesso e reutilizaccedilatildeo da informaccedilatildeo por parte dos cidadatildeos e garantir a transparecircncia da atividade administrativa A abertura de dados do setor puacuteblico eacute garantida pela CADA responsaacutevel pelo cumprimento da lei e a AMA que fornece a e-infraestrutura e apoio teacutecnico Tambeacutem os custos de abertura de dados governamentais parecem estar assegurados num plano de racionalizaccedilatildeo de custos da Administraccedilatildeo Puacuteblica (OECD 2015)

Em termos de conteuacutedo a poliacutetica de Dados Abertos enuncia na sua constituiccedilatildeo alguns princiacutepios de abertura bastante importantes como o acesso livre e universal a acessibilidade a interoperabilidade a qualidade a integridade e a autenticidade dos dados publicados e ainda a sua identificaccedilatildeo e localizaccedilatildeo (art 2ordm) A publicaccedilatildeo de dados deve ser feita num formato aberto e legiacutevel por maacutequina (art 3ordm)

Relativamente ao contexto o acesso eacute gratuito e de faacutecil compreensatildeo sendo que todos os dados no dadosgov estatildeo disponiacuteveis para download sem necessidade de pedido ou registo Eacute aplicada a licenccedila CC BY 30 a todos os datasets alojados no portal permitindo assim a sua reutilizaccedilatildeo com apenas a restriccedilatildeo de mencionar a fonte dos dados Todos os dados no dadosgov estatildeo disponiacuteveis em formatos abertos podendo ser classificados com 3 estrelas segundo o conceito de dados abertos conectados de Tim Berners-Lee (2010)

Contudo natildeo existe esquema padratildeo de metadados nem existe verificaccedilatildeo dos metadados antes da publicaccedilatildeo de cada dataset (Lapa 2017) Natildeo satildeo conhecidas meacutetricas de avaliaccedilatildeo nem multas ou recompensas no ecossistema portuguecircs de Dados Abertos A uacuteltima mediccedilatildeo da qualidade dos dados data de 2014 onde foram encontrados alguns problemas que natildeo foram totalmente resolvidos junto dos fornecedores A uacuteltima grande atividade de promoccedilatildeo de reutilizaccedilatildeo de dados do setor puacuteblico ocorreu em 2014-2015 natildeo se conhecendo para jaacute novas atividades previstas (Lapa 2017)

Em termos de disponibilidade de dados Portugal apresenta 802 conjuntos de dados no portal nacional de temaacutetica diversa mas com maior incidecircncia na Economia e Financcedilas Mas se considerarmos os dados alojado em outros portais puacuteblicos e natildeo que ainda natildeo constam no portal nacional a contabilidade eacute bastante mais elevada

Os indicadores de desempenho satildeo modestos Apesar do espetro alargado de destinataacuterios da abertura de dados registam-se apenas 2 aplicaccedilotildees elaboradas a

113

partir de Dados Abertos disponibilizados pela AMA e Direcccedilatildeo-Geral das Autarquias Locais (Lapa 2017) Natildeo eacute por isso surpreendente o fraco impacto poliacutetico econoacutemico e social apontado pelo Open Data Barometer e pelo Open Data Maturity O estudo de Gomes e Soares (2014) conclui que a transparecircncia eacute o uacutenico benefiacutecio real

Em termos de valor puacuteblico alcanccedilado apenas conseguimos identificar a transparecircncia governativa e disponibilidade de dados Mesmo que a poliacutetica mandate a abertura de dados mediante como a interoperabilidade e a qualidade se natildeo existe verificaccedilatildeo nem mediccedilatildeo quem pode assegurar que estes estatildeo a ser cumpridos A disponibilidade de dados existe o que natildeo se verifica eacute grande reutilizaccedilatildeo dos dados puacuteblicos Poderaacute esta falta de verificaccedilatildeo da qualidade dos dados estar a interferir com a sua reutilizaccedilatildeo Faltam claramente indicadores de reutilizaccedilatildeo de dados do setor puacuteblico e estudos de impacto para uma avaliaccedilatildeo concreta do valor alcanccedilado

Gomes e Soares (2014) apenas atribuem nota positiva ao dadosgov no cumprimento dos princiacutepios de abertura A atividade dos visitantes o desenvolvimento de aplicaccedilotildees a atividade geradora de novo conhecimento e a utilizaccedilatildeo de recursos do portal satildeo classificadas como pobres Neste indicador apenas a atividade dos fornecedores no portal eacute satisfatoacuteria Em termos de benefiacutecios observaacuteveis da abertura de dados governamentais o estudo apenas regista bons niacuteveis de transparecircncia governativa enquanto a participaccedilatildeo puacuteblica a inovaccedilatildeo e o empreendedorismo e a eficiecircncia governativas natildeo revelam impactos satisfatoacuterios

O cruzamento da informaccedilatildeo obtida atraveacutes das vaacuterias iniciativas de avaliaccedilatildeo da abertura de dados permite inferir algumas conclusotildees e tambeacutem revelar algumas disparidades O Open Data Barometer e o Open Data Maturity apontam o baixo impacto econoacutemico e social da abertura de dados em Portugal Gomes e Soares (2014) concluem que o problema em Portugal natildeo eacute quantidade de dados disponibilizados mas sim a quantidade de dados que satildeo reutilizados e como satildeo reutilizados

O Public Sector Information Scoreboard e o Open Data Maturity afirmam que Portugal natildeo possui uma poliacutetica de Dados Abertos o que como vimos natildeo corresponde agrave verdade Entre as vaacuterias iniciativas de avaliaccedilatildeo do estado de abertura de dados apenas trecircs publicaram informaccedilatildeo relativa a 2016 Apesar da equivalecircncia de ranking e taxa de abertura entre duas das iniciativas eacute redundante inferir qualquer conclusatildeo dado que estas natildeo medem o mesmo nuacutemero paracircmetros nem estes coincidem na maioria dos casos O Open Data Inventory refere-se a dados avaliados apenas do portal do INE para calcular a sua taxa de abertura pelo que tambeacutem deve ser relativizado

Como pontos positivos satildeo apontados a abertura de dados de diferentes domiacutenios o fato de todos os dados disponibilizados no portal estarem num formato processaacutevel

114

por maacutequina (Carrara Nieuwenhuis amp Vollers 2016) ao contraacuterio do que afirma a OECD (2015b) e o Open Data Inventory

Todos os iacutendices de avaliaccedilatildeo da maturidade do estado das iniciativas e poliacuteticas de Dados Abertos satildeo relativos a dados puacuteblicos natildeo tendo sido encontrada nenhuma estrutura de avaliaccedilatildeo das poliacuteticas de abertura de dados de investigaccedilatildeo

Tendo em conta o Quadro 5 eacute possiacutevel verificar a qualidade da abertura dos dados dos 60 portais de dados portugueses encontrados na web e inferir algumas conclusotildees Em termos de portais de dados de investigaccedilatildeo foram encontrados apenas 11 com os restantes 49 a conter dados do setor publico Os portais de dados estatiacutesticos satildeo os grandes dominadores do panorama nacional com 13 siacutetios web seguidos dos portais de dados econoacutemicos com 6 Dos 60 portais analisados apenas 33 disponibilizam dados legiacuteveis por maacutequina sendo que alguns portais natildeo o fazem totalmente Apenas 16 portais indicam usar uma licenccedila aberta que permita a livre reutilizaccedilatildeo dos dados e apenas 3 fornecem a indicaccedilatildeo do padratildeo de metadados usado Denota-se que alguns dos portais parecem usar um esquema proacuteprio de descriccedilatildeo de datasets no entanto estes natildeo parecem corresponder aos padrotildees de metadados mais reconhecidos Existem 17 portais que natildeo utilizam formatos abertos ou natildeo indicam sequer o tipo de formato Eacute possiacutevel jaacute encontrar jaacute tambeacutem 17 portais que fornecem dados em formatos estruturados

Em suma eacute necessaacuterio transpor a Diretiva da EU de 2013 e criar mais poliacuteticas municipais e institucionais mandatar a total abertura legal e teacutecnica de dados e a sua verificaccedilatildeo da qualidade O niacutevel de reutilizaccedilatildeo de dados e as atividades de treino e envolvimento dos cidadatildeos devem ser aumentados

O sucesso das poliacuteticas de Dados Abertos depende como vimos da criaccedilatildeo de um ecossistema sustentaacutevel e tambeacutem do impacto e reutilizaccedilatildeo que estes tipos de informaccedilatildeo possam induzir O impacto dos Dados abertos pode ser medido atraveacutes da citaccedilatildeo de dados ou atraveacutes de indicadores altimeacutetricos que permitem uma observaccedilatildeo mais clara e detalhada dos possiacuteveis impactos dos conjuntos de dados disponibilizados em AA sejam eles provenientes do setor puacuteblico ou das entidades de investigaccedilatildeo

115

Referecircncias Bibliograacuteficas

Agecircncia para a Modernizaccedilatildeo Administrativa (AMA) (2016a) Guia Dados Abertos Disponiacutevel na WWW httpwwwdadosgovptmedia46120guia_dados_abertos_amapdf

Agecircncia para a Modernizaccedilatildeo Administrativa (AMA) (2016b) Dadosgov [Consultado a 11-05-2017] Disponiacutevel na WWW httpwwwdadosgovpt

Agecircncia Portuguesa do Ambiente (2017) SNIAmb - Sistema Nacional de Informaccedilatildeo de Ambiente [Consultado a 12-05-2017] Disponiacutevel na WWW httpsniambapambienteptHomeDefaulthtm

Arzberger P et al (2004) An international framework to promote access to data Science 303(5665) 1777-1778 Disponiacutevel na WWW httpsciencesciencemagorgcontent30356651777full

Asociacioacuten Espantildeola de Normalizacioacuten y Certificacioacuten (2015) UNE 178301 Ciudades Inteligentes Datos Abiertos (Open Data) Madrid AENOR Beagrie C amp Houghton J (2014) The Value and Impact of Data Sharing and Curation A synthesis of three recent studies of UK research data centres Disponiacutevel na WWW httprepositoryjiscacuk55681iDF308_-_Digital_Infrastructure_Directions_Report2C_Jan14_v1-04pdf

Beall J (2012) Predatory publishers are corrupting open access Nature 489(7415) 179 Disponiacutevel na WWW httpswwwnaturecomnewspredatory-publishers-are-corrupting-open-access-111385

Bell G (2009) Foreword In Hey T Tansley S amp Tolle K (eds) (2009) The Fourth Paradigm Data-Intensive Scientific Discovery (pp XI-XV) Microsoft Research Disponiacutevel na WWW httpwwwastrocaltechedu~georgeaybi1994th_paradigm_book_complete_lrpdf

Berners-Lee Tim (2010) Is your Linked Open Data 5 Star Disponiacutevel na WWW httpswwww3orgDesignIssuesLinkedDatahtml

Big Data Europe (2016) Big Data Europe Empowering Communities with Data Technologies [Consultado a 22-11-2016] Disponiacutevel na WWW httpswwwbig-data-europeeu

BioDatapt Recursos [Consultado a 18-05-2017] Disponiacutevel na WWW httpwwwbiodataptresourceshtml

Biosharingorg (2017) Policies [Consultado a 22-05-2017] Disponiacutevel na WWW httpsbiosharingorgpolicies

Bjoumlrk B-C Laakso M Welling P amp Paetau P (2014) Anatomy of green open access Journal of the American Society for Information Science and Technology 65 237ndash250 Disponiacutevel na WWW httponlinelibrarywileycomwol1doi101002asi22963full

BOAI - Budapest Open Access Initiative (2002) Disponiacutevel na WWW httpwwwbudapestopenaccessinitiativeorg

116

BOAI - Budapest Open Access Initiative (2012) Ten years on from the Budapest Open Access Initiative setting the default to open Disponiacutevel na WWW httpwwwbudapestopenaccessinitiativeorgboai-10-recommendations

Borges M M (2006) A esfera comunicaccedilatildeo acadeacutemica e novos meacutedia (Tese de Doutoramento) Faculdade de Letras Universidade de Coimbra Portugal Disponiacutevel na WWW httpsestudogeralsibucptjspuibitstream1031685575MMBorges_tesepdf

Borgman C L (2015) Big Data Little Data No Data Scholarship in the Networked World The MIT Press

Bueno de la Fuente G (2016) What is Open Science Introduction Disponiacutevel na WWW httpswwwfosteropenscienceeucontentwhat-open-science-introduction

Cabinet Office (2012) Open Data White Paper Unleashing the Potential Disponiacutevel na WWW httpsdatagovuksitesdefaultfilesOpen_data_White_Paperpdf

Cabinet Office (2013) G8 Open Data Charter and Technical Annex Disponiacutevel na WWW httpswwwgovukgovernmentpublicationsopen-data-charterg8-open-data-charter-and-technical-annex

Cambridge University Press (2017) Cambridge Dictionary Disponiacutevel na WWW httpdictionarycambridgeorgdictionaryenglishpolicy

Carrara W Chan W S Fischer S Steenbergen E (2015) Creating Value through Open Data Study on the Impact of Re-use of Public Data Resources Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_creating_value_through_open_data_0pdf

Carrara W Fischer S Oudkerk F S Steenbergen E amp Tinholt D (2015) Analytical Report 1 Digital Transformations and Open Data Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_analytical_report_n1_-_digital_transformationpdf Carrara W Fischer S Steenbergen E (2015) Analytical Report 2 E-skills and Open Data Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_analytical_report_n2_-_e-skillspdf Carrara W Nieuwenhuis M amp Vollers H (2016) Open Data Maturity in Europe 2016 Insights into the European state of play Disponiacutevel na WWW httpswwwcapgemini-consultingcomresource-file-accessresourcepdfopen_data_maturity_in_europe_2016_final_v10_0pdf

Carrara W Oudkerk F Steenbergen E Tinholt D (2016a) European Data Portal Open Data Goldbook for Data Managers and Data Holders Capgemini Consulting Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesgoldbookpdf

117

Carrara W Engbers W Nieuwenhuis M amp Steenbergen E (2016b) Analytical report nordm4 Open Data in Cities Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_analytical_report_n4_-_open_data_in_cities_v10_finalpdf

Caruso J Nicol A amp Archambault Eacute (2013) Open Access Strategies in the European Research Area (August) 1ndash46 Retrieved from httpeuropaeurapidpress-release_IP-13-786_enhtmlocale=ennhttpwwwscience-metrixcompdfSM_EC_OA_Policiespdf

Carvalho J Furtado F amp Priacutencipe P (2017) WP4 ndash D25 ndash Kit sobre dados de investigaccedilatildeo RCAAP Disponiacutevel na WWW httpprojectorcaapptindexphplang-ptconsultar-recursos-de-apoioremositoryfunc=finishdownampid=395

Christensen-Dalsgaard B et al (2012) Ten recommendations for libraries to get started with research data management Final report of the LIBER working group on E-Science Research Data Management Disponiacutevel na WWW httplibereuropeeuwp-contentuploadsThe20research20data20group20201220v720finalpdf

CKAN CKAN The open source data portal software Disponiacutevel na WWW httpckanorg

Colpaert P Sarah J Peter M Mannens E Van de Walle R (2013) The 5 star of open data portals 7th internacional conference on methodologies Technologies and tools enabling e-Government (MeTTeG) 61-67 Disponiacutevel na WWW httppieterpm5stardataportals5starsofopendataportalspdf

Comissatildeo de Acesso aos Documentos Administrativos (CADA) Quem somos Disponiacutevel na WWW httpwwwcadapt

Comissatildeo Europeia (2011) Open data an engine for innovation growth and transparent governance Communication from the Commission to the European Parliament the Council the European economic and social committee and the committee of the regions (COM [2011] 882) Disponiacutevel na WWW httpwwweuroparleuropaeuRegDatadocs_autres_institutionscommission_europeennecom20110882COM_COM282011290882_ENpdf

Comissatildeo Europeia (2012) COMUNICACcedilAtildeO DA COMISSAtildeO AO PARLAMENTO EUROPEU AO CONSELHO AO COMITEacute ECONOacuteMICO E SOCIAL EUROPEU E AO COMITEacute DAS REGIOtildeES - Melhorar o acesso agrave informaccedilatildeo cientiacutefica rentabilizar o investimento puacuteblico em investigaccedilatildeo COM (2012) 401 final Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentENTXTuri=COM20120401FIN

Comissatildeo Europeia (2013) EU implementation of the G8 Open Data Charter Disponiacutevel na WWW httpseceuropaeudigital-single-marketnewseu-implementation-g8-open-data-charter

Comissatildeo Europeia (2014) COMUNICACcedilAtildeO DA COMISSAtildeO AO PARLAMENTO EUROPEU AO CONSELHO AO COMITEacute ECONOacuteMICO E SOCIAL EUROPEU E AO COMITEacute DAS REGIOtildeES - Para

118

uma economia dos dados proacutespera COM(2014) 442 final Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentENTXTuri=COM20140442FIN

Comissatildeo Europeia (2016a) Open innovation Open Science open to the world A vision for Europe Brussels European Commission Directorate-General for Research and Innovation Disponiacutevel na WWW httpbookshopeuropaeuenopen-innovation-open-science-open-to-the-world-pbKI0416263

Comissatildeo Europeia (2016b) Research amp Innovation News Alert Commission proposes copyright exception for researchers Disponiacutevel na WWW httpeceuropaeuresearchindexcfmpg=newsalertampyear=2016ampna=na-140916

Comissatildeo Europeia (2016c) COMUNICACcedilAtildeO DA COMISSAtildeO AO PARLAMENTO EUROPEU AO CONSELHO AO COMITEacute ECONOacuteMICO E SOCIAL EUROPEU E AO COMITEacute DAS REGIOtildeES ndash Iniciativa Europeia para a Nuvem ndash Construir uma economia de dados e conhecimento competitiva na Europa COM(2016) 178 final Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentPTALLuri=CELEX52016DC0178

Comissatildeo Europeia (2016d) Europa liacuteder mundial da economia baseada nos dados graccedilas agrave iniciativa europeia para a computaccedilatildeo em nuvem Comissatildeo Europeia comunicado de imprensa Disponiacutevel na WWW httpeuropaeurapidpress-release_IP-16-1408_pthtm

Comissatildeo Europeia (2017a) Digital Single Market Digital Economy amp Society Disponiacutevel na WWW httpseceuropaeudigital-single-marketenwhat-big-data-can-do-you

Comissatildeo Europeia (2017b) H2020 Programme AGA ndash Annotated Model Grant Agreement Disponiacutevel na WWW httpeceuropaeuresearchparticipantsdatarefh2020grants_manualamgah2020-amga_enpdf

Comissatildeo Europeia (2017c) COMUNICACcedilAtildeO DA COMISSAtildeO AO PARLAMENTO EUROPEU AO CONSELHO AO COMITEacute ECONOacuteMICO E SOCIAL EUROPEU E AO COMITEacute DAS REGIOtildeES - Construir uma economia de dados proacutespera COM(2017) 9 final Disponiacutevel na WWW httpeceuropaeutransparencyregdocrep12017PTCOM-2017-9-F1-PT-MAIN-PART-1PDF

Comissatildeo Europeia Grupo de peritos de alto niacutevel em dados de investigaccedilatildeo (2010) Riding the wave how Europe can gain from the rising tide of scientific data Disponiacutevel na WWW httpeceuropaeuinformation_societynewsroomcfitemlongdetailcfmitem_id=6204

Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2016a) H2020 Programme Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020 Disponiacutevel na WWW httpseceuropaeuresearchparticipantsdatarefh2020grants_manualhioa_piloth2020-hi-oa-pilot-guide_enpdf

Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2016b) Realising the European Open Science Cloud First report and recommendations Group of the Commission

119

High Level Expert Cloud on the European Open Science Luxemburgo Publications Office of the European Union Disponiacutevel na WWW httpseceuropaeuresearchopensciencepdfrealising_the_european_open_science_cloud_2016pdf

Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2016c) H2020 Programme Guidelines on FAIR Data Management in Horizon 2020 Disponiacutevel na WWW httpeceuropaeuresearchparticipantsdatarefh2020grants_manualhioa_piloth2020-hi-oa-data-mgt_enpdf

Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2017) Open Science Monitor Disponiacutevel na WWW httpeceuropaeuresearchopenscienceindexcfmpg=aboutampsection=monitor

Comissatildeo Executiva Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta (Comissatildeo Executiva GT-PNCA) (2016) Primeiro Relatoacuterio da Comissatildeo Executiva Grupo de Trabalho Para a Poliacutetica Nacional de Ciecircncia Aberta Disponiacutevel na WWW httpmediawixcomugda8bd7c_1ca622bff7f34abbad228ac94e1eda16pdf

Concordat on Open Research Data (2016) Disponiacutevel na WWW httpwwwrcukacukdocumentsdocumentsconcordatonopenresearchdata-pdf

Croll A (2012) The feedback economy In Planning for big data (pp 1-8) Sebastepol OacuteReilly Media

Cybermetrics Lab (2017) Ranking web of repositories [Consultado a 02-02-2017] Disponiacutevel na WWW httprepositorieswebometricsinfoen

Dallmeier-Tiessen et al (2011) Highlights from the SOAP project survey What Scientists Think about Open Access Publishing arXiv11015260 [Cs] 14 httpsarxivorgabs11015260

DataCite (2017a) re3data registry of research data repositories [Consultado a 02-05-2017] Disponiacutevel na WWW httpwwwre3dataorg

DataCite (2017b) Search [Consultado a 02-05-2017] Disponiacutevel na WWW httpssearchdataciteorg

Data Documention Iniciative (DDI) (2016) Document Discover and Interoperate Disponiacutevel na WWW httpwwwddiallianceorg

DataHub Datasets [Consultado a 03-01-2017] Disponiacutevel na WWW httpsdatahubiodatasetq=portugalamppage=1

DataCite (2017) Search [Consultado a 18-05-2017] Disponiacutevel na WWW httpssearchdataciteorg

Davies T (2012) 5-Stars of Open Data Engagement Disponiacutevel na WWW httpwwwtimdaviesorguk201201215-stars-of-open-data-engagement

Davies T (2014) Open data policies and practice an internacional comparison Paper for European Consortium for Political Research Panel P356 ndashThe Impacts of Open Data Disponiacutevel na WWW httpsecpreuFilestorePaperProposald591e267-cbee-4d5d-b699-7d0bda633e2epdf

120

Dawes S Vidiasova L amp Parkhimovich O (2016) Planning and designing open government data programs An ecosystem approach Government Information Quarterly 33(1) 15-27 Disponiacutevel na WWW httpwwwsciencedirectcomsciencearticlepiiS0740624X1630003X

Declaraccedilatildeo de Bethesda sobre a Publicaccedilatildeo em Acesso Aberto (2003) Disponiacutevel na WWW httplegacyearlhamedu~petersfosbethesdahtm

Declaraccedilatildeo de Berlim sobre Acesso Livre ao Conhecimento nas Ciecircncias e Humanidades (2003) Disponiacutevel na WWW httpsrepositoriumsdumuminhoptaboutDeclaracaoBerlimhtm

Decreto-Lei nordm 1152013 de 7 de agosto do Ministeacuterio da Educaccedilatildeo e Ciecircncia Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 151 (2013) 4749-4772 Disponiacutevel na WWW httpsdreptapplicationdirpdf1sdip201308151000474904772pdf

Despacho nordm 153892016 de 12 de dezembro do Ministeacuterio das Financcedilas e da Secretaria de Estado da Cultura e Ciecircncia Tecnologia e Ensino Superior Diaacuterio da Repuacuteblica nordm 2442016 Seacuterie II Nordm 244 (2016) 37155 ndash 37156 Disponiacutevel na WWW httpsdreptapplicationfilea105580126

Dietrich D (2013) Open Government Data principles concepts amp best practice Disponiacutevel na WWW httpworkspaceunpanorgsitesInternetDocumentsUNPAN95209pdf

Dietrich D Cherkasov V Susar D (2013) Open Government Data for Citizen Engagement in Managing Development Disponiacutevel na WWW httpworkspaceunpanorgsitesInternetDocumentsOGDCE20Toolkit20v113-Feb2013pdf

Directory of Open Access Journals (DOAJ) (2017) Search [Consultado a 27-05-2017] Disponiacutevel na WWW httpsdoajorg

Dodds L Newman A (2015) Open Data Maturity Model ed 10 Disponiacutevel na WWW httptheodiorgguidesmaturity-model

Donker F amp van Loenen B (2017) How to assess the sucess of the open data ecossystem Internacional journal of digital eart 10(3) 284-306 Disponiacutevel na WWW httpwwwtandfonlinecomdoifull1010801753894720161224938

Dumbill E (2012) What is Big Data In Planning for big data (pp 9-16) Sebastepol OacuteReilly Media Disponiacutevel na WWW httpeecswsuedu~yinghuimatcoursesfall202015resourcesplanning-for-big-datapdf

e-Infraestruture Reflection Group (e-IRG) (2016) Long Tail of Data e-IRG Task Force Report Disponiacutevel na WWW httpe-irgeudocuments10920238968LongTailOfData2016pdf

ELIXIR Portugal (2015) What is ELIXIR Portugal Disponiacutevel na WWW httpelixir-portugalorg

ePSI Scoreboard (2013) ePSI platform scoreboard Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesoverview_page_-_epsi_platform_scoreboardpdf

Etalab (2011) Licence Ouvert Disponiacutevel na WWW httpswwwetalabgouvfrenlicence-ouverte-open-licence

EUDAT(a) What is EUDAT Disponiacutevel na WWW httpseudateuwhat-eudat

121

EUDAT(b) B2FIND [Consultado a 22-05-2017] Disponiacutevel na WWW httpb2findeudateu

EUR-Lex (2003a) Directive 200398EC of the European Parliament and of the Council of 17 November 2003 on the re-use of public sector information Official Journal of the European Union 90-96 Disponiacutevel na WWW httpeur-lexeuropaeuLexUriServLexUriServdouri=OJL200334500900096enPDF

EUR-Lex (2003b) Directive 20034EC of the European Parliament and of the Council of 28 January 2003 on public access to environmental information and repealing Council Directive 90313EEC Official Journal of the European Union 26-32 Disponiacutevel na WWW httpeur-lexeuropaeuLexUriServLexUriServdouri=OJL200304100260032ENPDF

EUR-Lex (2011) COMMISSION DECISION of 12 December 2011 on the reuse of Commission documents (2011833EU) Official Journal of the European Union 39-42 Disponiacutevel na WWW httpeur-lexeuropaeuLexUriServLexUriServdouri=OJL201133000390042ENPDF

EUR-Lex (2012) COMMISSION RECOMMENDATION of 17 July 2012 on access to and preservation of scientific information (2012417EU) Official Journal of the European Union 39-43 Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentENTXTuri=celex3A32012H0417

EUR-Lex (2013) Directive 201337EU of the European Parliament and of the Council of 26 June 2013 amending Directive 200398EC on the re-use of public sector information Official Journal of the European Union 1ndash8 Disponiacutevel na WWW httpeur-lexeuropaeuLexUriServLexUriServdouri=OJL201317500010008ENPDF

EUR-Lex (2016) REGULAMENTO (UE) 2016679 DO PARLAMENTO EUROPEU E DO CONSELHO de 27 de abril de 2016 relativo agrave proteccedilatildeo das pessoas singulares no que diz respeito ao tratamento de dados pessoais e agrave livre circulaccedilatildeo desses dados e que revoga a Diretiva 9546CE (Regulamento Geral sobre a Proteccedilatildeo de Dados) Jornal Oficial da Uniatildeo Europeia 1-88 Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentPTTXTPDFuri=CELEX32016R0679ampfrom=PT

European Data Portal (2016) Conjuntos de dados [Consultado a 12-05-2017] Disponiacutevel na WWW httpswwweuropeandataportaleudataptdataset

European Research Area and Innovation Committee (ERAC) (2016) ERAC opinion on open research data (ERAC 120216) Disponiacutevel na WWW httpwwweartoeufileadmincontentWebsiteERAC_Opinion_on_Open_Research_DataPDF

Erway R Horton L Nurnberger A Otsuji R amp Rushing A (2016) Building blocks laying the foundation for a research data management program Dublin Ohio OCLC Research Disponiacutevel na WWW httpswwwoclcorgcontentdamresearchpublications2016oclcresearch-data-management-building-blocks-2016pdf

Expert Advisory Group on Data Acess (EAGDA) (2014) Establishing Incentives and changing cultures to support data acess Disponiacutevel na WWW httpswellcomeacuksitesdefaultfilesestablishing-incentives-and-changing-cultures-to-support-data-access-eagda-may14pdf

Executive Office of the President Office of Managment and Budget (2013) MEMORANDUM FOR THE HEADS OF EXECUTIVE DEPARTMENTS AND AGENCIES Open Data Policy - Managing Information as an Asset Disponiacutevel na WWW

122

httpsobamawhitehousearchivesgovsitesdefaultfilesombmemoranda2013m-13-13pdf

Fan W amp Bifet A (2012) Mining Bid Data Current Status and Forecast to the Future SIGKDDExplorations 14(2) 1-5 Disponiacutevel na WWW httpwwwkddorgexploration_filesV14-02-01-Fanpdf

Fecher B amp Friesike S (2013) Open Science One Term Five Schools of Thought In Bartling S amp Friesike (Eds) Opening Science (pp 17-47) New York Springer Disponiacutevel na WWW httpswwwresearchgatenetpublication236607487_Open_Science_One_Term_Five_Schools_of_Thought

FIWARE (2015) Porto a city that has become a real-time guide Disponiacutevel na WWW httpswwwfiwareorg20151120porto-a-city-that-has-become-a-real-time-guide

FORCE11 FAIR Data Publishing Group (2014) The FAIR Data Principles Disponiacutevel na WWW httpswwwforce11orggroupfairgroupfairprinciples

Forsstroumlm P amp Haataja J (2016) Open Science as an Instrument for Effective Research Disponiacutevel na WWW httpojstsvfiindexphpsignumarticleviewFile5874120303

FOSTER (2016) About FOSTER portal Disponiacutevel na WWW httpswwwfosteropenscienceeuabout

Fundaccedilatildeo para a Ciecircncia e Tecnologia [FCT] (2014) Poliacutetica sobre a Disponibilizaccedilatildeo de Dados e outros Resultados de Projetos de IampD Financiados Pela FCT Disponiacutevel na WWW httpswwwfctptdocumentosPoliticaAcessoAberto_Dadospdf

G20rsquos Anti-corruption Working Group (2014) G20 Anti-corruption Open Data Principles Disponiacutevel na WWW httpwwwg20utorontoca2015G20-Anti-Corruption-Open-Data-Principlespdf

Garcia M (2015) New businesses around open data smart cities and Fiware European Public Sector Information Platform Topic Report Nordm 201504 Disponiacutevel na WWW httpwwwinvesthorizoneuresourcesdocuments6263232145-New-Businesses-Around-Open-Data-Smart-Cities-FIWAREpdf

Garfield E (2006) The History and Meaning of the Journal Impact Factor Journal of the American Medical Association (JAMA) 293 90-93 Disponiacutevel na WWW httpgarfieldlibraryupennedupapersjifchicago2005pdf

GitHub (2017) Search [Consultado a 18-05-2017] Disponiacutevel na WWW httpsgithubcomsearchutf8=E29C93ampq=portugalamptype=

Gomes A amp Soares D (2014) Open government iniciatives in Europe nothern versus Southern countries analysis In ICEGOV2014 Outubro 27-30 Guimaratildees Portugal Disponiacutevel na WWW httphdlhandlenet182237172

Gonzalez-Zapata F amp Heeks R (2015) The multiple meanings of open government data understanding different stakeholders and their perspectives Government Information Quarterly 32(4) 441-452 Disponiacutevel na WWW httpsdoiorg101016jgiq201509001

123

Granickas K (2013) Understanding the impact of releasing and re-usinf open government data European Public Sector Information Platform Topic Report Nordm 2013 08 Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfileslibrary201308_understanding_the_impact_of_releasing_and_re_using_open_datapdf

Hahnel M amp Hook D (2016) Open by default In Treadway J et al The state of open data a selections of analyses and articles about open data curated by Figshare (pp 3-6) Disponiacutevel na WWW httpsfigsharecomarticlesThe_State_of_Open_Data_Report40363981

Harnad S et al (2004) The AccessImpact Problem and the green and gold roads to Open Access Serials Review 30(4) Disponiacutevel na WWW httpusersecssotonacukharnadTempimpacthtml

Harnad S amp Brody T (2004) Comparing the Impact of Open Access (OA) vs Non-AO Articles in the Same Journals D-Lib Magazine 10(6) Disponiacutevel na WWW httpwwwdliborgdlibjune04harnad06harnadhtml

Hernaacutendez-Peacuterez T (2016) En la era de la web de los datos primero datos abiertos despueacutes datos massivos El profesional de la informacioacuten 25(4) 517-525 Disponiacutevel na WWW httpsdoiorg103145epi2016jul01

Hey T Tansley S amp Tolle K (2009) Jim Gray on eScience A Transformed Scientific Method In Hey T Tansley S amp Tolle K (eds) (2009) The Fourth Paradigm Data-Intensive Scientific Discovery (pp 5-12) Microsoft Research Disponiacutevel na WWW httpwwwastrocaltechedu~georgeaybi1994th_paradigm_book_complete_lrpdf

Hogge B (2010) Open Data Study Open Society Institute Disponiacutevel na WWW httpwwwtransparencyinitiativeorgwpcontentuploads201105open_data_study_finalpdf

Houghton J amp Swan A (2013) Planting the green seeds for a golden harvest Comments and clarifications on ldquoGoing for Goldrdquo D-Lib Magazine 19 1ndash2 Disponiacutevel na WWW httpdoiorg101045january2013-houghton

Huijboom N van den Broek T (2011) Open Data an internacional comparison of strategies European Journal of ePractice 12 4-16 Disponiacutevel na WWW httpsjoinupeceuropaeusitesdefaultfiles76a705ePractice20Journal-20Vol2012-March_April202011pdf

Internacional Council for Science (ICSU) (2014) Open acess to scientific data and literature and the assessement of research by metrics Disponiacutevel na WWW httpwikilibsunaczaimagesbb8Icsu-report-on-open-accesspdf

International Open Data Charter (2015) Open Data Charter Disponiacutevel na WWW httpopendatacharternet

International Workshop on Open Data for Science and Sustainability in Developing Countries (2014) Data Sharing Principles in Developing Countries (The Nairobi Data Sharing Principles)

124

Disponiacutevel na WWW httpswwwrd-allianceorgsitesdefaultfilesattachmentNairobiDataSharingPrinciplespdf

Janssen M (2011) The influence of the PSI directive on open government data an overview of recent developments Government Information Quaterly 28 446-456 Disponiacutevel na WWW httpsdoiorg101016jgiq201101004

Janssen M Charalabidis Y amp Zuiderwijk A (2012) Benefits adoption barriers and myths of open data and open government Information Systems Management 4 258-268 Disponiacutevel na WWW httpwwwtandfonlinecomdoiabs101080105805302012716740

Jenssen K (2012) Open Government Data and the right to information opportunities and obstacles The Journal of Community Informatics 8 (2) Disponiacutevel na WWW httpci-journalnetindexphpciejarticleview952

Koski H (2015) The impact of open data ndash a preliminary study Ministry of Finance publications 15b2015 Disponiacutevel na WWW httpswwww3org2013share-psiwikiimages667Impact_of_Open_Data_in_the_Public_Sector_Koski_2015pdf

Kramer B amp Bosman J (2016) Innovations in Scholarly Communication [Consultado a 24-02-2017] Disponiacutevel na WWW https101innovationswordpresscom

Laakso M (2014) Green open access policies of scholarly journal publishers A study of what when and where self-archiving is allowed Scientometrics 99(2) 475ndash494 Disponiacutevel na WWW httpdoiorg101007s11192-013-1205-3

Laumlmmerhirt D (2016) PASTEUR4OA Briefing Paper Disciplinary differences in opening research data Disponiacutevel na WWW httpwwwpasteur4oaeuresources209

Laney D (2001) 3-D Data Management Controlling DataVolume Velocity and Variety META Group Disponiacutevel na WWW httpswwwnoexperiencenecessarybookcom8VeXJ3d-data-management-controlling-data-volume-velocity-and-varietyhtml

Lei nordm 462007 de 24 de Agosto Regula o acesso aos documentos administrativos e a sua reutilizaccedilatildeo revoga a Lei nordm 6593 de 26 de Agosto com a redaccedilatildeo introduzida pelas Lei nordm 895 de 29 de Marccedilo e 9499 de 16 de Julho e transpotildee para a ordem juriacutedica nacional a Diretiva nordm 200398CE do Parlamento e do Conselho de 17 de Novembro relativa agrave reutilizaccedilatildeo de informaccedilotildees do sector puacuteblico Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 163 (2007) 5680-5687 Disponiacutevel na WWW httpswwwfctptarquivodocsLei46_2007pdf

Lei nordm 362011 de 21 de Junho Estabelece a adopccedilatildeo de normas abertas nos sistemas informaacuteticos do Estado Diaacuterio da Repuacuteblica 1ordf seacuterie mdash Nordm 118 (2011) 3599-3600 Disponiacutevel na WWW httpsm6amaptdocsLei362011-NormasAbertaspdf

Lei nordm 262016 de 22 de Agosto Aprova o regime de acesso agrave informaccedilatildeo administrativa e ambiental e de reutilizaccedilatildeo dos documentos administrativos transpondo a Diretiva 20034CE do Parlamento Europeu e do Conselho de 28 de janeiro e a Diretiva 200398CE do Parlamento Europeu e do Conselho de 17 de novembro Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 160 (2016) 2777-2788 Disponiacutevel na WWW httpsdreptapplicationconteudo75177801

125

Leonelli S (2016) Why open data now Big data knowledge production and the political economy of research In Treadway J et al The state of open data a selections of analyses and articles about open data curated by Figshare (pp 7-11) Disponiacutevel na WWW httpsfigsharecomarticlesThe_State_of_Open_Data_Report40363981

Leonelli S Spichtinger D and Prainsack B (2015) Sticks and carrots encouraging open science at its source Geography and Environment 2 12ndash16 Disponiacutevel na WWW httponlinelibrarywileycomenhancedexportCitationdoi101002geo22

Lisboa Cacircmara Municipal (2016) Smart Open Lisboa Disponiacutevel na WWW httpwwwsmartopenlisboacom

Lisboa Cacircmara Municipal (2017) Lisboa Aberta [Consultado a 12-05-2017] Disponiacutevel na WWW httpdadoscm-lisboaptdataset

Lynch C (2009) Jim Grayrsquos Fourth Paradigm and the Construction of the Scientific Record In Hey T Tansley S amp Tolle K (eds) (2009) The Fourth Paradigm Data-Intensive Scientific Discovery (pp 177-183) Microsoft Research Disponiacutevel na WWW httpwwwastrocaltechedu~georgeaybi1994th_paradigm_book_complete_lrpdf

Machado Jorge (2015) Open Data and Open Science In Albagli S Maciel M amp Abdo A (Eds) Open Science Open Issues 189-214 Brasiacutelia IBICT Rio de Janeiro Unirio Disponiacutevel na WWW httplivroabertoibictbrbitstream110611Open20Science20open20issues_Digitalpdf

Manyika J Chui M Brown B Bughin J Dobbs R Roxburgh C amp Byers A H (2011) Big Dat The next frontier for innovation competition and productivity McKinsey Global Institute Disponiacutevel na WWW httpwwwmckinseycombusiness-functionsdigital-mckinseyour-insightsbig-data-the-next-frontier-for-innovation

Marr B (2014) Big Data The 5 Vs Everyone Must Know Disponiacutevel na WWW httpswwwlinkedincompulse20140306073407-64875646-big-data-the-5-vs-everyone-must-know

Naccedilotildees Unidas (2015) Addis Ababa Action Agenda of the Third International Conference on Financing for Development (Addis Ababa Action Agenda) Disponiacutevel na WWW httpssustainabledevelopmentunorgcontentdocuments2051AAAA_Outcomepdf

National Institutes of Health (NIH) (2008) NIH Guide Notice for Public Access Disponiacutevel na WWW httpgrantsnihgovgrantsguidenotice-filesNOT-OD-08-033html

Nature Springer (2016) Over 600 Springer Nature journals commit to new data sharing policies Disponiacutevel na WWW httpwwwspringernaturecombrgroupmediapress-releasesover-600-springer-nature-journals-commit-to-new-data-sharing-policies11111248

OECD (2007) Principles and Guidelines for Access to Research Data from Public Funding Paris OECD Publishing Disponiacutevel na WWW httpwwwoecdorgstisci-techoecdprinciplesandguidelinesforaccesstoresearchdatafrompublicfundinghtm

126

OECD (2013) Open Government data In Government at a Glance 2013 (pp 140-142) Paris OECD Publishing Disponiacutevel na WWW httpdxdoiorg101787gov_glance-2013-48-en

OECD (2015a) Making Open Science a Reality OECD Science Tecnology and Industy Policy Papers 25 Paris OECD Publications Disponiacutevel na WWW httpdoiorg1017875jrs2f963zs1-en

OECD (2015b) Assessing government initiatives on public sector information A review of the OECD Council Recommendation OECD Digital Economy Papers 248 Paris OECD Publishing Disponiacutevel na WWW httpdxdoiorg1017875js04dr9l47j-en

OECD (2016a) Open Government Data Disponiacutevel na WWW httpwwwoecdorggovdigital-governmentopen-government-datahtm

OECD (2016b) Observatory of Public Sector Innovation Disponiacutevel na WWW httpswwwoecdorggovernanceobservatory-public-sector-innovationhome

Olavsrud T (2013 Abril 05) 10 intriguing real-world uses for big data Computer World Disponiacutevel na WWW httpwwwcomputerworldcomarticle2473691big-data92712-10-Real-World-Big-Data-Deployments-That-Will-Change-Our-Liveshtml

Open Acess Directory (2016) Data repositories [Consultado a 22-02-2017] Disponiacutevel na WWW httpoadsimmonseduoadwikiData_repositories

OpenAIRE Research Data [Consultado a 12-05-2017] Disponiacutevel na WWW httpswwwopenaireeusearchfinddatasetskeyword=

OpenAIRE (2017) About OpenAIRE-Connect Disponiacutevel na WWW httpswwwopenaireeuconnect

Open and Agile Smart Cities (OASC) (2017) Cities [Consultado a 17-05-2017] Disponiacutevel na WWW httpwwwoascitiesorglist-of-cities

Open Data for Development Network (OD4D[a]) About OD4D [Consultado a 16-02-2017] Disponiacutevel na WWW httpod4dcomabout

Open Data for Development Network (OD4D[b]) Open Data Impact Map [Consultado a 16-02-2017] Disponiacutevel na WWW httpopendataimpactmaporgindexhtml

Open Data for Development Network (OD4D) (2016) Summary report and the Second Action Plan for International Collaborations International Open Data Roadmap International Open Data Conference 2016 6-7 outubro Madrid Espanha Disponiacutevel na WWW httpod4dcomroadmapassetsfilesreport-iodc-2016-webpdf

Open Data Institute (ODI) (2012) About the ODI Disponiacutevel na WWW httptheodiorgabout

Open Data Institute (ODI) (2015) Open Data Maturity Model assessing your open data publishing and use Disponiacutevel na WWW httpsptscribdcomdocument260481608ODI-Maturity-Model-Guide-Assessing-your-open-data-publishing-and-use

127

Open Data Soft (2017) A comprehensive list of 2600+ Open Data portals around the world [Consultado a 15-04-2017] Disponiacutevel na WWW httpswwwopendatasoftcoma-comprehensive-list-of-all-open-data-portals-around-the-world

Open Government Partnership (OGP) (2011) Open Government Declaration Disponiacutevel na WWW httpswwwopengovpartnershiporgopen-government-declaration

Open Government Partnership (OGP) (2015) What is the Open Government Partnership Disponiacutevel na WWW httpwwwopengovpartnershiporg

Open Government Partnership (OGP) (2016) PARIS DECLARATION 4th Global Summit of the Open Government Partnership Disponiacutevel na WWW httpwwwopengovpartnershiporgsitesdefaultfilesOGP-Summit_PARIS-DECLARATION_ENpdf

Open Knowledge International (OKI [a]) Open Definition 21 Disponiacutevel na WWW httpopendefinitionorgod21en

Open Knowledge International (OKI [b]) Linked Open Vocabularies [Consultado a 31-01-2017] Disponiacutevel na WWW httplovokfnorgdatasetlov

Open Knowledge International (OKI [c]) Open Data Commons Disponiacutevel na WWW httpopendatacommonsorg

Open Knowledge International (OKI [d]) Datahub [Consultado a 18-02-2017] Disponiacutevel na WWW httpsdatahubio

Open Knowledge International (OKI) (2012a) The Open Data Handbook Disponiacutevel na WWW httpopendatahandbookorgguideen

Open Knowledge International (OKI) (2012b) What is open Disponiacutevel na WWW httpsokfnorgopendata

Open Knowledge International (OKI) (2014) Portugal Open Data Census Disponiacutevel na WWW httppt-citycensusokfnorgyear2014

Open Knowledge International (OKI) (2017) Global Open Data Index Disponiacutevel na WWW httpindexokfnorgplace

Open Knowledge International Working Group on Open Government Data () Open Government Data Disponiacutevel na WWW httpopengovernmentdataorg

Open Science and Research Iniciative (2014) The Open Science and Research Handbook Disponiacutevel na WWW httpsavointiedefidocuments142730Open+Science+and+Research+Handbook+v1050316d5d-440b-4496-b039-2997663afff8

Open Science Monitor (2015) Open Science Monitor Disponiacutevel na WWW httpopendatamonitoreu

128

Pangea (2017) Search [Consultado a 18-05-2017] Disponiacutevel na WWW httpswwwpangaeadeq=Portugal

Panton Principles (2010) Panton Principles Principles for open data in science Disponiacutevel na WWW httppantonprinciplesorg

Pasqueto I Sands A amp Borgman C (2015 novembro) Exploring openess in data and science What is ldquoopenrdquo to whom when and why Apresentado em ASIST 2015 6 - 10 Novembro St Louis MO USA Disponiacutevel na WWW httponlinelibrarywileycomdoi101002pra220151450520100141full

Pontika N Knoth P Cancellieri M amp Pearce S (2015 outubro) Fostering Open Science to Research using a Taxonomy and an eLearning Portal Apresentado em I-KNOW rsquo15 Proceedings of the 15th International Conference on Knowledge Technologies and Data-Driven Busines 21 - 22 Outubro 2015 1ndash8 Graz Austria Disponiacutevel na WWW httpdoiorg10114528095632809571

Pontika N Knoth P Cancellieri M amp Pearce S (2015) Open Science Taxonomy Figshare Disponiacutevel na WWW httpsdxdoiorg106084m9figshare1508606v3

Portal de Dados de Biodiversidade de Portugal (2016) Dados [Consultado a 18-05-2017] Disponiacutevel na WWW httpdadosgbifpt

Portaria nordm 2852015 de 15 de setembro do Ministeacuterio da Educaccedilatildeo e Ciecircncia Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 180 (2015) 8011-8014 Disponiacutevel na WWW httpsdreptapplicationconteudo70297426 Porto Cacircmara Municipal Dados Abertos para uma cidade mais inteligente [Consultado a 22-05-2017] Disponiacutevel na WWW httpdadosabertoscm-portoptabout

Portugal Governo (2017) Portal da Transparecircncia Municipal [Consultado a 20-05-2017] Disponiacutevel na WWW httpswwwportalmunicipalpthomelocale=pt

Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior Ministeacuterio da Cultura (2016) Diretoacuterio dos Repositoacuterios Digitais Disponiacutevel na WWW httprepositorios-conhecimentopt

Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior (MCTES) (2016) Ciecircncia Aberta Conhecimento para todos Princiacutepios orientadores Disponiacutevel na WWW httpwwwportugalgovptmedia1850619920160210-mctes-ciencia-abertapdf

Price D amp Chaytor S (2015) Open Access is a national licence the answer Disponiacutevel na WWW httpwwwhepiacuk20150330open-access-national-licence-answeruna-licencia-nacional-es-la-respuesta

Proumll S Meixner K amp Rauber A (2016) Precise Data Identification Services for Long Tail Research Data Proceedings of International Conference on Digital Preservation Bern Switzerland Disponiacutevel na WWW httpswwwrd-allianceorgsystemfilesdocumentsiPRES2016-Proellpdf

129

Rans J Day M Duke M amp Ball A (2013) Enabling the citation of datasets generated through public health research (DCC) 41 Retrieved from httpswellcomeacuksitesdefaultfilesenabling-citation-of-datasets-through-public-health-research-phrdf-2013PDF

RECODE (2014) Policy recommendations for open access to research data Disponiacutevel na WWW httprecodeprojecteuwp-contentuploads201501recode_guideline_en_web_version_full_FINALpdf

Registry of Open Access Repository Mandates and Policies (ROARMAP) Browse [Consultado a 25-11-2016] Disponiacutevel na WWW httproarmapeprintsorgviewcountry620html

Reitano S (2013) The Benefits of Open Data Royal Roads University Disponiacutevel na WWW httpdocplayernet589190-The-benefits-of-open-datahtml

Resoluccedilatildeo do Conselho de Ministros nordm 912010 Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 225 (2010) 5288-5307 Disponiacutevel na WWW httpsdreptapplicationdirpdf1s201011225000528805307pdf

Resoluccedilatildeo do Conselho de Ministros nordm 212016 Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 70 (2016) 1191-1193 Disponiacutevel na WWW httpsdreptapplicationconteudo74094659

Research Data Alliance (RDA) (2015) 23 Things Libraries for Research Data Disponiacutevel na WWW httpswwwrd-allianceorgsystemfilesdocuments23Things_Libraries_For_Data_Managementpdf

Ribeiro C et al (2016) Projeto TAIL ndash Gestatildeo de dados de investigaccedilatildeo da produccedilatildeo ao depoacutesito e agrave partilha (resultados preliminares) Cadernos BAD 2 (jul-dez) 256-264 Disponiacutevel na WWW httpwwwbadptpublicacoesindexphpcadernosarticleviewFile1603pdf

Rouder J (2016) The what why and how of born-open data Behavior Research Methods 48(3) 1062-1069 Disponiacutevel na WWW httplinkspringercomarticle103758s13428-015-0630-z

Royal Society (2012) Science as an Open Enterprise The Royal Society Policy Centre Report 0212 Disponiacutevel na WWW httpsroyalsocietyorgtopics-policyprojectsscience-public-enterprisereport

Sasse T Smith A Broad E Tennison J Wells P amp Atz U (2017) Recomendations for Open Data Portals from Setup to sustainability Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_s3wp4_sustainability_recommendationspdf

Schiermeier Q (2015 Dezembro 04) Pirate research-paper sites play hide-and-seek with publishers Nature Internacional weekly journal of science Disponiacutevel na WWW httpwwwnaturecomnewspirate-research-paper-sites-play-hide-and-seek-with-publishers-118876

130

Science International (2015) Open Data in a Big Data World Paris International Council for Science (ICSU) International Social Science Council (ISSC) The World Academy of Sciences (TWAS) InterAcademy Partnership (IAP) Disponiacutevel na WWW httpwwwscience-internationalorgsitesdefaultfilesreportsopen-data-in-big-data-world_short_enpdf

Science International (2016) About Science International Disponiacutevel na WWW httpwwwscience-internationalorgabout

ScienceOpen (2017) About ScienceOpen Disponiacutevel na WWW httpaboutscienceopencomcategoryabout-scienceopen

Sci-Hub About Disponiacutevel na WWW httpsci-hubio

Shadbolt N (2016) Foreword In Treadway J et al The state of open data a selections of analyses and articles about open data curated by Figshare (pp 2) Disponiacutevel na WWW httpsfigsharecomarticlesThe_State_of_Open_Data_Report40363981

SHERPAJULIET Research funders open access policies [Consultado a 26-11-2016] Disponiacutevel na WWW httpsherpaacukjulietindexphpla=enampmode=simple

SHERPARoMEO Publisher copyright policies amp self-archiving [Consultado a 26-11-2016] Disponiacutevel na WWW httpsherpaacukromeoindexphpla=enampfIDnum=1109|1ampmode=advanced

Soares N Baptista A amp Lima A (2015) Estudo Open Data Municiacutepios Quadrilaacutetero Disponiacutevel na WWW httpwwwccgptwp-contentuploads201510OpendataQuadrilatero_Estudopdf

SPARC Open Data Disponiacutevel na WWW httpsparcopenorgopen-data

Sponsoring Consortium for Open Access Publishing in Particle Physics (SCOAP3) (2014) What is SCOAP3 Disponiacutevel na WWW httpsscoap3orgwhat-is-scoap3

Statement on Data Sharing in Public Health Emergencies (2016) Disponiacutevel na WWW httpblogsplosorgplos201602statement-on-data-sharing-in-public-health-emergencies

Sturges P Bamkin M Anders J Hubbard B Hussain A amp Heeley M (2015) Research data sharing developing a stakeholder-driven model for journal policies Journal of the Association for Information Science and Technology 66(12) 2445-2455 Disponiacutevel na WWW httponlinelibrarywileycomdoi101002asi23336abstract

Suber P (2008) Open Access News Disponiacutevel na WWW httplegacyearlhamedu~petersfos200808greengold-oa-and-gratislibre-oahtml

Suber P (2009) Ten challenges for open-access journals SPARC Open Access Newsletter 138 Disponiacutevel na WWW httplegacyearlhamedu~petersfosnewsletter10-02-09htm

Suber P (2012) Open Access Cambridge MIT Press Disponiacutevel na WWW httpsmitpressmitedusitesdefaultfiles9780262517638_Open_Access_PDF_Versionpdf

131

Sunlight Foundation (2010) Ten Principles for Opening Up Government Information Disponiacutevel na WWW httpssunlightfoundationcompolicydocumentsten-open-data-principles

Sunlight Foundation (2013) Public Policy for Public Data Disponiacutevel na WWW httpwhatworkscitiessunlightfoundationcomsection-h2-02

Sunlight Foundation (2014) Guidelines for Open Data Policies Disponiacutevel na WWW httpssunlightfoundationcomopendataguidelines

Sunlight Foundation Open Data Policy Collection [Consultado a 12-05-2017] Disponiacutevel na WWW httpwwwopendatapoliciesorgbrowse

Swan A (2010) The open access citation advantage studies and results to date Disponiacutevel na WWW httpeprintssotonacuk2685162Citation_advantage_paperpdf

Swan A (2012) Diretrizes para as Poliacuteticas de desenvolvimento do acesso aberto UNESCO Paris Disponiacutevel na WWW httpunesdocunescoorgimages0021002158215863epdf

Tauberer Joshua (2014) Open Government Data The Book (2ordf ed) Disponiacutevel na WWW httpsopengovdataio20148-principles

Taunabaum G Implementing an Open Data Policy a SPARC Primer for Research Funders Disponiacutevel na WWW httpssparcopenorgwp-contentuploads201601sparc-open-data-primer-finalpdf

Transparecircncia e Integridade Associaccedilatildeo Ciacutevica (2016) Iacutendice de Transparecircncia Municipal Disponiacutevel na WWW httpstransparenciaptindice-de-transparencia-municipal

The UN Secretary Generals Independent Expert Advisory Group on a Data Revolution for Sustainable Development (2014a) UN Data Revolution Disponiacutevel na WWW httpwwwundatarevolutionorg

The UN Secretary Generals Independent Expert Advisory Group on a Data Revolution for Sustainable Development (2014b) A world that counts mobilising the data revolution for sustainable development Disponiacutevel na WWW httpwwwundatarevolutionorgwp-contentuploads201411A-World-That-Countspdf

The World Bank (2016) Open Government Data Toolkit Disponiacutevel na WWW httpopendatatoolkitworldbankorgenindexhtml

Ubaldi B (2013) Open Government Data Towards empirical analysis of open government data initiatives Disponiacutevel na WWW httpwwwoecd-ilibraryorggovernanceopen-government-data_5k46bj4f03s7-en

UK Data Archive (2017) Create amp Manage Data Research Data Lifecycle Disponiacutevel na WWW httpwwwdata-archiveacukcreate-managelife-cycle

UK The National Archives Open Government Licence for Public Sector Information Disponiacutevel na WWW httpwwwnationalarchivesgovukdocopen-government-licenceversion3

132

UNESCO (2015) Concepts of Openness and Open Access Open Access for Researchers Paris UNESCO Disponiacutevel na WWW httpunesdocunescoorgimages0023002322232207Epdf Uniatildeo Europeia (2013) REGULAMENTO (UE) Nordm 12912013 DO PARLAMENTO EUROPEU E DO CONSELHO de 11 de dezembro de 2013 Jornal Oficial da Uniatildeo Europeia Disponiacutevel na WWW httpeceuropaeuresearchparticipantsdatarefh2020legal_basisfph2020-eu-establact_ptpdf

Uniatildeo Europeia (2017) European Union Open Data Portal [Consultado a 12-05-2017] Disponiacutevel na WWW httpdataeuropaeueuodpendata

United Nations Statistics Division (2017) UN data a world of information [Consultado a 13-05-2017] Disponiacutevel na WWW httpdataunorgSearchaspxq=Portugalampt=Data

United States General Services Administration Datagov Disponiacutevel na WWW httpswwwdatagovopen-gov

Universidade do Minho (2017) Open Access Disponiacutevel na WWW httpsopenaccesssdumuminhoptpage_id=352

Universidade do Porto Faculdade de Engenharia (2017) Dendro The convergence between data management and description Disponiacutevel na WWW httpdendrofeupptblogindexphpdendro

Welcome Trust (2013) Open access policy Disponiacutevel na WWW httpswellcomeacukfundingmanaging-grantopen-access-policy

Whyte A amp Donnely M (2016) Common directions in research data policy a briefing for iInstitutions DCC Briefing Papers Edinburgh Digital Curation Centre Disponiacutevel na WWW httpwwwdccacukresourcesbriefing-paperscommon-directions-research-data-policycommon-directions-research-data-pol

World Council on City Data (2016) Data Portal [Consultado a 12-04-2017] Disponiacutevel na WWW httpopendataforcitiesorg

World Wide Web Consortium [W3C] (2014) Data Catalog Vocabulary (DCAT) Disponiacutevel na WWW httpswwww3orgTRvocab-dcat

World Wide Web Consortium [W3C] (2015) Linked Data Disponiacutevel na WWW httpswwww3orgstandardssemanticwebdata

World Wide Web Foundation (2014 maio) Towards common methods for assessing open data workshop report amp draft framework Apresentado em Towards common methods for assessing open data 2014 8 - 9 Maio Nova Iorque EUA Disponiacutevel na WWW httpopendataresearchorgsitesdefaultfilespostsCommon20Assessment20Workshop20Reportpdf

World Wide Web Foundation (2017) ODB Global Report Fourth Edition Disponiacutevel na WWW httpopendatabarometerorgdoc4thEditionODB-4thEdition-GlobalReportpdf

133

Zuiderwijk A Gasco M Parycek P amp Janssen M (2014) Special issue on transparency and open data policies guest editors introduction Journal of theoretical and applied electronic commerce research 9(3) I-IX Disponiacutevel na WWW httpwwwscieloclscielophpscript=sci_arttextamppid=S0718-18762014000300001

Zuiderwijk A amp Janssen M (2014) Open data policies their implementation and impact a comparison Framework Government Information Quaterly 31(1) 17-29 Disponiacutevel na WWW httpwwwsciencedirectcomsciencearticlepiiS0740624X13001202

134

LISTA DE SIGLAS AA - Acesso Aberto AMA - Agecircncia para a Modernizaccedilatildeo Administrativa APC - Article Processing Charge API - Application Programming Interface APIS - Arquivo Portuguecircs de Informaccedilatildeo Social BOAI - Budapest Open Access Initiative CA - Ciecircncia Aberta CADA - Comissatildeo de Aceso aos Documentos Administrativos CC - Creative Commons CERN - European Organization for Nuclear Research CML - Cacircmara Municipal de Lisboa DCAT - Data Catalog Vocabulary DCC - Digital Curation Center DDI - Data Documentation Initiative DGA - Dados Governamentais Abertos DMP - Data Management Plan DOAJ - Directory of Open Access Journals DOI - Digital Object Identifier EAGDA - Expert Advisory Group on Data Access e-IRG - e-Infrastructure Reflection Group EOSC - European Open Science Cloud ERAC - European Research Area and Innovation Committee EU - Uniatildeo Europeia EUA - Estados Unidos da Ameacuterica FCCN - Fundaccedilatildeo para a Computaccedilatildeo Cientiacutefica Nacional FCT - Fundaccedilatildeo para a Ciecircncia e Tecnologia FI - Fator de Impacto FOI - Freedom of Information FOSTER - Facilitate Open Science Training for European Research GBIF - Global Biodiversity Information Facility ICSU - International Council for Science INE - Instituto Nacional de Estatiacutestica IPCB - Instituto Politeacutecnico de Castelo Branco ITM - Iacutendice de Transparecircncia Municipal JISC - Joint Information Systems Committee MCTES - Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior NIH - National Institutes of Health OAI-PMH - Open Archive Initiative ndash Protocol for Metadata Harvesting OD4D - Open Data for Development

135

ODC - Open Data Commons ODIN - Open Data Inventory ODRA - Open Data Readiness Assessment OECD - Organizaccedilatildeo para a Cooperaccedilatildeo e Desenvolvimento Econoacutemico OGD - Open Government data OGL - Open Government Licence OGP - Open Government Partnership OGWG - Open Government Working Group OKI - Open Knowledge International OpenDOAR - Directory of Open Access Repositories PLOS - Public Library of Science PSI - Public Sector Information RCAAP - Repositoacuterio Cientiacutefico de Acesso Aberto de Portugal RDA - Research Data Aliance RDF - Resource Description Framework Re3data - Registry of Research Data Repositories ROARMAP - Registry of Open Access Repository Mandates and Policies SARDC - Serviccedilo de Alojamento de Repositoacuterio de Dados Cientiacuteficos SCOAP3 - Sponsoring Consortium for Open Access Publishing in Particle Physics SNIAmb - Sistema Nacional de Informaccedilatildeo de Ambiente SOAP - Study of Open Access Publishing SPARC - Scholarly Publishing and Academic Resources Coalition W3C - World Wide Web Consortium

136

IacuteNDICE DE FIGURAS

Fig 1 Os pilares da Ciecircncia Aberta 17 Fig 2 As 5 escolas de pensamento das mudanccedilas operadas pela Ciecircncia Aberta 18 Fig 3 Caracteriacutesticas e indicadores do Open Science Monitor 20 Fig 4 Taxonomia da Ciecircncia Aberta 22 Fig 5 Paradigmas da investigaccedilatildeo cientiacutefica 25 Fig 6 Cadeia de abastecimento dos Dados Massivos 27 Fig 7 A cauda longa dos Dados Massivos 28 Fig 8 Ciclo de vida dos dados de investigaccedilatildeo 31 Fig 9 Tipos de dados cientiacuteficos 34 Fig 10 Esquema de classificaccedilatildeo das 5 estrelas para Dados Abertos Ligados 35 Fig 11 Pilares dos Dados Governamentais Abertos 40 Fig 12 Perspetivas da abertura dos dados governamentais 44 Fig 13 Esquema de classificaccedilatildeo das 5 estrelas para as iniciativas de abertura de dados que envolvem os utilizadores 45 Fig 14 Esquema de classificaccedilatildeo das 5 estrelas para os portais de dados 50 Fig 15 Princiacutepios FAIR Data 61 Fig 16 Estrutura de avaliaccedilatildeo de poliacuteticas de Dados Abertos 67

137

IacuteNDICE DE QUADROS

Quadro 1 Princiacutepios de abertura de dados de investigaccedilatildeo mais recomendados 33 Quadro 2 Princiacutepios de abertura mais recomendados pelas iniciativas de Dados Governamentais Abertos 43 Quadro 3 Visatildeo geral sobre o contexto conteuacutedo e desempenho da poliacutetica de Dados Abertos em Portugal com base no esquema delineado por Zuiderwijk e Janssen (2014) 85 Quadro 4 Comparaccedilatildeo dos resultados de abertura de dados atribuiacutedos pelas vaacuterias iniciativas de avaliaccedilatildeo 95 Quadro 5 Portais de dados abertos existentes em Portugal 97

138

IacuteNDICE DE GRAacuteFICOS

Graacutefico 1 Nuacutemero de datasets publicados no SARDC nos anos seguintes agrave sua criaccedilatildeo 80 Graacutefico 2 Maiores fornecedores de dados do portal nacional 87 Graacutefico 3 Tipologia dos fornecedores de dados do portal nacional 88 Graacutefico 4 Tipologia das categorias de dados do portal nacional 88

Page 5: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação

iii

Aos meus pais Gracinda e Fernando

Agrave Sara namorada companheira e amiga

iv

v

AGRADECIMENTOS

O sucesso neste percurso acadeacutemico deve-se tambeacutem a todos os que me apoiaram incentivaram e inspiraram nos melhores e nos piores momentos tornando o caminho mais faacutecil de percorrer Espero que as palavras seguintes faccedilam justiccedila ao sentimento de agradecimento que pretendo transmitir

Agrave Professora Doutora Maria Manuel Borges a quem devo a introduccedilatildeo a este tema pela total disponibilidade pelo aconselhamento acadeacutemico e profissional espiacuterito criacutetico pela confianccedila depositada pela sua amizade e pelo privileacutegio de poder trabalhar com algueacutem por quem se nutre admiraccedilatildeo

Agrave Professora Doutora Daniela de Filippo pelo aconselhamento orientaccedilatildeo espiacuterito criacutetico e amizade que foram importantes durante o uacuteltimo ano

Agrave Sara cujo apoio paciecircncia e amor foram fundamentais ao longo deste percurso

Aos meus pais que nunca me deixaram desistir deste sonho

Agrave Ana Luiacutesa Ribeiro colega e amiga cujo esforccedilo me permitiu assistir a todas as aulas do mestrado

Agrave Cristina Caetano colega de mestrado e amiga pelo apoio incentivo partilha de ideias e espiacuterito criacutetico

Aos colegas Daniel Gonccedilalves Rosa Gomes e Quele pelo companheirismo amizade boa energia e pelas trocas de ideias ao almoccedilo agraves quintas-feiras

A todos os professores deste ciclo acadeacutemico pela mestria e paixatildeo com que transmitiram conhecimentos e me tornaram melhor profissional da informaccedilatildeo

vi

vii

A mente que se abre a uma nova ideia jamais volta ao seu tamanho inicial

Albert Einstein

viii

ix

RESUMO

A abertura de dados cientiacuteficos e de dados do setor puacuteblico eacute garantida por poliacuteticas de Dados Abertos que na sua constituiccedilatildeo recomendam ou mandatam a livre disponibilizaccedilatildeo de dados A um niacutevel macro a Uniatildeo Europeia atraveacutes do seu programa de financiamento de investigaccedilatildeo implementou um piloto de Dados Abertos que atualmente abrange todas as aacutereas de investigaccedilatildeo financiadas O acordo de financiamento mandata a abertura de todos os dados de investigaccedilatildeo subjacentes agraves publicaccedilotildees cientiacuteficas A Uniatildeo Europeia tem tambeacutem publicado legislaccedilatildeo referente agrave abertura de dados do setor puacuteblico que eacute transposta para as normas juriacutedicas de cada estado-membro onde Portugal natildeo eacute exceccedilatildeo Foram tambeacutem observadas as diversas iniciativas que visam medir a abertura de dados puacuteblicos a niacutevel europeu e mundial

O objetivo geral do trabalho eacute analisar a implementaccedilatildeo de poliacuteticas de Dados Abertos em Portugal Dado o diferente enquadramento legislativo relativamente aos dados de investigaccedilatildeo e aos dados do setor puacuteblico foram elencadas as poliacuteticas existentes para os diferentes tipos de dados A abertura de dados de investigaccedilatildeo situa-se ainda numa fase prematura natildeo sendo ainda visiacuteveis resultados da implementaccedilatildeo da Resoluccedilatildeo do Conselho de Ministros nordm212016 Ao niacutevel dos dados do setor puacuteblico abertura processou-se atraveacutes da transposiccedilatildeo da Diretiva 200398CE para as normas juriacutedicas portuguesas em 2007 e novamente em 2016 Usando o modelo de Zuiderwijk e Janssen (2014) foi elaborada uma estrutura para a avaliaccedilatildeo do conteuacutedo contexto e indicadores de desempenho da poliacutetica de abertura de dados do setor puacuteblico permitindo obter uma visatildeo geral do valor puacuteblico alcanccedilado Foram confrontados os resultados obtidos por esta anaacutelise com os indicadores de abertura provenientes de algumas iniciativas de avaliaccedilatildeo de impacto da abertura de dados do setor puacuteblico e com a informaccedilatildeo prestada pela AMA O ecossistema portuguecircs de Dados Governamentais Abertos encontra-se jaacute numa fase mais avanccedilada revelando a existecircncia do portal de dados nacional (dadosgov) e de diversos portais de entidades puacuteblicas e ateacute do setor privado que disponibilizam dados de forma aberta Esses portais foram analisados para se perceber se os conjuntos de dados cumpriam os requisitos de abertura definidos pela Open Knowledge International

Palavras-chave Dados Abertos Dados Governamentais Abertos poliacuteticas de Dados Abertos impacto avaliaccedilatildeo

x

xi

ABSTRACT

The openness of scientific data and public sector data is granted by Open Data policies which recommend or mandate free availability of data At a macro level the European Union through its research funding program implemented an Open Data pilot that now is extended to all the funded research areas The model agreement sets the openness of all the data underlying scientific publications The European Union has also published legislation referring to the openness of public sector information which is transposed to the legal system of each state member where Portugal is no exception We also analysed the different initiatives that aim to measure the openness of public data at European and global level

The main goal of this academic work is to analyse the implementation of Open Data policies in Portugal Given the different legal framework between scientific data and public sector data wersquove considered and listed the policies regarding both type of data The openness of scientific data is still in a premature phase which means that the results of the implementation of Resoluccedilatildeo do Conselho de Ministros nordm212016 are not visible yet In terms of public sector data the openness has started with the transposition of the EU Directive 200398EC to the Portuguese juridical system in 2007 and again in 2016 Using Zuiderwijk e Janssenrsquos (2014) model it was elaborated a structure to assess the context content and performance indicators of public sector open data policies which allows to obtain a general vision of public value achieved The results produce by this analysis were confronted with the openness indicators generated by some public sector data impact assessment initiatives and also with the information disclosed by AMA The Portuguese ecosystem of Open Governmental Data is in a more advanced phase disclosing the existence of a national data portal (dadosgov) and data portals from public institutions and even from the private sector which made data available in an open manner These data portals were analysed to understand if they fulfil all the openness requirements defined by Open Knowledge International

Keywords Open Data Open Government Data Open Data policies impact assessment

xii

xiii

Sumaacuterio

AGRADECIMENTOS v

RESUMO ix

ABSTRACT xi

Introduccedilatildeo 1

Indicaccedilotildees Metodoloacutegicas 6

1 Do Acesso Aberto aos Dados Abertos 8

11 Acesso Aberto 8

111 Via Dourada 14

112 Via Verde 15

12 A Ciecircncia Aberta 17

13 Big Data ou dados massivos 24

14 Dados Abertos 29

15 Dados Abertos Governamentais 40

2 As poliacuteticas de Dados Abertos 53

21 Poliacuteticas Macro 70

22 O caso portuguecircs 78

Conclusatildeo 103

Referecircncias Bibliograacuteficas 115

LISTA DE SIGLAS 134

IacuteNDICE DE FIGURAS 136

IacuteNDICE DE QUADROS 137

IacuteNDICE DE GRAacuteFICOS 138

xiv

1

Introduccedilatildeo

Uma marca distintiva da nossa eacutepoca eacute o crescimento exponencial da produccedilatildeo de informaccedilatildeo com a proliferaccedilatildeo de novas tecnologias de informaccedilatildeo e comunicaccedilatildeo que permitiram o aumento de troca de informaccedilatildeo de nuacutemero de artigos cientiacuteficos publicados e a produccedilatildeo massiva de dados O acesso generalizado agrave internet propiciou uma alteraccedilatildeo no paradigma do acesso e publicaccedilatildeo de conteuacutedos cientiacuteficos Eacute com o intuito de promover o livre acesso agrave informaccedilatildeo cientiacutefica que nasce o movimento de Acesso Aberto (AA) apoiado em trecircs declaraccedilotildees de princiacutepios de abertura Budapeste Bethesda e Berlim

Segundo a Budapest Open Access Initiative (BOAI) entende-se por AA a disponibilizaccedilatildeo na Internet de literatura cientiacutefica permitindo que os utilizadores possam ler copiar distribuir imprimir e pesquisar esta literatura sem barreiras legais teacutecnicas ou financeiras que natildeo o proacuteprio acesso agrave Internet (Budapest Open Access Iniciative [BOAI] 2002 traduccedilatildeo livre) O AA possuiu dois modelos de abertura a via dourada que remete para a publicaccedilatildeo em revistas cientiacuteficas de AA e a via verde que pressupotildee o auto arquivo num repositoacuterio adequado Subjacente a este movimento estaacute a abertura sem qualquer tipo de discriminaccedilatildeo de toda a literatura de investigaccedilatildeo cientiacutefica revista por pares no caso dos postprints como artigos dissertaccedilotildees e teses e mais recentemente dados de investigaccedilatildeo e livros cientiacuteficos (Swan 2012) Existem dois tipos de AA o AA graacutetis que se refere agrave remoccedilatildeo de barreiras de preccedilo e o AA livre que se refere agrave remoccedilatildeo de barreiras de preccedilo e de pelo menos algumas barreiras de permissatildeo (Suber 2012)

O AA enquadra-se num contexto cientiacutefico mais vasto o da Ciecircncia Aberta (CA) O conceito de CA eacute definido como o esforccedilo para disponibilizar todos os resultados da investigaccedilatildeo cientiacutefica que sejam financiados pelo setor puacuteblico (Organizaccedilatildeo para a Cooperaccedilatildeo e Desenvolvimento Econoacutemico [OECD] 2015a) Nesse sentido a Ciecircncia Aberta surge como um termo guarda-chuva referente agrave abertura de todos os resultados da investigaccedilatildeo financiada e que assenta em vaacuterios pilares remoccedilatildeo das barreiras de partilha construccedilatildeo da infraestrutura para a sua concretizaccedilatildeo e como desambiguaccedilatildeo de autores instituiccedilotildees e produccedilatildeo cientiacutefica A CA eacute um meio para garantir um sistema de investigaccedilatildeo mais eficiente atraveacutes da reduccedilatildeo de custos no processo de coleta transferecircncia e reutilizaccedilatildeo de dados do aumento da transparecircncia e qualidade do processo de investigaccedilatildeo da maior rapidez na transferecircncia de conhecimento do aumento do impacto econoacutemico e aproximaccedilatildeo entre ciecircncia e cidadatildeos (OECD 2015a)

A complexidade da abertura dos resultados de investigaccedilatildeo reside no fator cultural na implementaccedilatildeo de um ambiente de partilha Leonelli Spichtinger e Prainsack

2

(201513) defendem que ldquoin addition to the stick of compulsatory mandates carrots are therefore also neededrdquo As recompensas satildeo definidas em trecircs eixos reconhecimento das praacuteticas de partilha nas estruturas de incentivos reconhecimento do papel das meacutetricas alternativas na avaliaccedilatildeo dos investigadores e a criaccedilatildeo de incentivos mais significativos para envolver os investigadores na CA Fecher e Friesike (2013) sintetizaram as mudanccedilas operadas pela CA em cinco escolas de pensamento ao niacutevel da infraestrutura da acessibilidade puacuteblica da avaliaccedilatildeo de impacto do acesso gratuito e da melhoria da eficiecircncia

A Uniatildeo Europeia (EU) tem desempenhado um papel central na promoccedilatildeo da CA quer atraveacutes da criaccedilatildeo de legislaccedilatildeo adequada aos princiacutepios de abertura que defende quer ao niacutevel de financiamento para o AA agraves publicaccedilotildees cientiacuteficas criaccedilatildeo de e-infraestruturas de alojamento de recursos de informaccedilatildeo e programas de treino e apoio Em Portugal apesar da jaacute existecircncia de e-infraestruturas cientiacuteficas como o Repositoacuterio Cientiacutefico de Acesso Aberto de Portugal (RCAAP) e o Serviccedilo de Alojamento de Repositoacuterio de Dados Cientiacuteficos (SARDC) apenas em 2016 se veio a definir os princiacutepios da implementaccedilatildeo da poliacutetica nacional de CA atraveacutes da Resoluccedilatildeo do Conselho de Ministros nordm212016 A estrateacutegia assenta em quatros eixos AA e Dados Abertos infraestruturas e preservaccedilatildeo digital avaliaccedilatildeo cientiacutefica e responsabilidade social cientiacutefica (Comissatildeo Executiva GT-PNCA 2016)

O crescimento exponencial da produccedilatildeo de dados estimado em 40 ao ano (Manyika et al 2011) levou agrave emergecircncia do fenoacutemeno Big Data ou dados massivos atraveacutes do incremento da disponibilizaccedilatildeo de conjuntos de dados e tambeacutem do reconhecimento do potencial valor da combinaccedilatildeo e ligaccedilatildeo de diferentes datasets (Ubaldi 2013) Os dados digitais estatildeo presentes em todos os setores econoacutemicos existindo diversas ferramentas que coletam dados de forma massiva que depois podem ser reutilizados para desenvolver novas investigaccedilotildees ou aplicaccedilotildees1 para benefiacutecio da sociedade O crescimento da disponibilidade de dados originou mudanccedilas no paradigma da investigaccedilatildeo cientiacutefica sendo que Jim Gray considera que vivemos atualmente no 4ordm paradigma caracterizado pelo uso massivo de dados na investigaccedilatildeo cientiacutefica (Lynch 2009) Esta nova ciecircncia assenta em trecircs pilares captura curadoria e anaacutelise de dados (Bell 2009 Royal Society 2012) A influecircncia do Big Data na sociedade manifesta-se a diversos niacuteveis destacando-se o desenvolvimento de projetos na aacuterea da sauacutede transportes agricultura ambiente induacutestria ganho de competecircncias cientiacuteficas mercado de dados e dados abertos

Os dados que produzimos satildeo globais diversificados complexos e sobretudo podem representar um enorme valor cientiacutefico econoacutemico social ou cultural Neste

1 O termo aplicaccedilotildees deve ser aqui entendido de duas formas como aplicaccedilatildeo na inovaccedilatildeo cientiacutefica produzindo por exemplo um avanccedilo meacutedico e tambeacutem como aplicaccedilatildeo no sentido de software fornecendo um serviccedilo com o recurso agrave reutilizaccedilatildeo de dados

3

sentido o AA a dados torna-se um dos pilares da investigaccedilatildeo cientiacutefica do seacuteculo XXI mas tambeacutem um dos pilares do desenvolvimento econoacutemico do envolvimento dos cidadatildeos na ciecircncia atraveacutes da denominada ciecircncia cidadatilde e tambeacutem na auscultaccedilatildeo da transparecircncia governativa com a disponibilizaccedilatildeo em AA de dados governamentais

O mundo acadeacutemico tem vindo a ser pressionado para apoiar a abertura atraveacutes das imposiccedilotildees das entidades de financiamento e do aumento de benefiacutecios dos Dados Abertos embora nem todos os domiacutenios evoluam com a mesma rapidez (Hahnel amp Hook 2016) A Royal Society (2012) sublinha que os dados devem ser geridos de modo proficiente para as instituiccedilotildees obterem os benefiacutecios proporcionados pela abertura de dados e entenderem a enorme mudanccedila cultural necessaacuteria para atingir este objetivo

Existem vaacuterias definiccedilotildees de Dados Abertos apresentando algumas diferenccedilas entre elas embora focando o mesmo objetivo A Royal Society (2012) entende por Open Data os dados que devem ser acessiacuteveis utilizaacuteveis avaliados ou certificados e inteligiacuteveis Contudo ldquoOpenness is not however enough Data must be intelligently openrdquo (Science International 20154) Segundo a Open Definition os Dados Abertos englobam dois tipos diferentes de abertura teacutecnica e legal (Open Knowledge International [a])

Com o objetivo de contribuir para a adoccedilatildeo de padrotildees e poliacuteticas de Dados Abertos de investigaccedilatildeo algumas organizaccedilotildees lanccedilaram iniciativas e princiacutepios de Open Data destinadas agrave recomendaccedilatildeo de boas praacuteticas na publicaccedilatildeo de dados de investigaccedilatildeo obtidos atraveacutes de financiamento puacuteblico Estes princiacutepios foram comparados de forma a obter-se uma visatildeo geral da abertura teacutecnica e legal recomendada

A abertura dos dados governamentais teve a sua origem nas leis de ldquoFreedom of Informationrdquo Os Governos e as sociedades tecircm vindo de forma crescente a apoiar o acesso agrave informaccedilatildeo do setor puacuteblico como forma de aumentar a transparecircncia governativa e o crescimento econoacutemico A abertura de dados assume a preparaccedilatildeo das entidades puacuteblicas para o processo de abertura e que o governo estaacute disposto a efetuar mudanccedilas consideraacuteveis no setor puacuteblico devendo atuar como um sistema aberto que interage com o seu ambiente (Jansen Charalabidis amp Zuiderwijk 2012)

Os Dados Governamentais Abertos (DGA) referem-se agrave informaccedilatildeo coletada produzida ou paga pelo setor puacuteblico guardada em formato que possa ser lido por maacutequina e tornada acessiacutevel de forma livre para reutilizaccedilatildeo para qualquer propoacutesito atraveacutes da publicaccedilatildeo sob uma licenccedila aberta que permite a livre reutilizaccedilatildeo dentro do domiacutenio puacuteblico e privado (Koski 2015 Carrara Oudkerk Steenbergen Tinholt 2016) A Open Knowledge International (OKI) (2012a) identificou as componentes chave da abertura de dados puacuteblicos disponibilidade e acesso reutilizaccedilatildeo e redistribuiccedilatildeo e a participaccedilatildeo universal A abertura dos dados governamentais foi apoiada por vaacuterias iniciativas com o objetivo de estabelecer padrotildees e princiacutepios para a

4

disponibilizaccedilatildeo aberta de dados as quais foram comparadas para obter uma visatildeo geral da abertura teacutecnica e legal recomendada

Para gerar valor ldquodata must be reusable but more importantly actually used (Open Data for Development [OD4D] 20168) O acesso e a reutilizaccedilatildeo dos dados governamentais tecircm um potencial significativo no aumento da eficiecircncia e transparecircncia do setor puacuteblico alavancando atividades de ciecircncia cidadatilde com os dados governamentais aumentando assim o seu valor econoacutemico e social (OECD 2015a) Segundo Ubaldi (2013 traduccedilatildeo livre) podem ser identificadas quatro grandes fases na cadeia de valor dos Dados DGA geraccedilatildeo de dados coleta agregaccedilatildeo e processamento de dados distribuiccedilatildeo e fornecimento de dados e reutilizaccedilatildeo de dados Existem trecircs tipos de valor associados aos DGA valor econoacutemico valor social e transparecircncia puacuteblica (Ubaldi 2013 OECD 2015a)

O acesso a dados sem restriccedilotildees de acesso deve ser garantido por uma poliacutetica de Dados Abertos pois ldquoOpen Data is politicalrdquo (World Wide Web Foundation 201638) Existem poliacuteticas diferenciadas para a abertura de dados governamentais e para a abertura de dados cientiacuteficos sendo que a expressatildeo ldquoPoliacutetica de Dados Abertosrdquo surge frequentemente associada a termos como estrateacutegias programas ou iniciativas de abertura de dados e ainda a poliacuteticas de gestatildeo de dados A contextualizaccedilatildeo das poliacuteticas natildeo eacute clara mas foca-se preferencialmente apenas nos dados provenientes do setor puacuteblico Satildeo associadas poliacuteticas de Dados Abertos de vaacuterios niacuteveis desde o governamental em termos de dados puacuteblicos agraves poliacuteticas editoriais de abertura de dados cientiacuteficos

A niacutevel de dados cientiacuteficos salienta-se a existecircncia de vaacuterias recomendaccedilotildees no sentido de balizar indicadores fundamentais para o desenvolvimento de poliacuteticas de abertura de dados cientiacuteficos e a importacircncia da gestatildeo de dados no seio dessa abertura A mudanccedila cultural a necessidade de treino dos investigadores e a abertura de dados mediante os princiacutepios FAIR que pretendem facilitar o acesso a interoperabilidade e a reutilizaccedilatildeo de dados satildeo outros desafios focados A abertura dos dados de investigaccedilatildeo eacute incluiacuteda no programa de investimento Horizonte 2020 (H2020) da EU com a criaccedilatildeo um projeto-piloto de Dados Abertos para sete aacutereas com opccedilatildeo de natildeo participaccedilatildeo tendo sido alargado a todas as aacutereas cientiacuteficas em projetos iniciados a partir de 2017 O artigo 293 do acordo modelo de financiamento requer o depoacutesito de todos os dados e metadados associados aos resultados finais da investigaccedilatildeo num repositoacuterio devendo estes cumprir os princiacutepios FAIR A este model grant agreement estaacute associada tambeacutem a necessidade obrigatoacuteria de desenvolver um plano de gestatildeo de dados que descreva os dados que seratildeo produzidos e como e quando seratildeo publicados O AA a dados cientiacuteficos possui um contexto legislativo diferenciado dos dados puacuteblicos apresentando-se em Portugal numa fase ainda pouca maturada A primeira poliacutetica de Dados Abertos surge em 2014 atraveacutes da Fundaccedilatildeo

5

para a Ciecircncia e Tecnologia (FCT) com o objetivo de encorajar e promover a disponibilizaccedilatildeo de dados em AA O acesso a dados foi incluiacutedo na poliacutetica cientiacutefica atraveacutes da Resoluccedilatildeo do Conselho de Ministros nordm212016 que integrada na poliacutetica nacional de CA instaura a obrigatoriedade da abertura dos dados cientiacuteficos resultantes de projetos financiados por fundos puacuteblicos

O desenvolvimento de uma poliacutetica de abertura de dados governamentais deve considerar algumas questotildees como a definiccedilatildeo da sua aplicaccedilatildeo e os objetivos dados publicados condiccedilotildees de publicaccedilatildeo de dados local frequecircncia e razatildeo da publicaccedilatildeo devendo ainda ser calculado o impacto e os benefiacutecios da abertura de dados (Carrara et al 2016a) Os objetivos das poliacuteticas de Dados Abertos podem ser sintetizados em trecircs aacutereas principais fomentar a inovaccedilatildeo social e crescimento econoacutemico melhorar a eficiecircncia dos serviccedilos do setor puacuteblico e fortalecer a democracia e aumentar a transparecircncia (Zuiderwijk Gasco Parycek amp Janssen 2014)

A EU e a Comissatildeo Europeia tecircm promovido os DGA atraveacutes da publicaccedilatildeo de Diretivas Europeias (2003 e 2013) que estabeleceram regulamentos para permitir o livre acesso e reutilizaccedilatildeo dos dados produzidos pelas entidades europeias e governamentais Esta legislaccedilatildeo eacute de cariz obrigatoacuterio para todos os estados-membros Foram tambeacutem estabelecidas diversas e-infraestruturas para alojar e apoiar toda a produccedilatildeo de dados produzidos na EU e que indexam os dados existentes nos portais nacionais de cada paiacutes Satildeo abordadas as vaacuterias iniciativas europeias e internacionais de avaliaccedilatildeo de abertura de dados que permitem obter uma vista geral ainda que desfocada do estado de abertura de dados puacuteblicos a niacutevel nacional e europeu

Portugal confere o direito ao acesso agrave informaccedilatildeo puacuteblica desde 1993 As poliacuteticas de abertura de dados governamentais mais recentes foram publicadas em 2007 e 2016 e assentam na transposiccedilatildeo da Diretiva 200398CE para a lei nacional Assinala-se a existecircncia de duas poliacuteticas municipais a criaccedilatildeo do portal nacional e de vaacuterios portais regionais e institucionais Para avaliar a abertura dos dados governamentais em Portugal foi usada a estrutura elencada por Zuiderwijk e Janssen (2014) Atraveacutes da anaacutelise de vaacuterios indicadores esta estrutura fornece uma perspetiva do contexto e ambiente da poliacutetica do seu conteuacutedo e dos indicadores de desempenho permitindo assim inferir o valor puacuteblico alcanccedilado Foi tambeacutem analisada a abertura de dados alojados nos portais de dados portugueses com o recurso agraves caracteriacutesticas de abertura enunciadas na Open Definition

O objetivo geral deste trabalho eacute identificar as poliacuteticas de Dados Abertos em Portugal bem como a analisar a sua implementaccedilatildeo e impacto Neste sentido foram delineados os seguintes objetivos especiacuteficos

6

a) Contextualizar o movimento de Dados Abertos como continuaccedilatildeo do AA e tambeacutem dentro de um modelo mais amplo a CA focando ainda a produccedilatildeo massiva de dados

b) Identificar princiacutepios de abertura de dados cientiacuteficos e dados puacuteblicos c) Contextualizar os modelos de poliacuteticas de Dados Abertos e formas de avaliaccedilatildeo

de impacto das mesmas d) Identificar a constituiccedilatildeo e implementaccedilatildeo de poliacuteticas de abertura de dados

cientiacuteficos e dados puacuteblicos a niacutevel da EU e) Identificar a constituiccedilatildeo de poliacuteticas de abertura de dados cientiacuteficos e dados

puacuteblicos a niacutevel portuguecircs f) Avaliaccedilatildeo da implementaccedilatildeo e do impacto das poliacuteticas de Dados Abertos em

Portugal em termos de dados cientiacuteficos e de dados puacuteblicos

Indicaccedilotildees Metodoloacutegicas

Para cumprir os objetivos estipulados seguiu-se uma abordagem qualitativa baseada na revisatildeo bibliograacutefica de artigos cientiacuteficos recuperados em bases de dados especializadas disponiacuteveis na Universidade de Coimbra articulando a recuperaccedilatildeo de documentos com os documentos mais citados da aacuterea da Ciecircncia Aberta Acesso Aberto e Dados Abertos indexados na Web of Science Foram usados os termos de pesquisa em liacutengua inglesa open science open access open data open government data e scientific open data para situar o tema seguindo-se a pesquisa por open data policies government open data policies e open data impact A base da literatura revista para analisar o desenvolvimento e impacto das poliacuteticas de Dados Abertos em Portugal foi obtida em grande parte com o recurso ao motor de busca Google derivado agrave especificidade da legislaccedilatildeo das comunicaccedilotildees poliacuteticas e institucionais dos portais de dados e tambeacutem agrave escassez de literatura cientiacutefica nesse campo Foi ainda solicitado um esclarecimento de duacutevidas agrave Agecircncia para a Modernizaccedilatildeo Administrativa (AMA) por correio eletroacutenico em termos de conteuacutedos e funcionalidades do portal de dados nacional tendo as respostas do gestor de projeto Andreacute Lapa sido incluiacutedas como contraposiccedilatildeo a algumas afirmaccedilotildees da literatura ou das iniciativas de avaliaccedilatildeo Os Dados Abertos enquanto alvo do nosso estudo satildeo enquadrados na dimensatildeo da Ciecircncia Aberta que defende a abertura de todos os resultados cientiacuteficos e na dimensatildeo de abertura da informaccedilatildeo do setor puacuteblico que defende o acesso do cidadatildeo agrave informaccedilatildeo dos oacutergatildeos puacuteblicos e governativos

Em termos de Dados Abertos e as suas poliacuteticas a oferta de literatura eacute consideravelmente mais curta sendo que apenas os documentos mais antigos apresentam nuacutemero de citaccedilotildees com algum relevo Sempre que necessaacuterio recorreu-se a trabalhos citados nas publicaccedilotildees em estudo A singularidade da aacuterea e o seu raacutepido crescimento levou agrave opccedilatildeo por autores e artigos menos cotados mas

7

diretamente relacionados com o mundo dos Dados Abertos A recolha de literatura para investigaccedilatildeo visou identificar legislaccedilatildeo referente a poliacuteticas de Dados Abertos publicaccedilotildees de organizaccedilotildees internacionais documentos oficiais relacionados com a abertura de dados e tambeacutem comunicaccedilotildees poliacuteticas quer para o caso portuguecircs quer ao niacutevel macro da EU Foi identificado o contexto social e poliacutetico dos Dados Abertos destacando-se as iniciativas com potencial impacto na abertura de dados Foram pesquisados documentos de investigaccedilatildeo relativos a poliacuteticas de dados abertos e formas de anaacutelise das mesmas

A avaliaccedilatildeo de impacto das poliacuteticas de Dados Abertos em Portugal foi feita com base na estrutura elencada por Zuiderwijk e Janssen (2014) A identificaccedilatildeo das respostas aos 27 indicadores foi feita com o recurso agrave literatura legislaccedilatildeo e agraves respostas obtidas a partir da AMA

Para determinar a quantidade de conjuntos de dados existentes em cada portal internacional analisado quando natildeo estava disponiacutevel a possibilidade de pesquisar por paiacutes foi introduzido o termo Portugal na caixa de pesquisa Deste modo recuperaram-se os conjuntos de dados relacionados com o paiacutes embora nem todos os datasets tenham autoria portuguesa A determinaccedilatildeo das caracteriacutesticas dos portais de dados portugueses analisados foi efetuada com base na informaccedilatildeo inscrita no proacuteprio siacutetio web Quando natildeo disponiacuteveis na paacutegina principal dos cataacutelogos de dados procedeu-se agrave pesquisa nas paacuteginas descritivas dos datasets ou no setor dos avisos legais

Procurou-se aqui tambeacutem definir alguns dos termos que iratildeo ser utilizados com frequecircncia na liacutengua inglesa e tambeacutem o seu acircmbito de aplicaccedilatildeo Segundo Borgman (2015) dados satildeo representaccedilotildees de observaccedilotildees objetos ou outras entidades usadas como prova de um fenoacutemeno para fins de investigaccedilatildeo ou acadeacutemicos

O termo dataset designa um conjunto ou coleccedilatildeo de dados publicados ou preservados por um agente uacutenico estando disponiacutevel para acesso ou download em um ou mais formatos (World Wide Web Consortium [W3C] 2014)

Para a contextualizaccedilatildeo e avaliaccedilatildeo de poliacuteticas foi tida em consideraccedilatildeo a definiccedilatildeo do Dicionaacuterio de Cambridge que define poliacutetica como ldquoa set of ideas or a plan of what to do in particular situations that has been agreed to officially by a group of people a business organization a government or a political partyrdquo (Cambridge University Press 2017)

8

1 Do Acesso Aberto aos Dados Abertos

O processo de abertura do conhecimento cientiacutefico comeccedilou em 2002 com o movimento do Acesso Aberto (AA) culminando na abertura da literatura cientiacutefica financiada por fundo puacuteblicos O avanccedilar da tecnologia a produccedilatildeo massiva de dados as redes sociais cientiacuteficas a ciecircncia cidadatilde os recursos educacionais e o coacutedigo aberto em conjunto gerou uma ciecircncia diferente Este conceito mais amplo de ciecircncia definido como Ciecircncia Aberta pretende abrir toda a panoacuteplia de formatos e recursos onde constem resultados cientiacuteficos com destaque para os dados de investigaccedilatildeo financiados publicamente A abertura de dados processa-se tambeacutem a niacutevel puacuteblico com o Governo e vaacuterias instituiccedilotildees puacuteblicas empenhadas em disponibilizar de forma aberta a informaccedilatildeo do setor puacuteblico

11 Acesso Aberto

O acesso ao conhecimento eacute a base do processo cientiacutefico motor do desenvolvimento social econoacutemico e humano O acesso generalizado agrave Internet alterou o paradigma da comunicaccedilatildeo acadeacutemica pela introduccedilatildeo experimental de novas formas de publicaccedilatildeo e disseminaccedilatildeo da ciecircncia Os primoacuterdios do Acesso Aberto (AA) agrave informaccedilatildeo cientiacutefica remontam a iniciativas como o ArXiv2 um servidor de preprints3 e o EPrints um dos softwares usados para a constituiccedilatildeo de repositoacuterios

O movimento de AA surgiu como resposta ao problema conhecido como lsquoCrise dos Perioacutedicosrsquo Na verdade a escalada de preccedilos das assinaturas de revistas cientiacuteficas e as restriccedilotildees colocadas pelas editoras limitando de forma seacuteria o acesso aos resultados de investigaccedilatildeo teve duas consequecircncias limitaccedilatildeo severa no acesso agrave informaccedilatildeo e colateral diminuiccedilatildeo do potencial de impacto de citaccedilatildeo Eacute neste contexto que em 2002 surge a declaraccedilatildeo fundadora do AA a Budapeste Open Access Initiative (BOAI) Segundo a BOAI entende-se por AA a disponibilizaccedilatildeo na Internet de literatura cientiacutefica permitindo que os utilizadores possam ler copiar distribuir imprimir e pesquisar esta literatura sem barreiras legais teacutecnicas ou financeiras que natildeo o proacuteprio acesso agrave Internet (Budapest Open Access Iniciative [BOAI] 2002 traduccedilatildeo livre) A BOAI estabeleceu duas vias para concretizar o AA a publicaccedilatildeo em revistas cientiacuteficas de AA conhecida como a via dourada e o auto arquivo em repositoacuterios cientiacuteficos conhecido como a via verde de AA Para atingir a abertura dos artigos a BOAI sublinha que devem ser cumpridas duas estrateacutegias complementares

2 O arXiv surgiu em 1991 com o intuito de alojar preprints de artigos cientiacuteficos da aacuterea da fiacutesica tendo sido expandido para integrar aacutereas como a matemaacutetica astronomia ciecircncias da computaccedilatildeo biologia e financcedila quantitativa e estatiacutestica Disponiacutevel na WWW httpsarxivorg 3 O preprint eacute uma versatildeo de um artigo cientiacutefico natildeo publicado e ainda natildeo sujeito a revisatildeo por pares

9

Os investigadores devem proceder ao Auto arquivo da versatildeo completa das suas publicaccedilotildees Necessidade de desenvolver uma nova geraccedilatildeo de revistas cientiacuteficas cujo foco seja a publicaccedilatildeo em AA (BOAI 2002)

Seguiram-se mais duas declaraccedilotildees de elevada importacircncia para o estabelecimento do AA a Declaraccedilatildeo de Bethesda sobre a Publicaccedilatildeo em Acesso Aberto e a Declaraccedilatildeo de Berlim sobre Acesso Livre ao Conhecimento nas Ciecircncias e Humanidades ambas em 2003 A Declaraccedilatildeo de Bethesda define o AA agraves publicaccedilotildees quando eacute autorizado o livre acesso uso e redistribuiccedilatildeo e tambeacutem quando eacute fornecida a versatildeo completa incluindo materiais suplementares e respetiva licenccedila de utilizaccedilatildeo em formato digital num repositoacuterio adequado (Declaraccedilatildeo de Bethesda sobre a Publicaccedilatildeo em Acesso Aberto 2003) A Declaraccedilatildeo de Berlim impotildee o cumprimento de duas condiccedilotildees os autoresdetentores dos direitos de autor devem autorizar sob a forma de uma licenccedila qualquer tipo de coacutepia reutilizaccedilatildeo redistribuiccedilatildeo e transmissatildeo sujeito apenas agrave menccedilatildeo de atribuiccedilatildeo de creacutedito e os autores devem depositar uma coacutepia completa do seu trabalho num repositoacuterio que assegure a sua preservaccedilatildeo a longo prazo (Declaraccedilatildeo de Berlim sobre Acesso Livre ao Conhecimento nas Ciecircncias e Humanidades 2003 traduccedilatildeo livre)

Borges (200692) sintetizou outros exemplos de iniciativas de AA desencadeadas a niacutevel global como o Open Archives Forum em 2001 a International Scholarly Communications Alliance ao niacutevel das ldquobibliotecas especializadas de investigaccedilatildeordquo listando ainda princiacutepios editoriais dos Estados Unidos da Ameacuterica (EUA)4 e europeus5 e assinalando tambeacutem a existecircncia do ldquoDAREnet a rede dos Digital Academic Repositoriesrdquo

Em 2012 a BOAI declarou que ldquoNothing in the last ten years makes OA less necessary or less opportunerdquo renovando e definindo recomendaccedilotildees para os proacuteximos 10 anos ao niacutevel de poliacuteticas licenciamento e reutilizaccedilatildeo infraestrutura e sustentabilidade e por fim sobre promoccedilatildeo e coordenaccedilatildeo

A abertura requerida por estas declaraccedilotildees tem por objetivo disponibilizar o AA a todos os que manifestem interesse nele sem distinccedilotildees discriminatoacuterias Suber (2012) um dos promotores do Movimento de Acesso Aberto agrave informaccedilatildeo cientiacutefica afirma que temos de ver o conhecimento como um bem puacuteblico e natildeo como uma mercadoria O AA deve incluir tambeacutem o processamento da informaccedilatildeo por maacutequinas que atraveacutes de teacutecnicas de extraccedilatildeo indexaccedilatildeo ou mistura permitem obter novas inferecircncias de

4 Os princiacutepios foram denominados Washington DC Principles For Free Access to Science em 2004 tendo sido assinados ldquopor uma seacuterie de editores natildeo lucrativos de sociedades cientiacuteficasrdquo (Borges 200692) 5 Borges (2006) indica que a Association of Learned and Professional Society Publishers emitiu princiacutepios semelhantes aos princiacutepios anunciados nos EUA

10

conhecimento (Suber 2012 Swan 2012) Os conteuacutedos comummente abrangidos pelo AA satildeo a literatura de investigaccedilatildeo cientiacutefica revista por pares dissertaccedilotildees teses e mais recentemente os dados de investigaccedilatildeo e livros cientiacuteficos (Swan 2012) aleacutem de manuais software modelos tridimensionais plantas mapas entre outros

As barreiras de preccedilo e de direitos de autor causam danos aos autores por limitarem a audiecircncia e impacto do seu trabalho ao condicionarem o que pode ser lido usado e citado (Suber 2012 traduccedilatildeo livre) O movimento de AA veio ameaccedilar o modelo dominante de publicaccedilatildeo cientiacutefica baseado ateacute entatildeo em subscriccedilotildees de revistas cientiacuteficas de elevado custo mudando o paradigma em termos de pagamento isentando o leitor e cobrando ao autor O AA natildeo eacute acesso sem custos (OECD 2015a) Em 2008 Stevan Harnad e Peter Suber propuseram termos para descrever os dois tipos de livre acesso agrave informaccedilatildeo cientiacutefica que se impuseram como fundamentais e reconhecidos O termo Graacutetis refere-se agrave remoccedilatildeo das barreiras de preccedilo enquanto o termo Livre refere-se agrave retirada das barreiras de preccedilo e de pelo menos algumas barreiras de permissatildeo (Suber 2008 traduccedilatildeo livre)

A viabilidade econoacutemica das infraestruturas de suporte ao AA pode constituir outro obstaacuteculo Contudo as revistas de AA podem optar por vaacuterios modelos de financiamento que lhes garanta a sustentabilidade econoacutemica como ldquosubsiacutedios publicidade taxas de poacutes-processamento do artigo impressotildees outros serviccedilos de publicaccedilatildeo taxas de associado ou combinaccedilotildees destas accedilotildeesrdquo (Universidade do Minho 2017) Jaacute os repositoacuterios de AA satildeo mais limitados em termos de sustentabilidade no entanto tecircm menos custos de manutenccedilatildeo e estatildeo jaacute em grande parte construiacutedos (OECD 2015a) O retorno do investimento que cada instituiccedilatildeo faz num repositoacuterio tem sempre garantia de retorno atraveacutes do conhecimento que aloja atraindo desta forma alunos investigadores e outros potenciais interessados

A complexidade do AA reside na transiccedilatildeo entre o modelo tradicional e o novo modelo de abertura natildeo pelos obstaacuteculos legais teacutecnicos ou financeiros mas sobretudo pelo fator cultural (Suber 2012 traduccedilatildeo livre) O mesmo autor defende que o AA natildeo eacute acesso universal pois mesmo removendo as barreiras de preccedilos e de permissotildees continuam a existir outras barreiras como filtros e censura barreiras de linguagem de acesso a incapacitados e de conectividade

A escolha do local de publicaccedilatildeo por parte do investigador eacute muitas vezes influenciada pelo prestiacutegio da revista na procura da melhor visibilidade para a sua investigaccedilatildeo O prestiacutegio das revistas eacute conseguido atraveacutes do Fator de Impacto (FI) uma medida de avaliaccedilatildeo criada por Eugene Garfield e Irving H Sher ldquoIn addition to helping libraries decide which journals to purchase JIFs are also used by aithors to decide where to submit their articles As a general rule the journals with high impact factors include the most prestigious Some would equate prestige with high impactrdquo (Garfield 200692) O FI do ano de uma revista cientiacutefica eacute calculado atraveacutes da divisatildeo

11

entre o nuacutemero de citaccedilotildees total que os artigos dessa revista receberam nos dois anos anteriores e o nuacutemero total de artigos publicados no mesmo periacuteodo (Garfield 2006) Suber afirmava em 2009 que o FI como medida principal da qualidade da investigaccedilatildeo impede o crescimento das revistas de AA pois segundo o autor pode afastar os investigadores da publicaccedilatildeo em revistas de AA Contudo em 2017 existem jaacute revistas de AA com o mesmo niacutevel de prestiacutegio das revistas tradicionais das puras como eacute o caso daquelas publicadas pela Public Library of Science (PLOS) e BioMed Central ou Hindawi agraves hiacutebridas de outros editores cientiacuteficos

Como incentivos para abertura dos seus trabalhos aleacutem do maior reconhecimento e impacto medido pela contagem de citaccedilotildees os investigadores apenas recebem recompensas menos tangiacuteveis como a promoccedilatildeo na carreira (Suber 2012) Para este autor o sucesso do AA natildeo depende do altruiacutesmo do investigador entendendo que o ganho de audiecircncia e de impacto atraveacutes da publicaccedilatildeo da investigaccedilatildeo em AA eacute do interesse pessoal do investigador

Sendo o AA dirigido agrave literatura cientiacutefica revista por pares seria de esperar que o controlo de qualidade natildeo constituiacutesse um problema Contudo surgiram no mundo editorial as revistas predatoacuterias um termo cunhado por Jeffrey Beall para definir as revistas que aproveitam o modelo dourado do AA em proveito proacuteprio ldquoThese predatory publishers are dishonest and lack transparencyrdquo Constroem siacutetios web semelhantes aos dos ldquolegitimate online publishers and publish journals of questionable and downright low qualityrdquo (Beall 2012) Beall assevera que ldquonow there is a journal willing to accept almost every article as long as the author is willing to pay the feerdquo (Beall 2012) Este tipo de revistas cobra pela publicaccedilatildeo de cada artigo sem no entanto oferecer os mesmos serviccedilos editoriais como a revisatildeo por pares um elemento fundamental para garantir a integridade e qualidade cientiacutefica

O AA acarreta vaacuterios benefiacutecios para a sociedade e comunidade cientiacutefica como o aumento da velocidade eficiecircncia e eficaacutecia da investigaccedilatildeo facilita a investigaccedilatildeo interdisciplinar amplia a visibilidade uso e impacto da investigaccedilatildeo e permite que as comunidades de profissionais empreendedores e o puacuteblico em geral retirem valor da investigaccedilatildeo (Swan 2012 traduccedilatildeo livre) O projeto Study of Open Access Publishing (SOAP) concluiu que cerca de 90 dos investigadores que responderam ao inqueacuterito consideram que o AA eacute beneacutefico para a investigaccedilatildeo cientiacutefica com impacto direto positivo no fluxo da comunicaccedilatildeo acadeacutemica (Dallmeier-Tiessen et al 2011)

De acordo com Harnad e Brody (2004) a melhor forma de calcular o impacto do AA eacute ldquocompare the citation counts of individual OA and non-OA articles appearing in the same (non-OA) journals Such ongoing comparisons are revealing dramatic citation advantages for OA Os mesmos autores enfatizam que o acesso natildeo eacute uma condiccedilatildeo suficiente para a citaccedilatildeo mas eacute uma condiccedilatildeo necessaacuteria Com as publicaccedilotildees em AA a crescer exponencialmente entre as revistas de AA e os repositoacuterios ldquoverdesrdquo eacute natural

12

que o uso e impacto potencial aumentem com variaccedilotildees entre campos de conhecimento decorrentes da sua cultura de partilha

Apoacutes a anaacutelise de 36 estudos sobre o impacto do AA nas citaccedilotildees de artigos Swan (2010) concluiu que 27 desses estudos apresentavam uma clara subida do nuacutemero meacutedio de citaccedilotildees Os artigos cientiacuteficos disponibilizados em AA satildeo mais citados que aqueles que permanecem fechados estando este facto relacionado com o aumento de audiecircncia e visibilidade promovida pelo AA (Suber 2012 Caruso Nicol amp Archambault 2013) Swan (2012) defende que o AA estaacute a nivelar a comunicaccedilatildeo cientiacutefica e o acesso a ela A mesma autora realccedila que a investigaccedilatildeo cientiacutefica tem impacto tambeacutem fora do meio acadeacutemico ao niacutevel empresarial sauacutede ou educaccedilatildeo A OECD (2015a) acrescenta que os artigos satildeo mais citados porque possuem livre acesso e uso e natildeo propriamente pela sua qualidade Um estudo da Science-Metrix concluiu que o AA pode aumentar o nuacutemero de artigos citados e diminuir a citaccedilatildeo de artigos que os investigadores natildeo leram Poreacutem a mesma anaacutelise revelou que apenas 8 dos 28 paiacuteses auscultados conseguiram publicar 50 ou mais dos artigos produzidos em AA (Caruso Nicol amp Archambault 2013)

A distinccedilatildeo entre Graacutetis e Livre natildeo possuiu o mesmo significado que a distinccedilatildeo entre via verde e via dourada Enquanto a primeira distinccedilatildeo se refere aos direitos cedidos aos utilizadores (Quatildeo aberto estaacute) a segunda distinccedilatildeo refere-se ao modo de publicaccedilatildeo (Como eacute entregue) (Suber 2012) Os direitos de autor podem constituir uma barreira de peso ao AA A abertura requerida pelo estatuto de AA Livre deve ser assegurada pela concessatildeo de licenccedilas que informem os utilizadores sobre o que podem e natildeo podem fazer com determinado produto de investigaccedilatildeo cientiacutefica Existem licenccedilas abertas como as Creative Commons (CC) que permitem a criaccedilatildeo de modelos de licenciamento com diferentes niacuteveis de permissotildees podendo desta forma o detentor dos direitos de autor autorizar o niacutevel de permissatildeo que lhe seja mais conveniente

Das 9431 revistas cientiacuteficas de AA listadas no Directory of Open Access Journals (DOAJ) em Maio de 2017 8447 dessas revistas utilizavam licenccedilas CC enquanto 278 revistas possuiacuteam licenccedilas proacuteprias das editoras Os cerca de 90 do nuacutemero total de revistas de AA a utilizar licenccedilas CC representa um crescimento exponencial desde 2012 quando Suber afirmou que apenas 20 das revistas em AA usavam algum tipo de licenccedila CC Nesta mesma data encontram-se listadas no DOAJ 78 revistas de AA de editoras portuguesas sendo que 91 dessas publicaccedilotildees usa licenccedilas CC para permitir o AA Livre (Directory of Open Access Journals [DOAJ] 2017)

A abertura dos resultados de investigaccedilatildeo eacute suportada por poliacuteticas que podem encorajar ou requerer de forma obrigatoacuteria o AA Por norma o encorajamento eacute feito na via dourada enquanto na via verde se definem mandatos Segundo Swan (2012 traduccedilatildeo livre) na formulaccedilatildeo de uma poliacutetica de AA devem ser considerados os

13

seguintes fatores Modo de publicaccedilatildeo (via verde ou dourada) Local de depoacutesito Tipos de conteuacutedos abrangidos Periacuteodos de embargo Permissotildees Niacuteveis de aplicaccedilatildeo Sensibilizaccedilatildeo de apoio agraves poliacuteticas Sanccedilotildees por incumprimento e Isenccedilotildees

De acordo com Suber (2012) existe similitude na abordagem agraves poliacuteticas de AA entre universidades e agecircncias de financiamento que tanto podem encorajar a via dourada como requerer a via verde A Wellcome Trust do Reino Unido e a National Institutes of Health (EUA) satildeo dois casos de sucesso de mandatos verdes requerendo que os investigadores depositem o seu trabalho num repositoacuterio de AA e que retenham o direito de autorizar esse AA o que permite que as instituiccedilotildees disponibilizem de forma aberta todos os resultados de investigaccedilatildeo por si financiados (National Institutes of Health [NIH] 2008 Wellcome Trust 2013)

O mais recente programa de financiamento de ciecircncia e inovaccedilatildeo da Uniatildeo Europeia o Horizonte 2020 detalha no artigo 292 do Model Grant Agreement os requisitos legais na abertura das publicaccedilotildees cientiacuteficas financiadas por este programa onde cada beneficiaacuterio deve assegurar o AA a todas as publicaccedilotildees revistas por pares utilizando para isso as duas vias disponiacuteveis (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016a traduccedilatildeo livre)

Existem tambeacutem serviccedilos com o intuito de facilitar a abertura das publicaccedilotildees cientiacuteficas O Registry of Open Access Repository Mandates and Policies (ROARMAP) lista as poliacuteticas e mandatos de AA ao niacutevel global registados neste diretoacuterio Em novembro de 2016 o ROARMAP conta com 794 mandatos instituiacutedos por vaacuterios tipos de organizaccedilotildees Portugal conta com 21 poliacuteticas de AA por via verde distribuiacutedas na sua maioria por instituiccedilotildees de ensino superior Os serviccedilos SHERPA da Universidade de Nottingham atraveacutes das bases de dados RoMEO e JULIET dispotildeem de valiosos indicadores quanto agraves poliacuteticas de AA das editoras cientiacuteficas e das entidades financiadoras de investigaccedilatildeo Relativamente agraves poliacuteticas editoriais de AA tendo em conta os direitos de autor e o auto arquivo existem em Portugal 127 poliacuteticas segundo o SHERPARoMEO sendo que mais de metade autoriza a publicaccedilatildeo em AA do poacutes-print ou da versatildeo final do editor Jaacute em termos de poliacuteticas de AA requeridas pela instituiccedilatildeo financiadora apenas a Fundaccedilatildeo para a Ciecircncia e Tecnologia (FCT) aparece listada no SHERPAJULIET

O AA envolve vaacuterios intervenientes distintos que cooperam na disponibilizaccedilatildeo dos resultados da investigaccedilatildeo cientiacutefica Assim como intervenientes podemos encontrar os investigadores cujo esforccedilo permite a criaccedilatildeo e difusatildeo de novo conhecimento com valor cientiacutefico a sociedade em geral que pode usufruir e construir em cima do novo conhecimento as universidades e institutos de investigaccedilatildeo que disponibilizam condiccedilotildees adequadas para o decurso da produccedilatildeo cientiacutefica incluindo a construccedilatildeo de infraestruturas de AA as entidades financiadoras de investigaccedilatildeo cientiacutefica as editoras que criam revistas de AA para permitir a difusatildeo acesso ao conhecimento e ainda

14

diversas organizaccedilotildees que dedicam parte das suas atividades agrave promoccedilatildeo de poliacuteticas e praticas de AA Entre as organizaccedilotildees mais relevantes podemos encontrar a UNESCO Wellcome Trust a Joint Information Systems Committee (JISC) a Scholarly Publishing and Academic Resources Coalition (SPARC) a Open Knowledge International (OKI) ou a NIH soacute para citar algumas das organizaccedilotildees mais reconhecidas pelo seu esforccedilo em direccedilatildeo ao AA

Em Portugal os grandes intervenientes do AA satildeo a FCT enquanto entidade financiadora a Fundaccedilatildeo para a Computaccedilatildeo Cientiacutefica Nacional (FCCN) no planeamento e gestatildeo da Rede Ciecircncia Tecnologia e Sociedade (RCTS) a Universidade do Minho pioneira no AA no paiacutes e o Repositoacuterio Cientiacutefico de Acesso Aberto de Portugal vulgo RCAAP que eacute um agregador da informaccedilatildeo cientiacutefica produzida

Segundo Suber (2012 traduccedilatildeo livre) o AA eacute um movimento amplo que abrange todos os campos de conhecimento todos os paiacuteses independentemente da sua realidade econoacutemica inclui a investigaccedilatildeo puacuteblica e privada sem limitaccedilatildeo temporal e natildeo se limita aos conteuacutedos textuais pois frequentemente estende-se aos dados conteuacutedos multimeacutedia e coacutedigo executaacutevel A UNESCO (2015) defende que o AA natildeo eacute um movimento isolado embora tenha caracteriacutesticas uacutenicas

111 Via Dourada

A via dourada do AA eacute a publicaccedilatildeo de artigos cientiacuteficos em revistas de AA que pode envolver o pagamento de custos de processamento - Article Processing Charge (APC) - pelo autor instituiccedilatildeo ou entidade financiadora ficando o artigo disponiacutevel e sem custos para os leitores A publicaccedilatildeo em AA por via dourada eacute compatiacutevel com a qualidade cientiacutefica das editoras tradicionais pois as revistas de AA possuem o serviccedilo de revisatildeo por pares dos artigos sendo que algumas delas jaacute atingiram um alto niacutevel de prestiacutegio O prestiacutegio das revistaseditoras cientiacuteficas eacute um fator que pesa na escolha do local de publicaccedilatildeo por parte dos investigadores Contudo o mundo editorial de AA conta jaacute com editoras de grande qualidade que implementaram sistemas rigorosos de revisatildeo cientiacutefica como satildeo o caso da BioMed Central ou PLoS (Swan 2012) O Sponsoring Consortium for Open Access Publishing in Particle Physics (SCOAP3) eacute um exemplo de sucesso de publicaccedilatildeo em AA dourado Sob orientaccedilatildeo do European Organization for Nuclear Research (CERN) apostou no redireccionamento do dinheiro aplicado nas subscriccedilotildees de revistas cientiacuteficas para efetuar o pagamento dos APCrsquos das revistas de AA da aacuterea da fiacutesica das partiacuteculas (Sponsoring Consortium for Open Access Publishing in Particle Physics [SCOAP3] 2014) Algumas revistas cientiacuteficas utilizam um modelo hiacutebrido que lhes permite dobrar os lucros ao cobrar subscriccedilotildees para acesso aos artigos permitindo contudo que estes fiquem em AA se for pago o APC pelo autor (Swan 2012)

15

O Reino Unido um dos liacutederes mundiais em investigaccedilatildeo concluiu que a implementaccedilatildeo de uma licenccedila nacional pode potenciar o AA ao permitir a negociaccedilatildeo de preccedilos ao mesmo tempo que orienta os investigadores para a publicaccedilatildeo em AA dourado (Price amp Chaytor 2015)

112 Via Verde

De acordo com Harnad et al (2004) a via verde de AA eacute um modo de publicaccedilatildeo em revistas cientiacuteficas de subscriccedilatildeo e o respetivo auto arquivo do trabalho publicado num repositoacuterio de AA O auto arquivo eacute o ato de submeter uma coacutepia de um documento cientiacutefico num repositoacuterio de AA de forma a assegurar a abertura e acesso ao seu conteuacutedo (UNESCO 2015) Existem trecircs tipos de documentos usados na via verde a versatildeo preacute-publicada (manuscrito natildeo sujeito a revisatildeo) a versatildeo poacutes-publicada (artigo aceite para publicaccedilatildeo) e a versatildeo final publicada (Laakso 2014 Bjoumlrk Lakso Welling Paetau 2014) Laakso (2014) sublinha a diferenccedila de quantidade de artigos publicados em AA e indexados pela SCOPUS entre as vaacuterias disciplinas cientiacuteficas com a fiacutesica e as ciecircncias da sauacutede a serem as aacutereas do conhecimento mais abertas por larga margem A falta de cultura de utilizaccedilatildeo do preacute-print a ausecircncia de revistas cientiacuteficas de alta qualidade ou a falta de financiamento para pagar os APCrsquos satildeo algumas das razotildees encontradas por Bjoumlrk et al (2014) para justificar a diferenccedila

Os repositoacuterios de AA satildeo coleccedilotildees ou bases de dados bibliograacuteficas de artigos cientiacuteficos publicados na web mas incluem outros conteuacutedos como teses dissertaccedilotildees datasets ou material didaacutetico oferecendo uma ligaccedilatildeo persistente a assegurando a preservaccedilatildeo a longo-prazo (Suber 2012) Os repositoacuterios natildeo efetuam o serviccedilo de revisatildeo por pares embora alojem artigos publicados em revistas de AA Outro aspeto importante da via verde de AA eacute o facto dos repositoacuterios de AA natildeo poderem gerar permissotildees de utilizaccedilatildeo por geralmente natildeo possuiacuterem esses direitos (Suber 2012 Bjoumlrk et al 2014)

Segundo Houghton amp Swan (2013) a via verde eacute o meio mais sustentaacutevel em termos de custos para todas as partes envolvidas Poreacutem de acordo com Swan (2012) soacute quando o AA por via verde eacute mandatado eacute que se atingem resultados satisfatoacuterios Apesar disso os repositoacuterios podem estimular a sua utilizaccedilatildeo se fornecerem serviccedilos como a contagem de citaccedilotildees ou estatiacutesticas de uso Bjork et al (2014 traduccedilatildeo livre) afirmam que o raacutecio de depoacutesito de artigos revistos pelos pares em repositoacuterios ronda os 12 justificando este baixo nuacutemero com os fracos sistemas de incentivo acadeacutemico com a falta de repositoacuterios adequados com a falta de conhecimento e com o fato de ser uma tarefa que consome tempo

Segundo o Directory of Open Access Repositories (OpenDOAR) existem vaacuterios tipos de repositoacuterios de AA os disciplinares que reuacutenem toda a informaccedilatildeo cientiacutefica de um

16

determinado campo do conhecimento os institucionais que agregam a informaccedilatildeo produzida por uma determinada instituiccedilatildeo os governamentais que alojam informaccedilatildeo proveniente de oacutergatildeos do Governo e os repositoacuterios agregadores Em Novembro de 2016 encontram-se listados no OpenDOAR 49 repositoacuterios de AA localizados em Portugal sendo que cerca de frac34 da totalidade dos repositoacuterios pertence a instituiccedilotildees do ensino superior O Open Archive Initiative ndash Protocol for Metadata Harvesting (OAI-PMH) permite a interoperabilidade entre diferentes plataformas possibilitando aos repositoacuterios de AA formar um sistema central virtual potenciando a descoberta e acessibilidade da informaccedilatildeo cientiacutefica (Suber 2012 Swan 2012 Bjoumlrk et al 2014) A Cybermetrics Lab lanccedilou em 2017 o Ranking de Repositoacuterios Web um grupo de investigaccedilatildeo do Conselho Superior de Investigaccedilatildeo Cientiacutefica de Espanha com o objetivo de apoiar o AA agraves publicaccedilotildees cientiacuteficas

Portugal possui 4 repositoacuterios no grupo dos 223 ldquoTop Portalsrdquo do ranking com o Scielo Portugal a ocupar a 76ordf posiccedilatildeo o Repositoacuterio Comum na 87ordf posiccedilatildeo a Plataforma de Revistas de AA da Universidade de Aveiro na 110ordf posiccedilatildeo e o Depoacutesito de Dissertaccedilotildees e Teses Digitais na 124ordm posiccedilatildeo No ldquoTop Institutionalsrdquo Portugal eacute representado pelo Universidade do Minho Repositorium na 60ordf posiccedilatildeo seguido pelo Repositoacuterio Universidade de Lisboa na 156ordf posiccedilatildeo e Repositoacuterio Aberto Universidade do Porto na 188ordf posiccedilatildeo entre os melhores duzentos classificados Em termos de ranking mundial o Repositorium da Universidade do Minho eacute o repositoacuterio melhor colocado ocupando a 68ordf posiccedilatildeo (Cybermetrics Lab 2017)

A relaccedilatildeo entre a via verde e a via dourada pode ser vista como ldquocomplementary and synergisticrdquo pois a filosofia de criaccedilatildeo e implementaccedilatildeo eacute a mesma (Suber 201258) Para este autor a via verde natildeo necessita de investimento econoacutemico tatildeo elevado para alavancar o AA agraves publicaccedilotildees cientiacuteficas nem infringe a liberdade acadeacutemica podendo ainda cobrir todos os resultados de investigaccedilatildeo de uma instituiccedilatildeo Este modo de disseminaccedilatildeo eacute compatiacutevel com a publicaccedilatildeo nas tradicionais revistas por subscriccedilatildeo podendo ainda alojar outros conteuacutedos que natildeo apenas artigos Jaacute a via dourada possui a vantagem de ser imediata sem periacuteodos de embargo podendo ainda ser classificada como AA Livre se forem dadas as respetivas permissotildees de uso Acrescenta-se o facto de a via dourada possuir o serviccedilo de revisatildeo por pares e fornecer sempre o acesso agrave versatildeo final do artigo Suber (2012 traduccedilatildeo livre) afirma que apenas a conjugaccedilatildeo das vantagens de cada modelo de publicaccedilatildeo garante a complementaridade de publicaccedilatildeo em AA uma vez que por si soacute tanto a via verde como a via dourada natildeo satildeo suficientes para assegurar o pleno AA O autor defende que enquanto a via verde atua melhor no registo e preservaccedilatildeo da investigaccedilatildeo cientiacutefica a via dourada assegura uma melhor distribuiccedilatildeo e certificaccedilatildeo de qualidade Na impossibilidade de publicar por uma das vias o investigador pode optar pela outra via assegurando sempre o AA ao seu trabalho

17

12 A Ciecircncia Aberta

A investigaccedilatildeo cientiacutefica encontra-se numa transiccedilatildeo cultural que abrange os

modelos de publicaccedilatildeo e reutilizaccedilatildeo na procura de uma maior abertura com o cariz digital a impulsionar o acesso aos resultados cientiacuteficos Machado (2015) salienta a necessidade de adotar um conceito mais amplo e que possa alojar na sua definiccedilatildeo toda a panoacuteplia de recursos cientiacuteficos produzidos durante o processo de investigaccedilatildeo A Ciecircncia Aberta (CA) refere-se comummente ao esforccedilo para tornar mais acessiacuteveis os resultados da investigaccedilatildeo cientiacutefica financiada pelo setor puacuteblico em formato digital para a comunidade cientiacutefica setor empresarial ou sociedade em geral (OECD 2015a)

O conceito de CA eacute considerado um termo guarda-chuva que assenta em vaacuterios pilares quer para remoccedilatildeo das barreiras de partilha de qualquer resultado meacutetodo ou ferramenta em qualquer fase do processo de investigaccedilatildeo (Bueno de la Fuente 2016 traduccedilatildeo livre) quer como sua condiccedilatildeo para a sua concretizaccedilatildeo (infraestrutura tecnoloacutegica) quer como desambiguaccedilatildeo de autores instituiccedilotildees e produccedilatildeo cientiacutefica (identificadores uacutenicos) A figura seguinte expressa algumas das vertentes que se enquadram no conceito amplo de CA e que respeita a manifestaccedilotildees muito distintas natildeo apenas da academia como jaacute foi referido mas de todas as esferas da sociedade

Fig 1 Os pilares da Ciecircncia Aberta Fonte adaptado de httpswwwfosteropenscienceeucontentwhat-open-science-introduction

A CA eacute um meio e natildeo um fim Garantir o acesso aos resultados de investigaccedilatildeo cientiacutefica pode tornar o sistema de investigaccedilatildeo mais eficiente ao reduzir custos na coleta transferecircncia e reutilizaccedilatildeo de dados ao aumentar a transparecircncia e qualidade no processo de investigaccedilatildeo acelerar a transferecircncia do conhecimento aumentar a

Ciecircncia Aberta

Acesso Aberto

Dados Abertos

Ciecircncia Cidadatilde

Revisatildeo por Pares Aberta

Coacutedigo Aberto

Blocos de Notas abertos

Recursos Educacionais

Abertos

Redes Sociais Cientiacuteficas

18

repercussatildeo do conhecimento na economia e promover a ligaccedilatildeo entre cidadatildeos e a ciecircncia e a investigaccedilatildeo (OECD 2015a traduccedilatildeo livre) A colaboraccedilatildeo dos cidadatildeos no processo de investigaccedilatildeo eacute denominada ciecircncia cidadatilde sendo o movimento de CA um importante facilitador da participaccedilatildeo puacuteblica na ciecircncia (Leonelli Spichtinger Prainsack 2015) O crescimento da ciecircncia cidadatilde aumentou o nuacutemero de intervenientes na cocriaccedilatildeo de conhecimento contribuindo para a aproximaccedilatildeo da fronteira entre o cientista profissional e o amador (Royal Society 2012 International Science 2015) Segundo a UNESCO (2012) citando dados da PubMed Central 40 do acesso a resultados de investigaccedilatildeo eacute feito por cidadatildeos individuais superando a utilizaccedilatildeo feita por universidades empresas e governo

Segundo a Open Science and Research Initiative (2014) a promoccedilatildeo da CA eacute feita em 4 niacuteveis definiccedilatildeo de poliacuteticas gerais alteraccedilatildeo na cultura de trabalho alteraccedilatildeo nos meacutetodos de trabalho e desenvolvimento de serviccedilos e infraestruturas Fecher amp Friesike (2013) estruturaram as mudanccedilas na CA em cinco escolas de pensamento

Fig 2 As 5 escolas de pensamento das mudanccedilas operadas pela Ciecircncia Aberta Fonte Fecher amp Friesike (2013)

A abertura aos resultados da investigaccedilatildeo eacute segundo a UNESCO (2015) muito requerida no processo de capacitaccedilatildeo dos cidadatildeos sendo que esta noccedilatildeo de abertura acarreta mudanccedilas na sociedade ao fornecer soluccedilotildees sustentaacuteveis para o chamado fosso digital6 Para a CA prosperar a comunidade acadeacutemica deve ter acesso a publicaccedilotildees dados meacutetodos conhecimentos serviccedilos de apoio e colaboraccedilatildeo entre os diversos intervenientes (Open Science and Research Initiative 2014 Leonelli Spichtinger Prainsack 2015 OECD 2015a Resoluccedilatildeo do Conselho de Ministros nordm 212016 2016) O acesso agrave literatura acadeacutemica tem por objetivo transpor a clivagem de conhecimento existente na sociedade fornecendo o Acesso Aberto (AA) atraveacutes de sistemas em linha aos resultados da investigaccedilatildeo financiada com fundos puacuteblicos (UNESCO 2015)

6 Segundo o glossaacuterio estatiacutestico da OCDE o termo fosso digital refere-se agrave desigualdade no acesso agrave informaccedilatildeo tecnologias de comunicaccedilatildeo e uso da Internet entre indiviacuteduos negoacutecios e aacutereas geograacuteficas com diferentes niacuteveis socioeconoacutemicos Disponiacutevel na WWW httpsstatsoecdorgglossarydetailaspID=4719

bull dirigida agrave arquitetura tecnoloacutegica com novas plataformas ferramentas e serviccedilos para os cientistas Infraestrutura

bull dirigida agrave acessibilidade do conhecimento pelo puacuteblico Puacuteblica bull dirigida ao desenvolvimento de uma nova avaliaccedilatildeo alternativa de impacto Avaliaccedilatildeo

bull dirigida ao acesso gratuito ao conhecimento pelo puacuteblico Democraacutetica

bull melhoria da eficiecircncia atraveacutes da investigaccedilatildeo colaborativa Pragmaacutetica

19

O projeto da EU Facilitate Open Science Training for European Research (FOSTER) assume a divisatildeo do conceito de Ciecircncia Aberta em quatro diferentes categorias Acesso Aberto Dados Abertos Coacutedigo Aberto e Investigaccedilatildeo Replicaacutevel Aberta (Pontika Knoth Cancellieri amp Pearce 2015)

A plena implementaccedilatildeo da CA estaacute dependente da resoluccedilatildeo de alguns desafios A Royal Society (2012) afirma que os interesses comerciais e econoacutemicos incluem a propriedade dos dados e os direitos de propriedade intelectual associados as parcerias puacuteblico-privadas e a abertura de informaccedilatildeo comercial de interesse puacuteblico a que se junta a privacidade e a seguranccedila e que constituem limites agrave implementaccedilatildeo da CA Por outro lado os incentivos e as recompensas concedidos agrave comunidade cientiacutefica continuam a ser inexistentes particularmente porque existe (i) falta de infraestruturas para apoiar a abertura (ii) receio que os dados em bruto e meacutetodos sejam mal interpretados ou mal usados (iii) incerteza sobre a propriedade dos dados e (iv) falta de experiecircncia na promoccedilatildeo da CA (Open Science and Research Initiative 2014 traduccedilatildeo livre) Metaforicamente Leonelli Spichtinger Prainsack (201513) defendem que ldquoin addition to the stick of compulsatory mandates carrots are therefore also neededrdquo Os autores sintetizam as ldquocarrotsrdquo ou seja as recompensas em trecircs eixos reconhecimento das praacuteticas de partilha nas estruturas de incentivos criaccedilatildeo de incentivos mais significativos para envolver os investigadores na CA e o reconhecimento do papel das meacutetricas alternativas na avaliaccedilatildeo dos investigadores

A CA proporciona vaacuterios benefiacutecios a todos os intervenientes e partes interessadas do processo de investigaccedilatildeo como o aumento da eficaacutecia da investigaccedilatildeo o aumento do conhecimento do modelo cientiacutefico melhoria do foco e da qualidade dos resultados de investigaccedilatildeo geraccedilatildeo de novas ideias de investigaccedilatildeo aumento do compromisso com a ciecircncia e melhoria da literacia cientiacutefica maior abertura e impacto social e econoacutemico aumento da qualidade visibilidade e impacto da investigaccedilatildeo (Open Science and Research Iniciative 2014 Leonelli Spichtinger Prainsack 2015 Forsstroumlm amp Haataja 2016) Estes benefiacutecios abrangem os investigadores e as suas equipas as organizaccedilotildees os decisores e financiadores e tambeacutem o puacuteblico em geral

A CA clama por uma mudanccedila no comportamento dos investigadores de forma a permitir a abertura de conteuacutedos e a adoccedilatildeo de praacuteticas e estrateacutegias abertas em todo o ciclo de investigaccedilatildeo (Pontika et al 2015) De acordo com Machado (2015) a abertura do conhecimento na sociedade da informaccedilatildeo pode ser uma realidade se essa for a prioridade de qualquer poliacutetica que tenha por objetivo promover a melhoria das condiccedilotildees de vida dos cidadatildeos e a reduccedilatildeo das assimetrias globais Quando falamos de CA aquilo que se vecirc eacute uma realidade jaacute espelhada globalmente inclusivamente em paiacuteses como a China (Price amp Chaytor 2015) onde a abertura poliacutetica natildeo o faria supor

20

A Comissatildeo Europeia desenvolveu o Open Science Monitor como forma de avaliar os desenvolvimentos na CA e as tendecircncias particulares ldquoin open science activities over time and comparatively between countries and scientific disciplinesrdquo (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2017) O Open Science Monitor tem como fonte diversas organizaccedilotildees empenhadas na avaliaccedilatildeo da CA do AA e dos Dados Abertos7 garantindo assim a profundidade e qualidade dos dados O modelo usado pelo Open Science Monitor divide diversos indicadores de avaliaccedilatildeo em trecircs categorias AA agraves publicaccedilotildees AA aos dados de investigaccedilatildeo e formas abertas de comunicaccedilatildeo acadeacutemica como demostrado na figura8 seguinte

Fig 3 Caracteriacutesticas e indicadores do Open Science Monitor Fonte Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2017) Disponiacutevel na WWW httpeceuropaeuresearchopenscienceindexcfmpg=homeampsection=monitor

A implementaccedilatildeo da CA implica alteraccedilotildees ao niacutevel da administraccedilatildeo da investigaccedilatildeo para melhorar a ciecircncia tornando-a crediacutevel replicaacutevel e iacutentegra como explica a Comissatildeo Europeia (2016a) Significa tambeacutem fazer alteraccedilotildees teacutecnicas e desenvolver normas para tornar a ciecircncia mais eficiente ao evitar a duplicaccedilatildeo de 7 Entre as vaacuterias organizaccedilotildees encontram-se a 101 innovations Clarivate Analytics Altimetric arXiv F1000Research figshare OpenAIRE Wiley entre outras 8 Os indicadores assinalados com um asterisco () tambeacutem satildeo considerados como forma de comunicaccedilatildeo acadeacutemica aberta

21

recursos e ao otimizar a reutilizaccedilatildeo de dados Por fim tornar a ciecircncia mais aberta ao melhorar a acessibilidade a dados e ao assegurar as condiccedilotildees legais apropriadas para o desenvolvimento de Text e Data Mining potenciando assim alteraccedilotildees econoacutemicas e legais ao niacutevel do copyright

Os investigadores recorrem cada vez mais agraves plataformas sociais para partilhar e validar os projetos de investigaccedilatildeo enquanto a criaccedilatildeo de plataformas abertas permite a partilha de dados para resoluccedilatildeo de problemas puacuteblicos como eacute o caso do The Humanitarian Data Exchange9 (Open Science and Research Initiative 2014) A ScienceOpen eacute outro exemplo de uma plataforma gratuita de pesquisa de informaccedilatildeo cientiacutefica que oferece contexto agrave investigaccedilatildeo atraveacutes de comentaacuterios recomendaccedilotildees ou revisatildeo por pares apoacutes a publicaccedilatildeo permitindo assim que os investigadores encontrem a informaccedilatildeo mais relevante para as suas pesquisas (ScienceOpen 2017) Nos uacuteltimos anos tecircm surgido outras formas de publicaccedilatildeo em AA normalmente atraveacutes de paacuteginas pessoais ou em siacutetios de comunidades cientiacuteficas como o academiaedu ou o Research Gate que em 2017 foram classificados como liacutederes do ranking ldquoTop Portalsrdquo do Ranking de Repositoacuterios Web pela Cybermetrics Lab Outros resultados interessantes foram obtidos por Kramer e Bosman (2016) apoacutes a anaacutelise dos dados dos mais de 20 mil participantes num inqueacuterito a niacutevel global A CA e o AA satildeo apoiados por 809 e 859 dos inquiridos respetivamente Em termos de publicaccedilatildeo de artigos o estudo indica o Research Gate e os repositoacuterios institucionais como os preferidos Relativamente agrave publicaccedilatildeo de dados a preferecircncia dos inquiridos recaiu no GitHub seguindo-se o Figshare DropBox BitBucket Dataverse Dryad e o Zenodo Poreacutem dos 20 mil inquiridos apenas cerca de 30 respondeu a esta questatildeo Em relaccedilatildeo a Portugal e no caso do apoio agrave CA e ao AA os resultados satildeo extremamente positivos contudo a amostra obtida eacute demasiado pequena para se poder aferir qualquer conclusatildeo definitiva E contrastam de forma gritante com as conclusotildees do relatoacuterio sobre a elaboraccedilatildeo de uma poliacutetica nacional de CA que sublinha a dificuldade de generalizaccedilatildeo das praacuteticas de AA registando por isso limitaccedilotildees nas ldquotaxas de sucesso e cumprimentos das poliacuteticas institucionaisrdquo (Comissatildeo Executiva Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta [Comissatildeo Executiva GT-PNCA] 20169)

A intenccedilatildeo da EU eacute criar uma European Open Science Cloud (EOSC) ou seja um ambiente onde os investigadores possam ter acesso a ferramentas e dados para fins de investigaccedilatildeo inovaccedilatildeo e educaccedilatildeo Esta plataforma eacute considerada uma parte fundamental da transiccedilatildeo europeia para a CA e para tornar a ciecircncia orientada por dados (Comissatildeo Europeia 2016a traduccedilatildeo livre)

Podem observar-se algumas tendecircncias chave na CA e a sua relevacircncia na EOSC como o novo modelo de comunicaccedilatildeo acadeacutemica recompensas modernas e

9 Disponiacutevel na WWW httpsdatahumdataorg

22

reconhecimento aumento da dependecircncia de peritos de dados colaboraccedilatildeo interdisciplinar fomento da transiccedilatildeo de ciecircncia para inovaccedilatildeo desenvolvimento de um complexo sistema de infraestruturas da integridade da investigaccedilatildeo e do processamento do conhecimento por maacutequinas (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016b traduccedilatildeo livre)

O FOSTER desenhou uma interessante taxonomia a partir do termo CA que permite demonstrar a grandeza e os diferentes niacuteveis de impacto do conceito (Pontika et al 2015)

Fig 4 Taxonomia da Ciecircncia Aberta Fonte Knoth Petr Pontika Nancy (2015)

Em termos de poliacuteticas existem trecircs tendecircncias na definiccedilatildeo das poliacuteticas de CA como refere a OECD (2015a traduccedilatildeo livre)

As regras obrigatoacuterias impostas nos contratos de financiamento ou em poliacuteticas nacionais

Os mecanismos de incentivo como o apoio financeiro para publicaccedilatildeo de investigaccedilatildeo a citaccedilatildeo e a progressatildeo na carreira

Os viabilizadores ou seja a infraestrutura que permite o decurso da abertura cientiacutefica

23

A OECD (2015a) acrescenta que as poliacuteticas de AA satildeo mais maduras que as poliacuteticas de Ciecircncia Aberta existentes e sublinha ainda que as poliacuteticas de CA devem ter princiacutepios-base mas que tecircm de ser adaptadas agraves realidades locais

A CA tem estado em foco na agenda poliacutetica dos governos e organizaccedilotildees mundiais Ao niacutevel europeu a Agenda Digital da Comissatildeo Europeia define cinco potenciais linhas de accedilatildeo poliacuteticas (Comissatildeo Europeia 2016a45 traduccedilatildeo livre)

Fomento e criaccedilatildeo de incentivos para a CA atraveacutes do fomento do conceito de abertura em programas de educaccedilatildeo e promoccedilatildeo das melhores praacuteticas de ciecircncia cidadatilde garantindo a qualidade impacto e integridade da investigaccedilatildeo

Remoccedilatildeo de barreiras atraveacutes da revisatildeo de carreiras dos investigadores bem como dos incentivos e recompensas pelos esforccedilos de CA

Generalizaccedilatildeo da promoccedilatildeo de poliacuteticas de AA (artigos e dados de investigaccedilatildeo) Desenvolvimento de infraestruturas de investigaccedilatildeo para a CA de forma a

melhorar o alojamento de dados acesso e governaccedilatildeo com a criaccedilatildeo de uma nuvem europeia de CA (European Open Science Cloud)

Incorporar a Ciecircncia Aberta na sociedade como condutor socioeconoacutemico

De acordo com a Open Science and Research Initiative (2014) a CA tem vaacuterios intervenientes distintos os investigadores e as equipas de investigaccedilatildeo organizaccedilotildeesentidades de investigaccedilatildeo financiadores decisores e puacuteblico em geral A OECD (2015a) acrescenta as bibliotecas editoras cientiacuteficas privadas empresas e entidades supranacionais como a proacutepria OECD Neste contexto a EU tem-se destacado como promotora da CA Nesse sentido criou o jaacute mencionado FOSTER um projeto cujo objetivo eacute produzir um programa de treino que iraacute ajudar investigadores estudantes bibliotecaacuterios e outras partes interessadas a incorporar a CA nas suas metodologias de investigaccedilatildeo O portal FOSTER10 eacute uma plataforma e-learning que agrega conteuacutedos de treino sobre CA para aqueles que precisem de desenvolver estrateacutegias e competecircncias para a implementaccedilatildeo da CA nos fluxos de trabalho diaacuterio (FOSTER 2016) A Uniatildeo Europeia (EU) posiciona-se tambeacutem como financiadora do AA como forma de acesso ao conhecimento Nesse sentido adotou o AA como princiacutepio em 2012 tendo-o definido como obrigatoacuterio em 2013 no novo programa de financiamento da investigaccedilatildeo e inovaccedilatildeo europeu denominado Horizonte 2020 (Uniatildeo Europeia 2013) Financiou ainda um projeto de investigaccedilatildeo exclusivamente dedicado ao alinhamento de estrateacutegias e poliacuteticas de AA o Pasteur4OA Aleacutem disso a EU criou o OpenAIRE uma plataforma que permite agregar toda a literatura cientiacutefica produzida em projetos financiados por fundos europeus A segunda fase do OpenAIRE consiste em facilitar o AA ao fornecer ligaccedilotildees cruzadas entre publicaccedilotildees dados e esquemas de financiamento e iraacute expandir a rede de repositoacuterios para incluir os fornecedores de dados com o objetivo de interligar os dados cientiacuteficos associados

10 Disponiacutevel na WWW httpswwwfosteropenscienceeu

24

(OECD 2015a) A terceira fase do projeto arrancou em Janeiro de 2017 com o OpenAIRE-Connect que visa fornecer pontes tecnoloacutegicas e sociais para aleacutem de disponibilizar serviccedilos de troca de literatura dados ou meacutetodos de investigaccedilatildeo ldquowith semantic links between them across research communities and content providers in scientific communicationrdquo (OpenAIRE 2017) O OpenAIRE-Connect iraacute tambeacutem implementar o conceito de ldquoOpen Science as a Service (OSaaS) on top of the existing OpenAIRE infrastructure delivering out-of-the-box on demand deployable toolsrdquo (OpenAIRE 2017) O projeto eacute uma parceria entre 11 instituiccedilotildees onde consta a Universidade do Minho como representante portuguesa

A UNESCO estaacute ativamente empenhada na promoccedilatildeo da CA e em parceria com a Nature lanccedilou em Novembro de 2014 a Biblioteca Mundial de Ciecircncia11 (WLoS) uma biblioteca cientiacutefica gratuita e multilingue com o objetivo de fornecer acesso agrave investigaccedilatildeo cientiacutefica recente a estudantes e professores de todas as partes do globo Podemos ainda relacionar a CA com o conceito de Ciecircncia 20 que sugere a partilha e a colaboraccedilatildeo como nova abordagem para o uso de informaccedilatildeo incluindo o uso de ferramentas como wikis blogs viacutedeos dados em bruto e novas teorias (Machado 2015 Leonelli Spichtinger Prainsack 2015)

Em Portugal soacute em fevereiro de 2016 se regista a intenccedilatildeo de estabelecer uma poliacutetica nacional de Ciecircncia Aberta com a publicaccedilatildeo dos principiacuteos orientadores para a ldquoCiecircncia Aberta Conhecimento para todosrdquo pelo Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior (MCTES) Em Maio a Resoluccedilatildeo do Conselho de Ministros nordm 212016 vem definir os princiacutepios da implementaccedilatildeo da poliacutetica de Ciecircncia Aberta em Portugal Esta poliacutetica estaacute estruturada em torno de quatro eixos Acesso aberto e dados abertos Infraestruturas e preservaccedilatildeo digital Avaliaccedilatildeo cientiacutefica Responsabilidade social cientiacutefica (Comissatildeo Executiva GT-PNCA 2016)

O MCTES e o Ministeacuterio da Cultura lanccedilaram em 201712 o Diretoacuterio dos Repositoacuterios Digitais uma infraestrutura digital com o objetivo de identificar e constituir um ponto de acesso aos repositoacuterios digitais existentes em Portugal na aacuterea da Ciecircncia e da Cultura de forma a promover a utilizaccedilatildeo dos repositoacuterios digitais bem como a normalizaccedilatildeo teacutecnica e praacuteticas de preservaccedilatildeo digital tal como foi anunciado em 2016 (Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior Ministeacuterio da Cultura 2016)

13 Big Data ou dados massivos

O termo Big Data surge associado aos dados em formato digital que excedem a capacidade de processamento dos sistemas de bases de dados convencionais (Reitano 11 Disponiacutevel na WWW httpwwwnaturecomwlsabout 12 Disponiacutevel na WWW httprepositorios-conhecimentopt

25

2013 Comissatildeo Europeia 2014) Segundo Borgman (2015) o Big Data compreende dados estruturados e natildeo estruturados com tendecircncia agrave homogeneidade e agrave padronizaccedilatildeo Ubaldi (2013 traduccedilatildeo livre) reitera que o Big Data enquanto fenoacutemeno emergiu quando a disponibilidade de datasets produzidos por vaacuterias fontes cresceu e quando os utilizadores de dados reconheceram o valor potencial da combinaccedilatildeo e ligaccedilatildeo de diferentes conjuntos de dados produzidos por diferentes intervenientes

A revoluccedilatildeo digital ocorrida nas uacuteltimas deacutecadas teve repercussotildees profundas na coleta acesso armazenamento e transmissatildeo de dados estando atualmente estimado em 40 o volume de crescimento de dados por ano (Manyika et al 2011) Os dados digitais estatildeo presentes em todos os setores econoacutemicos o nuacutemero de paacuteginas web cresceu exponencialmente surgiram as redes sociais os smartphones e toda uma panoacuteplia de tecnologias que coletam dados que podem ser beneacuteficos para a sociedade como as aplicaccedilotildees surgidas no acircmbito da Internet of Things13 (IoT) que iratildeo avolumar o nuacutemero de dados jaacute produzidos (Fan amp Bifet 2012)

Weacutere drowning in data bits are faster than atoms (Croll 20122)

Large amounts of data are being produced permanently and when these are analyzed and interlinked they have the potential to create new knowledge and intelligent solutions for economy and society (Uniatildeo Europeia 2016)

Lynch (2009) salienta a emergecircncia do 4ordm paradigma da investigaccedilatildeo cientiacutefica termo cunhado por Jim Gray definindo-se como uma ciecircncia intensiva orientada a dados

Fig 5 Paradigmas da investigaccedilatildeo cientiacutefica Fonte traduzido de Lynch (2009)

Esta nova ciecircncia assenta em trecircs pilares captura curadoria e anaacutelise de dados (Bell 2009 Royal Society 2012) A curadoria de dados envolve variadas atividades como ldquofinding the right data structures to map into various storesrdquo (Bell 2009XIII) Inclui o esquema de metadados e os respetivos metadados para a sua preservaccedilatildeo e pesquisa A anaacutelise de dados ldquocovers a whole range of activities throughout the workflow pipeline including the use of databases analysis and modeling and then

13 A Internet Of Things eacute um conceito onde edifiacutecios transportes produtos e pessoas se tornam espaccedilos de informaccedilatildeo ou seja satildeo imbuiacutedos com sensores software ou eletroacutenica que lhes permite coletar e partilhar dados Disponiacutevel na WWW httpwwwtheinternetofthingseuwhat-is-the-internet-of-things

Investigaccedilatildeo teoacuterica

Investigaccedilatildeo empiacuterica

Investigaccedilatildeo computacional

Investigaccedilatildeo orientada a dados

26

data visualizationrdquo (Bell 2009XIV) podendo ser sinoacutenimo de melhores resultados processos e decisotildees (Comissatildeo Europeia 2014)

Dumbill (2012) afirma que para retirar valor destes dados eacute necessaacuterio encontrar formas alternativas de os processar Borgman reitera que os dados tecircm muitos tipos de valor e que esse valor pode natildeo ser visiacutevel ateacute os dados serem coletados curados ou perdidos A autora sublinha que os dados natildeo tecircm valor estando isolados eles fazem parte de uma infraestrutura do conhecimento ldquoan ecology of people pratices technologies institutions material objects and relationshpsrdquo (Borgman 20154) Este volume de dados produzidos pode segundo o Big Data Europe (2016) trazer contribuiccedilotildees relevantes para o progresso teacutecnico dos setores chave da sociedade e ajudar a reformular o mundo dos negoacutecios Ainda segundo a EU ldquowhat is needed are innovative technologies strategies and competencies for the beneficial use of Big Data to address societal needsrdquo

Segundo Manyika et al (2011) os Dados Massivos podem gerar valor de vaacuterias formas criar transparecircncia governativa e empresarial permitir a experimentaccedilatildeo expor variaacuteveis e melhorar o rendimento criar de produtos e serviccedilos para populaccedilotildees especiacuteficas apoiar ou substituir o processo de decisatildeo humana com algoritmos automatizados criar de modelos de negoacutecio produtos e serviccedilos inovadores Verifica-se que um nuacutemero crescente de empresas jaacute usa dados para gerar valor econoacutemico sendo que tambeacutem os governos tecircm a possibilidade de aumentar a sua eficiecircncia e gerar poupanccedila (Manyika et al 2011) A Comissatildeo Europeia (2017a) destaca as aplicaccedilotildees para smartphones ou produtos inteligentes para empresas acrescentando que os Dados Massivos podem fomentar o crescimento de emprego na Europa e melhorar a qualidade de vida dos cidadatildeos europeus

Numa organizaccedilatildeo o valor do Big Data eacute contabilizado em duas categorias uso analiacutetico e desenvolvimento de novos produtos (Dumbill 2012) Croll (20122) afirma a necessidade da sociedade em decidir agir e experimentar com base nas aprendizagens feitas e utilizar esse conhecimento em accedilotildees futuras defendendo que estamos a entrar numa ldquofeedback economyrdquo que iraacute tornar-se a norma em organizaccedilotildees puacuteblicas e no setor empresarial dada a eficiecircncia e a otimizaccedilatildeo de recursos geradas Esta economia de retorno de resultados e respetivas mediccedilotildees de impacto tem por base a cadeia de abastecimento dos Dados Massivos como representado na figura seguinte

27

Fig 6 Cadeia de abastecimento dos Dados Massivos Fonte traduzido de Croll (2012)

ldquoIn this networked world people objects and connections are producing data at unprecedented rates both actively and passivelyrdquo (Science International 2015) Segundo Hey Tansley e Tolle (2009) a Internet pode proporcionar mais do que o acesso aos dados pode agregar todos os dados disponiacuteveis agrave literatura que lhes faz referecircncia aumentando a velocidade da informaccedilatildeo cientiacutefica e a eficiecircncia da investigaccedilatildeo Laney (2001) foi o primeiro a caraterizar a gestatildeo de dados atraveacutes do sistema de trecircs Vrsquos que ajuda a perceber a natureza dos dados e as plataformas disponiacuteveis para os explorar Marr (2014) afirma que atualmente o sistema passou a ser composto por dois Vrsquos adicionais perfazendo um total de cinco Vrsquos

Volume o volume e o tamanho dos dados continuam a aumentar contudo a capacidade de processamento dos nossos sistemas continua baixa

Variedade existecircncia de diversos tipos de dados provenientes de diversas fontes Velocidade obtenccedilatildeo de informaccedilatildeo em tempo real Veracidade refere-se agrave qualidade e correccedilatildeo dos dados Valor ganho de competitividade tomada de decisotildees alavancada em informaccedilatildeo

atualizada

A intensidade da revoluccedilatildeo operada pelo fenoacutemeno dos Dados Massivos ldquohas produced changes in economic and social behaviour e has profound implications for sciencerdquo permitindo a identificaccedilatildeo de padrotildees em fenoacutemenos e demonstrando relaccedilotildees insuspeitas entre dados que ateacute aqui eram desconhecidas (Science International 2015) ldquoContrary to many high-volume big data settings where standardised infrastructure are available there exist other big data settings with less

Coleta de Dados

Extraccedilatildeo e Limpeza

Infra

estruturas

Plataformas

M Learning e Mining

Exploraccedilatildeo humana

Armazena mento

Partilha

Mediccedilatildeo de resultados e criaccedilatildeo de feedback

28

mature processes due to the lack of tools resources and community exchangerdquo (Proumll Meixner ampRauber 2016) Borgman (20158) recorre a um termo utilizado na Estatiacutestica para identificar distribuiccedilotildees de dados a long tail of data14 ou cauda longa dos dados que quando aplicada agrave investigaccedilatildeo acadeacutemica implica que ldquoa small number of research teams work with large volumes of data some teams work with very little data and most fall somewhere in betweenrdquo

Fig 7 A cauda longa dos Dados Massivos Fonte traduzido de Borgman (2015)

A cauda longa dos dados de investigaccedilatildeo abrange grandes porccedilotildees ldquoof data that are highly heterogeneous managed predominantly locally within each researcherrsquos environment and frequently not properly transferred to and managed within well-curated repositoriesrdquo (Proumll Meixner ampRauber 2016) Segundo o e-Infrastructure Reflection Group (e-IRG) (2016) citando Heidorn (2008) o termo long tail of data tem-se tambeacutem aplicado para salientar a variedade na estrutura tema complexidade formato tamanho localizaccedilatildeo e o uso na investigaccedilatildeo dos dados de investigaccedilatildeo

Para capturar todo o potencial gerado pela produccedilatildeo massiva de dados devem ser tidas em conta vaacuterias questotildees (Manyika et al 2011 traduccedilatildeo livre)

Formulaccedilatildeo de poliacuteticas de dados que incluam temas sensiacuteveis como a privacidade seguranccedila credibilidade e propriedade intelectual

Desenvolvimento de novas tecnologias de armazenamento computaccedilatildeo e software analiacutetico aleacutem de novas teacutecnicas de anaacutelise

Mudanccedila na cultura organizacional com a contrataccedilatildeo de peritos que possam retirar informaccedilatildeo e conhecimento dos dados e tambeacutem o estabelecimento de incentivos para otimizar o uso do Big Data induzindo melhorias numa tomada de decisatildeo mais informada

Acesso aos dados para permitir a criaccedilatildeo de novas oportunidades de negoacutecio Intensificaccedilatildeo da estrutura competitiva de empresas e setor puacuteblico para

potenciar a captaccedilatildeo de benefiacutecios da massificaccedilatildeo de dados

14 O termo foi introduzido por Cris Anderson (2004) para comparar o mercado de bens feito ao niacutevel de vendas fiacutesicas e online Disponiacutevel na WWW httpswwwwiredcom200410tail

Volu

me

de d

ados

Nuacutemero de Investigadores

29

O fenoacutemeno do Big Data estaacute intrinsecamente ligado a outro fenoacutemeno o desenvolvimento de software aberto como eacute o caso do Apache Hadoop15 que permite o processamento de grandes quantidades de dados em paralelo atraveacutes ldquolarge clusters of compute nodesrdquo (Fan amp Bifet 20123)

A influecircncia do Big Data na sociedade manifesta-se a diversos niacuteveis destacando-se o desenvolvimento de projetos na aacuterea da sauacutede transportes agricultura ambiente induacutestria ganho de competecircncias cientiacuteficas mercado de dados e dados abertos Num artigo assinado na Computer World Olavsrud (2013) identifica alguns dos usos do Big Data na atualidade fins meacutedicos empresariais tecnoloacutegicos em eventos desportivos ou no desenvolvimento das smart cities A Uniatildeo Europeia tem contribuiacutedo para o alargar da importacircncia e da esfera de influecircncia do fenoacutemeno Big Data financiando entre outros projetos como

DataPitch16 que tem por objetivo acelerar a chegada dos dados ao mercado Open Data Incubator Europe17 (ODINE) que oferece incubaccedilatildeo e tutoria agraves PMEs

na nova geraccedilatildeo de empreendedorismo digital European Data Science Academy18 (EDSA) que avalia o estado do setor de peritos

de dados e oferece ciclos de aprendizagem de habilidades especiacuteficas de acordo com as necessidades detetadas

Big Data Europe que visa coletar informaccedilotildees sobre o desenvolvimento de infraestruturas necessaacuterias agrave praacutetica de uma ciecircncia de dados intensiva para a resoluccedilatildeo de problemas da sociedade possibilitando que as empresas possam construir produtos e serviccedilos inovadores ldquobased on semantically interoperable large-scale multi-lingual data assets and knowledge available under a variety of licenses and business modelsrdquo (Big Data Europe 2016)

14 Dados Abertos

Eacute axiomaacutetico o fato de o conhecimento ser essencial ao processo de decisatildeo agrave inovaccedilatildeo e ao bem-estar social Os dados sempre foram essenciais em muitas aacutereas da investigaccedilatildeo e nos uacuteltimos anos tornaram-se destaque em mais aacutereas cientiacuteficas crescendo substancialmente em escala e complexidade Quando a informaccedilatildeo eacute abundante a proacutepria natureza da investigaccedilatildeo comeccedila a mudar gerando um ciclo de respostas entre investigadores e resultados de investigaccedilatildeo que ldquochanges the pace and direction of discoveryrdquo (Comissatildeo Europeia Grupo de peritos de alto niacutevel em dados de investigaccedilatildeo 20108) Os Dados Abertos permitem que os investigadores produzam anaacutelises e inferecircncias muito aleacutem do que os indiviacuteduos e silos de dados isolados podem

15 Disponiacutevel na WWW httphadoopapacheorg 16 Disponiacutevel na WWW httpcordiseuropaeuprojectrcn206193_enhtml 17 Disponiacutevel na WWW httpsopendataincubatoreu 18 Disponiacutevel na WWW httpcordiseuropaeuprojectrcn194116_enhtml

30

produzir (Shadbolt 2016) O International Council for Science (ICSU) considera que quando o setor publico eacute o responsaacutevel pelos custos da criaccedilatildeo de dados de investigaccedilatildeo eacute do interesse cientiacutefico que seja encorajado o maacuteximo e possiacutevel uso e reuacuteso dos dados (International Council for Science [ICSU] 2014) A abertura dos dados gerados na investigaccedilatildeo cientiacutefica ou pelas entidades puacuteblicas as grandes fontes de dados na atualidade constituem uma oportunidade de gerar valor para a sociedade Segundo Borgman (2015) dados satildeo representaccedilotildees de observaccedilotildees objetos ou outras entidades usadas como prova de um fenoacutemeno para fins de investigaccedilatildeo ou acadeacutemicos Os dados tornam-se informaccedilatildeo quando satildeo combinados de formas que podem revelar padrotildees num determinado fenoacutemeno O conhecimento eacute gerado pela informaccedilatildeo apoiada em dados concretos sobre um fenoacutemeno (Royal Society 2012)

ldquoIn the digital age data is the raw material on which discoveries are built and unfettered access to research datardquo (SPARC) O processo de investigaccedilatildeo eacute dividido em vaacuterias etapas atraveacutes das quais muitas vezes satildeo produzidos dados primaacuterios estatiacutesticas caacutelculos ou anotaccedilotildees seja em forma bruta ou em forma graacutefica que servem de suporte aos artigos cientiacuteficos publicados Contudo dada a variedade de tipologias e formatos por norma os dados natildeo satildeo alvo de publicaccedilatildeo correndo o risco de ser perderem se natildeo forem adequadamente armazenados e preservados Neste sentido a abertura de dados eacute essencial para assegurar a sua preservaccedilatildeo e possiacutevel reutilizaccedilatildeo em benefiacutecio da sociedade

Existem vaacuterias definiccedilotildees de Dados Abertos apresentando algumas diferenccedilas entre elas embora focando o mesmo objetivo Algumas das definiccedilotildees satildeo emitidas no acircmbito da abertura de dados puacuteblicos outras da abertura de dados de investigaccedilatildeo O portal de dados dos EUA define Open Data como os conjuntos de dados de alto valor criados pelo governo federal que possam ser processados por maacutequina e que natildeo sejam privados ou restritos por razotildees de seguranccedila (United States General Services Administration) A Royal Society (2012) entende por Open Data os dados que devem ser acessiacuteveis utilizaacuteveis avaliados ou certificados e inteligiacuteveis A Open Definition sintetiza que os Dados Abertos devem poder ser ldquofreely used modified and shared by anyone for any purposerdquo (Open Knowledge International [a]) Segundo a Open Knowledge International (OKI) (2012b) ldquoOpen Data are the building blocks of open knowledgerdquo O termo Open Data pode ainda referir-se a outros tipos de dados natildeo puacuteblicos que sejam acessiacuteveis de forma livre como os dados dos meacutedia sociais (European Data Portal 2016a)

ldquoOpenness is not however enough Data must be intelligently openrdquo (Science International 20154) O primeiro passo na abertura inteligente dos dados eacute segundo a Royal Society (20127) ldquodata that underpin a journal article should be made concurrently available in a accessible databaserdquo O mundo acadeacutemico tem vindo a ser moldado para apoiar a abertura agrave medida que os benefiacutecios se tornam mais tangiacuteveis e

31

a pressatildeo de retorno de investimento exercida sobre as entidades financiadoras aumenta embora nem todas as aacutereas evoluam com a mesma rapidez (Hahnel amp Hook 2016) A Royal Society (2012) sublinha a necessidade das instituiccedilotildees ligadas agrave investigaccedilatildeo cientiacutefica gerirem os seus dados de modo proficiente para obterem os benefiacutecios proporcionados pela abertura de dados e entenderem a enorme mudanccedila cultural necessaacuteria para atingir este objetivo

A Denton Declaration foi publicada em 2012 com o intuito de promover boas praacuteticas de gestatildeo de dados de investigaccedilatildeo promover a colaboraccedilatildeo transparecircncia e prestaccedilatildeo de contas ao longo das fronteiras organizacionais e disciplinares Esta declaraccedilatildeo estabeleceu treze princiacutepios para promover a cultura de abertura na investigaccedilatildeo estabelecer um padratildeo para arquivo de dados de modo a facilitar a sua pesquisa e acesso desenvolver um regime de financiamento para a construccedilatildeo da infraestrutura necessaacuteria para a gestatildeo de dados adotar padrotildees de metadados preservar a longo prazo os dados subjacentes agraves publicaccedilotildees apoiar os investigadores nas negociaccedilotildees para a abertura dos dados com as editoras e o reconhecer da propriedade intelectual dos investigadores nos dados e em outros produtos de investigaccedilatildeo (Denton Declaration An Open Data Manifesto 2012 traduccedilatildeo livre)

A gestatildeo de informaccedilatildeo e do conhecimento deve ser incluiacuteda nas estrateacutegias organizacionais das instituiccedilotildees (Royal Society 2012) Quando os dados satildeo bem organizados documentados preservados e partilhados tornam-se preciosos no avanccedilo cientiacutefico e no aumento de oportunidades de aprendizagem e inovaccedilatildeo (UK Data Archive 2017) O ciclo de vida dos dados contempla seis fases de gestatildeo incluiacutedas num processo contiacutenuo a cada reutilizaccedilatildeo geram-se novos dados conforme demonstrado na figura seguinte

Fig 8 Ciclo de vida dos dados de investigaccedilatildeo Fonte traduzido de UK Data Archive (2017) Disponiacutevel na WWW httpwwwdata-archiveacukcreate-managelife-cycle

As seis fases do ciclo de vida dos dados comportam diversas accedilotildees necessaacuterias agrave plena execuccedilatildeo de cada ciclo

Criaccedilatildeo

Processa mento

Anaacutelise

Preservaccedilatildeo

Fornecer acesso

Reutilizaccedilatildeo

32

Criaccedilatildeo desenho da investigaccedilatildeo criaccedilatildeo do plano de gestatildeo de dados planear a partilha localizar dados existente coletar dados capturar eou criar metadados

Processamento entrada de dados transcriccedilatildeo traduccedilatildeo validaccedilatildeo limpeza anonimizaccedilatildeo descriccedilatildeo gestatildeo e armazenamento de dados

Anaacutelise interpretaccedilatildeo e derivaccedilatildeo de dados produccedilatildeo de resultados de investigaccedilatildeo publicaccedilatildeo e preparaccedilatildeo dos dados para preservaccedilatildeo

Preservaccedilatildeo migraccedilatildeo de dados para o melhor formato criaccedilatildeo de coacutepia de seguranccedila e armazenamento criaccedilatildeo de metadados e arquivo

Fornecer acesso distribuir e partilhar dados controlar o acesso estabelecer a propriedade intelectual promover os dados

Reutilizaccedilatildeo acompanhamento da investigaccedilatildeo assumir a revisatildeo da investigaccedilatildeo escrutinar os resultados e aprender e ensinar (UK Data Archive 2017)

Com o objetivo de contribuir para a adoccedilatildeo de padrotildees e poliacuteticas de Dados Abertos de investigaccedilatildeo algumas organizaccedilotildees lanccedilaram iniciativas e princiacutepios de Open Data destinadas agrave recomendaccedilatildeo de boas praticas na publicaccedilatildeo de dados de investigaccedilatildeo obtidos atraveacutes de financiamento puacuteblico Apoacutes o lanccedilamento de uma declaraccedilatildeo em 2004 a OECD publicou em 2007 um conjunto de 13 princiacutepios para abertura de dados de investigaccedilatildeo provenientes de financiamento puacuteblico Em 2010 foram lanccedilados os Panton Principles um conjunto de quatro princiacutepios delimitadores da abertura de dados na ciecircncia cujo foco centrou-se no licenciamento de conteuacutedos para garantir uma clara partilha distribuiccedilatildeo e reutilizaccedilatildeo de informaccedilatildeo pelos investigadores (Panton Principles 2010 traduccedilatildeo livre) A Royal Society afirma em 2012 que os dados abertos devem ser acessiacuteveis inteligiacuteveis avaliaacuteveis e reutilizaacuteveis Em 2014 foram publicados os Nairobi Data Sharing Principles um conjunto de dez recomendaccedilotildees destinadas a apoiar a abertura de dados puacuteblicos e de investigaccedilatildeo nos paiacuteses em vias de desenvolvimento por forma a gerar valor econoacutemico social educacional e potenciar a investigaccedilatildeo cientiacutefica (International Workshop on Open Data for Science and Sustainability in Developing Countries 2014)

A Open Definition um projeto da responsabilidade da OKI fixou os princiacutepios que definem a abertura de dados e conteuacutedos assegurando a qualidade e encorajando a compatibilidade de diferentes tipos de conteuacutedos atraveacutes da utilizaccedilatildeo precisa do termo aberto (Open Knowledge International [a] traduccedilatildeo livre) Assim o termo Dados Abertos engloba dois tipos diferentes de abertura

Abertura Teacutecnica os conteuacutedos devem ser publicados sob uma licenccedila aberta ao custo de produccedilatildeo num formato aberto e que possa ser processado por maacutequina

Abertura Legal a licenccedila aberta deve permitir o uso redistribuiccedilatildeo modificaccedilatildeo separaccedilatildeo compilaccedilatildeo propagaccedilatildeo aplicaccedilatildeo para qualquer fim ou propoacutesito sem custos e sem discriminaccedilatildeo contra pessoas ou grupos A mesma licenccedila pode requerer condiccedilotildees de uso como a atribuiccedilatildeo de creacutedito de autoria manutenccedilatildeo

33

da integridade do trabalho original redistribuiccedilatildeo sob a mesma licenccedila do original retenccedilatildeo de notificaccedilotildees de copyright acesso agrave fonte original proibiccedilatildeo de implementaccedilatildeo de restriccedilotildees teacutecnicas e implementaccedilatildeo de regras de natildeo-agressatildeo com a licenccedila original (Open Knowledge International [a]) traduccedilatildeo livre)

A Science International (2016) eacute o conjunto das 4 entidades mais representativas a niacutevel da ciecircncia internacional (International Council for Science ndash ICSU the InterAcademy Partnership ndash IAP The World Academy of Sciences ndash TWAS and the International Social Science Council ndash ISSC) que tecircm por missatildeo representar a comunidade cientiacutefica global na definiccedilatildeo de poliacuteticas cientiacuteficas internacionais Esta organizaccedilatildeo lanccedilou 12 princiacutepios para os Dados Abertos criados com base em outros relatoacuterios da autoria quer dos proacuteprios parceiros da Science International quer de instituiccedilotildees governamentais ou acadeacutemicas Estes princiacutepios assentam em trecircs pilares base as responsabilidades de cada interveniente os limites da abertura e as praacuteticas adequadas (Science International 2015 traduccedilatildeo livre)

Todos estes princiacutepios de abertura de dados de investigaccedilatildeo foram sintetizados no Quadro 1 apresentando-se apenas os princiacutepios mencionados em pelo menos duas recomendaccedilotildees de Open Data

Quadro 1 Princiacutepios de abertura de dados de investigaccedilatildeo mais recomendados

Princiacutepios e recomendaccedilotildees

OECD Princ (2007)

Panton Princ (2010)

Royal Soc

(2012)

Nairobi Princ (2014)

Science Int

(2015)

Open Defini tion

Abertura Acesso Reutilizaccedilatildeo

Citaccedilatildeo de dados Interoperabilidade Sem discriminaccedilatildeo Licenccedilas Abertas Formato Aberto

Processaacuteveis p maacutequina Modificaccedilatildeo

Publicaccedilatildeo imediata Qualidade

Acesso Gratuito Disponibilidade

Sustentabilidade Qualidade

Integridade

Fonte Elaboraccedilatildeo proacutepria

Analisando em detalhe os princiacutepios de abertura dos dados de investigaccedilatildeo eacute possiacutevel retirar algumas ilaccedilotildees sobre quais as recomendaccedilotildees consideradas mais importantes Verifica-se uma grande variedade de princiacutepios propostos sendo que

34

apenas 16 num total de 33 se repetem em 2 ou mais recomendaccedilotildees A abertura legal e teacutecnica dos dados soacute eacute acautelada por metade dos princiacutepios Os princiacutepios considerados mais importantes satildeo o AA aos dados seguido da reutilizaccedilatildeo de dados A citaccedilatildeo de dados interoperabilidade acesso sem discriminaccedilatildeo licenccedilas e formatos abertos a modificaccedilatildeo e o fato de os dados serem processaacuteveis por maacutequina satildeo mencionados apenas em trecircs recomendaccedilotildees tendo a seu favor o fato de terem sido incluiacutedas nas recomendaccedilotildees mais recentes Princiacutepios relevantes como a publicaccedilatildeo imediata a qualidade e a integridade dos dados surgem apenas duas vezes listados

Eacute possiacutevel verificar que a OKI (2012b) coloca os dados de investigaccedilatildeo ao mesmo niacutevel de importacircncia que outros tipos de dados com potencial para novos usos e aplicaccedilotildees para benefiacutecio da sociedade como os dados culturais financeiros estatiacutesticos ambientais e ainda sobre o clima e transportes

A OECD (2015a traduccedilatildeo livre) defende haver quatro tipos de dados cientiacuteficos

Fig 9 Tipos de dados cientiacuteficos Fonte traduzido de OECD (2015a)

A explosatildeo de produccedilatildeo de dados que originou o Big Data possui um segundo pilar os Dados Ligados ou Linked Data A combinaccedilatildeo destas duas abordagens tem o potencial para criar uma nova era de entendimento cientiacutefico relativamente aos maiores problemas subjacentes agrave espeacutecie humana (Science International 2015) O termo Linked Data cunhado por Tim Berners-Lee implica que as ldquorelationships among data should be made availablerdquo (World Wide Web Consortium [W3C] 2015) ou seja conjuntos de dados relacionados com um fenoacutemeno em particular e que estatildeo ligados de uma forma loacutegica podem ser conectados semanticamente dando a possibilidade de um computador poder identificar relaccedilotildees mais profundas entre eles (Science International 2015 traduccedilatildeo livre) Reitano (2013) sublinha que a informaccedilatildeo extraiacuteda de conjuntos de dados conectados eacute a que tem mais impacto na investigaccedilatildeo inovaccedilatildeo e crescimento econoacutemico Berners-Lee (2010) propocircs um esquema de 5 estrelas para classificar as melhores praacuteticas de publicaccedilatildeo de dados na web que permitam a ligaccedilatildeo entre diferentes datasets com cinco niacuteveis de abertura tecnoloacutegica

bullprovenientes de instrumentos como telescoacutepios sateacutelites sensores inqueacuteritos e outras ferramentas que registem informaccedilatildeo sobre fenoacutemenos uacutenicos

Dados de observaccedilatildeo

bullobtidos atraveacutes de maacutequinas de alto rendimento ensaios cliacutenicos ou outras experiecircncias controladas Dados experimentais

bullgerados a partir de simulaccedilotildees computacionais Dados computacionais

bullSatildeo conjunto de dados agrupados de alto niacutevel de uso pela comunidade cientiacutefica recebendo para isso um alto niacutevel de curaccedilatildeo

Coleccedilotildees de dados de referecircncia

35

Fig 10 Esquema de classificaccedilatildeo das 5 estrelas para Dados Abertos Ligados Fonte traduzido de Berners-Lee (2010) Disponiacutevel na WWW httpswwww3orgDesignIssuesLinkedDatahtml

O Linked Data usa teacutecnicas e conceitos da World Wide Web para identificar factos conceitos pessoas lugares fenoacutemenos ou documentos que contenham atributos em comum (Science International 2015 traduccedilatildeo livre) A Royal Society (201234) afirma que o aparecimento de ldquosiloed sections of the web linked datardquo deve-se ao uso de vocabulaacuterios heterogeacuteneos na descriccedilatildeo semacircntica dos dados Neste sentido a OKI desenvolveu um cataacutelogo de vocabulaacuterios de Linked Data onde constam um total de 593 distribuiacutedos por vaacuterios temas sendo os mais populares meacutetodos metadados e cataacutelogos Existem 11 vocabulaacuterios em portuguecircs embora nenhum seja exclusivo sendo mesmo a liacutengua com maior nuacutemero de vocabulaacuterios a par com o inglecircs (OKI [a])

Existem algumas razotildees para limitar a abertura da ciecircncia especialmente em redor de dados que vatildeo aleacutem de questotildees teacutecnicas envolvendo a comunidade de investigadores e a sociedade em geral Embora seja mandatado pelas poliacuteticas de Dados Abertos que todos os dados de investigaccedilatildeo obtidos atraveacutes de financiamento puacuteblico devam ser disponibilizados abertamente o fato eacute que existem exceccedilotildees legiacutetimas como questotildees de privacidade seguranccedila ou questotildees eacuteticas que impedem a total abertura de dados (Concordat on Open Research Data 2016)

Os desafios tecnoloacutegicos natildeo implicam as mesmas preocupaccedilotildees na implementaccedilatildeo do AA a dados de investigaccedilatildeo que geram os desafios financeiros culturais e legais Eacute necessaacuterio ldquoadopt technical and infrastructural solutions that holistically address the above issuesrdquo A atenccedilatildeo eacute dada a padrotildees abertos e interoperaacuteveis pesquisa harmonizada e serviccedilos identificadores permanentes promoccedilatildeo da cultura de gestatildeo de dados reutilizaccedilatildeo de dados de investigaccedilatildeo soluccedilotildees teacutecnicas para a seguranccedila e questotildees legais sobre dados de investigaccedilatildeo abertos (RECODE 20146)

Embora se registe progresso a publicaccedilatildeo de Dados Abertos continua a ser um desafio dado que a distribuiccedilatildeo aberta de dados de investigaccedilatildeo natildeo eacute um comportamento comum sendo necessaacuterio uma mudanccedila cultural (Royal Society 2012 Pontika et al 2015 Science International 2015) A avaliaccedilatildeo e revisatildeo por pares dos dados natildeo tecircm a mesma qualidade quando comparada com as publicaccedilotildees

Colocar os conteuacutedos disponiacuteveis na web (sob uma licenccedila aberta)

Tornar os dados estruturados (Excel em vez de uma imagem)

Usar formatos abertos (CSV em vez de Excel)

Usar URIrsquos para identificar os recursos (para serem indicados)

Ligar os dados a outros dados (para fornecer contexto)

36

tradicionais dado a publicaccedilatildeo de dados natildeo ser ainda uma praacutetica comum (European Research Area and Innovation Committee [ERAC] 2016) Hahnel e Hook (2016) apontam a falha na atribuiccedilatildeo de incentivos e recompensas tangiacuteveis aos investigadores pelas suas contribuiccedilotildees A publicaccedilatildeo de dados de forma aberta envolve tarefas que consomem muito tempo aos investigadores como a mudanccedila do formato dos dados manter a informaccedilatildeo atualizada alinhar os dados com as licenccedilas existentes e com os criteacuterios de publicaccedilatildeo de informaccedilatildeo sensiacutevel (Reitano 2013) A Royal Society (2012) sublinha que uma boa parte dos dados torna-se independente das publicaccedilotildees separando assim a ideia da evidecircncia

Para Hahnel e Hook (2016) a abertura de dados cientiacuteficos natildeo pode ser separada das mudanccedilas no desenvolvimento da investigaccedilatildeo e dos receios dos investigadores Estes receios manifestam-se a dois niacuteveis estrutural (questotildees de permissotildees qualidade licenciamento) e cultural (receio de natildeo ser reconhecido ou ser ultrapassado na investigaccedilatildeo)

A Science International (20156) sublinha que os custos da adaptaccedilatildeo ao ldquodata challengerdquo podem causar problemas aos paiacuteses menos desenvolvidos impedindo-os de participar na ldquoglobal research enterpriserdquo A mesma organizaccedilatildeo aponta falhas na replicabilidade de resultados cientiacuteficos atraveacutes da citaccedilatildeo de trecircs estudos nas aacutereas de oncologia preacute-cliacutenica psicologia social e economia que obtiveram meacutedias de sucesso bem inferiores a 50 Satildeo apontadas falhas como a falsificaccedilatildeo de dados raciociacutenios estatiacutesticos invaacutelidos e ausecircncia total ou parcial de dados ou metadados Eacute tambeacutem sublinhado que a falta de um padratildeo de abertura que permita testar a replicabilidade dos resultados cientiacuteficos pode torna-se uma barreira intransponiacutevel no avanccedilo da ciecircncia (Science International 2015)

O acesso aos dados de investigaccedilatildeo possuiu diversas vantagens como o fomento da inovaccedilatildeo em termos de educaccedilatildeo sauacutede estaacute na base da criaccedilatildeo de novos negoacutecios e progresso cientiacutefico (SPARC World Wide Web Foundation 2016) permite a melhoria da qualidade dos resultados de investigaccedilatildeo evita a duplicaccedilatildeo de trabalho acelera a inovaccedilatildeo aumenta a transparecircncia do progresso cientiacutefico (OECD 2007 Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016b ERAC 2016) A abertura de dados facilita a exploraccedilatildeo de novos toacutepicos natildeo estudados inicialmente reforccedila a diversidade de anaacutelise e opiniatildeo (OECD 2007) potencia o crescimento econoacutemico e a seguranccedila dos resultados da investigaccedilatildeo financiada (OECD 2007 SPARC Concordat on Open Research Data 2016 ERAC 2016) A Royal Society (2012) sublinha que a publicaccedilatildeo de dados experimentais e observacionais permite o escrutiacutenio a replicaccedilatildeo de experiecircncia e a reutilizaccedilatildeo de dados para obtenccedilatildeo de inferecircncias adicionais A mesma instituiccedilatildeo assevera que a abertura de dados permite a identificaccedilatildeo de erros a refinaccedilatildeo ou rejeiccedilatildeo de teorias realccedilando que a anaacutelise rigorosa de dados e teoria eacute o processo mais rigoroso de revisatildeo da qualidade O

37

estudo efetuado por Beagrie e Houghton (2014) a trecircs centros de dados do Reino Unido denota um acreacutescimo significativo ao niacutevel da eficiecircncia da investigaccedilatildeo nos utilizadores que usaram os centros de dados e o valor que os utilizadores retiraram dos dados excede o investimento feito na partilha e curaccedilatildeo de dados tendo os centros de dados aumentado exponencialmente o retorno do investimento feito na criaccedilatildeo e coleta de dados

Para Reitano (2013) o processo de abertura de dados pode fomentar a implementaccedilatildeo de novos padrotildees e tecnologias nas organizaccedilotildees e a mudanccedila de comportamentos culturais O mesmo autor refere que o fenoacutemeno dos Dados Abertos pode dar iniacutecio ao processo de validaccedilatildeo da qualidade dos dados A Science International (2015) sublinha o investimento nas infraestruturas fiacutesicas e tecnoloacutegicas natildeo deve ser muito elevado dado que este natildeo difere muito do exigido para uma base nacional de Ciecircncia Aberta O desenvolvimento desta e-infraestrutura pode trazer benefiacutecios a vaacuterios dos intervenientes da abertura de dados (Comissatildeo Europeia Grupo de Peritos em Dados Cientiacuteficos 2010)

Cidadatildeos beneficiam com os resultados da investigaccedilatildeo e encontram as proacuteprias respostas para questotildees importantes baseadas em provas reais

Financiadores e decisores poliacuteticos tomam decisotildees mais informadas e tecircm mais retorno no seu investimento

Investigadores obteacutem dados e ferramentas com mais facilidade aumentando assim a sua produtividade a investigaccedilatildeo extrapola a sua aacuterea de conhecimento gerando novas inferecircncias e produzindo novas soluccedilotildees

Empresas e induacutestria proporcionam uma base industrial e econoacutemica para a prosperidade usam a melhor informaccedilatildeo disponiacutevel para a sua investigaccedilatildeo e desenvolvimento criam novo conhecimento mercados oportunidades e aumentam as oportunidades de troca de conhecimento

Segundo Borgman (201515) o fluxo de informaccedilatildeo depende cada vez mais de infraestruturas tecnoloacutegicas sendo que ldquosubstantial investments in infrastructure are necessary to acquire sustain and exploit research data today tomorrow and beyondrdquo As bases de dados cientiacuteficas tecircm-se tornado importantes na infraestrutura cientiacutefica global sendo indispensaacuteveis no progresso da ciecircncia De acordo com e-IRG (2016) existem trecircs formas de desenvolver uma infraestrutura de dados de investigaccedilatildeo pelo setor industrial pelo setor puacuteblico ou por comunidades especializadas que recebam financiamento para a construccedilatildeo da sua proacutepria infraestrutura Para melhorar o acesso e uso de datasets a e-IRG recomenda

Impor as mesmas tecnologias e padrotildees a todas a disciplinas Atribuir identificadores persistentes para dados instituiccedilotildees e pessoas

38

Aumentar a pesquisabilidade e descoberta de dados nos repositoacuterios atraveacutes da criaccedilatildeo de registos de datasets e repositoacuterios conectar as publicaccedilotildees aos dados subjacentes e criar uma paacutegina de descritiva do dataset

O Open Access Directory (2016) lista 113 repositoacuterios de dados de investigaccedilatildeo referentes a 15 aacutereas do conhecimento O Registry of Research Data Repositories (re3data) eacute um serviccedilo que regista repositoacuterios de dados de investigaccedilatildeo a niacutevel mundial fornecendo acesso a 1821 repositoacuterios divididos por quatro grandes aacutereas cientiacuteficas Este serviccedilo eacute disponibilizado pelo DataCite (2017a) para fornecer acesso e armazenamento permanente de dados aos investigadores entidades financiadoras editores e instituiccedilotildees acadeacutemicas Portugal conta atualmente com dois repositoacuterios indexados o KiMoSys e o INTEGRALL ambos com ligaccedilatildeo ao ramo da biologia

O Projeto do Genoma Humano19 envolveu uma investigaccedilatildeo intensiva agrave escala global sendo um exemplo de sucesso da disponibilidade de dados abertos na inovaccedilatildeo cientiacutefica Com o intuito de facilitar a pesquisa e reutilizaccedilatildeo de dados o W3C (2014) desenvolveu um vocabulaacuterio especiacutefico para dados o Data Catalog Vocabulary (DCAT) que atraveacutes da tecnologia RDF20 facilita a interoperabilidade entre diferentes cataacutelogos de dados na web Utilizar o DCAT para descrever conjunto de dados em cataacutelogos permite aumentar a pesquisabilidade e a extraccedilatildeo de metadados a partir de outros cataacutelogos Salienta-se tambeacutem a existecircncia do schemaorg uma comunidade colaborativa com a missatildeo de criar manter e promover esquemas para dados estruturados na Internet

A Data Documentation Initiative (DDI) eacute um padratildeo internacional para descrever dados criados por meacutetodos observacionais provenientes das ciecircncias sociais econoacutemicas e da sauacutede O DDI eacute um padratildeo que pode ser utilizado para documentar as diferentes fases do ciclo de vida dos dados de investigaccedilatildeo Descrever dados utilizando o padratildeo DDI facilita a compreensatildeo interpretaccedilatildeo e uso por pessoas software e redes de computadores (Data Documentation Initiative [DDI] 2016)

Ainda em formato beta a OKI oferece um serviccedilo o is it open data21 que permite aos utilizadores inquirirem as entidades detentores de dados sobre a abertura dos seus dados focando-se essencialmente em dados de investigaccedilatildeo

19 Este projeto teve como base os Bermuda Principles que asseguraram que todos dados sobre a sequenciaccedilatildeo geneacutetica gerados por centros financiados para esse fim deveriam estar no domiacutenio puacuteblico com livre acesso Disponiacutevel na WWW httpwebornlgovscitechresourcesHuman_Genomeresearchbermudashtml 20 O Resource Description Framework (RDF) eacute um modelo padratildeo desenvolvido pela W3C que permite que dados estruturados e semiestruturados possam ser misturados expostos e partilhados atraveacutes de diferentes aplicaccedilotildees O RDF facilita a uniatildeo de datasets mesmo que usem estes esquemas diferentes Disponiacutevel na WWW httpswwww3orgRDF 21 Disponiacutevel na WWW httpwwwisitopendataorgabout

39

Verifica-se tambeacutem o lanccedilamento de revistas cientiacuteficas especiacuteficas para a ciecircncia orientada a dados como o Data Science Journal22 Scientific Data23 ou o Geoscience Data Journal possibilitando a publicaccedilatildeo de dados e dos artigos cientiacuteficos que os utilizam apoacutes o serviccedilo de revisatildeo por pares A F1000 Research24 utiliza o conceito de revisatildeo apoacutes a publicaccedilatildeo

Os Dados Abertos tecircm estado em foco quando se debate a resoluccedilatildeo de problemas humanitaacuterios A agenda 2030 definida pelas Naccedilotildees Unidas (2015) visa a erradicaccedilatildeo da pobreza e o desenvolvimento econoacutemico humanitaacuterio e social agrave escala global Os 17 objetivos de desenvolvimento sustentaacutevel contam com a preciosa ajuda da abertura de dados para a monotorizaccedilatildeo e tomada de decisatildeo Em 2016 a abertura de dados em casos de emergecircncias puacuteblicas foi alvo de forte debate com a propagaccedilatildeo de viacuterus como Zica e o Eacutebola na agenda O debate culminou na Statement on Data Sharing in Public Health Emergencies (2016) um compromisso assinado por 33 organizaccedilotildees a niacutevel global com vista agrave partilha de dados de investigaccedilatildeo e ao fomento do financiamento nestas aacutereas sensiacuteveis

Conforme indicado nos princiacutepios de Open Data da Science International (2015) existem diversos intervenientes no processo de abertura de dados sendo que cada um destes intervenientes tem responsabilidades proacuteprias Como intervenientes diretos satildeo apontados os investigadores que recebem financiamentos puacuteblicos as universidades e institutos de investigaccedilatildeo as bibliotecas institucionais agecircncias de financiamento e instituiccedilotildees de investigaccedilatildeo governos e sociedade acadeacutemicas Existem outras iniciativasorganizaccedilotildees envolvidas na promoccedilatildeo da abertura de dados como a EU Naccedilotildees Unidas OECD W3C OKI SPARC Royal Society CODATA Digital Curation Center (DCC) Research Data Aliance (RDA) ou o ICSU que procuram promover o desenvolvimento de sistemas e procedimentos a niacutevel internacional que assegurem o acesso sustentabilidade e interoperabilidade Muitas destas organizaccedilotildees jaacute desenvolveram princiacutepios de abertura e protocolos de dados proacuteprios como eacute o exemplo da EU OECD e da OKI ou formaram grupos de trabalho para a definiccedilatildeo de padrotildees de gestatildeo publicaccedilatildeo citaccedilatildeo interoperabilidade e partilha de dados como a RDA Outras como a Universidade de Edimburgo25 criaram cursos de treino em gestatildeo de dados de investigaccedilatildeo para oferecer aos seus investigadores esse conhecimento

Outras atividades e eventos relacionados com a abertura e gestatildeo de dados vatildeo ocorrendo a niacutevel global como eacute o caso do Love Your Data26 um evento internacional que teve a sua quinta ediccedilatildeo em 2017 com vista a fornecerem conhecimento e ferramentas aos investigadores para que estes possam gerir melhor os seus dados

22 Disponiacutevel na WWW httpdatasciencecodataorg 23 Disponiacutevel na WWW httpwwwnaturecomsdata 24 Disponiacutevel na WWW httpsf1000researchcomabout 25 Disponiacutevel na WWW httpdatalibedinaacukmantra 26 Disponiacutevel na WWW httpsloveyourdatawordpresscomlydw-2017

40

15 Dados Abertos Governamentais

A abertura dos dados governamentais teve a sua origem em leis de Freedom of Information (FOI) Segundo Ubaldi (2013) muitos paiacuteses da OECD adotaram este tipo de leis para assegurar o direito do acesso puacuteblico agrave informaccedilatildeo atraveacutes da publicaccedilatildeo de datasets que possam ser usados e reutilizados Os DGA ou no seu termo mais usual Open Government data (OGD) ldquois a philosophy- and increasingly a set of policies - that promotes transparency accountability and value creation by making government data available to allrdquo (OECD 2016a) Esta filosofia assenta numa nova relaccedilatildeo entre cidadatildeos e Governos atraveacutes da abertura dos dados governamentais onde todas as partes interessadas trabalham em cooperaccedilatildeo na procura de novas respostas para os problemas da sociedade num ldquolearning process of changing the culture of public sector administrationrdquo (Dietrich Cherkasov Susar 201311) Os Governos e as sociedades tecircm vindo de forma crescente a apreciar a importacircncia do acesso agrave informaccedilatildeo do setor puacuteblico para sustentar a boa gestatildeo e estimular o crescimento econoacutemico alavancado no conhecimento Esta situaccedilatildeo mudou a forma como os governos valorizaram gerem usam e partilham informaccedilatildeo sendo apoiada pela atualizaccedilatildeo das poliacuteticas estruturas e praacuteticas para produzir e usar a informaccedilatildeo puacuteblica (Ubaldi 2013 traduccedilatildeo livre) A abertura de dados permite inferir duas questotildees importantes quanto ao governo Aleacutem de assumir a preparaccedilatildeo das entidades puacuteblicas para o processo de abertura tambeacutem assume que o governo estaacute disposto a efetuar mudanccedilas consideraacuteveis no setor puacuteblico devendo atuar como um sistema aberto que interage com o seu ambiente (Jansen Charalabidis amp Zuiderwijk 2012) O objetivo eacute segundo Dietrich (20136) passar do ldquoe-gov to we-govrdquo

Os DGA estatildeo segmentados em duas partes os dados abertos e os dados governamentais ou informaccedilatildeo do setor puacuteblico (Ubaldi 2013 Dietrich Cherkasov e Susar 2013) estando os DGA na interseccedilatildeo entre estes dois tipos de dados

Fig 11 Pilares dos Dados Governamentais Abertos Fonte Dietrich (2013) Disponiacutevel na WWW httpworkspaceunpanorgsitesInternetDocumentsUNPAN95209pdf

Governo Aberto

Dados Governament

Dados Abertos

DGA

41

Os DGA referem-se agrave informaccedilatildeo coletada produzida ou paga pelo setor puacuteblico guardada em formato que possa ser lido por maacutequina e tornada acessiacutevel de forma livre para reutilizaccedilatildeo para qualquer propoacutesito atraveacutes da publicaccedilatildeo sob uma licenccedila aberta que permite a livre reutilizaccedilatildeo dentro do domiacutenio puacuteblico e privado (Koski 2015 Carrara Oudkerk Steenbergen Tinholt 2016) A Informaccedilatildeo do Setor Puacuteblico ou Public Sector Information (PSI) abrange toda a vasta gama de informaccedilatildeo que as entidades puacuteblicas coletam produzem reproduzem e disseminam em vaacuterias aacutereas de atividade no cumprimento das suas tarefas institucionais englobando informaccedilatildeo social econoacutemica geograacutefica meteorologia e informaccedilatildeo de cariz turiacutestico ou empresarial A grande diferenccedila entre os DGA e a PSI eacute que esta uacuteltima refere-se apenas aos dados detidos pelas entidade puacuteblicas podendo a sua reutilizaccedilatildeo ter custos Poreacutem se esta PSI for disponibilizada sob uma licenccedila aberta torna-se entatildeo DGA (Carrara et al 2016a traduccedilatildeo livre)

A reutilizaccedilatildeo e distribuiccedilatildeo de dados devem ser garantidas sob termos que permitam essas atividades (Ubaldi 2013) A abertura dos dados governamentais foi apoiada por vaacuterias iniciativas com o objetivo de estabelecer padrotildees e princiacutepios para a disponibilizaccedilatildeo aberta de dados Em 2007 o Open Government Working Group (OGWG) definiu oito princiacutepios sobre a abertura de Dados Governamentais (Tauberer 2014) Em 2010 foi a vez da Sunlight Foundation publicar 10 princiacutepios para abertura da informaccedilatildeo governamental Em 2012 foram lanccediladas trecircs iniciativas de abertura de dados O Reino Unido lanccedilou o Open Data White Paper que incluiu um conjunto de 14 princiacutepios para a abertura de dados puacuteblicos e assevera que o Reino Unido natildeo pretende implementar legislaccedilatildeo de forma raacutepida mas sim reconhecer e clarificar medidas iniciais que assegurem a partilha de dados (Cabinet Office 2012) O Banco Mundial publicou 13 princiacutepios de abertura de dados integrados no seu Open Government Data Toolkit A OKI (2012a traduccedilatildeo livre) identificou as componentes chave da abertura de dados puacuteblicos

Disponibilidade e acesso ndash os dados devem estar completos e a um preccedilo natildeo superior ao seu custo de reproduccedilatildeo com disponibilidade de acesso pela Internet Devem estar disponiacuteveis de forma conveniente e modificaacutevel

Reutilizaccedilatildeo e redistribuiccedilatildeo ndash os dados devem ser disponibilizadas sob licenccedilas que permitam a reutilizaccedilatildeo redistribuiccedilatildeo e mistura com outros datasets Deve ser assegurado que os dados satildeo passiacuteveis de serem processados por maacutequina

Participaccedilatildeo universal ndash os dados devem ser acessiacuteveis a todos para livre reutilizaccedilatildeo e redistribuiccedilatildeo sem discriminar nenhum campo do conhecimento pessoas ou grupos Natildeo eacute permitido a inclusatildeo de restriccedilotildees adjacentes aos dados

Ubaldi (2013) publicou onze princiacutepios de abertura de dados baseados em dois vetores principais disponibilidade e acessibilidade e a reutilizaccedilatildeo e redistribuiccedilatildeo Nos

42

EUA foram lanccedilados 7 princiacutepios para a abertura de dados atraveacutes do Memorando ldquoOpen Data Policy - Managing Information as an Assetrdquo (Executive Office of the President Office of Management and Budget 2013) O Anti-corruption Working Group do G2027 promoveu em 2014 a abertura de dados como um dos pilares essenciais da transparecircncia do setor puacuteblico estabelecendo seis princiacutepios de abertura de dados para apoiar a luta contra a corrupccedilatildeo (G20rsquos Anti-corruption Working Group 2014)

O G828 iniciou um debate sobre a transparecircncia inovaccedilatildeo e prestaccedilatildeo de contas governamentais culminando na criaccedilatildeo do G8 Open Data Charter (Cabinet Office 2013) ldquowhich outlined a set of five core open data principlesrdquo (International Open Data Charter 2015) ou seja ldquoa summary of visions and principles for creating a transparent Government the opening up of data and its quality and quantityrdquo (Carrara et al 2016a39) O G8 Open Data Charter criou uma lista de 14 categorias de dados a serem publicados de forma aberta empresas e negoacutecios crimes e justiccedila observaccedilatildeo da terra educaccedilatildeo energia e ambiente financcedilas e contratos geoespacial desenvolvimento global sauacutede democracia e contabilidade governativa ciecircncia e investigaccedilatildeo estatiacutesticas mobilidade e bem-estar social e por fim transportes e infraestruturas (Cabinet Office 2013) Poreacutem o sentimento geral era que os princiacutepios deveriam ser redefinidos e melhorados de forma a apoiar a adoccedilatildeo global dos Dados Abertos (International Open Data Charter 2015 traduccedilatildeo livre) Assim em 2015 um grupo de vaacuterios paiacuteses e organizaccedilotildees internacionais desenvolveu a International Open Data Charter uma ldquoGlobal Multi-Stakeholder Action Network with two types of leading members Stewards and Lead Stewardsrdquo tendo como missatildeo fomentar uma maior colaboraccedilatildeo na adoccedilatildeo e implementaccedilatildeo de princiacutepios padrotildees e boas praacuteticas de Dados Abertos em todo o mundo com a adesatildeo de 41 governos (International Open Data Charter 2015) Tim Berners-Lee numa opiniatildeo citada no proacuteprio siacutetio web da International Open Data Charter (2015) vecirc nesta rede o ldquopotential to accelerate progress by placing actionable data in the hands of peoplerdquo Todos os princiacutepios e recomendaccedilotildees de abertura de dados puacuteblicos foram sintetizados apresentando-se no Quadro 2 apenas os princiacutepios mencionados em duas iniciativas de Open Data

27 O G20 eacute um grupo formado pelos 19 paiacuteses mais fortes economicamente mais a Uniatildeo Europeia com o objetivo de obter cooperaccedilatildeo internacional em questotildees financeiras e econoacutemicas Disponiacutevel na WWW httpswwwg20orgWebsG20ENG20FAQsfaq_nodehtml 28 O G8 eacute um grupo constituiacutedo pelas economias mais avanccediladas do mundo que se reuacutenem para debater questotildees econoacutemicas e poliacuteticas a niacutevel global Este grupo eacute formado pelos EUA Itaacutelia Alemanha Reino Unido Franccedila Japatildeo Canadaacute e Ruacutessia embora esta uacuteltima tenha sido expulsa em 2014 apoacutes a anexaccedilatildeo da Crimeia A EU tambeacutem estaacute representada neste grupo embora natildeo seja membro oficial

43

Quadro 2 Princiacutepios de abertura mais recomendados pelas iniciativas de Dados Governamentais Abertos

Princiacutepios e recomendaccedilotildees

OGWG (2007)

Sun Fund (2010)

OKI

(2012)

World Bank

(2012)

White Paper (2012)

Mem EUA

(2013) Ubaldi (2013)

G20

(2014)

IODC

(2015) Abertura Acesso

Publicaccedilatildeo imediata Reutilizaccedilatildeo Completos

Sem discriminaccedilatildeo Processaacuteveis p maacutequina

Licenccedilas Abertas Comparabilidade Formato Aberto Disponibilidade

Abertura p defeito Interoperabilidade

Publicaccedilatildeo de metadados

Gestatildeo poacutes publicaccedilatildeo Custo natildeo superior ao da

produccedilatildeo

Desenvolvimento e inovaccedilatildeo inclusivos

Melhoria governaccedilatildeo e envolvimento cidadatildeos

Linked Data

Modificaccedilatildeo

Fonte Elaboraccedilatildeo proacutepria

Analisando em detalhe os princiacutepios de abertura dos dados puacuteblicos eacute possiacutevel inferir quais as recomendaccedilotildees consideradas mais importantes Tal como nos dados de investigaccedilatildeo verifica-se uma grande variedade de princiacutepios propostos sendo que apenas 19 num total de 36 se repetem em 2 ou mais recomendaccedilotildees Embora se registe uma melhoria significativa na abertura legal e teacutecnica relativamente aos dados de investigaccedilatildeo tambeacutem os princiacutepios propostos para os dados puacuteblicos natildeo abarcam a totalidade desta dupla abertura O acesso a publicaccedilatildeo imediata a reutilizaccedilatildeo e a disponibilizaccedilatildeo de dados de forma completa sem discriminaccedilatildeo e de forma a serem processados por maacutequina satildeo os princiacutepios que reuacutenem mais consenso entre as recomendaccedilotildees analisadas As licenccedilas abertas a comparabilidade de dados os formatos abertos a disponibilidade a abertura por defeito de dados a interoperabilidade publicaccedilatildeo de metadados e a gestatildeo de dados apoacutes a sua publicaccedilatildeo satildeo mencionados em menos de metade das recomendaccedilotildees analisadas apesar de ser indiscutiacutevel a sua importacircncia no processo de abertura de dados

44

Segundo Gonzalez-Zapata e Heeks (2015) podemos sintetizar os DGA em quatro perspetivas sumariadas na figura seguinte

Fig 12 Perspetivas da abertura dos dados governamentais Fonte Gonzalez-Zapata e Heeks (2015)

O movimento dos DGA assenta em dois importantes marcos o lanccedilamento do siacutetio datagov nos EUA em 2009 e do datagovuk no Reino Unido em 2010 tendo-se posteriormente estendido a outros paiacuteses e organizaccedilotildees (Janssen 2012) Neste segmento foi fundada em 2011 a Open Government Partnership (OGP) com o objetivo de ldquoprovide an international platform for domestic reformers committed to making their governments more open accountable and responsive to citizensrdquo (Open Government Partnership [OGP] 2015) Esta organizaccedilatildeo lanccedilou em Setembro de 2011 a Open Government Declaration subscrita por 70 paiacuteses e que assenta em quatro eixos estruturantes Transparecircncia da informaccedilatildeo sobre as atividades governativas apoio agrave participaccedilatildeo ciacutevica implementaccedilatildeo dos mais altos padrotildees da integridade profissional aumento do acesso a novas tecnologias de abertura e da prestaccedilatildeo de contas (OGP 2011) Em Dezembro de 2016 realizou-se a quarta cimeira da OGP culminando com a divulgaccedilatildeo da Paris Declaration for Open Government Partnership que pretende encorajar os Governos e as organizaccedilotildees da sociedade civil a inscreverem-se em accedilotildees coletivas para promover a abertura dos dados governamentais (OGP 2016)

O fenoacutemeno dos Dados Abertos eacute coadjuvado por dois sistemas de avaliaccedilatildeo da abertura dos dados provenientes do setor puacuteblico que auxiliam as entidades puacuteblicas a assumir a abertura e ligaccedilatildeo de dados (Colpaert Sarah Peter Mannens amp Van de Walle 2013) Estes dois sistemas atuam em perspetivas diferentes segundo Colpaert et al (2013) o 5 Stars Linked Open Data de Berners-Lee (2010) fornece uma perspetiva tecnoloacutegica enquanto o 5 Stars Open Data Engagement de Davies (2012) tem um acircmbito social atraveacutes do envolvimento da sociedade O esquema de Davies (2012) eacute um esquema de classificaccedilatildeo por estrelas baseado no esquema criado Tim Berners-Lee para sublinhar os niacuteveis de interaccedilatildeo e colaboraccedilatildeo proporcionados pela publicaccedilatildeo de dados ou seja os ldquokey steps that open data initiatives can take to engage with data usersrdquo

bull Definiccedilatildeo de estrateacutegias regulamentos e processos nas atividades do Governo Burocraacutetica bull Inovaccedilatildeo tecnoloacutegica nos sistemas de dados do

Governo Tecnoloacutegica bull Direito ao livre acesso agrave informaccedilatildeo do setor puacuteblico (dados) Poliacutetica bull Mecanismos para gerar valor econoacutemico atraveacutes do uso de dados Econoacutemica

45

Fig 13 Esquema de classificaccedilatildeo das 5 estrelas para as iniciativas de abertura de dados que envolvem os utilizadores Fonte Davies (2012) Disponiacutevel na WWW httpwwwtimdaviesorguk201201215-stars-of-open-data-engagement

No cumprimento das suas obrigaccedilotildees as entidades governamentais produzem coletam e gerem uma vasta quantidade de dados tendo elevado estes agrave categoria dos bens puacuteblicos mais valiosos Para gerar valor ldquodata must be reusable but more importantly actually used (Open Data for Development [OD4D] 20168) Para a OECD (2015a) permitir o acesso e a reutilizaccedilatildeo dos dados governamentais tem um potencial significativo no aumento da eficiecircncia e transparecircncia do setor puacuteblico suportando atividades de ciecircncia cidadatilde com os dados governamentais aumentando assim o seu valor econoacutemico e social Neste sentido concursos desafios e hackathons29 podem tornar-se uacuteteis se ajudarem a focar os cidadatildeos ldquoon high priority public problemsrdquo (Dawes Vidiasova amp Parkhimovich 201610) Para gerar valor eacute necessaacuterio publicar os dados sendo esta fase precedida uma preparaccedilatildeo teacutecnica de coleta preparaccedilatildeo publicaccedilatildeo e gestatildeo de dados (Carrara et al 2016a)

Criaccedilatildeo de uma infraestrutura de gestatildeo de dados Extraccedilatildeo transformaccedilatildeo (em formato open source e linked data) e publicaccedilatildeo Escolha dos canais de publicaccedilatildeo Implementaccedilatildeo da funccedilatildeo de pesquisa no canal de publicaccedilatildeo Definiccedilatildeo de domiacutenio hospedagem funcionalidades do canal de publicaccedilatildeo

incluindo a gestatildeo desta ferramenta e dos serviccedilos que nela forem incorporados

Segundo Ubaldi (2013 traduccedilatildeo livre) podem ser identificadas quatro grandes fases na cadeia de valor dos Dados Governamentais Abertos

Geraccedilatildeo de dados cobre a criaccedilatildeo de dados puacuteblicos Coleta agregaccedilatildeo e processamento de dados os dados governamentais precisam

de ser agregados ligados e manipulados de forma a adicionar valor para a maior parte dos utilizadores

29 Uma hackathon de dados abertos eacute um evento que reuacutene programadores e outros profissionais do ramo do desenvolvimento de software para reutilizar dados de forma a produzir aplicaccedilotildees de software que sejam a base de produtos e serviccedilos uacuteteis e com valor Servem tambeacutem para promover o trabalho de abertura de dados e os datasets disponiacuteveis (AMA 2016)

Os dados devem ser orientados para a procura

Os dados devem fornecer contexto

Os dados devem gerar conversaccedilatildeo

Publicaccedilatildeo de dados deve gerar envolvimento e ganho de habilidades

Dados como um recurso comum na colaboraccedilatildeo entre investigadores

46

Distribuiccedilatildeo e fornecimento de dados os dados precisam de ser distribuiacutedos aos seus potenciais utilizadores para permitir o acesso e reutilizaccedilatildeo

Uso final de dados os dados governamentais tecircm de ser reutilizados por diferentes pessoas para sustentar a criaccedilatildeo de valor puacuteblico

Perceber os diferentes valores associados aos dados governamentais eacute essencial para identificar que viabilizadores e tipos de dados devem ser tornados prioritaacuterios para atingir o objetivo especiacutefico de criaccedilatildeo de valor (Ubaldi 2013) Podem ser identificados trecircs tipos de valor associados aos DGA (Ubaldi 2013 OECD 2015a)

Valor econoacutemico crescimento e competitividade na economia fomentando a inovaccedilatildeo eficiecircncia e eficaacutecia nos serviccedilos governamentais

Valor Social promove empreendedorismo dos cidadatildeos a participaccedilatildeo social e o envolvimento puacuteblico nas decisotildees poliacuteticas e no fornecimento de serviccedilos

Governanccedila puacuteblica Prestaccedilatildeo de contas transparecircncia responsividade e controlo democraacutetico

A abertura dos dados governamentais eacute um domiacutenio emergente que enfrenta restriccedilotildees de natureza complexa Janssen Charalabidis e Zuiderwijk (2012) sintetizaram as barreiras em seis categorias institucional complexidade da tarefa uso e participaccedilatildeo legislaccedilatildeo qualidade da informaccedilatildeo e questotildees teacutecnicas Reitano (2013) defende que os governos devem modificar as praacuteticas e procedimentos internos de gestatildeo de informaccedilatildeo pois a reutilizaccedilatildeo da informaccedilatildeo estaacute dependente da forma em como ela eacute gerida e publicada O desempenho dos programas de DGA tendem apenas para o registo de dados estatiacutesticos e poucos optam por analisar as aplicaccedilotildees comerciais e os avanccedilos proporcionados pela abertura dos dados governamentais (Dawes Vidiasova amp Parkhimovich 2016) Existem outros pontos sensiacuteveis como o pagamento dos custos da coleta e processamento de dados puacuteblicos quais os incentivos concedidos agraves entidades puacuteblicas para estas manterem e atualizarem os seus dados que conjunto de dados devem ser prioritaacuterios para maximizar a criaccedilatildeo de valor puacuteblico e sobretudo a necessidade de desenvolver uma estrutura de anaacutelise entre custos e benefiacutecios que possa demonstrar as vantagens econoacutemico-sociais dos DGA (Ubaldi 2013 OECD 2013) Contudo segundo a OECD (2015a) para as partes interessadas estes dados continuam muitas vezes inacessiacuteveis quer em termos de acesso quer em termos de custo Isto verifica-se porque os dados enfrentam alguns entraves agrave sua publicaccedilatildeo as organizaccedilotildees e governos natildeo consideram os dados interessantes para reutilizaccedilatildeo ou natildeo conseguem entender os benefiacutecios da abertura pelo receio de terem de responder a um elevado nuacutemero de pedidos de dados ou que os utilizadores retirem conclusotildees superficiais que os dados possam natildeo ter um niacutevel de curaccedilatildeo satisfatoacuterio e que isso manche a reputaccedilatildeo da organizaccedilatildeo e por fim a preocupaccedilatildeo com os custos da conversatildeo de dados para formatos padratildeo (Carrara et al 2016a traduccedilatildeo livre) Existem ainda riscos associados agrave abertura dos dados

47

governamentais como o direito agrave privacidade e ao anonimato que resultam em restriccedilotildees agrave disponibilizaccedilatildeo desta informaccedilatildeo (Koski 2015)

Estabelecer um enquadramento legal eacute essencial para alavancar a abertura dos dados governamentais Dawes Vidiasova e Parkhimovich (2016) defendem que o sucesso dos programas de DGA depende da definiccedilatildeo padrotildees teacutecnicos e de qualidade e de um enquadramento legal que defina responsabilidades e limitaccedilotildees Ainda assim as iniciativas de DGA podem enfrentar problemas com a implementaccedilatildeo desafios teacutecnicos ou atrasos administrativos Restriccedilotildees teacutecnicas e financeiras podem limitar a acessibilidade e reutilizaccedilatildeo dos dados sendo necessaacuterio enfrentar desafios relacionados com poliacuteticas tecnologias financcedilas organizaccedilatildeo e cultura para criar um ecossistema e construir um modelo de negoacutecios sustentaacutevel para as iniciativas de DGA (Ubaldi 2013 traduccedilatildeo livre) Koski (2015) realccedila que uma vez abertos deve haver um esforccedilo para manter a qualidade dos dados e tambeacutem a sua atualizaccedilatildeo Por outro lado sem os conhecimentos e habilidades necessaacuterias para interpretar a vasta gama de conjuntos de dados os cidadatildeos podem natildeo conseguir criar valor a partir desses dados (Janssen 2012 Koski 2015) Segundo Carrara Fischer e Steenbergen (2015) satildeo vaacuterias as capacidades necessaacuterias para lidar com a complexidade dos dados As autoras defendem uma junccedilatildeo entre soft skills e hard skills como a colaboraccedilatildeo comunicaccedilatildeo resoluccedilatildeo de problemas e as competecircncias teacutecnicas estatiacutesticas analiacuteticas e domiacutenio da aacuterea do conhecimento (201512) Satildeo apontados ainda outros desafios como a constante evoluccedilatildeo das poliacuteticas e estrateacutegias de DGA a delegaccedilatildeo da produccedilatildeo e administraccedilatildeo dos dados governamentais a niacutevel regional e a falta de definiccedilotildees comuns agrave escala internacional (OECD 2013)

Dado o contexto de urgecircncia em que muitos dos portais foram criados ldquoas part of a politically driven Open Data Initiative without feasibility studies business case strategy or user researchrdquo os portais enfrentam agora uma seacuterie de desafios e problemas (Sasse et al 20177) Satildeo mencionados problemas como a falta de financiamento falta de qualidade dos dados a falta de apoio poliacutetico na publicaccedilatildeo de dados relevantes e desafios na reutilizaccedilatildeo de dados (Sasse et al 2017)

Um bom entendimento dos benefiacutecios da abertura dos dados governamentais pode acelerar o compromisso com as iniciativas de DGA (Carrara et al 2016a) Os benefiacutecios da abertura de dados podem segundo Janssen Charalabidis e Zuiderwijk (2012) ser contextualizados em trecircs quadrantes poliacutetico e social econoacutemico operacional e teacutecnico A partilha dos dados governamentais com o puacuteblico aumenta a transparecircncia e o reconhecimento puacuteblico das atividades do governo (OECD 2013) dado que os DGA satildeo um recurso estrateacutegico que pode beneficiar vaacuterios intervenientes (OECD 2013 Ubaldi 2013 Dietrich Cherkasov Susar 2013 Koski 2015 Carrara et al 2016a The World Bank 2016)

48

Governo melhora a tomada de decisotildees e a alocaccedilatildeo de recursos de forma a promover a eficiecircncia total das operaccedilotildees do governo e fornecer serviccedilos puacuteblicos mais eficientes efetivos inovadores e personalizados permitindo uma reduccedilatildeo de custos administrativos Aumenta a transparecircncia reforccedilando a prestaccedilatildeo de contas governamentais e a reduccedilatildeo de erros

Cidadatildeos permite participaccedilatildeo puacuteblica e o envolvimento social no desenho de respostas agraves necessidades puacuteblicas e cientiacuteficas (ciecircncia cidadatilde)

Sociedade Civil aumenta a transparecircncia e qualidade dos serviccedilos do Governo Setor Puacuteblico pode estimular um mercado competitivo nos serviccedilos puacuteblicos Setor Privado lanccedilamento de serviccedilos inovadores e com valor acrescentado

O Working Group on Open Government Data da OKI elegeu trecircs vantagens na abertura dos dados governamentais aumento da transparecircncia criaccedilatildeo de valor econoacutemico-social e participaccedilatildeo dos cidadatildeos na governaccedilatildeo Dietrich Cherkasov e Susar (2013) sublinham o papel chave da interoperabilidade na obtenccedilatildeo dos benefiacutecios da abertura na medida em que uma definiccedilatildeo comum de abertura iraacute assegurar a capacidade dos sistemas e organizaccedilotildees cooperarem

O impacto da abertura dos dados governamentais pode ser medido em trecircs dimensotildees econoacutemica poliacutetica e social (Granicas 2013 Koski 2015)

Econoacutemica aumento de receitas provenientes de taxas reduccedilatildeo dos custos de transaccedilatildeo de dados criaccedilatildeo de bens e serviccedilos (Granickas 2013) aumento da eficiecircncia e eficaacutecia do serviccedilo puacuteblico criaccedilatildeo de novas empresas (Granickas 2013 Koski 2015)

Poliacutetica aumento da transparecircncia poliacutetica e da prestaccedilatildeo de contas (Granickas 2013 Koski 2015)

Social aumento da proteccedilatildeo ao direito agrave informaccedilatildeo (Granickas 2013) aumento da inclusatildeo social e da capacitaccedilatildeo de grupos eou indiviacuteduos aumento dos niacuteveis de envolvimento e participaccedilatildeo ciacutevica (Granickas 2013 Koski 2015) e melhorias ao niacutevel educaccedilatildeo sauacutede ambiente ou desenvolvimento sustentaacutevel (Koski 2015)

Koski (20153) defende ser necessaacuterio desenvolver um modelo de avaliaccedilatildeo e monotorizaccedilatildeo seguido da coleta sistemaacutetica de dados para se poder medir com exatidatildeo o impacto dos Dados Abertos A autora sublinha a necessidade de explorar o conhecimento sobre o impacto da abertura de dados bem como os meacutetodos de investigaccedilatildeo e indicadores que podem ser usados para estudar os ldquosocio-economics impacts of open data which types of usable data are already being collected and what are the addionational data needsrdquo

Para Janssen (2012) o movimento dos DGA promoveu uma maior disponibilidade de informaccedilatildeo puacuteblica embora natildeo tenha necessariamente melhorado o acesso agrave informaccedilatildeo De acordo com a mesma autora os DAG estatildeo em voga com os

49

programadores e hackers a desenvolverem aplicaccedilotildees atraveacutes dos dados detidos pelo setor puacuteblico e os ativistas a descobrir o valor dos dados governamentais na defesa das suas causas Se as cidades utilizarem os dados que produzem em proveito proacuteprio publicando-os nos seus portais com as licenccedilas adequadas de reutilizaccedilatildeo podem estimular a criaccedilatildeo de novos serviccedilos e transformar-se em smart cities (Garcia 2015) reduzindo custos e consumo de recursos e melhorando o contacto entre cidadatildeos e governo (Carrara Engbers Nieuwenhuis amp Steenbergen 2016)

No acircmbito da digital transformation ocorrida nas uacuteltimas deacutecadas diversas alteraccedilotildees ocorreram na forma comas organizaccedilotildees produzem vendem e disponibilizam os seus produtos e tambeacutem na forma em como os funcionaacuterios trabalham e comunicam Segundo Carrara Fisher Oudkerk Steenbegen e Tinholt (2015) os Dados Abertos podem ser reutilizados por organizaccedilotildees de diferentes setores da induacutestria cultura e turismo educaccedilatildeo e investigaccedilatildeo energia e utilidades financcedilas e seguros sauacutede fabrico de produtos comunicaccedilatildeo e entretenimento puacuteblico imobiliaacuterio retalho telecomunicaccedilotildees transportes e tecnologias de informaccedilatildeo Davies (2014) afirma que no caso dos EUA e do Reino Unido a enfacircse do discurso puacuteblico passou da melhoria da transparecircncia governativa para o discurso das vantagens econoacutemicas dos Dados Abertos como consequecircncia da crise econoacutemica e da maior maturaccedilatildeo das poliacuteticas de abertura de dados Na EU a linha de pensamento tem evoluiacutedo no mesmo sentido com o estudo econoacutemico feito pelo European Data Portal a indiciar um impacto econoacutemico direto da abertura de dados em 2016 de 553 biliotildees de euros e em 2020 de 757 biliotildees de euros com uma projeccedilatildeo de perto de 100 mil postos de trabalho envolvidos O mesmo estudo indica que o mercado total da abertura de dados contabilizando os impactos diretos e indiretos subiraacute dos 193-209 biliotildees de euros em 2016 para os 265-286 biliotildees de euros em 2020 (Carrara Chan Fischer amp Steenbergen 2015)

Os portais de Dados Abertos satildeo uma parte essencial da infraestrutura ao permitirem o acesso e reutilizaccedilatildeo de dados oferecendo um ponto de acesso uacutenico aos utilizadores aos dados governamentais como os cataacutelogos e portais de dados centralizados Veja-se por exemplo os 304 portais incluiacutedos no cataacutelogo do portal de dados governamentais dos EUA o datagov que aleacutem dos portais de dados de cidades e estados norte-americanos (88) engloba ainda 52 paiacuteses e 164 regiotildees internacionais (United States General Services Administration) O Open Data Soft (2017) lista jaacute mais de 2600 portais de dados oriundos de 194 paiacuteses indicando apenas 6 portais de Dados Abertos em Portugal

Poreacutem de acordo com Colpaert et al (2013) natildeo existe nenhum guia que determine as funcionalidades e possibilidades dos portais de dados Os autores vecircm assim propor um esquema de classificaccedilatildeo para portais de Dados Abertos com o

50

objetivo de impulsionarem as entidades puacuteblicas a criarem o seu proacuteprio portal de dados ou a criarem novas metas para os jaacute existentes

Fig 14 Esquema de classificaccedilatildeo das 5 estrelas para os portais de dados Fonte Colpaert et al (2013) Disponiacutevel na WWW httppieterpm5stardataportals5starsofopendataportalspdf

O relatoacuterio feito pelo Open Data Institute (ODI) para o European Data Portal defende que os portais de dados devem continuar a responder aos desafios utilizando para isso modelos sustentaacuteveis em quatro aacutereas chave gestatildeo financcedilas arquitetura e operaccedilotildees Devem tambeacutem usar meacutetricas que permitam avaliar e melhorar a qualidade e usabilidade dos dados sendo que a mediccedilatildeo de impacto da reutilizaccedilatildeo de Dados Abertos tambeacutem deve ser alvo de financiamento contiacutenuo (Sasse et al 2017)

A OKI desenvolveu um sistema de gestatildeo de dados suportado por uma plataforma aberta o CKAN oferecendo soluccedilotildees que agilizam a publicaccedilatildeo partilha pesquisa e uso dos dados sendo utilizado por 146 portais de dados a niacutevel mundial (CKAN) Usar esta ferramenta para construir um cataacutelogo permite agraves entidades governos e organizaccedilotildees publicar dados e disponibiliza-los de forma aberta facilitando a pesquisa e a visualizaccedilatildeo da informaccedilatildeo A plataforma DataHub oferece acesso a muitos dos serviccedilos do CKAN permitindo o upload pesquisa registo de datasets publicados criaccedilatildeo e gestatildeo de grupos de datasets e receber atualizaccedilotildees de conjuntos de dados em que haja interesse O DataHub aloja 35 datasets relacionados com a palavra-chave ldquoPortugalrdquo sendo 18 desses conjuntos de dados diretamente coletados e disponibilizados por entidades portuguesas Os restantes 17 datasets estatildeo englobados em publicaccedilotildees que abrangem vaacuterios paiacuteses (Open Knowledge International [d]) As entidades puacuteblicas tambeacutem podem desenvolver portais de dados contratando para isso serviccedilos de plataformas como o Socrata30 OpenDataSoft31 ou o DataMarket32 que facilitam a publicaccedilatildeo a partilha e a reutilizaccedilatildeo de dados puacuteblicos

30 Disponiacutevel na WWW httpssocratacom 31 Disponiacutevel na WWW httpswwwopendatasoftptsolucao-de-dados-abertos 32 Disponiacutevel na WWW httpwwwqlikcomusproductsqlik-data-market

Registo de conjuntos de dados (ligaccedilatildeo ao dataset)

Fornecimento de metadados (licenccedila contexto atualizaccedilotildees etc)

Plataforma de cocriaccedilatildeo (interaccedilatildeo desenvolvimento aplicaccedilotildees)

Plataforma de publicaccedilatildeo de dados e metadados em formatos comuns

Central de dados comum (agregaccedilatildeo informaccedilatildeo interna e externa)

51

Em termos de licenciamento de dados embora as licenccedilas Creative Commons possam ser aplicadas aos dados foram criadas licenccedilas abertas especiacuteficas para dados sob a tutela da OKI as Open Data Commons (ODC)

ODC Attribution License (ODC-By) Compatiacutevel com a licenccedila CC BY permite a coacutepia distribuiccedilatildeo modificaccedilatildeo de dados ou bases de dados com a devida menccedilatildeo de atribuiccedilatildeo de autoria devendo ser mantida para trabalhos derivados

ODC Open Database License (ODC-ODbL) Segue os mesmo princiacutepios da licenccedila CC BY-SA aplicando-se no entanto apenas a dados Permite a coacutepia distribuiccedilatildeo modificaccedilatildeo de dados ou bases de dados com a devida menccedilatildeo de atribuiccedilatildeo de autoria devendo os trabalhos derivados aplicar a mesma licenccedila e serem redistribuiacutedos sem restriccedilotildees

Public Domain Dedication and License (PDDL) permite a coacutepia distribuiccedilatildeo modificaccedilatildeo de dados ou bases de dados sem qualquer tipo de restriccedilotildees ou atribuiccedilatildeo de creacutedito uma vez que os dados passam para o domiacutenio puacuteblico Eacute compatiacutevel com a licenccedila CC0 (Open Knowledge International [d] traduccedilatildeo livre)

Existem ainda 2 paiacuteses que definiram a sua proacutepria lincenccedila aberta de forma a garantir a abertura da PSI O Reino Unido desenvolveu a Open Government Licence (OGL) que sendo compativel com as licenccedilas CC e ODC autoriza o uso distribuiccedilatildeo publicaccedilatildeo adaptaccedilatildeo e exploraccedilatildeo comercial e natildeo comercial sob o requerimento de menccedilatildeo da fonte e da proviecircncia da informaccedilatildeo (The National Archives) Tambeacutem a Franccedila desenvolveu a sua Licence Ouverte que avaliza a reproduccedilatildeo uso distribuiccedilatildeo publicaccedilatildeo adaptaccedilatildeo e exploraccedilatildeo comercial requerendo apenas o reconhecimento da fonte e da proviecircncia da informaccedilatildeo Tal como a licenccedila britacircnica a Licence Ouverte eacute compatiacutevel com as licenccedilas CC e ODC e ainda com a proacutepria OGL (Etalab 2011)

A publicaccedilatildeo dos DGA envolve quatro intervenientes diferentes (Carrara et al 2016a traduccedilatildeo livre)

Decisores poliacuteticos normalmente os responsaacuteveis pela validaccedilatildeo de estrateacutegias e iniciativas de Open Data

Gestores de Dados satildeo por norma os responsaacuteveis pela coleta partilha de dados design e implementaccedilatildeo da estrateacutegia de Open Data na qualidade de especialistas

Programadores responsaacuteveis pela implementaccedilatildeo dos requisitos teacutecnicos das estrateacutegias de Dados Abertos

Contribuidores tecircm um papel ativo na coleta preparaccedilatildeo publicaccedilatildeo e manutenccedilatildeo dos dados

Gonzalez-Zapata e Heeks (2015) acrescentam outros intervenientes como os ativistas da sociedade civil as organizaccedilotildees internacionais os fornecedores de tecnologias de informaccedilatildeo e comunicaccedilatildeo e os acadeacutemicos As entidades e organizaccedilotildees internacionais envolvidas no esforccedilo de abertura dos dados

52

governamentais tecircm desenvolvido esforccedilos para promover a abertura de dados governamentais O Open Data Institute (2012) foi criado com o objetivo de ajudar instituiccedilotildees puacuteblicas organizaccedilotildees comerciais e natildeo comerciais a ldquoidentify and address how the web of data will impact their businesses and their sectorsrdquo Neste sentido a ODI tem promovido algumas iniciativas como o Open Data Certificate33 que atraveacutes de um sistema de questionaacuterios consegue demonstrar se os dados foram publicados de forma sustentaacutevel e reutilizaacutevel certificando assim a qualidade e a confianccedila nos mesmos A ODI desenvolveu tambeacutem o Open Data Maturity Model para avaliar o quanto as organizaccedilotildees publicam e consomem Dados Abertos identificando os pontos de melhoria O modelo baseia-se numa escala de cinco temas processos de gestatildeo de dados conhecimento e habilidades envolvimento e apoio ao cliente investimento e performance financeira e por fim visatildeo estrateacutegica Estes cinco temas tecircm cinco niacuteveis de progressatildeo possuindo uma aplicaccedilatildeo34 em linha que facilita a avaliaccedilatildeo (Dodds amp Newman 2015) A ODI dedica-se ainda agrave elaboraccedilatildeo de estudos de caso envolvendo iniciativas de Open Data aleacutem de possuir guias de orientaccedilatildeo para a abertura de dados e cursos de aprendizagem com o mesmo objetivo

O Banco Mundial lanccedilou o Open Government Data Toolkit com o objetivo de ajudar governos bancaacuterios e utilizadores a entender os conceitos baacutesicos da abertura de dados e a planear e implementar um programa de abertura dos dados governamentais Falamos de ferramentas de orientaccedilatildeo para a implementaccedilatildeo de poliacuteticas de dados abertos desde a definiccedilatildeo de Open Data e exemplos do seu uso passando pelo licenciamento e qualidade dos dados e finalizando com assistecircncia teacutecnica e apoio na procura de financiamento Uma das ferramentas disponibilizadas eacute o Open Data Readiness Assessment (ODRA) que pode ser usada para conduzir accedilotildees de anaacutelise da preparaccedilatildeo de um governo ou instituiccedilatildeo para avaliar desenhar e implementar uma iniciativa de Dados Abertos (The World Bank 2016)

Outra iniciativa esta com a chancela da Open Data for Development Network (OD4D[a]) ldquoa global network of leaders in the Open Data community working together to develop open data solutions around the worldrdquo desenvolveu uma base de dados puacuteblica de organizaccedilotildees que usam DGA ao niacutevel global O Open Data Impact Map permite aos governos organizaccedilotildees internacionais e investigadores ter a perceccedilatildeo da procura existente de Dados Abertos O mapa inclui organizaccedilotildees que usam DGA para advogar algo para desenvolver produtos e serviccedilos aprimorar operaccedilotildees prestar informaccedilotildees sobre estrateacutegias ou efetuar investigaccedilatildeo (Open Data for Development Network (OD4D[b] traduccedilatildeo livre) Em fevereiro de 2017 encontram-se listadas 1765 organizaccedilotildees oriundas de 96 paiacuteses concentrados sobretudo na Ameacuterica do Norte Europa e Aacutesia Central sendo que a maioria das entidades estaacute relacionada com o setor das tecnologias de informaccedilatildeo geoespacial negoacutecios 33 Disponiacutevel na WWW httpscertificatestheodiorgen 34 Disponiacutevel na WWW httppathwaytheodiorg

53

consultadoria investigaccedilatildeo e com governabilidade Portugal conta com 4 organizaccedilotildees listadas Fundaccedilatildeo Francisco Manuel dos Santos35 Transparecircncia Hackday36 e Open Knowledge Portugal no setor da governabilidade e a Manufactura Independente37 no setor dos meacutedia e comunicaccedilotildees

A OKI estaacute ativamente envolvida em diversos projetos que visam criar condiccedilotildees e potenciar a abertura de dados Aleacutem da mencionada Open Definition a OKI posiciona-se como coordenadora de outros projetos semelhantes um siacutetio web sobre Dados Governamentais Abertos um guia com enfoque nos aspetos teacutecnicos legais e sociais dos Dados Abertos um cataacutelogo de portais de Dados Abertos a niacutevel global um iacutendice que mede a abertura das poliacuteticas de Open Data e ainda introduziu censos sobre a abertura de dados A OKI oferece ainda um portal sobre dados financeiros38 um portal de e-learning sobre literacia de dados39 um portal sobre gastos puacuteblicos40 uma base de dados de ensaios cliacutenicos41 e o Frictionless Data42 que disponibiliza um Data Package Standard para facilitar o agrupamento e descriccedilatildeo de dados

A EU tem assumido uma dupla funccedilatildeo na abertura dos dados puacuteblicos verificando-se a sua intervenccedilatildeo na elaboraccedilatildeo de leis de apoio aos DGA e na promoccedilatildeo da criaccedilatildeo de infraestruturas de suporte A OECD desenvolveu um Observatoacuterio da PSI que coleta e analisa exemplos e partilha experiecircncias de inovaccedilatildeo do setor puacuteblico com o intuito de fornecer conselhos praacuteticos aos paiacuteses na criaccedilatildeo de inovaccedilatildeo O Observatoacuterio permite a partilha discussatildeo e cooperaccedilatildeo na criaccedilatildeo de soluccedilotildees (OECD 2016b traduccedilatildeo livre)

A disponibilidade e acessibilidade de dados eacute um dos pilares da plena afirmaccedilatildeo da Ciecircncia Aberta e neste acircmbito devem ser definidas poliacuteticas de Dados Abertos que mandatem o livre acesso a este tipo de informaccedilatildeo cientiacutefica e administrativa

2 As poliacuteticas de Dados Abertos

O processo de desenvolvimento de poliacuteticas envolve tradicionalmente a investigaccedilatildeo anaacutelise consulta e siacutentese de informaccedilatildeo para produzir recomendaccedilotildees A abertura de dados sem restriccedilotildees de acesso deve ser garantida por uma poliacutetica de Dados Abertos pois ldquoOpen Data is politicalrdquo (World Wide Web Foundation 201638) ldquoInstitutionalizing open data within larger sectoral initiatives requires ample political

35 Disponiacutevel na WWW httpwwwpordatapt 36 Disponiacutevel na WWW httpwwwtransparenciahackdayorg 37 Disponiacutevel na WWW httpmanufacturaindependenteorg 38 Disponiacutevel na WWW httpnextopenspendingorg 39 Disponiacutevel na WWW httpschoolofdataorg 40 Disponiacutevel na WWW httpopenbudgetseu 41 Disponiacutevel na WWW httpopentrialsnet 42 Disponiacutevel na WWW httpfrictionlessdataio

54

willrdquo (OD4D 2016) O fenoacutemeno dos Dados Abertos eacute tambeacutem teacutecnico e social dada a interaccedilatildeo entre o meio local politico social legal e teacutecnico e as tecnologias que produzem resultados (Davies 2014 Pasqueto Sands amp Borgman 2015)

Da revisatildeo da literatura destaca-se a existecircncia de poliacuteticas diferenciadas para a abertura de dados governamentais e para a abertura de dados cientiacuteficos A maior parte das poliacuteticas e estrateacutegias governamentais concentram-se na abertura dos dados governamentais em detrimentos dos dados de investigaccedilatildeo (RECODE 2014) A expressatildeo ldquoPoliacutetica de Dados Abertosrdquo surge frequentemente associada a termos como estrateacutegias programas ou iniciativas de abertura de dados e ainda a poliacuteticas de gestatildeo de dados A contextualizaccedilatildeo das poliacuteticas natildeo eacute clara referindo-se apenas a Dados Abertos mas focando-se preferencialmente apenas nos dados provenientes do setor puacuteblico Em termos de dados de investigaccedilatildeo eacute possiacutevel encontrar poliacuteticas de quatro intervenientes diferentes Governo entidade financiadora que pode ser ou natildeo governamental instituiccedilotildees de investigaccedilatildeo e ainda as editoras de data journals Em termos de dados puacuteblicos satildeo associadas poliacuteticas governamentais e institucionais As poliacuteticas de dados abertos devem ainda incluir uma poliacutetica de gestatildeo de dados independentemente do seu cariz de investigaccedilatildeo ou puacuteblico

Nos uacuteltimos anos questotildees sobre a gestatildeo preservaccedilatildeo e partilha de dados cientiacuteficos tecircm sido alvo de debate puacuteblico O aumento da criaccedilatildeo de datasets vastos e complexos em todo o processo cientiacutefico estaacute a criar profundos desafios para o armazenamento acesso e interpretaccedilatildeo de dados (EAGDA 2014) As recentes poliacuteticas de Open Data pretendem disponibilizar em livre acesso os datasets da mesma forma que qualquer outra publicaccedilatildeo acadeacutemica sendo para isso necessaacuterio garantir uma infraestrutura de armazenamento acesso pesquisa e a reutilizaccedilatildeo dessa informaccedilatildeo (Rans Day Duke amp Ball 2013) As poliacuteticas satildeo essenciais para o estabelecimento de compromissos comuns (Erway et al 2016) Segundo a Science International (20156) ldquoeffective open data in a data-intensive age can only be realised if there is systemic action at disciplinary national and international levelsrdquo De acordo com Tananbaum num estudo preparado em nome da SPARC ldquoopen data policies promote the accessibility and reuse of the raw data generated during the scientific discovery phaserdquo Estas poliacuteticas abrangem uma gama variada de material natildeo-textual como datasets estatiacutesticas resultados de inqueacuterito e os metadados associados a estes objetos devendo permitir que estes sejam sujeitos a processamento por maacutequina e anaacutelise (Tananbaum) Existem alguns desafios teacutecnicos legais e eacuteticos na criaccedilatildeo de uma poliacutetica de abertura de dados como assegurar a heterogeneidade e interoperabilidade dos dados a acessibilidade e pesquisabilidade a preservaccedilatildeo e curaccedilatildeo a qualidade e avaliaccedilatildeo e tambeacutem a seguranccedila dos dados (RECODE 2014)

A abertura de dados de investigaccedilatildeo em todas as aacutereas cientiacuteficas natildeo pode ter uma abordagem one size fits all pois estas produzem diferentes tipos de dados e tecircm

55

procedimentos de anaacutelise publicaccedilatildeo e arquivo diferenciados (Royal Society 2012 RECODE 2014 ERAC 2016 Laumlmmerhirt 2016) A heterogeneidade verificada entre as poliacuteticas de dados de investigaccedilatildeo ao niacutevel da aplicaccedilatildeo normativa e da gestatildeo de dados implica de acordo com Laumlmmerhirt que o cumprimento das medidas impostas pelas poliacuteticas seja irregular O autor defende que as poliacuteticas de dados abertos devem considerar as praacuteticas normas infraestruturas dentro de cada disciplina cientiacutefica e tambeacutem estabelecer incentivos para a publicaccedilatildeo de dados

A Comissatildeo Europeia aborda a necessidade de desenvolver princiacutepios teacutecnicos legais eacuteticos e semacircnticos de interoperabilidade de assegurar a verificaccedilatildeo e a confianccedila nos dados a niacutevel local regional e nacional de implementar novos incentivos para a partilha e proteccedilatildeo de diferentes tipos de dados e por fim uma estrutura que possa avaliar estes princiacutepios (Comissatildeo Europeia Grupo de peritos de alto niacutevel em dados de investigaccedilatildeo 2010) Shadbolt (2016) ressalva que a aposta deve ser feita em poliacuteticas consistentes que determinem a forma de abertura de dados produzidos sob financiamento puacuteblico sendo essencial sublinhar os seus benefiacutecios e partilhar as melhores praacuteticas Para gerar praacuteticas e uma cultura de abertura ldquowe need incentives as well as mandatesrdquo (Shadbolt 20162) A visatildeo subjacente a este movimento de abertura de dados cientiacuteficos eacute que os dados arriscam-se a ficar sem sentido se forem impedidos de ganhar valor cientiacutefico econoacutemico social ou poliacutetico (Leonelli 2016)

Os governos devem desenvolver poliacuteticas de abertura dos dados cientiacuteficos que complementem as poliacuteticas de abertura dos dados puacuteblicos bem como apoiar a criaccedilatildeo de software e recursos humanos habilitados que satildeo criacuteticos no sucesso de ambas as poliacuteticas (Royal Society 2012) As poliacuteticas de Dados Abertos devem ter um caraacuteter diferenciado das poliacuteticas de AA devido a questotildees como a confidencialidade e seguranccedila Nesse sentido o desenvolvimento de poliacuteticas de Dados Abertos eacute uma tarefa mais complexa devendo por isso ser incorporada como uma extensatildeo das poliacuteticas de AA (Swan 2012) A loacutegica para a definiccedilatildeo de poliacuteticas nacionais de Open Data encontra-se em assegurar o rigor da ciecircncia nacional baseado na acessibilidade e reprodutibilidade dos seus resultados em capturar o valor da abertura de dados para benefiacutecio proacuteprio e como base da colaboraccedilatildeo eficiente na ciecircncia internacional (Science International 2015 traduccedilatildeo livre) Embora a ciecircncia seja um elemento central Pasqueto Sands e Borgman (2015) sublinham que esta loacutegica se centra maioritariamente no domiacutenio econoacutemico

Segundo a SPARC as entidades financiadoras de investigaccedilatildeo devem implementar poliacuteticas de Dados Abertos como forma de aumentar a disponibilidade e reutilizaccedilatildeo de dados enquanto reduzem a duplicaccedilatildeo de investigaccedilatildeo maacute-interpretaccedilatildeo fraude e manipulaccedilatildeo de dados As poliacuteticas devem abranger todos os dados e metadados necessaacuterios agrave verificaccedilatildeo dos resultados de investigaccedilatildeo devendo a sua publicaccedilatildeo ocorrer o mais rapidamente possiacutevel (Tananbaum) O tempo passado entre a criaccedilatildeo e

56

a publicaccedilatildeo de dados eacute uma questatildeo importante na cultura do Open Data Poreacutem a Royal Society (2012) sugere que os investigadores deveriam ter exclusividade do uso dos dados por um curto periacuteodo de tempo de maneira a poderem analisa-los e publicar os seus resultados

A RECODE (2014) sublinha que os dados devem ser depositados num repositoacuterio que garanta a reutilizaccedilatildeo seguranccedila estabilidade estrutura de custos relevacircncia temaacutetica metadados diversos formatos de ficheiros processamento por maacutequina e curadoria de dados As poliacuteticas mais significativas das entidades financiadoras definem o AA a dados com obrigatoacuterio para a investigaccedilatildeo financiada com as exceccedilotildees possiacuteveis por razotildees eacuteticas e legais Requem o depoacutesito de dados que suportam as publicaccedilotildees e outros dados importantes em repositoacuterios certificados Requerem que os investigadores descrevam os dados nos Data Management Plan (DMP) que satildeo submetidos com as propostas de financiamento para serem avaliados Para assegurar a reutilizaccedilatildeo dos dados e a habilidade de identificar e medir o cumprimento das poliacuteticas os financiadores de investigaccedilatildeo introduziram especificaccedilotildees teacutecnicas nas suas poliacuteticas (DOIrsquos padrotildees de metadados especiacuteficos) bem como provisotildees para o licenciamento apropriado Mais importante as poliacuteticas eficientes incluem descriccedilotildees claras das responsabilidades e expectativas para os intervenientes envolvidos (financiadores investigadores centros de dados repositoacuterios e instituiccedilotildees de investigaccedilatildeo) (RECODE 2014)

O sucesso das poliacuteticas dos financiadores depende da criaccedilatildeo de um ambiente com incentivos apropriados que assegurem que os investigadores que gerem datasets de qualidade e os disponibilizem publicamente recebam o devido reconhecimento e recompensa bem como o financiamento adequado para os repositoacuterios e a monitorizaccedilatildeo dos planos de gestatildeo de dados (Expert Advisory Group on Data Access [EAGDA] 2014) Segundo a RECODE (2014) as poliacuteticas das entidades financiadoras devem estabelecer o AA a dados de investigaccedilatildeo por defeito devem definir responsabilidades conteuacutedos alvo os planos de gestatildeo de dados tempo e local de depoacutesito as especificaccedilotildees teacutecnicas para permitir a reutilizaccedilatildeo o licenciamento de dados medidas para garantir o acesso a longo termo e garantir a conformidade com a poliacutetica As instituiccedilotildees de investigaccedilatildeo devem desenvolver poliacuteticas para a partilha de dados e preservaccedilatildeo fornecer treino e apoio aos investigadores para gerirem os seus dados de forma efetiva criar carreiras para os gestores de dados e reconhecer os data outputs nos processos de avaliaccedilatildeo (EAGDA 2014) No Reino Unido um grupo de entidades interessadas na abertura de dados assinou em Julho de 2016 a ldquoConcordat on Open Research Datardquo com o intuito de assegurar que os dados de investigaccedilatildeo gerados e coletados por membros da comunidade de investigaccedilatildeo britacircnica sejam disponibilizados de forma aberta para reutilizaccedilatildeo por outros devendo esta abertura ocorrer de maneira consistente ldquowith relevant legal ethical disciplinary and

57

regulatory frameworks and norms and with due regard to the costs involvedrdquo (Concordat on Open Research Data 20161)

O desenvolvimento de poliacuteticas de abertura de dados permite que as instituiccedilotildees43 salvaguardem o seu investimento intelectual financeiro humano e material e respondam agrave crescente pressatildeo dos financiadores que requerem que os dados produzidos sob financiamento sejam geridos de forma apropriada e com AA (RECODE 2014) As poliacuteticas de abertura de dados das instituiccedilotildees de investigaccedilatildeo devem identificar as funccedilotildees e responsabilidades de cada interveniente tendo ainda um papel importante no desenvolvimento de data science skills sendo a sua funccedilatildeo preparar os investigadores para explorarem dados de forma efetiva oferecer serviccedilos de administraccedilatildeo de dados e tambeacutem a infraestrutura de computaccedilatildeo e armazenamento necessaacuteria (RECODE 2014 Whyte amp Donnally 20166) Rouder (2015) defende que as instituiccedilotildees devem utilizar sistemas automatizados que permitem que os dados sejam criados jaacute abertos eliminando erros na gestatildeo de dados fornecendo coacutepias de seguranccedila automaacuteticas simplificaccedilatildeo da partilha aumento da disponibilidade dos dados a longo termo e proporcionando um local de partilha e armazenamento

Segundo o RECODE (2014) os editores estatildeo interessados na abertura de dados de investigaccedilatildeo porque esta abertura agrega valor aos seus produtos principais (publicaccedilotildees tradicionais) ao melhorar a confianccedila da investigaccedilatildeo publicada atraveacutes da habilidade de a verificar Os editores cientiacuteficos devem estabelecer poliacuteticas para a partilha de dados e processos que permitam a contribuiccedilatildeo de autores individuais nas publicaccedilotildees sejam avaliadas e que requeiram a citaccedilatildeo44 e o reconhecimento dos datasets usados no curso da publicaccedilatildeo (EAGDA 2014 ICSU 2014) Os editores devem ainda requerer que se possa aceder avaliar usar e rastrear os dados subjacentes aos artigos a partir dos mesmos como condiccedilatildeo para a publicaccedilatildeo (Royal Society 2012 EAGDA 2014 ICSU 2014) A emergecircncia de data journals45 deve ser ligada ao esforccedilo de publicar dados de forma separada o que permite que partes essenciais do registo cientiacutefico possam ser disponibilizadas de forma inteligiacutevel para a comunidade cientiacutefica (RECODE 2014) Segundo o estudo de Sturges et al (20152445) ldquoa large percentage of journals have no data sharing policy and that there are inconsistencies between those that are traceablerdquo significando que os investigadores natildeo sabem se devem 43 Um bom exemplo encontra-se no siacutetio do Centro Europeu de Investigaccedilatildeo nuclear que apresenta trecircs grupos de dados produzidos que podem ser reutilizados tendo ainda definido poliacuteticas de acesso externo aos dados reutilizaccedilatildeo e preservaccedilatildeo para os dados provenientes de quatro experiecircncias a decorrer com o Large Hadron Collider (Grande Colisor de Haacutedrons) Disponiacutevel na WWW httpopendatacernchabout 44 De forma a potenciar o creacutedito do autor e a citaccedilatildeo de dados a Royal Society (2012) Altman amp Crosas (2013) Carpenter (2014) Ball amp Duke (2015) aconselham a criaccedilatildeo perfis de autor como o ORCID ou o ISNI permitindo desta forma que os investigadores possam associar todos os seus trabalhos cientiacuteficos num ponto uacutenico 45 Os data journals satildeo plataformas de publicaccedilatildeo de dados em AA com revisatildeo por pares para a publicaccedilatildeo partilha e disseminaccedilatildeo de dados que cobrem uma grande variedade de disciplinas (RECODE 2014)

58

partilhar os dados subjacentes aos seus artigos e tambeacutem natildeo sabem como e onde depositar os dados Contudo o cenaacuterio parece estar a mudar com o grupo editorial Nature Springer46 a anunciar em dezembro de 2016 o compromisso de mais de 600 journals com as novas poliacuteticas de partilha de dados definidas pelo grupo encorajando ou mandatando a partilha arquivo citaccedilatildeo de dados e revisatildeo por pares (Nature Springer 2016)

O Open Science Monitor avalia o impacto da abertura dos dados de investigaccedilatildeo atraveacutes trecircs indicadores nuacutemero de repositoacuterios de Dados Abertos poliacuteticas das agecircncias de financiamento relativas agrave partilha de dados e tambeacutem o comportamento dos investigadores em termos de partilha de dados O modelo de avaliaccedilatildeo usa ferramentas como o r3data e o SHERPAJuliet para determinar o nuacutemero de repositoacuterios e de poliacuteticas de abertura de dados recorrendo ainda a estudos de caso para determinar o comportamento dos investigadores na partilha de dados Foram listadas 105 poliacuteticas de financiadores na EU sendo que 76 das instituiccedilotildees natildeo possuem qualquer poliacutetica de Dados Abertos 10 encoraram o arquivo e 19 entidades financiadores requerem o arquivo de dados Os resultados satildeo altamente influenciados pelo enorme nuacutemero de instituiccedilotildees de financiamento de investigaccedilatildeo que pertencem ao Reino Unido sendo que das 69 instituiccedilotildees listadas 53 natildeo implementaram nenhuma poliacutetica de Dados Abertos Ressalve-se tambeacutem que das 19 poliacuteticas que requerem o arquivo de dados 13 pertencem ao Reino Unido (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2017)

O biosharingorg (2017) elaborou uma lista com as poliacuteticas de abertura de dados de investigaccedilatildeo a niacutevel mundial contando com 96 referecircncias em maio de 2017 As poliacuteticas de Dados Abertos distribuem-se por revista cientiacutefica (68) entidade financiadora (22) projetos (4) e sociedade (2) Ciecircncias da Vida e Ciecircncias Biomeacutedicas satildeo os domiacutenios com mais poliacuteticas Natildeo se encontra nenhuma poliacutetica cientiacutefica portuguesa listada

O RECODE (2014) estabeleceu dez recomendaccedilotildees para a abertura de dados cientiacuteficos

Desenvolver poliacuteticas compreensivas de AA aos dados de investigaccedilatildeo e consistentes com as prioridades nacionais e alinhadas com os requisitos europeus

Assegurar o financiamento apropriado para o AA aos dados de investigaccedilatildeo ao niacutevel do financiamento do desenvolvimento e sustentabilidade a longo prazo das

46 A Scientific Data uma das revistas de AA para descriccedilatildeo de datasets cientiacuteficos da divisatildeo editorial Nature Research englobadas no grupo Nature Springer fornece aos investigadores uma lista de repositoacuterios recomendados para o depoacutesito de dados consoante a sua aacuterea temaacutetica Disponiacutevel na WWW httpswwwnaturecomsdatapoliciesrepositoriessocial

59

infraestruturas de investigaccedilatildeo treino de investigadores bibliotecaacuterios e outros profissionais

Desenvolver poliacuteticas e iniciativas que recompensem os investigadores pelo esforccedilo de partilharem dados de alta qualidade

Identificar os intervenientes-chave e as redes de colaboraccedilatildeo para fomentar o trabalho colaborativo para um ecossistema sustentaacutevel de AA aos dados

Planear a sustentabilidade da curadoria e a preservaccedilatildeo dos dados a longo termo Desenvolver soluccedilotildees teacutecnicas e infraestruturais que possam arcar com a

preservaccedilatildeo de dados de alta qualidade a longo prazo harmonizaccedilatildeo de dados descoberta e acesso preservaccedilatildeo obsolescecircncia tecnoloacutegica documentaccedilatildeo e metadados indicadores de qualidade e relevacircncia e questotildees de seguranccedila

Desenvolver padrotildees teacutecnicos e cientiacuteficos de qualidade para os dados Requerer o uso de estruturas harmonizadas abertas e licenciadas Lidar com os sistemaacuteticos desafios legais e eacuteticos decorrentes do AA a dados Apoiar a transiccedilatildeo para os Dados Abertos atraveacutes do treino e desenvolvimento de

curriacuteculo

A ERAC (2016) desenvolveu um conjunto de recomendaccedilotildees para apoiar o desenvolvimento de poliacuteticas nacionais de abertura de dados de investigaccedilatildeo As recomendaccedilotildees satildeo dirigidas aos diversos intervenientes da abertura de dados estando dividas em quatro categorias

Treino dos intervenientes no processo de abertura de dados mudanccedila cultural treino incentivos e sistemas de recompensa e monitorizaccedilatildeo

Gestatildeo e qualidade de dados aspetos teacutecnicos da avaliaccedilatildeo da qualidade de dados identificaccedilatildeo e citaccedilatildeo de dados e gestatildeo de projetos

Sustentabilidade e financiamento abordagem das infraestruturas e financiamento essenciais

Questotildees legais direitos de propriedade intelectual e questotildees de seguranccedila

A mudanccedila cultural exigida para a abertura plena dos dados passa pela necessidade de estabelecer novas formas de reconhecimento e recompensa aos esforccedilos de gestatildeo preservaccedilatildeo e curaccedilatildeo de dados como forma de envolver investigadores e comunidades na abertura de dados (RECODE 2014 International Science 2015) A mudanccedila cultural tem no entanto encontrado alguns reveses pois o caminho para a abertura de dados natildeo eacute percecionado da mesma forma pelos diferentes intervenientes Isto resulta de conflitos entre cadeias de valor processos paralelos e desconectados especialmente entre as praacuteticas de cada disciplina e os requisitos de cada financiadorinstituiccedilatildeo (RECODE 2014) Segundo o inqueacuterito efetuado pelo EAGDA (2014) os planos de gestatildeo de dados natildeo satildeo avaliados adequadamente e existe pouca monitorizaccedilatildeo da implementaccedilatildeo da partilha de dados Os investigadores natildeo se sentem encorajados pelas instituiccedilotildees a partilhar dados e existe necessidade de

60

proporcionar treino aos investigadores A falta de apoio para a partilha de dados eacute sintomaacutetica com a falta de habilidades na gestatildeo de projetos sendo que os investigadores dedicam poucos cuidados agrave preservaccedilatildeo e curaccedilatildeo de dados Estes acontecimentos contribuem para a falta de conhecimento de metadados limitando a utilidade dos datasets Os investigadores sentem tambeacutem que a partilha de dados natildeo tem influecircncia na progressatildeo na carreira (EAGDA 2014)

A OECD (2015a) considera essencial que os investigadores desenvolvam competecircncias sobre dados que lhes permita natildeo soacute partilhar dados limpos e com metadados adequados como tambeacutem entender e reutilizar dados de terceiros A familiaridade com ferramentas e princiacutepios de gestatildeo de dados deve ser segundo a Royal Society (2012) parte integrante do treino dos cientistas As bibliotecas como parte integrante do mundo da investigaccedilatildeo e os bibliotecaacuterios47 como profissionais de informaccedilatildeo multifacetados podem desempenhar um papel ativo no mundo dos Dados Abertos como facilitadores do processo de investigaccedilatildeo (RECODE 2014 Hahnel e Hook 2016 Erway et al 2016 Hernaacutendez-Peacuterez 2016) Para Erway et al (2016) o plano de gestatildeo de dados eacute um ponto base para os bibliotecaacuterios fornecerem serviccedilos de gestatildeo de dados de investigaccedilatildeo As bibliotecas devem fornecer informaccedilatildeo sobre o processo de gestatildeo de dados incluindo planos de gestatildeo de dados e aconselhamento sobre direitos de propriedade intelectual treino serviccedilos de metadados fornecer um cataacutelogo de dados ou um repositoacuterio de dados oferecer serviccedilos de armazenamento pesquisa e acesso permanente para apoiar o ciclo da investigaccedilatildeo (Christensen-Dalsgaard et al 2012 Erway et al 2016 Hernaacutendez-Peacuterez 2016) Christensen-Dalsgaard et al (2012) acrescenta que as bibliotecas devem participar no desenvolvimento da poliacutetica de Dados Abertos da instituiccedilatildeo e estabelecer colaboraccedilotildees com investigadores grupos de investigaccedilatildeo arquivos e centros de dados para fomentar a interoperabilidade da estrutura de acesso pesquisa e partilha de dados Embora muitas das funccedilotildees sejam idecircnticas Hernaacutendez-Peacuterez (2016) faz a distinccedilatildeo entre os papeacuteis das bibliotecas puacuteblicas e das universitaacuterias O autor ressalva que as bibliotecas puacuteblicas devem centrar a atenccedilatildeo nos Dados Abertos que sejam afetos agrave sua comunidade A RDA publicou em 2015 um documento com uma visatildeo geral sobre as praacuteticas recursos online e ferramentas que podem ajudar as bibliotecas a integrar a gestatildeo de dados nas suas rotinas de trabalho As 23 orientaccedilotildees sugeridas dividem-se em recursos de aprendizagem disseminaccedilatildeo de dados planos de gestatildeo de dados literacia de dados metadados citaccedilatildeo de dados licenciamento e privacidades preservaccedilatildeo digital repositoacuterios de dados e comunidade de praacutetica

Na procura de um padratildeo de abertura de dados que permita potenciar a ciecircncia e a investigaccedilatildeo o Data Publishing Group da FORCE11 criou os FAIR principles Estes

47 Veja-se neste ponto os cursos de formaccedilatildeo sobre gestatildeo de dados para bibliotecaacuterios oferecidos pela Universidade de Edimburgo Disponiacutevel na WWW httpdatalibedinaacukmantralibtraininghtml

61

princiacutepios apresentam-se divididos em quatro facetas relacionadas mas tecnicamente independentes (FORCE11 FAIR Data Publishing Group 2014)

Fig 15 Princiacutepios FAIR Data Fonte Adaptado de FORCE11 FAIR Data Publishing Group 2014 Disponiacutevel na WWW httpswwwforce11orggroupfairgroupfairprinciples

A implementaccedilatildeo destes princiacutepios teacutecnicos na abertura de dados poderaacute potenciar tambeacutem a partilha e por consequente a citaccedilatildeo de dados A citaccedilatildeo de dados48 eacute um assunto que tem vindo a ser debatido na comunidade cientiacutefica nos uacuteltimos anos sendo uma aacuterea em que a FORCE11 tambeacutem jaacute definiu princiacutepios49 que comeccedilam a ser adotados pela comunidade cientiacutefica

Relativamente aos dados puacuteblicos ou do setor puacuteblico a comunidade internacional tem vindo a aumentar o seu interesse no uso destes dados embora nem sempre seja claro que a abertura seja uma prioridade na sua agenda poliacutetica (OD4D 2016) ldquoThe 48 Num mundo onde o Fator de Impacto continua a ser a principal medida de avaliaccedilatildeo do trabalho dos cientistas a citaccedilatildeo de dados e as meacutetricas alternativas denominadas de Altimetrias comeccedilam a ganhar algum destaque na literatura cientiacutefica 49 Os Data Citation Principles foram criados pela FORCE11 com o intuito de disponibilizar um padratildeo de citaccedilatildeo de dados cobrindo o propoacutesito funccedilotildees e atributos da citaccedilatildeo O conjunto de oito princiacutepios inclui a importacircncia da citaccedilatildeo de dados a atribuiccedilatildeo de creacutedito prova de evidecircncia identificador uacutenico acesso persistecircncia especificidade e verificabilidade interoperabilidade e flexibilidade Disponiacutevel na WWW httpswwwforce11orggroupjoint-declaration-data-citation-principles-final

bull F1 - Satildeo atribuiacutedos identificadores persistentes e uacutenicos a cada conjunto de (meta)dados

bull F2 - Os dados satildeo descritos atraveacutes do uso de metadados sofisticados

bull F3 - Os (meta)dados devem ser registadosindexados num motor de pesquisa

bull F4 - Os metadados devem especificar o identificador de dados

Faacuteceis de encontrar

bull A1 - Os (meta)dados satildeo pesquisaacuteveis atraveacutes do seu identificador usando um protocolo de comunicaccedilatildeo padratildeo

bull A11 - O protocolo eacute aberto livre e universalmente implementaacutevel

bull A12 O protocolo requer a autenticaccedilatildeo e concessatildeo de autorizaccedilatildeo quando necessaacuterio

bull A2 - Os metadados permanecem acessiacuteveis mesmo quando os dados jaacute natildeo estatildeo disponiacuteveis

Acessiacuteveis

bull I1 - Os (meta)dados usam uma linguagem formal acessiacutevel partilhada e de aplicaccedilatildeo global

bull I2 - Os (meta)dados usam vocabulaacuterios que sigam os princiacutepios FAIR

bull I3 - Os (meta)dados incluem referecircncias qualificadas a outros (meta)dados

Interoperaacuteveis

bull R1 - Os (meta)dados tecircm uma pluralidade de atributos relevantes e precisos

bull R11 - Os (meta)dados satildeo publicados com uma licenccedila clara de acessibilidade e reutilizaccedilatildeo

bull R12 - Os (meta)dados satildeo associados com a sua origem bull R13 - Os (meta)dados cumprem com os padrotildees comunitaacuterios

relevantes de cada domiacutenio

Reutilizaacuteveis

62

culture of open data policies has to change from a culture in which opening of data is standardly considered (Zuiderwijk amp Janssen 201427)

Devem ser consideradas vaacuterias questotildees na elaboraccedilatildeo de uma poliacutetica de Dados Abertos como a definiccedilatildeo da sua aplicaccedilatildeo e os objetivos que dados iratildeo ser publicados quais as condiccedilotildees de publicaccedilatildeo de dados em que siacutetio qual a frequecircncia e qual a razatildeo da publicaccedilatildeo devendo ainda ser calculado o impacto e os benefiacutecios da abertura de dados (Carrara et al 2016a) Os objetivos das poliacuteticas de Dados Abertos podem ser sintetizados em trecircs aacutereas principais fomentar a inovaccedilatildeo social e crescimento econoacutemico melhorar a eficiecircncia dos serviccedilos do setor puacuteblico e fortalecer a democracia e aumentar a transparecircncia (Zuiderwijk Gasco Parycek amp Janssen 2014) Para alcanccedilar este impacto real os governos necessitam de implementar o fenoacutemeno dos Dados Abertos como uma mudanccedila cultural assegurando que recursos humanos e materiais infraestrutura leis e poliacuteticas satildeo eficientes para a implementaccedilatildeo e extraccedilatildeo de resultados a longo prazo (World Wide Web Foundation 2016)

No contexto das poliacuteticas de Dados Abertos a transparecircncia natildeo deve ser vista como um fim mas sim como um meio para atingir outros objetivos como a inovaccedilatildeo no setor puacuteblico permitindo o envolvimento democraacutetico e fornecendo o acesso a informaccedilatildeo ldquoincluding enhancing the findability usability and intelligibility of open data and providing the possibility to trace governmental processes and policy and decision makingrdquo (Zuiderwijk et al 2014) Dados os benefiacutecios desejados as barreiras agrave sua implementaccedilatildeo e os baixos niacuteveis de exploraccedilatildeo de dados os programas de DGA soacute funcionaratildeo bem se forem desenhados mediante a apreciaccedilatildeo da sua complexidade O programa deve natildeo soacute perceber as necessidades e as capacidades dos fornecedores de dados governamentais e privados como tambeacutem as caracteriacutesticas dos dados e a natureza dos recursos da comunidade e dos intervenientes (Dawes Vidiasova amp Parkhimovich 2016) Num estudo comparativo de cinco poliacuteticas nacionais de Dados Abertos Huijboom e van den Broek (2011) concluiacuteram que faltam provas mais evidentes dos benefiacutecios econoacutemicos sociais e democraacuteticos das poliacuteticas de abertura de dados governamentais Os autores sublinham que as barreiras estatildeo dentro das organizaccedilotildees governamentais as motivaccedilotildees estatildeo predominantemente fora desse espectro (Huijboom amp van den Broek 2011)

A investigaccedilatildeo de Dawes Vidiasova amp Parkhimovich (2016) demonstra a existecircncia de vaacuterias abordagens no desenvolvimento de programas de abertura de dados governamentais com diversas consideraccedilotildees sociais e teacutecnicas

Abordagem orientada a dados ou seja focada nas caracteriacutesticas qualidade e disponibilidade de dados abertos

Abordagem orientada ao programa que foca os objetivos e as funcionalidades das estruturas e operaccedilotildees dos programas de DGA

63

Abordagem orientada ao uso e ao utilizador que se centra nos fatores que influenciam o uso de DGA pela comunidade

Abordagem de desempenho e impacto que foca uma vasta gama de consideraccedilotildees que podem influenciar como os programas de DGA funcionam

Abordagem de ecossistemas e redes que indicam os componentes de um programa de DGA e tambeacutem as relaccedilotildees dinacircmicas existentes e como estas influenciam o desempenho do programa

O Secretaacuterio-geral das Naccedilotildees Unidas atraveacutes do seu grupo de aconselhamento independente efetuou recomendaccedilotildees para possibilitar ldquoa data revolution in sustainable developmentrdquo (The UN Secretary Generals Independent Expert Advisory Group on a Data Revolution for Sustainable Development 2014a traduccedilatildeo livre)

Criaccedilatildeo de normas incentivos e regulamentos para encorajar e requerer que os dados sejam tornados publicamente disponiacuteveis e de forma que possam ser uacuteteis a outros utilizadores

Aumentar a literacia de dados para que mais pessoas usem e analisem dados Criar inovaccedilotildees na forma em como quando e que dados satildeo coletados e

partilhados para que estejam sempre atualizados e sejam relevantes para as pessoas e para os poliacuteticos

Para apoiar o desenvolvimento sustentaacutevel e inclusivo a data revolution deve ser guiada pelos seguintes princiacutepios qualidade e integridade de dados desagregaccedilatildeo de dados publicaccedilatildeo de dados de forma raacutepida transparecircncia e abertura de dados curadoria e usabilidade de dados proteccedilatildeo e privacidade gestatildeo e independecircncia recursos e capacidades tecnoloacutegicas (The UN Secretary Generals Independent Expert Advisory Group on a Data Revolution for Sustainable Development 2014b) O repositoacuterio de dados estatiacutesticos das Naccedilotildees Unidas indexa 60 milhotildees de registos de datasets provenientes de 35 bases de dados de 20 temaacuteticas diferenciadas Ao inserir a palavra ldquoPortugalrdquo no campo de pesquisa do repositoacuterio satildeo recuperados 2172 datasets distribuiacutedos por 25 fontes diferenciadas Estes conjuntos de dados distribuem-se por vaacuterias temaacuteticas sendo o setor industrial o maior fornecedor de dados com 612 datasets (United Nations Statistics Division 2017)

Dawes Vidiasova amp Parkhimovich (20162) defendem ldquothe ecosystem metaphorrdquo como uma abordagem heuriacutestica para o desenho efetivo de programas de abertura de dados governamentais sublinhando a sua utilidade se o ecossistema for dotado de ldquofeedback and adjustment among actors and processesrdquo A chave para um ecossistema de Dados Abertos funcional eacute a implementaccedilatildeo de poliacuteticas que definam ldquothe legal context standards to facilitate data interoperability and a stable and sustainable network for users of the datardquo (Donker amp van Loenen 2017)

64

A Sunlight Foundation publicou em 2014 as ldquoGuidelines for open data policiesrdquo fornecendo aconselhamento ao niacutevel dos dados que devem ser tornados puacuteblicos e como essa abertura deve ser efetuada Para a implementaccedilatildeo de poliacuteticas de DGA a Sunlight Foundation aponta como fundamental criar um autoridade de supervisatildeo criar orientaccedilotildees e outras regulaccedilotildees vinculativas para a implementaccedilatildeo da poliacutetica incorporar a perspetiva puacuteblica na implementaccedilatildeo da poliacutetica definir prazos ambiciosos para a implementaccedilatildeo criar processos que assegurem a qualidade dos dados assegurar financiamento suficiente para a implementaccedilatildeo da poliacutetica criar ou explorar parcerias e mandatar futuras revisotildees da poliacutetica para possiacuteveis ajustamentos (Sunlight Foundation 2014 traduccedilatildeo livre)

De acordo com Dietrich (2013) uma poliacutetica de dados abertos deve

Definir a abertura por defeito Estar alinhada com os principais objetivos nacionais de desenvolvimento de

poliacuteticas Definir uma estrateacutegia nacional e as suas prioridades Tornar a coleta e gestatildeo de dados numa rotina Estabelecer accedilotildees de suporte ao ecossistema de dados abertos

Segundo o Open Data GoldBook todas as poliacuteticas de Dados Abertos devem cobrir os seguintes toacutepicos (Carrara et al 2016a traduccedilatildeo livre)

Lista das categorias de dados da organizaccedilatildeo Avaliaccedilatildeo do estatuto dos dados da organizaccedilatildeo Alinhamento com os aspetos legais Accedilotildees necessaacuterias para atingir os objetivos propostos Implicaccedilotildees teacutecnicas Implicaccedilotildees financeiras Criaccedilatildeo de um grupo de trabalho com responsabilidades e funccedilotildees claras Desenvolvimento de um plano que assegure a criaccedilatildeo do grupo de trabalho e

tambeacutem a sua monotorizaccedilatildeo Definiccedilatildeo de indicadores de performance que possibilitem a mediccedilatildeo do progresso

da poliacutetica relativamente aos objetivos delineados

O Open Data Study (Hogge 2011) aponta como razatildeo de sucesso das estrateacutegias de Open Data no Reino Unido e nos EUA a utilizaccedilatildeo de uma abordagem que envolve trecircs niacuteveis de intervenientes

Sociedade Civil e em particular o pequeno grupo que desenvolve aplicaccedilotildees e serviccedilos a partir de dados puacuteblicos

Um grupo de burocratas governamentais munidos de talento e recursos que lhes permita funcionar como niacutevel intermeacutedio ou de ligaccedilatildeo

Uma administraccedilatildeo poliacutetica recetiva agrave mudanccedila e agrave abertura

65

Em entrevista ao mesmo estudo (Hogge 201110) Tim Berners-Lee sintetiza esta estrateacutegia ldquoIt has to start at the top it has to start in the middle and it has to start at the bottomrdquo reforccedilando a ideia da importacircncia destes trecircs niacuteveis de influecircncia

Atraveacutes do seu Task Force Report o e-IRG (2016) efetuou vaacuterias recomendaccedilotildees para a implementaccedilatildeo de poliacuteticas de Dados Abertos preferecircncia pelas licenccedilas abertas promover a certificaccedilatildeo dos repositoacuterios apresentar os dados como um bem cientiacutefico institucional e societal e por fim ligar dados agraves publicaccedilotildees O OD4D (2016) sublinha que os dados devem ser publicados de forma consistente devem ser comparaacuteveis e interoperaacuteveis e para isso eacute necessaacuterio adotar padrotildees abertos e praacuteticas de publicaccedilatildeo para metadados formatos codificaccedilatildeo de caracteres identificadores vocabulaacuterios e licenciamento

Atraveacutes do estudo efetuado agraves poliacuteticas de Dados Abertos de instituiccedilotildees holandesas Zuiderwijk e Janssen (2014 traduccedilatildeo livre) efetuaram diversas recomendaccedilotildees que podem potenciar melhorias nas poliacuteticas de abertura de dados

Colaboraccedilatildeo entre instituiccedilotildees usando recursos e conhecimento coletivo para apoiar a troca de conhecimentos e a superaccedilatildeo da limitaccedilatildeo de recursos

Foco no impacto criaccedilatildeo de valor puacuteblico e natildeo apenas na publicaccedilatildeo de dados Estiacutemulo do uso de Dados Abertos e comunicaccedilatildeo dos sucessos de reutilizaccedilatildeo Criaccedilatildeo de uma cultura onde a abertura de dados seja incorporada nos processos

de trabalho diaacuterios

Arzberger et al (20041777) elencaram uma estrutura de avaliaccedilatildeo com cinco domiacutenios para promover o acesso a dados tecnoloacutegico institucional e de gestatildeo financeiro e orccedilamental legal e poliacutetico cultural e comportamental Estes domiacutenios podem ajudar na formulaccedilatildeo de poliacuteticas de Dados Abertos dado que satildeo ldquoa framework for locating and analyzing where improvements can be maderdquo Alguns autores destacam a pouca importacircncia que tem sido dedicada agrave implementaccedilatildeo avaliaccedilatildeo e alteraccedilotildees das poliacuteticas de Dados Abertos (Zuiderwijk et al2014) e ao desenvolvimento de investigaccedilatildeo que compare as mesmas poliacuteticas (Zuiderwijk amp Janssen 2014) A avaliaccedilatildeo dos efeitos das poliacuteticas de Dados Abertos pode fornecer inferecircncias importantes sobre as vantagens e desvantagens da abertura de dados e o valor puacuteblico que estas podem criar (Zuiderwijk et al2014) Comparar poliacuteticas de Dados Abertos em diferentes aspetos e a diferentes niacuteveis eacute importante e necessaacuterio para obter ldquoa better understanding of the common and differing elements in the policies and to identify the factors that affect the variation in policies and which influence their impactrdquo (Zuiderwijk amp Janssen 201417-18) Avaliar o estado da abertura de dados pode envolver a avaliaccedilatildeo teacutecnica dos conjuntos de dados das iniciativas de abertura dos dados governamentais atraveacutes da mediccedilatildeo quantitativa de resultados e impacto e julgamentos qualitativos sobre o desempenho da iniciativa de Dados Abertos (World Wide Web Foundation 2014) Um meacutetodo comum de avaliar o

66

efeito das poliacuteticas satildeo as estruturas de avaliaccedilatildeo da maturidade dos Dados Abertos sendo que estas podem ser uma ferramenta importante na melhoria da abertura de dados e no envolvimento da sociedade Estas estruturas satildeo usadas como modelo para comparaccedilatildeo de diferentes setores eou paiacuteses como instrumento de melhoria da qualidade e gestatildeo dos Dados Abertos (World Wide Web Foundation 2014 Donker amp van Loenen 2017) para entender os impactos comerciais e sociais e priorizar determinados tipos de dados (World Wide Web Foundation 2014) A World Wide Web Foundation (2014) enfatiza que a avaliaccedilatildeo das atividades de Dados Abertos deve ter em conta

Contexto em que a abertura de dados eacute feita legal organizacional poliacutetico teacutecnico social e econoacutemico

Natureza e qualidade dos conjuntos de dados acessibilidade legibilidade por maacutequina e licenccedilas abertas dimensatildeo teacutecnica legal social e praacutetica da abertura classificaccedilatildeo de datasets avaliaccedilatildeo da qualidade

Contexto de utilizaccedilatildeo quem satildeo os utilizadores quais os seus propoacutesitos e quais as atividades e modelos de negoacutecio construiacutedos a partir dos Dados Abertos

Benefiacutecios adquiridos pela reutilizaccedilatildeo de Dados Abertos sociais ambientais poliacuteticos e econoacutemicos ou comerciais

Atraveacutes de uma extensa revisatildeo da literatura50 Zuiderwijk e Janssen (2014) elaboraram uma estrutura de comparaccedilatildeo para as poliacuteticas de Dados Abertos baseada em trecircs vetores o ambiente e contexto da poliacutetica o conteuacutedo da poliacutetica os indicadores de desempenho que permitem inferir o valor puacuteblico alcanccedilado Estes vetores dividem-se em 27 indicadores de enquadramento e avaliaccedilatildeo das poliacuteticas de Dados Abertos

50 As autoras mencionam publicaccedilotildees de Huijboom amp Van der Broek (2011) Gibbs et al (2003) Eskelinen et al (2008) De Bruijn et al (2002) Dawes et al (2004) Rothenberg (2012) Public Sector Transparency Board (2012) Dawes Pardo amp Cresswell (2004) Open Government Directive (Obama 2012) Jaeger et al (2012) Zuiderwijk Jeffey amp Janssen (2012) Ono amp Zavodny (2007) Jaeger (2007)

67

Fig 16 Estrutura de avaliaccedilatildeo de poliacuteticas de Dados Abertos Fonte Zuiderwijk e Janssen (2014) Disponiacutevel na WWW httpwwwsciencedirectcomsciencearticlepiiS0740624X13001202

Antes de poder avaliar o sucesso do impacto dos Dados Abertos eacute necessaacuterio avaliar o estado atual da abertura de dados (Donker amp van Loenen 2017) De acordo com Sasse et al (2017) a avaliaccedilatildeo dos produtos de Dados Abertos pode ser difiacutecil Os autores enfatizam que os responsaacuteveis pelos portais de dados querem obter mais informaccedilatildeo atraveacutes da mediccedilatildeo de alguns paracircmetros como os datasets mais acedidos que datasets natildeo satildeo atualizados ou a percentagem de downloads entre outros Estas meacutetricas51 podem servir diversas audiecircncias desde organizaccedilotildees que publiquem dados a utilizadores que pretendam saber quais os conjuntos de dados mais usados Ainda

51 As meacutetricas satildeo uma forma de avaliaccedilatildeo que mede o progresso desempenho qualidade ou quantidade de um projeto serviccedilo ferramenta ou produto (Sasse et al 2017)

bullPaiacutes bullNiacutevel da organizaccedilatildeo e tipo de missatildeo bullMotivaccedilotildees e objectivos bullLanccedilamento da plataforma de Dados Abertos bullAlocaccedilatildeo de recursos e contexto econoacutemico bullLegislaccedilatildeo bullContexto poliacutetico e social

Conteacuteudo e ambiente da poliacutetica

bullEstrateacutegia e princiacutepios de abertura bullMedidas e instrumentos poliacuteticos bullProcessamento de dados antes da publicaccedilatildeo bullQuantidade de Dados Abertos bullTemaacutetica dos Dados Abertos bullFormas de apresentaccedilatildeo de dados bullPreccedilo do acesso aos dados bullGrupos alvo da abertura de dados bullPadrotildees e formatos teacutecnicos para os Dados Abertos bullFornececimento de metadados bullTipos de dados natildeo publicados bullApoio teacutecnico para o uso de dados publicados bullPromoccedilatildeo ativa da reutilizaccedilatildeo de dados bullQualidade dos dados bullLicenciamento de dados bullDisponibilidade de dados sem pedido de registo bullEstrutura da relaccedilatildeo entre os fornecedores de informaccedilatildeo e os utilizadores

Conteuacutedo da poliacutetica (input)

bullUsos dos dados publicados bullRiscos da publicaccedilatildeo de dados bullBenefiacutecios da publicaccedilatildeo de dados

Indicadores de desempenho (output)

Valor puacuteblico alcanccedilado (impacto)

68

segundo Sasse et al (2017) as meacutetricas devem ser integradas num contexto mais vasto para que possam conduzir agrave tomada de decisatildeo e agrave formulaccedilatildeo de poliacuteticas

Entre as iniciativas de Open Data ao niacutevel global a disponibilizaccedilatildeo aberta de dados eacute normalmente feita atraveacutes de cataacutelogos e portais de dados centralizados disponibilizando um ponto de acesso uacutenico aos utilizadores e atraveacutes dos quais se pode inferir o impacto das poliacuteticas de Open Data atraveacutes do regime de abertura dos datasets disponibilizados O DataCatalogs52 agrega os portais de DGA espalhados pelo mundo inteiro contabilizando 520 portais em Dezembro de 2016 sendo 197 localizados na Europa e apenas 5 em Portugal53 cenaacuterio que nos parece extremamente desatualizado tendo em conta os resultados obtidos no Quadro 5

O Open Data Barometer coleta informaccedilatildeo sobre a abertura de dados classificando os paiacuteses conforme o niacutevel de preparaccedilatildeo de poliacuteticas de Open Data a sua respetiva implementaccedilatildeo e tambeacutem o impacto causado por esta abertura oferecendo uma visatildeo global daquilo que eacute o estado de abertura dos dados governamentais A quarta ediccedilatildeo do Open Data Barometer revela algumas conclusotildees preocupantes a niacutevel da abertura dos dados governamentais A disponibilidade de dados que cumprem todos os princiacutepios de abertura caiu dos 10 para 7 e a legibilidade por maacutequina tambeacutem tem tendecircncia negativa Apenas se registou uma melhoria no licenciamento de dados A World Wide Web Foundation (2017) listou ainda um conjunto de problemas na disponibilizaccedilatildeo de Dados Abertos

Foi avaliado que nove em cada dez conjuntos de dados natildeo estatildeo abertos sendo que a recomendaccedilatildeo eacute que estes sejam abertos por princiacutepio

Os dados governamentais satildeo normalmente incompletos e de baixa qualidade A World Wide Web Foundation recomenda a descentralizaccedilatildeo da abertura de dados por todas as agecircncias e departamentos governamentais

A vontade poliacutetica eacute aquilo que distingue o sucesso do insucesso da abertura de dados ldquoGovernments must adopt the Open Data Charter to ensure open data practices are embedded beyond political mandatesrdquo (World Wide Web Foundation 201717)

Os governos natildeo estatildeo a publicar os dados necessaacuterios para restaurar a confianccedila dos cidadatildeos A recomendaccedilatildeo eacute que os governos devem consultar os cidadatildeos e intermediaacuterios para saber que dados devem ser considerados prioritaacuterios

Poucas iniciativas de Dados Abertos realmente promovem a igualdade e a inclusatildeo ldquoGovernments must invest in using open data to improve the lives of marginalised groupsrdquo (World Wide Web Foundation 201721)

52 Disponiacutevel na WWW httpdatacatalogsorg 53 Os portais indexados pelo DataCatalogs satildeo OneStopTransport iGEO Central de Dados Dadosgovpt Despesa Puacuteblica Portugal

69

O Open Data Maturity Model da ODI (201511) fornece uma estrutura para avaliar como as praacuteticas de abertura de dados tecircm impacto nas organizaccedilotildees nomeadamente como os dados satildeo publicados como satildeo geridos e valorizados Este modelo eacute baseado em cinco temas que representam uma vasta aacuterea de atividades

Processos de gestatildeo de dados identificaccedilatildeo dos processos de gestatildeo e publicaccedilatildeo de dados incluindo o controlo de qualidade fluxos de trabalho e adoccedilatildeo de padrotildees teacutecnicos Conhecimentos e habilidades delimitaccedilatildeo dos passos necessaacuterios para criar ldquoa culture of open data within an organizationrdquo identificando a necessaacuteria partilha de conhecimento treino e aprendizagem para entender os benefiacutecios da abertura Apoio e envolvimento do cliente foca a necessidade das organizaccedilotildees de se envolver com as fontes de dados e com os reutilizadores de dados de modo a poder fornecer apoio e obter respostas para tornar a abertura de dados bem-sucedida Investimento e desempenho financeiro cobre a necessidade da organizaccedilatildeo em ter uma visatildeo do valor dos seus dados e do orccedilamento necessaacuterio para suportar a sua publicaccedilatildeo Em termos de consumo de dados as organizaccedilotildees devem entender os custos e o valor associado agrave reutilizaccedilatildeo de dados provenientes de outras fontes Visatildeo estrateacutegica sublinha a necessidade de a organizaccedilatildeo adotar uma estrateacutegia clara sobre a partilha e reutilizaccedilatildeo de dados e nomear uma lideranccedila reconhecida com responsabilidade e capacidade para executar a estrateacutegia (ODI 2015 traduccedilatildeo livre)

A W3C publicou em Janeiro de 2017 como recomendaccedilatildeo uma lista de boas praacuteticas para a publicaccedilatildeo e partilha de dados denominada Data on the Web Best Practices Estas praacuteticas cobrem questotildees como o fornecimento de metadados descritivos e estruturais licenciamento arquivamento enriquecimento e republicaccedilatildeo de dados (W3C 2017) Cada uma das praacuteticas estaacute classificada de acordo com os seus benefiacutecios definidos em oito categorias reutilizaccedilatildeo compreensatildeo conexatildeo a outros dados pesquisabilidade confianccedila acesso interoperabilidade e processamento (W3C 2017) Esta lista de boas praacuteticas eacute complementada por dois vocabulaacuterios controlados um para o uso de datasets54 e outro para a qualidade dos dados55 (W3C 2017)

ldquoUma cidade inteligente eacute conhecedora das suas capacidades do seu territoacuterio e dos seus recursos devendo ser capaz de transformar o seu papel de fornecedor de dados em catalisadora de processos de inovaccedilatildeordquo (Soares Baptista e Lima 2015) A disponibilizaccedilatildeo de dados locais permite aos cidadatildeos acompanharem as decisotildees do setor puacuteblico relativas a despesas aumentando a transparecircncia e estimulando a democracia Contudo eacute necessaacuterio que as cidades desenvolvam uma infraestrutura correta que permita processar e integrar a gestatildeo de dados em diversos serviccedilos

54 Disponiacutevel na WWW httpswwww3orgTRvocab-duv 55 Disponiacutevel na WWW httpswwww3orgTRvocab-dqv

70

criando ainda um sistema de gestatildeo que facilite o armazenamento e publicaccedilatildeo de dados (Carrara et al 2016b) A Sunlight Foundation (2013) desenvolveu o Public Policy for Public Data um guia para ajudar as cidades a desenvolver e implementar poliacuteticas puacuteblicas de Dados Abertos desde as razotildees para a abertura passando pelos objetivos e implementaccedilatildeo ateacute agrave promoccedilatildeo da poliacutetica

De forma a sistematizar as iniciativas de Dados Abertos e melhorar a sua gestatildeo foi publicada em Espanha a UNE 1783012015 Ciudades Inteligentes Datos Abiertos permitindo avaliar a maturidade da publicaccedilatildeo de Dados Abertos das cidades inteligentes atraveacutes de meacutetricas e indicadores Esta norma define cinco grandes domiacutenios associados aos Dados Abertos (estrateacutegico legal organizacional teacutecnico econoacutemico-social) fornecendo ainda vocabulaacuterios concretos para a publicaccedilatildeo de dados (Asociacioacuten Espantildeola de Normalizacioacuten y Certificacioacuten 2015)

O World Council on City Data56 eacute uma das organizaccedilotildees envolvidas na promoccedilatildeo das smart cities e da criaccedilatildeo de padrotildees para os dados provenientes das cidades Em 2014 foi publicada a norma internacional ISO 37120 com o tiacutetulo ldquoSustainable development of communities -- Indicators for city services and quality of liferdquo incluindo 100 indicadores que medem indicadores sociais econoacutemicos e ambientais Estes indicadores estatildeo divididos em 17 categorias de dados economia educaccedilatildeo energia ambiente financcedilas governaccedilatildeo fogo e emergecircncias respostas sauacutede recreaccedilatildeo seguranccedila abrigos desperdiacutecios soacutelidos telecomunicaccedilotildees e inovaccedilatildeo transportes planeamento urbano desperdiacutecio de aacutegua e aacutegua e saneamento (Carrara et al 2016b) O World Council on City Data (2016) permite comparar a abertura de dados em diferentes cidades utilizando os indicadores da ISO 3720 Em termos de cidades listadas pelo mapa desta organizaccedilatildeo o Porto eacute o uacutenico representante portuguecircs destacando-se a sauacutede e transportes como aacutereas com maior abertura

21 Poliacuteticas Macro

A promessa de uma ciecircncia orientada a dados ldquohas renewed the vigour of policy efforts to catalyse innovationrdquo (Whyte amp Donnely 20161) No acircmbito da abertura de dados estatildeo a ser desenvolvidas poliacuteticas por governos agecircncias de financiamento e editoras cientiacuteficas57 que assegurem que os dados de investigaccedilatildeo estejam disponiacuteveis em repositoacuterios puacuteblicos A EU tem desempenhado uma dupla funccedilatildeo na abertura de dados cientiacuteficos ao requerer a abertura de dados nos seus programas de investimento e ao coordenar a implementaccedilatildeo de praacuteticas de abertura de dados nos

56 Disponiacutevel na WWW httpwwwdataforcitiesorg 57 O Open Acess Directory possui uma lista ainda em desenvolvimento com as revistas cientiacuteficas que implementaram uma poliacutetica de Dados Abertos Disponiacutevel na WWW httpoadsimmonseduoadwikiJournal_open-data_policies

71

estados membros (ERAC 2016) As agecircncias de financiamento58 tecircm vindo paulatinamente a definir poliacuteticas de AA que exigem a garantia que os dados de investigaccedilatildeo subjacentes agrave publicaccedilatildeo textual satildeo depositados em repositoacuterios adequados de forma a permitir a verificaccedilatildeo dos resultados de investigaccedilatildeo e futuros uso e interpretaccedilotildees (UNESCO 2015) O raacutepido desenvolvimento da abertura e gestatildeo de dados cientiacuteficos nos EUA e no Reino Unido satildeo resultados de mandatos dos financiadores como o Research Council United Kingdom National Science Foundation e da National Institutes of Health (RECODE 2014) As instituiccedilotildees de financiamento reconhecem a dificuldade na mudanccedila da cultura de partilha de dados sendo que a tendecircncia deveraacute passar por aumentar os niacuteveis de monotorizaccedilatildeo das poliacuteticas como a monotorizaccedilatildeo dos DMPrsquos auditorias institucionais monotorizaccedilatildeo de resultados produzidos e recompensas para o apoio na gestatildeo de dados (Whyte e Donnally 2016)

Em 2010 a Comissatildeo Europeia desenhou uma visatildeo que tinha por objetivo o desenvolvimento de uma e-infraestrutura cientiacutefica que potenciasse o acesso uso e reuacuteso bem como a qualidade dos dados dando o impulso para a EU formular poliacuteticas para a construccedilatildeo da infraestrutura de investigaccedilatildeo dentro do enquadramento da agenda digital Foca-se na infraestrutura necessaacuteria para a gestatildeo de dados cientiacuteficos e identifica os benefiacutecios de acelerar o desenvolvimento de uma completa e funcional infraestrutura para os dados cientiacuteficos O relatoacuterio faz seis recomendaccedilotildees destacando-se o papel governamental no desenvolvimento e uso de novas maneiras de medir o valor dos dados a necessidade de recompensar os que contribuem para tal treinar uma nova geraccedilatildeo de cientistas de dados e fomentar o entendimento puacuteblico (Comissatildeo Europeia Grupo de peritos de alto niacutevel em dados de investigaccedilatildeo 2010) No mesmo documento a Comissatildeo Europeia salienta que existem desafios que satildeo necessaacuterios superar na construccedilatildeo da e-infraestrutura estando estes ao niacutevel da coleta qualidade usabilidade interoperabilidade diversidade seguranccedila dos dados educaccedilatildeo e treino publicaccedilatildeo e acesso de dados exploraccedilatildeo comercial preservaccedilatildeo e sustentabilidade e novos paradigmas sociais

Em 2011 a Comissatildeo Europeia emitiu a COM (2011) 882 onde declara que a abertura de dados cientiacuteficos eacute vital para a Europa pelo seu poder de promover negoacutecios e oportunidades econoacutemicas resolver problemas da sociedade e acelerar o progresso cientiacutefico sendo necessaacuterio atuar a niacutevel local regional nacional e a niacutevel europeu (Comissatildeo Europeia 2011)

A recomendaccedilatildeo da Comissatildeo Europeia sobre o acesso agrave informaccedilatildeo cientiacutefica e a sua preservaccedilatildeo (2012417UE) pede aos Estados Membros que desenvolvam poliacuteticas e estrateacutegias que assegurem o AA a publicaccedilotildees e dados de investigaccedilatildeo provenientes

58 A Universidade de Cambridge apresenta uma lista com as 18 entidades financiadoras a niacutevel internacional que possuem poliacuteticas de Dados Abertos Disponiacutevel na WWW httpwwwdatacamacukfunders

72

de financiamento puacuteblico Estas poliacuteticas devem prever os objetivos e os indicadores de avaliaccedilatildeo o plano de execuccedilatildeo e o plano financeiro garantindo que os dados resultantes de financiamento puacuteblico sejam acessiacuteveis e reutilizaacuteveis ldquothrough digital e-infrastructuresrdquo e sejam facilmente identificados e ligados a outros conjuntos de dados As instituiccedilotildees nacionais devem promover a poliacutetica nacional atraveacutes de mecanismos que permitam e recompensem ldquothe sharing of research datardquo (EUR-Lex 201241-42) A poliacutetica instaurada em 2015 pela Comissatildeo Europeia denominada Digital Single Market propocircs a implementaccedilatildeo de uma ldquocopyright exception that would permit researchers to analyse on a large scale scientific data to which they have lawful accessrdquo (Comissatildeo Europeia 2016b) Esta exceccedilatildeo iraacute permitir que os investigadores europeus usem meacutetodos de ldquoText e Data Miningrdquo para analisar e extrair conhecimento de grandes quantidades de informaccedilatildeo atraveacutes de teacutecnicas computacionais (Comissatildeo Europeia 2016a51) Atraveacutes da implementaccedilatildeo deste Digital Single Market a EU tem envidado esforccedilos para desenvolver uma economia baseada em dados Esta economia de dados caracteriza-se por um ldquoecossistema de diferentes tipos de intervenientes no mercado como fabricantes investigadores e fornecedores de infraestruturas que colaboram para garantir que os dados satildeo acessiacuteveis e utilizaacuteveisrdquo Deste modo os intervenientes do mercado podem retirar valor desses dados ldquoatraveacutes da criaccedilatildeo de um leque de aplicaccedilotildees com um grande potencial de melhoria da vida quotidianardquo (Comissatildeo Europeia 2017c)

Com a ambiccedilatildeo de tornar a Europa liacuteder mundial numa economia baseada em dados a Comissatildeo Europeia (2016c) pretende ldquodisponibilizar serviccedilos baseados na computaccedilatildeo em nuvem e infraestruturas de dados de craveira mundialrdquo que forneccedilam vantagens competitivas a investigadores empresaacuterios e instituiccedilotildees puacuteblicas baseadas na utilizaccedilatildeo de grandes volumes de dados Neste sentido foram delineadas quatro metas a cumprir ateacute 2020 (Comissatildeo Europeia 2016d)

ldquoA partir de 2016 Criaccedilatildeo de uma nuvem europeia para a ciecircncia aberta destinada aos investigadores europeus e seus colaboradores cientiacuteficosrdquo A estrateacutegia definida inclui a ldquointegraccedilatildeo e consolidaccedilatildeo das plataformas de infraestruturas eletroacutenicas da agregaccedilatildeo das atuais nuvens cientiacuteficas e infraestruturas de investigaccedilatildeordquo e tambeacutem o apoio agrave criaccedilatildeo de ldquoserviccedilos baseados na computaccedilatildeo em nuvemrdquo

2017 Definiccedilatildeo de abertura por princiacutepio de todos os dados cientiacuteficos gerados em futuros projetos financiados pelo quadro atual de financiamento (H2020) para garantir a reutilizaccedilatildeo do volume massivo de dados produzidos pela comunidade cientiacutefica

2018 Lanccedilamento de uma iniciativa para acelerar o desenvolvimento de ldquotecnologias quacircnticas que estatildeo na base da proacutexima geraccedilatildeo de supercomputadoresrdquo

73

Ateacute 2020 desenvolvimento e implantaccedilatildeo em larga escala de uma infraestrutura europeia de computaccedilatildeo de alto desempenho armazenamento de dados e redesrdquo onde se destaca a ldquocriaccedilatildeo de um centro europeu de grandes volumes de dadosrdquo e a melhoria do GEANT59 ldquoa rede de base de investigaccedilatildeo e inovaccedilatildeordquo

A aposta na criaccedilatildeo de poliacuteticas de abertura de dados de acordo com os objetivos europeus relativamente agrave CA reflete-se no atual programa de financiamento da investigaccedilatildeo e inovaccedilatildeo da EU o Horizonte 2020 (H2020) Este programa criou um projeto-piloto de dados abertos com o objetivo de maximizar o acesso e reutilizaccedilatildeo de dados de investigaccedilatildeo nas aacutereas cientiacuteficas selecionadas60 embora todas as outras aacutereas sejam convidadas a participar (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016a) Sob o artigo 293 do Model Grant Agreement o projeto-piloto de abertura de dados requer o depoacutesito num repositoacuterio de AA de todos os dados e metadados associados que sejam subjacentes aos resultados finais da investigaccedilatildeo permitindo assim o seu acesso exploraccedilatildeo por maacutequina reproduccedilatildeo e disseminaccedilatildeo sem custos para os utilizadores Os investigadores devem fornecer informaccedilatildeo sobre as ferramentas e instrumentos necessaacuterios para validar os resultados Aos participantes em projetos financiados por fundos europeus eacute exigido a elaboraccedilatildeo de um DMP uma ferramenta para a gestatildeo publicaccedilatildeo e reutilizaccedilatildeo de dados permitindo descrever os conjuntos de dados gerados no processo de investigaccedilatildeo e como e quando seratildeo publicados A gestatildeo de dados deve ser efetuada segundo os princiacutepios FAIR tornando os dados faacuteceis de encontrar acessiacuteveis interoperaacuteveis e reutilizaacuteveis (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016c)

Com a extensatildeo do projeto-piloto a todas as aacutereas de investigaccedilatildeo financiadas a abertura de dados de investigaccedilatildeo passou a ser a norma por princiacutepio Poreacutem existe a opccedilatildeo de natildeo participaccedilatildeo (Comissatildeo Europeia 2017b) tendo sido implementado o lema ldquoas open as possible as closed as necessaryrdquo (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016b8) O opt out ou as exceccedilotildees de natildeo participaccedilatildeo podem ser exercidas em caso de incompatibilidade com a obrigaccedilatildeo de proteger resultados com razotildees de seguranccedila com regras de proteccedilatildeo de dados pessoais pelo fato de o objetivo do projeto ser colocado em causa de o projeto natildeo gerar ou coletar dados e ainda outras razotildees legiacutetimas que possam ser apresentadas (Comissatildeo Europeia 2017b)

59 O GEacuteANT eacute um elemento fundamental na infraestrutura europeia fornecendo uma rede para a criaccedilatildeo de investigaccedilatildeo educaccedilatildeo inovaccedilatildeo e perfeiccedilatildeo cientiacutefica Disponiacutevel na WWW httpswwwgeantorgAbout 60 As aacutereas cientiacuteficas selecionadas satildeo Tecnologias emergentes e futuras infraestruturas de investigaccedilatildeo lideranccedila na melhoria de tecnologias industriais (tenologias de informaccedilatildeo e comunicaccedilatildeo) nano e biotecnologias seguranccedila alimentar sustentabilidade de recursos agriacutecolas marinhos e mariacutetimos ambiente e eficiecircncia de recursos sociedades inovadoras e inclusivas ciecircncia de e para a sociedade e cidades inteligentes

74

A abertura dos dados de investigaccedilatildeo criados com financiamento puacuteblico conta com o apoio dos projetos do OpenAIRE+ e do OpenAIRE-Connect visam estimular a abertura de dados funcionando ldquoas a knowledge bank and Open Access web-portalrdquo (ERAC 201667) O portal do OpenAIRE agrega em Maio de 2017 um total de 46238 conjuntos de dados sendo que Portugal contribui com 1968 datasets distribuiacutedos por quatro entidades embora o Instituto Politeacutecnico de Castelo Branco seja o fornecedor de mais de 95 dos dados

O projeto EUDAT financiado pelo H2020 visa fornecer uma infraestrutura de dados colaborativa aos investigadores europeus de qualquer disciplina cientiacutefica onde possam preservar pesquisar aceder e processar dados como parte da EUDAT Collaborative Data Infrastructure uma rede de colaboraccedilatildeo e centros de cooperaccedilatildeo O EUDAT fornece acesso a sete serviccedilos diferentes relativos agrave gestatildeo de dados (EUDAT[a]) Atraveacutes do serviccedilo B2FIND61 eacute possiacutevel pesquisar os dados armazenados atraveacutes do serviccedilo B2SHARE62 verificando-se a existecircncia de 484795 conjuntos de dados (EUDAT[b])

Vaacuterios programas de abertura de dados governamentais foram lanccedilados em diversos paiacuteses e sistemas poliacuteticos tendo-se expandido tambeacutem ao niacutevel subnacional e local sendo que estes programas compreendem diretivas regras e praacuteticas com aplicaccedilatildeo em todos ou na maior parte dos setores do governo (Dawes Vidiasova amp Parkhimovich 2016) Estas iniciativas satildeo idecircnticas numa primeira anaacutelise atraveacutes da construccedilatildeo de um portal na seleccedilatildeo de datasets semelhantes sendo que tambeacutem recorrem aos mesmos tipos de eventos como os hackathons para preparar e divulgar o lanccedilamento de programas de DGA (Davies 2014) Contudo estas iniciativas diferem no seu estado de maturaccedilatildeo estruturas poliacuteticas e as suas prioridades puacuteblicas (Davies 2014) e nos princiacutepios de abertura na quantidade e tipos de dados publicados nos metadados fornecidos e no apoio agrave reutilizaccedilatildeo de dados (Zuiderwijk amp Janssen 2014) De facto uma simples comparaccedilatildeo dos vaacuterios iacutendices de avaliaccedilatildeo permitiraacute perceber os diferentes niacuteveis de maturidade das poliacuteticas de Dados Abertos e a niacutevel europeu e mundial

Os Dados Abertos estatildeo na agenda europeia haacute mais de uma deacutecada tendo o primeiro passo sido dado em 2003 com a publicaccedilatildeo da Diretiva 200398EC sobre a reutilizaccedilatildeo da PSI (EUR-Lex 2003a) e da Diretiva 20034CE relativa ao acesso puacuteblico agrave informaccedilatildeo ambiental (EUR-Lex 2003b) Esta Diretiva aplica-se agrave reutilizaccedilatildeo dos documentos detidos pelo setor puacuteblico poreacutem natildeo obriga os estados membros a publicar dados do setor puacuteblico para estimular o mercado da informaccedilatildeo apenas os aconselha a tornar disponiacuteveis nem impotildee nenhuma obrigaccedilatildeo de autorizaccedilatildeo de reutilizaccedilatildeo dos dados (Janssen 2011) Janssen (2011) sublinha que apesar do sucesso

61 Disponiacutevel na WWW httpb2findeudateudatasetq= 62 Disponiacutevel na WWW httpsb2shareeudateu

75

da abertura dos dados governamentais ter a contribuiccedilatildeo da Diretiva Europeia as iniciativas mais bem-sucedidas referem-se a princiacutepios de transparecircncia e prestaccedilatildeo de contas e natildeo agrave Diretiva em si

A EU adotou ainda uma estrutura compreensiva para o acesso e reutilizaccedilatildeo de informaccedilatildeo geoespacial incluindo as infraestruturas eletroacutenicas atraveacutes da INSPIRE Directive63 e fomentou a disseminaccedilatildeo do patrimoacutenio cultural atraveacutes da Europeana ldquothe European digital library for cultural objectsrdquo e o acesso a informaccedilatildeo ambientalrdquo (Comissatildeo Europeia 20132)

A Diretiva 2011833EU sobre a reutilizaccedilatildeo de documentos publicados pela Comissatildeo Europeia veio autorizar salvo nas exceccedilotildees previstas a utilizaccedilatildeo comercial e natildeo comercial sem custos e sem necessidade de pedido da informaccedilatildeo produzida pela EU ou em seu nome (EUR-Lex 2011) A Diretiva estabelece as condiccedilotildees de reutilizaccedilatildeo formatos em que os documentos devem ser disponibilizados regras de custos transparecircncia e natildeo discriminaccedilatildeo

A Diretiva 201337EU veio reformular a autorizaccedilatildeo da reutilizaccedilatildeo da PSI A nova diretiva requer que a informaccedilatildeo puacuteblica seja disponibilizada ldquothrough open and machine-readable formats and together with their metadata at the best level of precision and granularity in a format that ensures interoperabilityrdquo incluindo agora entidades como bibliotecas arquivos e museus na esfera da abertura de dados (EUR-Lex 20133) Esta diretiva tornou obrigatoacuteria a disponibilizaccedilatildeo de informaccedilatildeo proveniente das entidades puacuteblicas para reutilizaccedilatildeo ao custo de reproduccedilatildeo de preferecircncia num portal e sob licenccedilas de formatos digitais O artigo 9ordm sublinha que os Estados-Membros devem fornecer instrumentos que facilitem a pesquisa de dados como inventaacuterios dos documentos com os respetivos metadados disponibilizando-os se possiacutevel em linha em formato legiacutevel por maacutequina bem como a ligaccedilatildeo entre o portal e o inventaacuterio Os objetivos passam por estimular o desenvolvimento de um mercado europeu de serviccedilos baseados na PSI melhorar o uso e aplicaccedilatildeo da PSI nos processos de negoacutecio fortalecer a competitividade no mercado interno e para resolver divergecircncias sobre regras de reutilizaccedilatildeo entre Estados Membros

De forma a promover a abertura dos seus proacuteprios dados em Junho de 2013 a EU adotou os princiacutepios do G8 Open Data Charter comprometendo-se a

Identificar e tornar disponiacuteveis os datasets fundamentais ao niacutevel da EU Identificar e tornar disponiacuteveis os datasets de alto valor ao niacutevel da EU Publicar os dados no EU Open Data Portal

63A INSPIRE Directive eacute a Diretiva 20072EC do Parlamento Europeu e do Conselho de 14 Marccedilo 2007 que veio estabelecer uma Infraestrutura para a informaccedilatildeo espacial na Comunidade Europeia Disponiacutevel na WWW httpinspireeceuropaeuinspire-legislation26

76

Aplicar os princiacutepios do G8 Open Data Charter em todos os 28 estados-membros atraveacutes da revisatildeo da Diretiva sobre a PSI e de guias de orientaccedilatildeo

Apoiar atividades consultadoria e a participaccedilatildeo Partilhar experiecircncias na aacuterea dos Dados Abertos (Comissatildeo Europeia 2013)

Em 2016 entrou em vigor o novo Regulamento Geral sobre a Proteccedilatildeo de Dados que eacute relativo ao tratamento de dados pessoais e agrave livre circulaccedilatildeo dos mesmos O regulamente veio implementar o direito de pedido de esquecimento por parte do cidadatildeo a portabilidade de dados que permite migrar dados pessoais entre sistemas ou empresas multas para os incumpridores entre outras novidades A implementaccedilatildeo do regulamento seraacute obrigatoacuteria ateacute maio de 2018 sendo as legislaccedilotildees nacionais substituiacutedas por uma regulamentaccedilatildeo europeia (EUR-Lex 2016)

A EU criou em 2012 um portal para alojar dados puacuteblicos e de investigaccedilatildeo que provecircm de organizaccedilotildees europeias ou de projetos financiados pela EU O European Union Data Portal aloja dados afetos a vinte categorias contendo 10746 datasets em Maio de 2017 com o Eurostat a assumir a lideranccedila destacada em termos de nuacutemero de datasets Os dados satildeo classificados em domiacutenios com o recurso a metadados controlados provenientes de vocabulaacuterios controlados como o EuroVoc64 com a ciecircncia (1906) emprego e condiccedilotildees de trabalho (1795) questotildees sociais (1599) a destacarem-se como os domiacutenios com mais datasets publicados Em termos de formatos de dados os primeiros trecircs lugares satildeo ocupados pelos formatos ZIP (8072) HTML (7024) e texttab-separated-values (6762) O primeiro formato estruturado o XML aparece apenas em quinto lugar com 595 ficheiros seguido do primeiro formato aberto o CSV com apenas 360 (Uniatildeo Europeia 2017) Eacute importante tecer duas consideraccedilotildees sobre os formatos dos datasets disponibilizados O formato ZIP eacute um formato de compressatildeo de documentos e natildeo um formato de documento em si portanto estes 8072 ficheiros deveratildeo ser distribuiacutedos por outros tipos de formatos Em segundo lugar verifica-se uma fraca percentagem de dados a utilizarem formatos estruturados eou abertos que permitam a ligaccedilatildeo com outros dados Este portal apresenta 2663 datasets com ligaccedilatildeo a Portugal em grande parte das categorias de Ciecircncia e do Ambiente (Uniatildeo Europeia 2017)

O Public Sector Information Scoreboard eacute uma ferramenta ldquocrowd sourcedrdquo utilizada para medir o estado da abertura de dados e da PSI da EU Este painel de avaliaccedilatildeo atraveacutes do uso de 27 indicadores mede sete aspetos da reutilizaccedilatildeo da informaccedilatildeo puacuteblica implementaccedilatildeo da Diretiva europeia referente agrave PSI praacuteticas de reuacuteso preccedilo formatos acordos exclusivos informaccedilatildeo puacuteblica local e por fim eventos e atividades (ePSI Scoreboard 2013)

64 O EuroVoc eacute um vocabulaacuterio controlado multilingue e pluridisciplinar sobre as atividades da EU Disponiacutevel na WWW httpeurovoceuropaeudrupalq=pt

77

O Open Data Monitor um projeto financiado pela Comissatildeo Europeia que decorreu entre 2013 e 2015 teve por objetivo a extraccedilatildeo harmonizaccedilatildeo mediccedilatildeo e monitorizaccedilatildeo anaacutelise e visualizaccedilatildeo automaacutetica de metadados dos datasets disponibilizados nos cataacutelogos a niacutevel regional nacional e europeu (Sasse et al 2017) Os datasets ldquoharvested from portals across Europerdquo (Sasse et al 201759) satildeo estudados atraveacutes de meacutetricas quantitativas e qualitativas (Open Data Monitor 2015) A sua plataforma permite que os utilizadores tenham uma visatildeo dos conjuntos de dados e dos 173 cataacutelogos de dados identificados apresentando os resultados em termos do nuacutemero de datasets existentes tamanho de armazenamento a sua disponibilidade a posse de uma licenccedila aberta o uso por maacutequina e por fim a exaustividade dos metadados (Open Data Monitor 2015)

O European Data Portal uma plataforma criada em 2015 pela EU tem por objetivo melhorar a acessibilidade e aumentar o valor dos Dados Abertos abrangendo toda a cadeia de valor desde a publicaccedilatildeo de dados ateacute agrave sua reutilizaccedilatildeo Para isso coleta metadados da PSI disponiacutevel em portais de dados nos paiacuteses europeus incluindo a informaccedilatildeo sobre a disponibilizaccedilatildeo de dados e os benefiacutecios de reutilizaccedilatildeo fornecendo ainda aacutereas dedicadas agrave pesquisa de datasets disponibilizaccedilatildeo de dados uso de dados treino e biblioteca de dados (Carrara et al 2016a Carrara Nieuwenhuis amp Vollers 2016 Sasse et al 2017) O European Data Portal criou o Open Data Maturity para avaliar o desenvolvimento de poliacuteticas nacionais e portais na Europa usando a informaccedilatildeo coletada para elaborar um iacutendice de maturidade das poliacuteticas de Open Data baseado na preparaccedilatildeo poliacutetica e na maturidade do portal de dados (Carrara Nieuwenhuis amp Vollers 2016) Em termos de preparaccedilatildeo poliacutetica eacute avaliada a presenccedila de uma poliacutetica de Dados Abertos especiacutefica normas de licenciamento extensatildeo da coordenaccedilatildeo a niacutevel nacional uso de dados e impacto poliacutetico social e econoacutemico A maturidade dos portais eacute avaliada de acordo com a sua usabilidade a reutilizaccedilatildeo dos dados alojados no portal e inclusatildeo de dados de diferentes domiacutenios Segundo a informaccedilatildeo apurada no relatoacuterio a maioria dos paiacuteses europeus ainda natildeo atingiram a maturidade por completo Em 2016 houve um aumento do nuacutemero de paiacuteses que completaram a sua demanda na abertura de dados sendo agora de 566 entre os 31 avaliados O nuacutemero de paiacuteses com uma poliacutetica de Dados Abertos estabelecida passou de 23 para 28 O uso de dados chegou em 2016 aos 493 e o impacto da abertura de dados aos 463 sendo que a maturidade dos portais estabeleceu-se nos 643 Contudo os paiacuteses necessitam de elevar o reconhecimento poliacutetico sobre os Dados Abertos aumentar os processos automatizados nos seus portais para aumentar a usabilidade e reutilizaccedilatildeo dos dados e tambeacutem organizar mais eventos e treinos para apoiar as iniciativas nacionais e locais (Carrara Nieuwenhuis amp Vollers 2016) O relatoacuterio conclui que os paiacuteses europeus estatildeo a enfrentar barreiras legais financeiras de qualidade de dados e de poliacuteticas sublinhando que os poliacuteticos natildeo conhecem os benefiacutecios da abertura de dados e que por isso os Dados Abertos natildeo satildeo estabelecidos como uma prioridade poliacutetica Satildeo

78

deixadas ainda algumas recomendaccedilotildees para ajudar os paiacuteses a avanccedilar no processo de abertura de dados implementar uma estrateacutegia de Dados Abertos que estimula a criaccedilatildeo de uma poliacutetica adicionar funcionalidades ao portal e melhorar a qualidade dos dados aumentar o reconhecimento sobre os Dados Abertos monitorizar as atividades relacionadas com o Open Data (Carrara Nieuwenhuis amp Vollers 2016)

22 O caso portuguecircs

O primeiro sinal de abertura cientiacutefica eacute dado pelo artigo 50ordm do Decreto-Lei nordm 1152013 de 7 de agosto veio regulamentar a obrigatoriedade da inclusatildeo de trabalhos acadeacutemicos no RCAAP sendo posteriormente reforccedilado com a entrada em vigor da Portaria nordm 2852015 de 15 de setembro que aprova o Regulamento Teacutecnico de Depoacutesito de Teses e Trabalhos de Doutoramento e de Dissertaccedilotildees e Trabalhos de Mestrado Os Dados Abertos entram finalmente na poliacutetica cientiacutefica portuguesa em 2014 A FCT definiu e adotou uma poliacutetica que visa encorajar e promover a disponibilizaccedilatildeo em ldquobases de dados de AA apropriadasrdquo dos dados cientiacuteficos e outros materiais de investigaccedilatildeo criados em projetos financiados pela instituiccedilatildeo (Fundaccedilatildeo para a Ciecircncia e Tecnologia [FCT] 2014) Contudo a poliacutetica da FCT ldquonatildeo estaacute alinhada com os requisitos relativamente aos dados de investigaccedilatildeo do H2020rdquo (Comissatildeo Executiva GT-PNCA 2016)

Os princiacutepios orientadores para uma poliacutetica nacional de Ciecircncia Aberta definidos em fevereiro de 2016 pelo Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior delinearam algumas metas a curto-prazo sendo que na componente dos Dados Abertos apenas se regista a sensibilizaccedilatildeo para a importacircncia da partilha de dados ldquocomo um valor essencial agrave ciecircncia especialmente no que respeita agrave investigaccedilatildeo beneficiaacuteria de financiamento puacuteblicordquo (Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior [MCTES] 20163) Foram tambeacutem definidas metas a atingir ateacute 2018 dentro das quais se destacam as que se referem a dados de investigaccedilatildeo

ldquoCumprimento a 100 da publicaccedilatildeo de dados resultantes de projetos com financiamento puacuteblico num repositoacuterio em acesso abertordquo

Incluir ldquoa verificaccedilatildeo contiacutenua da publicaccedilatildeo de dados e de resultados da investigaccedilatildeo financiada com fundos puacuteblicosrdquo nos modelos de avaliaccedilatildeo da CA

Eliminar o ldquoduplo financiamento de publicaccedilotildeesdados em acesso abertordquo para racionalizar os custos puacuteblicos com ciecircncia

ldquoOferta regular de accedilotildees de formaccedilatildeo e esclarecimento em mateacuteria de publicaccedilatildeo de dados e resultados de investigaccedilatildeo em acesso aberto propriedade intelectual e proteccedilatildeo de dadosrdquo (Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior [MCTES] 2016 20164)

79

O acesso aos dados de investigaccedilatildeo eacute finalmente incluiacutedo na poliacutetica cientiacutefica atraveacutes da Resoluccedilatildeo do Conselho de Ministros nordm 212016 de 11 de abril No acircmbito da definiccedilatildeo de uma poliacutetica de Ciecircncia Aberta eacute incluiacuteda a obrigatoriedade do AA aos ldquodados cientiacuteficos resultantes de investigaccedilatildeo financiada por fundos puacuteblicosrdquo e sua respetiva preservaccedilatildeo ldquopor forma a permitir a sua reutilizaccedilatildeo e o acesso continuadordquo (Resoluccedilatildeo do Conselho de Ministros nordm 212016 2016)

Em dezembro de 2016 foi criado o Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta (GT-PNCA) atraveacutes do Despacho nordm 153892016 cujo objetivo se centra na elaboraccedilatildeo de uma poliacutetica nacional de CA e onde a abertura de dados de investigaccedilatildeo eacute parte integrante A Comissatildeo Executiva do GT-PNCA foi dividida em quatro conjuntos de temas acesso aberto e dados abertos infraestruturas e preservaccedilatildeo digital avaliaccedilatildeo cientiacutefica e responsabilidade social cientiacutefica (Despacho nordm 153892016 de 12 de dezembro do Ministeacuterio das Financcedilas e da Secretaria de Estado da Cultura e Ciecircncia Tecnologia e Ensino Superior 2016)

A abertura de dados cientiacuteficos estaacute ainda numa fase precoce O primeiro relatoacuterio da Comissatildeo Executiva do Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta constatou que em termos de gestatildeo e partilha de dados existem algumas iniciativas e experiecircncias de ldquoacircmbito disciplinar nomeadamente no contexto de projetosrdquo sendo expectaacutevel que o Roteiro Nacional de Infraestruturas de Investigaccedilatildeo de Interesse Estrateacutegico traga ldquoprogressos significativosrdquo (Comissatildeo Executiva GT-PNCA 20167) O mesmo relatoacuterio sublinha que ao niacutevel das instituiccedilotildees de investigaccedilatildeo e de ensino superior as iniciativas de partilha e gestatildeo de dados satildeo quase inexistentes

Em termos de dados de investigaccedilatildeo o ecossistema eacute bem mais concentrado a niacutevel disciplinar e inferior em nuacutemero de e-infraestruturas se comparado com o ecossistema de dados do setor puacuteblico Integrado no projeto RCAAP que visa a agregaccedilatildeo de conteuacutedos cientiacuteficos produzidos no paiacutes surge em 2011 o Serviccedilo de Alojamento de Repositoacuterios de Dados Cientiacuteficos65 (SARDC) uma plataforma de livre acesso que visa agregar os dados de investigaccedilatildeo de instituiccedilotildees nacionais Poreacutem com jaacute cerca de seis anos de existecircncia o SARDC apresenta apenas 2007 datasets em Maio de 2017 que correspondem a 42 categorias de assunto Os conjuntos disponibilizados satildeo provenientes de apenas duas instituiccedilotildees o Arquivo Portuguecircs de Informaccedilatildeo Social (APIS) com 37 e o Instituto Politeacutecnico de Castelo Branco (IPCB) com 1970 conjuntos de dados sendo que o SARDC apenas aloja os dados do APIS Embora exista um espaccedilo atribuiacutedo a mais duas instituiccedilotildees o Laboratoacuterio Nacional de Engenharia Civil e Universidade Catoacutelica Portuguesa nenhuma das entidades publicou ateacute agora dados atraveacutes desta plataforma O portal nacional de dados cientiacuteficos eacute extremamente limitado em termos de funcionalidades permitindo apenas a buscar

65 Disponiacutevel na WWW httpsdadosrcaappt

80

por autor data titulo assunto e tipo de documento Natildeo eacute possiacutevel perceber a legalidade da reutilizaccedilatildeo de dados pois natildeo eacute referido qualquer tipo de licenciamento A qualidade dos dados apresentados pelo SARDC eacute uma incoacutegnita pela falta de indicaccedilatildeo do uso de formatos abertos e estruturados e tambeacutem de um esquema padratildeo de metadados Aleacutem do SARDC os repositoacuterios de dados cientiacuteficos existentes em Portugal satildeo em grande parte do domiacutenio das Ciecircncias da Vida como se poderaacute constatar no Quadro 5 com exceccedilatildeo do Repositoacuterio Cientiacutefico do Instituto Politeacutecnico de Castelo Branco que tem um caraacutecter geral Depois da criaccedilatildeo do repositoacuterio de dados cientiacuteficos e da colocaccedilatildeo em massa de conjuntos de dados verifica-se que o depoacutesito de datasets decresceu de forma extrema

Graacutefico 1 Nuacutemero de datasets publicados no SARDC nos anos seguintes agrave sua criaccedilatildeo Fonte Adaptado de SARDC (2017)

A tendecircncia de abertura de dados cientiacuteficos parece estar ligada agrave cultura disciplinar Algumas disciplinas provenientes das ciecircncias naturais e das ciecircncias exatas possuem jaacute uma estrutura uniformizada de bases de dados onde a partilha e reutilizaccedilatildeo de datasets se encontra mais avanccedilada do que se verifica nas restantes disciplinas cientiacuteficas O Registry of Research Data Repositories (re3data) indexa apenas 2 repositoacuterios de dados cientiacuteficos portugueses o INTEGRALL66 e o KiMoSys67 sendo que ambos pertencem ao ramo da biologia (DataCite 2017a) O Biosharingorg (2017) indexou cinco bases de dados cientiacuteficas com origem em Portugal havendo participaccedilatildeo portuguesa em outras duas bases de dados internacionais Estas pertencem todas ao domiacutenio das Ciecircncias da Vida e da Biologia com exceccedilatildeo de uma conotada com as Ciecircncias da Terra O DataCite68 (2017b) criou um Digital Object Identifier (DOI) para 18632 datasets relacionados com o termo Portugal sendo a grande maioria de autores portugueses e provenientes da Global Biodiversity Information Facility (GBIF) tambeacutem da aacuterea da biologia A GBIF possui um noacute

66 Disponiacutevel na WWW httpintegrallbiouapt 67 Disponiacutevel na WWW httpwwwkimosysorg 68 Os dados obtidos relativamente ao DataCite Pangea e GitHub foram obtidos atraveacutes da inscriccedilatildeo do termo Portugal na caixa de pesquisa de cada repositoacuterio

13

3 1

2 1

2012 2013 2014 2015 2016 0 2 4 6 8

10 12 14

Nordm datasets

81

portuguecircs que aloja 2681051 ocorrecircncias de biodiversidade com Portugal a fornecer de 23 conjuntos de dados que correspondem a 448136 ocorrecircncias (Portal de Dados de Biodiversidade de Portugal 2016) Destaca-se ainda os 2772 datasets sobre Portugal muitos criados por autores portugueses alojados no Pangea (2017) que preserva dados relacionados com as ciecircncias da terra e do ambiente ou o GitHub (2017) que armazena 1324 registos sobre software relacionados com o termo Portugal

Portugal tem um consoacutercio denominado ELIXIR Portugal69 que eacute constituiacutedo por quatro70 instituiccedilotildees de investigaccedilatildeo que satildeo parte da rede nacional de informaccedilatildeo bioloacutegica - BioDatapt71 O ELIXIR Portugal (2015) ldquoaims to provide data tools standards and training in this domain and thus contribute to build an ELIXIR framework that is of added-value to all woody plant based industriesrdquo O BioDatapt fornece acesso a duas bases de dados disciplinares uma ontologia para descrever experiecircncias bioloacutegicas baseadas em plantas 4 softwares e 5 conjuntos de dados

O interesse na abertura de dados de investigaccedilatildeo tem crescido no discurso poliacutetico e cientiacutefico verificando-se jaacute a organizaccedilatildeo de uma conferecircncia de dados de investigaccedilatildeo e CA72 em 2016 e de dois foacuteruns de gestatildeo de dados de investigaccedilatildeo73 o uacuteltimo jaacute em 2017 Estes eventos tecircm a chancela direta do MCTES em coorganizaccedilatildeo com a FCT a Universidade do Minho e FCCN embora esta uacuteltima apenas no caso da conferecircncia Foi lanccedilado na Faculdade de Engenharia da Universidade do Porto o projeto TAIL com o objetivo de otimizar o processo de gestatildeo de dados de investigaccedilatildeo desde a sua produccedilatildeo ateacute ao depoacutesito e partilha Este projeto a decorrer de 2016 ateacute 2019 ldquovai construir um portfoacutelio de exemplos de gestatildeo de dados em diversos domiacutenios que poderatildeo ser usados pelos investigadores para avaliar o esforccedilo requerido e as compensaccedilotildees a obter com esta atividaderdquo (Ribeiro et al 2016256-257) Os resultados seratildeo avaliados atraveacutes da utilizaccedilatildeo da plataforma Dendro ldquodesigned to help researchers use concepts from domain-specific ontologies to collaboratively describe and share datasets within their groupsrdquo (Universidade do Porto Faculdade de Engenharia 2017)

69 Este consoacutercio eacute o noacute portuguecircs de uma organizaccedilatildeo intergovernamental denominada ELIXIR que pretende reunir os recursos europeus relacionados com as ciecircncias da vida Os recursos incluem bases de dados software material de treino armazenamento na nuvem e supercomputadores Disponiacutevel na WWW httpswwwelixir-europeorgabout-us 70 As organizaccedilotildees envolvidas no BioDatapt satildeo Instituto Gulbenkian de Ciecircncia Universidade do Minho Instituto de Biologia Experimental e Tecnoloacutegica e o Instituto de Biotecnologia e Bioengenharia 71 O BioDatapt faz parte do Roteiro das Infraestruturas de Investigaccedilatildeo de Portugal Disponiacutevel na WWW httpswwwfctptapoiosequipamentoroteiro 72 A conferecircncia ldquoDados de investigaccedilatildeo e Ciecircncia Aberta rumo a uma estrateacutegia nacionalrdquo apresentou-se com o objetivo de ldquoestabelecer as linhas orientadoras da estrateacutegia nacional para os dados de investigaccedilatildeordquo Disponiacutevel na WWW httpsconfdadosrcaappt 73 O objetivo dos foacuteruns sobre gestatildeo de dados de investigaccedilatildeo eacute de desenvolver competecircncias teacutecnicas e capitalizar saberes e praacuteticas nos investigadores e comunidade cientiacutefica Disponiacutevel na WWW httpforumgdircaappt2forum

82

O RCAAP publicou em Abril de 2017 um documento de apoio agrave abertura e gestatildeo de dados de investigaccedilatildeo O ldquoKit de Dados de Investigaccedilatildeordquo tem por objetivo prestar apoio e informaccedilatildeo aos ldquogestores de repositoacuterios da comunidade RCAAPrdquo e fornecer ajuda semelhante a ldquoinvestigadores gestores de ciecircncia e outros parceiros envolvidos em atividades de suporte agrave gestatildeo de dados de investigaccedilatildeordquo (Carvalho Furtado Priacutencipe 20175) Este documento seraacute a base da formaccedilatildeo que o RCAAP iraacute disponibilizar fornecendo uma contextualizaccedilatildeo sobre Dados Abertos Big Data preservaccedilatildeo digital e informaccedilatildeo sobre ciclos de gestatildeo de dados planos de gestatildeo de dados direitos de autor licenciamento e privacidade de dados poliacuteticas e diretrizes de abertura de dados de investigaccedilatildeo recursos de apoio e aplicaccedilatildeo nos recursos RCAAP

Os dados do setor puacuteblico tecircm uma contextualizaccedilatildeo legislativa diferenciada daquela que eacute aplicada aos dados de investigaccedilatildeo O direito ao acesso agrave informaccedilatildeo puacuteblica em Portugal foi estabelecido pelo artigo 268ordm da Constituiccedilatildeo de 1976 Poreacutem apenas em 1993 o estado portuguecircs legislou no sentido da abertura dos documentos administrativos com a publicaccedilatildeo da Lei nordm 6593 de 26 de Agosto a Lei do Acesso aos Documentos Administrativos (LADA) posteriormente alterada pelas leis nordm 895 de 29 de Marccedilo e 9499 de 16 de Julho

A evoluccedilatildeo da conjuntura de acesso aos documentos administrativos eacute derivada da imposiccedilatildeo das Diretivas Europeias a que Portugal como membro da EU estaacute obrigado A Lei 462007 de 24 de Agosto viraacute revogar da Lei nordm 6593 e as suas alteraccedilotildees ldquotranspondo para a ordem juriacutedica nacional a Diretiva nordm 200398CE do Parlamento e do Conselho de 17 de Novembro relativa agrave reutilizaccedilatildeo de informaccedilotildees do sector puacuteblicordquo O artigo 24ordm postula a obrigaccedilatildeo das entidades puacuteblicas em publicar documentos administrativos de forma eletroacutenica para que possam ser acedidos e reutilizados O artigo 27ordm nordm 1 vem criar a Comissatildeo de Aceso aos Documentos Administrativos (CADA) ldquouma entidade administrativa independente que funciona junto da Assembleia da Repuacuteblica e tem como fim zelar nos termos da Lei pelo cumprimento das disposiccedilotildees legais referentes ao acesso agrave informaccedilatildeo administrativardquo (Comissatildeo de Acesso aos Documentos Administrativos [CADA])

A Resoluccedilatildeo do Conselho de Ministros nordm 912010 (20105296) veio implementar a Agenda Digital 2015 O ponto 23 da Resoluccedilatildeo no acircmbito da transparecircncia na administraccedilatildeo puacuteblica tinha como objetivo ldquodesenvolver um programa de administraccedilatildeo aberta para a publicaccedilatildeo e agregaccedilatildeo em formatos reutilizaacuteveis da informaccedilatildeo produzida pela Administraccedilatildeo Puacuteblicardquo Eacute neste sentido que eacute proposta a criaccedilatildeo do siacutetio web dadosgovpt ldquopara publicar e agregar a informaccedilatildeo produzida pela Administraccedilatildeo Puacuteblica em formatos que possam ser lidos e reutilizados por qualquer cidadatildeordquo Esta medida teve o intuito de ldquofacilitar o acesso dos cidadatildeos e empresas agrave informaccedilatildeo relevante sobre os serviccedilos puacuteblicos com o desenvolvimento de novas aplicaccedilotildees com valor acrescentadordquo A Lei nordm 362011 de 21 de Junho veio

83

estabelecer a implementaccedilatildeo de normas abertas nos sistemas informaacuteticos do Estado contribuindo assim para a adoccedilatildeo de formatos de dados abertos

Em 2016 a Lei nordm 262016 de 22 de Agosto revogou a Lei 462007 de 24 de Agosto aprovando ldquoo regime de acesso agrave informaccedilatildeo administrativa e ambiental e de reutilizaccedilatildeo dos documentos administrativos transpondo a Diretiva 20034CE do Parlamento Europeu e do Conselho de 28 de janeiro e a Diretiva 200398CE do Parlamento Europeu e do Conselho de 17 de novembrordquo O artigo 3ordm mandata a abertura dos dados ambientais agrave comunidade incluindo-os na definiccedilatildeo de documento administrativo devendo a sua publicaccedilatildeo ser feita num formato aberto e legiacutevel por maacutequina O artigo 10ordm sobre a divulgaccedilatildeo ativa de informaccedilatildeo prevecirc que sejam publicados ldquoos documentos administrativos dados ou listas que os inventariem que entendam disponibilizar livremente para acesso e reutilizaccedilatildeo nos termos da presente lei sem prejuiacutezo do regime legal de proteccedilatildeo de dados pessoaisrdquo Tambeacutem deve ser garantida a abertura da informaccedilatildeo cujo ldquoconhecimento seja relevante para garantir a transparecircncia da atividade relacionada com o seu funcionamentordquo sobretudo ao niacutevel de planos de atividades orccedilamentos relatoacuterios de atividades e contas balanccedilo social e outros instrumentos de gestatildeo similaresrdquo e tambeacutem de despachos normativos internos circulares e orientaccedilotildees que comportem enquadramento estrateacutegico da atividade administrativardquo (Lei nordm 262016 de 22 de Agosto 20162780) O artigo 23ordm apenas prevecirc a reutilizaccedilatildeo dos dados para fins educativos e para fins de investigaccedilatildeo e desenvolvimento deixando de lado a reutilizaccedilatildeo comercial Contudo o dadosgov atribuiu aos dados que aloja a licenccedila CC BY 30 o que natildeo impede a reutilizaccedilatildeo comercial dos dados Eacute tambeacutem impossiacutevel natildeo questionar a razatildeo de natildeo ter sido transposta a nova Diretiva 201337EU que veio revogar precisamente a Diretiva que a Lei nordm 262016 de 22 de Agosto implementa

A AMA (2016) defende que as poliacuteticas de Dados Abertos devem ldquoprivilegiar o interesse e pertinecircncia dos dados para o cidadatildeo em geral ou para setores da sociedade especiacuteficosrdquo Ao niacutevel local apenas Lisboa e Porto parecem ter definido uma poliacutetica de abertura de dados A Carta de Princiacutepios da Politica de Dados Abertos do Municiacutepio de Lisboa tem por objetivo aumentar o envolvimento dos cidadatildeos aumentar a transparecircncia e o desenvolvimento econoacutemico aleacutem da melhoria da eficiecircncia dos serviccedilos A Cacircmara Municipal de Lisboa (CML) (2016) compromete-se a atualizar ldquoanualmente a poliacutetica de disponibilizaccedilatildeo puacuteblica de dados abertos indicando quais os dados a libertar ao longo do ano e em que formatordquo A poliacutetica abrangeraacute todas as unidades orgacircnicas do municiacutepio que produzam dados sendo que a CML incentivaraacute as Juntas de Freguesia e as empresas municipais a publicarem os seus dados A publicaccedilatildeo de todos os dados eacute feita no portal do municiacutepio como ponto de acesso uacutenico estando disponiacuteveis sem qualquer pedido de registo A carta de princiacutepios sublinha que os dados devem ser atualizados legiacuteveis por maacutequina deter uma licenccedila aberta que permita a reutilizaccedilatildeo comercial e ainda respeitar as leis de

84

privacidade e seguranccedila A CML compromete-se a publicar inventaacuterios das coleccedilotildees de dados e a promover a reutilizaccedilatildeo de dados atraveacutes de iniciativas de estiacutemulo ao desenvolvimento de aplicaccedilotildees e participaccedilatildeo puacuteblica (Lisboa Cacircmara Municipal [CML] 2016)

A poliacutetica de Dados Abertos no Porto eacute enquadrada na Agenda Digital para a Europa tendo como visatildeo a ldquodisponibilizaccedilatildeo e uso de dados e informaccedilatildeo do Municiacutepio do Porto contribuindo deste modo para a competitividade do Municiacutepio do Porto e da regiatildeo para visitar para residir captar e realizar negoacutecios no mercado nacional e internacionalrdquo (Porto Cacircmara Municipal)

Utilizando a estrutura de avaliaccedilatildeo de poliacuteticas de Dados Abertos de Zuiderwijk e Janssen (2014) foi elaborado um quadro para avaliar o estado da implementaccedilatildeo da poliacutetica de Dados Abertos em Portugal e o seu impacto Os dados foram recolhidos com base na Lei nordm 262016 de 22 de Agosto na informaccedilatildeo disponiacutevel no portal de dados nacional atraveacutes de um gestor de projeto da AMA Andreacute Lapa e tambeacutem em alguma literatura

85

Quadro 3 Visatildeo geral sobre o contexto conteuacutedo e desempenho da poliacutetica de Dados Abertos em Portugal com base no esquema delineado por Zuiderwijk e Janssen (2014) Aspetos da poliacutetica de Dados Abertos Acircmbito de aplicaccedilatildeo

Conteuacutedo e ambiente da

poliacutetica

Paiacutes Portugal

Niacutevel de organizaccedilatildeo e tipo de missatildeo Poliacutetica nacional de cariz regulamentar que eacute aplicada a entidades governamentais e puacuteblicas (art 4ordm)

Motivaccedilotildees e objetivos Econoacutemica e poliacutetica via EU Facilitar o acesso e reutilizaccedilatildeo da informaccedilatildeo por parte dos cidadatildeos e garantir a transparecircncia da atividade administrativa (art 2ordm)

Lanccedilamento da plataforma de dados Lanccedilamento do portal nacional em 2011

Alocaccedilatildeo de recursos e contexto econoacutemico

Abertura alicerccedilada em duas instituiccedilotildees puacuteblicas a CADA responsaacutevel pelo cumprimento da lei e a AMA que fornece a e-infraestrutura e apoio teacutecnico Os custos de abertura de informaccedilatildeo do setor puacuteblico satildeo financiados pelo Plano Global Estrateacutegico para a racionalizaccedilatildeo de custos com as TIC na Administraccedilatildeo Puacuteblica (OECD 2015)

Legislaccedilatildeo Lei nordm 262016 de 22 de Agosto que transpotildee a Diretiva 200398CE

Contexto poliacutetico e social Cumprimento da Diretiva europeia Disponibilizaccedilatildeo de informaccedilatildeo uacutetil para o cidadatildeo

Aspetos da poliacutetica de Dados Abertos Acircmbito de aplicaccedilatildeo

Conteuacutedo da poliacutetica

Estrateacutegia e princiacutepios de abertura

Cumprimento do princiacutepio da administraccedilatildeo aberta que advoga que o acesso aos dados deve ser feito mediantes princiacutepios de igualdade da proporcionalidade da justiccedila da imparcialidade O acesso deve ser livre e universal bem como a acessibilidade a interoperabilidade a qualidade a integridade e a autenticidade dos dados publicados e ainda a sua identificaccedilatildeo e localizaccedilatildeo (art 2ordm) A publicaccedilatildeo de dados deve ser feita num formato aberto e legiacutevel por maacutequina (art 3ordm)

Medidas e instrumentos poliacuteticos Portal nacional Natildeo satildeo conhecidas meacutetricas de avaliaccedilatildeo nem multas ou recompensas

Processamento de dados antes da publicaccedilatildeo Validaccedilatildeo da integridade das tabelas Natildeo existe verificaccedilatildeo de metadados (Lapa 2017)

Quantidade de dados Abertos 802 Conjuntos de dados no portal nacional Mas a contabilidade eacute bastante mais elevada com a adiccedilatildeo dos dados alojados em outros portais puacuteblicos e privados

Temaacutetica dos Dados Abertos Diversa mas com maior incidecircncia na Economia e Financcedilas

Formas de apresentaccedilatildeo de dados Faacutecil acesso e compreensatildeo

Preccedilo do acesso Gratuito

Grupos-alvo Developers programadores jornalistas de dados investigadores acadeacutemicos administraccedilatildeo puacuteblica (central ou local) empresas e sociedade civil (Lapa 2017)

Padrotildees e formatos teacutecnicos Todos os dados no dadosgov estatildeo disponiacuteveis em pdf csv xlsx e atraveacutes de serviccedilos REST (que inclui formatos como odata JSON ou KML e RDF se aplicaacutevel) (Lapa 2017)

86

Aspetos da poliacutetica de Dados Abertos Acircmbito de aplicaccedilatildeo

Conteuacutedo da poliacutetica (cont)

Fornecimento de metadados Natildeo existe um esquema padratildeo de metadados a ser utilizado sendo que estes tambeacutem natildeo satildeo verificados antes da publicaccedilatildeo dos dados (Lapa 2017)

Tipos de dados natildeo publicados Desconhecido

Apoio teacutecnico para o uso de dados publicados Sim fornecido pela AMA mediante pedido

Promoccedilatildeo ativa da reutilizaccedilatildeo de dados A uacuteltima grande atividade de promoccedilatildeo de reutilizaccedilatildeo Government as a Developer ocorreu em 2014-2015 natildeo se conhecendo para novas atividades previstas (Lapa 2017)

Qualidade dos Dados A uacuteltima mediccedilatildeo data de 2014 onde foram encontrados alguns problemas que natildeo foram totalmente resolvidos junto dos fornecedores (Lapa 2017)

Licenciamento Eacute aplicada a licenccedila CC BY 30 a todos os datasets

Disponibilidade dos dados sem registo Todos os dados no dadosgov estatildeo disponiacuteveis para download sem necessidade de pedido ou registo

Estrutura da relaccedilatildeo entre fornecedores de dados e os utilizadores Limitada

Aspetos da poliacutetica de Dados Abertos Acircmbito de aplicaccedilatildeo

Indicadores de

desempenho

Uso de dados publicados Existem 2 aplicaccedilotildees elaboradas a partir de Dados Abertos disponibilizados pela AMA e Direcccedilatildeo-Geral das Autarquias Locais

Riscos da publicaccedilatildeo de dados Privacidade seguranccedila maacute utilizaccedilatildeo (ainda sem casos reportados) (Lapa 2017)

Benefiacutecios da publicaccedilatildeo de dados Fraco impacto poliacutetico econoacutemico e social segundo o Open Data Barometer O estudo de Gomes e Soares (2014) conclui que a transparecircncia eacute o uacutenico benefiacutecio real

Valor puacuteblico alcanccedilado

Transparecircncia governativa e disponibilidade de dados Faltam indicadores de reutilizaccedilatildeo e estudos de impacto para uma avaliaccedilatildeo concreta do valor alcanccedilado

Fonte Elaboraccedilatildeo proacutepria

87

Em adiccedilatildeo agraves poliacuteticas de abertura de dados puacuteblicos um dos componentes principais do ecossistema de Dados Abertos eacute o desenvolvimento de e-infraestruturas que possam alojar e permitir a livre reutilizaccedilatildeo de dados O PORDATA criado em 2010 foi o primeiro portal de dados abertos em Portugal disponibilizando dados estatiacutesticos sobre os municiacutepios portugueses sobre o paiacutes e sobre a Europa A niacutevel puacuteblico a abertura de dados em Portugal iniciou-se com a abertura do portal de dados puacuteblicos e do portal de dados de investigaccedilatildeo Criado em 2011 depois da sua aprovaccedilatildeo poliacutetica o dadosgov eacute uma responsabilidade da AMA (2016a31) e ldquoeacute o ponto central na estrateacutegia nacional de Dados Abertos constituindo-se como a porta central de acesso online ao repositoacuterio de dados abertos disponibilizados pelas vaacuterias instituiccedilotildeesrdquo puacuteblicas em Portugal Em termos estrateacutegicos o gestor de projeto Andreacute Lapa declara que a AMA jaacute assumiu a necessidade do estabelecimento de uma relaccedilatildeo forte entre portal central e portais sectoriais regionais e locais sendo que a funccedilatildeo do dadosgov deve passar por alojar dados e por apontar para dados existentes noutros portais embora esta uacuteltima ainda natildeo tenha sido implementada (A Lapa comunicaccedilatildeo pessoal 2017) Eacute possiacutevel retirar algumas conclusotildees estatiacutesticas sobre os dados disponibilizados no dadosgov Os 802 conjuntos de dados existentes pertencem a 26 fornecedores de dados diferenciados embora os dados sejam maioritariamente publicados por apenas alguns dos fornecedores com o Instituto Nacional de Estatiacutestica a fornecer metade dos dados disponibilizados como se pode ver no graacutefico seguinte

Graacutefico 2 Maiores fornecedores de dados do portal nacional Fonte AMA (2016b)

Relativamente agrave tipologia dos fornecedores de dados do portal nacional esta apresenta-se concentrada em dois tipos de entidade

328 51

129 20

86 13

38 6 34 5 33 5

Instituto Nacional de Estatiacutestica (INE) Agecircncia Modernizaccedilatildeo Administrativa (AMA) Portal do SNS (Aacuterea da Transparecircncia) Direcccedilatildeo-Geral das Autarquias Locais (DGAL) Fundaccedilatildeo para a Computaccedilatildeo Cientiacutefica Nacional (FCCN) Comissatildeo Nacional de Eleiccediloes (CNE)

88

Graacutefico 3 Tipologia dos fornecedores de dados do portal nacional Fonte AMA (2016b)

Em termos de categorias de dados disponibilizados verifica-se uma maior dispersatildeo embora a Economia e Financcedilas assumam 13 dos dados existentes

Graacutefico 4 Tipologia das categorias de dados do portal nacional Fonte AMA (2016b)

O ecossistema de abertura de dados tem aumentado dentro e fora do espectro poliacutetico Aleacutem do portal nacional de dados puacuteblicos um grande nuacutemero de organizaccedilotildees puacuteblicas tem criado os seus portais de dados eou tem publicado os mesmos no dadosgov Por outro lado existem vaacuterios portais de dados com origem na sociedade civil com o selo da Transparecircncia Hackday Portugal74 Organizar eventos eacute

74 Transparecircncia Hackday Portugal eacute um movimento que nasceu no Porto e rdquose define como um grupo de trabalho entusiasmado com informaccedilatildeo puacuteblica dados abertos e as interaccedilotildees possiacuteveis entre

468 59

21 3

300 38 Entidades puacuteblicas Corpos de supervisatildeo

Municipalidades

Entidades governamentais

281 36

102 13 86 11 67 9

60 8 58 7

51 6

34 4 24 3 12 2

10 1 2 0

2 0

Economia e Financcedilas

Governo Eleiccedilotildees e Assuntos Parlamentares Sauacutede

Estatiacutesticas Gerais

Educaccedilatildeo Ciecircncia e Tecnologia

Administraccedilatildeo Local

Outras

Emprego e Seguranccedila Social

Justiccedila e Tribunais

Ambiente Geografia e Ordenamento Transportes Infra-estruturas e Telecomunicaccedilotildees Agricultura e Pescas

Cultura

89

uma forma de promover o reconhecimento nacional sobre a abertura de dados entre organizaccedilotildees e cidadatildeos (Carrara Nieuwenhuis amp Vollers 2016) Em Portugal tecircm existido diversas iniciativas a este niacutevel hackathons como o Date with Data organizados pela Transparecircncia Hackday Portugal e com o apoio da Open Knowledge Portugal com o intuito de alertar informar e formar a comunidade para este novo paradigma na disponibilizaccedilatildeo da informaccedilatildeo A Open Knowledge Portugal organiza em Lisboa o Lisbon Open Data Maker Night75 tendo em 2017 decorrido a terceira ediccedilatildeo A Porto Digital estaacute a organizar um hackathon76 sobre utilizaccedilatildeo de dados abertos no desenvolvimento de novas aplicaccedilotildees que ocorreraacute em Julho de 2017

Verifica-se tambeacutem que as entidades governamentais estatildeo a apostar na criaccedilatildeo de linhas de orientaccedilatildeo para abertura e gestatildeo de dados puacuteblicos A AMA criou em 2016 um guia de Dados Abertos para apoiar a abertura dos dados puacuteblicos O guia centra-se em quatro eixos

Definiccedilatildeo de Dados Abertos e enunciaccedilatildeo dos seus benefiacutecios bem como as questotildees de privacidade

Potencial dos Dados Abertos a niacutevel econoacutemico e no aumento da transparecircncia e da participaccedilatildeo ciacutevica

Estrateacutegia de abertura que aborda o planeamento escolha de dados tipos de utilizadores dados prioritaacuterios disponibilizaccedilatildeo de dados estrateacutegias de divulgaccedilatildeo e manutenccedilatildeo de dados

Princiacutepios que possibilitem a reutilizaccedilatildeo de dados como os formatos e as licenccedilas abertas aleacutem da forma de as escolher e publicar a estrutura de dados e metadados (AMA 2016a traduccedilatildeo livre)

A AMA assume a publicaccedilatildeo de dados como um compromisso com o cidadatildeo devendo a publicaccedilatildeo ser orientada por princiacutepios que potenciem a reutilizaccedilatildeo dos dados A disponibilizaccedilatildeo de dados deve abranger conjuntos de dados constantes ou sem continuidade regular e conjuntos de dados em seacuterie ou seja com continuidade temporal A relevacircncia dos dados eacute justificada quando ldquotem potencial para ser explorado por um grande nuacutemero de utilizadores ou quando o benefiacutecio potencial da sua utilizaccedilatildeo eacute elevadordquo (AMA 2016a20)

As duas principais cidades portuguesas Lisboa e Porto tecircm abordagens distintas relativamente agraves suas estrateacutegias de abertura de dados Lisboa possui uma parceria com a AMA e disponibiliza no seu portal77 ldquodatasets sobre a cidade nas mais diversas aacutereas de modo a potenciar a sua utilizaccedilatildeo em trabalhos de investigaccedilatildeo ou no tecnologia e cidadaniardquo O Transparecircncia Hackday Portugal estaacute envolvido em vaacuterios projetos de abertura de dados entre os quais se destacam a Central de Dados e a Democratica Disponiacutevel na WWW httpwwwtransparenciahackdayorgacerca 75 Disponiacutevel na WWW httpflipsideorgnotesopen-data-maker-night-III 76 Disponiacutevel na WWW httpshackacityeuporto 77 Disponiacutevel na WWW httpdadosabertoscm-lisboapt

90

desenvolvimento de aplicaccedilotildees informaacuteticasrdquo (Soares Baptista e Lima 201517) Os dados disponibilizados no portal ldquosatildeo produzidos no acircmbito de sistemas de informaccedilatildeordquo que pertencem a diversos organismos registando-se jaacute diversas aplicaccedilotildees78 que utilizam esses dados para criar valor para o cidadatildeo e visitante de Lisboa na aacuterea do turismo ambiente urbanismo (Soares Baptista e Lima 201518) Lisboa implementou tambeacutem o programa Smart Open Lisboa que visa dar apoio a start ups na validaccedilatildeo de ldquosolutions using real data in a live environment and work directly with your potential customers or partnersrdquo O apoio eacute dirigido a soluccedilotildees na aacuterea da mobilidade envolvimento dos cidadatildeos turismo cultura e sustentabilidade (Lisboa Cacircmara Municipal 2016) A estrateacutegia do Porto passa pela promoccedilatildeo de conjuntos de Application Programming Interface (API)79 permitindo a disponibilizaccedilatildeo de alguns serviccedilos na web como a disponibilizaccedilatildeo de ldquoconteuacutedos dos Portal de Turismordquo ou do BDRT80 entre outros que indica pontos de interesse na cidade A abertura de dados eacute centrada na ldquodimensatildeo turismo e negligencia pelo menos aparentemente as restantesrdquo (Soares Baptista e Lima 201518) Esta conclusatildeo pode ser reforccedilada com a anaacutelise do portal de dados do Porto onde apenas constam cinco conjuntos de dados sendo estes pertencentes ao turismo ou relacionados numa perspetiva de visita ou mudanccedila como enuncia a estrateacutegia de abertura de dados publicada pelo municiacutepio

O Porto Lisboa Fundatildeo Palmela Penela e Aacutegueda estatildeo entre as cidades que integram o Open and Agile Smart Cities (OASC) (2017) uma iniciativa com o objetivo de desenvolver mercados para as cidades inteligentes baseados nas necessidades das cidades e das comunidades O Porto eacute destaque nesta iniciativa pela utilizaccedilatildeo da tecnologia FIWARE81 que ajuda a melhorar o uso de dados abertos e a partilha conhecimentos e tecnologias entre cidades A FIWARE (2015) sintetizou o impacto da abertura de dados em tempo real no Porto ldquoImagine walking or driving through a city and the city itself tells you which trendy spots to check out where to park your car in that moment or which areas to avoid because of air quality or traffic congestionrdquo Na realidade a cidade do Porto jaacute consegue comunicar com os residentes turistas ou empresas que utilizem ldquoFIWARE standards and the UrbanSense platform82rdquo

A publicaccedilatildeo de Dados Abertos e a respetiva mediccedilatildeo de impacto podem ser avaliadas atraveacutes das vaacuterias iniciativas que visam medir o estado de abertura de dados 78 As aplicaccedilotildees referidas satildeo SPOT in Lisbon Lisboa Verde Lisboa NAV e Lisboa 360 79 De acordo com a Wikipeacutedia uma API eacute um conjunto de definiccedilotildees protocolos e ferramentas para construir aplicaccedilotildees de software Disponiacutevel em httpsenwikipediaorgwikiApplication_programming_interface 80 Disponiacutevel na WWW httpbdrtcm-portoptpt 81 A missatildeo da FIWARE eacute construir um ldquosustainable ecosystem around public royalty-free and implementation-driven software platform standards that will ease the development of new Smart Applications in multiple sectorsrdquo Disponiacutevel na WWW httpswwwfiwareorgabout-us 82 A plataforma Urbansense estaacute integrada no projeto futurecitiesup da Universidade do Porto sendo uma plataforma para a monitorizaccedilatildeo ambiental nas cidades composta por 20 unidades que coletam dados em pontos relevantes da cidade Disponiacutevel na WWW httpfuturecitiesupptsitehybrid-sensor-networking-testbed

91

algumas das quais jaacute mencionadas permitindo assim retirar conclusotildees especiacuteficas quanto ao estado dos Dados Abertos em Portugal A anaacutelise feita por Soares Baptista e Lima (2015) sobre a abertura de dados em quatro cidades do norte do paiacutes Braga Barcelos Guimaratildees e Vila Nova de Famalicatildeo concluiu que a disponibilizaccedilatildeo de dados ao niacutevel local eacute feita apenas ao niacutevel de ldquocontratos municipais orccedilamento anual gastos resultados eleitorais qualidade do ar horaacuterios de transporte orccedilamento participativo e lista de empresasrdquo A abertura de dados destas categorias eacute feita com a ajuda da ldquoadministraccedilatildeo central e algumas instituiccedilotildees transversais ao territoacuteriordquo sendo que existem aacutereas onde nenhum dos municiacutepios analisados possuiu Dados Abertos como os ldquotransportes em tempo real instalaccedilotildees puacuteblicas estatiacutesticas criminais seguranccedila e higiene alimentar acidentes de tracircnsito permissotildees de construccedilatildeo requisiccedilotildees de serviccedilos e licenccedilas comerciaisrdquo (Soares Baptista e Lima 201522) O estudo revela ainda que as cidades analisadas tecircm a maior taxa de abertura no Open Data Census pelo facto de serem a uacutenicas onde a informaccedilatildeo estaacute completa pois os resultados obtidos no estudo foram registados no censo

O Portal da Transparecircncia Municipal eacute uma ferramenta que permite avaliar vaacuterios indicadores da governaccedilatildeo dos municiacutepios portugueses com o recurso agrave disponibilizaccedilatildeo de dados estatiacutesticos Os indicadores abordam a gestatildeo financeira e administrativa decisotildees fiscais dinacircmica econoacutemica do municiacutepio serviccedilos municipais e participaccedilatildeo eleitoral autaacuterquica (Portugal Governo 2017) Contudo a disponibilidade de dados em cada indicador natildeo eacute totalmente uniforme em termos temporais e registam-se algumas falhas de coleta ou cedecircncia de dados

O Open Data Census83 responsabilidade da OKI coleta informaccedilatildeo sobre a performance de cada paiacutes e respetivas cidades em termos de abertura de dados acessibilidade disponibilidade licenciamento processamento por maacutequina e transparecircncia Existem dados de 2014 para Portugal com um total de 178 datasets provenientes de 51 cidades distribuiacutedos por aacutereas como a qualidade do ar transportes orccedilamentos contratos puacuteblicos despesas e eleiccedilotildees sendo Braga e Guimaratildees as cidades mais abertas Contudo apenas um desses conjuntos de dados possui a totalidade da abertura desejada (OKI 2014) Para 2015 e 2016 natildeo satildeo apresentados resultados relativos agrave abertura de dados nas cidades portuguesas

O Global Open Data Index eacute um iacutendice que mede o estado de abertura dos dados governamentais ao niacutevel global Este iacutendice coleta informaccedilatildeo sobre a abertura dos dados governamentais desde 2013 ano em que Portugal se encontrava no 16ordm lugar em 60 paiacuteses com uma taxa de abertura84 calculada em 56 Em 2014 Portugal desce

83 Disponiacutevel na WWW httpcensusokfnorgenlatest 84 O Global Open Data Index considera 9 criteacuterios na sua avaliaccedilatildeo para os dados serem denominados totalmente abertos Licenccedila aberta dados em formatos que sejam processaacuteveis por maacutequinas acesso sem custos disponibilidade do dataset completa para download disponibilizaccedilatildeo de forma raacutepida e

92

para o 36ordm lugar em 97 paiacuteses registando uma taxa de abertura para 47 Em 2015 nova descida do paiacutes no ranking ateacute ao 54ordm lugar num total de 122 paiacuteses com uma taxa de abertura estimada em 34 Para o ano de 2016 as categorias das estatiacutesticas nacionais limites administrativos e aquisiccedilotildees possuem a taxa de abertura mais elevada apenas indicando como falha o licenciamento mas que implica que nenhum dos datasets seja verdadeiramente aberto A taxa de abertura calculada situa-se agora nos 37 com Portugal a subir para 46ordm lugar (OKI 2017)

O Public Sector Information Scoreboard coloca Portugal em 25ordm lugar num total de 31 paiacuteses pontuados sendo alguns destes resultados obtidos com base na LADA cuja uacuteltima revisatildeo data de 1999 Este painel de avaliaccedilatildeo destaca pela positiva as praacuteticas de reutilizaccedilatildeo os formatos os acordos exclusivos e os eventos e atividades Pela negativa destaca a publicaccedilatildeo de informaccedilatildeo puacuteblica local a natildeo implementaccedilatildeo da Diretiva europeia (ePSI Scoreboard 2013) o que natildeo corresponde agrave realidade pois a Lei nordm 462007 de 24 de agosto entretanto revogada pela Lei nordm 262016 de 22 de agosto transpocircs para a ordem juriacutedica nacional a Diretiva nordm 200398CE

O Open Data Barometer coloca Portugal em 2016 no 34ordm lugar do ranking entre 92 paiacuteses caindo trecircs posiccedilotildees relativamente a 2015 Destaca-se pela positiva a prontidatildeo da publicaccedilatildeo de dados com 58 e pela negativa o impacto poliacutetico econoacutemico e social da abertura com apenas 16 com uma meacutedia total de 42 de abertura Eacute assinalada a maior abertura de dados geograacuteficos censos transportes puacuteblicos comeacutercio internacional desempenho do setor da sauacutede estatiacutesticas sobre educaccedilatildeo crimes ambiente e informaccedilatildeo sobre contratos puacuteblicos No sentido oposto a posse de terras informaccedilatildeo orccedilamental e gastos governamentais o registo de empresas legislaccedilatildeo e resultados de eleiccedilotildees satildeo apontados como os dados com menos abertura (World Wide Web Foundation 2017)

O Open Data Maturity divide os paiacuteses em vaacuterios segmentos liacutederes seguidores raacutepidos seguidores e iniciantes Portugal encontra-se no grupo dos seguidores o que indicia o desenvolvimento de uma poliacutetica baacutesica de Dados Abertos e um portal com funcionalidades avanccediladas O impacto da abertura de dados eacute baixo verificando-se apenas resultados positivos na transparecircncia e eficiecircncia poliacutetica Ao niacutevel social eacute denotado um baixo impacto praticamente nulo na sustentabilidade ambiental e na inclusatildeo de grupos marginalizados A niacutevel econoacutemico apenas a aplicaccedilatildeo do modelo de custo marginal para a abertura de dados merece destaque Em termos de preparaccedilatildeo para a abertura de dados Portugal desce de pontuaccedilatildeo em relaccedilatildeo a 2015 o que eacute explicado pela fase de transiccedilatildeo para uma nova estrateacutegia de Dados Abertos Jaacute a maturidade do portal nacional cresceu mais de 20 em 2016 rondando agora os 70 Segundo os dados recolhidos pelo Open Data Maturity o uso de Dados Abertos

imediata disponibilidade dos dados sem conexatildeo agrave internet disponibilizaccedilatildeo dos dados em formato digital disponibilidade puacuteblica dos dados e por fim a confirmaccedilatildeo da existecircncia dos dados

93

em 2016 em Portugal decaiu ligeiramente em relaccedilatildeo ao ano anterior rondando os 35 O estudo indica que o paiacutes natildeo tem uma poliacutetica de Dados Abertos e que apenas vai transpor a Diretiva europeia em 2016 apesar de jaacute o ter feito na Lei nordm 462007 de 24 de agosto sendo mencionado que a estrateacutegia a 5 anos estaacute a ser revista (Carrara Nieuwenhuis amp Vollers 2016) O Open Data Maturity aponta diversas barreiras em termos de publicaccedilatildeo de dados como a falta de apoio politico para a abertura de dados valiosos e relevantes a falta de recursos humanos teacutecnicos e financeiros e falta de conhecimentos relativos a padrotildees e boas praacuteticas de partilha de dados puacuteblicos O relatoacuterio afirma que ldquosome countries have a policy framework that does not necessarily require them to add a specific licence per data setrdquo apontando Portugal entre outros paiacuteses como exemplo (Carrara Nieuwenhuis amp Vollers 201624) Contudo a consulta dos avisos legais do portal dadosgov indica que todos os conjuntos de dados disponibilizados possuem uma licenccedila aberta Creative Commons Atribuiccedilatildeo 30 Portugal (CC-BY) (AMA 2016b)

O projeto Open Data Inventory (ODIN) monitoriza o progresso das poliacuteticas de abertura dos dados puacuteblicos medindo o seu sucesso e impacto e fornece suporte agrave implementaccedilatildeo de sistemas de dados Fruto deste acompanhamento o ODIN desenvolveu um ranking global com vista a avaliar a cobertura da abertura de dados e a abertura em si De acordo com os resultados de 2016 Portugal situa-se em 15ordm lugar entre os 173 paiacuteses cujas poliacuteticas de abertura de dados puacuteblicos foram avaliadas com uma cobertura de 58 e abertura de 75 perfazendo um total calculado de 67 Este ranking foi obtido depois da avaliaccedilatildeo da abertura de estatiacutesticas sociais (62) econoacutemicas (70) e ambientais (69) retirados do siacutetio web do Instituto Nacional de Estatiacutestica (INE) (Open Data Watch 2016)

Uma iniciativa de avaliaccedilatildeo dos programas de abertura da informaccedilatildeo do setor puacuteblico da OECD (2015b) fornece informaccedilatildeo uacutetil relativa ao estado dos Dados Abertos em Portugal Segundo esta organizaccedilatildeo os custos de abertura de informaccedilatildeo do setor puacuteblico satildeo financiados como parte do Plano Global Estrateacutegico para a racionalizaccedilatildeo de custos com tecnologias de informaccedilatildeo e comunicaccedilatildeo na Administraccedilatildeo Puacuteblica A legibilidade de dados por maacutequina eacute apontada como uma falha na avaliaccedilatildeo teacutecnica da abertura embora Andreacute Lapa da AMA tenha confirmado que todos os dados existentes no portal dadosgov tecircm essa caracteriacutestica (A Lapa comunicaccedilatildeo pessoal 27 Marccedilo 2017) Os resultados satildeo muitos positivos em termos de formatos abertos com a totalidade dos dados a deter esse estatuto e tambeacutem na interoperabilidade onde a OECD indica que esta caracteriacutestica teacutecnica iraacute ser implementada como obrigatoacuteria A niacutevel de licenciamento em Portugal eacute atribuiacuteda a Licenccedila CC BY 30 agrave totalidade de dados alojados no portal nacional (OECD 2015b AMA 2016b)

Referindo-se a dados de 2015 o portal do Open Data Monitor indica que apenas foi indexado um portal de dados em Portugal com um total de 656 datasets disponiacuteveis

94

sem contudo indicar qual Em termos de resultados apurados eacute indicado que Portugal apenas cumpre no capiacutetulo da exaustividade (50) tendo os campos da disponibilidade uso por maacutequina e do licenciamento aberto com uma percentagem de 0 o que explicaraacute os 13 de qualidade global atribuiacutedos pelo Open Data Monitor

Em Maio de 2017 o cataacutelogo do European Data Portal oferece o acesso a um total 633680 datasets provenientes de 34 paiacuteses europeus Portugal ocupa o 18ordm lugar com um total de 1635 conjuntos de dados disponibilizados oriundos dos trecircs portais indexados o dadosgovpt o portal do Sistema Nacional de Informaccedilatildeo de Ambiente (SNIAmb) e o Lisboa Aberta (European Data Portal 2017) Verifica-se uma discrepacircncia entre o nuacutemero de datasets disponibilizados no cataacutelogo do European Data Portal e o nuacutemero real existente nos cataacutelogos dos portais mencionados O portal dadosgovpt apresenta 802 conjuntos de dados no cataacutelogo (AMA 2016) enquanto o European Data Portal assinala 832 datasets O SNIAmb regista um total de 1991 datasets (Agecircncia Portuguesa do Ambiente 2017) contra os 439 indexados pelo European Data Portal Apenas os nuacutemeros referentes ao portal Lisboa Aberta satildeo coincidentes com o registo de 364 conjuntos de dados (Lisboa Cacircmara Municipal 2017)

Num estudo comparativo de seis iniciativas do norte e do sul da Europa Gomes e Soares (2014) analisaram diversos indicadores relativos aos portais de dados nacionais como o cumprimento dos princiacutepios de abertura de dados governamentais o niacutevel de atividade do portal e os benefiacutecios observaacuteveis da abertura de dados Segundo este estudo o portal portuguecircs tem nota eacute positiva no cumprimento dos princiacutepios de abertura A anaacutelise da atividade do portal eacute negativa com a atividade dos visitantes o desenvolvimento de aplicaccedilotildees a atividade geradora de novo conhecimento e a utilizaccedilatildeo de recursos do portal a serem classificadas como pobres Neste indicador apenas a atividade dos fornecedores no portal eacute satisfatoacuteria Em termos de benefiacutecios observaacuteveis da abertura de dados governamentais o estudo apenas regista bons niacuteveis de transparecircncia governativa enquanto a participaccedilatildeo puacuteblica a inovaccedilatildeo e o empreendedorismo e a eficiecircncia governativas natildeo revelam impactos satisfatoacuterios

Portugal possui ainda o Iacutendice de Transparecircncia Municipal (ITM) (2016) que mede o grau de transparecircncia das Cacircmaras Municipais atraveacutes de uma anaacutelise da informaccedilatildeo disponibilizada nas suas paacuteginas web O ITM eacute composto por 76 indicadores divididos em sete dimensotildees85 contudo este iacutendice eacute baseado no tipo de dados disponibilizados e natildeo em que contexto de abertura estes foram publicados

O cruzamento da informaccedilatildeo obtida atraveacutes das vaacuterias iniciativas de avaliaccedilatildeo da abertura de dados permite inferir algumas conclusotildees e revelar algumas disparidades

85 As dimensotildees satildeo Informaccedilatildeo sobre a Organizaccedilatildeo Composiccedilatildeo Social e Funcionamento do Municiacutepio Planos e Relatoacuterios Impostos Taxas Tarifas Preccedilos e Regulamentos Relaccedilatildeo com a Sociedade Contrataccedilatildeo Puacuteblica Transparecircncia Econoacutemico-Financeira Transparecircncia na aacuterea do Urbanismo Disponiacutevel na WWW httpstransparenciaptprojetosindice-de-transparencia-municipal

95

O Open Data Barometer e o Open Data Maturity apontam o baixo impacto econoacutemico e social da abertura de dados em Portugal Gomes e Soares (2014) concluem que o problema em Portugal natildeo eacute quantidade de dados disponibilizados mas sim a quantidade de dados que satildeo reutilizados e como satildeo reutilizados O Public Sector Information Scoreboard e o Open Data Maturity afirmam que Portugal natildeo possui uma poliacutetica de Dados Abertos o que como vimos natildeo corresponde agrave verdade Entre as vaacuterias iniciativas de avaliaccedilatildeo do estado de abertura de dados apenas trecircs publicaram informaccedilatildeo relativa a 2016

Quadro 4 Comparaccedilatildeo dos resultados de abertura de dados atribuiacutedos pelas vaacuterias iniciativas de avaliaccedilatildeo Iniciativa Ranking Taxa de Abertura

Global Open Data Index 46ordm122 Paiacuteses 37

Open Data Barometer

34ordm114 Paiacuteses 42

Open Data Inventory 15ordm173 Paiacuteses 67

Fonte Elaboraccedilatildeo proacutepria

Apesar da equivalecircncia de ranking e taxa de abertura entre duas das iniciativas eacute redundante inferir qualquer conclusatildeo dado que estas natildeo medem o mesmo nuacutemero paracircmetros nem estes coincidem na maioria dos casos O Open Data Inventory refere-se a dados avaliados apenas do portal do INE para calcular a sua taxa de abertura pelo que tambeacutem deve ser relativizado

Como pontos positivos satildeo apontados a abertura de dados de diferentes domiacutenios o fato de todos os dados disponibilizados no portal estarem num formato processaacutevel por maacutequina (Carrara Nieuwenhuis amp Vollers 2016) ao contraacuterio do que afirma a OECD (2015b) e o Open Data Inventory Apesar de a AMA natildeo deter dados concretos do impacto da reutilizaccedilatildeo de dados existentes no dadosgov existem pelo menos 2 aplicaccedilotildees Mapa do Cidadatildeo e Portal da Transparecircncia Municipal que utilizam dados do portal como fonte da informaccedilatildeo que disponibilizam (Lapa 2017) O Open Data Goldbook for Data Holders and Data Managers faz referecircncia a Portugal como um exemplo de boas praacuteticas ao niacutevel da abertura dos dados governamentais destacando a aplicaccedilatildeo moacutevel e a plataforma online86 da AMA que permite aos cidadatildeos aceder a um mapa que conteacutem a localizaccedilatildeo de todos os serviccedilos puacuteblicos (Carrara et al 2016a) A Infraestrutura de Dados Espaciais do Algarve disponibiliza atraveacutes do seu portal acesso a quatro aplicaccedilotildees87 que reutilizam Dados Abertos para fornecer informaccedilatildeo de acircmbito regional os cidadatildeos

86 Disponiacutevel na WWW httpswwwmapadocidadaopt 87 As aplicaccedilotildees satildeo ldquoSiacutetios Lugares e Ruasrdquo ldquoCarta Regional de Equipamentordquo ldquoReserva Ecoloacutegica Nacionalrdquo e ldquoPlanos Municipais de Ordenamento de Territoacuteriordquo Disponiacutevel na WWW httpidealgccdr-algptaplicacoesaspx

96

Relativamente agrave usabilidade do portal o Open Data Maturity refere que natildeo eacute possiacutevel contribuir para o portal o que parece natildeo corresponder agrave realidade Citando Andreacute Lapa da AMA organizaccedilatildeo responsaacutevel pelo portal nacional existem fornecedores com acesso direto ao backoffice e que publicam os seus dados (Lapa 2017) embora o mesmo natildeo se verifique relativamente aos cidadatildeos O Open Data Maturity avalia tambeacutem a usabilidade de dados referindo que natildeo eacute possiacutevel saber a maioria dos formatos dos ficheiros existentes no portal nacional Recorrendo agrave informaccedilatildeo disponibilizada por Lapa (2017) todos os dados no dadosgov estatildeo disponiacuteveis em pdf csv xlsx e atraveacutes de serviccedilos REST incluindo assim formatos como odata JSON ou KML e RDF se aplicaacutevel A disponibilizaccedilatildeo dos formatos enunciados garante que todos os dados que o portal disponibiliza cumprem pelo menos as 3 estrelas da classificaccedilatildeo de Tim Berners-Lee (Lapa 2017) O Open Data Maturity afirma ainda que natildeo existe uma licenccedila atribuiacuteda contudo a AMA (2016b) enuncia que todos os seus dados estatildeo disponiacuteveis com uma licenccedila CC BY 30 O portal dadosgov possui algumas funcionalidades como a disponibilizaccedilatildeo de uma API que permite efetuar consultas baacutesicas relativas ao cataacutelogo de dados e tem capacidades de coleta automatizada para o caso dos dados disponibilizados atraveacutes de web services sendo que os restantes satildeo atualizados de forma manual (Lapa 2017)

Em Maio de 2017 contabilizam-se 60 portais de dados abertos em Portugal distribuiacutedos por uma variada gama de aacutereas Foi elaborado um quadro com dados recolhidos atraveacutes desses portais para tentar identificar as e-infraestruturas que disponibilizam Dados Abertos que cumprem os requisitos inscritos na Open Definition nomeadamente em termos de licenccedila legibilidade por maacutequina esquema de metadados padratildeo e formatos abertos Todos os conjuntos de dados tecircm acesso gratuito atraveacutes da web razatildeo pela qual esse requisito natildeo foi incluiacutedo no quadro de avaliaccedilatildeo Atraveacutes deste quadro foi possiacutevel retirar algumas conclusotildees Existem apenas 11 portais de dados de investigaccedilatildeo com os restantes 49 a conter dados do setor puacuteblico Os dados estatiacutesticos satildeo os grandes dominadores do panorama nacional com 13 siacutetios web seguidos dos dados econoacutemicos com 6 Dos 60 portais analisados apenas 33 disponibilizam dados legiacuteveis por maacutequina sendo que alguns portais natildeo o fazem totalmente Apenas 16 portais indicam usar uma licenccedila aberta que permita a livre reutilizaccedilatildeo dos dados e apenas 3 fornecem a indicaccedilatildeo do padratildeo de metadados usado embora alguns dos portais pareccedilam usar um esquema proacuteprio de descriccedilatildeo de datasets Existem 17 portais que fornecem dados em formatos estruturados e 17 portais que natildeo utilizam formatos abertos ou natildeo indicam sequer o tipo de formato

97

Quadro 5 Portais de dados abertos existentes em Portugal

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Repositoacuterio de dados cientiacuteficos

RCAAP FCTFCCN Acadeacutemico 2007 IPCB ndash CC BY-NC APIS ndash CC BY 30 Sim Sem indicaccedilatildeo

IPCB ndash XLS APIS - PDF XML SAV

Repositoacuterio Cientiacutefico do Instituto Politeacutecnico de

Castelo Branco

IPCB Acadeacutemico 1970 CC BY-NC Sim Sem indicaccedilatildeo XLS

Qualidade da aacutegua da Albufeira do Roxo na

dinacircmica dos solos e das culturas agriacutecolas

Assoc Benefic do Roxo Inst

Politeacutecnico de Beja Univ Eacutevora

Agricultura Recursos Hiacutedricos

10 Sem licenccedila especiacutefica Sim ISO-19139

Metadata CSV KML Shapefile

Portal de dados da biodiversidade de Portugal

Instituto Superior de Agronomia

Biologia 23 CC BY 30 CC BY-NC 30

Sem indicaccedilatildeo

Esquema proacuteprio Sem indicaccedilatildeo

Biodatapt ELIXIR Portugal Biologia 5 Sem indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo Vaacuterios

Yeastract Inst Superior Teacutecnico - Lisboa

Ciecircncias da Vida Biologia

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

Cork Oak DB Instituto

Gulbenkian de Ciecircncia

Ciecircncias da Vida Biologia

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo HTML

Mitobreak Universidade do Porto

Ciecircncias da Vida Biologia

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

Haeckaliens Instituto

Gulbenkian de Ciecircncia

Ciecircncias da Vida Biologia

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Vaacuterios

Integrall Univ Aveiro Ciecircncias da Vida Biologia 8843 Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

Kymosys INESC-ID Lisboa Ciecircncias da Vida Biologia 42 CC BY 40 Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

98

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Geodados CM Lisboa Informaccedilatildeo Geograacutefica 257 PDDL Sim Esquema

proacuteprio CSV KLM

iGEO APA DGTerritoacuterio Informaccedilatildeo Geograacutefica 99 Sem indicaccedilatildeo Sem

indicaccedilatildeo Esquema proacuteprio HTML

IDEAlg CCDR Algarve Informaccedilatildeo Geograacutefica

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Sem indicaccedilatildeo

Mapa de Obras ndash Portal do Muniacutecipe De Vila do Bispo

CM Vila do Bispo Autaacuterquico Informaccedilatildeo geograacutefica Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo Aplicaccedilatildeo web

Portal de Dados Abertos do Porto

CM Porto Autaacuterquico 5 CC BY Sim Esquema proacuteprio SHP XLS

Lisboa Aberta CM Lisboa Autaacuterquico 365 CC0 e CC BY Sim (natildeo a 100)

Esquema proacuteprio

Diversos a maioria satildeo estruturados

Dados Abertos Aacutegueda CM Aacutegueda Autaacuterquico 47 CC0 CC BY-SA e CC BY

Sim (natildeo a 100)

Esquema proacuteprio

Diversosnem todos satildeo estruturados

SNIAmb APA Ambiente 1991 Sem indicaccedilatildeo Sim Esquema proacuteprio XML

SNIRH APA Ambiente

Recursos Hiacutedricos

7210 Resultados Sem indicaccedilatildeo Sim Sem indicaccedilatildeo CSV TSV

DadosGov AMA Agregador de Dados 802 CC BY 30 Sim Esquema

proacuteprio Diversos a maioria satildeo estruturados

Dados Abertos BNP Biblioteca Nacional Bibliograacutefico 12 CC0 10 Sim UNIMARC

Dublin Core Mods

RDF XML RDF TURTLE e Dublin Core XML

Simplex + - Dados Abertos AMA Burocraacutetico

Serviccedilos Puacuteblicos

1

Sem licenccedila especiacutefica autoriza

a reproduccedilatildeo de conteuacutedos

Sim Sem indicaccedilatildeo JSON

Mapa do Cidadatildeo AMA Burocraacutetico

Serviccedilos Puacuteblicos

Informaccedilatildeo geograacutefica Sem indicaccedilatildeo Sim Sem indicaccedilatildeo Aplicaccedilatildeo web e

moacutevel

99

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Instituto Nacional de Estatiacutestica

INE Estatiacutesticas Nacionais 8340

CC BY 30 (nos dados existentes no

dadosgov) Sim Esquema

proacuteprio XLS CSV

Estatiacutesticas Cultura GEPAC Cultura Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica autoriza a reproduccedilatildeo natildeo

comercial de conteuacutedos

Natildeo Sem indicaccedilatildeo PDF

AICEP - Estatiacutesticas AICEP Comeacutercio e Investimento

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo PDF

BPStat Banco de Portugal Economia Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sem

indicaccedilatildeo Esquema proacuteprio Sem indicaccedilatildeo

Portugal Economy Probe Vaacuterios Economia Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim (natildeo a

100) Sem indicaccedilatildeo PDF XLS

Estatiacutesticas Economia GEE Economia Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica autoriza a coacutepia mediante citaccedilatildeo da fonte

Sim Sem indicaccedilatildeo XLXS

Portal de Transparecircncia Municipal

AMA e DGAL Economia Financcedilas

Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica indica

que a coacutepia importaccedilatildeo ou

utilizaccedilatildeo satildeo graacutetis

Sim Sem indicaccedilatildeo XML CSV

Base INCI Economia Compras Puacuteblicas

766326 Resultados

CC BY 30 (nos dados existentes no

dadosgov) Natildeo Esquema

proacuteprio HTML PDF

Estatiacutesticas Empresariais MJ Estatiacutesticas Empresariais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim Sem indicaccedilatildeo PDF XLS

100

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

PORDATA

Fundaccedilatildeo Manuel dos Santos

Estatiacutesticas Nacionais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim Esquema

proacuteprio HTML PDF XLS

PORDATA Kids

Fundaccedilatildeo Manuel dos Santos

Estatiacutesticas Nacionais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim Esquema

proacuteprio HTML PDF XLS

CCDR-N - Indicadores Regionais

CCDR Norte Estatiacutesticas Regionais 8 Sem indicaccedilatildeo Sim Sem indicaccedilatildeo XLS

Observatoacuterio DR CCDR Alentejo Estatiacutesticas Regionais

Sem indicaccedilatildeo Sem indicaccedilatildeo Sem

indicaccedilatildeo Sem indicaccedilatildeo PDF XLS

Datacentro CCDR-Centro Estatiacutesticas Regionais

Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica autoriza a reproduccedilatildeo natildeo

comercial de conteuacutedos desde que identifique a

fonte

Natildeo Sem indicaccedilatildeo HTML

Estatiacutesticas dos Accedilores

Governo dos Accedilores

Estatiacutesticas Regionais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Esquema

proacuteprio HTML PDF

Estatiacutesticas da Madeira

Governo da Madeira

Estatiacutesticas Regionais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sem

indicaccedilatildeo Esquema

usado pelo INE PDF XLS

Quarenta anos de Abstenccedilatildeo

Transparecircncia Hackday Portugal Open Knowledge

Portugal

Estatiacutesticas Poliacuteticas

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo HTML

Central de dados

Transparecircncia Hackday Portugal

Estatiacutesticas Poliacuteticas e

Sociais 9 PDDL Sim Esquema

proacuteprio CSV JSON

Um Paiacutes como noacutes UBI U Aveiro Estatiacutesticas Sociais

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo Aplicaccedilatildeo web

Dados e estatiacutesticas de cursos superiores

MEC Educaccedilatildeo Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim (natildeo a

100) Sem indicaccedilatildeo HTML XLXS ODS

101

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Estatiacutesticas Educaccedilatildeo e Ciecircncia

DGEEC Educaccedilatildeo e Ciecircncia

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim (natildeo a

100) Sem indicaccedilatildeo PDF XLXS ODS

Estatiacutesticas Justiccedila DGPJ-MJ Justiccedila Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Sim (natildeo a

100) Sem indicaccedilatildeo HTML PDF XLS

Sistema de informaccedilatildeo dos certificados de oacutebitos

M Sauacutede Oacutebitos Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo HTML

Serviccedilo Nacional de Sauacutede SNS Sauacutede 126 Sem indicaccedilatildeo Sim Esquema proacuteprio Vaacuterios

Estatiacutesticas Sauacutede DGS Sauacutede Sem indicaccedilatildeo Sem indicaccedilatildeo Sim Sem indicaccedilatildeo PDF CSV

Dashboard da Sauacutede DGS Sauacutede Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo HTML

Relatoacuterios Sinistralidade ANSR Seguranccedila Rodoviaacuteria

Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo PDF

Portal Opiniatildeo Puacuteblica

Fundaccedilatildeo Francisco Manuel dos Santos

Sondagens Opiniatildeo

Informaccedilatildeo estatiacutestica

Sem licenccedila especiacutefica autoriza a reproduccedilatildeo natildeo

comercial de conteuacutedos desde que identifique a

fonte

Sim Sem indicaccedilatildeo HTML PDF XLS

Estatiacutesticas SegSocial ISS Seg Social Informaccedilatildeo estatiacutestica Sem indicaccedilatildeo Natildeo Sem indicaccedilatildeo HTML PDF

O Preccedilo Certo em Votos

Transparecircncia Hackday Portugal Open Knowledge

Portugal

Estatiacutesticas Poliacuteticas

Informaccedilatildeo estatiacutestica

General Public License v20

Sem indicaccedilatildeo Sem indicaccedilatildeo HTML

Arquivo Portuguecircs de Informaccedilatildeo Social

APIS Informaccedilatildeo social 37 CC BY 30 Sim Padratildeo do DDI PDF XML SAV

102

Portal Responsabilidade Acircmbito Total de datasets Licenccedila Legib p

maacuteq Metadados Formatos

Mila

Transparecircncia Hackday Portugal Aplicaccedilatildeo 78

Resultados Sem indicaccedilatildeo Sim Sem indicaccedilatildeo Aplicaccedilatildeo web

GeoDevolutas

Transparecircncia Hackday Portugal Aplicaccedilatildeo 250

Resultados Sem indicaccedilatildeo Sim Sem indicaccedilatildeo Aplicaccedilatildeo web

(tambeacutem disponiacutevel em CSV)

Open Food Facts

Open Food Facts - Portugal Aplicaccedilatildeo

Informaccedilatildeo estatiacutestica

e descritiva CC BY 40 Sim Sem indicaccedilatildeo Aplicaccedilatildeo web e

moacutevel

Invasatildeo dos hamburgueres

Transparecircncia Hackday Portugal Aplicaccedilatildeo Informaccedilatildeo

geograacutefica Sem indicaccedilatildeo Sim Sem indicaccedilatildeo

Aplicaccedilatildeo web (tambeacutem disponiacutevel em PDF CSV ODS

XLXS TSV)

103

Conclusatildeo

O conhecimento eacute inseparaacutevel do progresso cientiacutefico do processo de decisatildeo da inovaccedilatildeo e do bem-estar social Apesar de natildeo ser objetivo principal deste estudo natildeo deixaacutemos de constatar que o ecossistema portuguecircs de AA parece estar a amadurecer Aleacutem do RCAAP existem largas dezenas de repositoacuterios pertencentes a universidades e institutos de investigaccedilatildeo alguns incluiacutedos no ranking Top Portals O ROARMAP lista 21 poliacuteticas de AA por via verde em instituiccedilotildees do ensino superior o DOAJ (2017) indexa 78 revistas de AA com 91 a publicarem sob uma licenccedila CC que permite a sua livre reutilizaccedilatildeo O SHERPARoMEO listou 127 poliacuteticas editoriais de AA em Portugal sendo que mais de metade autoriza a publicaccedilatildeo em AA do posprint ou da versatildeo final do editor Nota ainda para a existecircncia de uma poliacutetica de AA da FCT por via do artigo 292 do acordo de financiamento que mandata a abertura de todos as publicaccedilotildees cientiacuteficas produzidos sob financiamento do programa H2020 Contudo os parcos resultados obtidos atraveacutes da literatura explorada natildeo permitem inferir a dimensatildeo cultural da implementaccedilatildeo do AA em Portugal

A plena implementaccedilatildeo do conceito de CA em Portugal parece ainda longe da realidade O estabelecimento de uma poliacutetica de CA apenas comeccedilou a ser desenhado em fevereiro de 2016 com a publicaccedilatildeo dos principiacuteos orientadores para a ldquoCiecircncia Aberta Conhecimento para todosrdquo pelo MCTES Em Maio a Resoluccedilatildeo do Conselho de Ministros nordm 212016 definiu os princiacutepios da implementaccedilatildeo da poliacutetica de CA em Portugal estruturada em torno de quatro eixos AA e Dados Abertos Infraestruturas e preservaccedilatildeo digital Avaliaccedilatildeo cientiacutefica Responsabilidade social cientiacutefica (Comissatildeo Executiva GT-PNCA 2016)

Hoje aplicamos o termo Dados Abertos referindo-nos a dados de investigaccedilatildeo e a dados do setor puacuteblico A origem da abertura destes dois tipos de dados tem contextos muito diferenciados e independentes embora os objetivos possam ser semelhantes Os dados sempre foram essenciais em muitas aacutereas da investigaccedilatildeo e nos uacuteltimos anos tornaram-se destaque em mais aacutereas cientiacuteficas crescendo substancialmente em escala e complexidade A niacutevel mundial verifica-se uma atenccedilatildeo crescente para o fenoacutemeno da abertura de dados de investigaccedilatildeo sobretudo quando se debate a resoluccedilatildeo de problemas agrave escala global Existem tambeacutem iniciativas e organizaccedilotildees internacionais envolvidas na promoccedilatildeo da abertura de dados que procuram fomentar o desenvolvimento de sistemas e procedimentos a niacutevel internacional que assegurem o acesso sustentabilidade e interoperabilidade Muitas destas organizaccedilotildees jaacute desenvolveram princiacutepios de abertura e protocolos de dados proacuteprios formaram grupos de trabalho para a definiccedilatildeo de padrotildees de gestatildeo publicaccedilatildeo citaccedilatildeo interoperabilidade e partilha de dados ou criaram cursos de treino em gestatildeo de dados de investigaccedilatildeo para oferecer aos seus investigadores Analisando em detalhe os

104

princiacutepios propostos para a abertura dos dados de investigaccedilatildeo verifica-se que aleacutem da grande variedade de princiacutepios propostos a abertura legal e teacutecnica dos dados soacute eacute acautelada em metade das recomendaccedilotildees Destacam-se o AA aos dados e a reutilizaccedilatildeo de dados em nuacutemero de menccedilotildees Em contrapartida a citaccedilatildeo de dados a interoperabilidade o acesso sem discriminaccedilatildeo as licenccedilas e formatos abertos a modificaccedilatildeo e legibilidade por maacutequina satildeo mencionados apenas em trecircs recomendaccedilotildees tendo a seu favor o facto de terem sido incluiacutedas nas recomendaccedilotildees mais recentes Princiacutepios relevantes como a publicaccedilatildeo imediata a qualidade e a integridade dos dados surgem apenas duas vezes listados Verifica-se tambeacutem o lanccedilamento de revistas cientiacuteficas especiacuteficas para a ciecircncia orientada a dados possibilitando a publicaccedilatildeo de dados e dos artigos cientiacuteficos que os utilizam apoacutes o serviccedilo de revisatildeo por pares

Apesar do progresso a literatura examinada aponta no sentido de que a abertura a dados de investigaccedilatildeo natildeo ser ainda um comportamento comum sendo necessaacuterio uma mudanccedila cultural (Royal Society 2012 Pontika et al 2015 Science International 2015) Verificam-se trecircs fatores que parecem estar a atrasar esta mudanccedila no comportamento dos investigadores

a) A OKI (2012b) coloca os dados de investigaccedilatildeo ao mesmo niacutevel de importacircncia que outros tipos de dados como os dados culturais financeiros estatiacutesticos ambientais e ainda sobre o clima e transportes sem lhes atribuir qualquer destaque ou importacircncia especial

b) A avaliaccedilatildeo e revisatildeo por pares dos dados natildeo tecircm a mesma qualidade quando comparada com as publicaccedilotildees tradicionais dado a publicaccedilatildeo de dados natildeo ser ainda uma praacutetica comum (ERAC 2016)

c) Hahnel e Hook (2016) apontam a falha na atribuiccedilatildeo de incentivos e recompensas tangiacuteveis aos investigadores pelas suas contribuiccedilotildees A publicaccedilatildeo de dados de forma aberta envolve tarefas que consomem muito tempo aos investigadores como a mudanccedila do formato dos dados manter a informaccedilatildeo atualizada alinhar os dados com as licenccedilas existentes e com os criteacuterios de publicaccedilatildeo de informaccedilatildeo sensiacutevel (Reitano 2013)

O debate sobre a abertura dos dados governamentais tem mais de uma deacutecada Diversas iniciativas e organizaccedilotildees internacionais tecircm promovido princiacutepios de abertura de dados do setor puacuteblico como a OKI (2012a) que identificou as componentes chave da abertura de dados puacuteblicos disponibilidade e acesso reutilizaccedilatildeo e redistribuiccedilatildeo participaccedilatildeo universal Foram analisados princiacutepios de abertura de dados puacuteblicos de nove organizaccedilotildees e tal como em relaccedilatildeo aos dados de investigaccedilatildeo verifica-se uma grande variedade de princiacutepios propostos Embora se registe uma melhoria significativa na abertura legal e teacutecnica relativamente aos dados de investigaccedilatildeo tambeacutem os princiacutepios propostos para os dados puacuteblicos natildeo abarcam

105

a totalidade desta dupla abertura O acesso a publicaccedilatildeo imediata a reutilizaccedilatildeo e a disponibilizaccedilatildeo de dados de forma completa sem discriminaccedilatildeo e de forma a serem processados por maacutequina satildeo os princiacutepios que reuacutenem mais consenso entre as recomendaccedilotildees analisadas As licenccedilas abertas a comparabilidade de dados os formatos abertos a disponibilidade a abertura por defeito de dados a interoperabilidade publicaccedilatildeo de metadados e a gestatildeo de dados apoacutes a sua publicaccedilatildeo satildeo mencionados em menos de metade das recomendaccedilotildees analisadas apesar de ser indiscutiacutevel a sua importacircncia no processo de abertura de dados

A abertura dos dados governamentais enfrenta restriccedilotildees complexas a niacutevel institucional da complexidade da tarefa uso e participaccedilatildeo legislaccedilatildeo qualidade da informaccedilatildeo e questotildees teacutecnicas (Janssen Charalabidis e Zuiderwijk 2012) Os governos devem modificar as praacuteticas e procedimentos internos de gestatildeo de informaccedilatildeo pois a reutilizaccedilatildeo da informaccedilatildeo estaacute dependente da forma como eacute gerida e publicada (Reitano 2013) A OECD (2015a) declara que estes dados continuam muitas vezes inacessiacuteveis quer em termos de acesso quer em termos de custo Satildeo apontados alguns entraves agrave sua publicaccedilatildeo derivados de questotildees culturais (Carrara et al 2016a) restriccedilotildees teacutecnicas e financeiras (Ubaldi 2013 Carrara et al 2016a) sendo necessaacuterio enfrentar desafios relacionados com poliacuteticas tecnologias financcedilas organizaccedilatildeo e cultura para criar um ecossistema e construir um modelo de negoacutecios sustentaacutevel para as iniciativas de DGA (Ubaldi 2013 traduccedilatildeo livre) Por outro lado devem ser fornecidos aos cidadatildeos os conhecimentos e habilidades necessaacuterias para interpretar a vasta gama de conjuntos de dados e gerar valor a partir desses dados (Janssen 2012 Koski 2015)

O impacto da abertura dos dados governamentais pode ser medido em trecircs dimensotildees econoacutemica poliacutetica e social (Granicas 2013 Koski 2015) Koski (20153) defende ser necessaacuterio desenvolver um modelo de avaliaccedilatildeo e monotorizaccedilatildeo seguido da coleta sistemaacutetica de dados para medir com exatidatildeo o impacto dos Dados Abertos

A abertura de dados sem restriccedilotildees de acesso deve ser garantida por uma poliacutetica de Dados Abertos pois ldquoOpen Data is politicalrdquo (World Wide Web Foundation 201638) O fenoacutemeno dos Dados Abertos eacute tambeacutem teacutecnico e social dada a interaccedilatildeo entre o meio local politico social legal e teacutecnico e as tecnologias que produzem resultados (Davies 2014 Pasqueto Sands amp Borgman 2015) A literatura destaca a existecircncia de poliacuteticas diferenciadas para a abertura de dados governamentais e para a abertura de dados cientiacuteficos com maior enfoque poliacutetico na abertura dos dados governamentais (RECODE 2014) Em termos de dados de investigaccedilatildeo eacute possiacutevel encontrar poliacuteticas de quatro intervenientes diferentes Governo entidade financiadora que pode ser ou natildeo governamental instituiccedilotildees de investigaccedilatildeo e ainda as editoras de data journals Ao niacutevel dos dados puacuteblicos satildeo associadas poliacuteticas

106

governamentais e institucionais As poliacuteticas de dados abertos devem ainda incluir uma poliacutetica de gestatildeo de dados independentemente do cariz dos dados

As recentes poliacuteticas de Open Data pretendem disponibilizar em livre acesso os datasets da mesma forma que qualquer outra publicaccedilatildeo acadeacutemica sendo para isso necessaacuterio garantir uma infraestrutura de armazenamento acesso pesquisa e a reutilizaccedilatildeo dessa informaccedilatildeo (Rans Day Duke amp Ball 2013) Segundo a Science International (20156) ldquoeffective open data in a data-intensive age can only be realised if there is systemic action at disciplinary national and international levelsrdquo

Exige-se uma mudanccedila cultural para atingir a abertura plena dos dados de investigaccedilatildeo sendo necessaacuterio estabelecer novas formas de reconhecimento e recompensa aos esforccedilos de gestatildeo preservaccedilatildeo e curadoria de dados como forma de envolver investigadores e comunidades na abertura de dados (RECODE 2014 Internacional Science 2015) Eacute essencial que os investigadores desenvolvam competecircncias que lhes permita natildeo soacute partilhar dados com metadados adequados como tambeacutem entender e reutilizar dados de terceiros (OECD 2015a) A familiaridade com ferramentas e princiacutepios de gestatildeo de dados deve ser segundo a Royal Society (2012) parte integrante do treino dos cientistas As bibliotecas e os bibliotecaacuterios como profissionais de informaccedilatildeo multifacetados podem desempenhar um papel ativo no mundo dos Dados Abertos como facilitadores do processo de investigaccedilatildeo (RECODE 2014 Hahnel e Hook 2016 Erway et al 2016 Hernaacutendez-Peacuterez 2016)

A implementaccedilatildeo de uma poliacutetica de abertura de dados puacuteblicos deve ter em conta a definiccedilatildeo da sua aplicaccedilatildeo e os objetivos que dados iratildeo ser publicados quais as condiccedilotildees de publicaccedilatildeo de dados em que siacutetio qual a frequecircncia e qual a razatildeo da publicaccedilatildeo devendo ainda ser calculado o impacto e os benefiacutecios da abertura de dados (Carrara et al 2016a) ldquoThe culture of open data policies has to change from a culture in which opening of data is standardly consideredrdquo (Zuiderwijk amp Janssen 201427) Os governos necessitam de implementar o fenoacutemeno dos Dados Abertos como uma mudanccedila cultural assegurando que recursos humanos e materiais infraestrutura leis e poliacuteticas satildeo eficientes para a implementaccedilatildeo e extraccedilatildeo de resultados a longo prazo (World Wide Web Foundation 2016) A literatura indica algumas estruturas de avaliaccedilatildeo da abertura de dados puacuteblicos tendo o nosso enfoque recaiacutedo no modelo criado Zuiderwijk e Janssen (2014) que aborda o contexto conteuacutedo e indicadores de desempenho da poliacutetica de dados abertos para calcular o valor alcanccedilado pela abertura de dados Destaque ainda para o Open Data Barometer que revela algumas conclusotildees preocupantes a niacutevel da abertura dos dados governamentais A disponibilidade de dados que cumprem todos os princiacutepios de abertura caiu dos 10 para 7 em 2016 e a legibilidade por maacutequina tambeacutem tem tendecircncia negativa Apenas se registou uma melhoria no licenciamento de dados

107

Ao niacutevel macro a EU tem estado ativa na recomendaccedilatildeo e implementaccedilatildeo de poliacuteticas de abertura de dados de investigaccedilatildeo e governamentais Em 2015 no acircmbito da criaccedilatildeo do Mercado Digital Uacutenico propocircs a implementaccedilatildeo de uma ldquocopyright exception that would permit researchers to analyse on a large scale scientific data to which they have lawful accessrdquo (Comissatildeo Europeia 2016b) Com a ambiccedilatildeo de tornar a Europa liacuteder mundial numa economia baseada em dados a Comissatildeo Europeia (2016c) pretende ldquodisponibilizar serviccedilos baseados na computaccedilatildeo em nuvem e infraestruturas de dados de craveira mundialrdquo que forneccedilam vantagens competitivas a investigadores empresaacuterios e instituiccedilotildees puacuteblicas baseadas na utilizaccedilatildeo de grandes volumes de dados

A aposta na criaccedilatildeo de poliacuteticas de abertura de dados de acordo com os objetivos europeus relativamente agrave CA reflete-se no atual programa de financiamento da investigaccedilatildeo e inovaccedilatildeo da EU o Horizonte 2020 (H2020) Foi criado um projeto-piloto de dados abertos com o objetivo de maximizar o acesso e reutilizaccedilatildeo de dados de investigaccedilatildeo nas aacutereas cientiacuteficas selecionadas tendo sido expandido em 2017 a todas as aacutereas sob financiamento do H2020 O artigo 293 do Model Grant Agreement requer o depoacutesito num repositoacuterio de AA de todos os dados e metadados associados permitindo assim o seu acesso exploraccedilatildeo por maacutequina reproduccedilatildeo e disseminaccedilatildeo sem custos para os utilizadores Os investigadores devem tambeacutem fornecer informaccedilatildeo sobre as ferramentas e instrumentos necessaacuterios para validar os resultados e elaborar um Data Management Plan para descrever os conjuntos de dados gerados no processo de investigaccedilatildeo e como e quando seratildeo publicados A gestatildeo de dados deve ser efetuada segundo os princiacutepios FAIR tornando os dados faacuteceis de encontrar acessiacuteveis interoperaacuteveis e reutilizaacuteveis (Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo 2016c) A implementaccedilatildeo dos princiacutepios FAIR na gestatildeo e abertura de dados de investigaccedilatildeo poderaacute potenciar tambeacutem a partilha e por conseguinte a citaccedilatildeo de dados

Em termos de dados puacuteblicos a EU implementou uma nova Diretiva (201337EU) que requer que a informaccedilatildeo puacuteblica seja disponibilizada ldquothrough open and machine-readable formats and together with their metadata at the best level of precision and granularity in a format that ensures interoperabilityrdquo incluindo agora entidades como bibliotecas arquivos e museus na esfera da abertura de dados (EUR-Lex 20133) Esta diretiva tornou obrigatoacuteria a disponibilizaccedilatildeo de informaccedilatildeo proveniente das entidades puacuteblicas para reutilizaccedilatildeo ao custo de reproduccedilatildeo de preferecircncia num portal e sob licenccedilas de formatos digitais

A EU criou tambeacutem o Open Data Maturity para avaliar o desenvolvimento de poliacuteticas nacionais e portais na Europa usando a informaccedilatildeo coletada para elaborar um iacutendice de maturidade das poliacuteticas de Open Data baseado na preparaccedilatildeo poliacutetica e na maturidade do portal de dados (Carrara Nieuwenhuis amp Vollers 2016) Em termos

108

de preparaccedilatildeo poliacutetica eacute avaliada a presenccedila de uma poliacutetica de Dados Abertos especiacutefica normas de licenciamento extensatildeo da coordenaccedilatildeo a niacutevel nacional uso de dados e impacto poliacutetico social e econoacutemico A maturidade dos portais eacute avaliada de acordo com a sua usabilidade a reutilizaccedilatildeo dos dados alojados no portal e inclusatildeo de dados de diferentes domiacutenios Segundo a informaccedilatildeo apurada no relatoacuterio apesar da melhoria do nuacutemero de poliacuteticas de Dados Abertos no uso de dados e impacto da abertura de dados a maioria dos paiacuteses europeus ainda natildeo atingiu a maturidade por completo Os paiacuteses necessitam de elevar o reconhecimento poliacutetico sobre os Dados Abertos aumentar os processos automatizados nos seus portais para aumentar a usabilidade e reutilizaccedilatildeo dos dados e tambeacutem organizar mais eventos e treinos para apoiar as iniciativas nacionais e locais O relatoacuterio do Open Data Maturity conclui que os paiacuteses europeus estatildeo a enfrentar barreiras legais financeiras de qualidade de dados e de poliacuteticas sublinhando que os poliacuteticos natildeo conhecem os benefiacutecios da abertura de dados e que por isso os Dados Abertos natildeo satildeo estabelecidos como uma prioridade poliacutetica (Carrara Nieuwenhuis amp Vollers 2016)

Em Portugal as poliacuteticas de abertura de dados de investigaccedilatildeo e do setor puacuteblico apresentam estados de maturidade diferentes Apenas em 2014 foi definida uma poliacutetica de AA aos dados de investigaccedilatildeo atraveacutes da FCT enquanto entidade financiadora de investigaccedilatildeo Contudo esta poliacutetica ldquonatildeo estaacute alinhada com os requisitos relativamente aos dados de investigaccedilatildeo do H2020rdquo (Comissatildeo Executiva GT-PNCA 2016) pois apenas recomenda a abertura de dados sem no entanto mencionar onde os depositar o tipo de licenccedilas a utilizar que tipo de metadados inserir que formatos utilizar

A abertura de dados de investigaccedilatildeo em Portugal foi enquadrada no acircmbito da definiccedilatildeo de uma poliacutetica de CA tendo sido delineadas algumas metas a atingir ateacute 2018 pelo Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior (2016) publicaccedilatildeo de 100 dos dados criados com financiamento puacuteblico num repositoacuterio de AA verificaccedilatildeo contiacutenua da publicaccedilatildeo de dados eliminaccedilatildeo do duplo financiamento para colocar publicaccedilotildees e dados em AA oferta regular de formaccedilatildeo relativa a publicaccedilatildeo de dados em AA propriedade intelectual e proteccedilatildeo de dados

A Resoluccedilatildeo do Conselho de Ministros nordm 212016 de 11 de abril vem finalmente incluir o AA aos dados de investigaccedilatildeo na poliacutetica cientiacutefica No acircmbito da definiccedilatildeo de uma poliacutetica de Ciecircncia Aberta eacute incluiacuteda a obrigatoriedade do AA aos ldquodados cientiacuteficos resultantes de investigaccedilatildeo financiada por fundos puacuteblicosrdquo e sua respetiva preservaccedilatildeo ldquopor forma a permitir a sua reutilizaccedilatildeo e o acesso continuadordquo (Resoluccedilatildeo do Conselho de Ministros nordm 212016 2016) O interesse na abertura de dados de investigaccedilatildeo tem crescido no discurso poliacutetico e cientiacutefico verificando-se jaacute a organizaccedilatildeo de uma conferecircncia de dados de investigaccedilatildeo e CA em 2016 e de dois foacuteruns de gestatildeo de dados de investigaccedilatildeo o uacuteltimo jaacute em 2017

109

O primeiro relatoacuterio da Comissatildeo Executiva do Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta constatou que em termos de gestatildeo e partilha de dados existem algumas iniciativas e experiecircncias de ldquoacircmbito disciplinar nomeadamente no contexto de projetosrdquo sendo expectaacutevel que o Roteiro Nacional de Infraestruturas de Investigaccedilatildeo de Interesse Estrateacutegico traga ldquoprogressos significativosrdquo (Comissatildeo Executiva GT-PNCA 20167) O mesmo relatoacuterio sublinha que ao niacutevel das instituiccedilotildees de investigaccedilatildeo e de ensino superior as iniciativas de partilha e gestatildeo de dados satildeo quase inexistentes De facto apenas se regista a existecircncia do projeto TAIL lanccedilado na Faculdade de Engenharia da Universidade do Porto com o objetivo de otimizar o processo de gestatildeo de dados de investigaccedilatildeo desde a sua produccedilatildeo ateacute ao depoacutesito e partilha Este projeto a decorrer de 2016 ateacute 2019 ldquovai construir um portfoacutelio de exemplos de gestatildeo de dados em diversos domiacutenios que poderatildeo ser usados pelos investigadores para avaliar o esforccedilo requerido e as compensaccedilotildees a obter com esta atividaderdquo (Ribeiro et al 2016256-257) Os resultados seratildeo avaliados atraveacutes da utilizaccedilatildeo da plataforma Dendro ldquodesigned to help researchers use concepts from domain-specific ontologies to collaboratively describe and share datasets within their groupsrdquo (Universidade do Porto Faculdade de Engenharia 2017)

O ecossistema dos dados de investigaccedilatildeo em Portugal eacute concentrado a niacutevel disciplinar e inferior em nuacutemero de e-infraestruturas relativamente aos dados puacuteblicos Regista-se a existecircncia do SARDC com jaacute cerca de seis anos de existecircncia e que apresenta apenas 2007 datasets em maio de 2017 Depois da sua criaccedilatildeo e da colocaccedilatildeo em massa de conjuntos de dados verifica-se que o depoacutesito de datasets decresceu de forma extrema Os conjuntos disponibilizados satildeo provenientes de apenas duas instituiccedilotildees o APIS com 37 e o IPCB com 1970 conjuntos de dados Embora exista um espaccedilo atribuiacutedo a mais duas instituiccedilotildees nenhuma dessas entidades publicou ateacute agora dados atraveacutes desta plataforma O SARDC eacute limitado em termos de funcionalidades permitindo apenas a busca por autor data titulo assunto e tipo de documento Natildeo eacute possiacutevel perceber a legalidade da reutilizaccedilatildeo de dados pois natildeo eacute referido qualquer tipo de licenciamento A qualidade dos dados apresentados pelo SARDC eacute uma incoacutegnita pela falta de indicaccedilatildeo do uso de formatos abertos e tambeacutem de um esquema padratildeo de metadados A niacutevel das instituiccedilotildees de investigaccedilatildeo apenas o IPCB possui um repositoacuterio de Dados Abertos

A tendecircncia de abertura de dados de investigaccedilatildeo parece estar ligada agrave cultura disciplinar com os repositoacuterios de dados cientiacuteficos existentes em Portugal a conotarem-se no domiacutenio das Ciecircncias da Vida O re3data indexa apenas 2 repositoacuterios de dados cientiacuteficos portugueses o INTEGRALL e o KiMoSys sendo que ambos pertencem ao ramo da biologia (DataCite 2017a) O Biosharingorg (2017) indexou cinco bases de dados cientiacuteficas com origem portuguesa havendo participaccedilatildeo nacional em outras duas bases de dados internacionais Estas pertencem todas ao domiacutenio das Ciecircncias da Vida e da Biologia com exceccedilatildeo de uma conotada com as

110

Ciecircncias da Terra A GBIF possui um noacute portuguecircs que aloja 23 conjuntos de dados que correspondem a 448136 ocorrecircncias (Portal de Dados de Biodiversidade de Portugal 2016) A rede nacional de informaccedilatildeo bioloacutegica - BioDatapt fornece acesso a duas bases de dados disciplinares uma ontologia para descrever experiecircncias bioloacutegicas baseadas em plantas quatro ferramentas de software e cinco conjuntos de dados

Em suma eacute necessaacuterio desenvolver por completo a poliacutetica de abertura de dados cientiacuteficos clarificando questotildees como o local de depoacutesito licenccedilas metadados e formatos a utilizar Ao niacutevel do ecossistema eacute necessaacuterio melhorar a visibilidade do SARDC abrir totalmente os dados isto eacute de forma legal e teacutecnica e construir mais repositoacuterios de dados Em termos de impacto eacute imperiosa uma mudanccedila cultural que passe pelo treino dos investigadores para a gestatildeo e partilha de dados pela definiccedilatildeo de recompensas e incentivos para os investigadores que partilhem dados e tambeacutem pela criaccedilatildeo de mais iniciativas de promoccedilatildeo da abertura de dados

A evoluccedilatildeo da conjuntura de acesso aos documentos administrativos do setor puacuteblico eacute derivada da imposiccedilatildeo das Diretivas Europeias a que Portugal como membro da EU estaacute obrigado A Lei 462007 de 24 de Agosto viraacute transpor para a ordem juriacutedica nacional a Diretiva nordm 200398CE legislando a obrigaccedilatildeo das entidades puacuteblicas publicar documentos administrativos de forma eletroacutenica para que possam ser acedidos e reutilizados Foi tambeacutem criada a CADA para supervisionar o cumprimento das disposiccedilotildees legais referentes ao acesso agrave informaccedilatildeo administrativardquo (Comissatildeo de Acesso aos Documentos Administrativos [CADA])

A Lei nordm 262016 de 22 de Agosto revoga e transpotildee a novamente a Diretiva 200398EC O artigo 3ordm mandata a abertura dos dados ambientais agrave comunidade incluindo-os na definiccedilatildeo de documento administrativo devendo a sua publicaccedilatildeo ser feita num formato aberto e legiacutevel por maacutequina O artigo 23ordm apenas prevecirc a reutilizaccedilatildeo dos dados para fins educativos e para fins de investigaccedilatildeo e desenvolvimento deixando de lado a reutilizaccedilatildeo comercial Contudo o dadosgov atribuiu aos dados que aloja a licenccedila CC BY 30 o que natildeo impede a reutilizaccedilatildeo comercial dos dados Perante este contexto eacute impossiacutevel natildeo questionar a razatildeo de natildeo ter sido transposta a nova Diretiva 201337EU que facilita a reutilizaccedilatildeo de dados ao tornar obrigatoacuteria a disponibilizaccedilatildeo de informaccedilatildeo proveniente das entidades puacuteblicas para reutilizaccedilatildeo ao custo de reproduccedilatildeo de preferecircncia num portal e sob licenccedilas de formatos digitais Um desenvolvimento interessante seria o de criar um legislaccedilatildeo apropriada para a abertura de dados governamentais que fosse estabelecida tendo em conta as necessidades dos utilizadores e os objetivos governamentais em vez da simples transposiccedilatildeo da Diretiva da Uniatildeo Europeia

Ao niacutevel local apenas Lisboa e Porto parecem ter definido uma poliacutetica de abertura de dados com estrateacutegias diferenciadas Lisboa aposta na publicaccedilatildeo de dados municipais que promovam o envolvimento dos cidadatildeos aumentem a transparecircncia e

111

o desenvolvimento econoacutemico aleacutem da melhoria da eficiecircncia dos serviccedilos devendo os dados ser atualizados legiacuteveis por maacutequina com licenccedila aberta que permita a reutilizaccedilatildeo comercial (Lisboa Cacircmara Municipal 2016) Os dados disponibilizados no portal ldquosatildeo produzidos no acircmbito de sistemas de informaccedilatildeordquo que pertencem a diversos organismos registando-se jaacute diversas aplicaccedilotildees que utilizam esses dados para criar valor para o cidadatildeo e visitante de Lisboa na aacuterea do turismo ambiente urbanismo (Soares Baptista e Lima 201518) Jaacute o Porto parece concentrado na publicaccedilatildeo de dados que contribuam para a ldquocompetitividade do Municiacutepio do Porto e da regiatildeo para visitar para residir captar e realizar negoacutecios no mercado nacional e internacionalrdquo (Porto Cacircmara Municipal) De acordo com a opiniatildeo de Soares Baptista e Lima (201518) a abertura de dados eacute centrada na ldquodimensatildeo turismo e negligencia pelo menos aparentemente as restantesrdquo Esta conclusatildeo pode ser reforccedilada com a anaacutelise do portal de dados do Porto onde apenas constam cinco conjuntos de dados sendo estes pertencentes ao turismo ou relacionados

O ecossistema de abertura de dados tem aumentado dentro e fora do espectro poliacutetico Aleacutem do portal nacional de dados puacuteblicos um grande nuacutemero de organizaccedilotildees puacuteblicas tem criado os seus portais de dados eou tem publicado os mesmos no dadosgov Por outro lado existem vaacuterios portais de dados com origem na sociedade civil com o selo da Transparecircncia Hackday Portugal Em Portugal tecircm existido diversas iniciativas a este niacutevel hackathons como o Date with Data com o intuito de alertar informar e formar a comunidade para este novo paradigma na disponibilizaccedilatildeo da informaccedilatildeo conferecircncias de Dados Abertos

O Porto Lisboa Fundatildeo Palmela Penela e Aacutegueda estatildeo entre as cidades que integram o Open and Agile Smart Cities (OASC) (2017) uma iniciativa com o objetivo de desenvolver mercados para as cidades inteligentes baseados nas necessidades das cidades e das comunidades O Porto eacute destaque nesta iniciativa pela utilizaccedilatildeo da tecnologia FIWARE que ajuda a melhorar o uso de dados abertos e a partilha conhecimentos e tecnologias entre cidades

A anaacutelise feita por Soares Baptista e Lima (2015) sobre a abertura de dados em quatro cidades do norte do paiacutes Braga Barcelos Guimaratildees e Vila Nova de Famalicatildeo concluiu que a disponibilizaccedilatildeo de dados ao niacutevel local eacute feita apenas ao niacutevel de ldquocontratos municipais orccedilamento anual gastos resultados eleitorais qualidade do ar horaacuterios de transporte orccedilamento participativo e lista de empresasrdquo

A avaliaccedilatildeo da transparecircncia governativa local pode tambeacutem ser obtida atraveacutes do Portal da Transparecircncia Municipal uma ferramenta que permite avaliar vaacuterios indicadores da governaccedilatildeo dos municiacutepios portugueses com o recurso agrave disponibilizaccedilatildeo de dados estatiacutesticos Os indicadores abordam a gestatildeo financeira e administrativa decisotildees fiscais dinacircmica econoacutemica do municiacutepio serviccedilos municipais e participaccedilatildeo eleitoral autaacuterquica (Portugal Governo 2017)

112

Utilizando a estrutura de avaliaccedilatildeo de poliacuteticas de Dados Abertos de Zuiderwijk e Janssen (2014) eacute possiacutevel tirar algumas ilaccedilotildees sobre o contexto conteuacutedo e indicadores de desempenho da poliacutetica de abertura de dados do setor puacuteblico bem como sobre o valor puacuteblico alcanccedilado A niacutevel de contexto da poliacutetica de Dados Abertos a Lei nordm 262016 de 22 de Agosto transpotildee a Diretiva 200398CE tendo como motivaccedilatildeo para a sua implementaccedilatildeo eacute sobretudo econoacutemica e poliacutetica via EU A poliacutetica tambeacutem pretende facilitar o acesso e reutilizaccedilatildeo da informaccedilatildeo por parte dos cidadatildeos e garantir a transparecircncia da atividade administrativa A abertura de dados do setor puacuteblico eacute garantida pela CADA responsaacutevel pelo cumprimento da lei e a AMA que fornece a e-infraestrutura e apoio teacutecnico Tambeacutem os custos de abertura de dados governamentais parecem estar assegurados num plano de racionalizaccedilatildeo de custos da Administraccedilatildeo Puacuteblica (OECD 2015)

Em termos de conteuacutedo a poliacutetica de Dados Abertos enuncia na sua constituiccedilatildeo alguns princiacutepios de abertura bastante importantes como o acesso livre e universal a acessibilidade a interoperabilidade a qualidade a integridade e a autenticidade dos dados publicados e ainda a sua identificaccedilatildeo e localizaccedilatildeo (art 2ordm) A publicaccedilatildeo de dados deve ser feita num formato aberto e legiacutevel por maacutequina (art 3ordm)

Relativamente ao contexto o acesso eacute gratuito e de faacutecil compreensatildeo sendo que todos os dados no dadosgov estatildeo disponiacuteveis para download sem necessidade de pedido ou registo Eacute aplicada a licenccedila CC BY 30 a todos os datasets alojados no portal permitindo assim a sua reutilizaccedilatildeo com apenas a restriccedilatildeo de mencionar a fonte dos dados Todos os dados no dadosgov estatildeo disponiacuteveis em formatos abertos podendo ser classificados com 3 estrelas segundo o conceito de dados abertos conectados de Tim Berners-Lee (2010)

Contudo natildeo existe esquema padratildeo de metadados nem existe verificaccedilatildeo dos metadados antes da publicaccedilatildeo de cada dataset (Lapa 2017) Natildeo satildeo conhecidas meacutetricas de avaliaccedilatildeo nem multas ou recompensas no ecossistema portuguecircs de Dados Abertos A uacuteltima mediccedilatildeo da qualidade dos dados data de 2014 onde foram encontrados alguns problemas que natildeo foram totalmente resolvidos junto dos fornecedores A uacuteltima grande atividade de promoccedilatildeo de reutilizaccedilatildeo de dados do setor puacuteblico ocorreu em 2014-2015 natildeo se conhecendo para jaacute novas atividades previstas (Lapa 2017)

Em termos de disponibilidade de dados Portugal apresenta 802 conjuntos de dados no portal nacional de temaacutetica diversa mas com maior incidecircncia na Economia e Financcedilas Mas se considerarmos os dados alojado em outros portais puacuteblicos e natildeo que ainda natildeo constam no portal nacional a contabilidade eacute bastante mais elevada

Os indicadores de desempenho satildeo modestos Apesar do espetro alargado de destinataacuterios da abertura de dados registam-se apenas 2 aplicaccedilotildees elaboradas a

113

partir de Dados Abertos disponibilizados pela AMA e Direcccedilatildeo-Geral das Autarquias Locais (Lapa 2017) Natildeo eacute por isso surpreendente o fraco impacto poliacutetico econoacutemico e social apontado pelo Open Data Barometer e pelo Open Data Maturity O estudo de Gomes e Soares (2014) conclui que a transparecircncia eacute o uacutenico benefiacutecio real

Em termos de valor puacuteblico alcanccedilado apenas conseguimos identificar a transparecircncia governativa e disponibilidade de dados Mesmo que a poliacutetica mandate a abertura de dados mediante como a interoperabilidade e a qualidade se natildeo existe verificaccedilatildeo nem mediccedilatildeo quem pode assegurar que estes estatildeo a ser cumpridos A disponibilidade de dados existe o que natildeo se verifica eacute grande reutilizaccedilatildeo dos dados puacuteblicos Poderaacute esta falta de verificaccedilatildeo da qualidade dos dados estar a interferir com a sua reutilizaccedilatildeo Faltam claramente indicadores de reutilizaccedilatildeo de dados do setor puacuteblico e estudos de impacto para uma avaliaccedilatildeo concreta do valor alcanccedilado

Gomes e Soares (2014) apenas atribuem nota positiva ao dadosgov no cumprimento dos princiacutepios de abertura A atividade dos visitantes o desenvolvimento de aplicaccedilotildees a atividade geradora de novo conhecimento e a utilizaccedilatildeo de recursos do portal satildeo classificadas como pobres Neste indicador apenas a atividade dos fornecedores no portal eacute satisfatoacuteria Em termos de benefiacutecios observaacuteveis da abertura de dados governamentais o estudo apenas regista bons niacuteveis de transparecircncia governativa enquanto a participaccedilatildeo puacuteblica a inovaccedilatildeo e o empreendedorismo e a eficiecircncia governativas natildeo revelam impactos satisfatoacuterios

O cruzamento da informaccedilatildeo obtida atraveacutes das vaacuterias iniciativas de avaliaccedilatildeo da abertura de dados permite inferir algumas conclusotildees e tambeacutem revelar algumas disparidades O Open Data Barometer e o Open Data Maturity apontam o baixo impacto econoacutemico e social da abertura de dados em Portugal Gomes e Soares (2014) concluem que o problema em Portugal natildeo eacute quantidade de dados disponibilizados mas sim a quantidade de dados que satildeo reutilizados e como satildeo reutilizados

O Public Sector Information Scoreboard e o Open Data Maturity afirmam que Portugal natildeo possui uma poliacutetica de Dados Abertos o que como vimos natildeo corresponde agrave verdade Entre as vaacuterias iniciativas de avaliaccedilatildeo do estado de abertura de dados apenas trecircs publicaram informaccedilatildeo relativa a 2016 Apesar da equivalecircncia de ranking e taxa de abertura entre duas das iniciativas eacute redundante inferir qualquer conclusatildeo dado que estas natildeo medem o mesmo nuacutemero paracircmetros nem estes coincidem na maioria dos casos O Open Data Inventory refere-se a dados avaliados apenas do portal do INE para calcular a sua taxa de abertura pelo que tambeacutem deve ser relativizado

Como pontos positivos satildeo apontados a abertura de dados de diferentes domiacutenios o fato de todos os dados disponibilizados no portal estarem num formato processaacutevel

114

por maacutequina (Carrara Nieuwenhuis amp Vollers 2016) ao contraacuterio do que afirma a OECD (2015b) e o Open Data Inventory

Todos os iacutendices de avaliaccedilatildeo da maturidade do estado das iniciativas e poliacuteticas de Dados Abertos satildeo relativos a dados puacuteblicos natildeo tendo sido encontrada nenhuma estrutura de avaliaccedilatildeo das poliacuteticas de abertura de dados de investigaccedilatildeo

Tendo em conta o Quadro 5 eacute possiacutevel verificar a qualidade da abertura dos dados dos 60 portais de dados portugueses encontrados na web e inferir algumas conclusotildees Em termos de portais de dados de investigaccedilatildeo foram encontrados apenas 11 com os restantes 49 a conter dados do setor publico Os portais de dados estatiacutesticos satildeo os grandes dominadores do panorama nacional com 13 siacutetios web seguidos dos portais de dados econoacutemicos com 6 Dos 60 portais analisados apenas 33 disponibilizam dados legiacuteveis por maacutequina sendo que alguns portais natildeo o fazem totalmente Apenas 16 portais indicam usar uma licenccedila aberta que permita a livre reutilizaccedilatildeo dos dados e apenas 3 fornecem a indicaccedilatildeo do padratildeo de metadados usado Denota-se que alguns dos portais parecem usar um esquema proacuteprio de descriccedilatildeo de datasets no entanto estes natildeo parecem corresponder aos padrotildees de metadados mais reconhecidos Existem 17 portais que natildeo utilizam formatos abertos ou natildeo indicam sequer o tipo de formato Eacute possiacutevel jaacute encontrar jaacute tambeacutem 17 portais que fornecem dados em formatos estruturados

Em suma eacute necessaacuterio transpor a Diretiva da EU de 2013 e criar mais poliacuteticas municipais e institucionais mandatar a total abertura legal e teacutecnica de dados e a sua verificaccedilatildeo da qualidade O niacutevel de reutilizaccedilatildeo de dados e as atividades de treino e envolvimento dos cidadatildeos devem ser aumentados

O sucesso das poliacuteticas de Dados Abertos depende como vimos da criaccedilatildeo de um ecossistema sustentaacutevel e tambeacutem do impacto e reutilizaccedilatildeo que estes tipos de informaccedilatildeo possam induzir O impacto dos Dados abertos pode ser medido atraveacutes da citaccedilatildeo de dados ou atraveacutes de indicadores altimeacutetricos que permitem uma observaccedilatildeo mais clara e detalhada dos possiacuteveis impactos dos conjuntos de dados disponibilizados em AA sejam eles provenientes do setor puacuteblico ou das entidades de investigaccedilatildeo

115

Referecircncias Bibliograacuteficas

Agecircncia para a Modernizaccedilatildeo Administrativa (AMA) (2016a) Guia Dados Abertos Disponiacutevel na WWW httpwwwdadosgovptmedia46120guia_dados_abertos_amapdf

Agecircncia para a Modernizaccedilatildeo Administrativa (AMA) (2016b) Dadosgov [Consultado a 11-05-2017] Disponiacutevel na WWW httpwwwdadosgovpt

Agecircncia Portuguesa do Ambiente (2017) SNIAmb - Sistema Nacional de Informaccedilatildeo de Ambiente [Consultado a 12-05-2017] Disponiacutevel na WWW httpsniambapambienteptHomeDefaulthtm

Arzberger P et al (2004) An international framework to promote access to data Science 303(5665) 1777-1778 Disponiacutevel na WWW httpsciencesciencemagorgcontent30356651777full

Asociacioacuten Espantildeola de Normalizacioacuten y Certificacioacuten (2015) UNE 178301 Ciudades Inteligentes Datos Abiertos (Open Data) Madrid AENOR Beagrie C amp Houghton J (2014) The Value and Impact of Data Sharing and Curation A synthesis of three recent studies of UK research data centres Disponiacutevel na WWW httprepositoryjiscacuk55681iDF308_-_Digital_Infrastructure_Directions_Report2C_Jan14_v1-04pdf

Beall J (2012) Predatory publishers are corrupting open access Nature 489(7415) 179 Disponiacutevel na WWW httpswwwnaturecomnewspredatory-publishers-are-corrupting-open-access-111385

Bell G (2009) Foreword In Hey T Tansley S amp Tolle K (eds) (2009) The Fourth Paradigm Data-Intensive Scientific Discovery (pp XI-XV) Microsoft Research Disponiacutevel na WWW httpwwwastrocaltechedu~georgeaybi1994th_paradigm_book_complete_lrpdf

Berners-Lee Tim (2010) Is your Linked Open Data 5 Star Disponiacutevel na WWW httpswwww3orgDesignIssuesLinkedDatahtml

Big Data Europe (2016) Big Data Europe Empowering Communities with Data Technologies [Consultado a 22-11-2016] Disponiacutevel na WWW httpswwwbig-data-europeeu

BioDatapt Recursos [Consultado a 18-05-2017] Disponiacutevel na WWW httpwwwbiodataptresourceshtml

Biosharingorg (2017) Policies [Consultado a 22-05-2017] Disponiacutevel na WWW httpsbiosharingorgpolicies

Bjoumlrk B-C Laakso M Welling P amp Paetau P (2014) Anatomy of green open access Journal of the American Society for Information Science and Technology 65 237ndash250 Disponiacutevel na WWW httponlinelibrarywileycomwol1doi101002asi22963full

BOAI - Budapest Open Access Initiative (2002) Disponiacutevel na WWW httpwwwbudapestopenaccessinitiativeorg

116

BOAI - Budapest Open Access Initiative (2012) Ten years on from the Budapest Open Access Initiative setting the default to open Disponiacutevel na WWW httpwwwbudapestopenaccessinitiativeorgboai-10-recommendations

Borges M M (2006) A esfera comunicaccedilatildeo acadeacutemica e novos meacutedia (Tese de Doutoramento) Faculdade de Letras Universidade de Coimbra Portugal Disponiacutevel na WWW httpsestudogeralsibucptjspuibitstream1031685575MMBorges_tesepdf

Borgman C L (2015) Big Data Little Data No Data Scholarship in the Networked World The MIT Press

Bueno de la Fuente G (2016) What is Open Science Introduction Disponiacutevel na WWW httpswwwfosteropenscienceeucontentwhat-open-science-introduction

Cabinet Office (2012) Open Data White Paper Unleashing the Potential Disponiacutevel na WWW httpsdatagovuksitesdefaultfilesOpen_data_White_Paperpdf

Cabinet Office (2013) G8 Open Data Charter and Technical Annex Disponiacutevel na WWW httpswwwgovukgovernmentpublicationsopen-data-charterg8-open-data-charter-and-technical-annex

Cambridge University Press (2017) Cambridge Dictionary Disponiacutevel na WWW httpdictionarycambridgeorgdictionaryenglishpolicy

Carrara W Chan W S Fischer S Steenbergen E (2015) Creating Value through Open Data Study on the Impact of Re-use of Public Data Resources Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_creating_value_through_open_data_0pdf

Carrara W Fischer S Oudkerk F S Steenbergen E amp Tinholt D (2015) Analytical Report 1 Digital Transformations and Open Data Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_analytical_report_n1_-_digital_transformationpdf Carrara W Fischer S Steenbergen E (2015) Analytical Report 2 E-skills and Open Data Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_analytical_report_n2_-_e-skillspdf Carrara W Nieuwenhuis M amp Vollers H (2016) Open Data Maturity in Europe 2016 Insights into the European state of play Disponiacutevel na WWW httpswwwcapgemini-consultingcomresource-file-accessresourcepdfopen_data_maturity_in_europe_2016_final_v10_0pdf

Carrara W Oudkerk F Steenbergen E Tinholt D (2016a) European Data Portal Open Data Goldbook for Data Managers and Data Holders Capgemini Consulting Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesgoldbookpdf

117

Carrara W Engbers W Nieuwenhuis M amp Steenbergen E (2016b) Analytical report nordm4 Open Data in Cities Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_analytical_report_n4_-_open_data_in_cities_v10_finalpdf

Caruso J Nicol A amp Archambault Eacute (2013) Open Access Strategies in the European Research Area (August) 1ndash46 Retrieved from httpeuropaeurapidpress-release_IP-13-786_enhtmlocale=ennhttpwwwscience-metrixcompdfSM_EC_OA_Policiespdf

Carvalho J Furtado F amp Priacutencipe P (2017) WP4 ndash D25 ndash Kit sobre dados de investigaccedilatildeo RCAAP Disponiacutevel na WWW httpprojectorcaapptindexphplang-ptconsultar-recursos-de-apoioremositoryfunc=finishdownampid=395

Christensen-Dalsgaard B et al (2012) Ten recommendations for libraries to get started with research data management Final report of the LIBER working group on E-Science Research Data Management Disponiacutevel na WWW httplibereuropeeuwp-contentuploadsThe20research20data20group20201220v720finalpdf

CKAN CKAN The open source data portal software Disponiacutevel na WWW httpckanorg

Colpaert P Sarah J Peter M Mannens E Van de Walle R (2013) The 5 star of open data portals 7th internacional conference on methodologies Technologies and tools enabling e-Government (MeTTeG) 61-67 Disponiacutevel na WWW httppieterpm5stardataportals5starsofopendataportalspdf

Comissatildeo de Acesso aos Documentos Administrativos (CADA) Quem somos Disponiacutevel na WWW httpwwwcadapt

Comissatildeo Europeia (2011) Open data an engine for innovation growth and transparent governance Communication from the Commission to the European Parliament the Council the European economic and social committee and the committee of the regions (COM [2011] 882) Disponiacutevel na WWW httpwwweuroparleuropaeuRegDatadocs_autres_institutionscommission_europeennecom20110882COM_COM282011290882_ENpdf

Comissatildeo Europeia (2012) COMUNICACcedilAtildeO DA COMISSAtildeO AO PARLAMENTO EUROPEU AO CONSELHO AO COMITEacute ECONOacuteMICO E SOCIAL EUROPEU E AO COMITEacute DAS REGIOtildeES - Melhorar o acesso agrave informaccedilatildeo cientiacutefica rentabilizar o investimento puacuteblico em investigaccedilatildeo COM (2012) 401 final Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentENTXTuri=COM20120401FIN

Comissatildeo Europeia (2013) EU implementation of the G8 Open Data Charter Disponiacutevel na WWW httpseceuropaeudigital-single-marketnewseu-implementation-g8-open-data-charter

Comissatildeo Europeia (2014) COMUNICACcedilAtildeO DA COMISSAtildeO AO PARLAMENTO EUROPEU AO CONSELHO AO COMITEacute ECONOacuteMICO E SOCIAL EUROPEU E AO COMITEacute DAS REGIOtildeES - Para

118

uma economia dos dados proacutespera COM(2014) 442 final Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentENTXTuri=COM20140442FIN

Comissatildeo Europeia (2016a) Open innovation Open Science open to the world A vision for Europe Brussels European Commission Directorate-General for Research and Innovation Disponiacutevel na WWW httpbookshopeuropaeuenopen-innovation-open-science-open-to-the-world-pbKI0416263

Comissatildeo Europeia (2016b) Research amp Innovation News Alert Commission proposes copyright exception for researchers Disponiacutevel na WWW httpeceuropaeuresearchindexcfmpg=newsalertampyear=2016ampna=na-140916

Comissatildeo Europeia (2016c) COMUNICACcedilAtildeO DA COMISSAtildeO AO PARLAMENTO EUROPEU AO CONSELHO AO COMITEacute ECONOacuteMICO E SOCIAL EUROPEU E AO COMITEacute DAS REGIOtildeES ndash Iniciativa Europeia para a Nuvem ndash Construir uma economia de dados e conhecimento competitiva na Europa COM(2016) 178 final Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentPTALLuri=CELEX52016DC0178

Comissatildeo Europeia (2016d) Europa liacuteder mundial da economia baseada nos dados graccedilas agrave iniciativa europeia para a computaccedilatildeo em nuvem Comissatildeo Europeia comunicado de imprensa Disponiacutevel na WWW httpeuropaeurapidpress-release_IP-16-1408_pthtm

Comissatildeo Europeia (2017a) Digital Single Market Digital Economy amp Society Disponiacutevel na WWW httpseceuropaeudigital-single-marketenwhat-big-data-can-do-you

Comissatildeo Europeia (2017b) H2020 Programme AGA ndash Annotated Model Grant Agreement Disponiacutevel na WWW httpeceuropaeuresearchparticipantsdatarefh2020grants_manualamgah2020-amga_enpdf

Comissatildeo Europeia (2017c) COMUNICACcedilAtildeO DA COMISSAtildeO AO PARLAMENTO EUROPEU AO CONSELHO AO COMITEacute ECONOacuteMICO E SOCIAL EUROPEU E AO COMITEacute DAS REGIOtildeES - Construir uma economia de dados proacutespera COM(2017) 9 final Disponiacutevel na WWW httpeceuropaeutransparencyregdocrep12017PTCOM-2017-9-F1-PT-MAIN-PART-1PDF

Comissatildeo Europeia Grupo de peritos de alto niacutevel em dados de investigaccedilatildeo (2010) Riding the wave how Europe can gain from the rising tide of scientific data Disponiacutevel na WWW httpeceuropaeuinformation_societynewsroomcfitemlongdetailcfmitem_id=6204

Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2016a) H2020 Programme Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020 Disponiacutevel na WWW httpseceuropaeuresearchparticipantsdatarefh2020grants_manualhioa_piloth2020-hi-oa-pilot-guide_enpdf

Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2016b) Realising the European Open Science Cloud First report and recommendations Group of the Commission

119

High Level Expert Cloud on the European Open Science Luxemburgo Publications Office of the European Union Disponiacutevel na WWW httpseceuropaeuresearchopensciencepdfrealising_the_european_open_science_cloud_2016pdf

Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2016c) H2020 Programme Guidelines on FAIR Data Management in Horizon 2020 Disponiacutevel na WWW httpeceuropaeuresearchparticipantsdatarefh2020grants_manualhioa_piloth2020-hi-oa-data-mgt_enpdf

Comissatildeo Europeia Diretoria Geral para a Investigaccedilatildeo e Inovaccedilatildeo (2017) Open Science Monitor Disponiacutevel na WWW httpeceuropaeuresearchopenscienceindexcfmpg=aboutampsection=monitor

Comissatildeo Executiva Grupo de Trabalho para a Poliacutetica Nacional de Ciecircncia Aberta (Comissatildeo Executiva GT-PNCA) (2016) Primeiro Relatoacuterio da Comissatildeo Executiva Grupo de Trabalho Para a Poliacutetica Nacional de Ciecircncia Aberta Disponiacutevel na WWW httpmediawixcomugda8bd7c_1ca622bff7f34abbad228ac94e1eda16pdf

Concordat on Open Research Data (2016) Disponiacutevel na WWW httpwwwrcukacukdocumentsdocumentsconcordatonopenresearchdata-pdf

Croll A (2012) The feedback economy In Planning for big data (pp 1-8) Sebastepol OacuteReilly Media

Cybermetrics Lab (2017) Ranking web of repositories [Consultado a 02-02-2017] Disponiacutevel na WWW httprepositorieswebometricsinfoen

Dallmeier-Tiessen et al (2011) Highlights from the SOAP project survey What Scientists Think about Open Access Publishing arXiv11015260 [Cs] 14 httpsarxivorgabs11015260

DataCite (2017a) re3data registry of research data repositories [Consultado a 02-05-2017] Disponiacutevel na WWW httpwwwre3dataorg

DataCite (2017b) Search [Consultado a 02-05-2017] Disponiacutevel na WWW httpssearchdataciteorg

Data Documention Iniciative (DDI) (2016) Document Discover and Interoperate Disponiacutevel na WWW httpwwwddiallianceorg

DataHub Datasets [Consultado a 03-01-2017] Disponiacutevel na WWW httpsdatahubiodatasetq=portugalamppage=1

DataCite (2017) Search [Consultado a 18-05-2017] Disponiacutevel na WWW httpssearchdataciteorg

Davies T (2012) 5-Stars of Open Data Engagement Disponiacutevel na WWW httpwwwtimdaviesorguk201201215-stars-of-open-data-engagement

Davies T (2014) Open data policies and practice an internacional comparison Paper for European Consortium for Political Research Panel P356 ndashThe Impacts of Open Data Disponiacutevel na WWW httpsecpreuFilestorePaperProposald591e267-cbee-4d5d-b699-7d0bda633e2epdf

120

Dawes S Vidiasova L amp Parkhimovich O (2016) Planning and designing open government data programs An ecosystem approach Government Information Quarterly 33(1) 15-27 Disponiacutevel na WWW httpwwwsciencedirectcomsciencearticlepiiS0740624X1630003X

Declaraccedilatildeo de Bethesda sobre a Publicaccedilatildeo em Acesso Aberto (2003) Disponiacutevel na WWW httplegacyearlhamedu~petersfosbethesdahtm

Declaraccedilatildeo de Berlim sobre Acesso Livre ao Conhecimento nas Ciecircncias e Humanidades (2003) Disponiacutevel na WWW httpsrepositoriumsdumuminhoptaboutDeclaracaoBerlimhtm

Decreto-Lei nordm 1152013 de 7 de agosto do Ministeacuterio da Educaccedilatildeo e Ciecircncia Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 151 (2013) 4749-4772 Disponiacutevel na WWW httpsdreptapplicationdirpdf1sdip201308151000474904772pdf

Despacho nordm 153892016 de 12 de dezembro do Ministeacuterio das Financcedilas e da Secretaria de Estado da Cultura e Ciecircncia Tecnologia e Ensino Superior Diaacuterio da Repuacuteblica nordm 2442016 Seacuterie II Nordm 244 (2016) 37155 ndash 37156 Disponiacutevel na WWW httpsdreptapplicationfilea105580126

Dietrich D (2013) Open Government Data principles concepts amp best practice Disponiacutevel na WWW httpworkspaceunpanorgsitesInternetDocumentsUNPAN95209pdf

Dietrich D Cherkasov V Susar D (2013) Open Government Data for Citizen Engagement in Managing Development Disponiacutevel na WWW httpworkspaceunpanorgsitesInternetDocumentsOGDCE20Toolkit20v113-Feb2013pdf

Directory of Open Access Journals (DOAJ) (2017) Search [Consultado a 27-05-2017] Disponiacutevel na WWW httpsdoajorg

Dodds L Newman A (2015) Open Data Maturity Model ed 10 Disponiacutevel na WWW httptheodiorgguidesmaturity-model

Donker F amp van Loenen B (2017) How to assess the sucess of the open data ecossystem Internacional journal of digital eart 10(3) 284-306 Disponiacutevel na WWW httpwwwtandfonlinecomdoifull1010801753894720161224938

Dumbill E (2012) What is Big Data In Planning for big data (pp 9-16) Sebastepol OacuteReilly Media Disponiacutevel na WWW httpeecswsuedu~yinghuimatcoursesfall202015resourcesplanning-for-big-datapdf

e-Infraestruture Reflection Group (e-IRG) (2016) Long Tail of Data e-IRG Task Force Report Disponiacutevel na WWW httpe-irgeudocuments10920238968LongTailOfData2016pdf

ELIXIR Portugal (2015) What is ELIXIR Portugal Disponiacutevel na WWW httpelixir-portugalorg

ePSI Scoreboard (2013) ePSI platform scoreboard Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesoverview_page_-_epsi_platform_scoreboardpdf

Etalab (2011) Licence Ouvert Disponiacutevel na WWW httpswwwetalabgouvfrenlicence-ouverte-open-licence

EUDAT(a) What is EUDAT Disponiacutevel na WWW httpseudateuwhat-eudat

121

EUDAT(b) B2FIND [Consultado a 22-05-2017] Disponiacutevel na WWW httpb2findeudateu

EUR-Lex (2003a) Directive 200398EC of the European Parliament and of the Council of 17 November 2003 on the re-use of public sector information Official Journal of the European Union 90-96 Disponiacutevel na WWW httpeur-lexeuropaeuLexUriServLexUriServdouri=OJL200334500900096enPDF

EUR-Lex (2003b) Directive 20034EC of the European Parliament and of the Council of 28 January 2003 on public access to environmental information and repealing Council Directive 90313EEC Official Journal of the European Union 26-32 Disponiacutevel na WWW httpeur-lexeuropaeuLexUriServLexUriServdouri=OJL200304100260032ENPDF

EUR-Lex (2011) COMMISSION DECISION of 12 December 2011 on the reuse of Commission documents (2011833EU) Official Journal of the European Union 39-42 Disponiacutevel na WWW httpeur-lexeuropaeuLexUriServLexUriServdouri=OJL201133000390042ENPDF

EUR-Lex (2012) COMMISSION RECOMMENDATION of 17 July 2012 on access to and preservation of scientific information (2012417EU) Official Journal of the European Union 39-43 Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentENTXTuri=celex3A32012H0417

EUR-Lex (2013) Directive 201337EU of the European Parliament and of the Council of 26 June 2013 amending Directive 200398EC on the re-use of public sector information Official Journal of the European Union 1ndash8 Disponiacutevel na WWW httpeur-lexeuropaeuLexUriServLexUriServdouri=OJL201317500010008ENPDF

EUR-Lex (2016) REGULAMENTO (UE) 2016679 DO PARLAMENTO EUROPEU E DO CONSELHO de 27 de abril de 2016 relativo agrave proteccedilatildeo das pessoas singulares no que diz respeito ao tratamento de dados pessoais e agrave livre circulaccedilatildeo desses dados e que revoga a Diretiva 9546CE (Regulamento Geral sobre a Proteccedilatildeo de Dados) Jornal Oficial da Uniatildeo Europeia 1-88 Disponiacutevel na WWW httpeur-lexeuropaeulegal-contentPTTXTPDFuri=CELEX32016R0679ampfrom=PT

European Data Portal (2016) Conjuntos de dados [Consultado a 12-05-2017] Disponiacutevel na WWW httpswwweuropeandataportaleudataptdataset

European Research Area and Innovation Committee (ERAC) (2016) ERAC opinion on open research data (ERAC 120216) Disponiacutevel na WWW httpwwweartoeufileadmincontentWebsiteERAC_Opinion_on_Open_Research_DataPDF

Erway R Horton L Nurnberger A Otsuji R amp Rushing A (2016) Building blocks laying the foundation for a research data management program Dublin Ohio OCLC Research Disponiacutevel na WWW httpswwwoclcorgcontentdamresearchpublications2016oclcresearch-data-management-building-blocks-2016pdf

Expert Advisory Group on Data Acess (EAGDA) (2014) Establishing Incentives and changing cultures to support data acess Disponiacutevel na WWW httpswellcomeacuksitesdefaultfilesestablishing-incentives-and-changing-cultures-to-support-data-access-eagda-may14pdf

Executive Office of the President Office of Managment and Budget (2013) MEMORANDUM FOR THE HEADS OF EXECUTIVE DEPARTMENTS AND AGENCIES Open Data Policy - Managing Information as an Asset Disponiacutevel na WWW

122

httpsobamawhitehousearchivesgovsitesdefaultfilesombmemoranda2013m-13-13pdf

Fan W amp Bifet A (2012) Mining Bid Data Current Status and Forecast to the Future SIGKDDExplorations 14(2) 1-5 Disponiacutevel na WWW httpwwwkddorgexploration_filesV14-02-01-Fanpdf

Fecher B amp Friesike S (2013) Open Science One Term Five Schools of Thought In Bartling S amp Friesike (Eds) Opening Science (pp 17-47) New York Springer Disponiacutevel na WWW httpswwwresearchgatenetpublication236607487_Open_Science_One_Term_Five_Schools_of_Thought

FIWARE (2015) Porto a city that has become a real-time guide Disponiacutevel na WWW httpswwwfiwareorg20151120porto-a-city-that-has-become-a-real-time-guide

FORCE11 FAIR Data Publishing Group (2014) The FAIR Data Principles Disponiacutevel na WWW httpswwwforce11orggroupfairgroupfairprinciples

Forsstroumlm P amp Haataja J (2016) Open Science as an Instrument for Effective Research Disponiacutevel na WWW httpojstsvfiindexphpsignumarticleviewFile5874120303

FOSTER (2016) About FOSTER portal Disponiacutevel na WWW httpswwwfosteropenscienceeuabout

Fundaccedilatildeo para a Ciecircncia e Tecnologia [FCT] (2014) Poliacutetica sobre a Disponibilizaccedilatildeo de Dados e outros Resultados de Projetos de IampD Financiados Pela FCT Disponiacutevel na WWW httpswwwfctptdocumentosPoliticaAcessoAberto_Dadospdf

G20rsquos Anti-corruption Working Group (2014) G20 Anti-corruption Open Data Principles Disponiacutevel na WWW httpwwwg20utorontoca2015G20-Anti-Corruption-Open-Data-Principlespdf

Garcia M (2015) New businesses around open data smart cities and Fiware European Public Sector Information Platform Topic Report Nordm 201504 Disponiacutevel na WWW httpwwwinvesthorizoneuresourcesdocuments6263232145-New-Businesses-Around-Open-Data-Smart-Cities-FIWAREpdf

Garfield E (2006) The History and Meaning of the Journal Impact Factor Journal of the American Medical Association (JAMA) 293 90-93 Disponiacutevel na WWW httpgarfieldlibraryupennedupapersjifchicago2005pdf

GitHub (2017) Search [Consultado a 18-05-2017] Disponiacutevel na WWW httpsgithubcomsearchutf8=E29C93ampq=portugalamptype=

Gomes A amp Soares D (2014) Open government iniciatives in Europe nothern versus Southern countries analysis In ICEGOV2014 Outubro 27-30 Guimaratildees Portugal Disponiacutevel na WWW httphdlhandlenet182237172

Gonzalez-Zapata F amp Heeks R (2015) The multiple meanings of open government data understanding different stakeholders and their perspectives Government Information Quarterly 32(4) 441-452 Disponiacutevel na WWW httpsdoiorg101016jgiq201509001

123

Granickas K (2013) Understanding the impact of releasing and re-usinf open government data European Public Sector Information Platform Topic Report Nordm 2013 08 Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfileslibrary201308_understanding_the_impact_of_releasing_and_re_using_open_datapdf

Hahnel M amp Hook D (2016) Open by default In Treadway J et al The state of open data a selections of analyses and articles about open data curated by Figshare (pp 3-6) Disponiacutevel na WWW httpsfigsharecomarticlesThe_State_of_Open_Data_Report40363981

Harnad S et al (2004) The AccessImpact Problem and the green and gold roads to Open Access Serials Review 30(4) Disponiacutevel na WWW httpusersecssotonacukharnadTempimpacthtml

Harnad S amp Brody T (2004) Comparing the Impact of Open Access (OA) vs Non-AO Articles in the Same Journals D-Lib Magazine 10(6) Disponiacutevel na WWW httpwwwdliborgdlibjune04harnad06harnadhtml

Hernaacutendez-Peacuterez T (2016) En la era de la web de los datos primero datos abiertos despueacutes datos massivos El profesional de la informacioacuten 25(4) 517-525 Disponiacutevel na WWW httpsdoiorg103145epi2016jul01

Hey T Tansley S amp Tolle K (2009) Jim Gray on eScience A Transformed Scientific Method In Hey T Tansley S amp Tolle K (eds) (2009) The Fourth Paradigm Data-Intensive Scientific Discovery (pp 5-12) Microsoft Research Disponiacutevel na WWW httpwwwastrocaltechedu~georgeaybi1994th_paradigm_book_complete_lrpdf

Hogge B (2010) Open Data Study Open Society Institute Disponiacutevel na WWW httpwwwtransparencyinitiativeorgwpcontentuploads201105open_data_study_finalpdf

Houghton J amp Swan A (2013) Planting the green seeds for a golden harvest Comments and clarifications on ldquoGoing for Goldrdquo D-Lib Magazine 19 1ndash2 Disponiacutevel na WWW httpdoiorg101045january2013-houghton

Huijboom N van den Broek T (2011) Open Data an internacional comparison of strategies European Journal of ePractice 12 4-16 Disponiacutevel na WWW httpsjoinupeceuropaeusitesdefaultfiles76a705ePractice20Journal-20Vol2012-March_April202011pdf

Internacional Council for Science (ICSU) (2014) Open acess to scientific data and literature and the assessement of research by metrics Disponiacutevel na WWW httpwikilibsunaczaimagesbb8Icsu-report-on-open-accesspdf

International Open Data Charter (2015) Open Data Charter Disponiacutevel na WWW httpopendatacharternet

International Workshop on Open Data for Science and Sustainability in Developing Countries (2014) Data Sharing Principles in Developing Countries (The Nairobi Data Sharing Principles)

124

Disponiacutevel na WWW httpswwwrd-allianceorgsitesdefaultfilesattachmentNairobiDataSharingPrinciplespdf

Janssen M (2011) The influence of the PSI directive on open government data an overview of recent developments Government Information Quaterly 28 446-456 Disponiacutevel na WWW httpsdoiorg101016jgiq201101004

Janssen M Charalabidis Y amp Zuiderwijk A (2012) Benefits adoption barriers and myths of open data and open government Information Systems Management 4 258-268 Disponiacutevel na WWW httpwwwtandfonlinecomdoiabs101080105805302012716740

Jenssen K (2012) Open Government Data and the right to information opportunities and obstacles The Journal of Community Informatics 8 (2) Disponiacutevel na WWW httpci-journalnetindexphpciejarticleview952

Koski H (2015) The impact of open data ndash a preliminary study Ministry of Finance publications 15b2015 Disponiacutevel na WWW httpswwww3org2013share-psiwikiimages667Impact_of_Open_Data_in_the_Public_Sector_Koski_2015pdf

Kramer B amp Bosman J (2016) Innovations in Scholarly Communication [Consultado a 24-02-2017] Disponiacutevel na WWW https101innovationswordpresscom

Laakso M (2014) Green open access policies of scholarly journal publishers A study of what when and where self-archiving is allowed Scientometrics 99(2) 475ndash494 Disponiacutevel na WWW httpdoiorg101007s11192-013-1205-3

Laumlmmerhirt D (2016) PASTEUR4OA Briefing Paper Disciplinary differences in opening research data Disponiacutevel na WWW httpwwwpasteur4oaeuresources209

Laney D (2001) 3-D Data Management Controlling DataVolume Velocity and Variety META Group Disponiacutevel na WWW httpswwwnoexperiencenecessarybookcom8VeXJ3d-data-management-controlling-data-volume-velocity-and-varietyhtml

Lei nordm 462007 de 24 de Agosto Regula o acesso aos documentos administrativos e a sua reutilizaccedilatildeo revoga a Lei nordm 6593 de 26 de Agosto com a redaccedilatildeo introduzida pelas Lei nordm 895 de 29 de Marccedilo e 9499 de 16 de Julho e transpotildee para a ordem juriacutedica nacional a Diretiva nordm 200398CE do Parlamento e do Conselho de 17 de Novembro relativa agrave reutilizaccedilatildeo de informaccedilotildees do sector puacuteblico Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 163 (2007) 5680-5687 Disponiacutevel na WWW httpswwwfctptarquivodocsLei46_2007pdf

Lei nordm 362011 de 21 de Junho Estabelece a adopccedilatildeo de normas abertas nos sistemas informaacuteticos do Estado Diaacuterio da Repuacuteblica 1ordf seacuterie mdash Nordm 118 (2011) 3599-3600 Disponiacutevel na WWW httpsm6amaptdocsLei362011-NormasAbertaspdf

Lei nordm 262016 de 22 de Agosto Aprova o regime de acesso agrave informaccedilatildeo administrativa e ambiental e de reutilizaccedilatildeo dos documentos administrativos transpondo a Diretiva 20034CE do Parlamento Europeu e do Conselho de 28 de janeiro e a Diretiva 200398CE do Parlamento Europeu e do Conselho de 17 de novembro Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 160 (2016) 2777-2788 Disponiacutevel na WWW httpsdreptapplicationconteudo75177801

125

Leonelli S (2016) Why open data now Big data knowledge production and the political economy of research In Treadway J et al The state of open data a selections of analyses and articles about open data curated by Figshare (pp 7-11) Disponiacutevel na WWW httpsfigsharecomarticlesThe_State_of_Open_Data_Report40363981

Leonelli S Spichtinger D and Prainsack B (2015) Sticks and carrots encouraging open science at its source Geography and Environment 2 12ndash16 Disponiacutevel na WWW httponlinelibrarywileycomenhancedexportCitationdoi101002geo22

Lisboa Cacircmara Municipal (2016) Smart Open Lisboa Disponiacutevel na WWW httpwwwsmartopenlisboacom

Lisboa Cacircmara Municipal (2017) Lisboa Aberta [Consultado a 12-05-2017] Disponiacutevel na WWW httpdadoscm-lisboaptdataset

Lynch C (2009) Jim Grayrsquos Fourth Paradigm and the Construction of the Scientific Record In Hey T Tansley S amp Tolle K (eds) (2009) The Fourth Paradigm Data-Intensive Scientific Discovery (pp 177-183) Microsoft Research Disponiacutevel na WWW httpwwwastrocaltechedu~georgeaybi1994th_paradigm_book_complete_lrpdf

Machado Jorge (2015) Open Data and Open Science In Albagli S Maciel M amp Abdo A (Eds) Open Science Open Issues 189-214 Brasiacutelia IBICT Rio de Janeiro Unirio Disponiacutevel na WWW httplivroabertoibictbrbitstream110611Open20Science20open20issues_Digitalpdf

Manyika J Chui M Brown B Bughin J Dobbs R Roxburgh C amp Byers A H (2011) Big Dat The next frontier for innovation competition and productivity McKinsey Global Institute Disponiacutevel na WWW httpwwwmckinseycombusiness-functionsdigital-mckinseyour-insightsbig-data-the-next-frontier-for-innovation

Marr B (2014) Big Data The 5 Vs Everyone Must Know Disponiacutevel na WWW httpswwwlinkedincompulse20140306073407-64875646-big-data-the-5-vs-everyone-must-know

Naccedilotildees Unidas (2015) Addis Ababa Action Agenda of the Third International Conference on Financing for Development (Addis Ababa Action Agenda) Disponiacutevel na WWW httpssustainabledevelopmentunorgcontentdocuments2051AAAA_Outcomepdf

National Institutes of Health (NIH) (2008) NIH Guide Notice for Public Access Disponiacutevel na WWW httpgrantsnihgovgrantsguidenotice-filesNOT-OD-08-033html

Nature Springer (2016) Over 600 Springer Nature journals commit to new data sharing policies Disponiacutevel na WWW httpwwwspringernaturecombrgroupmediapress-releasesover-600-springer-nature-journals-commit-to-new-data-sharing-policies11111248

OECD (2007) Principles and Guidelines for Access to Research Data from Public Funding Paris OECD Publishing Disponiacutevel na WWW httpwwwoecdorgstisci-techoecdprinciplesandguidelinesforaccesstoresearchdatafrompublicfundinghtm

126

OECD (2013) Open Government data In Government at a Glance 2013 (pp 140-142) Paris OECD Publishing Disponiacutevel na WWW httpdxdoiorg101787gov_glance-2013-48-en

OECD (2015a) Making Open Science a Reality OECD Science Tecnology and Industy Policy Papers 25 Paris OECD Publications Disponiacutevel na WWW httpdoiorg1017875jrs2f963zs1-en

OECD (2015b) Assessing government initiatives on public sector information A review of the OECD Council Recommendation OECD Digital Economy Papers 248 Paris OECD Publishing Disponiacutevel na WWW httpdxdoiorg1017875js04dr9l47j-en

OECD (2016a) Open Government Data Disponiacutevel na WWW httpwwwoecdorggovdigital-governmentopen-government-datahtm

OECD (2016b) Observatory of Public Sector Innovation Disponiacutevel na WWW httpswwwoecdorggovernanceobservatory-public-sector-innovationhome

Olavsrud T (2013 Abril 05) 10 intriguing real-world uses for big data Computer World Disponiacutevel na WWW httpwwwcomputerworldcomarticle2473691big-data92712-10-Real-World-Big-Data-Deployments-That-Will-Change-Our-Liveshtml

Open Acess Directory (2016) Data repositories [Consultado a 22-02-2017] Disponiacutevel na WWW httpoadsimmonseduoadwikiData_repositories

OpenAIRE Research Data [Consultado a 12-05-2017] Disponiacutevel na WWW httpswwwopenaireeusearchfinddatasetskeyword=

OpenAIRE (2017) About OpenAIRE-Connect Disponiacutevel na WWW httpswwwopenaireeuconnect

Open and Agile Smart Cities (OASC) (2017) Cities [Consultado a 17-05-2017] Disponiacutevel na WWW httpwwwoascitiesorglist-of-cities

Open Data for Development Network (OD4D[a]) About OD4D [Consultado a 16-02-2017] Disponiacutevel na WWW httpod4dcomabout

Open Data for Development Network (OD4D[b]) Open Data Impact Map [Consultado a 16-02-2017] Disponiacutevel na WWW httpopendataimpactmaporgindexhtml

Open Data for Development Network (OD4D) (2016) Summary report and the Second Action Plan for International Collaborations International Open Data Roadmap International Open Data Conference 2016 6-7 outubro Madrid Espanha Disponiacutevel na WWW httpod4dcomroadmapassetsfilesreport-iodc-2016-webpdf

Open Data Institute (ODI) (2012) About the ODI Disponiacutevel na WWW httptheodiorgabout

Open Data Institute (ODI) (2015) Open Data Maturity Model assessing your open data publishing and use Disponiacutevel na WWW httpsptscribdcomdocument260481608ODI-Maturity-Model-Guide-Assessing-your-open-data-publishing-and-use

127

Open Data Soft (2017) A comprehensive list of 2600+ Open Data portals around the world [Consultado a 15-04-2017] Disponiacutevel na WWW httpswwwopendatasoftcoma-comprehensive-list-of-all-open-data-portals-around-the-world

Open Government Partnership (OGP) (2011) Open Government Declaration Disponiacutevel na WWW httpswwwopengovpartnershiporgopen-government-declaration

Open Government Partnership (OGP) (2015) What is the Open Government Partnership Disponiacutevel na WWW httpwwwopengovpartnershiporg

Open Government Partnership (OGP) (2016) PARIS DECLARATION 4th Global Summit of the Open Government Partnership Disponiacutevel na WWW httpwwwopengovpartnershiporgsitesdefaultfilesOGP-Summit_PARIS-DECLARATION_ENpdf

Open Knowledge International (OKI [a]) Open Definition 21 Disponiacutevel na WWW httpopendefinitionorgod21en

Open Knowledge International (OKI [b]) Linked Open Vocabularies [Consultado a 31-01-2017] Disponiacutevel na WWW httplovokfnorgdatasetlov

Open Knowledge International (OKI [c]) Open Data Commons Disponiacutevel na WWW httpopendatacommonsorg

Open Knowledge International (OKI [d]) Datahub [Consultado a 18-02-2017] Disponiacutevel na WWW httpsdatahubio

Open Knowledge International (OKI) (2012a) The Open Data Handbook Disponiacutevel na WWW httpopendatahandbookorgguideen

Open Knowledge International (OKI) (2012b) What is open Disponiacutevel na WWW httpsokfnorgopendata

Open Knowledge International (OKI) (2014) Portugal Open Data Census Disponiacutevel na WWW httppt-citycensusokfnorgyear2014

Open Knowledge International (OKI) (2017) Global Open Data Index Disponiacutevel na WWW httpindexokfnorgplace

Open Knowledge International Working Group on Open Government Data () Open Government Data Disponiacutevel na WWW httpopengovernmentdataorg

Open Science and Research Iniciative (2014) The Open Science and Research Handbook Disponiacutevel na WWW httpsavointiedefidocuments142730Open+Science+and+Research+Handbook+v1050316d5d-440b-4496-b039-2997663afff8

Open Science Monitor (2015) Open Science Monitor Disponiacutevel na WWW httpopendatamonitoreu

128

Pangea (2017) Search [Consultado a 18-05-2017] Disponiacutevel na WWW httpswwwpangaeadeq=Portugal

Panton Principles (2010) Panton Principles Principles for open data in science Disponiacutevel na WWW httppantonprinciplesorg

Pasqueto I Sands A amp Borgman C (2015 novembro) Exploring openess in data and science What is ldquoopenrdquo to whom when and why Apresentado em ASIST 2015 6 - 10 Novembro St Louis MO USA Disponiacutevel na WWW httponlinelibrarywileycomdoi101002pra220151450520100141full

Pontika N Knoth P Cancellieri M amp Pearce S (2015 outubro) Fostering Open Science to Research using a Taxonomy and an eLearning Portal Apresentado em I-KNOW rsquo15 Proceedings of the 15th International Conference on Knowledge Technologies and Data-Driven Busines 21 - 22 Outubro 2015 1ndash8 Graz Austria Disponiacutevel na WWW httpdoiorg10114528095632809571

Pontika N Knoth P Cancellieri M amp Pearce S (2015) Open Science Taxonomy Figshare Disponiacutevel na WWW httpsdxdoiorg106084m9figshare1508606v3

Portal de Dados de Biodiversidade de Portugal (2016) Dados [Consultado a 18-05-2017] Disponiacutevel na WWW httpdadosgbifpt

Portaria nordm 2852015 de 15 de setembro do Ministeacuterio da Educaccedilatildeo e Ciecircncia Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 180 (2015) 8011-8014 Disponiacutevel na WWW httpsdreptapplicationconteudo70297426 Porto Cacircmara Municipal Dados Abertos para uma cidade mais inteligente [Consultado a 22-05-2017] Disponiacutevel na WWW httpdadosabertoscm-portoptabout

Portugal Governo (2017) Portal da Transparecircncia Municipal [Consultado a 20-05-2017] Disponiacutevel na WWW httpswwwportalmunicipalpthomelocale=pt

Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior Ministeacuterio da Cultura (2016) Diretoacuterio dos Repositoacuterios Digitais Disponiacutevel na WWW httprepositorios-conhecimentopt

Portugal Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior (MCTES) (2016) Ciecircncia Aberta Conhecimento para todos Princiacutepios orientadores Disponiacutevel na WWW httpwwwportugalgovptmedia1850619920160210-mctes-ciencia-abertapdf

Price D amp Chaytor S (2015) Open Access is a national licence the answer Disponiacutevel na WWW httpwwwhepiacuk20150330open-access-national-licence-answeruna-licencia-nacional-es-la-respuesta

Proumll S Meixner K amp Rauber A (2016) Precise Data Identification Services for Long Tail Research Data Proceedings of International Conference on Digital Preservation Bern Switzerland Disponiacutevel na WWW httpswwwrd-allianceorgsystemfilesdocumentsiPRES2016-Proellpdf

129

Rans J Day M Duke M amp Ball A (2013) Enabling the citation of datasets generated through public health research (DCC) 41 Retrieved from httpswellcomeacuksitesdefaultfilesenabling-citation-of-datasets-through-public-health-research-phrdf-2013PDF

RECODE (2014) Policy recommendations for open access to research data Disponiacutevel na WWW httprecodeprojecteuwp-contentuploads201501recode_guideline_en_web_version_full_FINALpdf

Registry of Open Access Repository Mandates and Policies (ROARMAP) Browse [Consultado a 25-11-2016] Disponiacutevel na WWW httproarmapeprintsorgviewcountry620html

Reitano S (2013) The Benefits of Open Data Royal Roads University Disponiacutevel na WWW httpdocplayernet589190-The-benefits-of-open-datahtml

Resoluccedilatildeo do Conselho de Ministros nordm 912010 Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 225 (2010) 5288-5307 Disponiacutevel na WWW httpsdreptapplicationdirpdf1s201011225000528805307pdf

Resoluccedilatildeo do Conselho de Ministros nordm 212016 Diaacuterio da Repuacuteblica 1ordf seacuterie Nordm 70 (2016) 1191-1193 Disponiacutevel na WWW httpsdreptapplicationconteudo74094659

Research Data Alliance (RDA) (2015) 23 Things Libraries for Research Data Disponiacutevel na WWW httpswwwrd-allianceorgsystemfilesdocuments23Things_Libraries_For_Data_Managementpdf

Ribeiro C et al (2016) Projeto TAIL ndash Gestatildeo de dados de investigaccedilatildeo da produccedilatildeo ao depoacutesito e agrave partilha (resultados preliminares) Cadernos BAD 2 (jul-dez) 256-264 Disponiacutevel na WWW httpwwwbadptpublicacoesindexphpcadernosarticleviewFile1603pdf

Rouder J (2016) The what why and how of born-open data Behavior Research Methods 48(3) 1062-1069 Disponiacutevel na WWW httplinkspringercomarticle103758s13428-015-0630-z

Royal Society (2012) Science as an Open Enterprise The Royal Society Policy Centre Report 0212 Disponiacutevel na WWW httpsroyalsocietyorgtopics-policyprojectsscience-public-enterprisereport

Sasse T Smith A Broad E Tennison J Wells P amp Atz U (2017) Recomendations for Open Data Portals from Setup to sustainability Disponiacutevel na WWW httpswwweuropeandataportaleusitesdefaultfilesedp_s3wp4_sustainability_recommendationspdf

Schiermeier Q (2015 Dezembro 04) Pirate research-paper sites play hide-and-seek with publishers Nature Internacional weekly journal of science Disponiacutevel na WWW httpwwwnaturecomnewspirate-research-paper-sites-play-hide-and-seek-with-publishers-118876

130

Science International (2015) Open Data in a Big Data World Paris International Council for Science (ICSU) International Social Science Council (ISSC) The World Academy of Sciences (TWAS) InterAcademy Partnership (IAP) Disponiacutevel na WWW httpwwwscience-internationalorgsitesdefaultfilesreportsopen-data-in-big-data-world_short_enpdf

Science International (2016) About Science International Disponiacutevel na WWW httpwwwscience-internationalorgabout

ScienceOpen (2017) About ScienceOpen Disponiacutevel na WWW httpaboutscienceopencomcategoryabout-scienceopen

Sci-Hub About Disponiacutevel na WWW httpsci-hubio

Shadbolt N (2016) Foreword In Treadway J et al The state of open data a selections of analyses and articles about open data curated by Figshare (pp 2) Disponiacutevel na WWW httpsfigsharecomarticlesThe_State_of_Open_Data_Report40363981

SHERPAJULIET Research funders open access policies [Consultado a 26-11-2016] Disponiacutevel na WWW httpsherpaacukjulietindexphpla=enampmode=simple

SHERPARoMEO Publisher copyright policies amp self-archiving [Consultado a 26-11-2016] Disponiacutevel na WWW httpsherpaacukromeoindexphpla=enampfIDnum=1109|1ampmode=advanced

Soares N Baptista A amp Lima A (2015) Estudo Open Data Municiacutepios Quadrilaacutetero Disponiacutevel na WWW httpwwwccgptwp-contentuploads201510OpendataQuadrilatero_Estudopdf

SPARC Open Data Disponiacutevel na WWW httpsparcopenorgopen-data

Sponsoring Consortium for Open Access Publishing in Particle Physics (SCOAP3) (2014) What is SCOAP3 Disponiacutevel na WWW httpsscoap3orgwhat-is-scoap3

Statement on Data Sharing in Public Health Emergencies (2016) Disponiacutevel na WWW httpblogsplosorgplos201602statement-on-data-sharing-in-public-health-emergencies

Sturges P Bamkin M Anders J Hubbard B Hussain A amp Heeley M (2015) Research data sharing developing a stakeholder-driven model for journal policies Journal of the Association for Information Science and Technology 66(12) 2445-2455 Disponiacutevel na WWW httponlinelibrarywileycomdoi101002asi23336abstract

Suber P (2008) Open Access News Disponiacutevel na WWW httplegacyearlhamedu~petersfos200808greengold-oa-and-gratislibre-oahtml

Suber P (2009) Ten challenges for open-access journals SPARC Open Access Newsletter 138 Disponiacutevel na WWW httplegacyearlhamedu~petersfosnewsletter10-02-09htm

Suber P (2012) Open Access Cambridge MIT Press Disponiacutevel na WWW httpsmitpressmitedusitesdefaultfiles9780262517638_Open_Access_PDF_Versionpdf

131

Sunlight Foundation (2010) Ten Principles for Opening Up Government Information Disponiacutevel na WWW httpssunlightfoundationcompolicydocumentsten-open-data-principles

Sunlight Foundation (2013) Public Policy for Public Data Disponiacutevel na WWW httpwhatworkscitiessunlightfoundationcomsection-h2-02

Sunlight Foundation (2014) Guidelines for Open Data Policies Disponiacutevel na WWW httpssunlightfoundationcomopendataguidelines

Sunlight Foundation Open Data Policy Collection [Consultado a 12-05-2017] Disponiacutevel na WWW httpwwwopendatapoliciesorgbrowse

Swan A (2010) The open access citation advantage studies and results to date Disponiacutevel na WWW httpeprintssotonacuk2685162Citation_advantage_paperpdf

Swan A (2012) Diretrizes para as Poliacuteticas de desenvolvimento do acesso aberto UNESCO Paris Disponiacutevel na WWW httpunesdocunescoorgimages0021002158215863epdf

Tauberer Joshua (2014) Open Government Data The Book (2ordf ed) Disponiacutevel na WWW httpsopengovdataio20148-principles

Taunabaum G Implementing an Open Data Policy a SPARC Primer for Research Funders Disponiacutevel na WWW httpssparcopenorgwp-contentuploads201601sparc-open-data-primer-finalpdf

Transparecircncia e Integridade Associaccedilatildeo Ciacutevica (2016) Iacutendice de Transparecircncia Municipal Disponiacutevel na WWW httpstransparenciaptindice-de-transparencia-municipal

The UN Secretary Generals Independent Expert Advisory Group on a Data Revolution for Sustainable Development (2014a) UN Data Revolution Disponiacutevel na WWW httpwwwundatarevolutionorg

The UN Secretary Generals Independent Expert Advisory Group on a Data Revolution for Sustainable Development (2014b) A world that counts mobilising the data revolution for sustainable development Disponiacutevel na WWW httpwwwundatarevolutionorgwp-contentuploads201411A-World-That-Countspdf

The World Bank (2016) Open Government Data Toolkit Disponiacutevel na WWW httpopendatatoolkitworldbankorgenindexhtml

Ubaldi B (2013) Open Government Data Towards empirical analysis of open government data initiatives Disponiacutevel na WWW httpwwwoecd-ilibraryorggovernanceopen-government-data_5k46bj4f03s7-en

UK Data Archive (2017) Create amp Manage Data Research Data Lifecycle Disponiacutevel na WWW httpwwwdata-archiveacukcreate-managelife-cycle

UK The National Archives Open Government Licence for Public Sector Information Disponiacutevel na WWW httpwwwnationalarchivesgovukdocopen-government-licenceversion3

132

UNESCO (2015) Concepts of Openness and Open Access Open Access for Researchers Paris UNESCO Disponiacutevel na WWW httpunesdocunescoorgimages0023002322232207Epdf Uniatildeo Europeia (2013) REGULAMENTO (UE) Nordm 12912013 DO PARLAMENTO EUROPEU E DO CONSELHO de 11 de dezembro de 2013 Jornal Oficial da Uniatildeo Europeia Disponiacutevel na WWW httpeceuropaeuresearchparticipantsdatarefh2020legal_basisfph2020-eu-establact_ptpdf

Uniatildeo Europeia (2017) European Union Open Data Portal [Consultado a 12-05-2017] Disponiacutevel na WWW httpdataeuropaeueuodpendata

United Nations Statistics Division (2017) UN data a world of information [Consultado a 13-05-2017] Disponiacutevel na WWW httpdataunorgSearchaspxq=Portugalampt=Data

United States General Services Administration Datagov Disponiacutevel na WWW httpswwwdatagovopen-gov

Universidade do Minho (2017) Open Access Disponiacutevel na WWW httpsopenaccesssdumuminhoptpage_id=352

Universidade do Porto Faculdade de Engenharia (2017) Dendro The convergence between data management and description Disponiacutevel na WWW httpdendrofeupptblogindexphpdendro

Welcome Trust (2013) Open access policy Disponiacutevel na WWW httpswellcomeacukfundingmanaging-grantopen-access-policy

Whyte A amp Donnely M (2016) Common directions in research data policy a briefing for iInstitutions DCC Briefing Papers Edinburgh Digital Curation Centre Disponiacutevel na WWW httpwwwdccacukresourcesbriefing-paperscommon-directions-research-data-policycommon-directions-research-data-pol

World Council on City Data (2016) Data Portal [Consultado a 12-04-2017] Disponiacutevel na WWW httpopendataforcitiesorg

World Wide Web Consortium [W3C] (2014) Data Catalog Vocabulary (DCAT) Disponiacutevel na WWW httpswwww3orgTRvocab-dcat

World Wide Web Consortium [W3C] (2015) Linked Data Disponiacutevel na WWW httpswwww3orgstandardssemanticwebdata

World Wide Web Foundation (2014 maio) Towards common methods for assessing open data workshop report amp draft framework Apresentado em Towards common methods for assessing open data 2014 8 - 9 Maio Nova Iorque EUA Disponiacutevel na WWW httpopendataresearchorgsitesdefaultfilespostsCommon20Assessment20Workshop20Reportpdf

World Wide Web Foundation (2017) ODB Global Report Fourth Edition Disponiacutevel na WWW httpopendatabarometerorgdoc4thEditionODB-4thEdition-GlobalReportpdf

133

Zuiderwijk A Gasco M Parycek P amp Janssen M (2014) Special issue on transparency and open data policies guest editors introduction Journal of theoretical and applied electronic commerce research 9(3) I-IX Disponiacutevel na WWW httpwwwscieloclscielophpscript=sci_arttextamppid=S0718-18762014000300001

Zuiderwijk A amp Janssen M (2014) Open data policies their implementation and impact a comparison Framework Government Information Quaterly 31(1) 17-29 Disponiacutevel na WWW httpwwwsciencedirectcomsciencearticlepiiS0740624X13001202

134

LISTA DE SIGLAS AA - Acesso Aberto AMA - Agecircncia para a Modernizaccedilatildeo Administrativa APC - Article Processing Charge API - Application Programming Interface APIS - Arquivo Portuguecircs de Informaccedilatildeo Social BOAI - Budapest Open Access Initiative CA - Ciecircncia Aberta CADA - Comissatildeo de Aceso aos Documentos Administrativos CC - Creative Commons CERN - European Organization for Nuclear Research CML - Cacircmara Municipal de Lisboa DCAT - Data Catalog Vocabulary DCC - Digital Curation Center DDI - Data Documentation Initiative DGA - Dados Governamentais Abertos DMP - Data Management Plan DOAJ - Directory of Open Access Journals DOI - Digital Object Identifier EAGDA - Expert Advisory Group on Data Access e-IRG - e-Infrastructure Reflection Group EOSC - European Open Science Cloud ERAC - European Research Area and Innovation Committee EU - Uniatildeo Europeia EUA - Estados Unidos da Ameacuterica FCCN - Fundaccedilatildeo para a Computaccedilatildeo Cientiacutefica Nacional FCT - Fundaccedilatildeo para a Ciecircncia e Tecnologia FI - Fator de Impacto FOI - Freedom of Information FOSTER - Facilitate Open Science Training for European Research GBIF - Global Biodiversity Information Facility ICSU - International Council for Science INE - Instituto Nacional de Estatiacutestica IPCB - Instituto Politeacutecnico de Castelo Branco ITM - Iacutendice de Transparecircncia Municipal JISC - Joint Information Systems Committee MCTES - Ministeacuterio da Ciecircncia Tecnologia e Ensino Superior NIH - National Institutes of Health OAI-PMH - Open Archive Initiative ndash Protocol for Metadata Harvesting OD4D - Open Data for Development

135

ODC - Open Data Commons ODIN - Open Data Inventory ODRA - Open Data Readiness Assessment OECD - Organizaccedilatildeo para a Cooperaccedilatildeo e Desenvolvimento Econoacutemico OGD - Open Government data OGL - Open Government Licence OGP - Open Government Partnership OGWG - Open Government Working Group OKI - Open Knowledge International OpenDOAR - Directory of Open Access Repositories PLOS - Public Library of Science PSI - Public Sector Information RCAAP - Repositoacuterio Cientiacutefico de Acesso Aberto de Portugal RDA - Research Data Aliance RDF - Resource Description Framework Re3data - Registry of Research Data Repositories ROARMAP - Registry of Open Access Repository Mandates and Policies SARDC - Serviccedilo de Alojamento de Repositoacuterio de Dados Cientiacuteficos SCOAP3 - Sponsoring Consortium for Open Access Publishing in Particle Physics SNIAmb - Sistema Nacional de Informaccedilatildeo de Ambiente SOAP - Study of Open Access Publishing SPARC - Scholarly Publishing and Academic Resources Coalition W3C - World Wide Web Consortium

136

IacuteNDICE DE FIGURAS

Fig 1 Os pilares da Ciecircncia Aberta 17 Fig 2 As 5 escolas de pensamento das mudanccedilas operadas pela Ciecircncia Aberta 18 Fig 3 Caracteriacutesticas e indicadores do Open Science Monitor 20 Fig 4 Taxonomia da Ciecircncia Aberta 22 Fig 5 Paradigmas da investigaccedilatildeo cientiacutefica 25 Fig 6 Cadeia de abastecimento dos Dados Massivos 27 Fig 7 A cauda longa dos Dados Massivos 28 Fig 8 Ciclo de vida dos dados de investigaccedilatildeo 31 Fig 9 Tipos de dados cientiacuteficos 34 Fig 10 Esquema de classificaccedilatildeo das 5 estrelas para Dados Abertos Ligados 35 Fig 11 Pilares dos Dados Governamentais Abertos 40 Fig 12 Perspetivas da abertura dos dados governamentais 44 Fig 13 Esquema de classificaccedilatildeo das 5 estrelas para as iniciativas de abertura de dados que envolvem os utilizadores 45 Fig 14 Esquema de classificaccedilatildeo das 5 estrelas para os portais de dados 50 Fig 15 Princiacutepios FAIR Data 61 Fig 16 Estrutura de avaliaccedilatildeo de poliacuteticas de Dados Abertos 67

137

IacuteNDICE DE QUADROS

Quadro 1 Princiacutepios de abertura de dados de investigaccedilatildeo mais recomendados 33 Quadro 2 Princiacutepios de abertura mais recomendados pelas iniciativas de Dados Governamentais Abertos 43 Quadro 3 Visatildeo geral sobre o contexto conteuacutedo e desempenho da poliacutetica de Dados Abertos em Portugal com base no esquema delineado por Zuiderwijk e Janssen (2014) 85 Quadro 4 Comparaccedilatildeo dos resultados de abertura de dados atribuiacutedos pelas vaacuterias iniciativas de avaliaccedilatildeo 95 Quadro 5 Portais de dados abertos existentes em Portugal 97

138

IacuteNDICE DE GRAacuteFICOS

Graacutefico 1 Nuacutemero de datasets publicados no SARDC nos anos seguintes agrave sua criaccedilatildeo 80 Graacutefico 2 Maiores fornecedores de dados do portal nacional 87 Graacutefico 3 Tipologia dos fornecedores de dados do portal nacional 88 Graacutefico 4 Tipologia das categorias de dados do portal nacional 88

Page 6: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 7: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 8: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 9: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 10: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 11: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 12: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 13: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 14: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 15: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 16: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 17: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 18: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 19: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 20: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 21: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 22: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 23: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 24: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 25: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 26: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 27: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 28: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 29: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 30: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 31: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 32: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 33: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 34: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 35: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 36: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 37: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 38: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 39: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 40: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 41: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 42: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 43: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 44: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 45: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 46: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 47: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 48: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 49: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 50: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 51: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 52: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 53: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 54: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 55: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 56: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 57: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 58: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 59: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 60: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 61: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 62: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 63: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 64: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 65: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 66: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 67: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 68: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 69: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 70: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 71: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 72: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 73: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 74: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 75: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 76: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 77: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 78: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 79: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 80: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 81: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 82: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 83: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 84: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 85: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 86: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 87: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 88: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 89: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 90: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 91: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 92: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 93: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 94: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 95: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 96: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 97: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 98: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 99: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 100: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 101: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 102: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 103: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 104: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 105: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 106: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 107: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 108: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 109: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 110: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 111: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 112: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 113: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 114: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 115: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 116: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 117: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 118: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 119: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 120: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 121: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 122: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 123: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 124: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 125: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 126: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 127: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 128: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 129: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 130: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 131: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 132: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 133: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 134: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 135: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 136: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 137: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 138: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 139: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 140: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 141: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 142: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 143: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 144: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 145: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 146: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 147: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 148: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 149: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 150: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 151: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 152: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 153: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação
Page 154: As Políticas de Open Data em Portugal · 2020. 1. 21. · Paulo Fernando Pereira da Silva . As Políticas de Open Data em Portugal: análise da sua implementação e impacto . Dissertação