Guia bàsica per portar a terme un - Consorci Localret€¦ · 7 3. CLASSIFICACIÓ DE LES DADES...
Transcript of Guia bàsica per portar a terme un - Consorci Localret€¦ · 7 3. CLASSIFICACIÓ DE LES DADES...
Guia bàsica per portar a terme un
projecte de Dades Obertes d’un
Ajuntament (Open Data)
2015
3
ÍNDEX
1. INTRODUCCIÓ ................................................................................................................. 5
2. ELS PRINCIPIS DE LES DADES OBERTES .............................................................. 6
3. CLASSIFICACIÓ DE LES DADES OBERTES ............................................................ 7
3. Una (1) estrella........................................................................................................ 7
3.1. Dues (2) estrelles ................................................................................................ 8
3.2. Tres (3) estrelles ................................................................................................. 8
3.3. Quatre (4) i cinc (5) estrelles ............................................................................ 8
4. FORMATS .......................................................................................................................... 9
4.1. Formats propietaris ............................................................................................ 9
4.2. Formats lliures ................................................................................................... 10
4.3. Formats d’accés ................................................................................................ 14
4.4. Sistemes de compressió ................................................................................. 15
4.5. Interfícies de programació d’aplicacions (API) ............................................. 15
5. LOCALITZACIÓ DE LES DADES ................................................................................ 16
6. SELECCIÓ DE LES DADES PER A LA CATALOGACIÓ ......................................... 18
7. RESTRICCIONS EN LES PUBLICACIONS DE DADES ......................................... 19
8. CRITERIS DE SELECCIÓ DEL FORMAT DE LES DADES .................................... 20
8.1. Nivell de detall de les dades ........................................................................... 22
8.2. Qualitat i fiabilitat .............................................................................................. 22
8.3. Informació sobre com reflectir l'atribució a la font original. ........................ 23
9. TERMES D’ÚS I LLICENCIAMENT ............................................................................. 24
9.1. Modalitats de reutilització ................................................................................ 24
9.2. Modalitats de reutilització del portal de Dades Obertes de cada municipi o
ens local ........................................................................................................................... 25
9.3. Condicions d’ús – Avís legal ........................................................................... 26
9.4. Fórmules per a la citació de la font ................................................................ 28
10. PUBLICACIÓ DE LES DADES ..................................................................................... 29
10.1. Metadades ......................................................................................................... 29
10.1.1. Metadades obligatòries ................................................................................ 30
10.1.2. Metadades recomanades ............................................................................ 34
10.1.3. Metadades opcionals ................................................................................... 35
4
10.2. Proposta exemple ............................................................................................. 39
11. GLOSSARI DE TERMINOLOGIA ................................................................................ 40
12. ANNEX ............................................................................................................................. 46
RELACIÓ DE CONJUNTS DE DADES BÀSIC A OBRIR .................................................. 46
Agenda d'activitats del Municipi ............................................................................................. 47
Relació de datasets .................................................................................................................. 47
Calendari Fiscal d'aplicació al municipi per any .................................................................. 48
Calendari Laboral d'aplicació al municipi .............................................................................. 48
Pressupost de despeses de l'Ajuntament del Municipi ...................................................... 49
Pressupost d'ingressos de l'Ajuntament del Municipi ......................................................... 49
Catàleg d'ordenances de l'Ajuntament del Municipi ........................................................... 50
Carrerer ...................................................................................................................................... 50
Perfil de contractant de l'Ajuntament del Municipi ............................................................... 51
Equipaments ............................................................................................................................. 52
5
Aquest document s’ha elaborat amb la voluntat de ser una guia de treball per a
tot professional responsable de la gestió de les dades dins d’una organització
municipal amb la clara vocació de ser un document d’utilitat, ajuda i orientació en
el procés de catalogació de les dades que gestiona així com de les metadades
associades, per tal de disposar d’una metodologia correcta tant a nivell
d’interpretació com d’aplicació.
L'objectiu d'aquesta guia és proporcionar les indicacions necessàries per
elaborar, gestionar i mantenir tota la informació relativa a les metadades dels
conjunts de dades de forma coherent i d'acord amb la norma.
1. INTRODUCCIÓ
La Comissió Europea considera que les dades públiques han de ser reutilitzades,
tant per la ciutadania com per les empreses, ja que això, a més de transparència,
suposa un motor al desenvolupament de la societat de la informació i el
coneixement, sobretot per al sector dels continguts digitals.
Per aquest motiu, han legislat a favor amb la Llei 37/2007, de 16 de novembre,
sobre reutilització de la informació del sector públic, que transposa la Directiva
2003/98 / CE del Parlament Europeu i del Consell.
6
2. ELS PRINCIPIS DE LES DADES OBERTES
Sempre que publiquem dades en obert hem de seguir els principis que ens han
de permetre garantir que aquesta publicació es faci de manera adient i efectiva.
Per això, ens basem en els principis publicats per l’Open Government Data
(veure el següent enllaç original: https://public.resource.org/8_principles.html):
Complets: Han de proporcionar totes les dades amb l'única excepció
d'aquells que comptin amb especial protecció per qüestions de privacitat,
seguretat o similars.
Primaris: Les dades s'han de compartir tal com s'originen i amb el mateix
nivell de detall, sense modificacions, agregats o altres operacions
intermèdies addicionals.
En temps: Les dades es proporcionen en el moment adequat perquè no
perdin el seu valor per quedar obsolets.
Accessibles: Les dades estan disponibles de forma igualitària i equitativa
per a tots els usuaris.
Llegibles per màquines: Les dades estaran estructurades de manera que
permetin el seu tractament automatitzat.
No discriminatoris: L'accés a les dades serà obert i immediat sota
demanda sense requisits addicionals de registre o identificació.
Formats lliures: Les dades es publiquen en formats no propietaris per
maximitzar el seu potencial de reutilització.
Llicències obertes: Les dades es comparteixen lliures de drets, de manera
que qualsevol pugui usar-los, reutilitzar i redistribuir sense restriccions.
Al llarg d'aquesta guia s'explicaran una sèrie de pautes que són d'utilitat a l'hora
d'aconseguir complir amb aquests principis.
7
3. CLASSIFICACIÓ DE LES DADES OBERTES
El científic britànic considerat el pare de la Web i fundador del Consorci de la
World Wide Web, Tim Berners-Lee, va proposar una categorització del grau
d'obertura de les dades basada en estrelles, respecte a quant d’obertes i usables
són les dades que pot oferir una institució.
Una (1) estrella: Les dades han d'estar disponibles al web en qualsevol
format i sota una llicència oberta, perquè siguin considerades com dades
obertes.
Dues (2) estrelles: Les dades han de ser estructurades i en un format que
pugui ser interpretada o processada per màquines.
Tres (3) estrelles: Igual a l'anterior però en un format no propietari.
Quatre (4) estrelles: Tot l'anterior més la utilització d'estàndards
recomanats per w3c (RDF - SPARQL) per identificar coses.
Cinc (5) estrelles: Tot l'anterior més l'establiment de vincles amb les dades
d'altres (de tercers) i d'aquesta manera proveir context.
3. Una (1) Estrella
Segons la classificació abans descrita, qualsevol dada que estigui disponible a
la web en qualsevol format sota una llicència oberta, és una dada oberta de
categoria 1 estrella.
En el capítol següent s'explica que implica una llicència oberta, però a grans trets
és un document que expressa formalment i explícita les condicions sota les quals
podran ser utilitzades les dades publicades a disposició en un lloc web.
Llavors, resumint, qualsevol arxiu disponible en llocs web en format .PDF, .DOC,
.ODT, .TXT, entre d'altres; i que estigui sota una llicència oberta serà classificada
com a dada obert d'1 estrella.
8
3.1. Dues (2) estrelles
El nivell següent de classificació, és 2 estrelles. Ha de complir tot el que implica
estar a una (1) estrella (és a dir, publicat i sota una llicència oberta) i a més, les
dades han de ser estructurades i en un format que pugui ser interpretat o
processat per màquines. Per exemple, dades que es troben en format .XLS i
organitzades en una taula es podrien classificar com dues (2) estrelles.
3.2. Tres (3) estrelles
El nivell següent de classificació, tres (3) estrelles implica el mateix que els nivells
1 i 2 però el format ha de ser “no propietari”.
Per exemple, dades que es troben en format .CSV podrien classificar com tres
(3) estrelles. Un altre exemple, podria ser un arxiu en format .XML.
3.3. Quatre (4) i cinc (5) estrelles
Per tal que una dada oberta es consideri de quatre (4) estrelles ha de complir
amb les condicions anteriors i, a més, utilitzar estàndards recomanats per W3C
(Consorci internacional que fa recomanacions per a la World Wide Web) com
poden ser RDF, ODATA i SPARQL.
Els nivells 4 i 5 són considerats avançats i s'acosten molt a l'ideal de publicació
d'una dada oberta. Atès que en l'actualitat, s'està començant amb l'obertura de
dades, el nivell mínim exigible que tots els conjunts de dades obertes d’un ens
local que des del Consorci Localret considerem que cal assolir com a mínim, és
el nivell tres (3).
No obstant això, s'espera anar millorant de manera gradual i planificada per
aconseguir els nivells màxims en els casos de conjunts de dades que el cost-
benefici de realitzar l’esforç sigui considerat, per l’ens local, assumible.
9
4. FORMATS
Existeixen diferents tipologies de formats:
Formats propietaris
Formats lliures
Formats d’accés
Sistemes de compressió.
4.1. Formats propietaris
Són formats d’arxiu que requereixen eines que no són públiques. Entre els més
coneguts indicarem els de la suite de Microsoft o el format Shape dins de l’entorn
dels sistemes GIS (Sistemes d’Informació Geogràfica).
, DOC / . DOCX
Format tancat per transferir textos formatats o sense format. Pot
contenir textos, imatges, gràfiques i enllaços. Des de la versió 2007
es treballa amb un nou format, docx, que és més avançat i
comprimeix més el document.
Més informació office.microsoft.com/es-es/word
. XLS / .XLSX
Conté files i columnes de cel·les i cadascuna pot incloure dades,
que poden ser paraules, números o fórmules que tinguin dades i
dinàmicament resoldre equacions. Els fulls de càlcul XLS també
poden contenir taules i gràfics que mostren totes les seccions o de
les dades seleccionades. També, des de la versió 2007 es treballa
amb un nou format, xlsx, més avançat.
Més informació office.microsoft.com/es-es/excel/
10
.SHP (ESRI)
Shapefile és un format propietari de dades espacials que és
l’estàndard per a l’intercanvi d’informació geogràfica entre Sistemes
d’Informació Geogràfica (GIS). És un format vectorial
d’emmagatzematge digital on es guarda la localització d’elements
geogràfics i els atributs associats a aquest, però sense capacitat
per emmagatzemar informació topològica. El generen diversos
arxius, mínim tres i té tres tipus d’extensions: .shp, .shx i .dbf
Més informació www.esri.com/products/index.html#data_panel
4.2. Formats lliures
Són formats d’arxiu que es poden crear i manipular per qualsevol programari, llibre de restriccions legals.
.PDF (Format de Document Portàtil)
Document de format portable universal que manté l’aparença del
document independentment del sistema operatiu que s’utilitzi
(multiplataforma). Inclou qualsevol combinació de text, multimèdia
i hipertext i a més es pot xifrar el contingut i signar-lo digitalment.
És l’estàndard ISO, des de 2008, per a fitxers contenidors de
documents electrònics de cara a la preservació de llarga durada.
És una especificació que es pot crear, visualitzar o modificar amb
eines de software lliure. Aquest format originalment era propietari
(fins 2008).
Més informació www.adobe.com/es/products/acrobat/adobepdf.html
.ODF (Format de Document Obert per a Aplicacions Ofimàtiques OASIS)
Open Document és un format de fitxar estàndard per a
l’emmagatzematge de continguts ofimàtics com fulls de càlcul,
gràfiques i presentacions.
11
És l’estàndard per a l’intercanvi de text amb format. Les extensions
són:
text: .odt
full de càlcul: .ods
dibuix: .odg
gràfica: .odc
fórmula matemàtica: .odf
base de dades: .odb
imatge: .odi
document mestre: .odm
Més informació www.odfalliance.org/
.CSV (Valors separats per coma)
Tipus de documents en format obert senzill per representar dades
en format de taula, en columnes separades per comes (o punt i
coma, on la coma és el separador decimal) i les files són salts de
línia. Els camps que tenen una coma, un salt de línia o una cometa
doble s’han de tancar entre cometes dobles. No indica un joc
concret de caràcters, ni com van situats els bytes, ni el format per
al salt de línia. Les extensions que s’utilitzen són .csv i .txt.
Més informació tools.ietf.org/html/rfc4180
.XML (Llenguatge d’Etiquetat Extensible)
És un metallenguatge simple però estricte, desenvolupat per W3C.
Desenvolupa un paper fonamental en l’intercanvi d’una gran
varietat de dades. XML és un format que permet la interpretació de
dades a través de diverses aplicacions. És una simplificació i
adaptació del SGML i permet definir la gramàtica de llenguatges
específics. En realitat, XML és una manera de definir llenguatges
per a diferents necessitats.
Més informació www.w3.org/standards/xml/core
12
.TMX (Translation Memory eXchange)
Estàndard d’XML, que és un DTD (Definició de Tipus de Document)
que serveix per a l’intercanvi de memòries de traducció. Creat pel
comitè OSCAR (Open Standards for Container/Content Allowing
Re-use).
Més informació www.w3.org/2002/02/01-i18n-workshop/LocFormats#TMX - www.lisa.org/Translation-Memory-eXchange-TMX.34.0.html
.JSON (Notació d’Objectes de JavaScript)
Format lleuger d’intercanvi de dades, fàcil d’entendre per les
persones, i ofereix senzillesa a les màquines en la generació i
interpretació. Està basat en un subconjunt del llenguatge de
programació JavaScript, adequat per a la programació per part del
client.
Més informació json.org/json-es.html
.RDF-XML (Infraestructura per a Descripció de Recursos)
Model per a la representació dels recursos da la web en
expressions amb la forma subjecte-predicat-objecte. El subjecte és
el recurs que es descriu, el predicat és la propietat sobre la qual es
vol establir el recurs i l’objecte és el valor de la propietat amb el qual
s’estableix la relació. La combinació d’RDF amb altres eines permet
afegir significat a les pàgines i és una de les tecnologies essencials
13
per a la web semàntica. Per tal que sigui interpretable, es
representa en format XML.
Més informació www.w3.org/standards/techs/rdf#w3c_all
.KML-KMZ (Llenguatge d’Etiquetat d’Ull de Pany)
Gramàtica XML i format d’arxiu per a la creació de models i
emmagatzematge de funcions geogràfiques com punts, línies,
imatges, polígons i models que es mostraran principalment en
aplicacions de mapes. S’utilitza per compartir llocs i informació
entre aplicacions. És l’estàndard de l’Open Geospatial Consortium
i es pot fer servir a través de Google Earth. Els fitxers KML es
distribueixen comprimits com a fitxers KMZ.
Més informació code.google.com/intl/es/apis/kml/documentation/kmlreference.html - www.opengeospatial.org/standards/kml/
14
4.3. Formats d’accés
Són llenguatges per consultar arxius, tals com:
SPARQL (Protocol Simple i Llenguatge de consulta d’RDF)
Llenguatge estandarditzat per a la consulta de dades RDF,
normalitzat pel W3C. És una recomanació oficial del W3C des de
gener del 2008 per al desenvolupament de la web semàntica.
Més informació www.w3.org/standards/techs/sparql
Web services - API (Interfície de programació d’aplicacions)
Són interfícies de programació d’aplicacions (API) o l’API de la web
que s’accedeix a través d’HTTP i s’executa en un sistema remot
d’allotjament dels serveis sol·licitats. Els serveis web són sistemes
de software dissenyats per donar suport a la interacció
interoperable màquina a màquina sobre una xarxa. Té una interfície
descrita en un format processable per una màquina i uns altres
sistemes interactuen amb el servei web d’una manera prescrita per
la seva descripció utilitzant missatges SOAP, transmès a través
d’HTTP amb una serialització XML en conjunt amb altres normes
relacionades amb la web.
Més informació www.w3.org/TR/ws-gloss/ - www.w3.org/standards/techs/wsdl
WMS (Servei de Mapes Web)
Format que produeix mapes de dades referenciades espaialment,
de manera dinàmica, a partir d’informació geogràfica. És estàndard
internacional. Els mapes WMS es generen normalment en un
format d’imatge com PNG, GIF o JPG, i opcionalment com gràfics
vectorials en format SVD o WebCGM.
Més informació www.opengeospatial.org/standards/wms
15
4.4. Sistemes de compressió
ZIP
Format d’emmagatzematge sense pèrdua
que es pot utilitzar tant amb programes
propietat com lliures. Els arxius tenen
format .zip
Més informació www.pkware.com/support/zip-app-note/
4.5. Interfícies de programació d’aplicacions (API)
Com a valor afegit, proposem, si es disposa de la infraestructura tecnològica
necessària, habilitar una interfície de programació d’aplicacions (API) a
través de la qual els dispositius i aplicacions puguin consultar, cercar, filtrar i
ordenar les dades i així, per permetre el desenvolupament d'aplicacions de
tercers.
En aquest cas, recomanem marcar amb una etiqueta diferent, anomenada “api”,
tots els conjunts de dades que siguin accessibles a través de l'API de dades
obertes. Es tracta doncs d’una plataforma d'accés a les dades amb arquitectura
REST i que disposa d'una sintaxi unificada que permet que les aplicacions de
tercers puguin consultar, cercar, creuar, barrejar, filtrar, ordenar, geoposicionar,
paginar o transformar les dades en diferents formats.
Esmentar que aquest apartat, es fruit de l’aportació de la Diputació de Barcelona,
de la mà del servei de xxxxxxxx de la Direcció de Sistemes d’Informació de la
Diputació de Barcelona.
En l’enllaç següent es pot trobar tota la informació tècnica necessària sobre el
funcionament de l’API
http://dadesobertes.diba.cat/sites/dadesobertes.diba.cat/files/api_do_doc_tecni
ca_0.pdf
16
5. LOCALITZACIÓ DE LES DADES
Com a punt de partida inicial s'hauria de dur a terme un procés d'inventariat de
dades per conèixer quin és l'abast i l’extensió dels registres de dades existents.
Aquest inventari inicial s'ha de considerar només com el punt de partida inicial
d'un procés que ha d’expandir progressivament fins a incloure totes les àrees i
organismes. A més, atès que la producció i l’actualització de dades és contínua,
aquest procés s'ha de veure també com un aspecte cíclic i continu dins de cada
àrea i organisme on s'haurà de repetir i fer perdurable al llarg del temps.
En general, els gestors de les dades han d'assumir i assimilar com responsabilitat
pròpia tant la identificació inicial dels conjunts de dades existents com la posterior
detecció de nous conjunts de dades, així com dels canvis i actualitzacions que
es vagin produint en els mateixos.
Alguns moments durant el transcurs de l'activitat diària de qualsevol àrea o
organisme en què serà més fàcil que es produeixin nous conjunts de dades són:
Quan s'inicia una nova activitat o projecte;
Quan s'introdueixen canvis significatius que afectin les tecnologies i / o els
sistemes d'informació utilitzats;
Quan sigui necessària informació addicional per fonamentar una presa de
decisions, ja sigui davant de canvis prèviament planificats o per noves
situacions no previstes;
Quan apareixen noves necessitats d'informació demandades des d’altres
àrees o organismes;
Quan es produeixen canvis legislatius que afecten l'àmbit i objecte
d'actuació;
Quan es reben noves peticions de dades i informació per part de la
ciutadania o altres agents reutilitzadors;
17
A part de tot això, hi ha també altres factors que poden donar lloc a la generació
o actualització massiva de dades i que dependran dels procediments específics
establerts en cada àrea o organisme.
D'altra banda, quan les dades estan disponibles a través de mitjans no
electrònics - com ara publicacions impreses - o mitjançant suports físics - com
CD; DVDs; o altres - serà necessari localitzar la font original dels dades en les
bases de dades i sistemes interns, per tal de poder extreure el corresponent
conjunt de dades en format electrònic amb vista a la seva publicació.
A mitjà i llarg termini ha de plantejar també la digitalització de qualsevol contingut
que encara no estigui disponible en un format electrònic apropiat de cara a la
seva possible reutilització.
18
6. SELECCIÓ DE LES DADES PER A LA CATALOGACIÓ
L'objectiu a llarg termini és aconseguir catalogar totes les dades disponibles.
Sense això, atès que el temps i els recursos disponibles sempre seran limitats,
cada àrea o organisme, coneixedor del tipus d'informació que posseeix i de la
seva potencial audiència, ha de determinar quina informació és més valuosa des
del punt de vista de la reutilització per poder prioritzar la seva catalogació.
A causa del caràcter divers dels organismes i de la informació que gestionen la
priorització s'haurà d'adequar a les particularitats de cada cas. No obstant això,
existeixen també alguns criteris generals que s'han de valorar:
Normativa i legislació, atès que cada vegada és més freqüent l'existència
de normativa i recomanacions a nivell europeu, nacional o regional que
aconsella, o fins i tot estableix l'obligació, publicar cert tipus de
informació, ja sigui relativa a transparència o altres matèries.
Rellevància de les dades per a la ciutadania, valorant l'impacte i la
possible utilitat de les dades per a la ciutadania, especialment en aquells
casos en què ja s'hagin rebut peticions respecte a dades concretes.
Rellevància de les dades per a les empreses, valorant l'impacte i la
possible utilitat de les dades per a les empreses que faran ús,
especialment en aquells casos on hi hagi ja línies de treball
comuns en l'àmbit públic-privat.
Rellevància de les dades per a la pròpia Administració i organismes
relacionats, valorant el valor estratègic i la possible utilitat dels
dades per a ús intern del propi municipi o Ens Local.
Freqüència d'actualització de les dades. No és una norma global, atès que
dependrà de la naturalesa de la informació, però des del punt de vista de
la reutilització, les dades que són més dinàmiques i que canvien amb més
freqüència, ofereixen generalment més valor i més possibilitats de
reutilització que les dades estàtiques.
19
Volum de dades agrupades en conjunts, tenint en compte tant
el volum actual com les previsions de creixement futures perquè, com
a norma general, quant més quantitat de dades, més potencial de
reutilització.
En qualsevol cas, cada àrea o organisme podria també adaptar i completar la
seva pròpia llista de criteris de forma d'acord, tant al seu àmbit d'activitat i servei,
com a la normativa particular vigent.
7. RESTRICCIONS EN LES PUBLICACIONS DE DADES
Tot i que la norma general consisteix simplement a publicar tot, hi ha també
certes limitacions per causes de força major a l'hora de publicar dades que s’han
de respectar, com podria ser en els següents casos:
Que pel seu caràcter personal estiguin restringits per la Llei protecció de
dades de caràcter personal;
Que estiguin sotmesos al secret estadístic o la confidencialitat comercial;
Que afecten la defensa o la protecció de la seguretat pública;
Sobre els que hi hagi dret de propietat intel·lectual o industrial per part de
tercers;
Sobre els que existeixi prohibició o limitació en el dret d'accés, o per al
seu accés es requereixi ser titular d'un dret o interès legítim;
En qualsevol dels casos anteriors la informació sensible ha de ser filtrada i
extreta dels conjunts de dades prèviament a la seva publicació.
20
8. CRITERIS DE SELECCIÓ DEL FORMAT DE LES DADES
Un dels principals objectius a l'hora d'exposar les dades de caràcter públic
és permetre i facilitar el processament automàtic de les dades, ja que aquesta
és l'única manera de tractar grans quantitats de dades de manera eficient.
Perquè aquest processament a través de programes informàtics sigui possible
és necessari que la informació estigui organitzada en els formats adequats
perquè les dades puguin ser accessibles i tractades de forma automatitzada.
Alguns criteris a seguir a l'hora de seleccionar els formats adequats són:
1. Formats estructurats que siguin directament llegibles per les
màquines.
2. Els formats que siguin més demandats o populars entre els potencials
agents reutilitzadors o, si no, aquells formats d'ús
generalitzat en els principals sectors de consum de la informació i que
per tant suposen un estàndard, ja sigui oficial o de facto.
3. Formats oberts que permeten el seu ús sense restriccions de cap tipus,
ja sigui pel que fa a drets d'autor o patents, de manera que s'afavorirà
la igualtat d'oportunitats i fins i tot un possible estalvi de costos per a
totes les parts implicades. En cas contrari, encara que les dades fossin
publicades en obert estaríem obligats a emprar alguna tecnologia
específica lligada a un determinat proveïdor per a l'accés i / o posterior
tractament dels mateixos.
4. Formats compatibles amb el que estableix la Norma Tècnica
d’Interoperabilitat del Catàleg d’Estàndards sempre que sigui possible,
en particular pel que fa a formats de fitxers, gestió documental i
arxivística i semàntica.
5. Formats amb els que es pugui oferir també metainformació sobre els
esquemes o vocabularis utilitzats per representar la informació, com
per exemple XML o RDF4.
6. Oferir una varietat de formats diferents i complementaris de manera
simultània, sempre que siguin adequats per a les dades en qüestió.
D’aquesta manera serà més fàcil cobrir les necessitats d'un major
21
nombre de perfils de reutilitzadors amb diferents nivells de
coneixements tècnics i preferències (empresaris, emprenedors,
investigadors, periodistes, etc.)
L'objectiu ideal quant a formats seria aconseguir que la publicació de les
dades es realitzés sempre de manera que almenys una de les distribucions
utilitzés sempre un format obert, estàndard, estructurat i llegible per les
màquines.
Exemples freqüents d'aquest tipus de formats són: CSV (o TSV) per
dades tabulars, WMS per a mapes o XML per dades estructurades.
En qualsevol cas, i recordant que els esforços a curt termini haurien de centrar-
se a facilitar la reutilització directa i immediata del major nombre possible de
formats i mitjans actuals, a l'hora de decidir els formats finals haurà
buscar sempre un equilibri entre el potencial del format actual de cara a la
reutilització de dades i l'esforç que pot suposar per a l'àrea o organisme la
transformació de les dades a altres formats més apropiats.
22
8.1. Nivell de detall de les dades
Les dades s'han de proporcionar amb el major nivell de detall possible, de
manera que cada agent reutilitzador pugui ser capaç de realitzar amb
posterioritat el tractament de la informació que consideri necessari per als seus
fins específics.
És per tant important respectar el format i detall original de les dades tal
qual es generen en la seva font en la mesura
del possible, evitant qualsevol
modificació i alteració prèvia a la seva
publicació fins i tot encara que l'objectiu fos
facilitar la llegibilitat de la informació. L'única
excepció és el filtrat que pugui
ser necessari realitzar per qüestions de
privacitat, confidencialitat o
seguretat com s'ha comentat anteriorment.
De forma complementària es podrien oferir
també agregacions de dades amb
l'objectiu de facilitar-ne la interpretació. No
obstant això, mai hauria de ser com a
substitució de les dades desagregades, atès que es podria impedir l'accés a
certes dades que podrien ser rellevants per a les necessitats dels infomediaris.
8.2. Qualitat i fiabilitat
Els conjunts de dades publicades han de tenir també un contingut
raonablement fiable i adequat per ser directament explotat per qualsevol agent
reutilitzador, per la qual cosa no haurien de presentar problemes de qualitat o
fiabilitat més enllà del que és raonable en qualsevol cas.
Si no és així, serà necessari depurar prèviament les dades abans de la seva
publicació, determinant les mesures a prendre per dur a terme les reparacions
oportunes, amb l'objectiu de pal·liar els problemes que hagin estat prèviament
detectats.
23
8.3. Informació sobre com reflectir l'atribució a la font original
Si, de manera excepcional, una àrea o organisme optés per l'aplicació d'un règim
de llicenciament alternatiu per a la posada a disposició de les dades, és
recomanable que ho faci exclusivament a través d'alguna de les llicències-tipus
compatibles amb els principis de les dades obertes.
24
9. TERMES D’ÚS I LLICENCIAMENT
Amb el concepte reutilització de la informació generada pel sector públic ens
referim a l’ús que en poden fer persones, empreses i organitzacions per crear
nous productes i/o serveis per a altres públics o destinataris. La Llei 37/2007 (que
transposa la Directiva 2003/98/CE), de reutilització de la informació del sector
públic, i la Llei 29/2010, de l’ús dels mitjans electrònics al sector públic de
Catalunya, atenen aquesta rellevància de la informació per al desenvolupament
econòmic i són pals de paller de tota iniciativa d’obertura de dades.
9.1. Modalitats de reutilització
Segons l’article 4 de la Llei 37/2007, hi ha dues modalitats de reutilització de les
dades del sector públic:
1. Reutilització sense cap tipus de condició. Tot i que la informació
posada a disposició públicament queda exempta del compliment de
condicions per part dels reutilitzadors (empreses i usuaris), ha de
contenir un avís legal que estableixi els punts bàsics de compliment
que són:
Que el contingut de la informació no sigui alterat.
Que no es desnaturalitzi el sentit de la informació.
Que se'n citi la font.
Que es mencioni la data de la darrera actualització.
2. Reutilització amb subjecció a condicions que estableixin llicències -
tipus. Són dades que poden estar subjectes a drets de propietat
intel·lectual de l’Administració mateixa o de tercers (la majoria de
casos). En aquests casos, les llicències, a més de ser processables
electrònicament i estar en format digital, han de tenir en compte
aquests criteris:
25
Han de ser clares, justes i transparents.
No han de restringir les possibilitats de reutilització.
No han de ser discriminatòries per a categories comparables
de reutilització.
9.2. Modalitats de reutilització del portal de Dades Obertes de cada municipi o ens local
En cada conjunt o subconjunt de dades registrat en el catàleg oficial de cada
portal, s’ha d’especificar el tipus de reutilització que aplica entre les quatre que
recomana la “Guía de reutilización del Proyecto Aporta del Ministeri de Ciència i
Tecnologia (Plan Avanza)”.
Veure enllaç: www.aporta.es/web/guest/guia_reutilizacion
1. General: sense cap mena de restricció
més enllà de les condicions bàsiques
establertes en l’article 8 de la Llei 37/2007
(citació de la font, no alteració ni
desnaturalització de la informació i
especificació de la data d’última
actualització).
2. Les dades considerades obres (amb drets de propietat intel·lectual) es
posen a disposició de tercers per mitjà de llicències Creative
Commons, les de difusió més oberta, que permetin tant la finalitat
comercial, com la creació d’obres derivades.
3. En determinats casos, com és el cas de fotografies fetes per tercers,
la llicència de reutilització és la llicència Creative Commons de
Reconeixement – SenseObraDerivada BY-ND, és a dir, que es permeti
«l’ús comercial de l’obra però no la generació d’obres derivades».
26
4. Finalment, s’estableix una modalitat amb sol·licitud prèvia segons les
condicions de l’ens generador, del qual es facilitarà el contacte per
acordar els termes d’ús específics.
9.3. Condicions d’ús – Avís legal
En cadascuna de les modalitats esmentades i que es troben especificades en
cadascun del conjunt de dades del catàleg, les condicions d’ús són les següents:
1. La Llei 37/2007, de 16 de novembre, sobre reutilització de la informació
del sector públic, que transposa la Directiva 2003/98/CE del Parlament
Europeu i del Consell, regula la reutilització de la informació pública de
què disposen les administracions i organismes en què participen
majoritàriament, és a dir, el dret de tots els agents potencials del
mercat a la reutilització de la informació de les instàncies públiques.
Així mateix, la Llei 29/2010, de 3 d’agost, de l’ús dels mitjans
electrònics al sector públic de Catalunya, estableix que cal difondre
electrònicament la informació d’interès general per a la ciutadania
(trànsit, temps, medi ambient, cultura, salut, educació...).
D'acord amb aquesta normativa, sempre cal citar el titular i la font de
la informació. A canvi, l'Administració permet la reproducció (còpia), la
distribució (en les diferents formats: CD, llibre, vídeo...) i la
comunicació pública de l'obra (la difusió, per tant, via Internet i suports
digitals) i, a més, la transformació de l'obra per fer-ne obres derivades,
sempre que no es contradigui amb la llicència o avís que pugui tenir
una obra i que és la que preval, i tenir finalitat comercial (és a dir,
obtenir-ne guanys econòmics).
En aquest cas, per reutilitzar la informació, cal seguir les condicions següents:
a) No desnaturalitzar el sentit de la informació.
b) Citar sempre la font de la informació.
c) Mencionar la data de l'última actualització de la informació.
2. La reutilització es pot limitar per la tutela d'altres béns jurídics
prioritaris, com ara la protecció de les dades personals, la intimitat o
els drets de protecció intel·lectual de tercers. La reutilització d'obres
27
protegides per la propietat intel·lectual es formalitza mitjançant l'ús de
la llicència de Reconeixement Creative Commons CC BY 3.0
A la pràctica se'n permet la reproducció, la distribució, la comunicació
pública i la transformació per generar una obra derivada, sense cap
restricció, sempre que se'n citi l’autor, per exemple: Generalitat de
Catalunya.
La llicència completa es pot consultar a:
http://creativecommons.org/licenses/by/3.0/es/legalcode.ca
Reconeixement (by): Es permet qualsevol explotació de l'obra,
incloent-hi una finalitat comercial, així com la creació d'obres
derivades, la distribució de les quals també està permesa sense cap
restricció.
3. En el cas de les fotografies procedents dels serveis d’Arxius Municipals
o de Serveis de Comunicació dels municipis i altres tipus de dades on
hi ha participació de tercers, la reutilització es vehicula a través
d’alguna de la llicència Creative Commons Reconeixement –
SenseObraDerivada CC BY-ND 3.0
Reconeixement - SenseObraDerivada (by-nd): Es permet l'ús
comercial de l'obra però no la generació d'obres derivades.
4. En determinats casos, la reutilització només serà possible amb
sol·licitud prèvia a l’Ens generador de les dades, com per exemple les
del Institut Cartogràfic de Catalunya, les condicions del qual
28
s’especifiquen al seu web, al següent enllaç: www.icc.cat/cat/Home-
ICC/Inici/Condicions-d-us/(language)/cat-ES
Per tant, doncs, la utilització, reproducció, modificació o distribució dels conjunts
de dades suposa sempre l’obligació de reconèixer/citar al municipi o ens local en
qüestió com la font dels conjunts de dades de la forma següent:
Font de les dades: Consorci Localret [nom de l’organisme o ens autònom]
En qualsevol cas, l’acceptació dels termes d’ús no suposa la concessió dels drets
d’autor ni la propietat intel·lectual sobre els conjunts de dades.
El municipi o ens local s’ha de reservar el dret de publicar conjunts de dades per
als quals calgui satisfer el pagament de contraprestacions econòmiques. La
quantia d’aquestes contraprestacions tindrà com a objectiu cobrir els costos
associats a la producció, reproducció i difusió dels conjunts de dades i no pot ser
superior en cap cas. El llistat amb la quantia de les contraprestacions aplicables
es trobarà a disposició pública de forma concurrent a la publicació dels conjunts
de dades.
9.4. Fórmules per a la citació de la font
Com s’ha dit anteriorment, en qualsevol de les dues modalitats de reutilització
(sense cap tipus de condició via Llei 37/2007 i amb condicions per mitjà de
llicències Creative Commons BY o BY-ND), la fórmula exacta que s’ha de citar
en les dades per part de les empreses o usuaris reutilitzadors és aquesta:
Font: Consorci Localret. [nom de l’organisme o ens autònom]
29
10. PUBLICACIÓ DE LES DADES
Finalment, l'últim pas consistirà a posar a disposició pública tant els
conjunts de dades, com qualsevol altra informació addicional en forma de
metadades que pugui ser útil per a la seva localització, classificació i reutilització
amb l'objectiu que siguin accessibles per a la resta del món.
Les dades i metadades seran recopilades per part dels coordinadors
designats en les diferents àrees i organismes, per posteriorment ser
compartides per alguns dels mitjans posats a la seva disposició:
Plantilles de metadades.
Taules per a la càrrega massiva de dades automatitzada.
Directament a través de l'aplicació del catàleg accessible a través del
portal de dades obertes de cada municipi o ens local.
Amb vista a la seva publicació les dades han d'estar
disponibles, o bé a través d'un enllaç directe a la font original
de les dades, o bé a través d'algun tipus de
arxiu en qualsevol format que s'actualitzarà de forma manual
pujant un nou arxiu a la plataforma de forma periòdica amb la
freqüència que s'hagi establert en cada cas (d'aquesta manera
també es mantindrà un arxiu històric de l'evolució de les dades
que pot resultar molt útil).
10.1. Metadades
Les metadades són elements fonamentals a l'hora de catalogar els conjunts
de dades, ja que ens permetran classificar i trobar la informació
adequadament. Per tant, és molt important, no només proporcionar el major
nombre de metadades possible, sinó fer-ho també de la forma adequada,
seguint acuradament les indicacions que es donen en aquesta secció.
En cas de dubte pel que fa al significat o format d'algunes de les
metadades, és convenient consultar directament amb la coordinació general del
projecte per evitar problemes que puguin afectar després a la correcta
reutilització d'aquest conjunt de dades.
30
Les metadades es divideixen en:
Obligatòries: aquelles que, per la seva especial rellevància i també per
compliment amb la legislació vigent, serà obligat proporcionar.
Recomanades: aquelles que, si bé no serien obligatòries per complir
amb la legislació vigent, tanmateix és molt recomanable que es
proporcionin per la seva rellevància a l'hora de classificar les dades
adequadament.
Opcionals: aquelles que, tot i ser igualment recomanables, pot ser
que no sempre estiguin disponibles.
D'altra banda, al seu torn les diferents metadades a proporcionar de vegades
corresponen als conjunts de dades i altres a les diferents distribucions
que els componen.
a) Metadades Obligatòries: Títol, Descripció, Temàtica, Organisme,
Distribució i Format
b) Metadades Recomanades: Etiqueta/es, Llicència, Correu electrònic, Nom
i Descripció.
c) Metadades Opcionals: Data d’actualització, Freqüència d’actualització,
Àmbit geogràfic, Àmbit Temporal, Validesa, Referències, Normativa i
Informació sobre el format.
10.1.1. Metadades Obligatòries
En aquest apartat es descriuen les metadades mínimes que han de proporcionar,
tant per a cada un dels conjunts de dades que es vagin a publicar com per a
cadascun dels formats de distribució d'aquests conjunts.
CONJUNTS DE DADES
Títol: Correspon al nom representatiu del conjunt de dades.
Es recomana que sigui un text breu, que no superi les 10-12 paraules
aproximadament.
31
Descripció: Text descriptiu del contingut del conjunt de dades i les seves
principals característiques.
Es recomana incloure informació sobre el tipus dades que conté, el seu
origen, possible utilitat, limitacions, etc. encara que evitant replicar
informació que estigui disponible a través d'altres camps de metadades.
La descripció ha de ser el més completa possible però mantenint una
extensió raonable, no superior als 3-4 paràgrafs. Quan es tracti de
conjunts de dades d'una certa complexitat que necessitin una descripció
més àmplia, utilitzeu les metadades d'informació addicional per afegir una
referència a algun tipus de guia o manual que pugui estar disponible.
Temàtica/ques: Categoria o temàtica principal del conjunt de dades.
Es correspon amb un o diversos valors (no es recomana més de dos o
tres al consum) que haurem de seleccionar entre els disponibles a la
classificació oficial que s'aplica en el catàleg de dades que l’Ens Local
publiqui:
o Ciència i tecnologia
o Comerç
o Cultura i lleure
o Demografia
o Esport
o Economia
o Educació
o Ocupació
o Energia
o Hisenda
o Indústria
o Legislació i justícia
o Medi ambient
o Medi rural i pesca
o Salut
o Sector públic
o Seguretat
o Societat i benestar
o Transport
o Turisme
o Urbanisme/
infraestructures
o Habitatge
32
És important seleccionar les temàtiques més adequades, que en principi
no haurien d’estar directament relacionades amb l'estructura organitzativa
de l’Ens Local ni de cap de les seves àrees o organismes.
En el document amb la taxonomia del catàleg, s'inclourà també, a manera
d'orientació, una relació dels temes més comuns o possibles
subcategories que es corresponen amb cada temàtica principal.
Organisme: àrea o organisme responsable del conjunt de dades.
S'indicarà l'organisme responsable de les dades (ja sigui un determinat
Servei, Direcció, Departament, Entitat ...) dins de l'organigrama de l’Ens
Local.
Cal indicar sempre l'organisme amb la major especificitat possible (a nivell
de servei o similar). En cas de no estar clar, s'indicaria com a organisme
responsable al propi Ens Local.
33
DISTRIBUCIONS
Distribució: indicarà la forma de localitzar una distribució o recurs
específic del conjunt de dades.
El fitxer o recurs pot indicar d'una de les següents maneres:
Facilitant una adreça web (URL del tipus http://www.exemple.cat)
on es pot accedir al conjunt de dades en qüestió (fitxer, servei, etc.)
Seleccionant un fitxer des del nostre propi equip que contingui
directament les dades i es vulgui pujar a la plataforma.
Format: indica el format en què es troba representat el conjunt de dades.
El tipus de format generalment s'identifica amb un codi 3 o 4 lletres (CSV,
XLS, HTML o JSON per exemple) i se sol correspondre amb l'extensió de
l'arxiu on es guarden les dades. Alguns exemples de formats reutilitzables
que s'usen freqüentment són:
CSV: per a representar dades tabulars.
KML: per a representar informació geogràfica.
JSON: per a representar l'intercanvi de dades entre aplicacions.
ODS: per a representar fulls de càlcul.
PE: per a representar dades estadístiques.
RDF: per a representar recursos semàntics.
RSS: per a representar la distribució de continguts i informació
actualitzada.
SHP: per a representar dades espacials.
WMS: per a representar dades georeferenciades.
XLS: per a representar fulls de càlcul.
XML: per a representar vocabularis de dades personalitzades.
34
És recomanable introduir el format sempre en majúscules per facilitar la
seva llegibilitat, i sempre s'especificarà el format final de la distribució, mai
un intermedi.
(Per exemple: Si per accedir a una distribució d'un conjunt de dades en
format CSV hem de fer-ho a través d'una pàgina HTML intermèdia perquè
no tenim un accés directe, el format a indicar llavors serà CSV, no HTML).
Hi ha també un registre públic complet que recull tots els possibles tipus
de formats existents i que pot servir d'ajuda, però en cas de dubte és
recomanable posar-se en contacte amb el coordinador general del
projecte Open Data.
10.1.2. Metadades recomanades
En aquest apartat es descriuen les metadades addicionals recomanades que
s’haurien de proporcionar sempre que estiguin disponibles, tant per als conjunts
de dades com per a cadascun dels formats de distribució associats.
CONJUNTS DE DADES
Etiqueta/es: consisteix en una o diverses etiquetes textuals específiques
que serviran per classificar el conjunt de dades.
És preferible que les etiquetes estiguin compostes per una única paraula
(o com a màxim 2) i les diferents etiquetes s'introduiran separades entre
si per comes. És recomanable limitar-se a utilitzar un nombre d'etiquetes
raonable per a descriure cada conjunt de dades, no més de 3 o 4 per
exemple, prioritzant aquelles que considerem més relacionades amb el
conjunt en qüestió i procurant també que es complementin amb les
temàtiques principals que s'han seleccionat prèviament.
Llicència: nom de les condicions d'ús o la llicència aplicable a les dades.
En general s'utilitzaran sempre els termes d'ús per a la “Reutilizació de la
informació del sector públic en l'àmbit del sector públic estatal” que ja han
estat descrits en l'apartat de llicències d'ús d'aquesta guia.
35
VEURE APARTAT CORRESPONENT D’AQUESTA GUIA.
Correu electrònic de l'autor: informació de contacte amb l'autor.
Es correspon amb un correu electrònic general de contacte amb l'àrea o
organisme que publica les dades, o el correu del responsable directe de
les dades en qüestió.
DISTRIBUCIONS
Nom: Correspon al títol representatiu d'una distribució del conjunt
de dades.
Es recomana que sigui un text breu, no superior a les 10-12 paraules, i
que serveixi per diferenciar la distribució en qüestió de qualsevol altra,
indicant per exemple les característiques o la forma d'accés que la
diferència de la resta.
Descripció: Text descriptiu del contingut de la distribució.
La descripció ha de tenir una extensió raonable de menys de 2-3
paràgrafs. Es recomana centrar-se en qualsevol informació distintiva que
sigui particular de la distribució en qüestió.
10.1.3. Metadades opcionals
En aquest apartat es descriuen altres metadades addicionals que es poden
proporcionar per a un conjunt de dades específic. Encara que no sigui obligatori
emplenar els camps sol·licitats en aquest apartat, si la seva informació és
coneguda o de fàcil obtenció, és molt recomanable facilitar per millorar la
qualitat i utilitat de les metadades disponibles.
36
CONJUNTS DE DADES
Data d'actualització: data de l’última actualització del conjunt de dades.
S'ha d'indicar la data d'última actualització realitzada al contingut del
conjunt de dades (no en les metadades) seguint el format AAAA-MM-DD,
és a dir, l'any amb un nombre de quatre xifres, el mes amb un nombre
sempre de dues xifres (del 01 al 12) i el dia amb un nombre sempre de
dues xifres (del 01 al 31).
Per exemple: 2014-11-14 per al 14 de novembre del 2014.
Freqüència d'actualització: representa el període de temps estimat que
transcorre entre cada actualització del conjunt de dades.
Es representarà a través del valor més aproximat dins de les següents
mesures (Ordenades de major a menor freqüència):
Triennal; biennal; anual; semestral; trimestral; mensual; quinzenal;
setmanal; diària, horària i instantània.
Per exemple:
Actualització tots els anys: anual
Actualització cada 3 mesos: trimestral
Actualització 2 vegades al mes: quinzenal
Actualització 2 vegades al dia: diària
Àmbit geogràfic: representa l'espai geogràfic cobert per les dades.
Si coincideix amb l'àmbit general del Catàleg (el municipi o Ens Local) no
caldrà indicar-ho, però sí en el cas que sigui qualsevol altre (província,
comarca, etc.).
Cal indicar sempre l'àmbit geogràfic amb la major especificitat aplicable a
cada cas (ja sigui en l’àmbit de la província, la comarca o el municipi). En
cas de no tenir clar l'àmbit d'aplicació, s'indicaria aquesta particularitat.
37
Àmbit temporal: identifica la data inicial i la data final del període de
temps cobert pel conjunt de dades.
Es tracta de dues dates corresponent a l'inici i a la fi del període temporal
cobert per les dades en la forma AAAA-MM-DD, és a dir, l'any amb un
nombre de quatre xifres, el mes amb un nombre sempre de dues xifres
(del 01 al 12) i el dia amb un nombre sempre de dues xifres (del 01 al 31).
Per exemple: inici 2013.01.01 i fi 2013.12.31 seria el període des de l’1 de
gener de 2013 fins al 31 de desembre de 2013.
Validesa: identifica la data final de validesa o caducitat de les dades a
partir de la qual poden perdre la seva rellevància per qualsevol motiu
(modificació, actualització, etc.)
S'ha d'indicar la data de fi de validesa de les dades seguint el format
AAAA-MM-DD, és a dir, l'any amb un nombre de quatre xifres, el mes amb
un nombre sempre de dos xifres (del 01 al 12) i el dia amb un nombre
sempre de dues xifres (del 01 al 31).
Per exemple: 2014.01.31 indicaria que les dades serien vàlides fins al 31
de desembre de 2014.
Referències addicionals: adreces web (URL del tipus
http://www.exemple.cat) de pàgines, documents o altres recursos que
continguin informació ampliada sobre el conjunt de dada.
Per exemple, podria tractar-se d'un enllaç a un document en format PDF
on es explica la metodologia per a la recollida d'aquestes dades o un
enllaç a una aplicació interactiva a través de la qual s'expliquen les dades
d'una forma visual.
38
Normativa: adreces web (URL del tipus http://www.exemple.cat) de
pàgines, documents o altres recursos que continguin normativa relativa al
conjunt de dades.
Per exemple podria enllaçar-se a una pàgina web que mostri una llei o
ordenança que reguli les dades contingudes en el conjunt.
DISTRIBUCIONS
Informació sobre el format: adreces web (URL del tipus
http://www.exemple.cat) de pàgines, documents o altres recursos que
continguin
informació addicional, generalment de caràcter tècnic, sobre els formats
utilitzats per les distribucions.
Per exemple, podria tractar-se d'un enllaç a una pàgina web on pot
trobar més informació sobre el format emprat, o un enllaç a un esquema
XSD associat a un conjunt de dades en format XML.
39
10.2. Proposta exemple
Títol del conjunt de dades
Descripció Descripció del conjunt de dades
Temes Llistat de totes les empreses del municipi amb les
dades de contacte i tipus d'activitat que
desenvolupen. També inclou les dades dels
professionals que exerceixen la seva activitat al
nostre municipi i que han autoritzat a l'Ajuntament
la seva publicació
Etiquetes
Correu
electrònic
autor
Organisme
Empresa, Activitats, Cens, Economia
Ajuntament de “Municipi” o Organisme municipal
Creat 20/12/2012
Actualitzat 19/03/2015
Freqüència Diari
Llicència CC BY 3.0: Es permet qualsevol explotació de
l'obra, incloent una finalitat comercial, així com la
creació d'obres derivades, la distribució de les
quals també està permesa sense cap restricció.
40
11. GLOSSARI DE TERMINOLOGIA
API: Interfície de programació d'aplicacions (IPA) o API (de l'anglès Application
Programming Interface) és un canal estàndard de comunicació entre diferents
components o sistemes de programari.
Referència:
http://es.wikipedia.org/wiki/Interfaz_de_programaci%C3%B3n_de_aplicaciones.
Creative Commons: Llicència que defineix l'espai entre la protecció absoluta dels
drets d'autor i el domini públic. Les llicències t'ajuden a conservar els teus drets
autorals convidant a fer servir la teva obra sota l'esquema "Alguns drets
reservats". Referència:
http://www.creativecommons.mx/que/.
CSV: Format senzill i obert per a representar dades en forma de taula, en què
les columnes es separen per comes. En els casos en què un valor contingui
coma (com el separador decimal en alguns països), es recomana tancar entre
cometes els valors o utilitzar un altre separador com a "punt i coma" o "tabulador".
Referència:
http://es.wikipedia.org/wiki/Comma-separated_values.
DCAT: Vocabulari dissenyat per la W3C per facilitar la interoperabilitat entre
catàlegs de dades publicades a la web. En utilitzar DCAT per descriure conjunt
de dades en catàlegs, els publicadors incrementen la facilitat de descobriment i
la manipulació d'aquests catàlegs.
http://www.w3.org/TR/vocab-dcat/.
GeoJSON: Format nou basat en JSON per codificar una varietat d'estructures de
dades geogràfiques. Sota aquest format es poden representar objectes
41
geomètrics, una qualitat o una col·lecció d'aquestes. Els tipus geomètrics
suportats són punts, línies, polígons, multipunt, entre d'altres.
Referència: http://geojson.org.
ISO 8601: La norma ISO 8601 especifica la notació estàndard utilitzada per
representar instants, intervals i intervals recurrents de temps evitant ambigüitats.
Se segueix el criteri d'especificar en ordre primerament els períodes de temps
més llargs i posteriorment els més curts. Per exemple, per especificar la data 30
de maig de 2008, escriurem en aquesta notació: 2008-05-30.
http://es.wikipedia.org/wiki/ISO_8601
ISO 8859-1 (latin-1): Norma ISO que defineix la codificació de caràcters, cobrint
els caràcters especials de l'espanyol (http://es.wikipedia.org/wiki/ISO_8859-1).
Aquesta guia recomana l'estàndard UTF-8 ja que, a més d'incloure'l els caràcters
d'aquesta norma (http://es.wikipedia.org/wiki/ISO_8859-1), s'estén a un rang
més gran i s'ha convertit en l'estàndard d’utilització majoritària en la web
http://googleblog.blogspot.ca/2012/02/unicode-over-60-percent-of-web.html
JSON: Format lleuger (i llegible) per a l'intercanvi de dades. Donada la seva
simplicitat d'estructura, s'ha generalitzat el seu ús en la web.
Referència: http://es.wikipedia.org/wiki/JSON.
KML: Llenguatge de marcat basat en XML per representar dades geogràfiques
en tres dimensions, característic de l'eina Google Earth. Un arxiu KML descriu
elements, com a llocs, imatges, o polígons, que a més contenen títol, descripció,
coordenades geogràfiques i alguna altra informació. Des de 2008 és un
estàndard en la indústria i és aprovat per l'OGC. Referències:
http://es.wikipedia.org/wiki/Keyhole_Markup_Language,
https://developers.google.com/kml/documentation/kml_tut,
http://www.opengeospatial.org/standards/kml.
42
KMZ: Els KML sovint solen distribuir comprimits com arxius KMZ.
Llenguatge de marcat: Un llenguatge de marcat o llenguatge de marques és una
forma de codificar un document que, juntament amb el text, incorpora etiquetes
o marques que contenen informació addicional sobre l'estructura del text o la
seva presentació. El llenguatge de marques més estès és l'HTML (HyperText
Markup Language, Llenguatge de marcat d'hipertext), fonament del World Wide
Web.
http://es.wikipedia.org/wiki/Lenguaje_de_marcado.
Metadades: (del grec μετα, meta, 'després de, més enllà de' i llatí datum, 'el que
es dóna', «dada»), literalment «sobre dades», són dades que descriuen altres
dades. En general, un grup de metadades es refereix a un grup de dades,
anomenat recurs. El concepte de metadades és anàleg a l'ús d'índexs per
localitzar objectes en comptes de dades. Per exemple, en una biblioteca s'usen
fitxes que especifiquen autors, títols, cases editorials i llocs per buscar llibres.
Així, les metadades ajuden a situar dades.
http://es.wikipedia.org/wiki/Metadata.
ODbL (Open Database License): Llicència orientada a bases de dades, la qual
permet copiar, distribuir, remesclar, modificar i crear a partir d'aquesta obra, fins
i tot amb finalitats comercials, sempre que es doni crèdit a la font creadora i es
mantingui la mateixa llicència per a qualsevol obra derivada.
http://opendatacommons.org/licenses/odbl.
http://users.ecs.soton.ac.uk/nrs/
ODI: L'Open Data Institute és una companyia independent, sense ànim de lucre,
fundada per Sir Tim Berners-Lee i el Professor Nigel Shadbolt amb l'objectiu de
catalitzar la cultura de dades obertes per crear valor econòmic i social.
http://theodi.org/about.
43
Office Open XML: També anomenat OOXML, és un format d'arxiu obert i
estàndard, les extensions més comunes són .docx, .xlsx, i .pptx. Se li utilitza per
representar i emmagatzemar fulls de càlcul, gràfiques, presentacions i
documents de text. Un arxiu Office Open XML conté principalment dades
basades en el llenguatge de marcat XML, comprimits en un contenidor .zip
específic.
http://es.wikipedia.org/wiki/Office_Open_XML.
OGC: L'Open Geospatial Consortium és un consorci internacional, amb més de
400 companyies, agències de govern i universitats, participant en els processos
per desenvolupar estàndards públics, particularment enfocats a la informació
geoespacial.
http://www.opengeospatial.org/ogc.
PDF: El format de document portàtil, inventat per Adobe Systems, és un
estàndard obert per a l'intercanvi de documents electrònics que manté
l'Organització Internacional de Normalització (ISO).
RDF: Format de la W3C dissenyat per generar un model de dades que descrigui
la informació d'un recurs web. Aquest mecanisme és un component clau de la
Web Semàntica.
REST: Conjunt de principis d'arquitectura de programari per a sistemes
distribuïts com la World Wide Web. En l'actualitat s'utilitza el terme per a
descriure qualsevol interfície web simple sense les abstraccions addicionals dels
protocols basats en patrons d'intercanvi de missatges, com el protocol de serveis
web "SOAP".
http://es.wikipedia.org/wiki/Representational_State_Transfer.
44
Servei web: Un servei web (en anglès, Web Service o Web services) és una
tecnologia que utilitza un conjunt de protocols i estàndards que serveixen per
intercanviar dades entre aplicacions.
http://es.wikipedia.org/wiki/Servicio_web.
SHP: Format de dades geoespacials propietari de l'empresa ESRI. Donada la
seva popularitat, la seva especificació tècnica és pública i fins a cert punt oberta.
Un shapefile (com s'anomenen als arxius d'aquest format) és un format vectorial
que guarda la localització d'elements geogràfics i els atributs associats a ells. El
format és multi, és a dir, es genera en conjunt amb arxius .shx i .dbf, els quals
defineixen (respectivament) l'índex de les dependències i entitats geomètriques
i la base de dades dels atributs dels objectes.
http://es.wikipedia.org/wiki/Shapefile.
SOAP: SOAP (sigles de Simple Object Access Protocol) és un protocol
estàndard que defineix com dos objectes en diferents processos poden
comunicar-se per mitjà d'intercanvi de dades XML. És un dels protocols utilitzats
en els serveis web.
http://es.wikipedia.org/wiki/Simple_Object_Access_Protocol.
URL: Un localitzador de recursos uniforme, més comunament denominat URL
(sigla en anglès de Uniform Resoxurce Locator), és una seqüència de caràcters,
d'acord a un format modèlic i estàndard, que s'usa per nomenar recursos a
Internet per a la seva localització o identificació, com ara documents textuals,
imatges, vídeos, presentacions digitals, etc.
http://es.wikipedia.org/wiki/Localizador_uniforme_de_recursos.
UTF-8: UTF-8 (8 bits Unicode Transformation Format) és un format de codificació
de caràcters Unicode i ISO 10646 (http://es.wikipedia.org/wiki/UTF-8). Aquest
format és el més utilitzat en la web
http://w3techs.com/technologies/overview/character_encoding/all
45
W3C: El World Wide Web Consortium, abreujat W3C, és un consorci
internacional que produeix recomanacions per a la World Wide Web. Dirigit per
Tim Berners-Lee, conegut com el pare de la web.
Referència: http://es.wikipedia.org/wiki/World_Wide_Web_Consortium.
XML: Llenguatge de marcat desenvolupat per la W3C per emmagatzemar dades
en forma llegible i estructurada, que proposa un estàndard per a l'intercanvi
d'informació entre diferents plataformes.
Referència: http://es.wikipedia.org/wiki/XML.
46
12. ANNEX
RELACIÓ DE CONJUNTS DE DADES BÀSIC A OBRIR
En aquest annex es descriuen els 10 datasets que es considera de més importància per tal d’obrir a tot municipi que vulgui iniciar-se en el procés d’obertura i publicació de dades. Aquests conjunts de dades són:
Agenda d’activitats del municipi
Relació de datasets
Calendari Fiscal d'aplicació al municipi per any
Calendari Laboral d'aplicació al municipi
Pressupost de despeses de l'Ajuntament del municipi
Pressupost d'ingressos de l'Ajuntament del municipi
Catàleg d'ordenances de l'Ajuntament del municipi
Carrerer
Perfil de contractant de l'Ajuntament del municipi
A més, es proposa oferir informació geolocalitzada en forma de mapes al respecte d’informació com: Biblioteques, farmàcies, zones blaves/verdes, zones de càrrega i descàrrega, parades de taxi, parades d’autobusos, etc.
47
Agenda d'activitats del Municipi
Descripció Informació de tots els actes (culturals, esportius, etc.) que es realitzen a un Municipi, tant si són organitzats per l'Ajuntament com per altres entitats públiques o privades
Temes Agenda d'actes
Etiquetes Cultura, Actes, Activitats, Agenda, Esports, Esdevemiments, Oci
Freqüència Diari
RELACIÓ DE CAMPS A INCLOURE EN EL DATASET ID ACTE DESCRIPCIO CORREU ELECTRÒNIC_ACTE WEB_ACTE A_CARREC LLOC DATA_INI DATA_FI GRATUIT PREU HORA_INI HORA_FI IMATGE
DISTRICTE TIPUS_ACTE OBSERVACIONS CICLE DESCRIPCIO_CICLE CICLE_DATA_INI CICLE_DATA_FI DATA_PUB X Y LONGITUD LATITUD URL
Relació de datasets
Descripció Relació dels conjunts de dades publicats al portal Open Data del Municipi
Temes Catàleg Conjunts de dades
Etiquetes Catàleg, Conjunts de dades, Categories, Temes
Freqüència Mensual
48
RELACIÓ DE CAMPS A INCLOURE EN EL DATASET NOM_CA NOM_ES NOM_EN DESCRIPCIO_CA
DESCRIPCIO_ES DESCRIPCIO_EN LLICENCIA D_ULTIMA_ACTUALITZACIO
Calendari Fiscal d'aplicació al municipi per any
Descripció Calendari Fiscal d'aplicació al municipi per any des de l’inici de la publicació
Temes Administració Municipal
Etiquetes Municipal, Nom_Municipi, Calendari, Fiscal
Freqüència Anual
RELACIÓ DE CAMPS A INCLOURE EN EL DATASET ANY_TRIBUT TAXES_IMPOSTOS PERIODE_PAGAMENT
DATA_LIMIT_DOMICILIAR PERCENTATGE_DESCOMPTE
Calendari Laboral d'aplicació al municipi
Descripció Calendari Laboral d'aplicació al municipi
Temes Administració Municipal, Calendaris
Etiquetes Municipal, Nom_Municipi, Calendari, Laboral
Freqüència Anual
RELACIÓ DE CAMPS A INCLOURE EN EL DATASET Data/Fecha Descripció/Descripción Àmbit/Ámbito
49
Pressupost de despeses de l'Ajuntament del Municipi
Descripció Pressupost definitiu i liquidació de les quantitats que l'Ajuntament té previst gastar en l'exercici econòmic vigent, amb el seu detall per Àrea, Servei, Programa, Capítol i concepte de la despesa
Temes Despeses
Etiquetes Despeses, Pressupost
Freqüència Mensual
RELACIÓ DE CAMPS A INCLOURE EN EL DATASET AREA SERVEI PROGRAMA CAPITOL
PARTIDA DESCRIPCIO_PARTIDA PRESSUPOST_DEFINITIU LIQUIDACIO
Pressupost d'ingressos de l'Ajuntament del Municipi
Descripció Pressupost definitiu i liquidació de totes les quantitats que l'Ajuntament té previst ingressar en l'exercici econòmic vigent amb indicació del concepte pel qual s'ingressen: impostos, taxes, preus públics, transferències de l'Administració General de l'Estat, interessos, etc.
Temes Ingressos
Etiquetes Ingressos, Pressupost
Freqüència Mensual
RELACIÓ DE CAMPS A INCLOURE EN EL DATASET PARTIDA DESCRIPCIO_PARTIDA PRESSUPOST_DEFINITIU LIQUIDACIO
50
Catàleg d'ordenances de l'Ajuntament del Municipi
Descripció Llistat de totes les ordenances municipals aprovades per l'Ajuntament del Municipi i en vigor, amb enllaços als respectius documents normatius
Temes Ordenances Municipals
Etiquetes Ordenances
Freqüència Mensual
RELACIÓ DE CAMPS A INCLOURE EN EL DATASET CODI_NORMATIVA TITOL AMBIT URL
DESCRIPCIO DATA_INI_VIGENCIA DATA_FI_VIGENCIA WEB
Carrerer
Descripció Relació dels carrers de la ciutat
Temes Cartografia
Etiquetes Carrerers, Cartografia, Mapes, Plànols
Freqüència Mensual
Si hi ha possibilitat de donar la mateixa informació, per codis postals, per barris i per districtes.
51
Perfil de contractant de l'Ajuntament del Municipi
Descripció Llista de tots els expedients de contractació d'obres, subministraments o serveis, així com l'estat en que es troben
Temes Perfil de contractant
Etiquetes Perfil de contractant
Freqüència Setmanal
RELACIÓ DE CAMPS A INCLOURE EN EL DATASET DESCRIPCIO TIPUS_PROCEDIMENT CLASSIFICACIO ETAPA_ACTIVA DATA_ALTA TEXT DATA_TERMINI DATA_INI_PUBLICACIO TIPUS_EXPEDIENT NUM_EXPEDIENT
ANY_EXPEDIENT DATA_OBERTURA_PLIQUES_B HORA_OBERTURA_PLIQUES_B LLOC_OBERTURA_PLIQUES_B DATA_OBERTURA_PLIQUES_C HORA_OBERTURA_PLIQUES_C LLOC_OBERTURA_PLIQUES_C ORGAN_CONTRACTACIO TIPUS_TRAMITACIO WEB
52
Equipaments
Descripció Llista de tots els equipaments de l'Ajuntament del Municipi (administratius, cívics, esportius, etc.) i dels equipaments administratius de la Generalitat de Catalunya i de l'Administració General de l'Estat
Temes Equipaments
Etiquetes Equipaments
Freqüència Diari
RELACIÓ DE CAMPS A INCLOURE EN EL DATASET
ID_ENTITAT DESCRIPCIÓ NOM TELÈFON CORREU ELECTRÒNIC SIGLA CARRER NÚM BIS ESCALA PIS
PORTA CODI_POSTAL CIUTAT X Y LONGITUD LATITUD ATENCIÓ_CIUTADANA URL SECTOR
53
54