Charla a Consejo para la Transparencia, 27 de noviembre de 2013

54
Archivos, transparencia y web semántica 27 de noviembre de 2013 Christian Sifaqui

description

Presentación para funcionarios del Consejo para la Transparencia, Santiago, 27 de noviembre de 2013

Transcript of Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Page 1: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Archivos, transparencia y web semántica

27 de noviembre de 2013Christian Sifaqui

Page 2: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Archivo

Consejo Internacional de Archivos (ICA):• Conjunto de documentos• Institución responsable• Edificio o parte del edificio donde se

conservan (depósito)

Page 3: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Archivo

CPLT:• Muy buenas guías en

http://www.educatransparencia.cl/docs • Sistema con firma electrónica

Page 4: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Archivística

• Identificación: fase del tratamiento archivístico que consiste en la investigación y sistematización de las categorías administrativas y archivísticas en que se sustenta la estructura de un fondo

• Clasificación: operación archivística que consiste en el establecimiento de las categorías y grupos que reflejan la estructura jerárquica del fondo

• Ordenamiento: operación archivística realizada dentro del proceso de organización, que consiste en establecer secuencias naturales cronológicas y/o alfabéticas, dentro de las categorías y grupos definidos en la clasificación

Page 5: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Archivística

• Instalación: conjunto de medios físicos dispuestos para la adecuada conservación de los documentos

• Descripción: fase del tratamiento archivístico destinada a la elaboración de los instrumentos de consulta para facilitar el conocimiento y consulta de los fondos documentales y colecciones de los archivos

• Digitalización: conjunto de procedimientos de copia o microcopia realizados mediante cualquier tecnología y en distintos soportes

Page 6: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Digitalización

• Ingreso de documentos organizados archivísticamente

• Preparación de los documentos para digitalización

• Ingreso de metadatos• Escaneo• Retorno de documentos a su unidad• Instalación en los depósitos

Page 7: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Digitalización

• Metadatos• negocio electrónico• conservación• descripción de los recursos de información• localización de recursos de información• gestión de derechos de propiedad intelectual

• Formato máster, formato distribución• Roles, comunidades, colecciones

Page 8: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Repositorios digitales

• “Bolsa inteligente”

• Adecuados al contenido (XML, videos, etc.)

Page 9: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Bolsa “inteligente”

Debe:• manejar objetos digitales, organizados en

colecciones y éstas a su vez agrupadas en comunidades

• ofrecer uso de metadatos estándar Dublin Core, y permitir extenderlo

• soportar amplio espectro de formatos de archivos: texto, videos, sonido, imágenes

• versionamiento

Page 10: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Bolsa “inteligente”

Usar esta bolsa inteligente como backend y como frontend sitios web que sólo ofrezcan los documentos acorde a cierta metadata

Entrégame los objetos

más recientes

Objetos más recientes

Repositorio - Backend

Sitio web - Frontend

Page 11: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Bolsa “inteligente”

Entrégame objetos con metadata

dc.subject=Legisla

ción Comparada

Objetos

Page 12: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Bolsa “inteligente”

Frontend

BackendDocumentos

Objetos digitales Recursos legales

parlamentario.bcn.cl

transparencia.bcn.cl

historiapolitica.bcn.cl

www.bcn.cl/leyfacilarchivohales.bcn.cl

Page 13: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Repositorios digitales

• “Bolsa inteligente”

• Adecuados al contenido (XML, videos, etc.)

Page 14: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Adecuado al contenido

• Interesa determinar cambios en un documento o entre documentos

• Referenciar o reutilizar partes de o todo un documento

• Interoperabilidad• Otras consideraciones

Page 15: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Adecuado al contenido

Videos

Música

XML

Page 16: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Adecuado al contenido

Ley 22000

Artículo 1. abc.

Artículo 2. def.

Artículo 3. ghi.

Ley 22000

Artículo 1. abc.

Artículo 2. def.

Artículo 3. ghi.

Ley 22000

Artículo 1. xyzbc.

Artículo 2. def.

Artículo 3. ghi.

Ley 22000

Artículo 1. xyzbc.

Artículo 2. def.

Artículo 3. ghi.

t0 t1

Page 17: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Adecuado al contenido

Interesa capturar la “vida” del documento

Page 18: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Adecuado al contenido

Interesa la “estructura” del documento

Page 19: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Adecuado al contenido

LeyChile: XMLTexto: versiones, hiperenlaces, referencias, notas

Estructura: organización jerárquica de las partes de una norma legal

Metadatos: información adicional acerca de los documentos, como identificación de la norma, materia, términos libres, etc.

Page 20: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Adecuado al contenido

LeyChile interopera con Contraloría

Consume Dictámenes asociados a una ley

Envía parámetros

Capa de Presentación

Capa de Negocios

Cap

a d

e I

nte

gra

ció

n

Parámetros:Número ley

Prepara lista de resultados

Requerimiento de dictámenes para cualquier ley

AJAX

AJAX

Sistema Ley Chile

Page 21: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Adecuado al contenido

¿LeyChile podría interoperar con CPLT?

Page 22: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Adecuado al contenido

Akoma Ntoso http://www.akomantoso.org/

Es un conjunto de representaciones electrónicas tecnológicamente neutral (en formato XML) de documentos parlamentarios, legislativos y judiciales

Page 23: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Archivos

Dos accesos

Page 24: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Archivos

Ver Decreto Supremo 13 2009 Reglamento, ART-42

Page 25: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Archivos

Ver Decreto Supremo 13 2009 Reglamento, ART-42

¿?

Page 26: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Archivos

Ver Decreto Supremo 13 2009 Reglamento, ART-42Sencillo: enlace a

http://www.leychile.cl/Navegar?idNorma=1001095&idParte=8527294

Page 27: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Archivos

Ver Decreto Supremo 13 2009 Reglamento, ART-42Menos sencillo: procesar XML

http://www.leychile.cl/Consulta/obtxml?opt=7&idNorma=1001095 y buscar idParte="8527294"

Page 28: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Archivos

Enlaces dentro del texto

Page 29: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Archivos

Enlaces dentro del texto

Page 30: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Archivos

Instrucciones

9

1

Page 31: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Archivos

Documentos grandes

Documento PDF complejo consistente en imágenes facsimilares + texto OCR + mapeo de cada palabra a su posición en cada página

XML

PDF imágenes con texto 72 páginas en PDF, tamaño 24 MB.

Mismo archivo en XML 0.5 MB

Page 32: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Archivos

Mundo “papel”

Mundo digitalizados o creados digitalmenteDigitalizaciónRepositorios

Bolsa inteligenteAcorde al contenido

Firma electrónica

Page 33: Charla a Consejo para la Transparencia, 27 de noviembre de 2013
Page 34: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Transparencia activa

Título III Ley 20.285 es una oferta para seres humanos…

Page 35: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Transparencia activa

Título III Ley 20.285 es una oferta para seres humanos…

Ser humano: búsqueda y exploración

Page 36: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Transparencia activa

Pero la auditoría a TA debe ser muy trabajosa, porque TA fue hecha para seres humanos

Page 37: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Transparencia activa

Modelar una oferta para máquinas

Page 38: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Transparencia activa

Oferta para máquinas

Page 39: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Transparencia activa

Oferta para máquinas (RDFa)

Page 41: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Transparencia activa

Oferta para máquinasWSDL (http://www.leychile.cl/ws/LeyChile.wsdl)

Enlaces, widgets, servicios web (http://llevatelo.bcn.cl)

Page 42: Charla a Consejo para la Transparencia, 27 de noviembre de 2013
Page 43: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Web semántica

Open Data: es un idea que impulsa la publicación de datos de forma libre y asequible a cualquier persona para usar y republicar sin restricciones de ningún tipo

Linked Data: es usar la web para conectar datos relacionados que no estaban enlazados previamente. Usa algunas de las mejores prácticas de la Web Semántica

Page 44: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Web semántica

Web• Repleta de información• Orientada al ser humano:

• para comprender el contenido de una página• para relacionar contenidos dentro de una

página (textos, imágenes, videos, etc.)

Page 45: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Web semántica

Web• Dificultad en localización de la información (adaptar a una

región específica, por ejemplo, traducir)

• Buscadores actuales funcionan bien, pero orientados al keyword

• Por ejemplo: “constitución”¿la de Chile?¿ciudad del sur?

Page 46: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Web semántica

Soluciones

• ad hoc: usar métodos de IA para analizar la información no estructurada existente en la Web

• a priori: estructurar la información en la Web para facilitar el análisis automático Web Semántica

Page 47: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Web semántica

Estándares

Page 48: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Web semántica

Estándares

Page 49: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Web semántica

Endpoint SPARQL

Page 50: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Web semántica

Encontrar todas las normas emitidas por una municipalidad entre los años 1995 y 2000, pero que fueron modificadas después del año 2005

PREFIX dc: <http://purl.org/dc/elements/1.1/>PREFIX n: <http://datos.bcn.cl/ontologies/bcn-norms#> SELECT distinct str(?normTitle) as ?Titulo str(?creatorName) as ?Municipio ?pubDate as ?Fecha_Publicacion ?pubDateOther as ?Fecha_modificacionWHERE { ?norm n:createdBy ?creator . ?creator n:hasName ?creatorName . ?norm dc:title ?normTitle . ?norm n:publishDate ?pubDate . ?norm n:isModifiedBy ?otherNorm . ?otherNorm n:publishDate ?pubDateOther . FILTER (regex(?creatorName,"MUNICIPALIDAD","i")) FILTER (?pubDate > xsd:date("1995") && ?pubDate < xsd:date("2000") && ?pubDateOther > xsd:date("2005"))}ORDER BY (?pubDate)

PREFIX dc: <http://purl.org/dc/elements/1.1/>PREFIX n: <http://datos.bcn.cl/ontologies/bcn-norms#> SELECT distinct str(?normTitle) as ?Titulo str(?creatorName) as ?Municipio ?pubDate as ?Fecha_Publicacion ?pubDateOther as ?Fecha_modificacionWHERE { ?norm n:createdBy ?creator . ?creator n:hasName ?creatorName . ?norm dc:title ?normTitle . ?norm n:publishDate ?pubDate . ?norm n:isModifiedBy ?otherNorm . ?otherNorm n:publishDate ?pubDateOther . FILTER (regex(?creatorName,"MUNICIPALIDAD","i")) FILTER (?pubDate > xsd:date("1995") && ?pubDate < xsd:date("2000") && ?pubDateOther > xsd:date("2005"))}ORDER BY (?pubDate)

Page 51: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Web semántica

Visualizaciones

Page 52: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Web semántica

Visualizaciones

Page 53: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

Finalmente

Dos mundos• Mundo de documentos para el ser

humano• Mundo de datos para las máquinas

Page 54: Charla a Consejo para la Transparencia, 27 de noviembre de 2013

De documentos a datos

Documentos• OCR• aplicación de algoritmos Named-entity

Recognition• Enlaces a ontologías

• Ejemplo: proyecto Historia de la Ley y Labor Parlamentaria