PADICAT, el archivo web de Cataluña ... y algunos apuntes sobre Depósito legal electrónico

34
Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 PADICAT, el archivo web de Cataluña ... y algunos apuntes sobre Depósito legal electrónico Eugènia Serra Directora Biblioteca de Catalunya [email protected]

Transcript of PADICAT, el archivo web de Cataluña ... y algunos apuntes sobre Depósito legal electrónico

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

PADICAT, el archivo web de Cataluña ... y algunos apuntes sobre Depósito legal electrónico

Eugènia SerraDirectora

Biblioteca de [email protected]

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

Información general Fundada en 1907 Más de 3.000.000 documentos Crecimiento anual de 129.000

documentos 229 puestos de lectura en 3.060 m2 Presupuesto 2013: 6,9 M€ 160 plantilla 65 km de depósito + 1 depósito

cooperativo (GEPA)

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

Uso 2.596.180 consultas a documentos

digitalizados 4.618.579 consultas al catálogo 171 sesiones de formación/visitas

3.086 personas 252.000 reproducciones

(papel+digital) 142.000 documentos consultados

presencialmente

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

Contrato-Programa 2013-2016 La Biblioteca, centro cultural de referencia

del patrimonio escrito, musical, sonoro, audiovisual, gráfico y editorial.

Identificación y compleción del patrimonio bibliográfico y documental de Catalunya.

El patrimonio bibliográfico y documental de Catalunya accesible, al día y preservado

Internacionalitzación Participación de la sociedad y agentes del

patrimonio (crowdsourcing) Consolidación de un sistema de

preservación digital nacional

Estrategia Planes estratégicos 2004-2008, 2009-2012 y Contrato-Programa 2013-2016 → especial atención al contexto digital

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

A partir de 2004 → tres líneas de actuación: Digitalización, a través de iniciativas en

colaboración (a nivel catalán e internacional, de carácter selectivo y masivo).

Creación del archivo web de Catalunya Impulso a los servicios virtuales

A partir del 2009 → preservación digital más allá del archivo web

Lineas de actuación

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

Digitalización• ARCA: Archivo de Revistas Catalanas Antiguas

http://www.bnc.cat/digital/arca • MDC: Memoria Digital de Catalunya

http://mdc.cbuc.cat• Google Libros http://books.google.es/ • Europeana http://europeana.eu Preservación digital

- PADICAT: Patrimonio Digital de Catalunya http://www.padicat.cat

- COFRE: COnservamos para el Futuro Recursos Electrónicos + Depósito Legal electrónico online

Acciones

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

Del patrimonio bibliográfico al patrimonio digital

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

“Son objeto de depósito legal los escritos, estampas, imágenes y composiciones musicales, producidas en territorio nacional, en

ejemplares múltiples, con fines de difusión, hechos por procedimientos mecánicos o químicos. Comprenderá por tanto:

Libros, sea cualquiera la índole de su contenido y la forma de impresión y estén o no destinados a la venta.

Folletos, o sea escritos cuyo número de páginas sea mayor de cuatro y no exceda de 50, y con características semejantes a

las señaladas en el párrafo anterior, incluyéndose en este concepto las separatas de artículos de revista que tengan la acotada

extensión. Hojas impresas con fines de difusión y que no constituyan propaganda esencialmente comercial.

Publicaciones periódicas (revistas y diarios).Partituras musicales. Grabados: láminas sueltas,

láminas de calendario, estampas, cromos, "chrismas", anuncios artísticos. Mapas y planos. Carteles

anunciadores de espectáculos, fiestas y demás actos públicos, tanto religiosos como profanos; anunciadores de artículos

comerciales, siempre que lleven grabados artísticos; bandos y edictos. Postales ilustradas. Naipes. “Slides" destinadas a difusión y venta. Impresiones o grabaciones sonoras

realizadas por cualquier procedimiento o sistema empleado en la actualidad o en el futuro. Producciones cinematográficas, tanto de tipo argumental como documental, y "filmlets”.

Fuente: Orden de 30 de octubre de 1971, por la que se aprueba el Reglamento del Instituto Bibliográfico Hispánico

La producción bibliográfica en 1971

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

La producción digitalInternet Domain Survey, July, 2012

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

Libros, Folletos, Hojas impresas, Publicaciones periódicas, Grabados, Mapas y planos, Carteles, Postales, “Slides“, Impresiones o grabaciones sonoras, Producciones cinematográficas...

Pàgines web: Libros digitales, Diarios en línea, Sedes web, Weblogs, Webcams, Votacions en línea, Chats, Webs corporativas, Comercio en línea, Webs personales, Artículos y ponenciass digitales, Documentación de software...

La producción “bibliográfica” el 2013

+

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

2020?

¿Cuándo desaparecerán los periódicos de papel? Seguramente, en veinte años. Bill Gates dice que en cinco años.Steve Ballmer (Microsoft), El País 22 octubre 2006

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

El patrimonio digital consiste en recursos únicos que son fruto del saber o la expresión de los seres humanos. Comprende recursos de carácter cultural, educativo, científico o administrativo e información técnica, jurídica, médica y de otras clases, que se generan directamente en formato digital o se convierten a éste a partir de material analógico ya existente. Los productos “de origen digital” no existen en otro formato que el electrónico.

Los objetos digitales pueden ser textos, bases de datos, imágenes fijas o en movimiento, grabaciones sonoras, material gráfico, programas informáticos o páginas Web, entre otros muchos formatos posibles dentro de un vasto repertorio de diversidad creciente.

El patrimonio digital Unesco 2003

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

El patrimonio nacido digital es extenso y creciente

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

1999 2001 2003 2009

El patrimonio nacido digital es efímero

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

Experiencias en preservació digital pre 2005

Alemania, 1997Australia, 1996Áustria, 1999Canadá, 1994Dinamarca, 1998EUA, 2000Estonia, 2004Finlandia, 1997Francia, 2000Grecia, 2003

Islandia, 1997Japón, 2002Lituania, 2002Noruega, 2001Nueva Zelanda, 1999Holanda, 1995Quebec, 2000Reino Unido, 2004República Checa, 2001Suecia, 1996

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

Experiencias en preservación digital

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

PADICAT Patrimonio Digital de Catalunya

acceso permanente a la Web catalana

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

PADICAT exhaustivo

Webs dominio .CATWebs en servidores de CatalunyaWebs en lengua catalana bajo otros dominios

(.ES, .ORG, .NET, .COM, .INF, ...)Webs de autoría catalanaOtras webs relacionadas temáticamente con

Catalunya que no corresponden a las

categorías anteriores

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

PADICAT selectivo

Selección de 2.000 instituciones

representativas de la sociedad catalanaAyuntamientos y administración localPartidos políticos y sindicatosColegios y asociaciones profesionalesSector culturalEmpresas

460 convenios firmados desde 2006/09

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

PADICAT focalizado: elecciones 2006

• Partidos (CIU, PSC, ERC, ICV, PP + Partit Blau, Lliga antitaurina, Escons insubmisos…)• Candidatos (Montilla, Carod, Saura, Sirera…)• Fundaciones (Jordi Pujol, Rafael Campalans…)• Parlamento + Administración (eleccions2006.cat…)• Blocs personales (ciberpolítica de Joselito…)• Medios de comunicación (e-noticies.com, vilaweb…)

652 capturas de 83 webs diferentes

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

PADICAT focalizado: elecciones 2006

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

PADICAT focalizado: elecciones 2007

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

PADICAT Resumen de Datos Inicio: junio 2005 Hardware: 7 servidores ProLiant DL360 G4p, Robot Scalar i2000, 19 TB Software: Heritrix, NutchWax, Wera, Wayback / ARCindexer Presupuesto: 1,6M € (2006-12) Equipo de trabajo: 4 (bibliotecarios/informáticos) + dedicación puntual de técnicos de BC i CESCA

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

PADICAT En línea, abierto www.padicat.cat

Búsqueda por texto libre, URL, categorías58.787 webs diferentes262.937 versiones 372 millones de ficheros13 TB de espacio10 monográficos

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

PADICAT divulgación

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

PADICAT en red

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

“ El patrimonio bibliográfico, sonoro, visual, audiovisual y digital de las culturas de España es uno de los más ricos y representativos del mundo y debe ser preservado en beneficio de las generaciones presentes y futuras.”

3. “El depósito legal comprenderá los siguientes tipos de publicaciones y recursos, o la combinación de varios de ellos formando una unidad:

ñ) sitios web fijables o registrables cuyo contenido pueda variar en el tiempo y sea susceptible de ser copiado en un momento dado”.

8.2. “Se habilita a los centros de conservación, tanto de titularidad estatal como autonómica, a detectar y reproducir documentos electrónicos que hayan sido objeto de comunicación pública y los sitios web libremente accesibles a través de redes de comunicaciones que puedan resultar de interés para los fines del depósito legal, respetando en todo caso la legislación sobre protección de datos y propiedad intelectual.

La nueva Ley del DL, julio de 2011

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

Operativo desde 2011Objetivo → preservar- documentos digitalizados (másters)- copia periódica de PADICAT- documentos de DL nacidos digitalesRepositorio para otras instituciones catalanas

Módulo de depósito de DLMódulo de consulta en la BC (documentos con derechos vigentes)

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

Esquema COFRE

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

COFRE Módulo de carga DL online

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

COFRE Módulo de carga DL online

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

COFRE Módulo de carga DL online: flujo de la aplicación

2013 → pruebas de carga de documentos desde la BC2014 → piloto con editores

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

Reflexiones finales

Sistemas de preservación nacional→ cooperativos (protocolo) y distribuidos→ adaptables y evolutivos

Web y depósito legal nacido digital→ no podemos ser exhaustivos (aunque lo intentemos)→ cambiante y creciente→ imprevisible: nuevos tipos de documentos (unidades documentales) y formatos

Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013

Biblioteca de CatalunyaEugènia Serra

[email protected]

¡Gracias!