Unidad 4: Tecnologías de la información y la comunicación en la recuperación de...

36
Documentación científica Unidad 4: Tecnologías de la información y la comunicación en la recuperación de la documentación científica Tema 11. Gestión de la información: las bases de datos bibliográficas y la minería de datos. [email protected]

Transcript of Unidad 4: Tecnologías de la información y la comunicación en la recuperación de...

Page 1: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Documentación científica

Unidad 4: Tecnologías de la información y la comunicación en la recuperación de la documentación científica Tema 11. Gestión de la información: las bases de datos bibliográficas y la minería de datos.

[email protected]

Page 2: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Investigación

Generar conocimiento

Práctica profesional

Aplicar conocimiento

¿Búsquedas para qué?

Page 3: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Gestión de la información Generación

Recolección

Representación

Almacenamiento Recuperación

Difusión

Uso

Indización

Bases de datos

Page 4: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos
Page 5: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Propósito

Manejar de forma ordenada, clara y sencilla un conjunto de datos que posteriormente se convertirán en información.

Bases de datos

Page 6: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de datos

Concepto: Es un conjunto de información almacenada en

soporte legible por ordenador y estructurada en

campos y registros.

Page 7: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de datos

> Registros: son cada una de las unidades lógicas de información en que está dividida una base de datos bibliográfica o documental.

> Campos (Variables): son conceptos o propiedades en que queda estructurado cada registro y que hacen referencia a diferentes características.

Page 8: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Campos columnas

Registros filas

Campos de un registro

Page 9: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de datos

Ejemplo: Campos del registro 20 (artículo)

- Código (PMID): 18391931 - Tipo documento (Tipo_doc): Opinión - Número de autores (Nº autor): 2 - Institución (Institucion): Queensland Institute of Medical Research - País (Pais): Australia - Idioma (Idioma): Inglés - Abreviatura título de la revista (Revista): Nat Med - Año pubicación (Año_pub): 2008 - Tipo de acceso (Acceso): Open Access - Texto completo (Texto): Si - etc…

Page 10: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de datos

Page 11: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de datos Se basan en herramientas que almacenan de manera óptima la información, la mantienen y facilitan su recuperación utilizando el análisis documental.

El análisis documental se realiza en 3 niveles:

Asiento: Determinado por los campos de la información (autor, título, fecha, número de páginas o volúmenes, etc). Resumen: Descriptores:

A.D. externo

A.D. interno

Page 12: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de datos

Procedimientos:

• Los procedimientos son las instrucciones y reglas que gobiernan el diseño y utilización de la base de datos.

• El personal que gestiona la base de datos y los usuarios del sistema requieren una serie de procedimientos documentados (INSTRUCCIONES) que les permita saber como utilizar o ejecutar el sistema.

Page 13: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de datos

Tipos:

1. Bases de datos estáticas 2. Bases de datos dinámicas 3. Bases de datos bibliográficas 4. Bases de datos de texto completo 5. Directorios 6. Bases de datos multimedia

Page 14: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de datos

1. Bases de datos estáticas Éstas son bases de datos de sólo lectura, utilizadas primordialmente para almacenar datos históricos que posteriormente se pueden utilizar para estudiar el comportamiento de un conjunto de datos a través del tiempo, realizar proyecciones y tomar decisiones.

Ejemplo: En una Farmacia el histórico de ventas

Page 15: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de datos

2. Bases de datos dinámicas Éstas son bases de datos donde la información almacenada

se modifica con el tiempo, permitiendo operaciones como

actualización y adición de datos, además de las operaciones

fundamentales de consulta.

Ejemplo: Base de datos de medicamentos

Page 16: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de datos

3. Bases de datos bibliográficas Solo contienen un subrogante (representante) de la fuente primaria, que permite localizarla. Un registro típico de una base de datos bibliográfica contiene información sobre el autor, fecha de publicación, editorial, título, edición, de una determinada publicación, etc. Ejemplo: MEDLINE

Page 17: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de datos

4. Bases de datos de texto completo Almacenan el texto completo de fuentes primarias. Ejemplo: • SciELO: Scientific Electronic Library Online de la OPS/BIREME http://www2.scielo.org/php/index.php?lang=pt

• Latindex: Revistas científicas de América Latina, Caribe, España y Portugal http://www.latindex.org/

• Redalyc: Revistas científicas de América Latina, Caribe, España y Portugal http://redalyc.uaemex.mx/

Page 18: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de datos 5. Directorios Servicios que ofrecen colecciones de enlaces a recursos web proporcionados por los propios creadores y organizados mediante clasificaciones temáticas. Los criterios para incluir nuevos recursos varían. La mayoría cuentan con un motor para interrogar la base de datos. Clasificación: Generales, comerciales o portales Académicos o profesionales Ejemplo: ROAD - Directory of Open Access scholarly Resources http://road.issn.org/

Page 19: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de datos

6. Bases de datos multimedia almacenan diferentes tipos de información en formato imagen, audio, video o conjunto de estos ellos. Ejemplo: Bibiloteca digital Mundial http://www.wdl.org/es/

Page 20: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de datos DOCUMENTALES

Page 21: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de datos DOCUMENTALES

• Evitan la redundancia y el aislamiento: • Centralización de los datos.

• Facilitan el acceso al documento: • Interfaces accesibles y amigables. • Utilización de lenguajes controlados.

• Control de concurrencia: • Gestión de usuarios. • Bloqueo de datos.

• Gestión de la seguridad: • Políticas de copias de seguridad.

Page 22: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de datos DOCUMENTALES

• Conjunto de textos, cifras, imágenes o combinación de todos ellos, organizados según un programa para facilitar su recuperación.

• Existen dos tipos de bases de datos según su contenido:

- Bases de datos referenciales (datos básicos) - Bases de datos factuales (texto primario)

Page 23: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de datos DOCUMENTALES

Según la cobertura temática es decir la disciplina científica o materia que abarca la bases de datos, las podemos clasificar en:

– Multidisciplinares: cobertura temática amplia, abarcan varias disciplinas o áreas temáticas.

– Especializadas (Temáticas): recogen información de un área temática concreta MEDLINE (Ciencias de la Salud)

Page 24: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de datos en Ciencias de la Salud

Page 25: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de Datos en las Ciencias de la Salud

• MEDLINE (acceso gratuito a través de PubMed) Creada y mantenida por la Librería Nacional de

Medicina de los Estados Unidos de Norteamérica (NLM National Library of Medicine, Bethesda, Maryland, USA ) .

Actualmente la BD más importante en ciencias de la salud.

Dispone de estructura jerárquica denominada “Thesaurus”.

Page 26: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de Datos en las Ciencias de la Salud

• EMBASE Base de datos europea con información biomédica y

farmacológica.

Dispone de estructura jerárquica denominada “Thesaurus” (similar, aunque no igual, que el de MEDLINE).

Page 27: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de Datos en las Ciencias de la Salud

• The Cochrane Library Base de datos de referencia sobre Medicina Basada

en la Evidencia.

Dispone de estructura jerárquica denominada “Thesaurus” (igual al de MEDLINE).

Es una base de gran prestigio.

Page 28: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de Datos en las Ciencias de la Salud

• Bases de Datos de OPS/BIREME (LILACS, PAHO, REPIDISCA, DESASTRES, ADOLEC, etc.)

Destaca: LILACS (Literatura Latinoamericana y del Caribe en Ciencias de la Salud).

Dispone de estructura jerárquica denominada “Thesaurus” (igual al de MEDLINE).

Page 29: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de Datos en las Ciencias de la Salud

• PsycINFO - American Psychological Association

Información sobre Psicología y áreas afines.

Dispone de estructura jerárquica (APA-Terms)

Page 30: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de Datos en las Ciencias de la Salud

• Bases de Datos de la Web of Science (WoS) Acceso a la literatura de investigación

multidisciplinaria publicada en revistas líderes mundiales en las ciencias, ciencias sociales, artes y humanidades.

NO dispone de estructura jerárquica.

Page 31: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Bases de Datos en las Ciencias de la Salud

• The International Pharmaceutical Abstracts (IPA)

Cobertura bibliográfica completa de la ciencia farmacéutica y la salud.

Dispone de estructura jerárquica terminológica.

Page 32: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Minería de Datos (data mining)

Page 33: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

• La minería de datos o exploración de datos es el proceso que intenta descubrir patrones (relaciones) en grandes volúmenes de conjuntos de datos. • Utiliza los métodos de la inteligencia artificial, aprendizaje automático, estadística y sistemas de bases de datos. • El objetivo general del proceso de minería de datos consiste en extraer información de un conjunto de datos y transformarla en una estructura comprensible para su uso posterior.

Minería de datos

Page 34: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

Datos

Conocimiento del tema

Comprender los datos

Preparación de los datos

Modelos

Evaluación

Implantación

Minería de datos

Page 35: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos

“Olla exprés” AND “Tornillo” AND “Acero” AND “Líbano” AND “Explosión”

Page 36: Unidad 4: Tecnologías de la información y la comunicación en la recuperación de …umh1697.edu.umh.es/wp-content/uploads/sites/651/2014/09... · 2014-09-25 · Bases de datos