Recuperación de Bases de datos documentales

21
Curso réplica: Recuperación de Bases de datos documentales Universidad Técnica Particular de Loja Diana Rivera Catalina Mier Jenny Yaguache

Transcript of Recuperación de Bases de datos documentales

Page 1: Recuperación de Bases de datos documentales

Curso réplica: Recuperación de Bases de datos

documentalesUniversidad Técnica Particular de Loja

Diana RiveraCatalina Mier

Jenny Yaguache

Page 2: Recuperación de Bases de datos documentales

Bases de datos y recuperación de información

• Indicadores de eficacia- Podemos encontrar mucho ruido o silencios

• Recuperación– selectiva– Eficaz– Eficiente

Page 3: Recuperación de Bases de datos documentales

Bases de datos y recuperación de información

• Se debe recuperar:- Toda la información relevante- Pero sólo la relevante- con un costo razonable

* tiempo y esfuerzo* fases previas y posteriores

Page 4: Recuperación de Bases de datos documentales

Operadores de expansión

• Truncar:– Raíz del término– Substituye conjunto final de caracteres– Ej: profesor*

* (profesor, profesora, profesores, profesorado…)Enmascara:*Sustituye a un carácter• Ej: Profesor?s * (profesores, profesoras, profesoros)

Page 5: Recuperación de Bases de datos documentales

Operadores de expansión

• Truncar:* ExhaustividadEnmascarar:* Exhaustividad

Page 6: Recuperación de Bases de datos documentales

Operadores de proximidad

• Definen la distancia máxima admisible entre dos términos

• Uso en campos textuales no contralados* Ej: informática near2 documentación* Informática y documentación* Documentación sobre una aplicación informática (NO SE HACE)

Page 7: Recuperación de Bases de datos documentales

Operadores de cualificación

• Permiten especificar el campo o campos en que la condición debe satisfacerse.– Ejemplos:

• (informática documenta) EN TITULO• Unamuno EN AUTOR

Page 8: Recuperación de Bases de datos documentales

Operadores de encadenamiento

• Permite emplear como parte de una ecuación los resultados de una búsqueda anterior– Por ejemplo, cada búsqueda parcial se denota

por #n– Ejemplos:

• #1:• Chaing IN AUTHOR

Page 9: Recuperación de Bases de datos documentales

Operadores de encadenamiento

• Permite emplear como parte de una ecuación los resultados de una búsqueda anterior– Por ejemplo, (en azul la respuesta del sistema)– Chaing IN AUTHOR

• 45322 ref.• #2• 12784 ref.• # 3• # 2 and PUBYEAR> 2005• 97 ref.

Page 10: Recuperación de Bases de datos documentales

Documentos: conceptos, definiciones y tipologías

• Documento: fuente y soporte de información:• Tipologías: diversidad de criterios

– Naturaleza información: texto, audio, imagen, etc

– Soporte físico: papel, digital, etc– Difusión: publicados, inéditos, literatura

gris, reservados de pago…Contenidos: primarios y secundarios

Page 11: Recuperación de Bases de datos documentales

Documentos: conceptos, definiciones y tipologías

• Contenido: primarios y secundarios– Primarios: fuentes originales completas– Secundarios: referencias

* Resultado del tratamiento documental* Elaboración técnicas de los primarios

- Para facilitar su recuperación

Page 12: Recuperación de Bases de datos documentales

Documentos: conceptos, definiciones y tipologías

• Las bases de datos contienen– Siempre referencias– Y, si es el caso, vínculos a los documentos

primarios– La búsqueda de la información se hace sobre

las referencias.

Page 13: Recuperación de Bases de datos documentales

Documentos: conceptos, definiciones y tipologías

• Las bases de datos contienen– Siempre referencias– Y, si es el caso, vínculos a los documentos

primarios– La búsqueda de la información se hace sobre

las referencias.

Page 14: Recuperación de Bases de datos documentales

Lenguajes documentales

• Principio básico • Papel de puente entre usuario y

documentalista • Para asegurar que unos y otros

empleanlos mismos términos para expresar los mismo conceptos.

• Así la recuperación es eficaz con mínimas tasas de ruido y silencio.

Page 15: Recuperación de Bases de datos documentales

Documentos: conceptos, definiciones y tipologías

• Las bases de datos contienen– Siempre referencias– Y, si es el caso, vínculos a los documentos

primarios– La búsqueda de la información se hace sobre

las referencias.

Page 16: Recuperación de Bases de datos documentales

TESAUROS

• Voz latina que significa tesoro• Acepción: como colección, repertorio• Función: Instrumento de control

terminológico del lenguaje natural de los documentos, indizadores o usuarios a un lenguaje documental más controlado.

Page 17: Recuperación de Bases de datos documentales

Tesauros

• Según su estructura: vocabulario controlado y dinámico de términos relacionados semántica y genéricamente que cubre un dominio específico del conocimiento.

• Control lenguaje• Concepto: docente, profesor, enseñante,

educador, maestro, etc• Variaciones de género y número

Page 18: Recuperación de Bases de datos documentales

Tesauros

• El uso del lenguaje natural:– Ruido– SilencioExhaustividad- Docente* OR profesor* OR educador*- Precisión:- ¿tutor? ¿educador de tiempo libre?- ¿cómo se busca?

Page 19: Recuperación de Bases de datos documentales

Tesauros: elementros estructurales

• Unidades léxicas:ç– Descriptores– Términos equivalentes– IdentificadoresRelaciones- De equivalencia- Jerárquicas- Asociativas- definitorias

Page 20: Recuperación de Bases de datos documentales

Tesauros: elementros funcionales

• Intrumentos de exhaustividad– Control de sinónimos– Normalizaciòn. Control de la forma de las

palabras.– ClasificiaciónInstrumentos de precisión:- Especificidad del lenguaje de indización- Coordinación y nivel de pre-coordinación

Page 21: Recuperación de Bases de datos documentales

Tesauros: Descriptores

• Todo descriptro es una palabra –clave• Es un térmio que caracteriza el

contenido conceptual de un documento• Es una palabra – clave noramalizada,

controlada.• Término normalizado y elegido como

preferente