Recuperación de Bases de datos documentales

Post on 16-Apr-2017

1.823 views 0 download

Transcript of Recuperación de Bases de datos documentales

Curso réplica: Recuperación de Bases de datos

documentalesUniversidad Técnica Particular de Loja

Diana RiveraCatalina Mier

Jenny Yaguache

Bases de datos y recuperación de información

• Indicadores de eficacia- Podemos encontrar mucho ruido o silencios

• Recuperación– selectiva– Eficaz– Eficiente

Bases de datos y recuperación de información

• Se debe recuperar:- Toda la información relevante- Pero sólo la relevante- con un costo razonable

* tiempo y esfuerzo* fases previas y posteriores

Operadores de expansión

• Truncar:– Raíz del término– Substituye conjunto final de caracteres– Ej: profesor*

* (profesor, profesora, profesores, profesorado…)Enmascara:*Sustituye a un carácter• Ej: Profesor?s * (profesores, profesoras, profesoros)

Operadores de expansión

• Truncar:* ExhaustividadEnmascarar:* Exhaustividad

Operadores de proximidad

• Definen la distancia máxima admisible entre dos términos

• Uso en campos textuales no contralados* Ej: informática near2 documentación* Informática y documentación* Documentación sobre una aplicación informática (NO SE HACE)

Operadores de cualificación

• Permiten especificar el campo o campos en que la condición debe satisfacerse.– Ejemplos:

• (informática documenta) EN TITULO• Unamuno EN AUTOR

Operadores de encadenamiento

• Permite emplear como parte de una ecuación los resultados de una búsqueda anterior– Por ejemplo, cada búsqueda parcial se denota

por #n– Ejemplos:

• #1:• Chaing IN AUTHOR

Operadores de encadenamiento

• Permite emplear como parte de una ecuación los resultados de una búsqueda anterior– Por ejemplo, (en azul la respuesta del sistema)– Chaing IN AUTHOR

• 45322 ref.• #2• 12784 ref.• # 3• # 2 and PUBYEAR> 2005• 97 ref.

Documentos: conceptos, definiciones y tipologías

• Documento: fuente y soporte de información:• Tipologías: diversidad de criterios

– Naturaleza información: texto, audio, imagen, etc

– Soporte físico: papel, digital, etc– Difusión: publicados, inéditos, literatura

gris, reservados de pago…Contenidos: primarios y secundarios

Documentos: conceptos, definiciones y tipologías

• Contenido: primarios y secundarios– Primarios: fuentes originales completas– Secundarios: referencias

* Resultado del tratamiento documental* Elaboración técnicas de los primarios

- Para facilitar su recuperación

Documentos: conceptos, definiciones y tipologías

• Las bases de datos contienen– Siempre referencias– Y, si es el caso, vínculos a los documentos

primarios– La búsqueda de la información se hace sobre

las referencias.

Documentos: conceptos, definiciones y tipologías

• Las bases de datos contienen– Siempre referencias– Y, si es el caso, vínculos a los documentos

primarios– La búsqueda de la información se hace sobre

las referencias.

Lenguajes documentales

• Principio básico • Papel de puente entre usuario y

documentalista • Para asegurar que unos y otros

empleanlos mismos términos para expresar los mismo conceptos.

• Así la recuperación es eficaz con mínimas tasas de ruido y silencio.

Documentos: conceptos, definiciones y tipologías

• Las bases de datos contienen– Siempre referencias– Y, si es el caso, vínculos a los documentos

primarios– La búsqueda de la información se hace sobre

las referencias.

TESAUROS

• Voz latina que significa tesoro• Acepción: como colección, repertorio• Función: Instrumento de control

terminológico del lenguaje natural de los documentos, indizadores o usuarios a un lenguaje documental más controlado.

Tesauros

• Según su estructura: vocabulario controlado y dinámico de términos relacionados semántica y genéricamente que cubre un dominio específico del conocimiento.

• Control lenguaje• Concepto: docente, profesor, enseñante,

educador, maestro, etc• Variaciones de género y número

Tesauros

• El uso del lenguaje natural:– Ruido– SilencioExhaustividad- Docente* OR profesor* OR educador*- Precisión:- ¿tutor? ¿educador de tiempo libre?- ¿cómo se busca?

Tesauros: elementros estructurales

• Unidades léxicas:ç– Descriptores– Términos equivalentes– IdentificadoresRelaciones- De equivalencia- Jerárquicas- Asociativas- definitorias

Tesauros: elementros funcionales

• Intrumentos de exhaustividad– Control de sinónimos– Normalizaciòn. Control de la forma de las

palabras.– ClasificiaciónInstrumentos de precisión:- Especificidad del lenguaje de indización- Coordinación y nivel de pre-coordinación

Tesauros: Descriptores

• Todo descriptro es una palabra –clave• Es un térmio que caracteriza el

contenido conceptual de un documento• Es una palabra – clave noramalizada,

controlada.• Término normalizado y elegido como

preferente