Indización, Resumen y Catalogación Automática Piedad Garrido Picazo Francisco J. Martínez...

18
Indización, Resumen y Catalogación Automática Piedad Garrido Picazo Francisco J. Martínez Domínguez Alberto Segrera Torres

Transcript of Indización, Resumen y Catalogación Automática Piedad Garrido Picazo Francisco J. Martínez...

Indización, Resumen y Catalogación Automática

Piedad Garrido PicazoFrancisco J. Martínez Domínguez

Alberto Segrera Torres

Introducción

Productos desarrollados

Aplicación de las redes neuronales

Conclusiones

INTRODUCCIÓN

“Proceso que permite captar y representar el contenido de un documento.”

Identificación de los conceptos en lenguaje natural

Traslación de estos conceptos a su expresión por medio de un lenguaje controlado (normalizado)

Utiliza lenguajes de tipo documental, puesto que el lenguaje natural, presenta una eficacia muy limitada.

Si bien el lenguaje natural es simple y no requiere ningún esfuerzo de traducción, tiene un alto grado de ambigüedad que lo limita en un esfuerzo de sistematización de una determinada materia.

La indización automática, se limita a buscar los términos más representativos del documento y registrarlos.

Una máquina, en principio, es incapaz de realizar la labor de indizar, ya que no puede llegar a captar todos los matices conceptuales como puede hacerlo un indizador humano.

Sin embargo, es necesaria, pues la indización es el cuello de botella de la Catalogación.

Se emplean dos reglas en la indización automática: Los documentalistas deciden un conjunto de

identificadores; esta lista se compara en el ordenador con cada palabra del documento, si aparece algún identificador, se almacena como índice para ese documento.

Los documentalistas deciden un conjunto de palabras que NO deben ser seleccionadas como índice (antidiccionario); los sistemas automáticos cuentan el número de apariciones de las palabras no vacías y las más frecuentes serán elegidas como índices.

Durante el proceso de RESUMEN, el ordenador, crea una versión comprimida del texto original. Esta nueva versión deberá tener el mismo sentido que la anterior.

Es una tarea muy importante, pues las bibliotecas tienen que catalogar muchísimo material y si un ordenador puede realizar buenos resúmenes, se agiliza la catalogación.

PRODUCTOS DESARROLLADOS

Aplicación de las redes neuronales a la indización automática

“Nuestra meta es encontrar lo que quieres, no sólo por lo que has preguntado”

CONCLUSIONES

Se están desarrollando continuamente proyectos para automatizar las tareas documentales.

El nivel encontrado hasta ahora, cuando el volumen de información es pequeño, es bastante aceptable.

Se necesitan máquinas muy potentes para obtener buenos resultados.

CONCLUSIONES

La aparición de la multimedia ha dificultado más todavía, la consolidación de estos sistemas.

Existe una escasa presencia de investigadores del área de Biblioteconomía y Documentación, en el estudio de automatización de las tareas documentales.

En España existe muy poca tradición de investigación en este campo.