Procesamiento del lenguaje natural

16
Procesamiento del lenguaje natural

Transcript of Procesamiento del lenguaje natural

Procesamiento del lenguaje natural

El Procesamiento del Lenguaje Natural• Disciplina de la Inteligencia Artificial que se ocupa

de la formulación e investigación de mecanismos computacionales para la comunicación entre personas y máquinas mediante el uso de Lenguajes Naturales

• Los Lenguajes Naturales son los utilizados en la comunicación humana, ya sean escritos, hablados o signados.

Aplicaciones del Procesamiento del Lenguaje Natural:

• Comprensión del lenguaje

• Recuperación de la información

• Extracción de la información

• Búsqueda de respuestas• Generación de discurso• Traducción automática• Reconstrucción de

discurso• Reconocimiento del

habla• Síntesis de voz

Análisis de lenguaje• Se analiza la estructura del lenguaje a cuatro

niveles:

Lenguaje

Análisis morfológic

o:

Análisis sintáctico.

Análisis semántico.

Análisis pragmático

.

El análisis de la estructura sintáctica de la frase mediante una gramática de la lengua en cuestión .

El análisis de las palabras para extraer raíces, rasgos flexivos, unidades léxicas compuestas y otros fenómenos.

La extracción del significado (o posibles significados) de la frase.

El análisis de los significados más allá de los limites de la frase, por ejemplo, para determinar los antecedentes referenciales de los pronombres

Técnicas de análisis de lenguaje• Las distintas fases y problemáticas del análisis del

lenguaje se afrontan principalmente con las siguientes técnicas

• Técnicas lingüísticas formales: Se basan en el desarrollo de

• reglas estructurales que se aplican en las fases de análisis del

• lenguaje• Técnicas probabilísticas: Se basan en el estudio en

base a un conjunto de textos de referencia (corpus) de características de tipo probabilístico asociadas a las distintas fases de análisis del lenguaje.

Gramáticas de contexto

Recuperación de la información

• Dada una colección de documentos, encontrar aquellos más relevantes con respecto a una necesidad de información expresada por un usuario.

4 Características de la búsqueda de información• Se caracteriza por:• Una colección de documentos (hay que definir

que se entiende por “documento” en cada caso)• Una pregunta del usuario realizada usando un

lenguaj especifico de consultas• Un conjunto de resultados obtenidos (un

subconjunto de la colección de documentos)• Una presentación de los resultados obtenidos

Lenguaje de consulta booleano

• El lenguaje de consulta es el lenguaje de las expresiones booleanas construidas sobre las características asociadas a las palabras.

• Un documento es relevante solo si la consulta se evalúa a verdadero

• Este modelo tiene la ventaja de que es muy simple y fácil de

• implementar.

Desventajas del lenguaje booleano• La relevancia de un documento es 1 o 0, no hay

una gradación• de la misma• Las expresiones booleanas no suelen ser

familiares a los usuarios que no son programadores o lógicos

• Es difícil realizar una consulta adecuada

Instrumentos a nuestro alcance para la recuperación de la informaciónEn la actualidad disponemos de diversos instrumentos a nuestro alcance para resolver de la forma más eficiente la recuperación de la información en los archivos .

• Todo el trabajo que se realiza en la administración de los archivos y en la gestión de los documentos converge en una sola finalidad: poder consultar los documentos tras una petición.

• Los documentos se clasifican, se ordenan, se describen, se garantiza su óptima conservación, para poder resolver la consulta en un momento dado.

Base de datos• La base de datos y el sistema de gestión de bases de datos

han revolucionado la gestión de los documentos• Mientras que las bases de datos son un conjunto o

colección de datos, • Un sistema de gestión de bases de datos —SGBD— es

un software que permite la creación, mantenimiento y explotación de la base de datos

• El término base de datos se aplica a los datos y estructuras de datos, y no al SGBD que requiere de un software para gestionarlos, dado que la estructura de una base de datos suele ser demasiado compleja para ser manejada sin su SGBD.

Características de una BD

Descripción de unidad

archivísticaIndización Interoperabili

dad

Intercambio de datos

Datos vinculados

Preguntas.

1. ¿Qué es el Procesamiento del Lenguaje Natural?2. ¿2 aplicaciones del Procesamiento del Lenguaje

Natural?3. ¿Cuáles son los 4 niveles de Análisis de

lenguaje?4. Menciona 2 Técnicas para combatir problemas de

análisis de lenguaje5. Características o elementos de la búsqueda de

información6. ¿Qué es una BD?7. ¿Qué es un SGBD?