Lenguaje Natural

15
.

description

Lógica Computacional Revista Singularidad Ciencias de la Computacion 1 Cohorte Grupo Scheme

Transcript of Lenguaje Natural

Page 1: Lenguaje Natural

.

Page 2: Lenguaje Natural

Introducción ......................................................................................... 4

Lenguaje ............................................................................................. 5

Lenguaje Natural ................................................................................. 6

Características de las lenguas naturales .......................................... 7

Procesamiento del Lenguaje Natural ................................................... 9

Origen .............................................................................................. 9

Niveles del Procesamiento del Lenguaje Natural .............................10

Nivel fonológico: ...........................................................................10

Nivel morfológico: .........................................................................10

Nivel sintáctico: ............................................................................11

Nivel semántico: ...........................................................................11

Nivel pragmático: ..........................................................................11

Arquitectura de un sistema de PLN .................................................11

Aplicaciones del Procesamiento de Lenguajes Naturales ................12

Traducción automática .................................................................13

Recuperación de la información: ..................................................13

Resolución cooperativa de problemas: .........................................13

Reconocimiento de voz: ...............................................................14

Referencias Bibliográficas ..................................................................15

Page 3: Lenguaje Natural

Poder vincular el lenguaje cotidiano a una interacción matemática con un ordenador es una tarea ardua y paradójicamente fascinante, requiere un pensamiento

abstracto que vaya más allá de los simples supuestos de tomar las reglas gramaticales más simples, sobrentenderlas, tratar de implementarlos en las computadoras y fallar miserablemente. Esto es en parte dado que los estudios científicos enfocados al conjunto de los lenguajes naturales y la inteligencia artificial no han resonado de la manera más armoniosa posible.

Y como culparlos de no trabajar armoniosamente si sus campos de estudio son en teoría diametralmente opuestos, son como agua y aceite, no se mezclan, ¿o tal vez si? Entrando como catalizador a esta mezcla surgen hasta hace poco el procesamiento de los lenguajes naturales, mediante un análisis del contexto de una oración pueden dar con un resultado de una búsqueda, bajo el uso de un algoritmo que estudia la semántica lógica de la oración el ordenador da con el resultado en cuestión de instantes.

El PLN si bien es un logro, es una ciencia que todavía se encuentra en etapas tempranas de desarrollo, todavía no ha logrado complementar exitosamente a la inteligencia artificial de manera de hacerla posible en la práctica, pero como dice un famoso refrán chino un viaje de un millón de leguas empieza con dar el primer paso. Así que habrá que esperar un tiempo mas.

Revista Singularidad

Director Luis Enrique Rangel. Redacción Manuel Martino Del Molino Consejo Académico Asesor

Yamila Gascón

Nelsy Vivenes

Jonathan Vásquez Editor Responsable: Luis E. Rangel y Manuel Martino Del Molino. Las ideas y opiniones expresadas en esta revista son responsabilidad única y exclusiva de los autores, la revista no se responsabilizara por dichas opiniones. Avenida Universidad Los Guaritos. Maturín, Monagas, Venezuela Teléfono: +58 (0291) 6417755 Correo electrónico: [email protected]

RIF: G-20000052-0

Page 4: Lenguaje Natural

Actualmente vivimos en un mundo con un alto auge por la creación de

nuevas formas de comunicación, y por ende adaptar el lenguaje con el que nos

comunicamos normalmente, pero como lograr eso depende exclusivamente en

que tan bien comprendamos nuestro propio lenguaje, que comprendamos el

origen, su estructura, sus ineficiencias, comprender todo de una manera holística,

para al final dar con una cosmovisión de la realidad del lenguaje y poder aplicar

las el conocimiento al mejoramiento de los métodos de comunicación.

Aquí se estudiara que es el lenguaje natural, en toda la extensión de su

palabra y como ese puede ser adaptado a las necesidades que surgen de los

sistemas computacionales, siendo un campo relacionado intrínsecamente con el

paradigma de la cibernética, que busca mejorar las relaciones entre las máquinas

y el hombre, y por supuesto un campo fundamental es la comunicación e

interacción entre las máquinas y el hombre.

Page 5: Lenguaje Natural

Es el empleo de la palabra

para expresar ideas, comunicarse,

establecer relaciones entre los seres

humanos. Un lenguaje es un conjunto

de palabras, su pronunciación y los

métodos para combinarlas en frases

y oraciones, generalmente infinito y

que se forma mediante

combinaciones de palabras definidas

en un diccionario terminológico

previamente establecido. Las

combinaciones posibles deben

respetar un conjunto de reglas

sintácticas establecidas, a ello se le

conoce con el nombre de Sintaxis.

Además, las palabras deben tener

determinado sentido,

deben ser comprendidas

por un grupo humano en

un contexto dado, a ello se

le denomina Semántica.

Posiblemente los primero humanos utilizaban una suerte

de fonogramas que contribuyeron a la creación de

las primeras lenguas

A lo largo de la historia el ser humano

ha utilizado el lenguaje para trasmitir

sus conocimientos, sentimientos,

emociones, sensaciones,

comunicarse con el resto de los

humanos y esta función del lenguaje

la ha desarrollado de manera oral,

gráfica, escrita o por señas. [1]

Desde un punto de vista más

amplio, el lenguaje indica una

característica común al hombre y a

los animales para expresar sus

experiencias y comunicarlas a otros

mediante el uso de símbolos, señales

y sonidos registrados por los órganos

de los sentidos. El ser humano

emplea un lenguaje complejo que se

Page 6: Lenguaje Natural

expresa con secuencias sonoras y

signos gráficos. Los animales, por su

parte, se comunican a través de

signos sonoros y corporales y en

muchos casos distan de ser

sencillos.[2]

Entre los tipos de lenguajes cabe

destacar mencionar

que existen dos tipos:

Los lenguajes

naturales como

el español, el

ruso, el inglés,

el francés, etc.

Los lenguajes

formales como

los lenguajes de programación,

el lenguaje de la lógica

matemática, etc.[1]

Lenguaje Natural

El término lengua natural designa una

variedad lingüística o forma de

lenguaje humano con fines

comunicativos que está dotado de

una sintaxis y que obedece

supuestamente a los principios de

economía y optimidad. Las lenguas

naturales usualmente están basadas

en símbolos sonoros pero también

pueden existir lenguas basadas en

signos.

En la sociolingüística, el término

lengua natural también se

utiliza a veces como

lengua étnica en

contraposición a las

lenguas planificadas

(como el esperanto). La

lengua étnica evoluciona

enmarcada por una

cultura de hablantes

nativos que utilizan dicha lengua con

una finalidad comunicativa. De esta

forma, se distingue entre idiomas

tales como el chino mandarín, el

español y el inglés, las cuales son

lenguas étnicas; y el esperanto, ido,

interlingua, a las cuales se les

denomina lenguas planificadas. Sin

embargo, una lengua planificada

también puede adquirir una cultura y

hablantes nativos, como es el caso

del esperanto. Además, formalmente

las lenguas planificadas y las lenguas

étnicas pueden cumplir igualmente

Page 7: Lenguaje Natural

Charles F. Hockett

con los requisitos de poseer sintaxis y

principios de economía que las hagan

aptas para la comunicación humana

general.

Características de las lenguas

naturales

Varios autores han redactado

listas de características definitorias de

qué es una lengua natural, algunas

de las cuales están presentes en la

comunicación animal y los lenguajes

formales. Sin embargo, sólo las

lenguas naturales tienen estos quince

rasgos de

Hockett y, por

tanto, esta lista

caracteriza lo

que es una

lengua natural.

Entre los rasgos más

definitorios están la

arbitrariedad (de la relación entre el

signo y el significado), la

productividad (que permite producir

nuevos mensajes nunca antes

realizados) y la estructura jerárquica

(según la cual, las lenguas humanas

poseen reglas o principios sintácticos

y gramaticales, por lo que las

producciones no son aleatorias).[3]

Según el lingüista Charles Hockett,

existen seis rasgos fundamentales de

las lenguas naturales:

1. Desplazamiento: nos permite

hablar sobre elementos que no

están presentes en el contexto

y sucesos que no ocurren en el

momento. Es decir, tenemos

conciencia del tiempo: pasado,

presente y futuro. Va unido al

concepto de la muerte, cuya

angustia previa es eclipsada

por las religiones.

2. Arbitrariedad: en los animales

parece haber conexión entre el

mensaje y la señal, los signos

no son arbitrarios. Las señales

son un inventario limitado en

casi todas las especies. La

relación entre una palabra y su

representación es casual.

3. Productividad: cuando surgen

nuevas situaciones u objetos

que han de ser descritos, los

usuarios manipulan el lenguaje

para producir nuevas

Page 8: Lenguaje Natural

expresiones y proposiciones.

Somos capaces de producir

nuevas palabras, expresiones,

cosas que los demás no han

sido capaces de crear.

4. Transmisión cultural: aunque

los humanos

nacemos

con una

capacidad

innata para

el lenguaje,

la realización

concreta de

este y sus conexiones

semánticas son un producto

cultural que se transmite por

tradición. Nuestro lenguaje se

transmite dentro de una

sociedad, culturalmente, para

que se active.

5. Elementos discretos: cada

sonido de la lengua es

discriminable del resto y el

conjunto tiende a ser

interpretado como un sonido

de la lengua con un significado

específico. Entre todos los

sonidos posibles de alrededor,

identificamos los que sabemos

descodificar y darles

significado.

6. Dualidad: dos niveles de

realización; por un lado, el que

permite decir los sonidos y, por

otro, pronunciar esos sonidos

como una o varias

palabras con

significado (c-a-l-o:

loca, cola...). Nuestro

lenguaje puede

referirse a sonidos que

combinados son

palabras y forman

frases a su vez.

7. Canal vocal-auditivo: el habla

se genera en las cuerdas y se

percibe por los oídos.

8. Intercambiabilidad: cualquier

emisor se puede convertir en

receptor.

9. Especialización: las señales

lingüísticas solo sirven para

comunicarse, para transmitir

significados.

10. Transmisión irradiada: la

señal no se puede dirigir y la

puede interceptar cualquiera.

11. Evanescencia: las señales

desaparecen en el mismo

momento de emitirlas.

Page 9: Lenguaje Natural

Test de Turing

12. Retroalimentación: el propio

hablante oye todo lo que dice y

puede reflexionar sobre ello.

13. Semanticidad: los signos

tienen significado porque se

asocian de forma estable a

elementos de la vida real.

Las 7 últimas propiedades son

compartidas con algunos animales.

Estas caracterizan al lenguaje

humano, pero no lo distinguen de

otros sistemas de comunicación.[5]

Procesamiento del

Lenguaje Natural

Por Procesamiento de Lenguaje

Natural (PLN, denominado también

NLP por sus siglas en inglés) se

entiende la habilidad de la máquina

para procesar la información

comunicada, no simplemente las

letras o los sonidos del lenguaje.

El procesamiento del lenguaje es de

manera general, el conjunto de

instrucciones que una computadora

recibe en un lenguaje de

programación dado (formal), que le

permitirán comunicarse con un

humano en su propio lenguaje,

(inglés, francés, español, etc.)

Origen

La historia del PLN empieza desde

1950, aunque existe trabajo

encontrado desde periodos

anteriores. En 1950, Alan Turing

publicó Computing machinery and

intelligence el cual proponía lo que

Page 10: Lenguaje Natural

Noam Chomsky

hoy llamamos test de turing como

criterio de inteligencia. El experimento

de Georgetown en 1954 involucro

traducción automática de más de

sesenta oraciones del ruso al inglés.

Los autores clamaron que en tres o

cinco años la traducción automática

sería un problema resuelto. El

progreso real en traducción

automática fue más lento y después

del reporte ALPAC en 1996, el cual

demostró que la investigación había

tenido un bajo desempeño. Más tarde

investigación a

menor escala en

traducción

automática se llevó a

cabo hasta finales de

1980, cuando se

desarrollaron los

primeros sistemas de

traducción

automática

estadística. Esto se debió tanto

al aumento constante del poder

de cómputo resultante de la Ley de

Moore y la disminución gradual del

predominio de las teorías lingüísticas

de Noam Chomsky (por ejemplo, la

Gramática Transformacional), cuyos

fundamentos teóricos desalentaron el

tipo de lingüística de corpus, que se

basa el enfoque de aprendizaje de

máquinas para el procesamiento del

lenguaje. Algunos de los primeros

algoritmos de aprendizaje automático

utilizados, tales como árboles de

decisión, sistemas producidos de

sentencias si-entonces similares a las

reglas escritas a mano.

Niveles del Procesamiento del

Lenguaje Natural

Nivel fonológico:

trata de cómo las

palabras se

relacionan con los

sonidos que

representan.

Ejemplo:

Rápida + mente ==

rápidamente

Nivel morfológico: trata de cómo

las palabras se construyen a partir de

unas unidades de significado más

pequeñas llamadas morfemas.

Ejemplos:

Page 11: Lenguaje Natural

teléfono: tele (morfema prefijo) + fono

(lexema)

Nivel sintáctico: trata de cómo las

palabras pueden unirse para formar

oraciones, fijando el papel estructural

que cada palabra juega en la oración

y que sintagmas son parte de otros

sintagmas.

Nivel semántico: trata del

significado de las palabras y

de cómo los significados se

unen para dar significado a

una oración, también se

refiere al significado

independiente del contexto,

es decir de la oración aislada.

Nivel pragmático: trata de cómo

las oraciones se usan en distintas

situaciones y de cómo el uso afecta el

significado de las oraciones. Se suele

reconocer un sub-nivel recursivo:

discursivo, que trata de cómo el

significado de una oración se ve

afectado por las oraciones

inmediatamente anteriores.[8]

Arquitectura de un sistema de

Procesamiento del Lenguaje

Natural

Uno de los elementos fundamentales

en el diseño de un sistema PLN es

sin lugar a dudas la determinación de

la arquitectura del sistema, es decir,

computadora y como ella interpreta y

analiza las

oraciones

que le

sean

proporcionadas. A continuación se

muestra un esquema del análisis

léxico/ sintáctico por computadora. El

sistema consiste de:

a. El usuario le expresa (de

alguna forma) a la

computadora que tipo de

procesamiento desea hacer;

b. La computadora analiza las

oraciones proporcionadas, en

Page 12: Lenguaje Natural

Arquitectura de un Sistema PLN

el sentido morfológico y

sintáctico;

c. Luego, se analizan las

oraciones semánticamente, es

decir se determina el

significado de cada oración;

d. Se realiza el análisis

pragmático del texto. Así, se

obtiene una expresión final.

Se ejecuta la expresión final y se

entrega al usuario para su

consideración.[1]

Aplicaciones del Procesamiento

de Lenguajes Naturales

Las aplicaciones del procesamiento

de lenguajes naturales son muy

variadas, ya que su alcance es muy

grande, algunas de las aplicaciones

son:

Page 13: Lenguaje Natural

Traducción automática

Se refiere más que nada a la

traducción correcta de un lenguaje a

otro, tomando en cuenta lo que se

quiere expresar en cada oración, y no

solo palabra por palabra.

Recuperación de la información:

En esta aplicación, un claro ejemplo

seria el siguiente: una persona llega a

la computadora y le dice (en lenguaje

natural) que es lo que busca, esta

busca y le dice que es lo que tiene

referente al tema.

Resolución cooperativa de

problemas:

La computadora debe tener la

capacidad de cooperar con los

humanos para la solución de

problemas complejos,

proporcionando datos e información,

incluyendo también, la demanda de

información por parte del ordenador

al usuario, debiendo existir una

excelente interactividad entre el

usuario y el ordenador.

Page 14: Lenguaje Natural

Reconocimiento de voz:

Esta es una aplicación del

Procesamiento de Lenguajes

Naturales que más éxito ha obtenido

en la actualidad, ya que las

computadoras de hoy ya tienen esta

característica, el reconocimiento de

voz puede tener dos posibles usos:

para identificar al usuario o para

procesar lo que el usuario dicte,

existiendo ya programas comerciales,

que son accesibles por la mayoría de

los usuarios, ejemplo: viavoice.[6]

Page 15: Lenguaje Natural

Referencias Bibliográficas

[1]-González Díaz, E. (Noviembre de 2006). Monografias.com. Recuperado el 26

de Marzo de 2015, de http://goo.gl/Z6v2Wr

[2]- Lenguaje. (2015, 21 de marzo). Wikipedia, La enciclopedia libre. Fecha de

consulta: 04:24, marzo 27, 2015 desde http://goo.gl/Un5R34

[3]- Lengua natural. (2014, 11 de noviembre). Wikipedia, La enciclopedia libre.

Fecha de consulta: 04:26, marzo 27, 2015 desde http://goo.gl/jnzxgx

[4]- Perez Hernandez, S. R. (13 de Feberero de 2011). saylerrene.blogspot.com. Recuperado el 26 de Marzo de 2015, de http://goo.gl/xpFPh0

[5]- descubriendoelenguaje.blogspot.com. (11 de Mayo de 2008). Recuperado el 26 de Marzo de 2015, de http://goo.gl/zKVHJY

[6]- Procesamiento de lenguajes naturales. (2015, 20 de marzo). Wikipedia, La

enciclopedia libre. Fecha de consulta: 04:33, marzo 27, 2015 desde

http://goo.gl/jiiDWp

[7]- Rodriguez Correa, S., & Benavides Cañon, P. A. (23 de Mayo de 2007). eprints.rclis.org/. Recuperado el 26 de Marzo de 2015, de http://goo.gl/Fsok34

[8]-Muñoz Fernandez, S. (2007). procesamientolenguajerecuperacion.50webs.org. Recuperado el 26 de Marzo de 2015, de http://goo.gl/x8Crsy