INFORMADOR PARLANTE MINUTO A MINUTO
Transcript of INFORMADOR PARLANTE MINUTO A MINUTO
Prototipo: Sistema lector de definiciones en español provenientes de la web
interactuando con voz
2 Ingeniería en Sistemas Computacionales
Aplicación e Investigación en Tecnologías de Cómputo
Prototipo: Sistema lector de definiciones en español provenientes de la web
interactuando con voz
3 Ingeniería en Sistemas Computacionales
Aplicación e Investigación en Tecnologías de Cómputo
Prototipo: Sistema lector de definiciones en español provenientes de la web
interactuando con voz
4 Ingeniería en Sistemas Computacionales
Aplicación e Investigación en Tecnologías de Cómputo
Contenido
PARTICIPANTES ........................................................................................................................................ 5
OBJETIVOS .............................................................................................................................................. 11
PRESUPUESTO SOLICITADO ................................................................................................................... 12
METODOLOGÍA ...................................................................................................................................... 13
CALENDARIO .......................................................................................................................................... 15
VENTAJAS Y CONCLUSIONES .................................................................................................................. 15
IMPACTO ................................................................................................................................................ 16
FUENTES DE INFORMACIÓN .................................................................................................................. 17
Prototipo: Sistema lector de definiciones en español provenientes de la web
interactuando con voz
5 Ingeniería en Sistemas Computacionales
Aplicación e Investigación en Tecnologías de Cómputo
PARTICIPANTES
Líder del Proyecto
M.C. Rosa María Ortega Mendoza
Docentes
M.C.C. René Cruz Guerrero
M.C.C. Lauro Vargas Ruiz
Alumnos
YANIN GUADALUPE HERNÁNDEZ
Prototipo: Sistema lector de definiciones en español provenientes de la web
interactuando con voz
6 Ingeniería en Sistemas Computacionales
Aplicación e Investigación en Tecnologías de Cómputo
RESUMEN
La web se ha consolidado como una fuente valiosa de información, ya que podemos
encontrar textos digitales donde los usuarios expresan, en lenguaje natural, sus
sentimientos, conocimientos e intereses, entre otras cosas. Esta disponibilidad de
información ha motivado la creación de herramientas basadas en técnicas de
minería de texto para extraer información específica proveniente de la web.
Asimismo, se buscado que las herramientas brinden una interacción amigable con
el usuario. Precisamente, la interacción usando el habla ha ganado mucha
popularidad.
Por ello, el prototipo propuesto corresponde a una aplicación que define términos
especificados por el usuario e interactuando a través del habla. Básicamente, se
propone que el usuario ingrese una petición en habla y la herramienta consulte varias
definiciones en la web de diferentes sitios. Posteriormente, mediante técnicas de
minería de texto, recupere las definiciones más populares. Finalmente, la
herramienta devolverá la respuesta, también en habla.
Prototipo: Sistema lector de definiciones en español provenientes de la web
interactuando con voz
7 Ingeniería en Sistemas Computacionales
Aplicación e Investigación en Tecnologías de Cómputo
ESTADO DEL ARTE
Con el nacimiento de la computación y sobre todo del internet, han surgido varias
líneas de investigación y desarrollo para crear aplicaciones de computadora que
busquen interactuar con el usuario a través del habla. En este contexto, el prototipo
propuesto busca extraer información de la web, ya que ese encuentra actualizada y
a su vez, mostrarla al usuario en una forma de comunicación natural como el habla
o la visualización de imágenes.
Actualmente, existen unas herramientas conocidas como screen readers (lectores
de pantalla), los cuales transforman la información mostrada en la pantalla en formas
no visuales como el habla. Un ejemplo es el sistema llamado JAWS1, realizado por
la compañía Freedom Scientific de San Petersburg, Florida, Estados Unidos. Hoy en
día, ya existe una versión en español. Por otro lado, WebbIE [8] es un sistema
enfocado a interpretar el formato de una página web para que, posteriormente, un
lector de pantalla ofrezca la información de manera auditiva.
Estas herramientas buscan facilitar la interacción con el usuario pero se limitan a leer
contenidos. La herramienta propuesta, mina la información de la web para extraer
información específica para atender necesidades de los usuarios. En otras palabras,
se utilizan técnicas de minería de texto para procesar los contenidos fuente
provenientes de la web y de esta manera, atender peticiones de los usuarios tales
como definiciones o imágenes alusivas a término.
Prototipo: Sistema lector de definiciones en español provenientes de la web
interactuando con voz
8 Ingeniería en Sistemas Computacionales
Aplicación e Investigación en Tecnologías de Cómputo
La ventaja más importante de nuestra propuesta es el soporte de interacción por
medio del habla para obtener información específica del usuario a través de minar
contenidos web y no sólo leerlos.
Las tecnologías de voz cada vez son más importantes tanto en la informática
personal y como empresarial, principalmente, porque mejoran la interacción humana
con los ordenadores. Existen diversas aplicaciones dirigidas a usar síntesis y otras
que se complementan con el reconocimiento de voz [4]:
• Enciclopedias multimedia: Diseñadas para personas con algún tipo de
discapacidad, ya sea auditiva, motora o visual. Por ejemplo, el Diccionario
para Invidentes Larousse Electrónico DILE [2] es una enciclopedia
hipertextual, la información se suministra a través de la síntesis de voz.
• Aplicaciones usadas para personas con discapacidades visuales: Proyecto
CANAIMA [6] que es enfocado al aprendizaje de personas con distintas
discapacidades.
• Anotaciones parlantes: Como el Braille’n speack (Ministerio de Educación,
Cultura y Deporte). Es un aparato para personas con discapacidad visual con
funciones de lectura y escritura, la entrada de datos es mediante un teclado
en braile y la salida es por medio de una voz sintética.
• Guías de museos: como el robot realizado en el proyecto ROBINT [7]. Es un
robot autónomo concebido como elemento interactivo en un museo capaz de
realizar visitas guiadas usando el reconocimiento de voz para recibir
preguntas de los visitantes. A su vez, integra la síntesis de voz con emociones
que humanizan su intervención.
Por otro lado, existe un sistema similar al que se presenta en esta propuesta, el
proyecto fue realizado por la Universidad de Guayaquil en Ecuador [1]. Ese sistema
Prototipo: Sistema lector de definiciones en español provenientes de la web
interactuando con voz
9 Ingeniería en Sistemas Computacionales
Aplicación e Investigación en Tecnologías de Cómputo
usa el reconocimiento y síntesis de voz, así como un diccionario de datos donde se
encuentra almacenada la información sobre temas específicos. Sin embargo, el uso
de un diccionario de datos local propicia que la búsqueda de la información sea
limitada, ya que sólo podremos encontrar resultados de los términos que se
encuentren en dicho diccionario. En contraste, la aplicación propuesta hace uso de
la web para obtener información específica de lo que busca un usuario. De esta
forma, se asegura que se obtendrán definiciones para casi cualquier término y sobre
todo, de cualquier dominio.
Prototipo: Sistema lector de definiciones en español provenientes de la web
interactuando con voz
1
0
Ingeniería en Sistemas Computacionales
Aplicación e Investigación en Tecnologías de Cómputo
JUSTIFICACIÓN
Actualmente, la información más actualizada que refleja las variaciones
generacionales del uso de las palabras, la encontramos en la web. En este contexto,
se propone en el desarrollo de una herramienta de software que automáticamente
extraiga definiciones para un término especificado por el usuario y que sean
provenientes de la web para que con ello, se refleje el contexto actual de la sociedad.
Asimismo, el software ofrecerá una interacción en habla constituyéndolo como una
herramienta de gran ayuda tanto para personas con discapacidad visual, como para
personas con poca disponibilidad de tiempo para estar frente a una computadora
leyendo la información en la web. Así también, podría ser usada por niños, evitando
que se expongan a consultar páginas con contenidos no adecuados.
Prototipo: Sistema lector de definiciones en español provenientes de la web
interactuando con voz
1
1
Ingeniería en Sistemas Computacionales
Aplicación e Investigación en Tecnologías de Cómputo
OBJETIVOS
A continuación se muestran los objetivos del prototipo de investigación
Objetivo general
Desarrollar una aplicación de escrito que recupere y lea definiciones para un término
especificado por el usuario mediante habla.
Objetivos particulares
• Realizar reconocimiento de voz para traducir una petición del usuario a texto
• Extraer definiciones provenientes de la web para un término especificado por el
usuario.
• Realizar síntesis de voz para traducir el resultado del procesamiento a habla.
Prototipo: Sistema lector de definiciones en español provenientes de la web
interactuando con voz
1
2
Ingeniería en Sistemas Computacionales
Aplicación e Investigación en Tecnologías de Cómputo
PRESUPUESTO SOLICITADO
Este prototipo recibirá financiamiento interno, requiriendo los siguientes recursos y
materiales:
• Una computadora con por lo menos 1GB de memoria,
• Licencia de Microsoft Visual Studio
• Una diadema con micrófono
• Bocinas usb
• Tarjeta de conexión inalámbrica
• Conexión a internet
con
Prototipo: Sistema lector de definiciones en español provenientes de la web
interactuando con voz
1
3
Ingeniería en Sistemas Computacionales
Aplicación e Investigación en Tecnologías de Cómputo
METODOLOGÍA
Las etapas de desarrollo se describen a continuación:
1. Análisis
Se analizarán principales tecnologías de síntesis y reconocimiento de voz para
seleccionar la más adecuada.
2. Diseño. Se diseñará una arquitectura que involucre:
a. Reconocimiento de voz. Se desarrollará un módulo que permita tomar
la definición que indique el usuario mediante el habla y la convierta en
texto para su posterior procesamiento.
b. Recuperación de información web. Se realizará un módulo que
recupere contenidos fuente que provengan de la web que contengan
posibles definiciones para el término indicado por el usuario.
c. Módulo de minería de texto para extraer las definiciones provenientes
de la web que correspondan al término indicado por el usuario. Se
analizarán los contenidos fuente de los diferentes sitios seleccionados
para establecer patrones que permitan minar el código con la finalidad
de extraer la definición deseada.
d. Síntesis de voz. Se implementará un módulo para traducir la
información obtenida a habla
e. Diseño de la interfaz. Se diseñará y desarrollará un interfaz de software
para interactuar con el usuario. Será una interfaz que integre todos los
módulos mencionados
Prototipo: Sistema lector de definiciones en español provenientes de la web
interactuando con voz
1
4
Ingeniería en Sistemas Computacionales
Aplicación e Investigación en Tecnologías de Cómputo
3. Programación. Se analizarán diversos lenguajes de programación según las
necesidades de los módulos planeados (java, C#, perl, etc) y se programarán
todos los módulos. A su vez, se realizará la programación correspondiente para
integrar todos los módulos en un solo sistema.
4. Pruebas del sistema. Se realizarán diversos casos de prueba para validar el
correcto funcionamiento del sistema.
Prototipo: Sistema lector de definiciones en español provenientes de la web
interactuando con voz
1
5
Ingeniería en Sistemas Computacionales
Aplicación e Investigación en Tecnologías de Cómputo
CALENDARIO
Las actividades necesarias para desarrollar el proyecto tienen una duración de
aproximadamente 1 año y 2 meses, desde abril 2015 hasta junio 2016. Dichas
actividades se muestran en la tabla 1.
Tabla 1. Calendario del proyecto
Actividad ENE MAR 2015
ABR JUN 2015
JUL SEP 2015
OCT DIC 2015
ENE MAR 2016
ABR JUN 2016
Análisis
Diseño
Reconocimiento de voz
Recuperación de información
Minería de texto
Síntesis de voz
Diseño de la interfaz
Programación
Pruebas
VENTAJAS Y CONCLUSIONES
• El sistema a construir será usado para encontrar definiciones de términos de
forma más rápida, fácil y sobre todo, interactiva mediante habla.
• Se atenderán peticiones del usuario mediante el lenguaje hablado. En
consecuencia, las aplicaciones derivadas de este proyecto pueden ser
Prototipo: Sistema lector de definiciones en español provenientes de la web
interactuando con voz
1
6
Ingeniería en Sistemas Computacionales
Aplicación e Investigación en Tecnologías de Cómputo
utilizadas por personas con alguna discapacidad visual incluso hasta
totalmente invidentes.
• La aplicación también puede ser usada académicamente por niños.
Básicamente, la búsqueda de una definición se facilita evitando que los
pequeños indaguen por la web visitando sitios con contenidos no adecuados.
• Se recuperará información proveniente de la web, la cual refleja la variación
del uso del lenguaje. Por lo tanto, las herramientas creadas tendrán una
amplia vida útil.
IMPACTO
Académicamente, el prototipo permitirá el desarrollo de una tesis de licenciatura.
A continuación, se presenta una lista de los posibles usos del prototipo que reflejan el
impacto del mismo
• Uso por personas con discapacidad visual
• Uso por niños delimitando su navegación en internet
• Uso por cualquier persona para facilitar búsquedas en diccionarios
Prototipo: Sistema lector de definiciones en español provenientes de la web
interactuando con voz
1
7
Ingeniería en Sistemas Computacionales
Aplicación e Investigación en Tecnologías de Cómputo
FUENTES DE INFORMACIÓN
1. Alarcón Acosta, D.P. (2016). Sistema que simule conocimiento humano con
voz "SEUZ". Manual Técnico. http://repositorio.cisc.ug.edu.ec/handle/123/71
2. Alonso A. F., Jiménez, A., Fuentes Castro, J., Martínez, L., & Montes Gracia,
C. (1996). El Diccionario para Invidentes Larousse Electrónico (DILE): una
aplicación de la enciclopedia parlante hipertextual (EPA). Integración. Revista
sobre ceguera y deficiencia visual, 47-60
3. Eíto Brun, R. y Senso, J. A. (2004). Minería textual. El profesional de la
información, 2004, v. 13, n. 1, 11-27
4. Fernández R., E. (1999). Tecnologías del habla y síntesis de voz en gallego.
Volumen Monográfico, 103-116. Obtenido de
https://dialnet.unirioja.es/descarga/articulo/227027.pdf
5. Hailpern, J. et al. (2009). Web 2.0: blind to an accessible new world.
Proceedings of the 18th international Conference on World Wide Web New
York, NY.
6. González, M. (2014). La CANAIMA educativa una herramienta tecnológica de
enseñanza en educación primaria bolivariana. Revista Electrónica Campus
Virtual de la Universidad Fermín Toro, 40-73.
Prototipo: Sistema lector de definiciones en español provenientes de la web
interactuando con voz
1
8
Ingeniería en Sistemas Computacionales
Aplicación e Investigación en Tecnologías de Cómputo
7. Lucas Cuesta, J., Alcázar, R., Montero, J., Fernández, F., Barra-Chicote, R.,
D'Haro, L., Pardo Muñoz, J. (2008). Desarrollo de un Robot-Guía con
Integración de un Sistema de Diálogo y Expresión de Emociones: Proyecto
ROBINT. Procesamiento del Lenguaje Natural, Revista nº 40, 51-58.
8. King, A. et al. (2004).Web Browser for Visually Impaired People. Cam-bridge
Workshop on Universal Access and Assistive Technology (CWUAAT),
Cambridge, UK