MEMORIA EN EXTENSO - Jesús Olivares

1er Encuentro Nacional de Innovación Tecnológica

para la Discapacidad

MEMORIA EN EXTENSO

Diciembre, 2017

Facultad de Ingeniería Eléctrica

ENITED 2017

PRESENTACIÓN

Las personas que padecen alguna discapacidad son un sector de la población muy valioso para la

sociedad. Sin embargo, por lo general conforman uno de los grupos más vulnerables, pues suelen

presentar índices de escolaridad más bajos, participar menos en la economía y tener mayores

gastos en comparación con las personas sin discapacidad. De acuerdo con informes de la

Organización Mundial de la Salud y a reportes de los últimos censos nacionales, el número de

personas con discapacidad (ya sea de nacimiento, por enfermedad, por accidente o por efectos de

la edad) va en aumento. Esto muestra lo necesario y urgente que es promover el desarrollo

científico y tecnológico que ellas requieren.

Las personas que sufren alguna discapacidad tienen problemas y necesidades específicas que

pueden ser atendidos por quienes se dedican a la investigación científica y al desarrollo

tecnológico en el país. Por un lado, se requiere investigación científica para prevenir, en lo

posible, la discapacidad. También se requiere investigación e innovación tecnológica para ayudar

a las personas con alguna discapacidad a superar los obstáculos a los que se enfrentan en su diario

vivir y, a la vez, ayudarlos a lograr su inclusión social, laboral y educativa.

Este Primer Encuentro Nacional de Innovación Tecnológica para Personas con Discapacidad

(ENITED 2017) es un foro donde se muestran los avances y resultados de la investigación

científica y tecnológica a favor de las personas con alguna discapacidad (física o intelectual) en

tres Ejes Temáticos:

1. Ingeniería

2. Ciencias de la Salud

3. Educación y Cultura.

ENITED 2017 ha reunido a investigadores, profesionales y estudiantes (de diferentes

instituciones y disciplinas) interesados en el desarrollo de tecnología que beneficie a las personas

con discapacidad. Esperamos que este encuentro promueva más proyectos de investigación y el

desarrollo de más tecnología para las personas con discapacidad, con el fin de favorecer su

autonomía física y económica y mejorar las condiciones de vida tanto de ellos como de sus

cuidadores, maestros y familias.

Los trabajos expuestos en este Encuentro forman parte de estas memorias y muestran el gran

interés que tienen los investigadores de las instituciones educativas en el desarrollo científico y

tecnológico a favor de las personas con discapacidad. Agradecemos a todos ellos su valiosa

participación.

El Comité Organizador de ENITED 2017

ENITED 2017

COMITÉ ORGANIZADOR

Coordinador General:

M.I. Miguel Ángel García Trillo

Trámites administrativos:

M.C. Diana Itzel Sepúlveda Jáuregui

Logística:

Ing. Wendolin Jacinto Díaz

Ing. Bertha Georgina Flores

Cursos y Talleres:

Enrique de Jesús Robledo Camacho

Alojamiento, turismo y eventos culturales:

M.C. Diana Itzel Sepúlveda Jáuregui

Web, apoyo técnico:

M.I. Salvador Daniel Pelayo Gómez

Enrique De Jesús Robledo Camacho

Registro y constancias:

M.C. Antonio Ulises Sáez Trujillo

Encuestas, Exposición Comercial y enlace con ONG’s:

C.P. Carolina Mateo Mejía

Personal de Staff y edecanes:

C.P. Carolina Mateo Mejia

Comité Científico:

Dra. Ma. Martha Marin Laredo

Dr. Francisco Loeza Becerra

Dra. Josefina Valenzuela Gandarilla

Mtra. Marisol Morales Rodriguez

M.T.I. José Juan Herrera García

Comité Científico de Prototipos Tecnológicos:

M.I. Rosalia Mora Juárez

M.C. Antonio Ulises Saez Trujillo

ENITED 2017

ÍNDICE

PONENCIAS

INGENIERÍA

SALUD

MULTIDISCIPLINARIA

CARTELES

RESUMENES

6

122

149

251

390

ENITED 2017

PONENCIAS

ÁREA DE INGENIERÍA .............................................................................................................. 6

DESARROLLO DE UNA MAQUINA CORTADORA LÁSER CON UNA PERSPECTIVA

INCLUYENTE ............................................................................................................................. 7

DISPOSITIVO DE RECONOCIMIENTO DE MOVIMIENTOS PARA PERSONAS CON

DISCAPACIDAD AUDITIVA Y DE LENGUAJE ................................................................... 13

DEFINICIÓN DE MODELO DE PRODUCCIÓN CON CALIDAD DE APLICACIONES

MÓVILES PARA DESARROLLO DE HABILIDADES PSICOMOTRICES ......................... 21

MANUFACTURA DE PRÓTESIS PERSONALIZADA CON IMPRESIÓN

TRIDIMENSIONAL .................................................................................................................. 41

DISEÑO MECANICO - ELECTROMAGNETICO Y CONTROL DE FASES DE

MOVILIDAD PARA PROTESIS DE EXTREMIDAD INFERIOR ......................................... 45

DESARROLLO DE EXOESQUELETO PARA REHABILITACIÓN ..................................... 58

SISTEMA DE INFORMACIÓN PARA LA DETECCIÓN OPORTUNA DE LA DISLEXIA76

SISTEMA DE APERTURA DE PUERTAS AUTOMÁTICO EDOS: GARANTIZANDO

ACCESIBILIDAD A PERSONAS EN SITUACIÓN DE DISCAPACIDAD ........................... 87

ACCESIBILIDAD WEB Y CONTENIDOS DIGITALES. EVALUACION DE

PRINCIPALES OPERADORES DE TELECOMUNICAICONES NACIONALES E

INTERNACIONALES ............................................................................................................... 93

DISLEXPACE” .......................................................................................................................... 97

VIDEOJUEGO SERIO PARA NIÑOS CON DISLEXIA ......................................................... 97

LAS TIFLOTECNOLOGÍAS COMO HERRAMIENTA PARA MEJORAR LA INCLUSIÓN

EDUCATIVA DE LOS ESTUDIANTES CON DISCAPACIDAD VISUAL......................... 104

APLICACIÓN MÓVIL DE TRADUCCIÓN DE IMÁGENES DE LA LENGUA DE SEÑAS

A SONIDOS ............................................................................................................................. 112

ÁREA DE SALUD ..................................................................................................................... 123

CALIDAD DE VIDA EN PACIENTES QUE RECIBEN FISIOTERAPIA Y

REHABILITACIÓN ................................................................................................................. 124

CONOCIMIENTO DE LOS ESTUDIANTES DE ENFERMERÍA SOBRE LA

CONTENCIÓN MECÁNICA .................................................................................................. 131

DISCAPACIDADES QUE LIMITAN LA INDEPENDENCIA DEL ADULTO MAYOR E

INTERVENCIÓN DE ENFERMERÍA EN LA REHABILITACIÓN .................................... 139

ÁREA MULTIDISCIPLINARIA ............................................................................................. 149

PERCEPCION DE APOYO EN PAREJAS CON UN HIJO CON SÍNDROME DE DOWN

150

ENITED 2017

EQUINOTERAPIA COMO ALTERNATIVA DE REHABILITACIÓN EN PERSONAS CON

DISCAPACIDAD ..................................................................................................................... 166

EVALUACIÓN DE LA INFRAESTRUCTURA INCLUYENTE Y PROBLEMÁTICA PARA

DISCAPACITADOS EN EL INSTITUTO TECNOLÓGICO DE JIQUILPAN ..................... 178

MÚSICA COMO ESTRATEGIA TECNOLÓGICA APLICADA AL DESARROLLO DE

HABILIDADES EN PERSONAS CON DISCAPACIDAD .................................................... 204

APRENDIZAJE SUPERVISADO PARA DETECTAR DISLEXIA EN LA VOZ ................ 222

DISEÑO DE AYUDAS TÉCNICAS PARA DISCAPACIDAD VISUAL Y MOTORA: UNA

CONTRIBUCIÓN A LA EDUCACIÓN INCLUSIVA ........................................................... 239

CARTELES ............................................................................................................................. 253

APLICACIÓN WEB PARA APOYAR EL APRENDIZAJE DE MANEJO DE DINERO EN

PERSONAS CON SÍNDROME DE DOWN ........................................................................... 254

APOYO INTELIGENTE PARA PERSONAS CON DISCAPACIDAD VISUAL ................. 268

BASTÓN ELECTRÓNICO PARA INVIDENTES ................................................................. 272

DISEÑO DE PROTOTIPO DE VEHÍCULO MÓVIL DE TRANSMISIÓN MANUAL PARA

PERSONAS CON CAPACIDADES DIFERENTES ............................................................... 288

DISEÑO DE UN DISPOSITIVO PORTÁTIL PARA LA PRUEBA DE POTENCIALES

EVOCADOS AUDITIVOS ...................................................................................................... 298

SILLA DE RUEDAS CONTROLADA POR COMANDOS DE VOZ E INTERFACE

GRAFICA (EASY CHAIR VOICE)………………………………………………………….305

ENSEÑANZA DE LA ESCRITURA PARA NIÑOS CON ESPECTRO AUTISTA,

ESCRIBIENDO SIN

LAGRIMAS……………………………………………………………318

IDENTIFICACION Y EVALUACIÓN DE RIESGOS PSICOSOCIALES LABORALES EN

TRABAJADORES EN UNA TIENDA DE AUTOSERVICIO, 2017……………………….323

PREVALENCIA DE LESIONES MUSCULO ESQUELETICOS EN UNA EMPRESA DE

ALIMENTOS DE AGUASCALIENTES, ENERO A DICIEMBRE DE

2016………………344

DESARROLLO DE PROTOTIPO DE SOFTWARE PARA HABILITAR LA

COMUNICACIÓN EN PERSONAS CON PARALISIS CEREBRAL

SEVERA……….......361

TOXOPLASMOSIS OCULAR BILATERAL. REPORTE DE UN CASO DE ENFERMEDAD

DE TRABAJO ………………………………………………………………………………..369

RIESGOS DE DISCAPACIDAD EN EL PERSONAL DE ENFERMERIA DE UN

HOSPITAL

PÚBLICO……………………………………………………………………………………..378

ENITED 2017

RESUMENES ........................................................................................................................ 390

MEJORANDO LA DISFEMINA MEDIANTE EL RECONOCIMIENTO

COMPUTARIZADO DE SILABAS DEL HABLA ................................................................. 391

ESPACIOS EDUCATIVOS ACCESIBLES PARA PERSONAS CON DISCAPACIDAD .... 392

PROFESIONALIZACIÓN DE LOS ACTORES DE LA EDUCACIÓN INICIAL PARA UNA

INCLUSIÓN EDUCATIVA ..................................................................................................... 393

LA DISCAPACIDAD EN LOS CENSOS MEXICANOS DE POBLACION ......................... 395

DISPOSITIVO DE MARCHA SOLAR CON ELECTROESTIMULACIÓN ........................ 396

ENITED 2017

222

Con el fin de proteger la privacidad de cada participante, se omiten, como en el texto, los

nombres reales y sólo se hace referencia a quien hizo la recolección de datos:

(2017. Entrevistadora: Rigel Miravete. Conservatorio de las Rosas, A.C., Morelia, Michoacán.

[Grabaciones de audio].

APRENDIZAJE SUPERVISADO PARA DETECTAR DISLEXIA EN LA

VOZ Itzel Moreno Martínez1 [email protected], Karla Ivette Naranjo Juárez1

[email protected], Jesús Manuel Olivares Ceja2 [email protected], Andrés Lucas

Bravo1 [email protected], Benina Velázquez Ordoñez3

1Unidad Profesional Interdisciplinaria en Ingeniería y Tecnologías Avanzadas 2Centro de Investigación en Computación

3Dirección de Cómputo y Comunicaciones

Resumen. La dislexia es un trastorno del habla que afecta a miles de personas, entre ellas, al

menos a 8% de estudiantes de nivel primaria. Este padecimiento causa dificultades en el

aprendizaje y como consecuencia muchos estudiantes abandonan la escuela repercutiendo en el

tipo de empleos que pueden obtener siendo poco remunerados. Una oportunidad para quien

padece este tipo de trastorno es la detección oportuna desde la infancia. Este trabajo forma parte

de un sistema telemático para la detección oportuna de la dislexia mediante el reconocimiento de

palabras que se conoce su utilidad para realizar un diagnóstico adecuado. Los resultados que se

obtienen a distancia, están sujetos a la valoración de un grupo de especialistas en el área de

trastornos del lenguaje. A diferencia de los sistemas de reconocimiento de voz que en ocasiones

confunden palabras similares, en este trabajo, se debe tener mayor precisión para detectar

variaciones en la pronunciación de ciertas sílabas que caracterizan este padecimiento. Es por esto

que se trata en este documento el aprendizaje de los patrones no supervisado que caracterizan a

las palabras de interés. Se utilizaron muestras etiquetadas de infantes voluntarios con autorización

de sus padres. Las pruebas realizadas permiten considerar como una alternativa no invasiva

factible de aplicarse en sitios donde se carece de especialistas de la voz pero hay acceso a Internet

y personal que puede lograr grabaciones con equipos a precios accesibles y condiciones de

mínimo ruido.

Palabras clave: Dislexia, procesamiento de voz, aprendizaje supervisado, identificación de

patrones.

1. Introducción

La dislexia (Jiménez, 2012), es un trastorno del habla que se presenta en las personas desde la

infancia y persiste en el tiempo afectando habilidades básicas como la lectura y la escritura,

repercutiendo en el aprendizaje. Afecta también a quienes tienen capacidades intelectuales

normales o incluso superiores. La revista “México Sano” de la Secretaría de Salud publicó que

aproximadamente el 8% de los niños cursando primaria presentan dislexia, con consecuencias

ENITED 2017

223

académicas que llegan al abandono de los estudios por haber reprobado. Estas personas con

pocos estudios difícilmente pueden acceder a un empleo bien remunerado.

Los síntomas de la dislexia se pueden notar desde que los infantes comienzan a decir sus

primeras palabras, pero usualmente el diagnóstico se realiza hasta que empiezan a leer y escribir

con dibujos y pruebas escritas. La detección oportuna de la dislexia permite a los afectados

mejorar su calidad de vida y darles mejores oportunidades para estudiar y completar una carrera,

otorgándoles al mismo tiempo la oportunidad de mejorar la interacción con su entorno y así

evitarles la marginación social a que se encuentran expuestos.

La dislexia se presenta en diferentes tipos:

Profunda o fonética, presentan errores semánticos y dificultades para comprender el significado

de algunas palabras; añaden prefijos y sufijos al pronunciar palabras.

Fonológica, se conocen pocos trabajos.

Superficial, presentan problemas principalmente en palabras de longitud grande.

Las personas que presentan el trastorno de la dislexia presentan síntomas como:

Invertir letras de palabras completas o en partes, por ejemplo: en casa, dicen saca.

Cambian letras, por ejemplo, usan b en vez de p, o b en vez de d.

Copian palabras erróneamente aunque estén copiando.

Escriben una palabra con diferentes letras, por ejemplo: danca en vez de blanca.

Algunas palabras utilizadas para detectar personas con dislexia son: blanca, colombianos, fusil,

jirafa, gemelo, entre otras.

El propósito de este trabajo es generar un diccionario fonético con patrones de palabras que

puedan caracterizar los diferentes estilos fonéticos que se encuentran en el habla castellana. El

diccionario se utiliza en la detección de la dislexia mediante la comparación de los patrones de

palabras con la voz de los pacientes pronunciando palabras que se conocen como típicas para la

detección oportuna de dislexia. El resultado del procesamiento automatizado se valida por un

grupo de especialistas ubicados en un hospital del habla donde se ubica el servidor que efectúa el

proceso de reconocimiento de patrones. El servidor permite mediante Internet que personas

ubicadas en lugares remotos pueden enviar sus archivos de voz para analizarlos y que los

especialistas los valoren. En caso que alguna persona presente síntomas del trastorno de dislexia,

dependiendo del grado de severidad, los médicos le indicarán ejercicios o lo canalizarán a la

ciudad más cercana para su seguimiento.

El resto del trabajo presenta el estado del arte relacionado con el procesamiento de voz. En la

sección 3 se presenta la arquitectura del sistema telemático de reconocimiento de voz del cual

este trabajo se encarga de la obtención del diccionario fonético. La sección 4 explica el proceso

ENITED 2017

224

de aprendizaje no supervisado con archivos de voz etiquetados y presenta los resultados

obtenidos. Al final se indican las conclusiones y las referencias.

2. Estado del arte

En la literatura se reconoce a (Rabiner, 1993) como uno de los teóricos que han hecho

importantes aportaciones en el área de reconocimiento de voz, tanto para la extracción de

características como métodos para comparación de patrones o reconocimiento de la voz.

En la literatura es posible encontrar trabajos en que el procesamiento de la voz se aplica en:

Reconocimiento del hablante, una variante de este enfoque se emplea para el acceso seguro.

Reconocimiento de palabras independientemente del hablante, se utiliza principalmente en los

sistemas que transforman la voz en texto; estos sistemas existen en versiones para dispositivos

móviles.

Traducción de idiomas en tiempo real, algunos de estos desarrollos consisten en aplicaciones

móviles que reconocen la voz en un idioma y le envían a los audífonos la voz con la traducción

simultánea.

Análisis de la voz para detectar o ayudar a personas con algún trastorno.

En (Pérez, 2013) se utiliza el reconocimiento de la voz en un sistema de seguridad para el hogar.

El sistema almacena las voces de los dueños de la casa para permitirles el acceso. El sistema se

prueba con diferentes usuario y se valida que los usuarios no reconocidos no los deja ingresar, sin

embargo, cuando el usuario cambia su tono de voz, el sistema tampoco puede reconocerlo y no le

permite el acceso. Esta propuesta hace uso de una técnica conocida como «Linear Predictor

Coefficients, LPC» Coeficientes de Predicción Lineal (CPL).

En (Linarez, 2011) se describe un sistema de reconocimiento de voz para reconocer las vocales

del alfabeto en español de forma aislada para 3 hombres y 3 mujeres. Además, tiene la capacidad

de mostrar algunas características cualitativas del sistema auditivo humano, como la

identificación del locutor y la localización de la fuente sonora. En este sistema también se hace

uso de los Coeficientes de Predicción Lineal (CPL) para caracterizar las palabras.

3. Arquitectura del reconocedor de voz

El reconocimiento de la voz en el sistema propuesto se realiza mediante los módulos de la Figura

1. La captura de la voz, preprocesamiento, procesamiento son comunes a la obtención del

diccionario fonético y a la fase de reconocimiento. En la fase de reconocimiento se tiene la

opción de aprendizaje en donde se obtiene uno o varios patrones que mejor caracterizan a una

palabra. Los patrones múltiples se producen porque entre las personas algunas tienen un acento

diferente; estos patrones se almacenan en el diccionario fonético. Las palabras que se

proporcionan de los pacientes para el diagnóstico se clasifican con alguno de los patrones del

diccionario fonético.

ENITED 2017

225

Fig. 9 Arquitectura del reconocedor de voz

Captura de la señal de voz

La señal de voz se compone por ondas de presión producidas por el aparato fonador. Para realizar

una adquisición adecuada de este tipo de ondas se utiliza un micrófono, considerando que la

función principal de este dispositivo de medición es transformar las fluctuaciones de presión en

fluctuaciones de voltaje eléctrico.

Una vez captada la señal analógica, es necesario convertirla a un formato que permita su

procesamiento en la computadora, este cambio se realiza a través de un convertidor analógico

digital (ADC) en la tarjeta de sonido, el cual entrega la señal digitalizada y codificada.

Fig. 10 Convertidor Analógico Digital

ENITED 2017

226

Preprocesamiento

El preprocesamiento estriba en la manipulación de la señal mostrada en la Fig. 1 para que ésta sea

más fácil de analizar. Consta de tres etapas, eliminación del ruido, preénfasis y segmentación.

En la primera, se debe aplicar cualquier técnica para la eliminación de señales indeseables, como

ruido de fondo.

La segunda etapa radica en suavizar el espectro y dar acentuación a las frecuencias altas mediante

un filtro.

Finalmente, en la tercera etapa los segmentos generados son guardados en formato de columna de

matriz y son agrupados en varias tramas para el posterior procesamiento de la señal.

Fig. 11 Señal de voz de entrada

Atenuación de Ruido

En una señal de voz capturada por un micrófono, generalmente se adhiere ruido originado de

diversas fuentes, esta afectación puede modificar las características de las señales de voz y

deteriorar su calidad provocando la inteligibilidad del habla.

ENITED 2017

227

Para aplicaciones de voz, la estimación de habla limpia se consigue a través de la aplicación de

filtros lineales que reducen significativamente los efectos del ruido sin distorsionar la voz del

hablante. Sin ello se tendrían datos perjudiciales. Es por ello que a la señal de entrada se le aplica

un filtro de promedio móvil, se emplea para promediar los valores de forma local (Raúl Ibarra,

1999), esto significa que las componentes de entrada de mayor frecuencia son promediadas

mientras que las componentes de menor frecuencia son mantenidas. En seguida se define en la

ecuación 1 el filtro de promedio móvil, y en la Fig. 4 se puede observar su aplicación.

𝒚(𝒏) =𝟏

𝑴∑ 𝒙[𝒏 − 𝒌]

𝑴−𝟏

𝒌=𝟎

(𝟏)

Fig. 12 Señal de voz filtrada por promedio movil

Y un filtro pasa banda el cual es delimitado por un rango de frecuencias de corte, una inferior y

otra superior, por consiguiente, atenúa los componentes de frecuencia que sobrepasen el mismo y

las que permanecen pasan sin distorsión. La aplicación de estos filtros a la señal de voz se

muestra en la Fig. 5

ENITED 2017

228

Fig. 13 Señal de voz aplicando los filtros de promedio movil y pasabanda

Preénfasis

El objetivo de este filtro, que se define en el domino del tiempo por la ecuación 5, es suavizar el

espectro de la señal compensando los valores de altas y bajas frecuencias,

𝒚(𝒏) = 𝒙(𝒏) − 𝒂𝒙(𝒏 − 𝟏) (𝟐)

De esta forma, el valor de la señal 𝑦(𝑛), se calcula restando a la muestra en el instante 𝑛 actual, el

resultado de la multiplicación entre una constante 𝑎 (cuyo valor se encuentra en el rango de 0.9 a

1) y el valor de la muestra en el instante anterior 𝑛 − 1.

Finalmente, este filtro, logra que el espectro de la señal tenga un rango dinámico similar en toda

la banda de frecuencias. La aplicación de este filtro se observa en la Fig. 6

ENITED 2017

229

Fig. 14 Señal de voz aplicando los filtros de promedio movil, pasabanda y preenfasis

Segmentación

Este proceso es de suma importancia debido a que la señal de voz no es estacionaria, a causa de

que sus características cambian para reflejar los diferentes sonidos que se producen al hablar. Por

este motivo es necesario un método que permita obtener segmentos cortos cuasi estacionarios,

por consiguiente se divide la secuencia larga de voz que se tiene en segmentos de 5 a 100 ms [6],

ya que en este lapso de tiempo sus características son suficientemente estacionarias.

Dentro de la segmentación se aplican algoritmos para el ventaneo de la señal y la detección de

inicio y fin, como se explica a continuación.

Detección de inicio y fin de palabra

Es de particular importancia localizar la región del habla a reconocer, esto es, detectar el inicio y

fin de una palabra [6]. Para ello se utiliza el algoritmo Rabiner-Sambur [8], el cual detecta el

inicio y fin de una palabra adaptándose al entorno acústico de fondo, de donde obtiene los

umbrales relevantes para sus criterios de decisión de acuerdo a un intervalo registrado.

La Fig. 7 muestra el resultado de la aplicación de este algoritmo, que como se observa, elimina la

parte grabada que es innecesaria para el reconocimiento.

ENITED 2017

230

Fig. 15 Detección de inicio y fin de la señal de voz

Procesamiento

El objetivo principal de esta etapa es seleccionar las características más representativas de la

señal y es de suma importancia dentro del reconocimiento de voz porque es donde se obtiene el

conjunto de elementos que describen el patrón de la palabra a reconocer.

Considerando la variabilidad de la voz, es necesario extraer sus características más

representativas, es decir, llevar a cabo la eliminación de señales que no son elementales puesto

que los coeficientes extraídos que la caracterizan sólo deben preservar la información necesaria y

desechar la producida por fluctuaciones ajenas a ésta.

Al representar la señal de voz en intervalos cortos, los parámetros pueden extraerse mediante

técnicas de tratamiento de la señal, en el dominio del tiempo, o bien en un dominio transformado.

Existe una gran variedad de algoritmos que proporcionan rasgos extraídos de la señal de voz, que

representan sus características no estacionarias y en conjunto describen las propiedades acústicas

que conforman las unidades del habla.

En relación con las técnicas de extracción que se encuentran en la literatura, este trabajo se centra

exclusivamente en la Codificación de Predicción Lineal (LPC) y cuyos resultados obtenidos se

presentan en la Fig. 8.

ENITED 2017

231

Fig. 16 Coeficientes LPC

Reconocimiento de patrones

El método de reconocimiento basado en comparación de patrones [6], es un procedimiento en el

que algoritmos de entrenamiento establecen representaciones consistentes de los patrones a partir

de un conjunto de características cuantitativas que describen a un objeto o entidad. Su finalidad

es encontrar una regla de decisión automática que asigne al objeto a una categoría específica.

En relación con los patrones propios del habla, éstos se representan directamente por una

secuencia temporal de vectores con atributos obtenidos de un análisis espectral, estos atributos

son usados para clasificar los sonidos por palabras o subunidades de palabras específicas. En esta

investigación son clasificados por palabras.

Las fases esenciales que describen este enfoque son entrenamiento, aprendizaje y clasificación,

las cuales se muestran en el diagrama a bloques de la Fig. 9.

ENITED 2017

232

Para realizar esta etapa se emplea una Red Neuronal Artificial que como su nombre lo indica, es

un conjunto de neuronas o nodos interconectados entre sí por ligaduras que crean conexiones

permitiendo la comunicación directa entre ellas para poder recibir señales, procesarlas y

transmitirlas.

Aprendizaje de la RNA

Para escoger los pesos adecuados en las conexiones para que la red desempeñe una tarea en

particular, se le debe enseñar a hacer los cálculos realizando ajustes iterativos en los pesos, lo que

lleva a dos caminos, el aprendizaje supervisado y el no supervisado.

Aprendizaje Supervisado

Este tipo de aprendizaje se basa en la comparación directa de la salida de la red con la respuesta

correcta, la cual, ya es conocida. Se fundamenta en el reforzamiento del aprendizaje, en donde la

retroalimentación se lleva a cabo con base a la diferencia entre la salida real y la salida esperada.

Aprendizaje No supervisado

Este tipo de aprendizaje funciona cuando el fin no es definir en términos específicos de ejemplos

correctos, puesto que solo se requiere que con base a la entrada la red forme categorías de

acuerdo a las correlaciones realizadas y produzca una señal de salida que corresponda a cada

categoría de entrada.

Funcionamiento de la Red Neuronal Artificial

Clasificación Conjunto de

entrenamiento

∙ Adquisición ∙ Preprocesamiento ∙ Procesamiento

∙ Medidas de similitud o distancia

Predicción

Aprendizaje del

modelo

Construcción del

modelo

∙ Aprendizaje supervisado

Fig. 17 Diagrama a bloques de las etapas del mudulo de reconocimiento de patrones

ENITED 2017

233

El modelo de red neuronal empleado para el presente trabajo es el de retropropagación

«backpropagation», el cual está basado en la regla de aprendizaje que solo se aplica a modelos de

redes multicapa. Esta red tiene la capacidad de auto adaptar los pesos de las neuronas de las capas

intermedias con la finalidad de aprender la relación entre el conjunto de patrones de entrada y sus

salidas correspondientes para que posteriormente utilice esa misma relación con nuevos vectores

de entrada para dar una salida activa en caso que la nueva entrada sea parecida a las presentadas

durante el aprendizaje. En la Fig. 10 se aprecia el modelo de la red neuronal de retropropagación

empleado.

Fig. 18 Modelo de la red neuronal de retropropagación

Reconocimiento de patrones

Como se observa en la Fig. 10, es primordial establecer el número de neuronas en la capa de

entrada 𝑛 y el número de neuronas en la capa de salida 𝑚 a las cuales les corresponden como

datos de entrada un vector 𝑋 de tamaño 𝑛[𝑋1, 𝑋2, … 𝑋𝑛] y como datos de salida un vector 𝑌 de

tamaño 𝑚[𝑌1, 𝑌2, … 𝑌𝑚], estableciendo entre ellos una dependencia funcional que se puede

expresar de la siguiente manera:

[𝑿𝟏, 𝑿𝟐, …𝑿𝒏]𝑹𝑵 = [𝒀𝟏, 𝒀𝟐, … 𝒀𝒎] (𝟑)

𝐷𝑜𝑛𝑑𝑒:

𝑛 = 20

𝑚 = 5

ENITED 2017

234

Diseño de la Red Neuronal Artificial

El diseño de la red se divide en dos partes, la primera es el entrenamiento, que tiene como

objetivo modificar los pesos de la red en cada una de las capas, de modo que la salida deseada

coincida con la salida obtenida por la red ante un determinado patrón de entrada.

La segunda es la fase de validación de la red ante cualquier patrón de entrada que se le presente.

Como se muestra en la Fig. 10 se utiliza una arquitectura de retropropagación con tres capas: la

de entrada, la oculta y la de salida.

Fase de entrenamiento

Como se menciona anteriormente, los valores empleados para el correcto desempeño de esta fase

se presentan en la Tabla II.

TABLA II

VALORES PARA LA FASE DE ENTRENAMIENTO

Dato Valor

Neuronas en la capa de entrada 20

Neuronas en la capa oculta 10

Neuronas en la capa de salida 5

Fase de evaluación

Se abren los pesos obtenidos para la salida del proceso de entrenamiento y para la capa oculta, se

definen los mismos valores utilizados en el entrenamiento para la capa de entrada, la oculta, y la

de salida, así como el número de entrenamientos, los pesos de la capa de entrada y de la capa

oculta, y el patrón de entrenamiento.

Posteriormente, se procede a evaluar la red con un solo patrón de entrenamiento, que es el

objetivo a identificar; Si el patrón de entrenamiento se encuentra en la red, esta lo identifica de

acuerdo a las características de los valores de sus pesos, en caso contrario, la red emite un

mensaje indicando que no se identifica lo que ha dicho el hablante.

ENITED 2017

235

TABLA III FUNCIONAMIENTO DE LA RED

Palabra Pronunciada Palabra Reconocida

Blanca Blanca

Colombianos Colombianos

Fusil Fusil

Colombianos Gemelo

Jirafa Jirafa

Gemelo Gemelo

Blanca Blanca

Jirafa Gemelo

Gemelo Gemelo

Fusil Fusil

ENITED 2017

236

Fig. 19 Gráfica del error

TABLA III RENDIMIENTO DE LA RED

Rendimiento de la Red Neuronal

Número total de palabras a reconocer 20

Número de aciertos 16

Porcentaje de aciertos 80

ENITED 2017

237

Fig. 20 Gráfica del error

TABLA IV FUNCIONAMIENTO DE LA RED

Palabra Pronunciada Palabra Reconocida

Blanca Lada

Alba Danca

Escapa Escapo

Danca Blanca

Jirafa Jirafa

Gabán Gabán

ENITED 2017

238

Bueyes Pueyes

Lada Bala

Bonito Bonito

Bailar Bala

TABLA V RENDIMIENTO DE LA RED

Rendimiento de la Red Neuronal

Número total de palabras a reconocer 20

Número de aciertos 8

Porcentaje de aciertos 40

Conclusiones

Como lo muestran las Figs. 11 y 12 el desempeño del reconocedor de voz mejora si las palabras a

reconocer son distintas fonéticamente.

Por otra parte, la propuesta de trabajo a futuro se plantea crear diccionarios para las diversas

variantes lingüísticas del idioma español, y posteriormente de otros idiomas como el inglés. Al

igual que la implementación de otro clasificador para comparar los resultados de ambos.

Es importante mencionar que este sistema no pretende reemplazar al especialista en trastornos del

habla, sino apoyarlo en el proceso de la detección.

Agradecimientos

Este trabajo recibe apoyo del proyecto SIP 20170375 “Desarrollo de servicios de tecnología

educativa de última generación” que es parte del proyecto multidisciplinario 1899 “Servicios de

tecnología educativa de última generación, basados en buenas prácticas e ITIL para la RED

LATE MX”

ENITED 2017

239

Referencias

Crisostomo, O. N. (2006). Diseño de un reconocedor de comandos de voz para el DSP

TMS320C6711. Ciudad de México.

Ignacio Cobeta, F. N. (2013). Patología de la voz. Barcelona: Marge Médica Books.

Israel Linarez González, J. L. (2011). Sistema de reconocimiento de voz basado en el

funcionamiento del sistema auditivo humano. Ciudad de México.

Jiménez, J. E. (2012). Dislexia en español. Madrid: Pirámide.

Lawrence Rabiner, B. H. (1993). Fundamentals of Speech Recognition. Nueva Jersey: Prentice

Hall.

Lawrence Rabiner, M. R. (febrero de 1975). An algorithm for determining the endpoints of

isolated utterances. The Bell System Technical Journal, págs. 297-315.

Oxana, E. (2013). Sistema de seguridad por reconocimiento de voz. Ciudad de México.

Ramírez, G. V. (2008). Sistema de reconocimiento de voz en MATLAB. Guatemala.

Raúl Ibarra, M. S. (1999). Principios de teoría de las comunicaciones. Ciudad de México:

Limusa.

Saravia, J. A. (septiembre de 2011). Segmentación de audio y locutores para recuperación de

información multimedia y su apicación a videos de información turística. Recuperado el 9 de

abril de 2017, de

https://repositorio.uam.es/bitstream/handle/10486/12498/60600_20110926JoseAntonioMorejonS

aravia.pdf?sequence=1

DISEÑO DE AYUDAS TÉCNICAS PARA DISCAPACIDAD VISUAL Y

MOTORA: UNA CONTRIBUCIÓN A LA EDUCACIÓN INCLUSIVA Ovidio Linares Amador1 [email protected] Lizbeth de Jesús González López1,

[email protected], Araceli Linares Amador1, [email protected], David

Infante Sánchez2, [email protected] 1Secretaria de Educación en Michoacán

2Instituto Tecnológico de Morelia

Resumen. Se presenta la experiencia de diseño, pruebas y ajustes de asistencias técnicas

personalizadas para favorecer la inclusión de alumnos con discapacidad motora y discapacidad

visual en escuelas de educación básica del estado de Michoacán. La iniciativa surge ante la

necesidad de atender las condiciones específicas de los alumnos con discapacidad que ya asisten

al aula regular, partiendo de la iniciativa de profesores sensibilizados en temas de inclusión y

desarrollada por un equipo multidisciplinario mediante un proceso de investigación-acción. El

mailto:[email protected]

MEMORIA EN EXTENSO - Jesús Olivares

Documents

Transcript of MEMORIA EN EXTENSO - Jesús Olivares