MEMORIA EN EXTENSO - Jesús Olivares
Transcript of MEMORIA EN EXTENSO - Jesús Olivares
1er Encuentro Nacional de Innovación Tecnológica
para la Discapacidad
MEMORIA EN EXTENSO
Diciembre, 2017
Facultad de Ingeniería Eléctrica
ENITED 2017
PRESENTACIÓN
Las personas que padecen alguna discapacidad son un sector de la población muy valioso para la
sociedad. Sin embargo, por lo general conforman uno de los grupos más vulnerables, pues suelen
presentar índices de escolaridad más bajos, participar menos en la economía y tener mayores
gastos en comparación con las personas sin discapacidad. De acuerdo con informes de la
Organización Mundial de la Salud y a reportes de los últimos censos nacionales, el número de
personas con discapacidad (ya sea de nacimiento, por enfermedad, por accidente o por efectos de
la edad) va en aumento. Esto muestra lo necesario y urgente que es promover el desarrollo
científico y tecnológico que ellas requieren.
Las personas que sufren alguna discapacidad tienen problemas y necesidades específicas que
pueden ser atendidos por quienes se dedican a la investigación científica y al desarrollo
tecnológico en el país. Por un lado, se requiere investigación científica para prevenir, en lo
posible, la discapacidad. También se requiere investigación e innovación tecnológica para ayudar
a las personas con alguna discapacidad a superar los obstáculos a los que se enfrentan en su diario
vivir y, a la vez, ayudarlos a lograr su inclusión social, laboral y educativa.
Este Primer Encuentro Nacional de Innovación Tecnológica para Personas con Discapacidad
(ENITED 2017) es un foro donde se muestran los avances y resultados de la investigación
científica y tecnológica a favor de las personas con alguna discapacidad (física o intelectual) en
tres Ejes Temáticos:
1. Ingeniería
2. Ciencias de la Salud
3. Educación y Cultura.
ENITED 2017 ha reunido a investigadores, profesionales y estudiantes (de diferentes
instituciones y disciplinas) interesados en el desarrollo de tecnología que beneficie a las personas
con discapacidad. Esperamos que este encuentro promueva más proyectos de investigación y el
desarrollo de más tecnología para las personas con discapacidad, con el fin de favorecer su
autonomía física y económica y mejorar las condiciones de vida tanto de ellos como de sus
cuidadores, maestros y familias.
Los trabajos expuestos en este Encuentro forman parte de estas memorias y muestran el gran
interés que tienen los investigadores de las instituciones educativas en el desarrollo científico y
tecnológico a favor de las personas con discapacidad. Agradecemos a todos ellos su valiosa
participación.
El Comité Organizador de ENITED 2017
ENITED 2017
COMITÉ ORGANIZADOR
Coordinador General:
M.I. Miguel Ángel García Trillo
Trámites administrativos:
M.C. Diana Itzel Sepúlveda Jáuregui
Logística:
Ing. Wendolin Jacinto Díaz
Ing. Bertha Georgina Flores
Cursos y Talleres:
Enrique de Jesús Robledo Camacho
Alojamiento, turismo y eventos culturales:
M.C. Diana Itzel Sepúlveda Jáuregui
Web, apoyo técnico:
M.I. Salvador Daniel Pelayo Gómez
Enrique De Jesús Robledo Camacho
Registro y constancias:
M.C. Antonio Ulises Sáez Trujillo
Encuestas, Exposición Comercial y enlace con ONG’s:
C.P. Carolina Mateo Mejía
Personal de Staff y edecanes:
C.P. Carolina Mateo Mejia
Comité Científico:
Dra. Ma. Martha Marin Laredo
Dr. Francisco Loeza Becerra
Dra. Josefina Valenzuela Gandarilla
Mtra. Marisol Morales Rodriguez
M.T.I. José Juan Herrera García
Comité Científico de Prototipos Tecnológicos:
M.I. Rosalia Mora Juárez
M.C. Antonio Ulises Saez Trujillo
ENITED 2017
ÍNDICE
PONENCIAS
INGENIERÍA
SALUD
MULTIDISCIPLINARIA
CARTELES
RESUMENES
6
122
149
251
390
ENITED 2017
PONENCIAS
ÁREA DE INGENIERÍA .............................................................................................................. 6
DESARROLLO DE UNA MAQUINA CORTADORA LÁSER CON UNA PERSPECTIVA
INCLUYENTE ............................................................................................................................. 7
DISPOSITIVO DE RECONOCIMIENTO DE MOVIMIENTOS PARA PERSONAS CON
DISCAPACIDAD AUDITIVA Y DE LENGUAJE ................................................................... 13
DEFINICIÓN DE MODELO DE PRODUCCIÓN CON CALIDAD DE APLICACIONES
MÓVILES PARA DESARROLLO DE HABILIDADES PSICOMOTRICES ......................... 21
MANUFACTURA DE PRÓTESIS PERSONALIZADA CON IMPRESIÓN
TRIDIMENSIONAL .................................................................................................................. 41
DISEÑO MECANICO - ELECTROMAGNETICO Y CONTROL DE FASES DE
MOVILIDAD PARA PROTESIS DE EXTREMIDAD INFERIOR ......................................... 45
DESARROLLO DE EXOESQUELETO PARA REHABILITACIÓN ..................................... 58
SISTEMA DE INFORMACIÓN PARA LA DETECCIÓN OPORTUNA DE LA DISLEXIA76
SISTEMA DE APERTURA DE PUERTAS AUTOMÁTICO EDOS: GARANTIZANDO
ACCESIBILIDAD A PERSONAS EN SITUACIÓN DE DISCAPACIDAD ........................... 87
ACCESIBILIDAD WEB Y CONTENIDOS DIGITALES. EVALUACION DE
PRINCIPALES OPERADORES DE TELECOMUNICAICONES NACIONALES E
INTERNACIONALES ............................................................................................................... 93
DISLEXPACE” .......................................................................................................................... 97
VIDEOJUEGO SERIO PARA NIÑOS CON DISLEXIA ......................................................... 97
LAS TIFLOTECNOLOGÍAS COMO HERRAMIENTA PARA MEJORAR LA INCLUSIÓN
EDUCATIVA DE LOS ESTUDIANTES CON DISCAPACIDAD VISUAL......................... 104
APLICACIÓN MÓVIL DE TRADUCCIÓN DE IMÁGENES DE LA LENGUA DE SEÑAS
A SONIDOS ............................................................................................................................. 112
ÁREA DE SALUD ..................................................................................................................... 123
CALIDAD DE VIDA EN PACIENTES QUE RECIBEN FISIOTERAPIA Y
REHABILITACIÓN ................................................................................................................. 124
CONOCIMIENTO DE LOS ESTUDIANTES DE ENFERMERÍA SOBRE LA
CONTENCIÓN MECÁNICA .................................................................................................. 131
DISCAPACIDADES QUE LIMITAN LA INDEPENDENCIA DEL ADULTO MAYOR E
INTERVENCIÓN DE ENFERMERÍA EN LA REHABILITACIÓN .................................... 139
ÁREA MULTIDISCIPLINARIA ............................................................................................. 149
PERCEPCION DE APOYO EN PAREJAS CON UN HIJO CON SÍNDROME DE DOWN
150
ENITED 2017
EQUINOTERAPIA COMO ALTERNATIVA DE REHABILITACIÓN EN PERSONAS CON
DISCAPACIDAD ..................................................................................................................... 166
EVALUACIÓN DE LA INFRAESTRUCTURA INCLUYENTE Y PROBLEMÁTICA PARA
DISCAPACITADOS EN EL INSTITUTO TECNOLÓGICO DE JIQUILPAN ..................... 178
MÚSICA COMO ESTRATEGIA TECNOLÓGICA APLICADA AL DESARROLLO DE
HABILIDADES EN PERSONAS CON DISCAPACIDAD .................................................... 204
APRENDIZAJE SUPERVISADO PARA DETECTAR DISLEXIA EN LA VOZ ................ 222
DISEÑO DE AYUDAS TÉCNICAS PARA DISCAPACIDAD VISUAL Y MOTORA: UNA
CONTRIBUCIÓN A LA EDUCACIÓN INCLUSIVA ........................................................... 239
CARTELES ............................................................................................................................. 253
APLICACIÓN WEB PARA APOYAR EL APRENDIZAJE DE MANEJO DE DINERO EN
PERSONAS CON SÍNDROME DE DOWN ........................................................................... 254
APOYO INTELIGENTE PARA PERSONAS CON DISCAPACIDAD VISUAL ................. 268
BASTÓN ELECTRÓNICO PARA INVIDENTES ................................................................. 272
DISEÑO DE PROTOTIPO DE VEHÍCULO MÓVIL DE TRANSMISIÓN MANUAL PARA
PERSONAS CON CAPACIDADES DIFERENTES ............................................................... 288
DISEÑO DE UN DISPOSITIVO PORTÁTIL PARA LA PRUEBA DE POTENCIALES
EVOCADOS AUDITIVOS ...................................................................................................... 298
SILLA DE RUEDAS CONTROLADA POR COMANDOS DE VOZ E INTERFACE
GRAFICA (EASY CHAIR VOICE)………………………………………………………….305
ENSEÑANZA DE LA ESCRITURA PARA NIÑOS CON ESPECTRO AUTISTA,
ESCRIBIENDO SIN
LAGRIMAS……………………………………………………………318
IDENTIFICACION Y EVALUACIÓN DE RIESGOS PSICOSOCIALES LABORALES EN
TRABAJADORES EN UNA TIENDA DE AUTOSERVICIO, 2017……………………….323
PREVALENCIA DE LESIONES MUSCULO ESQUELETICOS EN UNA EMPRESA DE
ALIMENTOS DE AGUASCALIENTES, ENERO A DICIEMBRE DE
2016………………344
DESARROLLO DE PROTOTIPO DE SOFTWARE PARA HABILITAR LA
COMUNICACIÓN EN PERSONAS CON PARALISIS CEREBRAL
SEVERA……….......361
TOXOPLASMOSIS OCULAR BILATERAL. REPORTE DE UN CASO DE ENFERMEDAD
DE TRABAJO ………………………………………………………………………………..369
RIESGOS DE DISCAPACIDAD EN EL PERSONAL DE ENFERMERIA DE UN
HOSPITAL
PÚBLICO……………………………………………………………………………………..378
ENITED 2017
RESUMENES ........................................................................................................................ 390
MEJORANDO LA DISFEMINA MEDIANTE EL RECONOCIMIENTO
COMPUTARIZADO DE SILABAS DEL HABLA ................................................................. 391
ESPACIOS EDUCATIVOS ACCESIBLES PARA PERSONAS CON DISCAPACIDAD .... 392
PROFESIONALIZACIÓN DE LOS ACTORES DE LA EDUCACIÓN INICIAL PARA UNA
INCLUSIÓN EDUCATIVA ..................................................................................................... 393
LA DISCAPACIDAD EN LOS CENSOS MEXICANOS DE POBLACION ......................... 395
DISPOSITIVO DE MARCHA SOLAR CON ELECTROESTIMULACIÓN ........................ 396
ENITED 2017
222
Con el fin de proteger la privacidad de cada participante, se omiten, como en el texto, los
nombres reales y sólo se hace referencia a quien hizo la recolección de datos:
(2017. Entrevistadora: Rigel Miravete. Conservatorio de las Rosas, A.C., Morelia, Michoacán.
[Grabaciones de audio].
APRENDIZAJE SUPERVISADO PARA DETECTAR DISLEXIA EN LA
VOZ Itzel Moreno Martínez1 [email protected], Karla Ivette Naranjo Juárez1
[email protected], Jesús Manuel Olivares Ceja2 [email protected], Andrés Lucas
Bravo1 [email protected], Benina Velázquez Ordoñez3
1Unidad Profesional Interdisciplinaria en Ingeniería y Tecnologías Avanzadas 2Centro de Investigación en Computación
3Dirección de Cómputo y Comunicaciones
Resumen. La dislexia es un trastorno del habla que afecta a miles de personas, entre ellas, al
menos a 8% de estudiantes de nivel primaria. Este padecimiento causa dificultades en el
aprendizaje y como consecuencia muchos estudiantes abandonan la escuela repercutiendo en el
tipo de empleos que pueden obtener siendo poco remunerados. Una oportunidad para quien
padece este tipo de trastorno es la detección oportuna desde la infancia. Este trabajo forma parte
de un sistema telemático para la detección oportuna de la dislexia mediante el reconocimiento de
palabras que se conoce su utilidad para realizar un diagnóstico adecuado. Los resultados que se
obtienen a distancia, están sujetos a la valoración de un grupo de especialistas en el área de
trastornos del lenguaje. A diferencia de los sistemas de reconocimiento de voz que en ocasiones
confunden palabras similares, en este trabajo, se debe tener mayor precisión para detectar
variaciones en la pronunciación de ciertas sílabas que caracterizan este padecimiento. Es por esto
que se trata en este documento el aprendizaje de los patrones no supervisado que caracterizan a
las palabras de interés. Se utilizaron muestras etiquetadas de infantes voluntarios con autorización
de sus padres. Las pruebas realizadas permiten considerar como una alternativa no invasiva
factible de aplicarse en sitios donde se carece de especialistas de la voz pero hay acceso a Internet
y personal que puede lograr grabaciones con equipos a precios accesibles y condiciones de
mínimo ruido.
Palabras clave: Dislexia, procesamiento de voz, aprendizaje supervisado, identificación de
patrones.
1. Introducción
La dislexia (Jiménez, 2012), es un trastorno del habla que se presenta en las personas desde la
infancia y persiste en el tiempo afectando habilidades básicas como la lectura y la escritura,
repercutiendo en el aprendizaje. Afecta también a quienes tienen capacidades intelectuales
normales o incluso superiores. La revista “México Sano” de la Secretaría de Salud publicó que
aproximadamente el 8% de los niños cursando primaria presentan dislexia, con consecuencias
ENITED 2017
223
académicas que llegan al abandono de los estudios por haber reprobado. Estas personas con
pocos estudios difícilmente pueden acceder a un empleo bien remunerado.
Los síntomas de la dislexia se pueden notar desde que los infantes comienzan a decir sus
primeras palabras, pero usualmente el diagnóstico se realiza hasta que empiezan a leer y escribir
con dibujos y pruebas escritas. La detección oportuna de la dislexia permite a los afectados
mejorar su calidad de vida y darles mejores oportunidades para estudiar y completar una carrera,
otorgándoles al mismo tiempo la oportunidad de mejorar la interacción con su entorno y así
evitarles la marginación social a que se encuentran expuestos.
La dislexia se presenta en diferentes tipos:
Profunda o fonética, presentan errores semánticos y dificultades para comprender el significado
de algunas palabras; añaden prefijos y sufijos al pronunciar palabras.
Fonológica, se conocen pocos trabajos.
Superficial, presentan problemas principalmente en palabras de longitud grande.
Las personas que presentan el trastorno de la dislexia presentan síntomas como:
Invertir letras de palabras completas o en partes, por ejemplo: en casa, dicen saca.
Cambian letras, por ejemplo, usan b en vez de p, o b en vez de d.
Copian palabras erróneamente aunque estén copiando.
Escriben una palabra con diferentes letras, por ejemplo: danca en vez de blanca.
Algunas palabras utilizadas para detectar personas con dislexia son: blanca, colombianos, fusil,
jirafa, gemelo, entre otras.
El propósito de este trabajo es generar un diccionario fonético con patrones de palabras que
puedan caracterizar los diferentes estilos fonéticos que se encuentran en el habla castellana. El
diccionario se utiliza en la detección de la dislexia mediante la comparación de los patrones de
palabras con la voz de los pacientes pronunciando palabras que se conocen como típicas para la
detección oportuna de dislexia. El resultado del procesamiento automatizado se valida por un
grupo de especialistas ubicados en un hospital del habla donde se ubica el servidor que efectúa el
proceso de reconocimiento de patrones. El servidor permite mediante Internet que personas
ubicadas en lugares remotos pueden enviar sus archivos de voz para analizarlos y que los
especialistas los valoren. En caso que alguna persona presente síntomas del trastorno de dislexia,
dependiendo del grado de severidad, los médicos le indicarán ejercicios o lo canalizarán a la
ciudad más cercana para su seguimiento.
El resto del trabajo presenta el estado del arte relacionado con el procesamiento de voz. En la
sección 3 se presenta la arquitectura del sistema telemático de reconocimiento de voz del cual
este trabajo se encarga de la obtención del diccionario fonético. La sección 4 explica el proceso
ENITED 2017
224
de aprendizaje no supervisado con archivos de voz etiquetados y presenta los resultados
obtenidos. Al final se indican las conclusiones y las referencias.
2. Estado del arte
En la literatura se reconoce a (Rabiner, 1993) como uno de los teóricos que han hecho
importantes aportaciones en el área de reconocimiento de voz, tanto para la extracción de
características como métodos para comparación de patrones o reconocimiento de la voz.
En la literatura es posible encontrar trabajos en que el procesamiento de la voz se aplica en:
Reconocimiento del hablante, una variante de este enfoque se emplea para el acceso seguro.
Reconocimiento de palabras independientemente del hablante, se utiliza principalmente en los
sistemas que transforman la voz en texto; estos sistemas existen en versiones para dispositivos
móviles.
Traducción de idiomas en tiempo real, algunos de estos desarrollos consisten en aplicaciones
móviles que reconocen la voz en un idioma y le envían a los audífonos la voz con la traducción
simultánea.
Análisis de la voz para detectar o ayudar a personas con algún trastorno.
En (Pérez, 2013) se utiliza el reconocimiento de la voz en un sistema de seguridad para el hogar.
El sistema almacena las voces de los dueños de la casa para permitirles el acceso. El sistema se
prueba con diferentes usuario y se valida que los usuarios no reconocidos no los deja ingresar, sin
embargo, cuando el usuario cambia su tono de voz, el sistema tampoco puede reconocerlo y no le
permite el acceso. Esta propuesta hace uso de una técnica conocida como «Linear Predictor
Coefficients, LPC» Coeficientes de Predicción Lineal (CPL).
En (Linarez, 2011) se describe un sistema de reconocimiento de voz para reconocer las vocales
del alfabeto en español de forma aislada para 3 hombres y 3 mujeres. Además, tiene la capacidad
de mostrar algunas características cualitativas del sistema auditivo humano, como la
identificación del locutor y la localización de la fuente sonora. En este sistema también se hace
uso de los Coeficientes de Predicción Lineal (CPL) para caracterizar las palabras.
3. Arquitectura del reconocedor de voz
El reconocimiento de la voz en el sistema propuesto se realiza mediante los módulos de la Figura
1. La captura de la voz, preprocesamiento, procesamiento son comunes a la obtención del
diccionario fonético y a la fase de reconocimiento. En la fase de reconocimiento se tiene la
opción de aprendizaje en donde se obtiene uno o varios patrones que mejor caracterizan a una
palabra. Los patrones múltiples se producen porque entre las personas algunas tienen un acento
diferente; estos patrones se almacenan en el diccionario fonético. Las palabras que se
proporcionan de los pacientes para el diagnóstico se clasifican con alguno de los patrones del
diccionario fonético.
ENITED 2017
225
Fig. 9 Arquitectura del reconocedor de voz
Captura de la señal de voz
La señal de voz se compone por ondas de presión producidas por el aparato fonador. Para realizar
una adquisición adecuada de este tipo de ondas se utiliza un micrófono, considerando que la
función principal de este dispositivo de medición es transformar las fluctuaciones de presión en
fluctuaciones de voltaje eléctrico.
Una vez captada la señal analógica, es necesario convertirla a un formato que permita su
procesamiento en la computadora, este cambio se realiza a través de un convertidor analógico
digital (ADC) en la tarjeta de sonido, el cual entrega la señal digitalizada y codificada.
Fig. 10 Convertidor Analógico Digital
ENITED 2017
226
Preprocesamiento
El preprocesamiento estriba en la manipulación de la señal mostrada en la Fig. 1 para que ésta sea
más fácil de analizar. Consta de tres etapas, eliminación del ruido, preénfasis y segmentación.
En la primera, se debe aplicar cualquier técnica para la eliminación de señales indeseables, como
ruido de fondo.
La segunda etapa radica en suavizar el espectro y dar acentuación a las frecuencias altas mediante
un filtro.
Finalmente, en la tercera etapa los segmentos generados son guardados en formato de columna de
matriz y son agrupados en varias tramas para el posterior procesamiento de la señal.
Fig. 11 Señal de voz de entrada
Atenuación de Ruido
En una señal de voz capturada por un micrófono, generalmente se adhiere ruido originado de
diversas fuentes, esta afectación puede modificar las características de las señales de voz y
deteriorar su calidad provocando la inteligibilidad del habla.
ENITED 2017
227
Para aplicaciones de voz, la estimación de habla limpia se consigue a través de la aplicación de
filtros lineales que reducen significativamente los efectos del ruido sin distorsionar la voz del
hablante. Sin ello se tendrían datos perjudiciales. Es por ello que a la señal de entrada se le aplica
un filtro de promedio móvil, se emplea para promediar los valores de forma local (Raúl Ibarra,
1999), esto significa que las componentes de entrada de mayor frecuencia son promediadas
mientras que las componentes de menor frecuencia son mantenidas. En seguida se define en la
ecuación 1 el filtro de promedio móvil, y en la Fig. 4 se puede observar su aplicación.
𝒚(𝒏) =𝟏
𝑴∑ 𝒙[𝒏 − 𝒌]
𝑴−𝟏
𝒌=𝟎
(𝟏)
Fig. 12 Señal de voz filtrada por promedio movil
Y un filtro pasa banda el cual es delimitado por un rango de frecuencias de corte, una inferior y
otra superior, por consiguiente, atenúa los componentes de frecuencia que sobrepasen el mismo y
las que permanecen pasan sin distorsión. La aplicación de estos filtros a la señal de voz se
muestra en la Fig. 5
ENITED 2017
228
Fig. 13 Señal de voz aplicando los filtros de promedio movil y pasabanda
Preénfasis
El objetivo de este filtro, que se define en el domino del tiempo por la ecuación 5, es suavizar el
espectro de la señal compensando los valores de altas y bajas frecuencias,
𝒚(𝒏) = 𝒙(𝒏) − 𝒂𝒙(𝒏 − 𝟏) (𝟐)
De esta forma, el valor de la señal 𝑦(𝑛), se calcula restando a la muestra en el instante 𝑛 actual, el
resultado de la multiplicación entre una constante 𝑎 (cuyo valor se encuentra en el rango de 0.9 a
1) y el valor de la muestra en el instante anterior 𝑛 − 1.
Finalmente, este filtro, logra que el espectro de la señal tenga un rango dinámico similar en toda
la banda de frecuencias. La aplicación de este filtro se observa en la Fig. 6
ENITED 2017
229
Fig. 14 Señal de voz aplicando los filtros de promedio movil, pasabanda y preenfasis
Segmentación
Este proceso es de suma importancia debido a que la señal de voz no es estacionaria, a causa de
que sus características cambian para reflejar los diferentes sonidos que se producen al hablar. Por
este motivo es necesario un método que permita obtener segmentos cortos cuasi estacionarios,
por consiguiente se divide la secuencia larga de voz que se tiene en segmentos de 5 a 100 ms [6],
ya que en este lapso de tiempo sus características son suficientemente estacionarias.
Dentro de la segmentación se aplican algoritmos para el ventaneo de la señal y la detección de
inicio y fin, como se explica a continuación.
Detección de inicio y fin de palabra
Es de particular importancia localizar la región del habla a reconocer, esto es, detectar el inicio y
fin de una palabra [6]. Para ello se utiliza el algoritmo Rabiner-Sambur [8], el cual detecta el
inicio y fin de una palabra adaptándose al entorno acústico de fondo, de donde obtiene los
umbrales relevantes para sus criterios de decisión de acuerdo a un intervalo registrado.
La Fig. 7 muestra el resultado de la aplicación de este algoritmo, que como se observa, elimina la
parte grabada que es innecesaria para el reconocimiento.
ENITED 2017
230
Fig. 15 Detección de inicio y fin de la señal de voz
Procesamiento
El objetivo principal de esta etapa es seleccionar las características más representativas de la
señal y es de suma importancia dentro del reconocimiento de voz porque es donde se obtiene el
conjunto de elementos que describen el patrón de la palabra a reconocer.
Considerando la variabilidad de la voz, es necesario extraer sus características más
representativas, es decir, llevar a cabo la eliminación de señales que no son elementales puesto
que los coeficientes extraídos que la caracterizan sólo deben preservar la información necesaria y
desechar la producida por fluctuaciones ajenas a ésta.
Al representar la señal de voz en intervalos cortos, los parámetros pueden extraerse mediante
técnicas de tratamiento de la señal, en el dominio del tiempo, o bien en un dominio transformado.
Existe una gran variedad de algoritmos que proporcionan rasgos extraídos de la señal de voz, que
representan sus características no estacionarias y en conjunto describen las propiedades acústicas
que conforman las unidades del habla.
En relación con las técnicas de extracción que se encuentran en la literatura, este trabajo se centra
exclusivamente en la Codificación de Predicción Lineal (LPC) y cuyos resultados obtenidos se
presentan en la Fig. 8.
ENITED 2017
231
Fig. 16 Coeficientes LPC
Reconocimiento de patrones
El método de reconocimiento basado en comparación de patrones [6], es un procedimiento en el
que algoritmos de entrenamiento establecen representaciones consistentes de los patrones a partir
de un conjunto de características cuantitativas que describen a un objeto o entidad. Su finalidad
es encontrar una regla de decisión automática que asigne al objeto a una categoría específica.
En relación con los patrones propios del habla, éstos se representan directamente por una
secuencia temporal de vectores con atributos obtenidos de un análisis espectral, estos atributos
son usados para clasificar los sonidos por palabras o subunidades de palabras específicas. En esta
investigación son clasificados por palabras.
Las fases esenciales que describen este enfoque son entrenamiento, aprendizaje y clasificación,
las cuales se muestran en el diagrama a bloques de la Fig. 9.
ENITED 2017
232
Para realizar esta etapa se emplea una Red Neuronal Artificial que como su nombre lo indica, es
un conjunto de neuronas o nodos interconectados entre sí por ligaduras que crean conexiones
permitiendo la comunicación directa entre ellas para poder recibir señales, procesarlas y
transmitirlas.
Aprendizaje de la RNA
Para escoger los pesos adecuados en las conexiones para que la red desempeñe una tarea en
particular, se le debe enseñar a hacer los cálculos realizando ajustes iterativos en los pesos, lo que
lleva a dos caminos, el aprendizaje supervisado y el no supervisado.
Aprendizaje Supervisado
Este tipo de aprendizaje se basa en la comparación directa de la salida de la red con la respuesta
correcta, la cual, ya es conocida. Se fundamenta en el reforzamiento del aprendizaje, en donde la
retroalimentación se lleva a cabo con base a la diferencia entre la salida real y la salida esperada.
Aprendizaje No supervisado
Este tipo de aprendizaje funciona cuando el fin no es definir en términos específicos de ejemplos
correctos, puesto que solo se requiere que con base a la entrada la red forme categorías de
acuerdo a las correlaciones realizadas y produzca una señal de salida que corresponda a cada
categoría de entrada.
Funcionamiento de la Red Neuronal Artificial
Clasificación Conjunto de
entrenamiento
∙ Adquisición ∙ Preprocesamiento ∙ Procesamiento
∙ Medidas de similitud o distancia
Predicción
Aprendizaje del
modelo
Construcción del
modelo
∙ Aprendizaje supervisado
Fig. 17 Diagrama a bloques de las etapas del mudulo de reconocimiento de patrones
ENITED 2017
233
El modelo de red neuronal empleado para el presente trabajo es el de retropropagación
«backpropagation», el cual está basado en la regla de aprendizaje que solo se aplica a modelos de
redes multicapa. Esta red tiene la capacidad de auto adaptar los pesos de las neuronas de las capas
intermedias con la finalidad de aprender la relación entre el conjunto de patrones de entrada y sus
salidas correspondientes para que posteriormente utilice esa misma relación con nuevos vectores
de entrada para dar una salida activa en caso que la nueva entrada sea parecida a las presentadas
durante el aprendizaje. En la Fig. 10 se aprecia el modelo de la red neuronal de retropropagación
empleado.
Fig. 18 Modelo de la red neuronal de retropropagación
Reconocimiento de patrones
Como se observa en la Fig. 10, es primordial establecer el número de neuronas en la capa de
entrada 𝑛 y el número de neuronas en la capa de salida 𝑚 a las cuales les corresponden como
datos de entrada un vector 𝑋 de tamaño 𝑛[𝑋1, 𝑋2, … 𝑋𝑛] y como datos de salida un vector 𝑌 de
tamaño 𝑚[𝑌1, 𝑌2, … 𝑌𝑚], estableciendo entre ellos una dependencia funcional que se puede
expresar de la siguiente manera:
[𝑿𝟏, 𝑿𝟐, …𝑿𝒏]𝑹𝑵 = [𝒀𝟏, 𝒀𝟐, … 𝒀𝒎] (𝟑)
𝐷𝑜𝑛𝑑𝑒:
𝑛 = 20
𝑚 = 5
ENITED 2017
234
Diseño de la Red Neuronal Artificial
El diseño de la red se divide en dos partes, la primera es el entrenamiento, que tiene como
objetivo modificar los pesos de la red en cada una de las capas, de modo que la salida deseada
coincida con la salida obtenida por la red ante un determinado patrón de entrada.
La segunda es la fase de validación de la red ante cualquier patrón de entrada que se le presente.
Como se muestra en la Fig. 10 se utiliza una arquitectura de retropropagación con tres capas: la
de entrada, la oculta y la de salida.
Fase de entrenamiento
Como se menciona anteriormente, los valores empleados para el correcto desempeño de esta fase
se presentan en la Tabla II.
TABLA II
VALORES PARA LA FASE DE ENTRENAMIENTO
Dato Valor
Neuronas en la capa de entrada 20
Neuronas en la capa oculta 10
Neuronas en la capa de salida 5
Fase de evaluación
Se abren los pesos obtenidos para la salida del proceso de entrenamiento y para la capa oculta, se
definen los mismos valores utilizados en el entrenamiento para la capa de entrada, la oculta, y la
de salida, así como el número de entrenamientos, los pesos de la capa de entrada y de la capa
oculta, y el patrón de entrenamiento.
Posteriormente, se procede a evaluar la red con un solo patrón de entrenamiento, que es el
objetivo a identificar; Si el patrón de entrenamiento se encuentra en la red, esta lo identifica de
acuerdo a las características de los valores de sus pesos, en caso contrario, la red emite un
mensaje indicando que no se identifica lo que ha dicho el hablante.
ENITED 2017
235
TABLA III FUNCIONAMIENTO DE LA RED
Palabra Pronunciada Palabra Reconocida
Blanca Blanca
Colombianos Colombianos
Fusil Fusil
Colombianos Gemelo
Jirafa Jirafa
Gemelo Gemelo
Blanca Blanca
Jirafa Gemelo
Gemelo Gemelo
Fusil Fusil
ENITED 2017
236
Fig. 19 Gráfica del error
TABLA III RENDIMIENTO DE LA RED
Rendimiento de la Red Neuronal
Número total de palabras a reconocer 20
Número de aciertos 16
Porcentaje de aciertos 80
ENITED 2017
237
Fig. 20 Gráfica del error
TABLA IV FUNCIONAMIENTO DE LA RED
Palabra Pronunciada Palabra Reconocida
Blanca Lada
Alba Danca
Escapa Escapo
Danca Blanca
Jirafa Jirafa
Gabán Gabán
ENITED 2017
238
Bueyes Pueyes
Lada Bala
Bonito Bonito
Bailar Bala
TABLA V RENDIMIENTO DE LA RED
Rendimiento de la Red Neuronal
Número total de palabras a reconocer 20
Número de aciertos 8
Porcentaje de aciertos 40
Conclusiones
Como lo muestran las Figs. 11 y 12 el desempeño del reconocedor de voz mejora si las palabras a
reconocer son distintas fonéticamente.
Por otra parte, la propuesta de trabajo a futuro se plantea crear diccionarios para las diversas
variantes lingüísticas del idioma español, y posteriormente de otros idiomas como el inglés. Al
igual que la implementación de otro clasificador para comparar los resultados de ambos.
Es importante mencionar que este sistema no pretende reemplazar al especialista en trastornos del
habla, sino apoyarlo en el proceso de la detección.
Agradecimientos
Este trabajo recibe apoyo del proyecto SIP 20170375 “Desarrollo de servicios de tecnología
educativa de última generación” que es parte del proyecto multidisciplinario 1899 “Servicios de
tecnología educativa de última generación, basados en buenas prácticas e ITIL para la RED
LATE MX”
ENITED 2017
239
Referencias
Crisostomo, O. N. (2006). Diseño de un reconocedor de comandos de voz para el DSP
TMS320C6711. Ciudad de México.
Ignacio Cobeta, F. N. (2013). Patología de la voz. Barcelona: Marge Médica Books.
Israel Linarez González, J. L. (2011). Sistema de reconocimiento de voz basado en el
funcionamiento del sistema auditivo humano. Ciudad de México.
Jiménez, J. E. (2012). Dislexia en español. Madrid: Pirámide.
Lawrence Rabiner, B. H. (1993). Fundamentals of Speech Recognition. Nueva Jersey: Prentice
Hall.
Lawrence Rabiner, M. R. (febrero de 1975). An algorithm for determining the endpoints of
isolated utterances. The Bell System Technical Journal, págs. 297-315.
Oxana, E. (2013). Sistema de seguridad por reconocimiento de voz. Ciudad de México.
Ramírez, G. V. (2008). Sistema de reconocimiento de voz en MATLAB. Guatemala.
Raúl Ibarra, M. S. (1999). Principios de teoría de las comunicaciones. Ciudad de México:
Limusa.
Saravia, J. A. (septiembre de 2011). Segmentación de audio y locutores para recuperación de
información multimedia y su apicación a videos de información turística. Recuperado el 9 de
abril de 2017, de
https://repositorio.uam.es/bitstream/handle/10486/12498/60600_20110926JoseAntonioMorejonS
aravia.pdf?sequence=1
DISEÑO DE AYUDAS TÉCNICAS PARA DISCAPACIDAD VISUAL Y
MOTORA: UNA CONTRIBUCIÓN A LA EDUCACIÓN INCLUSIVA Ovidio Linares Amador1 [email protected] Lizbeth de Jesús González López1,
[email protected], Araceli Linares Amador1, [email protected], David
Infante Sánchez2, [email protected] 1Secretaria de Educación en Michoacán
2Instituto Tecnológico de Morelia
Resumen. Se presenta la experiencia de diseño, pruebas y ajustes de asistencias técnicas
personalizadas para favorecer la inclusión de alumnos con discapacidad motora y discapacidad
visual en escuelas de educación básica del estado de Michoacán. La iniciativa surge ante la
necesidad de atender las condiciones específicas de los alumnos con discapacidad que ya asisten
al aula regular, partiendo de la iniciativa de profesores sensibilizados en temas de inclusión y
desarrollada por un equipo multidisciplinario mediante un proceso de investigación-acción. El