Educación y Evaluación de la Voz Infantil Alterada con ... CIIEE9/Educacion_y... · modulación...

7
Educación y Evaluación de la Voz Infantil Alterada con Software Libre William R. Rodríguez¹-², Oscar Saz¹, y Eduardo Lleida¹ ¹Grupo de Tecnologías de las Comunicaciones (GTC) Instituto de Investigación en Ingeniería de Aragón (I3A) Universidad de Zaragoza, España ² Universidad Antonio Nariño, Colombia {wricardo,oskarsaz,lleida}@unizar.es 1. RESUMEN Éste trabajo presenta una herramienta libre para terapia de voz desarrollada por el Instituto de Investigación en Ingeniería de Aragón (I3A), y probada en entidades de educación especial en España, y países latinoamericanos. La herramienta permite evaluar y hacer terapia en aspectos relacionados con la voz como la intensidad, el soplo, el tono y la articulación vocálica en español. La herramienta en mención llamada PreLingua, se utilizó en un estudio en donde se aplicó dicha tecnología en niños con discapacidad en España y Latinoamérica, los resultados cuantitativos y cualitativos muestran, mejoras en las competencias vocales de varios usuarios con diferentes niveles de significancia y de acuerdo a su grado de discapacidad. Adicionalmente, se obtuvieron resultados positivos no esperados relativos a competencias de socialización y trabajo en grupo, lo que muestra un gran potencial de la tecnología propuesta. 2. INTRODUCCIÓN Los profesionales de fonoaudiología y educación especial conscientes de la ventaja de trabajar de la mano con la tecnología, experimentan grandes necesidades y limitaciones a la hora de trabajar con población infantil con discapacidad y voz alterada, no solo por las pocas herramientas disponibles y por su alto costo de adquisición, sino porque la mayoría vienen en idiomas diferentes al español y por las limitadas prestaciones de éstas para trabajar con sonidos vocálicos entre otras necesidades. Es ésta línea encontramos herramientas como SpeechViewer[1], CLS Games Program [2] o Speech Therapy Dr. Speech [3]. Considerando la terapia de habla, los proyectos realizados han sido variados y se han orientado a mejorar la capacidad articulatoria de los alumnos [4], su capacidad de lectura oral y comprensión [5], o el aprendizaje de idiomas extranjeros [6] entre otros. Es así como los terapeutas se ven obligados en la mayoría de los casos a trabajar la voz con herramientas manuales fruto de su iniciativa, herramientas como laminas, fotos, o actividades como inflar globos, trabajar frente a espejos con los niños, imitar los sonidos de instrumentos musicales, y un sin numero de otros imaginativos recursos para poder trabajar con los niños sus problemas de voz. De manera que con apoyo de las Tecnologías del Habla, en el Instituto de Investigación en Ingeniería de Aragón se desarrolló la herramientas llamada PreLingua, la cual permite apoyar la labor del terapeuta tanto en la terapia misma como en la evaluación de los avances de sus alumnos, en lo referente a aspectos de la comunicación pre-lingüística y aspectos acústicos de la voz como la intensidad, el tono, y la articulación vocálica en español entre otros. En éste trabajo se muestran los resultados de aplicación de dicha herramienta en casos reales de niños con discapacidad y voz alterada en instituciones de educación especial. En la Sección 3, se describen los objetivos de desarrollo de la herramienta y del estudio realizado, la Sección 4 describe la herramienta desarrollada y la metodología del estudio realizado, y finalmente, la sección 5 muestra los resultados obtenidos y la discusión sobre los mismos.

Transcript of Educación y Evaluación de la Voz Infantil Alterada con ... CIIEE9/Educacion_y... · modulación...

Educación y Evaluación de la Voz Infantil Alterada con Software LibreWilliam R. Rodríguez¹-², Oscar Saz¹, y Eduardo Lleida¹

¹Grupo de Tecnologías de las Comunicaciones (GTC)Instituto de Investigación en Ingeniería de Aragón (I3A)

Universidad de Zaragoza, España² Universidad Antonio Nariño, Colombia

{wricardo,oskarsaz,lleida}@unizar.es

1. RESUMENÉste trabajo presenta una herramienta libre para terapia de voz desarrollada por el Instituto de Investigación en Ingeniería de Aragón (I3A), y probada en entidades de educación especial en España, y países latinoamericanos. La herramienta permite evaluar y hacer terapia en aspectos relacionados con la voz como la intensidad, el soplo, el tono y la articulación vocálica en español. La herramienta en mención llamada PreLingua, se utilizó en un estudio en donde se aplicó dicha tecnología en niños con discapacidad en España y Latinoamérica, los resultados cuantitativos y cualitativos muestran, mejoras en las competencias vocales de varios usuarios con diferentes niveles de significancia y de acuerdo a su grado de discapacidad. Adicionalmente, se obtuvieron resultados positivos no esperados relativos a competencias de socialización y trabajo en grupo, lo que muestra un gran potencial de la tecnología propuesta.

2. INTRODUCCIÓNLos profesionales de fonoaudiología y educación especial conscientes de la ventaja de trabajar de la mano con la tecnología, experimentan grandes necesidades y limitaciones a la hora de trabajar con población infantil con discapacidad y voz alterada, no solo por las pocas herramientas disponibles y por su alto costo de adquisición, sino porque la mayoría vienen en idiomas diferentes al español y por las limitadas prestaciones de éstas para trabajar con sonidos vocálicos entre otras necesidades. Es ésta línea encontramos herramientas como SpeechViewer[1], CLS Games Program [2] o Speech Therapy Dr. Speech [3]. Considerando la terapia de habla, los proyectos realizados han sido variados y se han orientado a mejorar la capacidad articulatoria de los alumnos [4], su capacidad de lectura oral y comprensión [5], o el aprendizaje de idiomas extranjeros [6] entre otros. Es así como los terapeutas se ven obligados en la mayoría de los casos a trabajar la voz con herramientas manuales fruto de su iniciativa, herramientas como laminas, fotos, o actividades como inflar globos, trabajar frente a espejos con los niños, imitar los sonidos de instrumentos musicales, y un sin numero de otros imaginativos recursos para poder trabajar con los niños sus problemas de voz. De manera que con apoyo de las Tecnologías del Habla, en el Instituto de Investigación en Ingeniería de Aragón se desarrolló la herramientas llamada PreLingua, la cual permite apoyar la labor del terapeuta tanto en la terapia misma como en la evaluación de los avances de sus alumnos, en lo referente a aspectos de la comunicación pre-lingüística y aspectos acústicos de la voz como la intensidad, el tono, y la articulación vocálica en español entre otros. En éste trabajo se muestran los resultados de aplicación de dicha herramienta en casos reales de niños con discapacidad y voz alterada en instituciones de educación especial. En la Sección 3, se describen los objetivos de desarrollo de la herramienta y del estudio realizado, la Sección 4 describe la herramienta desarrollada y la metodología del estudio realizado, y finalmente, la sección 5 muestra los resultados obtenidos y la discusión sobre los mismos.

3. OBJETIVOSEn la etapa de desarrollo de la herramienta, el objetivo principal fue lograr un acercamiento a instituciones especializadas en logopedia y educación especial, e investigar sobre técnicas de procesado de voz que permitieran la estimación robusta de parámetros acústicos en la voz infantil. También se tenia como meta, que la herramienta a desarrollar representara para el terapeuta una ayuda real en su trabajo, y que su diseño de cara al usuario final sea el más adecuado posible. Una vez desarrollada la primera versión estable de la herramienta, se diseñó un estudio para poder aplicar y probar la tecnología propuesta en casos reales. Dicho estudio tuvo como objetivos, trabajar con población con discapacidad y voz alterada para probar la tecnología en casos reales, también que los usuarios participantes comprendieran las actividades a realizar, y que siempre se contara con el apoyo de profesionales en fonoaudiología y educación especial durante el estudio.

4. DESARROLLO Y METODOLOGÍAÉsta sección describe la herramienta desarrollada y la metodología del estudio realizado en población con discapacidad.

PreLingua1 es una herramienta integrada por un conjunto de juegos organizados en cinco categorías a manera de pirámide como puede apreciarse en la Figura 1. La base de la pirámide consta de actividades para trabajar en la distinción entre voz y no voz, el segundo nivel consta de actividades para trabajar en el control de la intensidad de la voz, el tercer nivel ayuda a la modulación de la respiración controlando el soplo, el ataque vocal, y la duración de sonidos. El cuarto nivel trabaja el control de la tonalidad, y la cima posee una actividad de vocalización que concatena las habilidades adquiridas en los niveles inferiores de la pirámide. La herramienta busca trabajar entonces aquellos aspectos del pre-lenguaje y acústicos de la voz mostrando siempre una realimentación visual en tiempo real, y buscando hacer consciente al alumno de las características básicas de la producción oral.

Figura 1 PreLingua

Por ejemplo, la Figura 2 muestra en su parte izquierda una actividad donde la modulación de la intensidad de voz permite a un dragón volar a través de un laberinto. La parte central

1 Hace parte del proyecto COMUNICA, se puede descargar de www.vocaliza.es

muestra una actividad donde el control de la tonalidad hace que una mariposa (elipse) se acerque a los demás animales (rectángulos) del bosque para que tengan movimiento. En la parte derecha, el control de la respiración permite simular la actividad de soplar una pipa para elevar una esfera. La tecnología debajo de las aplicaciones se basa en procesado de la señal de voz como detectores de voz-silencio, estimadores de pitch basados en error de predicción de los Coeficientes de Predicción Lineal (LPC) y detección y análisis de formantes [7].

Figura 2 Juego de Intensidad de la voz (izq.), Tonalidad (centro) y Soplo (der.)

Articulación Vocálica. Ésta versión de PreLingua posee una novedosa aplicación llamada ARTICULA [8] para trabajar articulación vocálica en tiempo real, partiendo de la información acústica del usuario. La figura 3 muestra en su parte izquierda, el diseño interno de ARTICULA en donde un avatar mueve su lengua, labios y mandíbula inferior, según la información acústica detectada por el sistema. La parte derecha de la misma figura muestra, la interface final de usuario en donde el niño debe intentar imitar el patrón vocálico mostrado por el sistema según la vocal seleccionada.

Figura 3 Diseño de ARTICULA e Interface final

Estudio de aplicación. El estudio se realizó en 27 alumnos de dos colegios de educación especial, uno de ellos en Zaragoza España y el otro en Bogotá Colombia. Los alumnos fueron seleccionados por profesionales en fonoaudiología y educación especial bajo las premisas de que ellos tuvieran alteraciones en su voz, que conocieran las vocales y entendieran las actividades a realizar. El estudio tuvo un duración de doce semanas y los datos se dividieron en datos cualitativos y cuantitativos tomados al inicio y al final del estudio. Para los datos cualitativos, los profesionales en fonoaudiología y educación especial diseñaron una evaluación considerando la intensidad, la duración del soplo, el tono, las práxias de lengua y el ritmo. En los datos cuantitativos se consideró la intensidad, el tono, el soplo y la articulación vocálica, y se obtuvieron directamente de la herramienta como muestra la Figura 4, en donde se puede apreciar que una vez el usuario ha realizado una sesión de trabajo (parte superior), el sistema mide el error cuadrático medio entre el patrón definido por el terapeuta y el patrón descrito por el niño con su voz (parte inferior). Estos datos fueron registrados

semana a semana y se compararon las medias de las primeras tres semanas con respecto a las tres últimas. Una adaptación de la prueba t Student llamada test de Welch fue utilizada para verificar si las medias iniciales eran significativamente diferentes a las medias finales.

Figura 4 Datos cuantitativos para Intensidad, Soplo y Tono

5. RESULTADOS Y DISCUSIÓN

Los datos cualitativos obtenidos en el estudio se muestran en la Figura 5, mientras que los datos cuantitativos se muestran en la Figura 6.

Figura 5 Resultados cualitativos del estudio

los resultados cualitativos muestran un numero de sujetos que usando PreLingua durante 12 semanas, ciertamente mejoraron sus habilidades de voz en aspectos como el soplo, la intensidad, y el ritmo, en un 66.6%, 44.4% y 40.7% de los sujetos respectivamente. Habilidades como la entonación y práxias de lengua, las cuales requieren de un mejor control de los músculos y demás estructuras anatómicas, mostraron resultados menos relevantes con un 29.6% y 33.3% respectivamente, convirtiéndosen en los aspectos de la voz más difíciles de trabajar por parte de los usuarios. Debido al alto nivel de entendimiento y concentración requeridos, se necesitará de un estudio más amplio (quizá de seis meses a un año) y con más

casos de estudio que refleje mayores variaciones de estos parámetros en el tiempo, para saber si PreLingua tiene las mismas posibilidades de mejorar estos aspectos de la voz en sujetos con voz alterada. Una parte muy positiva de los resultados cualitativos son las habilidades adicionales observadas (H.A.O.) que, aunque no se esperaban al inicio del estudio, éstas se presentaron en el 77.7% de los casos de estudio convirtiéndosen en los mejores resultados cualitativos obtenidos. Éstas habilidades adicionales incluyen el aumento del tiempo de atención, direccionalidad del soplo y habilidades de socialización como la sana competencia, el respeto de turnos y la automotivación.

Figura 6 Resultados cuantitativos del estudio

Por su parte, los resultados cuantitativos muestran, que objetivamente la intensidad fue la actividad con mejores resultados en todos los niveles de significancia con respecto a las demás, seguida del soplo, la articulación vocálica y finalmente el tono. En general, Intensidad y Soplo fueron las actividades donde más sujetos alcanzaron mejoras significativas en todos los niveles de significancia. Estos resultados son especialmente buenos en la actividad de Soplo, ya que ésta actividad requiere un alto nivel de concentración comparada con la actividad de Intensidad que es considerada la más fácil de realizar. Un numero menor de usuarios alcanzaron mejoras significativas en la actividad de Tono, posiblemente influenciada por la corta duración del estudio y el alto nivel de exigencia requerido en ésta actividad a nivel de conciencia, como también, el buen control/modulación sobre las cuerdas vocales. Respecto a la actividad de articulación vocálica, es bien sabido que el proceso de articulación está afectado por las condiciones geométricas de la cavidad vocal del usuario, algunos de los usuarios presentaban mal formaciones en el paladar blando o duro, dientes torcidos, y/o hipotonía o hipertonía, de manera que los resultados obtenidos en ésta actividad no fueron tan relevantes como en las otras actividades, y se espera sean mejores en la medida en que se utilice más la herramienta y se hagan más sesiones de trabajo.

En función de los resultados obtenidos hasta el momento, la herramienta propuesta representa una ayuda real para los profesionales de terapia de voz, aunque se debe seguir investigando

para dar a la herramienta más robustez ante diferentes entornos acústicos y ante la enorme diversidad que implica trabajar con discapacidad.

6. AGRADECIMIENTOS Los autores quieren agradecer la colaboración para este trabajo a los profesionales del Colegio Público de Educación Especial Alborada, y a la Fundación Centro de Educación Especial del Niño Diferente CEDESNID. De igual manera al Banco Santander y al proyecto TIN-2008-06856-C05-04 del Ministerio de Ciencia e Innovación de España.

7. REFERENCIAS[1] http://www.axistive.com/speechviewer-iii.html.[2] http://www.kayelemetrics.com/Product Info/3950/3950.htm[3] http://www.drspeech.com

[4] A. Hatzis, P. Green, J. Carmichael, S. Cunningham, R. Palmer, M. Parker, y P. O’Neill, “An integrated toolkit deploying speech technology for computer based speech training with application to dysarthric speakers,” in Proceedings of the 8th European Conference on Speech Communication and Technology (Eurospeech-Interspeech), Geneva, Switzerland, September 2003, pp. 2213-2216.

[5] J. Duchateau, L. Cleuren, H. Van Hamme, y P. Ghesquiere, “Automatic assessment of children’s reading level,” in Proceedings of the 10th European Conference on Speech Communication and Technology (Eurospeech-Interspeech), Antwerp, Belgium, September 2007, pp. 1210–1213.

[6] F.-C. Chou, “Ya-Ya language box - A portable device for English pronunciation training with speech recognition technologies,” in Proceedings of the 9th European Conference on Speech Communication and Technology (Eurospeech-Interspeech), Lisbon, Portugal, September 2005, pp. 169–172.

[7] Rodríguez, W.-R. and Lleida, E. (2009). Formant estimation in children’s speech and its application for a spanish speech therapy tool. In Proceedings of the 2009 Workshop on Speech and Language Technologies in Education (SLaTE), Wroxall Abbey Estates, United Kingdom.

[8] Rodríguez, W.-R., Saz, O., and Lleida, E. (2010b). Articula - a tool for spanish vowel training in real time. In Proceedings of the 2010 Workshop on Second Language Studies: Adquisition, Learning, Education an Technology. Interspeech 2010, Tokio, Japan.

8. NIVEL DE FORMACIÓNIntermedio: Posee conocimientos generales del tópico.

http://www.ciiee9.utp.ac.pa