Procesamiento Habla Espontánea

11
1 2009 PHD LENGUAJE HUMANO: Naturaleza, origen y usos Cristina Díez Barberá [PROCESAMIENTO DEL HABLA ESPONTÁNEA] DOCTORADO UNED

description

Trabajo curso de doctorado

Transcript of Procesamiento Habla Espontánea

Page 1: Procesamiento Habla Espontánea

1

2009 

PHD LENGUAJE HUMANO: Naturaleza, origen y usos  Cristina Díez Barberá  

[PROCESAMIENTO DEL HABLA ESPONTÁNEA] DOCTORADO UNED 

Page 2: Procesamiento Habla Espontánea

2

PROCESAMIENTO DEL HABLA ESPONTÁNEA 

ÍNDICE CAPÍTULO PÁGINAS 1. DESCRIPCIÓN DE LAS PRÁCTICAS 3

a. PRÁCTICA 1 b. PRÁCTICA 2 

2. ANÁLISIS INDIVIDUAL DE LAS GRABACIONES 3 3. CONCLUSIONES GENERALES 9

Page 3: Procesamiento Habla Espontánea

3

1. DESCRIPCIÓN DE LAS PRÁCTICAS PRÁCTICA 1: Análisis de la sílaba en grabaciones espontáneas  Se analizará la correspondencia de la sílaba acústica con la sílaba fonológica. Para ello se utilizará un programa específico (WaveSurfer) y datos de un corpus desarrollado por el Laboratorio de Lingüística Informática, el C-ORAL-ROM. Se partirá de un etiquietado y segmentación automáticos y el alumno deberá comprobar la segmentación y el etiquietado silábico propuesto, prestando especial atención a las discrepancias entre ambos, debidas a los distintos registros de oralidad.  PRÁCTICA 2  Descripción de los entornos y contextos en los que se produce una discrepancia entre la sílaba fonológica y su realización acústica, teniendo en cuenta especialmente la tipología de registros de la lengua oral. A partir de estas observaciones, se tratará de encontrar reglas para mejorar un transcriptor fonológico automático para adaptarlo al habla espontánea.

2. ANÁLISIS INDIVIDUAL DE LAS GRABACIONES INFORMAL Familiar/privado

efamcv01_0026 – Conversación – 40´ Chica joven (en grupo, se sobreponen voces)

• yes ke a de ma yu kuan do me oigo m me parece ke tu na voz de pi to y es ke a de mas yo kuan do ten go u na 1. Desparecen sonidos o se asimilan a otros 2. Vocalización poco clara

efamdl01_0008 - Diálogo – 35´ Mujeres mayores (Norte de España?)

• te tie nes ke bus kar for mas o ke si no pue des en trar ren pi ka o si no sa les por ke pi ka do

1. Desaparecen sonidos o se asimilan a otros 2. Pérdida de la d en el final ado

efammn01_0007 - Monólogo – 30´ Mujer mayor

• li(i alargada) bros ir a de xar le al co le xio por ke eh ta ba un po ki to le jos es ta ba

1. Alargamiento vocálico en las enumeraciones

Page 4: Procesamiento Habla Espontánea

4

FORMAL Medios de comunicación

emedin01_0001 - Entrevista – 10´ Locutor( de informativos)

• fe Ca en la ke se ce le bra en ka si to do el mun do la fies ta del tra ba jo

1. Locutor: correspondencia entre la trascripción y el texto del locutor 2. Mayor correspondencia con las personas mayores 3. Los jóvenes vocalizan peor, dudan más, deforman fonemas

emedmt01_0010 - Meteorología – 20´ Locutor: hombre del tiempo

• ay ma re xa da a fuer te ma re xa da i mar de fon do del nor o es te ko no las de tres me tros

1. Locutor: correspondencia con ligeras variantes 2. Consonantes finales en posición implosiva se unen a vocal de siguiente palabra.

emednw01_0008 - Noticias – 15´ Experto

• los ni be les de mo nok si do de car bo no i car bok si e mo glo bi na en de fi ni ti ba no

1. Pronunciación clara. 2. La s implosiva no se pronuncia igual en los dos casos: los-nibeles

Los: s seguida de n se pierde Nibeles: se define perfectamente como sibilante sorda

3. La X: Se repite patrón en el espectograma Sin embargo, en la ks no se aprecia una s clara, sino un sonido que no

puedo clasificar

Page 5: Procesamiento Habla Espontánea

5

emedrp01_1_0000 – Reportaje – 30´ Locutora (de informativos)

• ye ban bein ti Tin ko a Nos tra tan do de a ceR po pu laR la mu si ka kla si ka cer lar

1. La r en posición implosiva se hace doble ante una l 2. El resto de la pronunciación sin alteraciones

emedsc01_0015 – Prensa científica – 25´ Instrucciones: locutor profesional

• den tro de a gu a ka lien te es de Tir po bre en nok si Xe nos se em bla ki ne Te en ok no se

1. Dos vocales e – e, una en posición final y la otra inicial, se convierten en un solo sonido de mayor duración: pobre en / se emblanquinece

2. n en posición final de palabra, ante otra palabra que empieza por vocal, se pronuncia al entrar en contacto con la vocal inicial , sin perder el sonido de su posición implosiva.

3. s en posición inicial de palabra, se une a la consonante final de la palabra que la antecede.

4. Se repite el patrón del espectograma del sonido ks

Page 6: Procesamiento Habla Espontánea

6

emedsp01_0003 - Deportes – 30´ Locutor de radio (onda cero)

• nu es tros ses tu dios Ten tra les en lak kap pi tal des pa Na es tu dios on da cero es la ka de es

1. Consonantes finales en posición implosiva se unen a vocal de siguiente palabra. (Excepto cuando los separa una pausa)

2. Vocales finales de sílaba, consonante principio de sílaba: toman parte del sonido consonantico, como cuando dichas consonantes está en posición implosiva.

3. Se aprecia una peculiar pronunciación de la s antes de la t. Parece que se fricatiza aún más.

4. Dos vocales e – e, una en posición final y la otra inicial, se convierten en un solo sonido de mayor duración: de – españa

emedts01_0015 – Programa informal de entrevistas – 35´ ¿Locutora o comentarista?

• ip pes ta mos bien do en la vi Ne tas ko mos tan per ma nen te men te i es las mo es tan

1. Consonantes finales en posición implosiva se unen a vocal de siguiente palabra.

(Excepto cuando los separa una pausa) 2. Vocales finales de sílaba, consonante principio de sílaba: toman parte del sonido

consonantico, como cuando dichas consonantes está en posición implosiva. 3. Dos vocales iguales, una en posición final y la otra inicial, se convierten en un

solo sonido de mayor duración. 4. Dos vocales diferentes, una en posición final y la otra inicial, se asimilan al

sonido de una de ellas, en un solo sonido de mayor duración. FORMAL Natural context

enatbu01_0037 – Negocios – 30´ • en tre(alargamiento vocálico) pai ses

pri me ro a Ter run kua dro ma so me nos de lo ke ke re mos de cir le Ter un mas o

1. Consonantes finales en posición implosiva se unen a vocal de siguiente palabra. (Excepto cuando los separa una pausa)

2. Alargamiento vocálico de vocal final ante una pausa o para realizar una pausa. 3. Vocalización clara, pero no tan marcada como la profesional. ¿Se fricatizan

ligeramente las consonantes implosivas?

enatco01_0013 - Conferencia – 30´ • ne(alargamiento) los cim pan Te(alargamiento) los ma ka ko los pa pio nes es tos pri

e Tes kos • ma tes kes son mas ko mu nes

ke 1. La s de plural de dos sustantivos desaparece en contacto con la siguiente vocal. 2. No ocurre lo mismo en un tercero, pues se hace una pausa 3. Inicio de enunciado con un en

Page 7: Procesamiento Habla Espontánea

7

4. Consonantes finales en posición implosiva se unen a vocal de siguiente palabra. (Excepto cuando los separa una pausa)

enatla01_0033 – Leyes – Derecho – 20´ • sa be mos ke ses ta ven dien do dro ga en det ter mi na dos lu ga res

se es de ter 1. Dos vocales iguales, una en posición final y la otra inicial, se convierten en un

solo sonido. 2. Vocales finales de sílaba, consonante principio de sílaba: toman parte del sonido

consonantico, como cuando dichas consonantes está en posición final. 3. Claridad de pronunciación. Coincidencia entre sonido y transcripción. Énfasis

que favorece la distinción silábica.

enatpd01_0003 – Debate político – 20´ • se go via vein ti si te de se tiem bre del dos mil uno fir ma do an Xel gar ci a can ta le xo

via a sep 1. Consonate implosiva a final de sílaba (p), con sílaba siguiente iniciada con

consonante, la final de la sílaba anterior desaparece. 2. Dos vocales iguales, una en posición final y la otra inicial, se convierten en un

solo sonido.

enatpe01_0012 – Explicación profesional – 25´ • en ton Tes saies don de se se pa sa pri me ro a la sek Tion de per fo ra do

a i es 1. Consonantes finales en posición implosiva se unen a vocal de siguiente palabra. 2. Vocales que forman un triptongo fonético: aie 3. Hablante profesional, menor formación o interés en la pronunciación.

enatpr01_0018 – Sermón religioso – 35´ • Ci no ke a la o ra de la ber dad des de tir a la o ra de la kri ti ka(alargamiento vocálico) la

Si es ka a • o ra del pe li gro e

1. Palatalización de la s inicial. Se convierte en C 2. Consonantes finales en posición implosiva se unen a vocal de siguiente palabra. 3. Dos vocales iguales, una en posición final y la otra inicial, se convierten en un

solo sonido. 4. Claridad, pero no tanta como en medios.

enatps01_0001 – Discurso político – 30´ • i(alargamiento) an te to do pues lo ke(alargamiento vocálico) ko Res pon de es e da

i ke • ros las gra Tias por vues tra pre sen Tia

1. Alargamiento vocálico antes de una pausa (¿duda?). 2. Se insertan en el discurso sonidos no necesarios para la comunicación 3. Claridad

Page 8: Procesamiento Habla Espontánea

8

enatte01_0007 – Docencia – 35´ • i(alargamiento vocálico) kie ro(alargamiento vocálico) ko Xer ru na sig na tu ra de li bre

i ro u na a sig • con fiu ra Tion ke kre o ke(alargamiento) la das tu

fi gu ke 1. Duda=pausas con alargamiento vocálico. La duración del fonema vocálico es

mayor, pero se refleja un cambio melódico y tonal. En esta grabación se repite varias veces esta expresión de duda

2. fiu por figu: características del habla informal. Desaparecen fonemas. Similitudes con efamcv01_0026. (Mujer joven)

3. Consonantes finales en posición implosiva se unen a vocal de siguiente palabra.

4. Dos vocales iguales, una en posición final y la otra inicial, se convierten en un solo sonido.

5. No coinciden temporalmente transcripción y sonido.

INFORMAL Contexto público

epubcv01_0113 – Conversación • i lo ba de xan do un po ko mal largo ke nos sin te re sa no so tros

mas nos in 1. La superposición de voces dificulta la diferenciación de sonidos 2. Consonantes finales en posición implosiva se unen a vocal de siguiente palabra. 3. Dos vocales iguales, una en posición final y la otra inicial, se convierten en un

solo sonido. 4. Vocalización menos clara 5. Modificación de sonidos: mal largo por mas largo

epubdl01_0018 – Diálogo • to ma el (alargamiento silábico) el pa pel les te ke te doy yo te lo(alargamiento vocálico)

el pa pel es • i kon nes to bas sa ka xa ma driz i(alargamiento vocálico) i ya lo a bo nas

a drid i 1. Duda=pausas con alargamiento vocálico. La duración del fonema vocálico es

mayor, pero se refleja un cambio melódico y tonal. 2. Emisión de fonemas y sílabas no relevantes en la comunicación 3. Vocalización menos clara. 4. Consonantes finales en posición implosiva se unen a vocal de siguiente palabra.

LEYENDA

ALSKJFLASJF POSIBLES PATRONES A ESTUDIAR ALSKJFLASJF SONIDOS DE POCO FRECUENTE PRONUNCIACIÓN CORRECTA ALSKJFLASJF PRONUNCIACIÓN CLARAMENTE DISTINTA DE LA HABITUAL ALSKJFLASJF POSIBLES PATRONES DE COMPORTAMIENTO: FORMAL – MEDIOS DE COMUNICACIÓN ALSKJFLASJF POSIBLES PATRONES DE COMPORTAMIENTO: FORMAR – NATURAL CONTEXT ALSKJFLASJF POSIBLES PATRONES DE COMPORTAMIENTO: INFORMAL – CONTEXTO PÚBLICO ALSKJFLASJF POSIBLES PATRONES DE COMPORTAMIENTO: INFORMAL – FAMILIAR/PRIVADO ALSKJFLASJF SÍLABA FONOLÓGICA

Page 9: Procesamiento Habla Espontánea

9

3. CONCLUSIONES GENERALES DISCREPANCIAS CON LA SEGMENTACIÓN Y EL ETIQUETADO SILÁBICO AUTOMÁTICOS 

• Sólo en dos casos se ha observado una clara asincronía temporal entre la segmentación mecánica y el sonido.

• El programa no tiene nunca en cuenta la realidad acústica de ciertos sonidos finales al entrar en contacto con otros iniciales. La dificultad fundamental a la hora de incorporar dichas variantes al programa estriba en que, a pesar de que muchos fenómenos se repiten con frecuencia, no son completamente regulares ni generales.

• La dificultad crece en registros de habla informal o formal pero de contexto natural.  ENTORNOS Y CONTEXTOS EN LOS QUE SE PRODUCE UNA DISCREPANCIA ENTRE SÍLABA FONOLÓGICA Y SU REALIZACIÓN ACÚSTICA 

• La coincidencia entre sílaba fonológica y su realización acústica es mayor en el entorno formal cuando se trata de medios de comunicación. No obstante, también varía dependiendo del tipo de información o programa. Aquellos denominados talk shows muestran una menor coincidencia. No obstante son frecuentes:

Juntura silábica: final de una sílaba que pasa a formar parte del principio de la siguiente

Alargamiento de una única vocal en sustitución de dos que se hallan en contacto.

• En el entorno formal, dentro del contexto natural, encontramos una coincidencia mayor que el entorno informal, pero menor que en el formal de medios. Encontramos:

Juntura silábica: final de una sílaba que pasa a formar parte del principio de la siguiente

Alargamiento vocálico para expresar duda o para sustituir a una pausa Alargamiento de una única vocal en sustitución de dos que se hallan en

contacto. • En el entorno informal familiar/ privado se presenta la mayor dificultad a la hora de

diferenciar sonidos, así como una menor coincidencia entre silaba fonológica y realización acústica.

Pérdidas de sonidos/fonemas Inserción de sonidos/fonemas no pertinentes Juntura silábica: final de una sílaba que pasa a formar parte del principio

de la siguiente Alargamiento vocálico para expresar duda o para sustituir a una pausa  Alargamiento de una única vocal en sustitución de dos que se hallan en

contacto.

Page 10: Procesamiento Habla Espontánea

10

• En el entorno informal de contexto público la coincidencia es mayor que en el anterior, pero menor que en un entorno formal.

Inserción de sonidos/fonemas no pertinentes Juntura silábica: final de una sílaba que pasa a formar parte del principio

de la siguiente Alargamiento vocálico para expresar duda o para sustituir a una pausa Alargamiento de una única vocal en sustitución de dos que se hallan en

contacto. 

OBSERVACIONES: ALGUNAS CARACTERÍSTICAS GENERALES.  Si bien se puede observar la repetición de algunos patrones de comportamiento acústico, ninguno es absolutamente regular y constante. No obstante, enumeraré los que se han observado más frecuentemente.

1. Consonantes finales en posición implosiva se unen a vocal de siguiente palabra. 2. Dos vocales iguales, una en posición final y la otra inicial, se convierten en un

solo sonido. 3. Alargamiento vocálico en sustitución de una pausa. La duración del fonema

vocálico es mayor, y se refleja un cambio melódico y tonal. 4. Vocales finales de sílaba, consonante principio de sílaba: toman parte del sonido

consonántico, como cuando dichas consonantes está en posición final.  

Page 11: Procesamiento Habla Espontánea

11

NOTA: Para la discriminación de entornos y contextos, se ha consultado, después de la revisión de las transcripciones, la página web: http://lablita.dit.unifit.it/cromdemo