La señal de voz Asunción Moreno. Indice El aparato fonador La señal vocal Parámetros...

Post on 12-Jan-2015

8 views 0 download

Transcript of La señal de voz Asunción Moreno. Indice El aparato fonador La señal vocal Parámetros...

La señal de voz

Asunción Moreno

Indice

El aparato fonador La señal vocal Parámetros fundamentales Modelo de producción de la voz Fonética acústica El oído Percepción del sonido

El aparato fonador

La glotis

x104

El gol -pe de ti - món f - ue sobr-e co-g-e - do - r

Señal de voz (fm= 8Khz/12 bits)

0 100 200 300 400

-1000

-800

-600

-400

-200

0

200

400

600

800

0 100 200 300 400

-200

-150

-100

-50

0

50

100

150

Señal sonora: /e/ Señal sorda: /s/

Representación temporal y frecuencial

0 5 10 15 20 25 30-200

-100

0

100

200

0 500 1000 1500 2000 2500 3000 3500 4000-150

-100

-50

0

Espectrograma

0 500 1000 1500

-1500

-1000

-500

0

500

1000

0 500 1000 1500

-500

0

500

1000

0 500 1000

-1000

-500

0

500

Tres realizaciones de lapalabra “el” pronunciadaspor tres locutores distintos

Variabilidad

Factores de variabilidad

Culturales

• Volumen de la voz• Conjunto de sonidos• Duración• Entonación• Formas de formar frases• Velocidad del habla• Vocabulario

GramáticaEspañola

Diccionar

ioDicc

ionario

EspañolEspañol

Ambientales

• Ruido de fondo• Factores mecánicos: vibraciones• Estado emocional • Acústica de la sala • Ambiente: calor

Fisiológicas

• Tracto vocal• Cuerdas vocales y• frecuencia de vibración• Forma del pulso glotal• Cansancio• Congestión nasal

Variabilidad intra locutor

ArticuladaArticulada SusurradaSusurrada Alta vozAlta voz

NormalNormal EnfadoEnfado SuaveSuave RápidaRápida

Palabra cero pronunciada en diversos estilos

Análisis estadístico

0 200 400 600 800-1000

-800

-600

-400

-200

0

200

400

600

Transición del fonema /f/ al fonema /u/

No estacionariedad

Histograma

-3 -2 -1 0 1 2 30

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Aproximación del histograma

Representación conjunta de dos muestras consecutivas

0 20 40 60 80

-1000

-500

0

500

1000

1500

2000

2500

3000

Indice desplaz.

Corr. M./seg.=357 Sol.= 0% V.Dat: Rect Estim: Inse

0 20 40 60 80-2

-1.5

-1

-0.5

0

0.5

1

1.5

2

2.5

x 105

Indice desplaz.

Corr. M./seg.=459 Sol.= 0% V.Dat: Rect Estim: Inse

Tramas sorda y sonora con su autocorrelación

0 100 200 300 400

-1000

-800

-600

-400

-200

0

200

400

600

800

0 100 200 300 400

-200

-150

-100

-50

0

50

100

150

Tramas sorda y sonora: densidad espectral de potencia

0 100 200 300 400

-1000

-800

-600

-400

-200

0

200

400

600

800

0 500 1000 1500 2000 2500 3000 3500

10

20

30

40

50

60

70

Freq.(Hz)

Period. Mues./seg.=460 Sol.= 0% Vent. Hamm

0 500 1000 1500 2000 2500 3000 35005

10

15

20

25

30

35

40

45

Freq.(Hz)

Period. Mues./seg.=459 Sol.= 0% Vent. Hamm

0 100 200 300 400

-200

-150

-100

-50

0

50

100

150

Parámetros fundamentales

Tono (frecuencia fundamental) Formantes Ancho de banda

Tono (frecuencia fundamental)

Gama de variación entre 50 Hz y 400 Hz Tono medio:

mujeres: 220 Hz varones: 130 Hz

1 octava de variación en el habla normal.

Tono o frecuencia fundamental

Hz

Formantes de un sonido sonoro

0 2 4 kHz

Formantes de las vocales Triángulo de las vocales

200

800

800 2000

F1

F2

u

a

i

F3: 2.24 kHz (u)3.01 kHz (i)

Formantes de un sonido sordo

0 2 4 kHz

Evolución de los formantes

Hz

Parametrización de la voz

Hz

Ancho de banda

canal telefónico

inteligibilidad

50 Hz300 Hz

3.4 kHz

7 kHz

naturalidad

Modelo de producción de la voz

excitación tracto vocal

voz

ruido

tren periódico de pulsos H(z)

sonidos sonoros

sonidossordos

No

Fonética acústica

FricativasAproximantes

VibrantesLaterales

Son

ori

dad

VocalesSiNasales

Oclusivas

Oclusivas Fricativas

Africadas

Oclusión

No Total Parcial

Fonética acústica

Puntos de articulación

Alófono

Fonema

Variabilidad

Puntos de articulación

labios: [p], [b], [m]

dientes: [t], [d]

alveolos: [n], [s]

paladar: [J], [L]

velo: [k], [g], [x]

Alófono

Cada uno de los sonidos propios de una lengua

Fonema

Conjunto de alófonos con el mismo valor fonológico en una lengua /s/, /z/ casa, mismo /n/, /N/ cana, tango

Variabilidad

contexto coarticulación prosodia

locutor factores individuales ... y sociolingüísticos

El oído

Oído interno

Percepción del sonido

Respuesta a la composición frecuencial (no a la forma de onda)

Enmascaramiento en frecuencia

Bandas críticas

Escalas de Bark y mel

Enmascaramiento Simultáneo