Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la...

30
Técnicas de predicción Técnicas de predicción lineal lineal Curso de doctorado 2001/2002 Inmaculada Hernáez [email protected]

Transcript of Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la...

Page 1: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 1

Técnicas de predicción Técnicas de predicción lineallineal

Curso de doctorado 2001/2002Inmaculada Herná[email protected]

Page 2: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 2

Técnicas de predicción lineal

Análisis LPCDescripciónCálculo de los coeficientesCoeficientes PARCORPotencia del análisis LPC: ejemplos

Vocoder LPC

Page 3: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 3

Análisis LPCEl análisis LPC permite representar la señal de voz y las características espectrales de forma precisa y eficiente, mediante muy pocos parámetros obtenidos mediante cálculos sencillos.Definición:Sean {s(n)} las muestras de la señal de voz tomadas cada Ts seg. Ts<1/2W, W: frecuencia máxima de la señal.Formamos una combinación lineal de P+1 muestras.

s(n)+a1·s(n-1)+a2·s(n-2)+…+ap·s(n-p)=e(n)Si{e(n)}es una variable aleatoria estadísticamente incorrelada, con media cero y varianza σ2 la muestra actual s(n) puede ser linealmente predicha, utilizando p muestras anteriores.El valor predicho:

∑=

−⋅−=p

ii insans

1)()(ˆ

Page 4: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 4

Análisis LPCFiltro predictor P(z): ∑

=

−⋅−=p

ii insans

1)()(ˆ

∑=

− ⋅⋅−=p

i

ii zSzazS

1)()(ˆ ∑

=

−−=p

i

ii zazP

1

·)(

P(z))(ns )(ˆ ns

Error de predicción

P(z)

)(ns

)(ˆ ns

)(ne+_

A(z)

Page 5: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 5

Análisis LPC

P(z)

)(ns

)(ˆ ns

)(neH(z)=1/A(z)

∑=

−−=p

i

ii zazP

1·)(

Síntesis LPC:

H(z): estimación de la respuesta del tracto vocal

Page 6: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 6

Ejemplos análisis LPC

H(ω)

Page 7: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 7

Ejemplos análisis LPC

Page 8: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 8

Cálculo de los coeficientes LPC

Page 9: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 9

Cálculo de los coeficientes LPCMétodo de las autocorrelaciones

Page 10: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 10

Cálculo de los coeficientes LPC

La matriz [R] es Toepliz: es simétrica, y todos los elementos en las diagonales paralelas a la diagonal principal son iguales. El ‘método de Durbin’ para la resolución de las ecuaciones aprovecha estas propiedades de la la matriz [R].Como s(n)=0 para n<0 y n>N-1, e(n) será grande en 0<n<p pues estamos basando la predicción en muestras que han sido puestas a cero. Lo mismo ocurrirá en el intervalo final N<n<N+p-1. Para disminuir este efecto, se realiza el enventanado de la señal.

ω(n)

Page 11: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 11

Cálculo de los coeficientes LPCMétodo de las covarianzas

Page 12: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 12

Algoritmo de Levinson-Durbin

Page 13: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 13

Análisis PARCOR

Page 14: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 14

Análisis PARCOR

Page 15: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 15

Análisis PARCOR

Page 16: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 16

Análisis PARCOR

Page 17: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 17

Análisis LPC

Page 18: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 18

Análisis LPC

¿Cómo suena el residuo?

P(z)P(z)

)(ns

)(ˆ ns

)(ne+_

A(z)

Page 19: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 19

Análisis LPC

Seña

l ori

gina

l

Page 20: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 20

Análisis LPC

Resi

duo

Page 21: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 21

Potencia del análisis LPC: ejemplos

∑=

−−=p

k

kk zazP

1·)(

P(z)P(z)

)(ny

)(ˆ ny

Análisis LPCAnálisis LPC…{ak,Gi}i {ak,Gi}i +1…)(ny

)(nx

Gi

a) Ruido blanco, G=100%>

b) Ruido blanco, G=50%

c) Tren de deltas G=100%

d) Tren de deltas G=50%

Page 22: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 22

Técnicas de predicción lineal

Análisis LPCDescripciónCálculo de los coeficientesCoeficientes PARCORPotencia del análisis LPC: ejemplos

Vocoder LPC

Page 23: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 23

Vocoder LPC

Modelo de producción de voz:

GENERADORde PULSOS

PULSOGLOTALG(z)

GENERADORde RUIDO

x

x

TRACTOVOCALV(z)

RADIACIÓNLABIOSR(z)F0

AV

AUCOEFICIENTES

REFLEXIÓN

s(n)

EXCITACIÓNSONORA

EXCITACIÓNSORDA

GENERADORde

EXCITACIONES

TRACTOVOCALH(z)

u(n)

G(z) V(z) R(z)

Page 24: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 24

Vocoder LPCSimplificación de la excitación en la síntesis:

Tren de impulsos periódicos en los segmentos sonorosRuido gaussianoblanco en los segmentos sordosMantenimiento de la potencia del residuo en la nueva excitación sintética.Ejemplos:

Page 25: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 25

Decodificador/Codificador LPC

P(z)

+

H(z)x

ANÁLISISLPC

P(z)

- ANÁLISIS-PITCH-U/V

G

CoeficientesReflexión

G

V

U

F0)(nr

)(ˆ ns

)(ns

)(ns

1/F0

Page 26: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 26

Vocoder LPC10E/FS1015

54 bits/trama

Pitch + U/V->7bitsG->5bitsK1 a K4->5bitsK5 a K8-> 4bitsK9->3bitsK10->2bits

Fs= 8000muestras/s54bits/trama180muestras/trama(22.5ms/trama)

2400bits/seg

Page 27: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 27

Vocoder LPC10E

Ejemplos:Señal OriginalSeñal transcodificada LPC10E Señal transcodificada LPC10E

(transmisión radio vía satélite)

Características:Nasalidad: modelo todo-polosExcitación sonora simple (tren de impulsos): buzzingTamaño de trama: problemas con las transiciones rápidas (p, t, k…)

Page 28: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 28

Vocoder LPC10E

En esta gráfica podemos observar la incapacidad del codificador para reproducir elementos de transición rápida (tales como las explosiones de las oclusivas p t k). Lógicamente, este codificador no mantiene la forma de onda de la señal original, ya que el proceso de codificación se fija únicamente en minimizar el error en el módulo de la envolvente espectral.

Page 29: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 29

Variantes del Vocoder LPC

Gran cantidad de variantes cuyo fin era mejorar la calidad, transmitiendo más información en la señal de excitaciónExcitaciones mixtas pulsos+ruido en diferentes bandas y con diferentes pesos.Sustitución de la delta por un pulso ligeramente más complejoLPC excitado por voz o por resíduo:

Intenta mejorar la calidad de la excitaci`´on, eliminando la detección sordo/sonoro y la estimación del valor del pitchLa excitación es filtrada paso-bajo (fc=800Hz), y se transmite con muy pocos bits. Se utiliza para la reconstrucción ene l receptor.Requiere velocidades de transmisión superiores al LPC10E

Todas las mejoras posteriores se orientaron a mejorar la excitación transmitida (el predictor permanece prácticamente inalterado en todos los esquemas propuestos).

Page 30: Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la señal de voz 3. Análisis LPC. El análisis LPC permite representar la señal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 30

BibliografíaJ. Makhoul; Linear Prediction: A tutorial review Proc. of the IEEE, April1975 Andreas S. Spanias; Speech Coding: A Tutorial Review Proc. of the IEEE, Vol. 82, no10, October 1994Bishnu S. Atal; Speech Analysis and synthesis by Linear Prediction of the Speech Wave J. Acoust. Soc. Am. Vol.55, pp. 637-655, Aug. 1971Tremain, T.; The government standard linear predictive coding algorithm: LPC-10 Speech Techno1ogy Magazine, April 1982, pp.40-40 J. Campbell and T .E. Tremain; Voiced/unvoiced classification of speech with applications of the W.S. Government LPC-10e algorithm Proc.IEEEInt. Conf. ASSP1986 pp.473-476V. Welch and T. Tremain; A new government standard 2400 bps speech coder IEEE Workshop on Speech Coding for Telecommunicacions, pp. 1626-1640, Oct. 1993Bishnu S. Atal Predictive Coding of Speech at Low Bit RatesIEEE Transactions on Communications, Vol COM-30. no4, April l982, pp. 600-614