procesamiento de señales de voz.pptx

CURSO: Procesamiento Digital de Señales I

Integrantes:

ABIA ARRIETA AUGUSTO CADENILLAS CABANILLAS SEGUNDO REYMUNDO GASPAR MICHAEL

Procesamiento de señales de voz

La comunicación oral

¿Qué es la voz?

• Onda de sonido (onda de presión)• Producida por el aparato fonador• Utilizada para comunicación (para

transmisión de mensajes)

Procesamiento de voz

• Análisis de voz• Codificación y comprensión de voz• Síntesis de voz• Reconocimiento automático de voz• Reconocimiento y verificación de

locutores• Detección de patologías• Diseño de ayudas para la audición

Problemas del procesamiento de voz• Variabilidad

– Intra-locutor (estado salud / ánimo, velocidad)– Inter-locutor– Adquisición

• Continuidad: concatenación y coarticulación• Información contenida en la señal de voz

muy redundante• Multi-interactividad entre niveles:

– Nivel fonético– Características suprasegmentales– Nivel semántico: contexto – suplencia mental

• Ruido: perturbación + efecto Lombard

• Variabilidad de las señales de voz

• 40 ms correspondientes al fonema /a/

Modelo acústico de producción de voz

• Onda acústica: onda de presión en el aire con c = 350 m/s

• Longitud de onda l = c / f– Para 100 Hz, l = 3.5 m– Para 4 kHz, l = 8.75 cm

• Producción de sonido:– Fonemas sonoros: vibración cuerdas vocales– Fonemas sordos: flujo turbulento– Fonemas oclusivos: obstrucción + apertura

Formantes

• Formantes: resonancias del tracto vocal

• Por las dimensiones y la velocidad de propagación del sonido, aparece en promedio 1 formante por cada kHz

• El tracto vocal “filtra” la onda glotal: amplifica cada componente de frecuencia con una determinada ganancia

Pérdidas por radiación de onda

• p(L) = 0 no es cierto• Impedancia acústica Z• Impedancia para abertura circular

de radio a en plano infinito

• El filtrado del tracto vocal considerando las perdidas por radiación es distinto:• Caída para altas frecuencias• 6 dB / década

u(L,f) / uG(f)

Solución numérica para función de área correspondiente a fonema /a/

Acoplamiento del tracto nasal

Modelo acústico de producción de voz

• Excitación– Fonemas sonoros– Fonemas sordos– Fonemas oclusivos

• Filtrado por tracto vocal / nasal– Formantes (1 por kHz)– Caída 6 dB/década

Modelo digital de producción de voz

Características de la voz• Excitación:

– Sonoro (freq. fundamental o pitch)– Sordo– Oclusivo– Combinación

• Formantes:– Cavidad buco-nasal– Envolvente espectral

• Energía: presión de aire• Evolución en el tiempo de los parámetros

Características de la voz• Excitación:

– Sonoro (freq. fundamental o pitch)– Sordo– Oclusivo– Combinación

• Formantes:– Cavidad buco-nasal– Envolvente espectral

• Energía: presión de aire• Evolución en el tiempo de los parámetros

Clasificación de los fonemas(desde el punto de vista de la producción)

• Actividad de cuerdas vocales– Vocales– Consonantes sonoras– Consonantes sordas

• Modo de articulación– Vocales– Consonantes

• Lugar de articulación– Vocales– Consonantes

Clasificación de vocales

• Modo de articulación (formante 1)– Cerradas (i,u)– Medias (e,o)– Abiertas (a)

• Lugar de articulación (formante 2)– Anteriores (i,e)– Centrales (a)– Posteriores (o,u)

Formantes 1º y 2º en vocales

200 300 400 500 600 700 800 900 1000

freq. 1er formante (Hz)

/a//o//u/

/i/ /e/

Fonemas del español

Análisis de señales de voz

• Conceptos de procesado de señales– Transformada de Fourier– Componentes de frecuencia– Espectro de potencia– Filtrado– Ventanas– Muestreo– Espectrogramas

Transformada de Fourier

• Transformada (FT): – Cambio de representación– Misma información (otra representación)– Existe transformada inversa (FT-1)– Transforma señal compleja en señal

compleja:

Espectro de potencia (1)

Espectro de potencia (2)

Descomposición en componentes freq.

Linealidad de la Transformada de Fourier

Filtrado

• Caracterización del filtro:– Tiempo: respuesta impulsiva– Frecuencia: función de transferencia (o

respuesta en frecuencia)

filtroexcitación señal filtrada

Filtrado en el tiempo: convolución

Filtrado en frecuencia: multiplicación

Ventanas (multiplicación en tiempo)

Transformada de un tren de pulsos

Transformada de señal periódica

Muestreo de señales: T. de muestreo

Transformada Fourier: Resumen

DFT y FFT

• Transformada discreta de Fourier (DFT)• Transformada rápida de Fourier (FFT)

• Señales discretas (muestreadas)• Ventana (resolución espectral)• N muestras en t => N muestras en f• FFT: Muy utilizada en procesamiento

digital de señales

La señal de voz

/s/ /a/ /l/

Estacionariedad de la voz

• La señal de voz es “estacionaria a trozos”– Durante la pronunciación de un fonema es quasi-

estacionaria– Velocidad cambios tracto vocal– Velocidad cambios cuerdas vocales

– Estacionaria durante 20 – 40 ms– Velocidad de pronunciación: 5-20 fonemas / seg– Análisis de “trozos de voz estacionarios”:

ventanas

Análisis con ventanas

Espectro de las vocales

/a/ cerrada

Espectro de las vocales

/a/ cerrada

Espectro de consonantes sonoras

Espectro de consonantes fricativas

Fonemas no estacionarios

• Fonemas estacionarios:– vocales: /a/ /e/ /i/ /o/ /u/– consonantes sonoras: /l/ /y/ /R/ /m/ /n/ /ñ/– consonantes fricativas: /s/ /sh/ /ss/ /z/ /f/ /j/

• Fonemas no estacionarios:– Plosivas sordas: /p/ /t/ /k/– Plosivas sonoras: /b/ /d/ /g/– Otras consonantes: /ch/ /r/

Espectrograma (representación tiempo - frecuencia)

m b o i a kom p r a R p a n

Ventana en el espectrograma: 64ms / 8 ms

Información relevante de la señal de voz:

• Para reconocimiento de voz:– Envolvente espectral (formantes)– Evolución temporal de los formantes

Información espectral de tiempo corto• Información complementaria:

– Tono fundamental– Estructura fina del espectro

procesamiento de señales de voz.pptx

Documents

Transcript of procesamiento de señales de voz.pptx

PROCESAMIENTO DE SEÑALES

Procesamiento Analógico de Señales (PDF)

Procesamiento Digital de Señales de Voz - … · 1 Procesamiento Digital de Señales de Voz Transparencias: Procesamiento de Señales y Métodos de Análisis para reconocimiento

Procesamiento Digital de Señales Musicales @pdsuntrefmate.dm.uba.ar/~tallerdemusica/Poster-mieza.pdf · Procesamiento Digital de Señales Musicales ... pablomargaretic@hotmail.com

Procesamiento Analogico de Señales I

11. Procesamiento de Señales Procesamiento de señales analógicas ztiempo continuo ztransformadas continuas (Fourier, Laplace) zfiltros implementados en.

PROCESAMIENTO DE SEÑALES DE ELECTROMIOGRAFÍA …

PROCESAMIENTO DIGITAL SEÑALES

PROCESAMIENTO DIGITAL DE SEÑALES SEÑALES Y SISTEMAS ANALÓGICOS.

MODELO DE PROCESAMIENTO DIGITAL DE SEÑALES ...

PROCESAMIENTO DIGITAL DE SEÑALES

Procesamiento Digital de Señales: Señales y Sistemas

Procesamiento de señales Ingeniería de Telecomunicaciones.

Procesamiento Digital De Señales Proakis

PROCESAMIENTO DE SEÑALES ANALÓGICAS

procesamiento analogo de señales libro

Procesamiento Digital de Señales - fimee.ugto.mx · Procesamiento Digital de Señales (PDS) Facultad de Ingeniería Mecánica, Eléctrica y Electrónica Que es DSP? Procesamiento

Percepción (Procesamiento Digital de Señales)

Procesamiento Analogico de Señales

PROCESAMIENTO DE SEÑALES MIOELÉCTRICAS APLICADO …