Proyecto de 1016

9
[ANALISIS ESPECTRALES DE LA VOZ] ETN - 1016 UNIVERSIDAD MAYOR DE SAN ANDRES FACULTAD DE INGENIERIA INGENIERIA ELECTRONICA PROYECTO EN MATLAB (Análisis espectrales de la voz) SISTEMAS DE TELECOMUNICACIONES II ETN – 1016 Alumnos: Univ. Richard J. Huchani Cahuana Auxiliar: Univ. Flor pamela águila reyes Docente: Ing. Campero UNIV. HUCHANI CAHUANA RICHARD J.Página 1

Transcript of Proyecto de 1016

Page 1: Proyecto de 1016

[analisis espectrales de la voz] ETN - 1016

UNIVERSIDAD MAYOR DE SAN ANDRESFACULTAD DE INGENIERIAINGENIERIA ELECTRONICA

PROYECTO EN MATLAB

(Análisis espectrales de la voz)

SISTEMAS DE TELECOMUNICACIONES II

ETN – 1016

Alumnos: Univ. Richard J. Huchani Cahuana

Auxiliar: Univ. Flor pamela águila reyes

Docente: Ing. Campero

Fecha: 09-06-2014

UNIV. HUCHANI CAHUANA RICHARD J. Página 1

Page 2: Proyecto de 1016

[analisis espectrales de la voz] ETN - 1016

1. OBJETIVOS:

- Capturar con “goldwave”, o con otra aplicación su nombre

- Analizar sus características espectrales con matlab

- Incluir gráficos del espectro capturado y digitalizado

2. INTRODUCCION

- Un archivo WAV o WAVE, es un formato digital de archivos de audio.

Generalmente no presenta compresión de datos. Es capaz de trabajar con

archivos mono y estéreo en diversas resoluciones y con distintas velocidades

de muestreo

- Una de las grandes ventajas que presenta este formato es que no posee

pérdida de calidad, lo cual lo hace adecuado para uso profesional. Para tener

calidad CD de audio se necesita que el sonido se grabe a 44100 Hz y a 16 bits

- Este formato no es muy popular debido a que al evitarse la compresión de

datos dentro del mismo para no perder calidad, hace que se genere un archivo

demasiado extenso.

3. CREACION DE UN ARCHIVO WAV:

Mediante el programa GOLDWAVE, se procederá a crear un archivos de formato .wav

para el siguiente caso:

- Nombre del estudiante (RICHARD HUCHANI CAHUANA) este archivo tendrá

la siguiente característica

:• Formato PCM

• 16 Bits

• Mono

• 8 KHz.

4. ANALISIS ESPECTRAL DE LAS MUESTRA USANDO MATLAB:Como se menciono en los objetivos del trabajo, utilizaremos el software MatLab,

mediante la introducción de comandos para obtener diversas propiedades de las

señales creadas y así comparar las diferencias entre ambas. El Software MatLab nos

permitirá:

Cargar el Archivo de Audio X = wavread(‘ruta’) Graficar en el dominio del tiempo plot(X)

UNIV. HUCHANI CAHUANA RICHARD J. Página 2

Page 3: Proyecto de 1016

[analisis espectrales de la voz] ETN - 1016

Hallar la transformada rápida de Fourier Y = fft(x) Hallar la potencia de la señal A = Y.*conj(Y) Graficar el espectro de Frecuencias f(100,3000); plot( f, A(1,2901)) 

Al graficar el espectro de frecuencias (luego de calcular la fft), se debe determinar un rango de frecuencias, en este caso entre 100 y 3000 debido a que es el rango promedio de frecuencias en las cuales los ondas sonoras son perfectamente audibles

5. ANALISIS ESPECTRAL:Grafica en el dominio del tiempo:Se calcula a través de la función “plot” una vez cargado el archivo

RICHARDHUCHANICAHUANA.wav original, el cual lo presenta tal como es; en forma

de una onda senoidal.

Grafica en el dominio de la Frecuencia

Se hallando la transformada rápida de Fourier de la señal original para pasar del domino

del tiempo al dominio de la frecuencia; logrando así facilitar su análisis.

UNIV. HUCHANI CAHUANA RICHARD J. Página 3

Page 4: Proyecto de 1016

[analisis espectrales de la voz] ETN - 1016

Parámetros de la Señal

Tiempo de Duración

- La señal dura 2,500 seg. en la cual, el punto de inicio del nombre emitido en la onda sonora se da en 0,411 y se prolonga hasta 2,312 seg. Por lo cual lo demás representa el ruido del ambiente

Ancho de banda

- En base al inicio y al final de la onda sonora (solo analizando el nombre)

BW=Fmax−FminBW=3000−366

BW=2634 [Hz ]

Frecuencia a la mayor potencia:

FPmax=859 [Hz]

UNIV. HUCHANI CAHUANA RICHARD J. Página 4

Page 5: Proyecto de 1016

[analisis espectrales de la voz] ETN - 1016

NOTA: Todos estos datos fueron sacados de las graficas.

6. DIGITALIZACIÓN DE LA SEÑAL

Para la digitalización pasaría por 3 procesos que se muestran en la grafica siguiente:

El proceso de digitalización de una señal consta de tres fases, como se muestra

en la figura. En primer lugar, la señal analógica se discretiza en tiempo

por medio de un convertidor A/D, que muestrea la señal de entrada a una frecuencia

fija, denominada frecuencia de muestreo. A continuación, cada muestra

se discretiza en amplitud, utilizando, como mínimo, un cuantificador para

representar todos los valores de las muestras posibles con un número finito de

símbolos. Finalmente, los símbolos se transforman en bits para transmitirlos

UNIV. HUCHANI CAHUANA RICHARD J. Página 5

Función en el dominio del tiempo

Función en el dominio de la frecuencia

Page 6: Proyecto de 1016

[analisis espectrales de la voz] ETN - 1016

o almacenarlos.

Donde para el caso de la cuantificación tanto expansión como en comprensión se utiliza la ley miu

Con la función:

Hist(y);

UNIV. HUCHANI CAHUANA RICHARD J. Página 6

Page 7: Proyecto de 1016

[analisis espectrales de la voz] ETN - 1016

Donde es un histograma q codifica la señal, En niveles de voltaje.

Para la cuantificación final se corrigió el error de cuantificación y con un intervalo de cuantificación de 0.1.

UNIV. HUCHANI CAHUANA RICHARD J. Página 7

Proceso de digitalización mediante la cuantificación

Page 8: Proyecto de 1016

[analisis espectrales de la voz] ETN - 1016

CONCLUSION:

- La señal de voz esta entre los 200 y 3000 [Hz], en nuestro caso es de 2634 el ancho de banda, razonable para una voz grave.

- En la cuantización, disminuir los intervalos o niveles de cuantización proporcional un error de cuantización mas bajo. El error disminuye porque los espacios entre los niveles de cuantización son menores, por tanto serán menores los números redondeados al nivel de cuantización mas cercano

.

UNIV. HUCHANI CAHUANA RICHARD J. Página 8