UNIVERSIDAD DE GUANAJUATO - telin.ugent.beafriasve/Thesis Andres Frias.pdf · Fig. 1.2 (b)...

UNIVERSIDAD DE GUANAJUATO Facultad de Ingeniería Mecánica Eléctrica y Electrónica “Efectos de longitud finita de palabra en filtros digitales adaptivos” TESIS PRFESIONAL QUE PARA OBTENER EL TÍTULO DE: INGENIERO EN COMUNICACIONES Y ELECTRÓNICA PRESENTA: ANDRÉS FRÍAS VELÁZQUEZ ASESOR: DR. RENÉ DE J. ROMERO TRONCOSO SALAMANCA, GTO. SEPTIEMBRE DE 2005

“La ciencia no puede resolver el misterio último que guarda la naturaleza debido a que nosotros mismos formamos parte de ese misterio”

Max Planck

Agradecimientos A Dios, por concederme su amor y su gracia

A mis padres, por su cariño, esfuerzo y enseñanzas de vida A mi mamá María y papá Chucho, por ser mis ángeles de la guarda A mis hermanos Irene, Avelina y Juan, por su eterna amistad y cariño A mis abuelos Petra y Antonio, por su respaldo y bendiciones A mis tíos Mario e Isabel, por su apoyo y ejemplo

A mis tíos Martha e Israel, por ayudarme a superarme A Tere, porque me enseñaste la humildad y la caridad A Chiquis, porque me enseñaste la rectitud y me brindas tu cariño A mis tíos Chano y Luzma, por su apoyo y afecto

A mi asesor René de Jesús, por sus sabios consejos y forjarme íntegramente como estudiante

A los doctores Oscar y Amparo, por su amistad y apoyo incondicional

A mis amigos, Alejandro, Gustavo, Sergio, Alberto R., Anayansi, Mary Helena, Chucho, Ordaz, Vite, Cabal, Diana, Ale U., Aurora, Maribel, Chabe, Carolina, Almendra, Agustín, Mata, Luis, Alberto, Carlos Santiago, etc.,etc., así como a todos mis amigos de CEM-UFEC, mi más profundo respeto y agradecimiento.

i

Contenido Contenido . . . . . . . . . . . . . . . . . . . . . . . . i Lista de Figuras . . . . . . . . . . . . . . . . . . . . . iii Lista de Tablas . . . . . . . . . . . . . . . . . . . . . . iv Nomenclatura . . . . . . . . . . . . . . . . . . . . . . v

1 Introducción al Filtrado Adaptivo 1

1.1 Introducción . . . . . . . . . . . . . . . . . . . . 1

1.1.1 Objetivos . . . . . . . . . . . . . . . . . . 2

1.1.2 Justificación . . . . . . . . . . . . . . . . . 3

1.2 Introducción al Filtrado Adaptivo . . . . . . . . . . 5

1.2.1 Algoritmos Adaptivos . . . . . . . . . . . . . . 7

1.2.2 Aplicaciones . . . . . . . . . . . . . . . . . 10

1.3 Fundamentos de Filtrado Adaptivo . . . . . . . . . . 15

1.3.1 Clasificación de Señales . . . . . . . . . . . . . 15

1.3.2 Procesos Estocásticos . . . . . . . . . . . . . . 16

1.3.3 Parámetros Estadísticos . . . . . . . . . . . . . 19

1.3.4 Ergodicidad . . . . . . . . . . . . . . . . . 21

1.3.5 Densidad de Potencia Espectral . . . . . . . . . . 21

1.3.6 Matriz de Correlación . . . . . . . . . . . . . . 22

1.4 Filtro Wiener . . . . . . . . . . . . . . . . . . . 23

1.5 Filtro LMS . . . . . . . . . . . . . . . . . . . . 26

1.6 Efectos de Palabra Finita . . . . . . . . . . . . . . 28

1.6.1 Modelo de Ruido de Cuantización . . . . . . . . . 30

Contenido ii

2 Modelo Matemático 34

2.1 Filtro LMS implementado con aritmética de punto fijo . 34

2.2 Modelo de comportamiento transitorio y estado estable . 36

2.3 Análisis de Estabilidad . . . . . . . . . . . . . . . 46

3 Simulaciones 56

3.1 Procedimiento de Simulación . . . . . . . . . . . . 56

3.2 Simulaciones . . . . . . . . . . . . . . . . . . . 57

4 Conclusiones 62

4.1 Conclusiones . . . . . . . . . . . . . . . . . . . 62

4.2 Perspectivas de investigación futura . . . . . . . . . 63

4.3 Aprendizaje . . . . . . . . . . . . . . . . . . . 63

Referencias . . . . . . . . . . . . . . . . . . . . . . . . 64

iii

Lista de Figuras Fig. 1.1 Configuración general de un filtro adaptivo . . . . . . . . . . 6

Fig. 1.2 (a) Estructura transversal IIR de 4to. orden . . . . . . . . . 6

Fig. 1.2 (b) Estructura canónica directa IIR de 3er. orden . . . . . . . 7

Fig. 1.3 Configuración de modelado . . . . . . . . . . . . . . . 10

Fig. 1.4 Configuración de modelado inverso . . . . . . . . . . . . . 11

Fig. 1.5 Configuración de predicción lineal . . . . . . . . . . . . 12

Fig. 1.6 Configuración de cancelación de interferencia . . . . . . . . . 14

Fig. 1.7 Modelo probabilístico de ruido blanco . . . . . . . . . . . . 16

Fig. 1.8 Realización del proceso ( )N m . . . . . . . . . . . . . . 17

Fig. 1.9 Estructura de filtro LMS . . . . . . . . . . . . . . . . 27

Fig. 1.10 Formato numérico de punto fijo . . . . . . . . . . . . . . 28

Fig. 1.11 Modelo de proceso de cuantización . . . . . . . . . . . . . 28

Fig. 1.12 Proceso de truncamiento . . . . . . . . . . . . . . . . 29

Fig. 1.13 Modelo estadístico de cuantización . . . . . . . . . . . . . 29

Fig. 1.14 Distribución de error para truncamiento complemento a dos . . . 30

Fig. 1.15 Distribución de error para redondeo . . . . . . . . . . . . 31

Fig. 1.16 Distribución resultante de la diferencia de dos dist. uniformes . . . 32

Fig. 2.1 Algoritmo LMS de precisión finita para configuración de identifica-

ción de sistemas . . . . . . . . . . . . . . . . . . . . 33

Fig. 2.2 (a) Gráfica de sensitividad 2x

ESσ

. . . . . . . . . . . . . . 48

Fig. 2.2 (b) Comparación de (2.87) con varias aproximaciones de (2.89) . . 48

Fig. 2.3 Variación del RMSE al aumentar ν . . . . . . . . . . . 50

Fig. 3.1 C.A. comparativa utilizando (a) redondeo (b) truncamiento . . . 56

Fig. 3.2 C.A. comparativa con 7db = y 11cb = para (a) redondeo (b) trunca-

miento . . . . . . . . . . . . . . . . . . . . . . . 58

Fig. 3.3 C.A. comparativa cuando 2 6 5γ = − para (a) redondeo (b) trunca-

miento . . . . . . . . . . . . . . . . . . . . . . . 59

iv

Lista de Tablas Tabla 2.1 Primer y segundo momento de distribuciones cuantizadas . . . . 34

Tabla 2.2 Límites lineales con ν grados de libertad . . . . . . . . . . 50

Tabla 2.3 Rangos de operación propuestos por varios autores . . . . . . . 53

Tabla 3.1 Comparación de error de estado estable para ambos casos de cuanti-

zación . . . . . . . . . . . . . . . . . . . . . . . 57

Tabla 3.2 Exceso de kurtosis para varias distribuciones . . . . . . . . . 59

v

Nomenclatura

cb . . . . . . . . . . . . Número de bits de cuantizador de coeficientes

db . . . . . . . . . . . Número de bits de cauntizador de datos

( )d k . . . . . . . . . . Señal deseada

[ ]diag x . . . . . . . . . Matriz diagonal

E . . . . . . . . . . . . Exceso de error de estado estable

( )e k . . . . . . . . . . . Señal error

( )oe k . . . . . . . . . . Señal de error óptimo

[ ]E ⋅ . . . . . . . . . . . Función valor esperado

2γ . . . . . . . . . . . Exceso de kurtosis

( )d kη . . . . . . . . . . Señal de ruido de cuantización de la señal deseada

( )e kη . . . . . . . . . . Señal de ruido de cuantización de la señal error

( )kuη . . . . . . . . . . Ruido de cuantización del término de actualización

( )y kη . . . . . . . . . . Señal de ruido de cuantización de la señal de salida

I . . . . . . . . . . . . Matriz identidad

( )kK . . . . . . . . . . Matriz de correlación del vector de error ponderado

Λ . . . . . . . . . . . . Matriz de eigenvalores

λ . . . . . . . . . . . . Eigenvalor

µ . . . . . . . . . . . . Factor de convergencia

uµ . . . . . . . . . . . Media estadística del vector de ruido de actualización

( )kvµ . . . . . . . . . . Valor esperado del vector de error ponderado

N . . . . . . . . . . . Orden de filtro

( )n k . . . . . . . . . . . Ruido de medición

Nomenclatura vi

vn . . . . . . . . . . . . Límite lineal con ν grados de libertad

ν . . . . . . . . . . . Grados de libertad

p . . . . . . . . . . . . Vector de correlación cruzada

Q . . . . . . . . . . . . Matriz de eigenvectores

R . . . . . . . . . . . . Matriz de correlación 2eσ . . . . . . . . . . . Varianza del ruido de la señal error

2nσ . . . . . . . . . . . Varianza del ruido de medición

2xσ . . . . . . . . . . . Varianza de la señal de entrada

2x

ESσ

. . . . . . . . . . . Sensitividad

tr[ ]⋅ . . . . . . . . . . . Función traza

( )u k . . . . . . . . . . . Función escalón

( )kv . . . . . . . . . . Vector de error ponderado

( )kw . . . . . . . . . . Vector ponderado

ow . . . . . . . . . . . Vector de coeficientes

( )x k . . . . . . . . . . . Señal de entrada

minξ . . . . . . . . . . . Error mínimo cuadrático

( )kξ . . . . . . . . . . Error medio cuadrático

( )y k . . . . . . . . . . Señal de salida

{}⋅Z . . . . . . . . . . Transformada z

{}1− ⋅Z . . . . . . . . . . Transformada z inversa

1

Capítulo 1

Introducción al Filtrado Adaptivo

"El hombre encuentra a Dios detrás de cada puerta que la ciencia logra abrir"

-Albert Einstein-

1.1 Introducción

En un mundo en el que la tecnología cada vez más forma parte del estilo de vida de

una persona y crea una sociedad más sofisticada, es poco probable no haber escuchado o

leído acerca de las señales que están presentes en los dispositivos que utilizamos

diariamente, como las señales de música en un reproductor de disco compacto, voz en un

teléfono celular, video en una televisión, por mencionar algunos ejemplos. La mayoría de

estas señales son generadas por medios naturales donde las variables que determinan

dichas señales suelen ser tiempo, distancia, posición, temperatura, presión etc., y que

generalmente son transformadas a señales eléctricas para su procesamiento. Sin embargo,

algunas de estas señales pueden también ser sintetizadas por otros medios como la

simulación por computadora.

Una señal inherentemente contiene información acerca de la entidad o fenómeno que

generó dicha señal, por lo que el procesamiento de señales tiene como objetivo la extracción

de esta información. Como resultado de lo anterior, podemos definir en forma general que

el procesamiento de señales se ocupa de la interpretación matemática de las señales y del

desarrollo de algoritmos para la extracción de la información contenida en ellas.

De acuerdo a la forma de implementarse, el procesamiento de señales puede ser

analógico ó digital, el primero está basado fundamentalmente en resistores, capacitores y

Universidad de Guanajuato Facultad de Ingeniería Mecánica Eléctrica y Electrónica

Capítulo 1: Introducción al Filtrado Adaptivo 2

amplificadores operacionales, los cuales manipulan la señal en el dominio natural en la que

ésta es generada (analógico); mientras que en el procesamiento digital las señales requieren

ser muestreadas para transformarse a tiempo discreto, y mediante convertidores A/D

obtener la señal digital, posteriormente se procesa la información mediante

microprocesadores, los cuales enviarán los resultados hacia otro convertidor encargado de

que la señal resultante sea transformada a tiempo continuo nuevamente.

Debido principalmente a que el procesamiento analógico es muy susceptible al ruido,

temperatura, y robusto para aplicaciones serias, es por lo que el procesamiento digital ha

ganado terreno. En los últimos 30 años, el procesamiento digital de señales ha sido uno de

los campos que más ha prosperado a la par con el desarrollo de circuitos digitales, cuestión

que ha permitido la implementación de algoritmos complejos en un sinnúmero de sistemas

aplicables que abarcan desde electrodomésticos hasta instrumentos aeroespaciales. La

sinergia resultante de estos dos campos ha dado pie a que se produzcan sistemas más con-

fiables, precisos, flexibles y de tamaño reducido.

Actualmente existe una gran variedad de dispositivos mediante los cuales se puede

efectuar el procesamiento digital de señales, el de uso más común es el llamado DSP

(Digital Signal Processor), el cual es un tipo de microprocesador que tiene la capacidad de

realizar operaciones compuestas como la multiplicación y suma en un solo ciclo de máquina

además de poder simularse y desempeñarse en tiempo real con un bajo consumo de

potencia. Por otro lado, existen otros sistemas que realizan funciones similares a un DSP,

pero que varían en la flexibilidad, confiabilidad, costo, consumo de potencia y desempeño.

Un ejemplo de ello son los FPGAs (Field Programmable Gate Arrays) que tienen como

principal arma la capacidad de ser reconfigurables y ofrecer un mejor desempeño en

funciones específicas. Sin embargo, los FPGAs son significativamente más caros y

típicamente disipan mayor potencia que los DSPs. Otra opción a considerar son los ASICs

(Application-Specific ICs) los cuales su desempeño es superior en comparación a los casos

anteriores, además tienen una alta eficiencia de potencia, su principal desventaja es que su

flexibilidad es nula pues no son programables, y el tiempo de salida al mercado del chip es

mayor. En contraste con los ASICs, los microprocesadores de propósito general no son

utilizados en aplicaciones serias pues no tienen la capacidad de procesar en tiempo real,

además de que el consumo de potencia es mucho mayor; a pesar de estas desventajas

pueden utilizarse en aplicaciones simples.

Una de las principales operaciones que se realiza en el procesamiento de señales es el

filtrado, el cual tiene como objetivo manipular las señales para obtener la información

contenida en éstas; tradicionalmente, los filtros son utilizados para dejar pasar ciertas

frecuencias y suprimir lo más posible aquellas que sean indeseables.



Un filtro digital es aquél que puede procesar señales en tiempo discreto

representadas en un formato digital. Los filtros digitales más comunes son los que sus

parámetros y estructura del filtro son fijos, esto significa que son invariantes con el tiempo.

Cuando los parámetros fijos de un filtro no son conocidos o las especificaciones de un filtro

no son satisfechas por los filtros invariantes en el tiempo se utiliza el llamado filtrado

adaptivo. Los filtros adaptivos son variantes con el tiempo porque sus parámetros están

cambiando continuamente hasta obtener el desempeño deseado.

El hecho de que los parámetros de un filtro estén representados en un formato

digital, implica que se generen errores con respecto al diseño teórico de un filtro, los cuales

pueden afectar desde una forma mínima en el desempeño, cambiar drásticamente la

respuesta en frecuencia del filtro diseñado, o hasta convertirlo en un oscilador. De esta

manera, es indispensable tomar en cuenta estos errores en la implementación de cualquier

filtro, llamados también como efectos de palabra finita.

1.1.1 Objetivos

Un modelo matemático para el análisis de los efectos de palabra finita de la curva

de aprendizaje del algoritmo LMS (Least Mean Squares) es presentado en este trabajo.

Tomar en consideración los efectos de palabra finita en el diseño de un filtro adaptivo LMS

es un aspecto indudablemente importante al momento de la implementación, ya que dichos

efectos pueden repercutir seriamente en las variables que miden el desempeño transitorio y

de estado estable del filtro, tal como la rapidez de convergencia y el desajuste

respectivamente. Existen diversos trabajos relacionados a este tema que han permitido

analizar los errores de precisión finita deacuerdo a distintos criterios como el modelo de

cuantización del algoritmo, entorno estacionario o no estacionario, análisis transitorio o de

estado estable, tipo de entrada, tipo de cuantización etc.; sin embargo, al momento de

diseñar es indispensable tener un panorama completo del sistema bajo la unificación de

condiciones y criterios de todo el análisis. El modelo matemático propuesto en este trabajo

permite analizar la curva de aprendizaje (C.A.) con los efectos de precisión finita

asumiendo que la señal de entrada es estacionaria en el sentido amplio, real, media cero, y

los elementos del vector de entrada son mutualmente independientes, así mismo el análisis

contempla la cuantización por redondeo y truncamiento complemento a dos. Simulaciones

realizadas en Matlab confirman la validez del modelo matemático propuesto, y sus

ecuaciones permiten realizar un diseño confiable del filtro considerando los efectos de

palabra finita.



1.1.2 Justificación

Actualmente las necesidades comerciales demandan aplicaciones tecnológicas cada vez

más rápidas y precisas, llevando al límite la capacidad de los sistemas; un ejemplo de ello

son los sistemas de posicionamiento global, en los cuales el procesamiento en tiempo real y

la alta precisión son vitales para un buen desempeño del sistema. En el caso del algoritmo

LMS, éste es implementado generalmente con aritmética de punto fijo, cuestión que genera

inherentemente efectos que ponen en detrimento la rapidez de convergencia y estabilidad

del filtro, así mismo el exceso de error medio cuadrático puede resultar mucho mayor que

el estimado por el análisis de precisión infinita.

Existen diversos trabajos relacionados a este tema que han permitido analizar los

efectos de palabra finita de forma satisfactoria en relación a los resultados prácticos

obtenidos; sin embargo, la complejidad del análisis obliga a limitar el problema a ciertas

condiciones tales como, tipo de señal de entrada, cuantización, aplicación, entre otras. El

sinnúmero de variables involucradas hace difícil formular un modelo genérico para el

análisis de los efectos finitos de palabra del algoritmo LMS; a pesar de esto, un intento de

lo anterior acotado para el análisis de estado estable fue propuesto por Yousef y Sayed [1].

Por otro lado, en la mayoría de los análisis propuestos se considera un buen referente hacer

uso del típico problema de identificación de sistemas como base para integrar un modelo

estadístico de los errores de cuantización. Andrews y Fitch [2] se enfocan en analizar los

efectos de convergencia generados por la cuantización sufrida en la ecuación de

actualización del filtro para el caso de redondeo y truncamiento complemento a dos. Diniz

[3] presenta un modelo estadístico práctico para el cálculo del error de estado estable para

entradas gaussianas estacionarias; mientras que Seara et al. [4] proponen un modelo

estadístico mejorado que enfatiza en el problema referente al fenómeno conocido como

“stopping”, así mismo Gupta y Hero III [5] analizan el comportamiento transitorio del

mismo fenómeno, pero bajo otra concepción referida como “frenado”(slowdown) .

En este trabajo se analiza el comportamiento transitorio y de estado estable de forma

conjunta incorporando los efectos de cuantización por truncamiento y redondeo, se asume

que la señal de entrada es estacionaria en el sentido amplio, real, media cero, y los

elementos del vector de entrada son mutualmente independientes. Una de las principales

aportaciones de este trabajo es que, no solo se analizan los efectos cuando la entrada es

gaussiana sino también cuando la distribución no es mesokurtica, esto significa que el

exceso kurtosis de la señal de entrada es diferente de cero, de esta manera se puede

predecir el comportamiento del algoritmo cuando no se cuenta con un filtro para el

preprocesamiento de la señal de entrada. Otro resultado importante es el análisis de

estabilidad del filtro el cual mediante un análisis de sensitividad del exceso de MSE

permite un mejor entendimiento de las restricciones del factor de convergencia.



1.2 Introducción al Filtrado Adaptivo

En la actualidad el filtrado adaptivo se ha convertido en una herramienta muy útil

en aplicaciones, principalmente en áreas como control, instrumentación, procesamiento de

imágenes y telecomunicaciones. La característica que fundamenta el filtrado adaptivo es la

capacidad de autoajustar su desempeño, esto significa que si se aplica a la entrada del

filtro una señal que está variando constantemente, el sistema se adaptará en relación a los

cambios que presenta la misma. Como introducción a este tema se había mencionado que

los filtros adaptivos eran variantes en el tiempo, y que a diferencia de los filtros fijos, los

coeficientes de un filtro adaptivo están variando o autodiseñándose constantemente para

ajustarse al desempeño deseado, al inferir lo anterior es obvio que el análisis de este tipo de

filtros es más complejo que los fijos.

La configuración básica de un filtro adaptivo es mostrada en la Fig. 1.1, en donde k

es el número de iteración, x(k) la señal de entrada, )(ky la señal de salida del filtro

adaptivo, )(kd define la señal deseada y la señal error )(ke es calculada como )()( kykd − .

La función error es la que determina el desempeño del filtro adaptivo, y que sirve como

base en el algoritmo adaptivo para actualizar el filtro hasta que cumpla un criterio de

minimización. La especificación completa de un sistema adaptivo, está formada por tres

partes [3]:

1) Estructura del Filtro Adaptivo: El filtro adaptivo puede ser implementado en un

número diferente de estructuras o realizaciones. La elección de un tipo de estructura

puede influir en la complejidad computacional (cantidad de operaciones aritméticas

por iteración) del proceso y del número de iteraciones necesarias para lograr el nivel

deseado de desempeño. Básicamente, hay dos principales clases de realizaciones para

filtros digitales adaptivos, filtros de respuesta finita al impulso (FIR, Finite Impulse Response) y filtros de respuesta infinita al impulso (IIR, Infinite Impulse Response). La realización FIR utilizada más comúnmente, es la estructura de filtro transversal

(Fig. 1.2(a)), la cual es una realización directa de la función de transferencia, que

tiene como principal característica el que no tiene lazo de retroalimentación. En el

caso de las realizaciones de los filtros IIR, la estructura más común es la forma

canónica directa (Fig. 1.2(b)), debido a su simple implementación y análisis. Sin

embargo, existen problemas inherentes a los filtros recursivos que tienen origen en

su estructura, como lo pueden ser la inestabilidad de los polos del filtro y la rapidez

de convergencia. Estos problemas han sido resueltos mediante otras estructuras que

intentan aminorar o eliminar las limitaciones de la realización de forma directa, tal

como la estructura en cascada, de red, y la paralela.



2) Algoritmo: El algoritmo es el procedimiento usado para ajustar los coeficientes del

filtro mediante un criterio establecido. El algoritmo es definido en función del

método de búsqueda utilizado para lograr la minimización de la señal error.

3) Aplicación: El tipo de aplicación es definido por la clase de señales que son

adquiridas, y por la configuración típica del sistema adaptable. Algunos ejemplos de

estas configuraciones son la cancelación de eco, igualación de canal dispersivo,

identificación de sistemas, cancelación de ruido, y control.

Fig. 1.1 Configuración General de un Filtro Adaptivo.

(a)



(b)

Fig. 1.2 (a) Estructura transversal FIR de 4to. orden.

(b) Estructura canónica directa IIR de 3er. orden.

1.2.1 Algoritmos Adaptivos

La palabra adaptación tiende a ser un término muy común en la naturaleza, así

como en el quehacer diario del hombre, pues constantemente estamos sometidos a variables

que hacen ajustarnos a las necesidades de nuestro entorno; la forma en realizar ese ajuste

es lo que podríamos llamar un algoritmo adaptivo.

Para desarrollar un algoritmo adaptivo es necesario generar una función objetivo, la

cual nos indique la variable de interés que desea ser minimizada, así como las variables que

intervienen en el proceso; en forma general la función objetivo se denota de la siguiente

manera [ ] [ ])(),(),()( kdkykxFkeFF == . Dicha función tiene que cumplir con ciertas

propiedades [3]:

1) No negatividad: [ ] 0)( ≥keF

2) Optimación: [ ] 0)( =keF

Existen diversas funciones que satisfacen dichas propiedades, sin embargo, utilizar

funciones muy complejas inevitablemente hace que el análisis sea más difícil así como su

implementación; debido a lo anterior es que generalmente se utilizan funciones elevadas al



cuadrado en conjunto con algún promedio estadístico. Las funciones que se utilizan con

mayor frecuencia se describen a continuación [3]:

• Error Medio Cuadrático (MSE, Mean Square Error): ]|)([|)]([ 2keEkeF = ;

• Mínimos Cuadrados (LS, Least Squares): ∑=−

+k

iike

k 0

2)(1

1;

• Mínimos Cuadrados Ponderados (WLS,Weighted Least Squares):

∑=−=

k

ii kekeF

0

2)1()]([ λ , donde λ es una constante menor a 1.

• Valor Cuadrático Instantáneo (ISV, Instantaneous Squared Values): 2)()]([ kekeF = .

Además de las diferencias en cuanto a complejidad, cada una de las funciones

anteriores difiere en convergencia, suceptibilidad al ruido, rapidez de cálculo etc., que hace

que uno u otro sea más adecuado para cierta aplicación.

La variable de mayor interés dentro de un proceso adaptivo es la señal de error, esto se

hace evidente ya que está presente en todas las funciones descritas arriba. Como se

mencionó anteriormente, el error se genera de la diferencia de una señal de referencia y la

salida del filtro adaptivo.

Hasta ahora se han definido en forma general las propiedades de un algoritmo adaptivo,

así como los criterios de minimización más comunes; sin embargo, una tarea importante en

el filtrado adaptivo es llevar al sistema a un estado óptimo, a dicho estado se le conoce

como solución óptima de Wiener, la cual es derivada de las ecuaciones Wiener-Hopf que se

detallarán más adelante. Para obtener la solución óptima de Wiener se requiere la

inversión de una matriz, cuestión que hace poco probable su implementación práctica

mediante esta concepción; sin embargo, existen métodos de optimización que

recursivamente minimizan la función objetivo y que pueden implementarse sin ningún

problema, también llamados comúnmente como métodos de búsqueda.

Los métodos de optimización más comunes son los siguientes:

• Método steepest-descent: En este método se asume que la función objetivo es

convexa, el algoritmo inicia en un punto arbitrario y realiza pequeños cambios en la

dirección en que la función objetivo disminuye más rápidamente, de tal manera que

en cada iteración se acerca más al punto mínimo de la superficie convexa, en ese

punto se habrá minimizado la función objetivo y obtenido la solución óptima de

Wiener. A continuación se muestra la ecuación de actualización de filtro utilizando

este método:

(1.1) )]([)()1( kekk k∇−=+ µww



donde µ es el factor que controla la convergencia del algoritmo y ∇ es el operador

gradiente definido por el siguiente vector:

(1.2)

• Método de Newton: Este método es similar al anterior solo que en lugar que el

gradiente apunte hacia la dirección en que se minimiza la función objetivo, el

gradiente es rotado para que apunte hacia la dirección a la que se encuentra la

solución óptima. La ecuación de actualización este método es la siguiente:

(1.3)

La ecuación es muy similar a la del método steepest-descent, solo que el

gradiente está multiplicado por la inversa de una matriz llamada matriz de correlación la cual será explicada a detalle más adelante. El producto )]([1 kek∇−R hace que el gradiente sea rotado hacia la dirección de la solución óptima, y por

consecuencia la convergencia hacia ese punto es más rápida que para el caso

anterior.

• Métodos Quasi-Newton: Estos algoritmos son una versión simplificada del método

Newton, ya que intentan estimar por diversos medios la inversa de la matriz de

correlación. El compromiso de estos algoritmos es de que sean prácticos en la

implementación, así como rápidos para converger; sin embargo, existen problemas

de inestabilidad asociados al estimar la matriz de correlación, debido a que dichas

estimaciones son obtenidas por medios iterativos.

(1.4)

donde 1ˆ −= R)S(k , de tal manera que 1R)S( −

∞→=k

klim .

Una forma más didáctica de entender todo lo que se ha explicado en esta

sección sería cuando tratamos de mantener una escoba en equilibrio sostenida por la

palma de una mano, nuestra función objetivo se basaría en el criterio de mantener

la escoba en una posición vertical, la función error se produciría en relación al

ángulo generado con la vertical, mientras quien sostiene la escoba trata de que la

ésta llegue al punto de equilibrio (solución de Wiener) mediante pequeños

desplazamientos de la palma.

)]([)()1( kekkk k∇−=+ )S(ww µ

)]([)()1( 1 kekk k∇−=+ −Rww µ

T

Nwww ⎥⎦

⎤⎢⎣

⎡∂∂

∂∂

∂∂

=∇−10 1



1.2.2 Aplicaciones

En diversos textos relacionados sobre filtrado adaptivo se exponen un sinnúmero de

aplicaciones donde puede ser utilizado este tipo de filtrado, sin embargo, cada aplicación

puede ser clasificada dentro de cuatro clases básicas como es sugerido en [6]: Modelado, Modelado Inverso, Predicción Lineal y Cancelación de Interferencia.

Modelado El modelado es uno de los casos típicos en el que se utiliza el filtrado adaptivo,

debido a que es una forma básica en la que se puede comprender el análisis y las

implicaciones de este tipo de filtrado. La configuración de este sistema se muestra en la

Fig. 1.3. Como el nombre lo sugiere, el objetivo de las aplicaciones que están dentro de

esta clasificación, es estimar un modelo de la función de transferencia de un sistema el cual

se tiene muy poca información de forma a priori. De acuerdo a la figura, )(zH representa

la función de transferencia del sistema desconocido, )(zW representa el filtro que

constantemente se esta actualizando hasta que alcanza un valor óptimo. La diferencia de

las señales filtradas genera la señal error, la cual es utilizada para actualizar )(zW .

+-

x(k)

d(k)

e(k)

y(k)

( )G z

( )W z

Fig. 1.3 Configuración de Modelado.

Una de las principales aplicaciones en que se utiliza este modelo, es el llamado

identificación de sistemas, que hace exactamente lo que se describió arriba. Esta aplicación

es muy utilizada dentro del área de control, pues a veces los sistemas que se desean

controlar están compuestos por muchas variables determinísticas y aleatorias, que hacen

casi una tarea imposible modelar matemáticamente dicho sistema. Gracias al filtrado

adaptivo se puede estimar dicha caja negra y se puede diseñar un esquema de control de

lazo cerrado.



Uno de los temas de investigación aún vigentes dentro del campo de comunicaciones

es la igualación de canal, el objeto de esta investigación se centra en eliminar los efectos

producidos por un canal (cable, fibra óptica, enlace inalámbrico) al transmitir datos por

este medio. Un canal puede ser modelado en forma práctica como una caja negra, debido a

que las condiciones del canal pueden intervenir un sinnúmero de factores que no solo

dependen del material que sirve como medio físico, sino también de las condiciones

externas a las que está sometido. Al poder estimarse la función de transferencia del canal

mediante el filtrado adaptivo, se puede obtener la inversa de dicha función (igualación de

canal) y aplicarse a los datos recibidos. Cabe aclarar que estrictamente hablando, a esta

aplicación se le denomina identificación de canal, pues en realidad lo que se logra estimar

es la función de transferencia del canal y no su inversa, ya que la inversa se obtiene en

forma independiente del filtro adaptivo.

Otra aplicación importante dentro de las comunicaciones es la cancelación de eco.

Dicho fenómeno es producido básicamente por un desacoplamiento de impedancias en la

línea telefónica, esto produce que la calidad del enlace sea pobre y sea difícil entablar

comunicaciones a larga distancia. El filtrado adaptivo es utilizado para estimar la señal de

eco, la cual posteriormente es utilizada para eliminarla de la señal recibida.

Modelado Inverso

El funcionamiento de esta clase de filtrado adaptivo es muy similar al de modelado,

solo que las señales de entrada del filtro son conceptualizadas de manera diferente, esto con

el objetivo de que las salidas del filtro puedan ser utilizadas activamente dentro de un

proceso. En comparación con el caso anterior donde el principal objetivo era obtener la

función de transferencia de una planta desconocida, en este caso se busca encontrar la

inversa de dicha función. En la Fig. 1.4 se muestra el modelo básico de esta clase de

filtrado, en el cual se puede ver que la señal de entrada del filtro )(zW es precisamente la

salida generada por la planta desconocida )(zG , mientras que la señal deseada es una

versión retrasada de la señal de entrada de la planta desconocida.

Fig. 1.4 Configuración de Modelado Inverso.



Este tipo de modelo es referido frecuentemente como igualador de canal, pues en

comparación con el sistema de identificación de canal descrito anteriormente, este filtro

obtiene directamente la inversa del canal, esto se debe a que en la señal deseada se

encuentra una secuencia de símbolos de entrenamiento los cuales igualmente son enviados

por el emisor a través del canal, la señal recibida por el receptor se introduce al filtro

adaptivo, y su salida es comparada con los símbolos de entrenamiento, de tal forma que el

error generado es utilizado para actualizar los coeficientes del filtro hasta que el error sea

mínimo, al llegar a este punto, el lazo de la señal de error se abre terminando así el proceso

de entrenamiento y se empiezan a enviar datos los cuales son recuperados a la salida del

filtro adaptivo y procesados con algún criterio de decisión. Este tipo de filtrado es utilizado

comúnmente en módems y sistemas inalámbricos de comunicación.

Otra aplicación de este modelo es utilizado en el área de control, pues es común

encontrar que un planta tenga ciertas características no ideales, las cuales pueden afectar

en el tiempo de respuesta y estabilidad del sistema de control. Este problema puede ser

resuelto haciendo uso de este tipo de filtrado para autodiseñar un compensador que

aminore dichas características no ideales.

Predicción Lineal

Para realizar cualquier tipo de predicción ya sea climática, económica, tecnológica,

social etc., es necesario tener información previa del fenómeno que lo origina, de tal manera

que evaluando dicha información podamos predecir con cierto grado de confiabilidad un

evento. Este mismo criterio se utiliza en diversas aplicaciones que utilizan el filtrado

adaptivo como modelo de predicción lineal. La estructura del filtro se muestra en la Fig.

1.5. A diferencia de los casos anteriores, aquí la señal deseada es tomada directamente de

la entrada del proceso sin ser manipulada, mientras que la señal que entra al filtro )(zW

son valores anteriores de la misma entrada del proceso; dichos valores anteriores

representan la información previa y mediante el error generado se puede sintonizar el filtro

para que actúe como predictor.

Fig. 1.5 Configuración de Predicción Lineal.



Una aplicación muy importante dentro del procesamiento y transmisión de voz e

imagen, es la codificación de predicción lineal, la cual permite codificar dichas señales a su

representación digital con el menor número de bits posibles, de esta manera se puede

transmitir de forma más rápida la información esencial de una señal de voz e imagen. Para

recuperar la información transmitida, se envían también los coeficientes del filtro adaptivo,

los cuales servirán para que el receptor pueda decodificar la información.

Una de las características importantes que son necesarias para realizar la predicción

lineal, es que los valores generados en una señal estén correlacionados con ellos mismos.

Esta propiedad permite que cuando una señal está compuesta por dos señales y una de

ellas sus valores presentes y pasados están correlacionados y en la otra no, se pueda

obtener la separación de cada una de ellas mediante un esquema de predicción lineal; a

este tipo de aplicación se le conoce como incrementador de línea adaptivo. Se le conoce así

porque la mayoría de las señales que son de espectro estrecho sus valores están

correlacionados, y por lo tanto las señales pueden ser separadas por el predictor lineal,

mientras que las señales de espectro amplio precisamente debido a su dispersión en

frecuencia es poco probable que sus valores estén correlacionados, y en consecuencia son

suprimidos por el predictor. Un ejemplo claro de esta aplicación es cuando se desea

eliminar el ruido de 60Hz en un electrocardiograma, donde la señal de 60Hz es la señal de

espectro estrecho y la del electrocardiograma la de espectro amplio, de tal manera que la

señal error contiene precisamente la señal del electrocardiograma sin el ruido del 60Hz.

El esquema de predicción lineal es también utilizado ampliamente para estimar la

densidad de potencia espectral, la cual refleja el contenido espectral de un proceso

estocástico en función de la frecuencia, la estimación se realiza utilizando el modelo de

autoregresión el cual puede verse más a detalle en [6].

Cancelación de Interferencia

En la mayoría de los sistemas electrónicos se producen distintos tipos de ruidos así

como interferencias, algunos de estos ruidos resultan difíciles poder eliminarse por medio de

técnicas de filtrado fijo, es por eso que se recurre al filtrado adaptivo. El principio que se

utiliza para realizar la cancelación de interferencia se basa en que la señal de interferencia

(obtenida de forma independiente de la señal deseada) es utilizada como referencia, la cual

sirve de entrada para el filtro adaptivo, posteriormente este último intentará estimar la

interferencia contenida en la señal deseada. La señal deseada se le conoce también como

entrada primaria, la cual esta compuesta por la señal útil y la interferencia, de tal suerte

que cuando se resta la señal deseada de la interferencia estimada por el filtro adaptivo, se

obtendrá la señal útil sin la interferencia. El modelo de este esquema de filtrado se muestra

en la Fig. 1.6.



Fig. 1.6 Configuración de Cancelación de Interferencia.

Una forma práctica de ver este modelo es cuando en la entrada primaria tenemos un

micrófono en el cual evidentemente la voz se mezcla con ruido debido al dispositivo, al

ambiente y el eco generado por la bocina. La señal de referencia se utiliza para captar

todas estas interferencias y estimar por medio del filtro adaptivo la interferencia contenida

en la señal deseada, posteriormente cuando el filtro converge a una solución óptima, la

diferencia de ambas señales interfiere destructivamente del tal manera que solo sobrevive

la señal útil.

Una aplicación muy específica de este modelo de filtrado, es control activo de ruido,

el cual es utilizado principalmente en sistemas de ventilación y ductos. El sistema está

compuesto por un micrófono el cual capta la señal de ruido, la cual es utilizada como señal

de referencia, también se instala una bocina cerca de la fuente de ruido la cual está

conectada a la salida del filtro adaptivo y obviamente de un DAC (Digital-Analog

Coverter); delante de donde fue instalada la bocina se coloca otro micrófono el cual hace la

función de receptor de la señal error del sistema. El sistema funciona de la siguiente

manera, primero se capta la señal de ruido mediante el micrófono de referencia, después el

filtro adaptivo manda una señal a la bocina tratando de que el ruido sea interferido

destructivamente y posteriormente el resultado es registrado por el micrófono de error, el

filtro tratará de ajustarse hasta que el ruido haya sido cancelado completamente.

Durante esta sección se pudo conocer que existe una gran variedad de aplicaciones

del filtrado adaptivo dentro de los diversos campos de la ciencia, algunos de ellos no han

sido incluidos dentro de esta tesis debido a que el objetivo es presentar la clasificación

general de los modelos existentes, así como crear un panorama breve acerca de estas

aplicaciones, si el lector requiere más información acerca de este tema puede consultar en

[2,3].



1.3 Fundamentos de Filtrado Adaptivo

Como se ha podido constatar en temas tratados anteriormente, el filtrado adaptivo

ha permitido resolver diversos problemas que con el filtrado tradicional hubiese resultado

poco práctico o hasta imposible de resolver; el motivo por el cual el filtrado adaptivo ha

ganado terreno ante el filtrado fijo, es debido a que la mayoría de las señales con las que el

hombre está en contacto como voz, ruido, etc., son de tipo aleatorio o pseudoaleatorio; de

tal manera que el filtrado adaptivo tiene la capacidad de tratar dichas señales de mejor

forma que el filtrado fijo.

En las siguientes secciones se estudiará con mayor detalle la naturaleza de las

señales utilizadas en el filtrado adaptivo, el análisis del filtro Wiener, así como el filtro

LMS.

1.3.1 Clasificación de Señales Dentro del campo del procesamiento de señales existen diversas clasificaciones para

las señales, todo depende de la característica o características que está siendo analizadas en

cierto grupo de señales. De acuerdo a las características más fundamentales de una señal,

las señales pueden dividirse en determinísticas o aleatorias, estas últimas conocidas

también como señales estocásticas. Dentro de cada clasificación puede ocurrir que las

señales sean continuas, discretas, cuantizadas o digitales. Debido a que nuestro principal

interés es el procesamiento digital y a que su teoría es desarrollada para señales discretas

por razones de generalidad, de aquí en adelante se manejarán definiciones y conceptos para

señales de tiempo discreto a menos que se especifique lo contrario. Señales Determinísticas Una señal determinística en tiempo discreto es aquella que se puede calcular en

forma exacta los valores de una señal en cualquier parte del espacio discreto. Un ejemplo

de lo anterior puede ser la siguiente señal:

(1.5)

donde ...3,2,1,0 ±±±=k representa el espacio discreto. Como se muestra en la ecuación (1.5),

el comportamiento de la señal puede predecirse de manera analítica, así como su respuesta

en frecuencia.

)cos()( kekx k ωα−=



Señales Aleatorias

En comparación a las señales determinísticas, las señales aleatorias no pueden ser

modeladas por una ecuación, ya que no se puede predecir cuales serán los valores próximos

generados por la fuente de dicha señal. Algunas de estas señales en tiempo discreto pueden

obtenerse al muestrear ruido o voz, las cuales se consideran señales mayormente aleatorias.

El concepto de aleatoriedad está cercanamente asociado a los términos de información y

ruido, debido precisamente a que en los sistemas de comunicación la mayoría de las señales

que se manejan son aleatorias o pseudoaleatorias. Aunque no es posible obtener una

función matemática que pueda describir las señales aleatorias con la exactitud de una señal

determinística, generalmente la mayoría de estas señales exhiben características bien

definidas que permiten ser descritas de acuerdo a dichas características tales como media,

mediana, varianza, densidad de potencia espectral etc., así como de un modelo

probabilístico.

A continuación se muestra en la Fig. 1.7 el modelo probabilístico de ruido blanco.

Fig. 1.7 Modelo probabilístico de ruido blanco.

1.3.2 Procesos Estocásticos El término de proceso estocástico es usado comúnmente para describir un proceso

aleatorio. En un sentido estricto, un proceso estocástico representa el modelo probabilístico

de una clase de señales aleatorias, tal como los procesos Gaussianos, procesos de Markov,

procesos de Poisson etc. Los procesos aleatorios en tiempo discreto pueden ocurrir en forma

natural, obtenerse mediante el muestreo de procesos aleatorios de tiempo continuo o

limitados en banda. El término de “proceso estocástico en tiempo discreto” hace referencia

a la clase de señales aleatorias en tiempo discreto )(mX , caracterizado por un modelo



probabilístico [7]. Cada realización del proceso estocástico discreto )(mX , puede ser

indexada en tiempo y en espacio como ),( smx , donde m es el índice de tiempo discreto, y s la variable entera que designa el índice de realización del proceso. Ensamblado de un Proceso Estocástico El conjunto de realizaciones de un proceso aleatorio se le conoce como ensamblado o

espacio del proceso [7]. Es claro que al obtener muestras independientes de ruido blanco

de un canal de comunicación, las señales obtenidas serán a primera vista completamente

diferentes unas de otras, sin embargo al obtener el histograma de cada una de las muestras

se observará que todas tienden a parecerse al modelo probabilístico gaussiano, de esta

manera, cada una de las muestras representan una realización específica del proceso,

formando así parte del ensamblado o espacio de un proceso. Cada una de las realizaciones

del proceso se denota indicando el índice de tiempo discreto y el correspondiente al espacio

respectivo ),( smn , y el proceso estaría indicado como )(mN . La estadística “verdadera” de

un proceso estocástico se obtiene al ensamblar los promedios estadísticos de todas las

realizaciones existentes en el proceso. Sin embargo, en muchos casos prácticos solo se puede

obtener una realización del proceso, en estos casos se recurre a la propiedad de ergodicidad

de un proceso, en el cual se considera que el promedio en tiempo en una realización del

proceso es igual al promedio de ensamblado. Este concepto será revisado a detalle más

adelante.

Fig. 1.8 Realizaciones del proceso )(mN .



Modelos Probabilísticos En forma general podemos definir que los modelos probabilísticos proveen la

descripción matemática exacta de un proceso aleatorio. Un modelo probabilístico está

compuesto escencialemnete por variables aleatorias, las cuales se definen como el conjunto

de muestras de un instante de tiempo fijo m obtenidas de diversas realizaciones en el

espacio s de un proceso { }),()( smxmX = . Los modelos probabilísticos pueden ser aplicados

no solo a variables aleatorias, sino también a procesos estocásticos. Una variable aleatoria

está compuesta de todos los elementos probables que pueden ocurrir, este espacio de

elementos puede ser dividido en subespacios de acuerdo a cierto criterio, a cada uno de los

subespacios se les conoce como eventos. La probabilidad de que un evento ocurra está

definido como la razón del número de elementos que se observaron en cierto evento entre el

número total de observaciones. Obteniendo las probabilidades de cada uno de los eventos

se puede obtener el modelo probabilístico de la variable aleatoria formando así la función

de probabilidad ponderada, en la cual se puede determinar la probabilidad de que ocurra

cierto evento de una variable aleatoria. La notación de lo anterior se muestra de la

siguiente manera )( ixXP = . Procesos Aleatorios Estacionarios y no Estacionarios Cuando en un proceso aleatorio, la señal que se genera de éste es invariante en el

tiempo se dice que es estacionario, esto significa que los parámetros estadísticos del modelo

probabilístico que caracteriza a un proceso no varían con el tiempo, si dichos parámetros

cambian con el tiempo entonces se dice que el proceso es no estacionario. Los parámetros

estadísticos que determinan si un proceso es estacionario o no, son la media, la varianza, la

densidad de potencia espectral, y los momentos de orden superior. Sin embargo, existen

grados en que una señal puede ser estacionaria, debido a que algunos de los parámetros

estadísticos puede que sean estacionarios y otros no.

La mayoría de las señales con las que el hombre tiene relación diariamente son no

estacionarias, sin embargo se utiliza mucho el concepto de señales estacionarias para

desarrollar métodos de procesamiento de señales. La voz por ejemplo, que se considera una

señal no estacionaria, pero puede ser considerada estacionaria para periodos cortos de

tiempo. La mayoría de los procesos estocásticos tales como las señales de video, audio,

información financiera, meteorológica, biomédica etc., no son estacionarias debido a que

dichos datos son generados por sistemas que dependen de variables externas que cambian

con el tiempo.



[ ])(E)( nXnmx =

En el campo del procesamiento de señales se definen dos clases de procesos

estacionarios:

1) Procesos Estacionarios en el sentido estricto: Se dice que un proceso pertenece a

esta clase si los parámetros estadísticos de media, autocorrelación y densidad de

potencia espectral son invariantes en el tiempo.

2) Procesos Estacionarios en el sentido amplio: Esta clase de procesos es menos

restrictivo que el caso anterior, debido a que solo se requiere que la media y la

autocorrelación sean invariantes en el tiempo.

1.3.3 Parámetros Estadísticos Los parámetros estadísticos además de determinar si un proceso es estacionario o

no, también definen la clase de modelo probabilístico del proceso, tal como Gaussiano, de

Poisson etc.

Uno de los parámetros estadísticos más comunes es la esperanza, la cual también es

conocida como promedio de ensamblado, debido a que el promedio se realiza sobre el eje de

tiempo del proceso estocástico, por ejemplo, si { }),()( snxnX = es un proceso estocástico, la

media del elemento n del proceso será:

(1.6)

donde ]E[⋅ denota el operador de esperanza. Cabe aclarar que no es posible obtener, la

esperanza de un proceso estocástico promediando en tiempo una realización del mismo, a

menos que el proceso tenga cierta propiedad especial que se detallara en la sección 1.3.4.

Otros promedios estadísticos se derivan del operador descrito arriba y se han utilizado a

través de este capítulo bajo el sustento de que el lector tiene la idea básica de ellos; a

continuación se definirán formalmente dichos promedios.

1) Función de autocorrelación: Para un proceso estocástico definido como )(nX , la

autocorrelación se define como

*( , ) E[ ( ) ( )]xx n m X n X mφ = (1.7)

donde el asterisco representa el conjugado de la señal. Las señales que se manejan

en los procesos pueden corresponder a señales reales o complejas, es por eso que se

define formalmente de esa manera.



2) Función de correlación cruzada: Esta definida para dos procesos estocásticos ( )X n y

)(mY como

*( , ) E[ ( ) ( )]xy n m X n Y mφ = (1.8)

De igual manera que en el caso continuo, la correlación es una forma de estimar el

grado de relación entre una señal y otra.

Las definiciones descritas en los incisos anteriores son válidas para cualquier tipo de

proceso, estacionario o no estacionario, sin embargo, debido a que mucho del análisis se

realiza bajo procesos estacionarios en sentido amplio, definiremos de forma específica los

parámetros estadísticos bajo este criterio. En concordancia a lo definido, un proceso es

estacionario en el sentido amplio si su media y la correlación son invariantes en el tiempo,

por lo tanto se tienen que cumplir estas dos condiciones

( ) ( )x xm n m n k= + (1.9)

( , ) ( , )xx xxn m n k m kφ φ= + + (1.10)

donde k representa solo un desplazamiento temporal. Estas dos condiciones implican que

)(nmx es constante para cualquier valor de n y que ),( mnxxφ solo depende de la diferencia

mn − , por lo tanto podríamos definir la función de autocorrelación de forma más apropiada

como

*( ) E[ ( ) ( )]xx k X n X n kφ = − (1.11)

Si en el caso de la correlación cruzada los promedios de los procesos )(nX y )(mY

son independientes de n y dicha correlación solo depende de la diferencia mn − entonces se

dice que son procesos conjuntamente estacionarios en el sentido amplio, y por lo tanto

puede ser definida de la siguiente manera

*( ) E[ ( ) ( )]xy k X n Y n kφ = − (1.12)



*

2

( ) E[ ( ) ( )]

( )

XX

j fnxx

n

P f X f X f

k e πφ∞

−

=−∞

=

= ∑

1.3.4 Ergodicidad En muchos problemas de procesamiento de señales, solo es posible obtener una

realización del proceso aleatorio, del cual se pueda obtener la media, correlación, y

densidad espectral. En tales casos, se utilizan los promedios estadísticos obtenidos en

tiempo como promedios de ensamblado, los cuales como ya se mencionó son calculados en

base a diferentes realizaciones del proceso. Por lo tanto, se dice que un proceso estocástico

es ergódico si exhibe las mismas características estadísticas a lo largo del eje de tiempo de

una sola realización como a través del espacio o ensamble de diferentes realizaciones del

proceso [7]. De esta manera una sola realización del proceso que es muestreada para un

número grande de elementos, puede poseer las mismas características estadísticas en todo

el espacio del proceso.

sespaciodeltravésansnxestadistipromediossnxestadistipromedios )],(cos[)],(cos[ =

∞→

1.3.5 Densidad de Potencia Espectral La densidad de potencia espectral (PSD, Power Spectral Density) refleja el

contenido espectral de un determinado proceso en función de la frecuencia. El estudio de

este promedio estadístico de segundo orden es debido a que la convergencia de un filtro

adaptivo depende directamente de la potencia espectral de la señal de entrada. La

densidad de potencia espectral está definida como

(1.13)

(1.14)

donde )(kxxφ y )( fPXX representan la autocorrelación del proceso )(nX y la densidad de

potencia espectral respectivamente, f representa la variable de frecuencia.

La densidad de potencia espectral es una función real no negativa, expresada en

unidades de Watts/Hz. Para el caso en que se manejan procesos con valores reales y

estacionarios, la autocorrelación es simétrica y por consecuencia la densidad de potencia

espectral puede ser obtenida mediante la siguiente ecuación

1

( ) (0) 2 ( ) cos(2 )XX xx xxn

P f n fnφ φ π∞

=

= +∑ (1.15)



1.3.6 Matriz de Correlación

La matriz de correlación forma parte importante dentro del comportamiento de un

filtro adaptivo pues en muchos casos es quien determina la convergencia de un algoritmo,

así como ciertas propiedades en estado estable. Si los elementos de la señal de entrada

están representados en forma vectorial de la forma

0 1( ) [ ( ) ( ) ( )]TNk x k x k x k=x … (1.16)

la matriz de correlación está definida como )]()(E[ kk HxxR = donde el superíndice H

representa la transposición hermitiana, el cual es un operador matricial compuesto, que

indica la transposición de la matriz, seguida de aplicar el conjugado de la misma. La

matriz de correlación puede ser expresada en forma matricial de la siguiente manera

2 * *0 0 1 0

* 2 *1 0 1 1

* * 20 1

E[| ( ) | ] E[ ( ) ( )] E[ ( ) ( )]E[ ( ) ( )] E[| ( ) | ] E[ ( ) ( )]

E[ ( ) ( )] E[ ( ) ( )] E[| ( ) | ]

N

N

N N N

x k x k x k x k x kx k x k x k x k x k

x k x k x k x k x k

⎡ ⎤⎢ ⎥⎢ ⎥=⎢ ⎥⎢ ⎥⎣ ⎦

R (1.17)

Las principales propiedades de la matriz de correlación son las siguientes [3]:

1) La matriz de correlación es positiva semidefinida.

Dado un vector arbitrario complejo w, se puede obtener la señal dada por

( ) ( )Hy k k= w x (1.18)

La magnitud al cuadrado de )(ky es

2*( ) ( ) ( ) ( ) ( ) 0H Hy k y k y k k k= = ≥w x x w (1.19)

El valor medio cuadrático de ( )y k está dado por

2[| ( ) | ] E[ ( ) ( )] 0H H HE y k k k= = ≥w x x w w Rw (1.20)

Por lo tanto R es positiva semidefinida.

2) El hermitiano de la matriz de correlación es la misma matriz.

H=R R (1.21)

RxxxxR === )]()(E[})]()(E{[ kkkk HHHH



3) Una matriz es Toeplitz si los elementos de la diagonal principal y de alguna

diagonal secundaria son iguales. Cuando el vector de la señal de entrada está

compuesta de versiones retrasadas de la misma señal tomadas de un proceso

estacionario en el sentido amplio, la matriz R es Toeplitz.

Si R se define como se describió anteriormente entonces

(0) (1) ( )( 1) (0) ( 1)

( ) ( 1) (0)

x x x

x x x

x x x

NN

N N

φ φ φφ φ φ

φ φ φ

⎡ ⎤⎢ ⎥− −⎢ ⎥=⎢ ⎥⎢ ⎥− − +⎣ ⎦

R (1.22)

Por simple inspección, y de acuerdo a la definición dada podemos concluir que R es

Toeplitz.

1.4 Filtro Wiener

El estudio de los filtros Wiener es la base para entender la mayoría de las

implicaciones del filtrado adaptivo, a esta clase de filtros también se les conoce como filtros

lineales óptimos debido a que involucran un proceso de estimación lineal de una señal

deseada de otra relacionada con ésta. El estudio de este filtro se enfocará para el caso de

señales de tiempo discreto y de valores reales, las señales utilizadas se considerarán como

procesos aleatorios.

Como se mencionó en la sección 1.2.1, uno de los algoritmos adaptivos más

importantes y más utilizados es el de error medio cuadrático (MSE), del cual se definió de

la siguiente manera

]|)([|)ξ()]([ 2keEkkeF == (1.23) y de acuerdo a la Fig. 1.1, el error es generado como )()()( kykdke −= , por lo tanto substituyendo en la ecuación anterior obtenemos que

2 2 2ξ( ) E[| ( ) | ] E[ ( ) 2 ( ) ( ) ( )]k e k d k d k y k y k= = − + (1.24)

Si se considera que la estructura del filtro debe consistir de una combinación lineal,

entonces se opta por la utilización de una estructura FIR como la mostrada en la Fig.

1.2(a) la cual su salida en forma genérica esta dada por la siguiente ecuación

)()()()()(0

kkikxkwky TN

ii xw∑

=

=−= (1.25)



donde TNkxkxkxk )]()1()([)( −−= …x y TN kwkwkwk )]()()([)( 10 …=w son la señal de

entrada y los coeficientes del filtro adaptivo respectivamente. Por lo tanto podemos

rescribir la ecuación (1.24) de la siguiente manera

(1.26)

(1.27)

Para un filtro con coeficientes fijos invariantes en el tiempo, el error medio cuadrático está

dado como

2

2

ξ E[ ( )] 2 E[ ( ) ( )] w E[ ( ) ( )]E[ ( )] 2

T T T

T T

d k d k k k kd k

= − +

= − +

w x x x ww p w Rw

(1.28)

donde )]()([ kkdE xp = es el vector de correlación cruzada, entre la señal deseada y la señal

de entrada, y )]()(E[ kk TxxR = es la matriz de correlación de la señal de entrada. Como

puede notarse, el error medio cuadrático es una función que varía dependiendo de los

coeficientes del filtro, pues tanto como p y R son conocidos de acuerdo a los procesos

aleatorios que les dan origen. Por lo tanto, para obtener el error mínimo posible se aplica

la función gradiente a la función objetivo, para obtener los coeficientes que minimizan el

error medio cuadrático del sistema.

0 1

ξ ξ ξ ξ

2 2

TNw w w

⎡ ⎤∂ ∂ ∂ ∂∇ = = ⎢ ⎥∂ ∂ ∂ ∂⎣ ⎦

= − +

w wp Rw

(1.29)

Igualando el vector gradiente a cero y asumiendo que R no es singular, los valores óptimos

de los coeficientes del filtro pueden ser obtenidos mediante la siguiente ecuación

1

o−=w R p (1.30)

A esta solución se le conoce como solución óptima de la ecuación Wiener-Hopf, la cual fue

mencionada en secciones anteriores. De aquí se deriva el lema conocido como inversión de

matriz, debido precisamente al problema de obtener la inversión de la matriz de

correlación para obtener la solución óptima. Por otro lado, debido a que no se pueden

obtener estimaciones muy precisas acerca de la matriz de correlación y correlación cruzada,

se utiliza el principio de ergodicidad para obtener los promedios estadísticos de ensamblaje,

esta característica generalmente va implícita cundo se desarrollan la mayoría de los filtros

adaptivos.

)]()()()(E[)]()()(E[2)](E[)]()()()()()()(2)(E[

)ξ()](E[

2

2

2

kkkkkkkdkdkkkkkkkdkd

kke

TTT

TTT

wxxwxwwxxwxw

+−=

+−=

=



Para obtener el error mínimo cuadrático se sustituye la solución de Wiener en la

ecuación (1.28) obteniendo finalmente la siguiente ecuación

(1.31)

Aquí se puede ver claramente que el error depende directamente de la señal deseada y la

señal de entrada, si ocurriese que en una aplicación la señal de entrada y la señal deseada

no estuvieran correlacionadas, el error solo dependería de la potencia de la señal deseada,

sin embargo en la mayoría de los casos existe cierta relación entre ambas variables.

Una importante propiedad del filtro Wiener puede ser deducida al analizar el

gradiente de error en la solución óptima.

(1.32)

Al igualar el gradiente a cero para minimizar el error obtenemos que

(1.33)

Lo anterior se le conoce como principio de ortogonalidad el cual infiere que la señal de

error óptima está rotada 90˚ de la señal de entrada, por lo cual se demuestra que ambas

señales no están correlacionadas. Esto se origina del hecho de que todas las variables

aleatorias que poseen momentos finitos de segundo orden constituyen un espacio lineal, y

que el producto punto de ambas determina el grado de correlación entre una variable y

otra. En el caso en que la señal de error o la señal de entrada tengan una media de cero, el

principio de ortogonalidad implica que ambas señales no están correlacionadas.

Una derivación importante del principio de ortogonalidad, es la que demuestra que

la señal de error en su valor óptimo y la señal de salida del filtro también son ortogonales,

como se muestra a continuación

(1.34)

2 1min

2

E[ ( )] 2

E[ ( )]

T To o

To

d k

d k

−= − +

= −

ξ w p w RR p

w p

2E[ ( )] ( )2 ( ) E[2 ( ) ( )]T T

e k e kE e k e k k∂ ∂⎡ ⎤∇ = = = −⎢ ⎥∂ ∂⎣ ⎦w xw w

[ ( ) ( )]oE e k k =x 0

E[ ( ) ( )] E[ ( ) ( )]

E[ ( ) ( )]

E[ ( ) ( )]0

o oTo o

To o

e k y k y k e k

k e k

k e k

=

=

==

w x

w x



1.5 Filtro LMS

Como se pudo constatar en la sección anterior, los principales problemas de

implementar el filtro Wiener surgen debido a que no es posible obtener mediciones precisas

de la matriz de correlación R y del vector de correlación cruzada p , por lo que se estiman

por medio de promedios temporales acudiendo a la propiedad de ergodicidad. Sin embargo,

el problema real radica en resolver el lema conocido como inversión de matriz, el cual

puede ser resuelto de manera apropiada con métodos numéricos capaces de ser

implementados de manera simple en hardware. El algoritmo adaptivo más utilizado para

lograr optimizar al filtro es el steepest-descent debido a su simplicidad de implementación

y análisis. Al utilizar una estructura FIR, el criterio de error medio cuadrático, así como el

algoritmo steepest-descent para minimizar la función objetivo, se dice que se utiliza un

filtro LMS (Least Mean Square).

Como se había establecido anteriormente, la solución óptima de Wiener se obtenía

mediante la siguiente ecuación

1

o−=w R p

donde )]()(E[ kk HxxR = y )]()([ kkdE xp = , asumiendo que )(kd y )(kx son conjuntamente

estacionarias en sentido amplio. Si la matriz de correlación y el vector de correlación

cruzada son expresados en forma estricta como una estimación, y se utiliza el método de

búsqueda steepest—descent entonces, la solución óptima de Wiener puede ser obtenida

como

(1.35)

para …,2,1,0=k , donde )(ˆ kw∇ representa el gradiente estimado de la función objetivo con

respecto a los coeficientes del filtro.

Las estimaciones de la matriz de correlación y el vector de correlación cruzada pueden ser

obtenidas mediante estimaciones instantáneas de cada una de ellas

(1.36)

(1.37)

ˆ( 1) ( ) ( )

ˆˆ( ) 2 ( ( ) ( ) ( ))

k k k

k k k k

µ

µ

+ = − ∇

= + −

w w ww p R w

ˆ ( ) ( ) ( )ˆ ( ) ( ) ( )

Tk k kk d k k

==

R x xp x



Al sustituir las ecuaciones (1.36) y (1.37) en (1.35) obtenemos que la ecuación de

actualización del filtro está dada como

(1.38)

Parte de la rapidez de convergencia de este filtro depende que µ, así como del rango que

garantiza la convergencia. Finalmente, podemos describir en forma completa el filtro LMS

mediante las siguientes ecuaciones.

Inicialización (1.39) Para 0≥k

(1.40) (1.41)

Es preciso aclarar que la inicialización de los coeficientes del filtro no necesariamente debe

empezar en ceros, pues en semejanza a cuando se utilizan los métodos de búsqueda para

encontrar las raíces de un polinomio, la solución puede obtenerse más rápido si se puede

estimar la vecindad en la que se encuentra la solución.

Fig. 1.9 Estructura de filtro LMS.

( 1) ( ) 2 ( ( ) ( ) ( ) ( ) ( ))( ) 2 ( )( ( ) ( ))( ) 2 ( ) ( )

Tk k d k k k k kk k d k y kk e k k

µ

µµ

+ = + −

= + −= +

w w x x x ww xw x

(0) (0) [0 0 0]T= =x w …

( ) ( ) ( ) ( )( 1) ( ) 2 ( ) ( )

Te k d k k kk k e k kµ

= −+ = +

x ww w x



1.6 Efectos de palabra finita

Todo sistema desarrollado en tiempo discreto y que desea implementarse en

hardware requiere que todas sus señales de entrada, coeficientes de filtros, operaciones etc.,

se realicen con una precisión finita determinada, esto implica que el sistema discreto

(precisión infinita) sea convertido a un sistema estrictamente digital. De tal manera que al

diseñar un filtro en tiempo discreto, es necesario que los coeficientes del mismo sean

cuantizados. Esto último quiere decir que dichos valores deben ser transformados a un

formato binario, tal como el de punto fijo o el de punto flotante. En nuestro caso nos

enfocaremos al tratado del formato de punto fijo, el cual asume que el punto binario está

fijo en una posición, y en la implementación en hardware se toma en cuenta dicha posición

para realizar operaciones aritméticas [8]. Los números en punto fijo son siempre

representados como fracciones debido precisamente a que la multiplicación o suma de dos

números de punto fijo resulta en un valor que mantiene la posición del punto binario.

La representación en punto fijo se puede ver en la Fig. 1.10 en la que se asume que

la longitud de palabra disponible es de (b+1) bits, donde el bit más significativo representa

el signo y cualquier número representado con este formato está cuantizado en pasos de b−2 ,

llamado paso o ancho de cuantización. 2-1 2-2 2-b ↓ ↓ ↓

s a-1 a-2 ... a-b

∆ Fig. 1.10 Formato numérico de punto fijo.

Antes de la cuantización, la longitud de palabra es mucho mayor que la indicada al

cuantizar. Si se asume que un dato x es representado con una precisión de ( 1+β ) bits

cuando β >> b, entonces para convertir dicho valor a una fracción de )1( +b bits, se le

aplica un modelo de cuantización como se observa en la Fig. 1.11. Existen dos tipos de

cuantización: truncamiento y redondeo, el truncamiento puede ser de signo-magnitud,

complemento a uno o complemento a dos, dependiendo de la representación numérica que

se utilice; el tipo más común es el de truncamiento complemento a dos.

Fig. 1.11 Modelo del proceso de cuantización.



Para realizar el truncamiento de un número de punto fijo de precisión )1( +β bits a

)1( +b , simplemente se descartan los bits menos significativos )( b−β como se muestra en la

Fig. 1.12, y el error generado por este truncamiento está definido como

(1.42)

2-1 2-2 2-b 2-β ↓ ↓ ↓ ↓

s a-1 a-2 ... a-b a-b-1 a-b-2 ... a-β

∆ Descartados

Fig. 1.12 Proceso de truncamiento

Para el caso de truncamiento complemento a dos, el error siempre es negativo y tiene un

rango de

(1.43)

En el caso de redondeo, el número es cuantizado al nivel de cuantización más próximo, si

un número se encuentra exactamente a la mitad de los dos niveles de cuantización, dicho

valor es redondeado al nivel superior próximo. Es de aclarar que el error de redondeo, no

depende la representación numérica que se está utilizando pues únicamente está basado en

la magnitud del número, por lo tanto el rango de redondeo está dado por

(1.44)

1.6.1 Modelo de Ruido de Cuantización Para modelar los efectos de cuantización en un sistema, lo más común es utilizar un

modelo estadístico tal como se muestra en la Fig. 1.13, este modelo tiene origen

precisamente en la ecuación (1.42), la cual permite estimar el error como una perturbación

aditiva. Debido a que este es un modelo estadístico, es necesario obtener las distribuciones

de ruido generadas por cada uno de los tipos de truncamiento.

Fig. 1.13 Modelo Estadístico de cuantización.

( )t Q x xε = −

(2 2 ) 0bt

β ε− −− − ≤ ≤

( )1 12 2 (2 2 )2 2

b br

β βε− − − −− − < ≤ −



Las distribuciones de cada uno de los tipos de truncamiento puede ser obtenidas

mediante las ecuaciones (1.43) y (1.44), considerando que b>>β y que la distribución es

uniforme. Para el caso de truncamiento complemento a dos tenemos que

(1.45)

Si tt

Pε es la densidad de probabilidad de error, la cual es constante debido a que la

distribución es uniforme entonces obtenemos que

2

t

bPε = 2 0btε

−− ≤ ≤ (1.46)

En la Fig. 1.14 se muestra la función de densidad de probabilidad de error para el caso de

truncamiento complemento a dos, donde b−= 2δ .

Fig. 1.14 Distribución de error para truncamiento complemento a dos.

Debido a que estas funciones de densidad de probabilidad de error son utilizadas

para modelar sistemas cuantizados, es necesario conocer los promedios estadísticos de estas

distribuciones ya que son muy útiles durante el análisis. Por lo tanto, la media y la

varianza para truncamiento se obtienen de la siguiente manera

Media

(1.47) Varianza

(1.48)

0

2

1t

btP dε ε

−−

=∫

00 2

221

E[2 ]

2 22

2

bb

bt

b b

b

xxdx

µ

−− −−

− −

=

= =

= −

∫

2 2

01 2

22

E[(2 ) ]

( 2 ) 2

212

b

bt

b b

b

x dx

σ µ

−

− −

−

−

= −

= +

=

∫



Para el caso de redondeo tenemos que

(1.49)

Si la densidad de nuevo se considera constante, desarrollando la ecuación obtenemos 2

t

bPε = 1 12 2b btε

− − − −− ≤ ≤ (1.50) En la Fig. 1.15 se muestra la densidad de probabilidad de error para el redondeo

Fig. 1.15 Distribución de error para redondeo.

Los promedios estadísticos para este caso son: Media

(1.51) Varianza

(1.52)

Un caso especial que será muy utilizado en el siguiente capítulo es la distribución de

la diferencia de dos densidades iguales de probabilidad de error uniforme, pero que cada

una de ellas es generada independientemente. Por experimentación se descubrió que la

función de densidad resultante es una función triangular para el caso en que las

distribuciones sean generadas por truncamiento o por redondeo. La función de distribución

puede ser vista en la Fig. 1.14 y sus promedios estadísticos pueden ser obtenidos de los

promedios obtenidos anteriormente.

1

1

2

2

1b

tb

tP dε ε− −

− −−

=∫

11

11

22 2

22

E[2 ]

2 22

0

bb

bb

bt

b b xxdx

µ− −− −

− −− − −−

=

= =

=

∫

1

1

2 2

22

22

E[(2 ) ]

2

212

b

b

br

b

b

x dx

σ− −

− −−

−

=

=

=

∫



Fig. 1.16 Distribución resultante de la diferencia de dos distribuciones uniformes.

Media.- Considerando que 21 εε µµ = , para ambos casos, truncamiento o redondeo.

(1.53)

Varianza.- Considerando que 22

21 εε σσ = y 21 εε µµ = para ambos casos, truncamiento o

redondeo.

(1.54)

Los efectos que generan estas perturbaciones en los sistemas pueden ser diversos,

por ejemplo, al cuantizar los coeficientes de un filtro puede que la respuesta en frecuencia

se modifique con respecto a su diseño original, de igual manera los filtros que cuentan con

una estructura IIR deben tomar en cuenta estos errores ya que el sistema en lugar de

filtrar oscile debido a su propiedad recursiva. Otro problema que puede surgir es cuando el

error de cuantización es comparable a los valores de la señal cuantizada, ya que la relación

señal a ruido disminuye, afectando de esta manera el desempeño de cualquier sistema

electrónico.

1 2 1 2

1 2

[( )] [ ] [ ]

0

E P P E P E Pε ε ε ε

ε εµ µ− = −

= −

=

2 2 21 2 1 1 2 2

2 2 2 21 1 1 2 2 2

2

2

[( ) ] [( ) ] 2 [ ] [( ) ]

( ) 2 ( )

2

26

b

E P P E P E P P E Pε ε ε ε ε ε

ε ε ε ε ε ε

ε

σ µ µ µ σ µ

σ−

− = − +

= + − + +

=

=

33

Capítulo 2

Modelo Matemático

"Si la gente no cree que las matemáticas son simples, es solo porque no se han dado cuenta cuan complicada es la vida "

-John von Neumann-

2.1 Filtro LMS implementado con aritmética de

punto fijo El diagrama de bloques detallado en Fig. 2.1 muestra el modelo típico de identificación

de sistemas que incluye los errores de precisión finita modelados como ruido aditivo.

Fig. 2.1 Algoritmo LMS de precisión finita para configuración identificación de sistemas.

La señal de entrada es una de las principales variables que determina el

comportamiento del algoritmo LMS, así como una fuente importante de información para

establecer las condiciones del análisis matemático. En la Fig. 2.1, ( )x k representa la señal

de entrada, la cual se asume no sufre cuantización y como se puntualizó anteriormente

dichos valores de entrada son mutualmente independientes, de media cero y generados por


Capítulo 2: Modelo Matemático 34

un proceso estacionario. El siguiente análisis puede ser utilizado ampliamente con señales

de ruido de banda ancha tal como el ruido blanco, comúnmente utilizado en esta

configuración debido a que con dicha entrada el algoritmo converge más rápido; por otro

lado, se aprovecha que las muestras sucesivas del ruido de banda ancha no están

correlacionadas entre ellas [6] lo cual simplifica el análisis matemático. El vector

[ ]o 1 2 1T

o o oNw w w −=w … representa la respuesta al impulso del sistema desconocido,

[ ]0 1 1( ) ( ) ( ) ( ) TNk w k w k w k−=w … representa el vector ponderado de longitud N de la kva

iteración obtenido de la ecuación de actualización, la cual esta dada como

( 1) ( ) 2 ( ) ( ) ( )qk k e k k kµ+ = + + uw w x η (2.1)

en donde qµ representa el factor de convergencia cuantizado, ( )e k es la señal error, ( )kx

representa el vector de corrimiento de la señal de entrada, y ( )kuη representa el ruido

producto de la cuantización de la multiplicación resultante de 2 ( ) ( )qe k kµ x ,cabe precisar

que todas las variables con subíndice q indican que han sufrido cuantización, así mismo se

supone que la señal de entrada está propiamente escalada por lo que no ocurre error

debido a sobreflujo. Las perturbaciones ( )d kη y ( )y kη son debidas a la cuantización

realizada después de la suma de los productos internos entre el vector de entrada, y el

vector ponderado correspondiente. La señal ( )n k se le conoce comúnmente como ruido de

medición (measurement noise).

Se asume que las señales de ruido ( )d kη , ( )y kη , y ( )kuη no están correlacionadas

entre ellas y tienen una distribución uniforme, y se definen formalmente de la siguiente

manera ( ) ( ) ( )d qk d k d kη = − (2.2)

( ) ( ) ( )y qk y k y kη = − (2.3)

[2 ( ) ( )] 2 ( ) ( )q q qe k k e k kµ µ= −uη x x (2.4)

El primer y segundo momento central de las distribuciones de ruido debidas al

redondeo y truncamiento se muestran en la siguiente tabla.

Tabla 2.1 Primer y segundo momento de distribuciones cuantizadas.

Distribuciones de error Truncamiento Redondeo Media Varianza Media Varianza

( )d kη , ( )y kη 12 db− −−

2212

db−

0

22

12db−

( )η ku 12 cb− −−

2212

cb−

0

22

12cb−



El proceso de cuantización del algoritmo involucra dos cuantizadores de diferente

resolución, uno para los coeficientes el cual es de cb bits más el de signo y otro para los

datos de db bits más el de signo.

2.2 Modelo de comportamiento transitorio y de estado estable

El análisis conjunto del comportamiento transitorio y de estado estable de la curva

de aprendizaje es sin duda una tarea difícil; sin embargo, revela información importante del

sistema, tal como la dependencia de ambos comportamientos y permite analizar distintos

parámetros de desempeño bajo las mismas condiciones y criterios establecidos para todo el

análisis.

De la Fig. 2.1 podemos deducir las siguientes ecuaciones que nos permitirán

desarrollar el modelo matemático.

( ) ( ) ( )q qe k d k y k= − (2.5)

o( ) ( ) ( ) ( )Tq dd k k n k kη= + +w x (2.6)

( ) ( ) ( ) ( )Tq yy k k k kη= +w x (2.7)

Dado que nuestro objetivo es obtener la curva de aprendizaje, ésta última es

obtenida utilizando el criterio de optimación de error medio cuadrático, el cual está

definido como 2[| ( ) | ]E e k (2.8)

de esta manera procedemos a sustituir las ecuaciones (2.6) y (2.7) en (2.5), y obtenemos la

siguiente ecuación

( ) ( ) ( ) ( ) ( )Tee k n k k k kη= + − v x (2.9)

donde ( ) ( )k k= − ov w w , el cual se le conoce como el vector de error ponderado, así mismo

( ) ( ) ( )e d yk k kη η η= − permite conjuntar ambos ruidos de cuantización en uno solo y al

analizar el primer y segundo momento central de esta distribución nos permitirá ahorrar

trabajo algebraico extra; deacuerdo a lo obtenido en el capítulo anterior dichos momentos

centrales de ( )e kη corresponden precisamente a las ecuaciones (1.53) y (1.54).



De la ecuación (2.9) podemos deducir fácilmente que el algoritmo alcanza el error

óptimo cuando ( )k =v 0 , por lo que se define de la siguiente manera

( ) ( ) ( )o ee k n k kη= + (2.10)

donde ( )n k se considera como ruido blanco de media cero como es comúnmente asumido, y

dado que ( )e kη es también una ruido de media cero, la distribución de error óptimo

conservará este parámetro estadístico.

Habiendo detallado en los elementos de la ecuación (2.9), procedemos a aplicar el

criterio de optimación en dicha ecuación, resultando (2.11). Después de manipular

algebraicamente (2.11) se asume que [ ( ) ( )] 0eE n k kη = , así mismo se asume que ( )kx y ( )kv

son vectores independientes lo que permite manipular el término [ ( ) ( ) ( )]ToE e k k kv x como se

muestra en (2.12).

2 2 2 2 2[| ( ) | ] [( ( ) ( ) ( )) ] [ ( )] [ ( )] [( ( ) ( )) ]T T

o eE e k E e k k k E n k E k E k kη= − = + +v x v x (2.11)

[ ( ) ( ) ( )] [ [ ( ) ( )] ( )]T To oE e k k k E E e k k k=v x x v (2.12)

Citando el principio de ortogonalidad [6] el cual establece (2.13), podemos concluir (2.14).

[ ( ) ( )]T ToE e k k =x 0 (2.13)

[ ( ) ( ) ( )] 0ToE e k k k =v x (2.14)

Por otro lado, de acuerdo a las características previamente establecidas para )(kn , se

obtiene que 2 2[ ( )] nE n k σ= , así mismo podemos recordar que el término 2[ ( )]eE kη es obtenido

por medio de la ecuación (1.54), mientras que el último término puede ser expresado como

tr[ ( )]kRK de acuerdo a lo propuesto en [6], donde [ ( ) ( )]TE k k=R x x , ( ) [ ( ) ( )]Tk E k k=K v v y

tr[ ]⋅ representa la función traza. Considerando lo anterior podemos rescribir la ecuación

(2.11) como (2.15). 2 2 2( ) [| ( ) | ] tr[ ( )]n ek E e k kξ σ σ= = + + RK (2.15)

Hasta ahora se ha definido una ecuación que nos permite visualizar parte de la

solución del problema, y nos indica la dirección hacia lo que debemos enfocarnos para

continuar el análisis. Es claro que los dos primeros términos de la ecuación (2.15)

pertenecen al comportamiento de estado estable, y sin duda el tercer término contiene el

comportamiento transitorio, es por eso que nos enfocaremos primeramente al análisis de la

matriz ( )kK .



La matriz de correlación del vector de error ponderado ( )kK está definida como

( ) [ ( ) ( )]Tk E k k=K v v (2.16)

Si sustituimos la ecuación (2.10) en (2.9) obtenemos que la señal error esta dada por (2.17)

y sustituyendo en la ecuación (2.1) podemos redefinir el vector de error ponderado como

(2.18).

( ) ( ) ( ) ( )Toe k e k k k= − v x (2.17)

( )( 1) 2 ( ) ( ) ( ) 2 ( ) ( ) ( )Tq q ok k k k e k k kµ µ+ = − + + uv I x x v x η (2.18)

Ahora procederemos a encontrar ( 1)k +K utilizando la ecuación (2.18) asumiendo la

independencia entre ( )oe k , ( )kuη , ( )kv y ( )kx .

( 1) [ ( 1) ( 1)]Tk E k k+ = + +K v v (2.19)

( ) ( )

( ) ( )

2 2

( 1) 2 ( ) ( ) ( ) ( ) 2 ( ) ( )

4 [ ( ) ( ) ( )] [ ( ) ( )]

( ) ( ) 2 ( ) ( ) 2 ( ) ( ) ( ) ( )

T T Tq q

T Tq o

T T T Tq q

k E k k k k k k

E e k n n E k k

E k k k k E k k k k

µ µ

µ

µ µ

⎡ ⎤+ = − −⎣ ⎦+ +

⎡ ⎤ ⎡ ⎤+ − + −⎣ ⎦ ⎣ ⎦

u u

u u

K I x x v v I x x

x x η η

η v I x x I x x v η

(2.20)

Reduciendo (2.20) resulta (2.21) donde µu y 2σu son el primer y segundo momento central

respectivamente de la distribución ( )η ku , la matriz O representa una matriz de unos, y

( ) [ ( )]k E k=vµ v .

( )( ) ( )

2

2 2 2 2

( 1) ( ) 2 ( ) ( ) 4 ( ) ( ) ( ) ( ) ( )

4 ( ) 2 2 ( )

T Tq q

T Tq o q q

k k k k E k k k k k

k k

µ µ

µ σ σ µ µ µ

+ = − + + ⎡ ⎤⎣ ⎦+ + + + − + −u u u v v u

K K K R R K x x K x x

R I O µ µ I R I R µ µ (2.21)

Analizando la ecuación (2.21) podemos observar que se sigue comportando como

una ecuación recursiva, en donde la matriz de correlación del vector de ponderado no es lo

único que está variando en cada iteración sino también la esperanza del vector de error

ponderado; cabe precisar que los últimos tres términos de la ecuación es la aportación

debida a la cuantización por truncamiento por la presencia de µu en dichos términos.

Antes de proseguir estudiando la ecuación (2.21), nos enfocaremos a obtener la esperanza

del vector de error ponderado la cual será utilizada posteriormente; por lo tanto, aplicando

la esperanza a la ecuación (2.18) obtenemos (2.22), la cual que es una clásica ecuación de

diferencias, por lo que procedemos a aplicar la transformada Z en ambos lados de la

igualdad para obtener (2.23) donde 0(0) = −vµ w .y después de agrupar se obtiene (2.24).



( )( 1) 2 ( )qk kµ+ = − +v v uµ I R µ µ (2.22)

( ) 1( ) (0) 2 ( )1qz z z z

zµ −− = − +

−u

v v vµµ µ I R µ (2.23)

1 111 1

1( ) ( 2 ) ( 2 ) (0)1q q

zz z zz

µ µ− −−

− −−= − − + − −⎡ ⎤ ⎡ ⎤⎣ ⎦ ⎣ ⎦−

v u vµ I I R µ I I R µ (2.24)

Si utilizamos la transformación de similaridad unitaria para descomponer la matriz de

correlación definida por (2.25) podemos rescribir (2.24) como (2.26).

1−=R QΛQ (2.25)

1 111 1 1 1

1( ) ( 2 ) ( 2 ) (0)1q q

zz z zz

µ µ− −−

− − − −−= − − + − −⎡ ⎤ ⎡ ⎤⎣ ⎦ ⎣ ⎦−

v u vµ Q I I Λ Q µ Q I I Λ Q µ (2.26)

Dado que Λ es una matriz diagonal, la inversión de matriz se obtiene de forma directa,

cuestión que permite aplicar la transformada Z inversa de forma más simple como se

establece en (2.27).

{ }

1

1

11 1 1

1

1 1 1

( ) ( 2 )1

( 2 ) (0)

q

q

zk zz

z

µ

µ

−

−

−− − −

−

− − −

⎧ ⎫⎡ ⎤= − −⎨ ⎬⎣ ⎦ −⎩ ⎭

⎡ ⎤+ − −⎣ ⎦

v u

v

µ Q I I Λ Q µ

Q I I Λ Q µ

Z

Z

(2.27)

Desarrollando el argumento de la primera transformada Z inversa en (2.27) obtenemos

(2.28) y al resolver un elemento de la matriz, se puede generalizar el resultado como se

muestra en (2.29). Siguiendo el mismo procedimiento para el segundo término en (2.27)

obtenemos (2.30).

1

1

1 10

11

1 1111

1

1 11

1 0 01 (1 2 ) 1

101 (1 2 ) 1( 2 )

1

10 01 (1 2 ) 1

q

qq

q N

zz z

zz z zzz

zz z

µ λ

µ λµ

µ λ

−

−

− −

−−

− −−−

−

− −−

⎡ ⎤⎢ ⎥− − −⎢ ⎥⎢ ⎥⎢ ⎥

− − −⎡ ⎤− − =⎢ ⎥⎣ ⎦ − ⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥

− − −⎢ ⎥⎣ ⎦

I I Λ (2.28)



1 11 1 1

1

1( 2 ) ( 2 )1 2

kq q

q

zzz

µ µµ

− −− − −

−

⎧ ⎫⎡ ⎤ ⎡ ⎤− − = − −⎨ ⎬⎣ ⎦ ⎣ ⎦−⎩ ⎭I I Λ Λ I I ΛZ (2.29)

{ }11 1( 2 ) ( 2 )k

q qzµ µ−

− −⎡ ⎤− − = −⎣ ⎦I I Λ I ΛZ (2.30)

Si sustituimos las ecuaciones (2.29) y (2.30) en (2.27) y 1−= =Q Q I debido a que la

entrada es mutualmente independiente y de media cero podemos concluir (2.31).

1 11 1( ) ( 2 ) (0)2 2

kq

q qk µ

µ µ− −⎛ ⎞

= − − +⎜ ⎟⎝ ⎠

v v u uµ I Λ µ Λ µ Λ µ (2.31)

Volviendo a la ecuación (2.21) procedemos a multiplicar dicha ecuación por R en

ambos lados de la igualdad, así mismo se aplica la función traza y se obtiene (2.32).

( ) ( )

2

2 2 2 2 2

2

tr[ ( 1)] tr[ ( ) 2 ( ) 2 ( )

4 [ ( ) ( ) ( ) ( ) ( )] 4

( ) 2 2 ( ) ]

q q

T Tq q o

T Tq q

k k k k

E k k k k k

µ k k

µ µ

µ µ σ σ

µ µ

+ = − −

+ + +

+ + − + −u

u u v v u

R K R K R K R R K

R x x K x x R R

R O R µ µ I R R I R µ µ

(2.32)

Por cuestiones prácticas los términos independientes del tiempo se agrupan en una

sola matriz llamada S como se muestra en (2.33) y dado que la función traza es una

función lineal utilizamos dicha propiedad para obtener la siguiente ecuación (2.34).

2 2 2 2 24 q o µµ σ σ= + +u uS R R RO (2.33)

( ) ( )

2

2

tr[ ( 1)] tr[ ( )] 2 tr[ ( ) ] 2 tr[ ( )]

4 tr [ ( ) ( ) ( ) ( ) ( )]

tr ( ) 2 tr 2 ( ) tr[ ]

q q

T Tq

T Tq q

k k k k

E k k k k k

k k

µ µ

µ

µ µ

+ = − −

+ ⎡ ⎤⎣ ⎦+ − + − +⎡ ⎤ ⎡ ⎤⎣ ⎦ ⎣ ⎦u v v u

RK R K R K R R K

R x x K x x

R µ µ I R R I R µ µ S

(2.34)

Aunque sabemos que la multiplicación de matrices no es conmutativa, la función traza

permite la permutación cíclica como se establece en (2.35). Otra propiedad importante se

detalla en (2.36)

tr[ ] tr[ ] tr[ ]= =ABC BCA CAB (2.35)



tr[ [ ( )]] [tr[ ( )]]E k E k=A A (2.36)

Utilizando las dos propiedades (2.35) y (2.36) podemos reducir algunos elementos de la

ecuación (2.34) para obtener (2.37) y (2.38).

2tr[ ( ) ] tr[ ( )]k k=R K R R K (2.37)

tr [ ( ) ( ) ( ) ( ) ( )] tr[ [ ( ) ( ) ( ) ( ) ( )]]

[tr[ ( ) ( ) ( ) ( ) ( )]][tr[ ( ) ( ) ( ) ( ) ( )]]

tr[ [ ( ) ( ) ( ) ( )] ( )]

T T T T

T T

T T

T T

E k k k k k E k k k k k

E k k k k kE k k k k k

E k k k k k

=⎡ ⎤⎣ ⎦=

=

=

R x x K x x R x x K x x

R x x K x xx x R x x Kx x R x x K

(2.38)

Analizando el término [ ( ) ( ) ( ) ( )]T TE k k k kx x R x x en forma separada y considerando

que las muestras de son mutualmente independientes podemos establecer (2.39) y (2.40)

donde 2 ( )x k − y 2[ ( )]E x kλ = − representan elementos diagonales de las matrices

( ) ( )Tk k=Ρ x x y R respectivamente.

12

0( ) ( ) tr[ ] ( )

NT k k x k λ

−

=

= = −∑x R x RΡ (2.39)

[ ( ) ( ) ( ) ( )] [tr[ ] ]T TE k k k k E=x x R x x R P P (2.40)

Por otro lado, podemos descomponer la matriz Ρ como se muestra en (2.41), donde 2 2 2diag[ ( ), ( 1), , ( 1)]x k x k x k N− − +… representa la matriz compuesta por los elementos

diagonales de P, y U representa la matriz con los elementos restantes.

2 2 2diag[ ( ), ( 1), , ( 1)]x k x k x k N= − − + +Ρ U… (2.41)

Sustituyendo la ecuación (2.41) en (2.40) obtenemos (2.42), y evaluando los elementos de

la matriz [tr[ ] ]E=T RP U podemos obtener (2.43) y en consecuencia (2.44).

2 2 2[tr[ ] ] tr[ ]diag[ ( ), ( 1), , ( 1)] tr[ ]E E x k x k x k N⎡ ⎤= − − + +⎣ ⎦R P P R P R P U… (2.42)

[ ]0 0,1, , 1

( ) ( ) tr[ ] 0ii

ij

t i Nt E x k i x k j i j= = −

= − − = ≠RP…

(2.43)

[tr[ ] ]E= =T R P U 0 (2.44)



Evaluando los elementos de la matriz 2 2 2tr[ ]diag[ ( ), ( 1), , ( 1)]E x k x k x k N⎡ ⎤= − − +⎣ ⎦F R P … , y

utilizando (2.39) obtenemos (2.45), donde ( )42[ ( )] 3 iE x k i γ λ− = + y ( ) ( ) ( )u i u iδ≠ = − −

es la función escalón que es cero únicamente cuando i= y 0< . De esta manera del

resultado de la ecuación (2.45) podemos concluir (2.46), donde 2γ es conocido como el

exceso de kurtosis el cual es un valor fijo que depende del tipo de distribución de la señal

de entrada; y finalmente podemos rescribir (2.38) como (2.47).

12 2

0

14 2 2

0

13 2

201

3 22

0

( ) ( )

( ) ( ) ( ) ( )

( 3) ( )

( 2) 0,1, , 1

N

ii

N

i

N

i i

N

i i

f E x k i x k

E x k i x k i x k u i

u i

i N

λ

λ λ

γ λ λ λ

γ λ λ λ

−

=

−

=

−

=

−

=

⎡ ⎤= − −⎢ ⎥⎣ ⎦⎡ ⎤= − + − − ≠⎢ ⎥⎣ ⎦

= + + ≠

= + + = −

∑

∑

∑

∑ …

(2.45)

3 22[ ( ) ( ) ( ) ( )] ( 2) tr[ ]T TE k k k k γ= + +x x R x x R R R (2.46)

( )2 22tr [ ( ) ( ) ( ) ( ) ( )] tr ( 2) tr[ ] ( )T TE k k k k k kγ⎡ ⎤⎡ ⎤⎣ ⎦ ⎣ ⎦= + +R x x K x x R R I R K (2.47)

Usando propiedades de simetría de la matriz de correlación, así como la transpuesta y

permutación cíclica podemos manipular el quinto término de (2.34) y obtener (2.48).

( ) ( )( )( ) ( )

tr ( ) 2 tr ( ) 2

tr 2 ( )

tr ( 2 ) ( )

TT Tq q

TT T Tq

Tq

k k

k

k

µ µ

µ

µ

⎡ ⎤− = −⎡ ⎤⎣ ⎦ ⎣ ⎦⎡ ⎤= −⎣ ⎦

= −⎡ ⎤⎣ ⎦

u v u v

u v

v u

R µ µ I R R µ µ I R

I R µ µ R

R I R µ µ

(2.48)

Habiendo simplificado los términos de las ecuaciones (2.37), (2.47) y (2.48) los

sustituimos en la ecuación (2.34) para obtener (2.49), la cual su transformada Z se

muestra en (2.50) donde o o(0) T=K w w .

( )( )

2 2 2 22tr[ ( 1)] tr[ ( )] 4 tr[ ( )] 4 tr ( 2) tr[ ] ( )

2 tr 2 ( ) tr[ ]

q q

Tq

k k k k

k

µ µ γ

µ

⎡ ⎤+ = − + + +⎣ ⎦+ − +⎡ ⎤⎣ ⎦v u

R K R K R K R R I R K

R I R µ µ S (2.49)



( )

( )

2

2 2 22

1

tr[ ( ( ) (0) )] tr[ ( )] 4 tr[ ( )]

4 tr ( 2) tr[ ] ( )

tr[ ]2 tr 2 ( )1

q

q

Tq

z z z z z

z

zz

µ

µ γ

µ −

− = −

⎡ ⎤+ + +⎣ ⎦

+ − +⎡ ⎤⎣ ⎦ −v u

R K K RK R K

R R I RK

SR I R µ µ

(2.50)

Ahora (2.51) se obtiene agrupando términos comunes y considerando que 2xσ=R I podemos

además reducir a (2.52).

( ){ }( )

2 2 22

1

tr 4 4 ( 2) tr[ ] ( ) tr[ (0)]

tr[ ]2 tr 2 ( )1

q q

Tq

z z z

zz

µ µ γ

µ −

⎡ ⎤− + − + + =⎣ ⎦

+ − +⎡ ⎤⎣ ⎦ −v u

I I R R R I RK RK

SR I R µ µ(2.51)

( )

( )

2 2 42

2 21

1 4 4 ( 2) tr[ ( )] tr[ (0)]

tr[ ]2 1 2 tr ( )1

q x q x

Tx q x

z N z z

zz

µ σ µ σ γ

σ µ σ −

⎡ ⎤− − + + + =⎣ ⎦

+ − +⎡ ⎤⎣ ⎦ −v u

RK RK

Sµ µ (2.52)

Despejando tr[ ( )]zRK y sustituyendo 2 2 421 4 4 ( 2)q x q x Nα µ σ µ σ γ= − + + + obtenemos

(2.53). La transformada Z inversa de (2.53) es (2.54).

2 22 (1 2 ) tr[ ]tr[ ( )] tr[ (0)] tr[ ( ) ]( )( 1)

x q x Tz zz zz z z z

σ µ σα α α

−= + +

− − − −v u

SRK RK µ µ (2.53)

1 2 2 1

1

tr[ ( ) ]tr[ ( )] tr[ (0)] 2 (1 2 )

tr[ ]( )( 1)

T

x q xzzk

z z

zz z

σ µ σα α

α

− −

−

⎧ ⎫⎧ ⎫= + −⎨ ⎬ ⎨ ⎬− −⎩ ⎭ ⎩ ⎭⎧ ⎫

+ ⎨ ⎬− −⎩ ⎭

v uµ µRK RK

S

Z Z

Z

(2.54)

La primera y tercer transformada del lado derecho de (2.54) pueden ser obtenidas de forma

simple como se muestra en (2.55) y (2.56), respectivamente.

1 ( )kz u kz

αα

− ⎧ ⎫ =⎨ ⎬−⎩ ⎭Z (2.55)

1 1 ( )( )( 1) 1

kz u kz z

αα α

− ⎧ ⎫ −=⎨ ⎬− − −⎩ ⎭

Z (2.56)



Para obtener la transformada inversa del segundo término en (2.54) recurrimos a la

ecuación (2.26) actualizándola a las condiciones presentes obtenemos (2.57).

1

2 1 1 2 1

1 1( ) (0)[1 (1 2 ) ] 1 1 (1 2 )q x q x

zzz z zµ σ µ σ

−

− − −= +− − − − −

v u vµ µ µ (2.57)

Si: 21 2 q xβ µ σ= − , 1 ( )( 1)a α β α− = − − , 1 ( )( 1)b β α β− = − − y 1 (1 )(1 )c α β− = − − ; entonces se

establece (2.58) a (2.60).

2tr[ ( ) ] tr (0)

( )( 1)T Tz zz N

z z zµ

β β= + ⎡ ⎤⎣ ⎦− − −

v u u v uµ µ µ µ (2.58)

1 1 2tr[ ( ) ] tr (0)( )( )( 1) ( )( )

TTz z zN

z z z z z zµ

α α β α β− −⎧ ⎫ ⎧ ⎫⎡ ⎤= +⎨ ⎬ ⎨ ⎬⎣ ⎦− − − − − −⎩ ⎭⎩ ⎭

v uu v u

µ µ µ µZ Z (2.59)

1 ( ) ( )( )( )( 1)

k kz a b c u kz z z

α βα β

− ⎧ ⎫= + +⎨ ⎬− − −⎩ ⎭

Z (2.60)

Ahora procedemos a obtener la transformada Z inversa como se establece en (2.61) donde 1 ( )d α β− = − y 1 ( )e β α− = − y sustituimos en (2.54) para obtener (2.62) y agrupando

términos comunes concluimos (2.63).

1 ( ) ( )( )( )

k kz d e u kz z

α βα β

− ⎧ ⎫= +⎨ ⎬− −⎩ ⎭

Z (2.61)

( ) ( ){ }2 2tr[ ( )] tr[ (0)] 2 tr (0)

(1 ) tr[ ](1 )

k k k T k kx

k

k N a b c d eα σ β µ α β α β

αα

⎡ ⎤= + + + + +⎣ ⎦

−+

−

u v uRK RK µ µ

S (2.62)

2 2 2

2 2 2 2 2

tr[ ]tr[ ( )] tr[ (0)] 2 2 tr[ (0) ]1

tr[ ]2 2 tr[ (0) ] 21

T kx x

T kx x x

k Nµ a d

N b e N c

σ β σ β αα

µ σ β σ β β σ µ βα

⎡ ⎤= + + −⎢ ⎥−⎣ ⎦

⎡ ⎤+ + + +⎣ ⎦ −

u v u

u v u u

SRK RK µ µ

Sµ µ

(2.63)



Simplificando (2.63) podemos finalmente obtener (2.64), donde de (2.65) a (2.68) se describen sus componentes.

( )tr[ ( )] k k

C T Tk J J J Eα β′= + + +RK (2.64)

( )2 2 2 2 212

0

4(0)

1

Nx q o x

C x iii

NJ k

σ µ σ σ σσ

α

−

=

+= +

−∑ u (2.65)

( )1

2

02

2 ( 1) (0)

( 1)

i

N

xi

T

NJ

α β µ β α µ σ µ

α β α β

−

=

⎡ ⎤+ + −⎢ ⎥⎣ ⎦=− + +

∑u v u

(2.66)

1

2

02

2 ( 1) (0)

( 1)

i

N

xi

T

NJ

µ β µ σ βµ

β α β α

−

=

⎡ ⎤+ −⎢ ⎥⎣ ⎦′ =− + +

∑u v u

(2.67)

( )( )

( )

2 2 2 2

2 22 2

2 2

2 2 22

1 ( 2 ) 4 1 ( 2 )

(1 )4 1 ( 2 )

q n e x

q x q q x

q x

q x q x

N NEN N

NN

µ σ σ σ σµ σ γ µ µ σ γ

µ µ σµ σ µ σ γ

+= +

− + + − + +

−+

− + +

u

u

(2.68)

Hasta ahora se analizado el problema asumiendo que la matriz de correlación es

constante durante todo el análisis; sin embargo, es común asumir que el vector de inicio es

puesto a ceros y por lo tanto se requiere N iteraciones para que este lleno de datos y

considerar la matriz de correlación constate, para este caso la condiciones iniciales

cambian, así mismo la ecuación solo es valida para 1k N≥ − entonces la ecuación (2.64)

puede ser rescrita como (2.69) y las condiciones iniciales se aproximan mediante (2.70) y

(2.71).

( ) 1 1tr[ ( )] ( 1)k N k N

C T Tk J J J E u k Nα β− + − +′= + + + − +⎡ ⎤⎣ ⎦RK (2.69)

2 1 2 2 2

0 1 1( 1) (1 2 ) (1 2 ) (1 2 )TN N

q x o q x o q x oNN w w wµ σ µ σ µ σ− −−⎡ ⎤− ≈ − − − − − −⎣ ⎦vµ … (2.70)

1

0( 1) ( 1) ( 1)

NT

iii

k N N N−

=

− = − −∑ v vµ µ (2.71)



Finalmente sustituyendo (2.64) en (2.15) podemos concluir que la curva de aprendizaje

puede ser modelado como se establece en (2.72).

( ) 2( ) k k

C T T ok J J J Eξ α β σ′= + + + + (2.72)

Para el caso en que el vector de la señal de entrada se ponga a ceros solo se sustituye la

ecuación (2.69) en la ecuación (2.15).

2.3 Análisis de estabilidad

La estabilidad del filtro es sin duda un elemento importante en cualquier proceso

recursivo, así mismo es un criterio de diseño imprescindible dentro de los filtros adaptivos

pues la rapidez de convergencia está directamente asociada a la estabilidad. A continuación

se mostrará el análisis de estabilidad del modelo propuesto en la sección anterior.

Revisando la ecuación (2.72) podemos afirmar que el algoritmo será estable cuando

se cumpla lo (2.73) y (2.74).

1 1α− < < (2.73)

1 1β− < < (2.74)

Si 2 2 421 4 4 ( 2)q x q x Nα µ σ µ σ γ= − + + + y 21 2 q xβ µ σ= − entonces podemos establecer (2.75) de

(2.73). Dado que α es una función cuadrática en la cual la variable de interés es qµ

procedemos a evaluar en el límite superior como se establece en (2.76).

2 2 4

21 1 4 4 ( 2) 1q x q x Nµ σ µ σ γ− < − + + + < (2.75)

( )

2 2 42

2 22

1 4 4 ( 2) 1

4 2 1 0q x q x

x q x q

N

N

µ σ µ σ γ

σ µ γ σ µ

− + + + =

+ + − =⎡ ⎤⎣ ⎦ (2.76)

De (2.76) obtenemos dos soluciones (2.77) y (2.78). El rango esta dado por (2.79).

1 0qµ = (2.77)

2 22

1( 2)q

xNµ

γ σ=

+ + (2.78)

22

10( 2)q

xNµ

γ σ< <

+ + (2.79)



Si se evalúa en el límite inferior las soluciones son complejas, por lo que se descartan

debido a que solo estamos considerando el caso de valores reales.

Dado que α no es una función lineal, entonces es importante conocer el valor que

minimiza la función la cual está dada por (2.80).

( )

( )

2 42

2 42

22

4 8 2

0 4 8 21

2 ( 2)

x q xq

x q x

qx

d Nd

N

N

α σ µ σ γµ

σ µ σ γ

µσ γ

= − + + +

= − + + +

=+ +

(2.80)

Para la desigualdad en (2.74) podemos fácilmente obtener (2.81).

2

2

2

1 1 2 1

2 2 010

q x

q x

qx

µ σ

µ σ

µσ

− < − <

− < − <

< <

(2.81)

Teóricamente los límites de estabilidad del algoritmo serían restringidos por las

desigualdades en las ecuaciones (2.79) y (2.81); sin embargo, en la realidad existen algunos

efectos que hacen que el comportamiento real del algoritmo y el obtenido en la ecuación

(2.72) no concuerden, una de las causas es debida al fenómeno conocido como frenado [5]

en el cual durante el comportamiento transitorio el término de actualización llega a cero

debido a que este término es muy pequeño para ser cuantizado apropiadamente, por lo que

el algoritmo se frena de tal manera que el ruido actualiza los valores del filtro, por lo tanto

para prevenir dicho problema entonces establecemos que

2 ( ) ( ) 2 Bq oe k x kµ −> (2.82)

donde cB b= cuando se utiliza truncamiento y 1cB b= + para redondeo; al elevar al

cuadrado y aplicar la esperanza a (2.82) obtenemos (2.83) y (2.84).

2 2 2 24 2 Bq o xµ σ σ −> (2.83)

2 2

22

B

q

x n e

µσ σ σ

−

>+

(2.84)

En (2.84) se establece el factor de convergencia mínimo necesario para evitar el fenómeno

de frenado.



Otro aspecto que debe considerarse, es cuando los valores de qµ son grandes, en

estos casos es común experimentar cambios bruscos en el comportamiento de estado

estable, así como variaciones pequeñas o considerables en el comportamiento transitorio

con respecto al teórico. Estas diferencias se atribuyen a que las suposiciones de

independencia utilizadas en el desarrollo teórico no son válidas para valores grandes de

qµ [6], así mismo se puede ver en la ecuación (2.68) que el exceso de error estable no es una

función lineal y que es extremadamente sensible a los parámetros de qµ y 2xσ . Una forma

de ver claro lo anterior es definiendo la sensitividad 2Sx

Eσ como el cambio en el exceso de

error de estado estable a causa de un cambio en la varianza de la señal de entrada, el cual

es definido en (2.85) y cundo es aplicado a (2.68) podemos obtener (2.86).

2

2

2Sx

xE

x

EEσσ

σ∂

=∂

(2.85)

2

22

22 2 22

2 2 4 2

1 ( 2)S1 ( 2)( )1

4

x

q xE

q xq x

q o x

NNσ

µ γ σµ σ γµ σ σ µ

µ σ σ µ

+ += +

− + +−⎡ ⎤+ ⎢ ⎥+⎣ ⎦u u

u

(2.86)

Si los valores de 2σu y 2µu son valores muy pequeños en la mayoría de las aplicaciones

podemos normalizar (2.86) como se muestra en (2.87), donde n es definida en (2.87),

0 1n< < , y 2xσ es constante.

2S 11x

E nnσ = +

− (2.87)

22( 2)

qx

nN

µσ γ

=+ +

(2.88)

La grafica de la ecuación (2.87) se muestra en Fig. 2.2a y se comprueba que para

valores grandes de qµ la sensitividad crece rápidamente y es la causa de la inestabilidad

del filtro en estado estable pues pequeños cambios en la estadística de la señal de entrada

producen cambios grandes en el exceso de error de estado estable, por lo tanto,

generalmente se descarta utilizar valores grandes qµ , lo anterior pudiera interpretarse

como algo que afecta drásticamente a la rapidez de convergencia del algoritmo; sin

embargo, dado que α es una función cuadrática y por lo tanto simétrica alrededor al

valor encontrado en (2.80) en donde se tiene la máxima rapidez de convergencia, se puede

obtener convergencias similares utilizando valores 0.5n ≤ , otra ventaja de utilizar dichos

valores es que el error de estado estable es menor ya que el desajuste es menor al 100%.



0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

5

10

15

20

25

30

35

40

45

50

n

Sen

sitiv

idad

0 0.1 0.2 0.3 0.4 0.5

1

1.1

1.2

1.3

1.4

1.5

1.6

1.7

1.8

1.9

2

n

Sen

sitiv

idad

Ec.(2.87)

6 GL

3 GL

2 GL

1 GL

(a) (b)

Fig. 2.2 (a) Gráfica de sensitividad 2Sx

Eσ , (b) Comparación de (2.87) con varias aproximaciones

de (2.89).

Hasta ahora hemos visto como el rango de operación del algoritmo ha sido cada vez

más restrictivo y encontrar un límite superior a este rango resulta una tarea difícil, pues

aunque para 0.5n ≤ la sensitividad es mucho menor, la variabilidad estadística de la señal

de entrada puede causar picos en valores cercanos a 0.5n = , los cuales pueden ser

indeseables en muchas aplicaciones. En consecuencia, es imperante establecer criterios más

restrictivos, uno de ellos sería mediante el máximo desajuste permitido o encontrando una

región de seguridad. Si ahora analizamos la ecuación (2.86) pero bajo la condición de que

lo que varía es 2xσ y lo que se mantiene constante es qµ podemos llegar a una ecuación

similar a (2.87), donde n ahora representa la variabilidad de 2xσ y no de qµ , por lo que

podemos remitirnos a la misma Fig. 2.2a en la cual podemos interpretarla de la siguiente

manera: si se está trabajando con valores grandes de n al ocurrir un cambio positivo en la

estadística, el exceso de error aumentará y a la vez el lugar de trabajo por lo que la

sensitividad aumentará en forma no lineal; ante esta situación, sin duda trabajar en la

región lo más lineal posible es muy importante para asegurar la estabilidad pues ante los

cambios de la estadística estos tendrán un efecto menor al cambiar el punto de trabajo.

Para encontrar dicha zona lineal podemos aproximar la ecuación (2.87) como una serie de

potencias (2.89) donde ν representa el grado de libertad.

22 3S 1

x

E n n n nνσ ≈ + + + +… (2.89)



En la Figura 2.2b se muestra la ecuación (2.87) con varias curvas de diferente grado

de libertad. Como se puede ver, al aumentar el grado de libertad la curva de la ecuación

(2.89) se aproxima a la curva real en el rango 0 0.5n< < que es ahora nuestra región de

trabajo, así mismo el rango que se puede considerar lineal se hace menos exigente. Una

forma muy común para medir el grado de ajuste de una curva es mediante el RMSE (Root Mean Square Error), mediante esto podemos estimar cuantos grados de libertad son

necesarios para ajustar la curva en el rango 0 0.5n< ≤ . En nuestro caso particular

podemos definir el RMSE como se establece en (2.90).

0.52

0

2 ( )RMSE MSE n dnε= = ∫ (2.90)

donde

1

( )(1 )nn

n

ν

ε+

=−

(2.91)

el cual es el valor residuo de la expansión realizada en la ecuación (2.89) y que además

representa el error entre la curva original y la expansión de series.

Resolviendo la integral en (2.90) obtenemos (2.92) podemos obtener el RMSE de

cualquier valor de ν y así la Fig. 2.3 en la cual es evidente que con al menos 10ν = se

obtiene un ajuste óptimo de la curva, así mismo representa que existen al menos 10 grados

de linealidad en el intervalo 0 0.5n< ≤ , y que podemos encontrar dichos puntos utilizando

la ecuación (2.91), ya que podemos encontrar el error óptimo en el punto máximo (2.93) y

utilizar este mismo error para encontrar los límites restantes.

2 12

0

( 1)(0.5)2 4 ln(2)( 1) 2(2 1)

i

i

iRMSEi

νν

νν

− +

=

+= − + +

− +∑ (2.92)

11

40.5 9.765625 100.5optε −= = × (2.93)



1 2 3 4 5 6 7 8 9 10 11 12 13 14 150

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

0.2

Grados de libertad

RM

SE

Fig. 2.3. Variación del RMSE al aumentar.ν .

Ahora la ecuación (2.91) se convierte en una ecuación de orden 1ν + como se muestra en

(2.94). Al resolver para los distintos valores de ν obtenemos la tabla 2.2.

1 0opt optn nν ε ε+ + − = (2.94)

Tabla 2.2 Límites lineales con ν grados de libertad.

ν 1 2 3 4 5 6 7 8 9 10 n 0.0308 0.0959 0.1688 0.2368 0.2970 0.3494 0.3949 0.4345 0.4693 0.5

1n nν = 32.5 10.424 5.9244 4.2222 3.3669 2.8623 2.5325 2.3014 2.1308 2

Algunos de los límites mostrados en la tabla 2.2 son fácilmente verificables

comparando con la Fig. 2.2b, así mismo se puede ver como al trabajar en una región

estrictamente lineal el rango de operación se vuelve extremadamente reducido; sin

embargo, en la mayoría de la veces se puede tolerar cierto grado de no linealidad

aumentando así el rango de operación. En relación al rango propuesto en [6,9] podemos

interpretar diciendo que se sugiere trabajar con aproximadamente 6 grados de libertad. Sin

embargo, si se considera el límite superior propuesto inicialmente por Horowitz y Senne

[10], y después utilizado como base del desarrollo de [9], bajo las condiciones establecidas

en este trabajo, el rango de operación en realidad coincide con (2.78), lo cual es

substancialmente diferente del resultado final obtenido en [9].

Finalmente, utilizando (2.84) y (2.88) podemos concluir que el rango de trabajo esta dado

por (2.95) donde nν representa el límite lineal con ν grados de libertad.



22 22

2 1( 2)2

B

qv xx n e n N

µγ σσ σ σ

−

< ≤+ ++

(2.95)

Las variaciones estadísticas de la señal de entrada no solo afectan al

comportamiento de estado estable, sino también al transitorio; sin embargo, al trabajar en

dentro del rango propuesto en (2.95), la convergencia del comportamiento transitorio está

garantizada, solo que pueden existir variaciones con respecto a lo estimado teóricamente en

la ecuación (2.72) en donde las simulaciones muestran que la rapidez de convergencia

puede ser mayor en ciertas regiones del rango de operación con respecto a lo estimado

teóricamente.

Finalmente podemos resumir que el modelo matemático propuesto para el análisis

de los efectos de la palabra finita en la curva de aprendizaje utilizando el modelo

estadístico de la Fig. 2.1, es descrito básicamente por las ecuaciones (2.72) y (2.95). En el

presente modelo se considera la cuantización por redondeo así como por truncamiento, así

mismo se asume que entrada estacionaria en sentido amplio, real, media cero, y los

elementos del vector de la señal de entrada son mutualmente independientes.

Tal como se mencionó anteriormente, la caracterización de la curva de aprendizaje

puede ser obtenida deacuerdo a dos casos típicos de inicialización del vector de entrada:

1. Si el vector de inicio de la señal de entrada esta formado por elementos de ruido

( ) 2( ) k k

C T T ok J J J Eξ α β σ′= + + + +

0(0) = −vµ w (2.96)

2. Si el vector de inicio de la señal de entrada es puesto a ceros

( ) 1 1 2( ) ( 1)k N k N

C T T ok J J J E u k Nξ α β σ− + − +′= + + + + − +⎡ ⎤⎣ ⎦ (2.97)

2 1 2 2 2

0 1 1( 1) (1 2 ) (1 2 ) (1 2 )TN N

q x o q x o q x oNN w w wµ σ µ σ µ σ− −−− ≈ − − − − − −⎡ ⎤⎣ ⎦vµ …

La curva de aprendizaje es válida dentro del rango variable mostrado a continuación

22 22

2 1( 2)2

B

qv xx n e n N

µγ σσ σ σ

−

< ≤+ ++

(2.98)

donde vn es obtenido a través de la tabla 2.



Como se muestra, el modelo contempla una referencia completa de curva de

aprendizaje que incluye diversos aspectos prácticos del filtro adaptivo LMS, los cuales

proporcionan información importante al diseñador tal como las variables que intervienen

en el comportamiento transitorio y de estado estable, así como la interdependencia de

ambos comportamientos; por otro lado se puede identificar claramente las aportaciones

debidas al error por truncamiento y redondeo en el comportamiento de la curva y su

comparación con la de precisión infinita.

En la mayoría de los trabajos previos el análisis se limita básicamente al estudio de

comportamiento transitorio, estado estable o rango de convergencia; esto sin duda no

permite la uniformidad de resultados, pues los modelos propuestos generalmente no son los

mismos, así mismo ciertas condiciones en un modelo pueden resultar no válidas en otro, de

tal suerte que no se puede tener certidumbre de que la caracterización completa del

sistema es confiable al momento de diseñar.

Uno de los aspectos poco tratados en la literatura es el análisis de los efectos finitos

de palabra es el comportamiento transitorio, pues como es mostrado en [3,6,8] este se

aproxima generalmente mediante curvas de decaimiento geométrico (2.99) y (2.100) las

cuales son derivadas del comportamiento transitorio del algoritmo steepest-descent.

kr e τ

−= (2.99)

1

4τ

µλ= (2.100)

Este método solo es válido cuando se desea aproximar el comportamiento transitorio con

precisión infinita; sin embargo, comparando con (2.64) dependiendo del tipo de

cuantización utilizada el comportamiento transitorio puede variar en forma considerable en

relación al estimado de precisión infinita.

Por otro lado la interdependencia entre los comportamientos de la curva de

aprendizaje es sin duda vital para el entendimiento general de la curva de aprendizaje, así

como establecer criterios de convergencia más confiables, ya que es una de las partes más

sensitivas en el diseño de un filtro adaptivo. La mayoría de las veces se acude al

conocimiento empírico del sistema así como a la simulación extensiva para establecer

rangos de operación que estimen de mejor manera dicho intervalo en comparación a las

propuestas teóricas. Algunas propuestas para estimar teóricamente el rango de

convergencia bajo las condiciones establecidas para este trabajo se muestra en la tabla 2.3.



Tabla 2.3 Rangos de operación propuestos por diversos autores

Referencia Rango

Widrow et al. [11]

max

10 µλ

< <

Haykin [12] 20tr[ ]

µ< <R

Diniz [3] 2 2

2 1tr[ ]4

cb

x e n

µσ σ σ

−

< <+ R

Feuer y Weinstein [9] 103tr[ ]

µ< <R

Frías y Romero 2 2

2

2 1(tr[ ] ( 2) )2

B

qvx n e n

µγ λσ σ σ

−

< ≤+ ++ R

Nota: 2tr[ ] xNσ=R y 2xλ σ=

Establecer el límite superior teórico del rango de operación es sin duda una tarea

difícil pues diversas variables y consideraciones están involucradas en el análisis, de tal

forma que cualquier rango teórico propuesto puede llegar a fallar si su derivación es solo

una consecuencia matemática del análisis transitorio y de estado estable y no un análisis

completo que evalúe otros aspectos importantes que causan la inestabilidad del sistema tal

como la variabilidad de los parámetros estadísticos. En el presente trabajo se obtuvieron

condiciones de convergencia y estabilidad derivadas del modelo matemático, pero además

se realizó un análisis de sensitividad del exceso de error de estado estable con respecto al

factor de convergencia y la estadística de la señal de entrada, lo anterior permite entender

de mejor manera los efectos asociados a la inestabilidad, así como la necesidad de

establecer regiones de seguridad. Sin duda la solución de este problema no consiste en

establecer rangos fijos más restrictivos que los encontrados actualmente, sino enfocarnos al

estudio de dos puntos fundamentales: suposiciones de independencia de los modelos y el

efecto de la variación de los parámetros estadísticos de la señal de entrada. Como se

mencionó al principio de este trabajo, el conocimiento de las características de la señal de

entrada es un factor que determina el análisis del filtro adaptivo, así mismo para el análisis

de estabilidad y convergencia si se tiene más información sobre el comportamiento

estadístico de la señal de entrada se puede obtener un rango operativo fijo y confiable, que

corresponda con alguno de los rangos de seguridad establecidos en este trabajo.

54

Capítulo 3

Simulaciones

“Quien ama la práctica sin la teoría es como un marinero que sube a un barco y no sabe a dónde va”

-Leonardo da Vinci-

3.1 Procedimiento de Simulación A continuación se presenta el procedimiento estándar de simulación formulado en base a la

Fig. 2.1.

1. Definir constantes del filtro adaptivo como orden del filtro, la planta a reconocer,

número de iteraciones, número de corridas independientes, varianza de la señal de

entrada, exceso de kurtosis de la señal de entrada, varianza del ruido de medición,

precisión del cuantizador de datos y el de coeficientes, y tipo de cuantización

utilizada.

2. Establecer región y factor de convergencia deacuerdo al paso 1 y a la tabla 2.3.

3. Establecer las condiciones de inicio para vector de entrada ( )kx , generación de las

muestras del ruido de medición así como el de la señal de entrada para el número de

iteraciones requeridas y cuantización del factor de convergencia.

4. Introducir muestra de la señal de entrada mediante el corrimiento del vector de

entrada.

5. Obtener la señal deseada mediante la realización el producto interno entre el vector

de entrada y el de la planta desconocida, y sumar una muestra del ruido de

medición, o( ) ( ) ( )Td k k n k= +w x .

6. Cuantizar la señal deseada.


Capítulo 3: Simulaciones 55

7. Obtener la señal de salida ( ) ( ) ( )Ty k k k= w x .

8. Cuantizar la señal de salida.

9. Generar la señal error mediante ( ) ( ) ( )q qe k d k y k= − .

10. Obtener el término de actualización de filtro 2 ( ) ( )qe k kµ x .

11. Cuantizar término de actualización de filtro.

12. Realizar actualización del filtro ( 1) ( ) [2 ( ) ( )]q qk k e k kµ+ = +w w x .

13. Se eleva al cuadrado el error y se acumula en una posición específica del vector

MSE, la cual corresponde a la iteración realizada.

14. Se repite el paso 4 hasta que el número de iteraciones definidas se cumpla.

15. Se repite el paso 3 hasta que el número de corridas independientes definidas se

cumpla.

16. Se divide el vector MSE entre el número de iteraciones totales.

3.2 Simulaciones

Diversas simulaciones en Matlab fueron realizadas para validar el modelo propuesto.

La simulación en la Fig. 3.1 muestra la curva de aprendizaje para un filtro de orden

15N = , entrada de ruido blanco de varianza 2 1xσ = , ruido blanco aditivo 2 0.001nσ = con

una precisión de 12bitsc db b= = , 200 corridas independientes y con aproximadamente 3

grados de libertad 0.01µ = .

0 100 200 300 400 500 600 700−32.5

−30

−27.5

−25

−22.5

−20

−17.5

−15

−12.5

−10

−7.5

−5

−2.5

0

2.5

5

Número de iteraciones

MS

E (

dB)

SimulaciónTeoría

0 100 200 300 400 500 600 700

−32.5

−30

−27.5

−25

−22.5

−20

−17.5

−15

−12.5

−10

−7.5

−5

−2.5

0

2.5

5


MS

E (

dB)

SimulaciónTeoría

(a) (b)

Fig. 3.1. Curva de aprendizaje comparativa utilizando: (a) redondeo, (b) truncamiento.



En la Fig. 3.1 se muestra como el desempeño de las curvas de aprendizaje teóricas

se comportan de manera aceptable en relación a lo simulado, así mismo se puede confirmar

que el error de estado estable es mayor para el truncamiento que para el redondeo; en el

caso de la Fig. 3.1a el vector de inicio está formado por muestras de ruido blanco, mientras

en la Fig. 3.1b el vector de inicio es puesto a ceros por lo tanto requiere de 15 iteraciones

para que la matriz de correlación se considere constante, de esta manera se comprueba la

validez de la ecuación (2.70) en la cual se estima ( 1)N −vµ .

En la Tabla 3.1 se analiza el error de estado estable para diferentes números de bits,

bajo las mismas condiciones establecidas inicialmente, así como para los dos tipos de

cuantización.

Tabla 3.1

Error de estado estable para ambos casos de cuantización.

Las diferencias de utilizar redondeo y truncamiento son evidentes para cuando el

número de bits es limitado (p.e. 16b ≤ ), así mismo se puede verificar que las predicciones

teóricas para ambos casos de cuantización concuerdan en forma general con la simulación.

En este caso en particular el error de estado estable no se vio afectado por las variaciones

de la estadística de la señal de entrada debido a que la región en que se encuentra el factor

de convergencia es una zona de trabajo segura como lo muestra la Fig. 2.2b ya que con 3

grados de libertad se conserva en una región lineal; sin embargo cuando el orden del filtro

aumenta indudablemente la región de convergencia se hace más estrecha y debido a la

cuantización del factor de convergencia, este último puede pasar de una región

estrictamente lineal a una región con 10 grados de libertad, por lo que hay que cuidar que

la precisión que estemos manejando sea la adecuada así como maximizar el rango de

operación variando la estadística de la señal de entrada.

En las Fig. 3.2a y Fig. 3.2b se muestra las C.A. cuando se trabaja con precisión muy

limitada, en la que es necesario que la precisión de los coeficientes sea mayor que en la de

datos para evitar el efecto de frenado, en las dos graficas se muestra que el modelo

matemático sigue siendo válido, en el caso de la gráfica de redondeo la convergencia es

alcanzada a un error de estado estable mucho menor que en el truncamiento así mismo se

Error de estado estable Redondeo Truncamiento

c db b b= = Simulación Teoría Simulación Teoría 10 1.1994x10-3 1.2124x10-3 1.2486x10-2 1.2342x10-2

12 1.1824x10-3 1.1832x10-3 1.8839x10-3 1.8735x10-3

16 1.1799x10-3 1.1806x10-3 1.1840x10-3 1.1832x10-3

20 1.1812x10-3 1.1807x10-3 1.1838x10-3 1.1807x10-3

24 1.1804x10-3 1.1807x10-3 1.1807x10-3 1.1807x10-3



puede ver como la rapidez de convergencia para redondeo es mayor comparando las

iteraciones que son necesarias para que la C.A. de redondeo alcance el error de

convergencia de la de truncamiento; este comportamiento es debido principalmente a que

la distribución ηu no es de media cero lo cual como se vio, este término está presente en la

ecuaciones (2.66)-(2.68) lo cual afecta en forma considerable el desempeño transitorio y de

estado estable.

0 100 200 300 400 500 600 700−32.5

−30

−27.5

−25

−22.5

−20

−17.5

−15

−12.5

−10

−7.5

−5

−2.5

0

2.5

5


MS

E (

dB)

Simulación

Teoría

..0 100 200 300 400 500 600 700

−32.5

−30

−27.5

−25

−22.5

−20

−17.5

−15

−12.5

−10

−7.5

−5

−2.5

0

2.5

5


MS

E (

dB)

SimulaciónTeoría

(a) (b)

Fig. 3.2. Curva de aprendizaje con 7db = y 11cb = para (a) redondeo, (b)truncamiento.

Como se mencionó anteriormente, un resultado importante de este trabajo es la

posibilidad de analizar el desempeño de la curva de aprendizaje no solo cuando la señal de

estrada es ruido blanco, sino también cuando la distribución no es perfectamente

gaussiana, así como cuando se utiliza otro tipo de ruido de banda ancha. En la tabla 3.2 se

muestra los diversos valores de γ 2 para distintas distribuciones.

Tabla 3.2 Exceso de kurtosis para varias distribuciones.

Distribución Exceso de kurtosis ( 2γ )

Bernoulli 1 (1 ) 1 6p p− + − Binomial 2(6 6 1) ( (1 ))p p np p− + −

2X 12 r Laplace 3

Lognormal 2 2 24 3 22 3 6s s se e e+ + − Maxwell 4 3− Normal 0 Poisson 1ν

Uniforme 6 5−



En Fig. 3.3a y Fig. 3.3b se muestra las curvas de aprendizaje bajo las mismas

condiciones establecidas inicialmente en esta sección solo que ahora se considera que la

señal de entrada es ruido uniforme, y deacuerdo a la tabla 3.2 2 6 5γ = − ; por otro lado, es

evidente que el modelo propuesto en este trabajo sigue siendo válido ante el cambio

mencionado, así mismo se puede verificar como la rapidez de convergencia es ligeramente

mayor para este caso en comparación con la Fig 3.1 dado que la variable α es sensitiva a

2γ y específicamente ésta última es negativa, de esta manera se puede confirmar que la

rapidez de convergencia es mayor.

0 100 200 300 400 500 600 700−32.5

−30

−27.5

−25

−22.5

−20

−17.5

−15

−12.5

−10

−7.5

−5

−2.5

0

2.5

5


MS

E (

dB)

SimulaciónTeoría

0 100 200 300 400 500 600 700

−32.5

−30

−27.5

−25

−22.5

−20

−17.5

−15

−12.5

−10

−7.5

−5

−2.5

0

2.5

5


MS

E (

dB)

SimulaciónTeoría

(a) (b)

Fig. 3.3. Curva de aprendizaje cuando 2 6 5γ = − para (a) redondeo, (b)truncamiento.

59

Capítulo 4

Conclusiones

"La diferencia entre una persona exitosa y otros, no es la falta de fortaleza, ni de conocimiento, sino la falta de voluntad"

-Vince Lombardi-

4.1 Conclusiones Un análisis completo de los efectos de palabra finita para el filtro LMS fue

desarrollado en este trabajo. La realización de un modelo analítico de la C.A. del algoritmo

LMS permitió analizar en forma integral un modelo estadístico bajo la unificación de

criterios y condiciones en todo el desarrollo matemático, y por consecuencia la uniformidad

de los resultados. En comparación a diversos trabajos previos enfocados al análisis de

estado estable con redondeo, en este trabajo se puede tener una referencia completa de la

curva de aprendizaje con los efectos de cuantización por redondeo y truncamiento. Por

otro lado, aunque la mayoría de los procesadores digital de señales utilizan cuantizadores

por redondeo, actualmente el creciente uso de los procesadores de señales embebidos

implementados en ASICs así como en FPGAs pueden hacer uso de cuantizadores por

redondeo o por truncamiento debido a su arquitectura abierta, lo cual permite evaluar el

desempeño del diseño de un filtro adaptivo LMS bajo las dos aproximaciones citadas en

este trabajo.

Finalmente podemos concluir que la predicción analítica de la C.A. resultó ser

satisfactoria dentro de los límites de estabilidad encontrados, así mismo se puede concluir

que el límite superior del factor de convergencia se encuentra en relación directa a las

variaciones estadísticas de la señal de entrada, así como del rango lineal en que se trabaja.


Capítulo 4: Conclusiones 60

4.2 Perspectivas de investigación futura En el presente trabajo se abarcó de manera satisfactoria la mayoría de los aspectos

más importantes relacionados al análisis y diseño de un filtro adaptivo LMS, así mismo,

durante el desarrollo del modelo matemático se ha podido vislumbrar algunos temas

interesantes de estudio que podrían ser desarrollados posteriormente y que

complementarían el presente trabajo. Algunos de esos temas serían los siguientes:

1. Análisis de la curva de aprendizaje del filtro LMS cuando la media estadística de la

señal de entrada es diferente de cero, así como la dispersión de los eigenvalores de la

matriz de correlación.

2. Estudios exhaustivos sobre propiedades estocásticas de ruido pseudoaleatorio,

específicamente sobre suposiciones de independencia y variabilidad de parámetros

estadísticos durante la realización de un proceso.

3. Desarrollo y verificación del modelo propuesto bajo descripción VHDL.

4.3 Aprendizaje Durante el transcurso de la carrera como en el desarrollo de esta tesis diversos retos

se me plantearon, y personalmente me siento completamente satisfecho de haber superado

cada uno de ellos, pues no solo me han permitido crecer académicamente sino también

como persona, así mismo me han ayudado a formarme un criterio más amplio y sentido de

responsabilidad y ética. Creo firmemente que ser llamado profesionista no solo involucra

obtener un papel que lo sustente sino realmente actuar como tal en todo momento.

Sin duda el realizar esta tesis me ha permitido no solo adquirir mayor conocimiento

y experiencia en las áreas de procesamiento digital de señales, álgebra lineal, y procesos

estocásticos sino que además me ha alentado a confirmar mi vocación por la investigación.

61

Referencias

[1] N.R. Yousef , A.H. Sayed, Fixed-point steady-state analysis of adaptive filters, Wiley

Internat. J. Adapt. Control Signal Process. 17 (3) (2003) 237-258.

[2] M. Andrews, R. Fitch, Finite word length arithmetic computational error effects on the

LMS adaptive weights, Proc. IEEE Internat. Conf. Acoust. Speech Signal Process.,

Washington, DC, April 1977, pp. 628—631.

[3] P.S.R. Diniz, Adaptive Filtering: Algorithms and Practical Implementation, Kluwer

Academic Publishers, Dordrecht, The Netherlands, 2002.

[4] R. Seara, J.C.M. Bermudez, W.P. Carpes Jr., An improved quantization model for the

finite precision LMS adaptive algorithm, IEEE Internat. Symp. Circuits Systems, Chicago,

IL, May 1993, pp. 858-861.

[5] R. Gupta, A.O. Hero III, Transient behavior of fixed point LMS adaptation, Proc.

IEEE Internat. Conf. Acoust. Speech Signal Process., Istanbul, Turkey, June 2000, pp.

376-379.

[6] B. Farhang-Boroujeny, Adaptive Filters: Theory and Applications, John Wiley & Sons,

New York, 1998.

[7] Vaseghi, S.V., Advanced Digital Signal Processing and Noise Reduction, John Wiley &

Sons, New York, 2000.

[8] Mitra, S.K., Digital Signal Processing: A Computer-Based Approach, New York, 2001.

[9] A. Feuer, E. Weinstein, Convergence analysis of LMS filters with uncorrelated gaussian

data, IEEE Trans. Acoust. Speech Signal Process. 33 (1) (1985) 222-230.

Referencias 62

[10] L. I. Horowitz, K. D. Senne, Performance advantage of complex LMS for controlling

narrow-bank adaptive arrays, IEEE Trans. Acoust. Speech Signal Process. 29 (3) (1981)

722-736.

[11] B. Widrow et al., Stationary and nonstationary learning characteristics of the LMS

adaptive filter, Proc. IEEE 64 (8) (1976) 1151-1162.

[12] Haykin, S., Adaptive Filters Theory, Prentice Hall, New Jersey, 1996.

Referencias 63

UNIVERSIDAD DE GUANAJUATO - telin.ugent.beafriasve/Thesis Andres Frias.pdf · Fig. 1.2 (b)...

Documents

Transcript of UNIVERSIDAD DE GUANAJUATO - telin.ugent.beafriasve/Thesis Andres Frias.pdf · Fig. 1.2 (b)...