Canal de comunicación y caos

Aplicacion de secuencias caoticas a la identificacion del canal

de comunicacion

David Arroyo Guardeno

Indice

Indice 1

1. Introduccion 2

2. Filtros de Wiener 2

3. Identificacion del canal de comunicacion vıa algoritmo LMS 33.1. Algoritmo LMS: formulacion y analisis de su estabilidad y convergencia . . . . . . 33.2. Aplicacion del algoritmo LMS al problema de la identificacion del canal de comuni-

cacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73.3. Codificacion caotica de senales de voz . . . . . . . . . . . . . . . . . . . . . . . . . 83.4. Identificacion ciega del canal de comunicacion: algoritmo DBD (Dynamic Based

Deconvolution) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

4. Simulaciones y conclusiones 104.1. Test del algoritmo LMS con codificacion caotica para diferentes valores del parametro

µ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104.1.1. Verificacion de las prestaciones de la codificacion caotica . . . . . . . . . . . 114.1.2. Decision valor de µ optimo para el caso de senales de voz codificadas mediante

senales caoticas de media cero: µ constante . . . . . . . . . . . . . . . . . . 114.1.3. Decision valor de µ optimo para el caso de senales de voz codificadas mediante

senales caoticas de media cero: esquema estocastico de iteracion . . . . . . . 124.1.4. Decision valor de µ optimo para el caso de senales de voz codificadas mediante

senales caoticas de media cero: esquema busqueda-convergencia . . . . . . . 124.1.5. Decision entre los tres valores optimos obtenidos . . . . . . . . . . . . . . . 13

4.2. Test del algoritmo DBD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134.2.1. Tasa de aprendizaje constante . . . . . . . . . . . . . . . . . . . . . . . . . . 14

4.3. Esquema estocastico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154.4. Esquema busqueda-convergencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154.5. Decision entre los tres valores optimos . . . . . . . . . . . . . . . . . . . . . . . . . 164.6. Test de los algoritmos LMS y DBD en presencia de ruido . . . . . . . . . . . . . . 16

Referencias 18

1

1. Introduccion

El objetivo sera desarrollar un metodo para codificar mediante caos las senales de voz, con elobjeto de mejorar las prestaciones del algoritmo LMS (Least Mean Square) a la hora de llevar acabo una identificacion del canal de comunicacion([1]). Asimismo se presenta tambien un segundometodo basado en el algoritmo DBD -Dynamic Based Deconvolution- ([2],[3]), con el que se lle-vara a cabo una identificacion ciega del canal. Se comenzara presentando someramente los filtrosde Wiener, tanto en cuanto el algoritmo LMS trata de aproximar tal filtro con el proposito deimplementar una realizacion on-line. Hecha tal presentacion, se desarrolla la teorıa vinculada conel algoritmo LMS, especialmente aquellos aspectos de la misma relacionados con la estabilidad yconvergencia del metodo, ya que son estos factores los que justifican la utilizacion de la codifi-cacion caotica de senales de voz. Por ultimo, se desarrolla un metodo que en lugar de partir delconocimiento de la senal enviada, aprovecha el conocimiento que se tiene respecto de la dinami-ca de aquella. Tal metodo es el DBD, el cual permite llevar a cabo la labor que aquı nos ocupasin necesidad de conocer la senal que se envıo originalmente y, por ello, se dice que realiza unaidentificacion ciega del canal.

2. Filtros de Wiener

Esta seccion pretende mostrar aquellos aspectos de los filtros de Wiener de interes para elposterior trabajo. Es decir, la descripcion aquı propuesta no es mas que una introduccion, siendorecomendable consultar [4] en caso de desear un mayor grado de detalle. Hecha esta primerapuntualizacion, el analisis comienza presentando el esquema a seguir (Figura 1).

e(n) d(n) x(n) Filtro de Wiener W(z)

Figura 1: Esquema diseno de un filtro de Wiener

El objetivo es minimizar el ındice J = E [e(n)e∗(n)], donde e(n) representa la diferencia entre lasenal deseada -d(n)- y la senal estimada por el filtro de Wiener -dest(n)-. Aquel filtro que minimizatal ındice se dice que es un filtro optimo de Wiener. Para lograr el mınimo valor posible de Jhabrıa que trabajar con un filtro IIR no causal, lo cual es muy complejo en la practica. Es decir,la solucion teorica del problema no es satisfactoria para nuestros intereses, por lo que es preferibleimponer restricciones al filtro a disenar, de modo que finalmente se desarrollara un metodo quelleva a cabo la implementacion del filtro de Wiener como un filtro FIR causal (1),

W (z) =M−1∑n=0

wnz−n, (1)

con lo que la senal estimada por el filtro vendra dada por (2), mientras que (3) define el ındice aminimizar.

dest(n) =M−1∑

i=0

wix(n− i), (2)

J = E[| e(n) |2] = E

[| d(n)− dest(n) |2] . (3)

Dado que se desea minimizar (3), la siguiente operacion sera diferenciar (3) con respecto a loscoeficientes del filtro a disenar e igualar a cero. Este proceso lleva a (4), que concreta el principiode ortogonalidad o teorema de la proyeccion sobre el cual se construye el filtro de Wiener.

∂J

∂wk= E

[2e(n)

∂e(n)∂wk

]= 0 ⇒ E [e(n)x(n− k)]

e(n) = d(n)−M−1∑

i=0

wix(n− i) ⇒ ∂e(n)∂wk

= −x(n− k). (4)

2

En efecto, si expresamos el error e(n) como la diferencia entre la senal deseada y la senal estimadapor el filtro, (4) desemboca en (5):

E

[[d(n)−

M−1∑

i=0

wix(n− i)

]x(n− k)

]= E [d(n)x(n− k)]−

M−1∑

i=0

wiE [x(n− i)x(n− k)] = 0

rdx(k) −M−1∑

i=0

wirx(k − i) = 0, (5)

expresion que, asumiendo d(n) y x(n) son procesos estacionarios en sentido amplio, lleva finalmentea la conocida como ecuacion de Wiener-Hopf (6).

M−1∑

i=0

wirx(k − i) = rdx(k). (6)

Esta ecuacion puede ser expresada matricialmente (7) de forma muy simple asumiendo que x(n)es un proceso real, lo cual implica que la funcion de auto-correlacion (rx(k) = E [x(n)x(n− k)])para x(n) es simetrica par respecto del origen (rx(k) = rx(−k)).

rx(0) rx(1) rx(2) · · · rx(M − 1)rx(1) rx(0) rx(1) · · · rx(M − 2)

.... . . . . . . . .

...

rx(M − 2). . . . . . . . . rx(1)

rx(M − 1) · · · rx(2) rx(1) rx(0)

︸︷︷︸⇓Rx

w0

w1

w2

...wM−1

︸︷︷︸⇓W

=

rdx(0)rdx(1)rdx(2)

...rdx(M − 1)

︸︷︷︸⇓rdx

(7)

Es decir, los coeficientes del filtro de Wiener vendran dados por:

W = R−1x rdx. (8)

3. Identificacion del canal de comunicacion vıa algoritmoLMS

3.1. Algoritmo LMS: formulacion y analisis de su estabilidad y conver-gencia

Dado que la solucion aportada en el apartado anterior constituye aquella para la cual el ındiceJ es el mınimo posible, cuando el filtro es FIR y causal, parece logico pensar que el diseno obusqueda de un metodo alternativo no tiene sentido. Sin embargo, la obtencion de los coeficientesdel filtro a partir de la ecuacion de Wiener-Hopf lleva asociada una gran carga computacional,tanto en cuanto implica la inversion de la matrix Rx, operacion que, desde el punto de vistacomputacional, es compleja y cada vez mas compleja a medida que crece el numero de coeficientesdel filtro a disenar, ya que dicha matriz suele estar mal condicionada. Por otro lado, a la horade obtener la ecuacion de Wiener-Hopf se asumio que los procesos aleatorios involucrados eran decaracter estacionario en sentido amplio. Ahora bien, a la hora de tratar con senales practicas reales,como las senales de voz, nos encontramos con que tal hipotesis no es aplicable. En el caso de lassenales de voz se puede pensar en la posibilidad de segmentar la senal de voz, de modo que cadauno de los segmentos resultantes permitan ser considerados como procesos aleatorios estacionariosen sentido amplio. No obstante, tal segmentacion no es recomendable en general, ya que puedeque los estadısticos asociados a la senal original cambien muy rapidamente, factor que obligarıaa disminuir el tamano de los distintos segmentos (con lo que aumenta el numero de segmentos),circunstancia que puede alterar considerablemente las caracterısticas espectrales del proceso. Endefinitiva, parece mas conveniente plantear un esquema alternativo al sintetizado en la ecuacion deWiener-Hopf (6), de modo que se llegue a un nuevo metodo que nos lleva a una solucion aceptable(pero no optima), y haga posible trabajar con procesos de caracter no estacionario, determinandolos coeficientes del filtro a disenar on-line y evitando posibles dificultades algebraicas semejantes alas previamente citadas. El metodo a desarrollar va a implementar un filtro adaptativo, es decir,los parametros libres del filtro se van a adaptar a las variaciones que experimentan los estadısticos

3

de las senales que constituyen el medio con el que se va a trabajar. En el caso particular que nosocupa, el esquema a seguir aparece en la siguiente figura (Figura 2).

x(n) e(n)d(n)Filtro transversal

WnMecanismo de control

adaptativo de los pesos del filtro

Figura 2: Esquema del algoritmo LMS

El algoritmo LMS se construye a partir de los valores instantaneos de la funcion de coste o depenalizacion:

J(n) = 1/2e2(n). (9)

La derivada de dicho ındice con respecto a los pesos del filtro adaptativo a crear es

∂J(n)∂W

= e(n)∂e(n)∂W

. (10)

El error en cada instante viene dado por

e(n) = d(n)− xT (n)W (n), (11)

donde (x)(n) = [x(n) x(n − 1) . . . x(n − M + 1)]T y W (n) = [w0(n)w1(n) . . . wM−1(n)]T . Enconsecuencia, se tiene que

∂J(n)∂W

= −x(n)e(n), (12)

expresion que constituye una estimacion del gradiente de la funcion de coste. Dicho gradiente deter-mina un vector cuya direccion indica la direccion en la que J(n) experimenta un mayor crecimiento.Dado que nuestro objetivo es minimizar J(n), el algoritmo LMS va a actualizar los valores de loscoeficientes del filtro haciendo que en cada instante estos se desplacen una cierta cantidad en ladireccion opuesta a la indicada por (12). De forma analıtica esta idea queda concretada en

W (n + 1) = W (n) + µx(n)e(n), (13)

donde µ es la tasa de aprendizaje. Dado que se lleva a cabo una realimentacion de los pesos(es decir, para calcular los pesos en el instante n + 1 se precisan los pesos en el instante n), elalgoritmo LMS sintetiza un filtro paso bajo en el sentido que tiende a atenuar las componentesde alta frecuencia del error dejando pasar las de baja frecuencia. Con el objeto de resaltar talcomportamiento se presenta en la figura 3 el diagrama de flujo asociado al algoritmo LMS, el cualse obtiene expresando (13) como

W (n + 1) = W (n) + µx(n)[d(n)− xT (n)W (n)] = [I − µx(n)xT (n)]WT (n) + µx(n)d(n), (14)

siendo I la matriz identidad, y teniendo en cuenta que

W (n) = z−1[W (n + 1)], (15)

donde z−1 es el operador retraso unidad, que lleva ımplicito el almacenamiento de valores previosde pesos.

A la vista del diagrama de flujo, se concluye que µ representa la inversa de la constante detiempo asociada al filtrado previamente resenado, es decir, pequenos valores de µ implican unproceso adaptativo lento, lo cual implica que una mayor cantidad de la informacion pasada es“recordada” por el algoritmo LMS, efecto que en ultima instancia se traduce en un filtrado de

4

µx(n)d(n) µx(n)xT(n)

W(n)W(n+1) z-1IFigura 3: Actualizacion de pesos segun el algoritmo LMS

mayor precision. En otras palabras, la inversa de la tasa de aprendizaje es una medida de lamemoria del algoritmo LMS.

La siguiente labor consiste en analizar la convergencia, ası como la estabilidad del algoritmoLMS. Sin embargo, antes de emprender tal tarea es necesario realizar una serie de aclaracionesrespecto del modo en que se actualizan los pesos del filtro objeto de diseno. Dicha actualizacionquedo plasmada en (13) y provoca que el vector de pesos W (n) no siga una trayectoria definida enel espacio de pesos, sino que dicha trayectoria es aleatoria, por lo que se dice que la aproximacionque aquı se realiza del gradiente es de caracter estocastico. A medida que el numero de iteracionesse aproxima al infinito, el algoritmo LMS hace que los pesos calculados mediante (13) definanuna trayectoria aleatoria entorno a la solucion de Wiener (Wopt). Pero lo mas importante aquı esque esta aproximacion a la solucion optima del problema se realiza sin necesidad de conocer losestadısticos asociados a las senales involucradas. Hechas las oportunas aclaraciones, se emprendeel analisis de la convergencia del algoritmo LMS. De teorıa de control se sabe que la estabilidadde un sistema realimentado esta determinada por los parametros involucrados en el bucle de real-imentacion. Si observamos la figura 3, se comprueba que es el bucle de realimentacion inferior elque permite controlar la convergencia del sistema, tanto en cuanto el bucle superior no presentaparametro ajustable alguno. Dos son los elementos que participan en el bucle de realimentacioninferior y que, por consiguiente, definen la transmitancia de dicho bucle: la tasa de aprendizaje µ yel vector de entradas x(n). Es decir, la convergencia del algoritmo LMS vendra condicionada tantopor caracterısticas estadısticas de la entrada como por el parametro µ, siendo este ultimo el unicofactor controlable para un entorno de trabajo dado. En consecuencia, el objetivo es determinaraquellos valores de µ que aseguran una buena convergencia. Ahora bien, para hallar tales valoresse ha de decidir cual ha de ser el criterio de convergencia a exigir. Dos son las posibilidades:

Convergencia en media: E[W (n)] → Wopt cuando n → ∞. Este criterio de convergencia noes de caracter practico tanto en cuanto cualquier secuencia aleatoria de vectores de mediacero converge en este sentido.

Convergencia en media cuadratica: E[e2(n)] → valor constante cuando n → ∞. Este es elverdadero criterio de caracter practico. El problema es que un analisis en profundidad de laconvergencia del algoritmo LMS en este sentido, encierra una gran complejidad, con lo quenos vemos abocados a realizar las siguientes hipotesis (teorıa de la independencia: Widrow yotros,1976):

• Las sucesivos vectores de entradas x(1), x(2) . . . son estadısticamente independientes.

• Para el instante de tiempo n el vector de entradas x(n) es independiente de todas lasmuestras anteriores de respuesta deseada del sistema, esto es, d(1), d(2) . . . , d(n− 1).

• Para el instante de tiempo n la respuesta deseada d(n) es estadısticamente independienterespecto x(n) y respecto de los valores anteriores de la respuesta deseada.

• El vector de entradas x(n) y la respuesta deseada d(n) presentan una funcion de dis-tribucion gaussiana.

Estas hipotesis permiten expresar la matriz de correlaciones de entradas como Rx = x(n)xT (n) yel vector de correlaciones entre entradas y respuestas deseadas como rdx = x(n)d(n). Asimismoaquellas hipotesis implican que, cuando n tiende a infinito, la solucion dada por el algoritmo LMS

5

tiende a la optima, es decir, la solucion dada por Wiener (Wopt). Por tanto, (13) ahora queda como

Wn+1 = (I − µRx)Wn + µrdx, (16)

expresion que, restando en ambos lados la solucion optima de Wiener y con el cambio de variableDn = Wn −W opt, da lugar a

Dn+1 = (I − µRx)Dn. (17)

Por otro lado, la matriz de correlaciones de entradas puede ser descompuesta mediante unadescomposicion SVD de modo que

Rx = V Λ V T , (18)

donde los autovectores que constituyen la matriz V forma una base ortonormal (es decir, V V T =I). Como resultado de esto obtenemos

Dn+1 = V (I − µΛ)V T Dn, (19)

que multiplicando por la izquierda a ambos lados de la igualdad, y haciendo vn = V T Dn, permiteexpresar

vn+1 = (I − µΛ)vn. (20)

Dado que la matriz Λ es diagonal (con elementos iguales a los autovalores de la matriz de correla-ciones de las entradas), podemos decir que

vn(k) = (1− µλk)vn(k). (21)

Tras n iteraciones a partir de un cierto valor inicial v0(k), nos queda

vn(k) = (1− µλk)nv0(k). (22)

Por tanto el sistema converge siempre que para todo k se cumpla que

| 1− µλk | < 1. (23)

De este modo, la convergencia del sistema exige la siguiente condicion con respecto a la tasa oparametro de aprendizaje:

0 < µ <2

λmax, (24)

siendo λmax el mayor autovalor de la matriz de correlaciones Rx. Ahora bien, dicho autovalor nosiempre se puede determinar, por lo que, teniendo en cuenta que λmax ≤

∑M−1k=0 λk = tr(Rx) =

Traza de la matriz Rx= Suma de los elementos diagonales de Rx=M · rx(0)=suma de los valorescuadraticos del vector de entradas xn, una condicion equivalente, aunque mas restrictiva serıa

0 < µ <2

M · rx(0)(25)

Por tanto si elegimos µ tal que se cumple (25), el algoritmo presenta convergencia cuadratica y con-vergencia en media, ya que la primera convergencia implica la segunda, si bien no se da la relacionrecıproca. Es decir, un sistema que converge en media puede que no converga cuadraticamente.Hasta punto se han resenado las circunstancias que determinan la convergencia del algoritmo LMS,lo que queda, pues, es determinar la rapidez de tal convergencia. Precisamente este es el principalproblema del algoritmo LMS, ya que, por lo general, se requiere un numero de iteraciones cercanoa 10 veces la dimension del espacio de entradas para alcanzar un regimen estable. El problema sehace mayor a medida que aumenta la dimension del vector de entradas (es decir, el numero decoeficientes del filtro adaptativo) y a medida que el numero de condicion de la matriz Rx aumenta,siendo el numero de condicion el cociente entre el autovalor mayor y el autovalor menor de dichamatriz. Ademas, la tasa de convergencia del algoritmo LMS es especialmente sensible a los cambiosque el entorno de trabajo provoca en el citado numero de condicion. Un analisis detallado de latranscendencia del numero de condicion de la matriz Rx puede verse en [4],[5].

6

3.2. Aplicacion del algoritmo LMS al problema de la identificacion delcanal de comunicacion

En este punto se pretende establecer un mecanismo de identificacion del canal de comunicacionbasado en el algoritmo LMS. Para ello se transmite una cierta senal conocida a traves del canal decomunicacion, de modo que el receptor recibira el resultado de la convolucion de la senal originalcon la respuesta impulsiva del canal, es decir, se asume que el canal es lineal e invariante conel tiempo. Pues bien, la identificacion del canal de comunicacion se efectuara disenando un filtroadaptativo FIR mediante el algoritmo LMS, de modo que la respuesta de dicho filtro, cuando laentrada es la senal original enviada a traves del canal, sea la senal recibida. Por tanto el modelo aaplicar sera el que aparece en la figura , donde v(n) es un ruido aditivo gaussiano de media cero(AWGN).

x(n) v(n)H(z)Función transferenciacanal de comunicaciónWn AdaptacióncoeficientesfiltroFigura 4: Modelo transmision para identificacion del canal de comunicacion

De forma generica tenemos

H(z) =∑∞

i=0 aiz−i

1−∑∞j=1 b

′jz−j

=∞∑

k=0

hkz−k, (26)

es decir, se asume que el canal es causal. El filtro adaptativo a construir es de orden M − 1, esdecir, hay que determinar M coeficientes, con lo que el esquema propuesto aproxima solo los Mprimeros coeficientes de la respuesta impulsiva del canal. Teniendo en cuenta que la senal deseadad(n) = hT x(n) + v(n), donde h = [h0 h1 . . . h∞]T , y expresando b = [h0 h1 . . . hM−1]T , tenemos

d(n) = bT x(n) + ξ(n) + v(n). (27)

De este modo el vector de correlaciones cruzadas entra la senal de entrada y la deseada , teniendoen cuenta que la senal de entrada y el ruido estan incorrelados, vendra dado por

rdx =

rdx(0)rdx(1)

...rdx(M − 1)

=

E[[

xT (n)h(n) + v(n)]x(n)

]E

[[xT (n)h(n) + v(n)

]x(n− 1)

]...

E[[

xT h(n) + v(n)]x(n−M + 1)

]

=

=

E[[

xT (n)b(n) + ξ(n)]x(n)

]E

[[xT (n)b(n) + ξ(n)

]x(n− 1)

]...

E[[

xT (n)b(n) + ξ(n)]x(n−M + 1)

]

rdx = Rxb + E [ξ(n)x(n)] . (28)

Expresion que, considerando que M es lo suficientemente grande como para despreciar el efectode la correlacion entre el termino residual ξ(n) y el vector de entradas, queda reducida al primersumando, es decir

W opt ≈ b. (29)

Por su parte la dinamica del algoritmo LMS vendra determinada por la ecuacion (13), donde

e(n) = (WT (n)− b)x(n) + ξ(n) + v(n) ≈ (WT (n)− b)x(n) + v(n) (30)

7

3.3. Codificacion caotica de senales de voz

En esta seccion se presenta un metodo de codificacion de las senales de voz de modo quela senal resultante posea un espectro plano, ya que, segun recoge [5], los autovalores asociadosa la matriz de correlaciones Rx, construida a partir de la senal codificada, estan limitados porlos valores maximo y mınimo del espectro de potencia de dicha senal. Dicho de otro modo, unnumero de condicion unitario para la matriz Rx significa un espectro plano para la senal x(n).Una de las principales caracterısticas de las senales caoticas es el “caracter plano” de su espectrode potencia. Esta circunstancia sugiere que un buen vehıculo para lograr una secuencia adecuadapara la identificacion del canal de comunicacion, es algun tipo de codificacion de la senal originalde voz mediante caos. El esquema aquı propuesto codifica la senal de voz escalandola, en primerlugar, de modo que este dentro del intervalo [-1,1] y, a continuacion, modifica en funcion de la senalde voz escalada, el valor del parametro que controla la dinamica de la secuencia caotica concretaconsiderada.

En lo que sigue se trabajara con el mapa logıstico. La dinamica del sistema viene dada por

xk+1 = rkxk(1− xk), (31)

de modo que rk se escogerk = r0 + ∆Ik. (32)

Es decir, se busca un valor del parametro dinamico r0 de modo que el comportamiento del sistemadefinido por 31 sea caotico para todo valor de k. Tal y como se comento mas arriba, la senal deinformacion ha de estar normalizada (| Ik |≤ 1 ∀k). Los valores de los parametros considerados sonr0 = 3.9757 y ∆r = 0.029. A la vista de la figura 5 se concluye que, en efecto, la codificacion caoticaesparce el espectro de la senal original de voz, de modo que la diferencia entre el valor maximo yel mınimo del espectro de potencia se ve reducida. Sin embargo, tal y como se observa en la figura5, la senal codificada caoticamente posee una alta componente de baja frecuencia, debido a queposee un cierto valor medio. Por tanto, un mecanismo para reducir aun mas el esparcimiento delos autovalores de Rx, consiste en restar a la anterior senal su valor medio. La disminucion delesparcimiento de los autovalores, fruto de la codificacion y de la posterior sustraccion del valormedio, se refleja en la tabla 3.3, la cual ha sido obtenida trabajando con la senal de voz de la figura5.

λmax/λmin

Senal Original 5270Senal codificada 987.84

Senal cod. media 0 5.1

Tabla 1: Relacion entre autovalor maximo y mınimo

8

Figura 5: Ensanchamiento de espectro mediante codificacion caotica

3.4. Identificacion ciega del canal de comunicacion: algoritmo DBD (Dy-namic Based Deconvolution)

El metodo de identificacion del canal de comunicacion propuesto en la seccion 3.2 partıa delconocimiento de la senal enviada a traves del canal. Ahora lo que se trata es de plantear un nuevoesquema que evite la necesidad de saber que senal fue enviada a traves del canal de comunicacion,motivo por el cual este nuevo metodo se dice que lleva a cabo la identificacion de forma ciega. Elmetodo que se va a utilizar se basa en el conocimiento de la dinamica de la senal transmitida. Porotro lado, el procedimiento es cuestion va a tratar de hallar la inversa de la funcion de transferenciadel canal de comunicacion. Por estas dos circunstancias, tal esquema de identificacion se dice esun metodo de deconvolucion basado en la dinamica de las senales transmitidas (en ingles dinamic-based deconvolution o, abreviadamente, DBD).

xk vk reck sk Codificación caótica Canal de comunicación Deconvolución canal z-1 Generación mapa caótico Figura 6: Esquema de funcionamiento del algoritmo DBD

El esquema a seguir es el presentado en la figura 6. La senal de voz a transmitir es codificadasiguiendo el esquema planteado en el apartado anterior. El canal de comunicacion se asume causal,lineal e invariante en el tiempo y viene representado mediante un modelo AR tal que

H(z) =1

1−∑pi=1 biz−i

. (33)

Pues bien, el bloque de deconvolucion del canal viene caracterizado por una funcion de transferenciaG(z), que es un filtro FIR de orden M (es decir, M + 1 coeficientes), siendo M mayor o igual quep. Se pretende que G(z) sea la inversa de la funcion de transferencia del canal de comunicacion.Es decir, se desea que

[G(z) ◦H(z)] = 1, (34)

9

lo cual exige que a0 = 1, ai = −bi i = 1, 2, . . . , p y ai = 0 para i > p, siendo aj los coeficientes quedefinen el filtro G(z), esto es

G(z) =M∑

i=0

aiz−i. (35)

Si denominamos xestk a la salida del filtro en el instante k tenemos que

xestk − xk = (a0reck − reck) +

p∑

i=1

(ai + bi)reck−i +M∑

i=p+1

aireck−i. (36)

Suponiendo que G(z) realiza de forma adecuada la deconvolucion, cabrıa esperar que la trayectoriadescrita por la secuencia a la salida de este filtro, sea la misma que describe la secuencia originalxk. Asumiendo que el mapa logıstico se utilizo en la codificacion, la funcion de error a emplear enla busqueda de los coeficientes de G(z) es

ek = xestk − restxest

k−1(1− xestk−1), (37)

donde rest es una estimacion del parametro de control de la dinamica del mapa caotico o un ciertovalor medio. Dado que dicho parametro va a estar fluctuando en torno a r0, se considerara querest = r0 = 3.9757. Al igual que se procedio con el algoritmo LMS, las sucesivas actualizaciones delos pesos del filtro a construir, vienen dadas por desplazamientos en la direccion contraria a la delgradiente del error cuadratico respecto de los coeficientes del filtro, siendo este

∇ake2k = 2ek(reck − restreck−1(1− 2xest

k−1)). (38)

La ley de actualizacion de pesos sera

ak+1 = ak − µek(reck − restreck−1(1− 2xestk−1)), (39)

siendo µ el parametro que determina la convergencia del algoritmo: si µ es demasiado pequenola convergencia del algoritmo DBD se lleva a cabo de forma lenta, mientras que si es demasiadogrande el sistema se desestabiliza. Para analizar las prestaciones del metodo propuesto previamentees preciso establecer cuales son los pesos optimos del filtro objeto de diseno, es decir, debemosdeterminar la solucion optima de Wiener aopt. Haciendo uso de la ecuacion de Wiener-Hopf enforma matricial (7), teniendo en cuenta que la entrada del sistema xk ahora es reck + vk y que lasenal deseada es dk = xk queda

Rentrada = E[(reck + vk)T (reck + vk)

]= Rrec + Rv,

rdx(k) = E [xn(recn−k + vn−k)] = E [xnrecn−k] = E[recn−krecT

n bext

],

a opt = [R rec + R v]−1R rec b ext. (40)

En el analisis practico se supondra Rv = 0 (caso ideal sin ruido), con lo que

a opt ≈ b ext, (41)

siendo b ext = [1 − b1 − b2 . . . − bp]T .

4. Simulaciones y conclusiones

4.1. Test del algoritmo LMS con codificacion caotica para diferentesvalores del parametro µ

El objetivo de este apartado es el de verificar el comportamiento del algoritmo LMS utilizandodiversos valores para la tasa de convergencia µ. Asimismo se comprobara la mejora experimenta-da al utilizar codificacion caotica. El primer paso consistira en definir una cierta figura que nospermita juzgar la precision del modelo. Una buena figura es la denominada desajuste del modelo(Model Misadjustment - MM-) respecto a la solucion optima de Wiener . A continuacion se anal-izan diversas situaciones (en todas ellas se considera ausencia de ruido) presentandose las graficasque concretan los resultados obtenidos. En dichas graficas se representa en decibelios la figuraMM normalizada respecto al desajuste del modelo inicial. La respuesta impulsiva del canal decomunicacion viene dada por

hn ={

12

[1 + cos( 2π

3 (n− 2))], n = 1, 2, 3

0 , e.o.c.,

mientras que el filtro a disenar presenta 128 coeficientes (M = 128).

10

4.1.1. Verificacion de las prestaciones de la codificacion caotica

Se pretende mostrar la conveniencia de emplear la codificacion caotica como herramienta paraaumentar la tasa de convergencia del algoritmo LMS aplicado a la identificacion del canal decomunicacion. Esta circunstancia se aprecia sin mas que observar la figura 8. A la vista de dichagrafica se concluye que la forma mas conveniente de llevar a cabo la identificacion del canal espor medio de codificacion caotica con senales de media cero, es decir, antes de enviar la senal atraves del canal conviene substraerle su valor medio, pues de este modo el espectro de la senalresultante no presenta una delta en el origen, lo que se traduce en un espectro de potencia planoy, en consecuencia, un numero de condicion bajo para la matriz Rx.

Amplitud normalizada

Numero de muestra

Figura 7: Senal empleada en los experimentos

MM (dBs)

Numero de iteraciones

Figura 8: Test LMS para µ = 0.02 sin ruido

4.1.2. Decision valor de µ optimo para el caso de senales de voz codificadas mediantesenales caoticas de media cero: µ constante

Se pretende determinar un valor adecuado de µ para el caso de codificacion caotica con senalesde media cero y siendo µ constante en las sucesivas iteraciones del algoritmo LMS. Los resultadosobtenidos aparecen en la figura 9, a la vista de la cual se concluye que 0.07 es un valor adecuadopara µ.

11

MM (dBs)


Figura 9: Busqueda de valor optimo para la tasa de aprendizaje

4.1.3. Decision valor de µ optimo para el caso de senales de voz codificadas mediantesenales caoticas de media cero: esquema estocastico de iteracion

El parametro µ en cada iteracion n viene descrito por

µ(n) =µ(0)n

n = 1, 2, . . . (42)

La eleccion de µ(0) determina la convergencia del algoritmo siendo crucial la eleccion de un valorpara el mismo no muy pequeno (convergencia lenta) ni demasiado grande (inestabilizacion delsistema), tal y como refiere [6]. En el caso que nos ocupa, los resultados mas satisfactorios se ob-tuvieron para µ(0) = 10 (mirar figura 10).

MM (dBs)


Figura 10: Resultados para esquema estocastico de iteracion

4.1.4. Decision valor de µ optimo para el caso de senales de voz codificadas mediantesenales caoticas de media cero: esquema busqueda-convergencia

En este caso µ es

µ(n) =µ(0)

1 + (n/τ)n = 1, 2 . . . , (43)

12

segun recoge [6]. A la vista de (43) se concluye que para valores de n pequenos respecto de laconstante de tiempo τ , µ es aproximadamente igual a µ(0). Por consiguiente, eligiendo un valorelevado para µ(0) hacemos que los pesos del filtro se actualicen de forma que se situen cerca desu valor optimo, es decir, en esta fase se lleva a cabo una busqueda del area entorno a la solucionoptima. Cuando el numero de iteraciones es considerablemente elevado, µ(n) es aproximadamenteigual a τµ(0)/n . Es en esta fase cuando los pesos del filtro convergen hacia su valor optimo, deahı que se hable de fase de convergencia. Para nuestro caso particular los resultados obtenidos paradiversos valores de los parametros involucrados en (43) aparecen en la figura 11, concluyendoseque la mejor eleccion es µ(0) = 0.09 y τ = 4000.

MM (dBs)


Figura 11: Busqueda del valor optimo de µ mediante esquema busqueda-convergencia

4.1.5. Decision entre los tres valores optimos obtenidos

Ahora es tiempo de decidir que esquema es el mas adecuado a la hora de realizar una iden-tificacion del canal de comunicacion vıa algoritmo LMS. Para ello representamos conjuntamentelas soluciones optimas obtenidas mas arriba (figura 12), concluyendo que los mejores resulta-dos se obtienen aplicando codificacion caotica son senales de media cero y un esquema debusqueda-convergencia para el parametro µ, ya que, si bien para un numero pequeno de itera-ciones la busqueda estocastica proporciona los mejores resultados, a medida que crece el numero deiteraciones las prestaciones del metodo de busqueda-convergencia supera a las de los otros meto-dos, siendo especialmente resenable el caso de la busqueda estocastica, ya que para numero deiteraciones superior a 1000 la mejora experimentada al seguir iterando es muy pequena. Es decir,el algoritmo se “estanca”, incrementandose cada vez mas la diferencia entre el MM de este metodoy el aportado por el mecanismo de busqueda-convergencia.

4.2. Test del algoritmo DBD

Se considerara que el canal viene descrito mediante

H(z) =1

1− 0.1106z−1 + 0.2309z−2 + 0.5839z−3(44)

La figura ha utilizar sera de nuevo MM y se considera que no hay ruido en el canal. Los valoresiniciales de los pesos del filtro vienen dados por el resultado de aplicar, para un numero pequeno deiteraciones, el algoritmo de identificacion del canal basado en el metodo LMS a una senal caoticapura generada a partir del mapa logıstico para r = 3.9757. De nuevo todos los resultados obtenidos,que aparecen sintetizados en las siguientes graficas, se encuentran normalizados respecto al MMdeterminado por los pesos iniciales anteriormente citados. Ademas, el resultado de tal normalizacionse expresa en decibelios. El ultimo punto a aclarar antes de mostrar las graficas es el referido a laeleccion del orden del filtro a disenar. Es decir, en el receptor se ha de suponer un cierto ordenpara el filtro a construir, teniendo que ser dicho orden igual o superior al orden del filtro AR que

13

MM (dBs)


Figura 12: Comparacion entre valores optimos de µ

modela el canal. Hechas todas las aclaraciones oportunas, pasamos a analizar el comportamientodel algoritmo DBD para las 3 implementaciones del parametro µ presentadas en la seccion anterior.

4.2.1. Tasa de aprendizaje constante

Suponiendo que conocemos a ciencia cierta el orden del filtro AR que modela el canal, y queen este caso es 3 (esto es, el canal tiene 4 coeficientes), se analiza la calidad del metodo DBDpara diversos valores de µ, siendo este constante a lo largo de las diversas iteraciones. La primeraconsecuencia destacable tras analizar la figura 13, son las oscilaciones que los coeficientes del filtroconstruido presentan una vez se ha alcanzado la adaptacion. Esto es resultado de que se intentaaproximar la dinamica de un sistema caotico, de modo que pequenos cambios en los pesos delfiltro se traducen en “grandes” diferencias entre las trayectorias predichas para dos instantes detiempo diferentes (recordar que una de los rasgos principales de un comportamiento caotico era quetrayectorias inicialmente proximas tienden a separarse exponencialmente con el tiempo). Es decir,en regimen permanente los cambios en los pesos del filtro generado mediante el algoritmo DBDse ven amplificados. La siguiente conclusion es relativa al valor del parametro de convergencia. Seobserva que para valores de µ inferiores a 0.01 el sistema es excesivamente lento, mientras que amedida que µ crece por encima de 0.01 y se acerca a 0.06 las oscilaciones en regimen permanenteson mayores, de modo que para µ mayor que 0.06 el sistema se inestabiliza. En definitiva, pareceque µ = 0.01 da lugar a un comportamiento aceptable.

14

MM (dBs)


Figura 13: Busqueda de valor optimo de µ para DBD y esquema de iteracion constante

4.3. Esquema estocastico

El valor que da mejores resultados es, teniendo en cuenta la figura 14, µ = 0.3. De dicha grafi-ca se desprende, ademas, que el esquema estocastico para µ hace que en regimen permanente elsistema no oscile, debido a que para n suficientemente grande µ presenta valores pequenos quecasi no amplifican los cambios experimentados en los pesos del filtro. Por el contrario, la robustezen cuanto a estabilidad que se gana se traduce en una convergencia mas lenta, es decir, existe uncompromiso entre precision y rapidez.

MM (dBs)


Figura 14: Busqueda de valor optimo de µ para DBD y esquema de iteracion estocastico

4.4. Esquema busqueda-convergencia

En los diversos experimentos realizados, algunos de los cuales aparecen representados en lafigura 15, se observo que para un valor de µ(0) superior a 0.08 los pesos del filtro crecen demasiadopara las primeras iteraciones del algoritmo, lo cual no conviene, pues empeora la tasa de con-vergencia. Por ello se asumio µ(0) = 0.08 como un valor adecuado. A continuacion se realizarondiversos experimentos con µ(0) = 0.08 y τ variable, concluyendose que, para µ(0) fijo, a medidaque τ aumenta las oscilaciones en regimen permanente se acentuan, debido a que µ(n) mantieneun valor elevado para un mayor numero de iteraciones. Por esta circunstancia se elige τ = 100 yµ(0) = 0.05 como un conjunto de valores que determinan un comportamiento satisfactorio.

15

MM (dBs)


Figura 15: Busqueda de valor optimo de µ para DBD y esquema de iteracion busqueda-convergencia

4.5. Decision entre los tres valores optimos

Si representamos las soluciones optimas obtenidas para cada uno de los esquemas de generaciondel parametro de aprendizaje del algoritmo DBD (figura 16), hemos de elegir como mejor opcionla representada por un diseno de µ segun el modelo de busqueda-convergencia de Moody y Darken,ya que es para esta situacion cuando se alcanza una rapida convergencia y,ademas, en regimenpermanente las oscilaciones de los pesos del filtro implementado casi no son apreciables.

MM (dBs)


Figura 16: Comparacion entre los diversos esquemas iterativos para el algoritmo DBD

4.6. Test de los algoritmos LMS y DBD en presencia de ruido

El canal de comunicacion sera modelada segun (44). Al igual que se hizo en el apartado 4.1, sesupone que el filtro a disenar mediante el algoritmo LMS posee 128 coeficientes. Las simulacionesobtenidas aparecen en la figura 17 y la figura 18, habiendose obtenido ambas segun los disenos“optimos” para cada algoritmo. La primera grafica (figura 17) nos lleva a concluir que el algoritmoDBD presenta un comportamiento aceptable cuando la relacion senal a ruido (SNR) es cercana osuperior a 20 dB. Ademas el comportamiento del algoritmo, en el caso de trabajar en las condicionesrecien resenadas, es aceptable aun cuando el orden del filtro a disenar no coincide con el orden de la

16

funcion de transferencia que modela al canal. Es mas, la tasa de convergencia del algoritmo DBD- tabla 2- para SNR = 20dB es mayor que la presenta el algoritmo LMS - tabla 3 - con senalescaoticas de media cero, si bien se observo que para ordenes del filtro a implementar superioreso iguales a 8 durante las primeras iteraciones del algoritmo DBD no existe convergencia alguna,esto es, los pesos del filtro se alejan de la solucion optima, aunque este comportamiento solo existedurante un regimen transitorio. Para concluir, es necesario resenar la importancia de seleccionarun valor no excesivamente elevado para la tasa de aprendizaje inicial en el caso del algoritmo DBD,pues a dicha tasa amplifica los efectos perjudiciales del ruido. De este modo, experimentalmentese comprobo que convenıa

µ(0) ≤ 10−7, τ = 10 para 0 ≤ SNR < 10 dBs (45)µ(0) ≤ 10−4, τ = 100 para 10 ≤ SNR ≤ 15 dBs (46)µ(0) ≤ 0.02, τ = 200 para 15 < SNR ≤ 25 dBs (47)

Tasa de convergencia aproximadas para el algoritmo DBDorden del filtro 3 4 6 8SNR<20 dBs 0.11dB/100 iter. 0.09 dB/100 iter. 0.37 dB/100 iter. 0.27dB/100 iter.SNR≥20 dBs 13 dB/100 iter. 13 dB /100 iter. 6 dB/100 iter. 3 dB/100 iter.

Tabla 2: Convergencia para DBD

MM (dBs)


(a) Orden filtro=3


(b) Orden filtro=4

MM (dBs)


(c) Orden filtro=6


(d) Orden filtro=8

Figura 17: Simulaciones para el algoritmo DBD en presencia de ruido

17

MM (dBs)


Figura 18: Analisis algoritmo LMS en presencia de ruido

Tasa de convergencia aproximada para el algoritmo LMSSNR < 20 dBs 2 dB/100 iter.SNR ≥ 20 dBs 4 dB /100 iter.

Tabla 3: Convergencia LMS en presencia de ruido

Referencias

[1] J.M.H. Elmirghani, S.H. Milner, R.A. Cryan, Experimental evaluation of echo path modellingwith chaotic coded speech, IEEE Trans. Signal Processing, vol. 45, pp. 2600-2604, Oct. 1997.

[2] A.Muller, J.M.H. Elmirghani, Blind channel estimation and echo cancellation using chaoticcoded signals, IEEE Communications Letters, vol 3, No. 3, pp. 72-74, Mar. 1999.

[3] A.Muller, J.M.H. Elmirgani, A chaotic spreading code and its application to blind channel es-timation, Proc. IEEE Global Telecommunications Conference, GLOBECOM’01, San Antonio,pp. 186-190, Nov. 2001.

[4] S. Haykin, Adaptive Filter Theory, Third Edition, Englewood Cliffs, NJ: Prentice-Hall, SignalProcessing Series, 1985.

[5] B. Widrow, S.D. Stearns, Adaptive signal Processing, Englewood Cliffs, NJ: Prentice-Hall,Signal Processing Series, 1985.

[6] C. Darken, J. Moody, Towards faster stochastic gradient search, Advances in Neural Informa-tion Processing Systems, vol. 4, pp. 1009-1016, San Mateo, CA: Morgan Kauffman, 1992.

[7] Miguel Romera, Tecnica de los sistemas dinamicos discretos, Consejo Superior de Investiga-ciones Cientıficas, 1997.

[8] C. Fernandez Perez, F.J. Vazquez Hernandez, J.M. Vegas Montaner, Ecuaciones diferencialesy en Diferencias. Sistemas Dinamicos, Thomson, Madrid 2003.

18

Canal de comunicación y caos

Technology

Transcript of Canal de comunicación y caos