Trafico Autosemejante

16
Hallazgos - Revista de Investigaciones 119 TR`FICO AUTOSEMEJANTE * Juan AndrØs PØrez Mejía** Jorge Mauricio Romero Parra*** Resumen Durante dØcadas, la ingeniería de redes ha basado el anÆlisis de trÆfico en un mismo concepto. Pero, en los œltimos aæos se han venido desarrollando teorías que rompen con estos enunciados y nos dan un nuevo enfoque para dicho anÆlisis. La mayoría del trÆfico existente en las redes actuales se comporta de forma diferente a lo que se pensaba, es de tipo autosimilar o fractal; por lo tanto, se han empezado ha desarrollar nuevos mØtodos para llevar a cabo su estudio y modelamiento. Esta autosemejanza implica un anÆlisis estadístico o probabilístico de los sucesos recurriendo a diferentes herramientas; en este caso, los modelos no correlacionados, sin memoria, de dependencia a corto plazo, de dependencia a largo plazo, Wavelet Multifractales, entre otros. En este caso se muestra, de forma general, cómo se puede lograr el anÆlisis del trÆfico por medio de tales modelos, con el fin de generar inquietudes en el lector. * El presente artículo fue presentado en la Universidad de Los Andes en el Día de las Comunicaciones, obteniendo el segundo lugar en el concurso de Posters de dicho evento. Sus autores son estudiantes de octavo y dØcimo semestre, respectivamente, de la Facultad de Ingeniería de Telecomunicaciones de la Universidad Santo TomÆs y miembros del Grupo de Investigación INVTEL de dicha Facultad. ** [email protected] *** [email protected]

Transcript of Trafico Autosemejante

Page 1: Trafico Autosemejante

Hallazgos - Revista de Investigaciones 119

TRÁFICO AUTOSEMEJANTE*

Juan Andrés Pérez Mejía**Jorge Mauricio Romero Parra***

Resumen

Durante décadas, la ingeniería de redes ha basado el análisis de tráfico en un mismo concepto. Pero,en los últimos años se han venido desarrollando teorías que rompen con estos enunciados y nos danun nuevo enfoque para dicho análisis.

La mayoría del tráfico existente en las redes actuales se comporta de forma diferente a lo que sepensaba, es de tipo autosimilar o fractal; por lo tanto, se han empezado ha desarrollar nuevos métodospara llevar a cabo su estudio y modelamiento. Esta autosemejanza implica un análisis estadístico oprobabilístico de los sucesos recurriendo a diferentes herramientas; en este caso, los modelos nocorrelacionados, sin memoria, de dependencia a corto plazo, de dependencia a largo plazo, WaveletMultifractales, entre otros.

En este caso se muestra, de forma general, cómo se puede lograr el análisis del tráfico por medio detales modelos, con el fin de generar inquietudes en el lector.

* El presente artículo fue presentado en la Universidad de Los Andes en el Día de las Comunicaciones, obteniendo el segundo lugar en elconcurso de Posters de dicho evento. Sus autores son estudiantes de octavo y décimo semestre, respectivamente, de la Facultad de Ingenieríade Telecomunicaciones de la Universidad Santo Tomás y miembros del Grupo de Investigación INVTEL de dicha Facultad.

** [email protected]

*** [email protected]

Page 2: Trafico Autosemejante

Universidad Santo Tomás120

Palabras clave

Fractales, modelos de Tráfico, autosemejanza, dependencia a corto plazo, dependencia a largo plazo.

Abstract

During decades, traffic analysis has been based in a same notion. However, in the last years, newtheories which break with those statements and gave us a new approach for this analysis are gettingexpounded.

Most of the traffic that now days exists in modern networks has a different performance than expected,now days traffic has a self-similar or Fractal behavior, thus, new methods to study and modeling traffic aregetting expounded. Statistics and probability analysis of those events, helped by some tools, such asnot correlate, no memory, SRD, LRD and Wavelet Models is needed due to this self-similarity.

This paper shows how traffic analysis can be done through these models in order to generate concernsin the reader.

Index terms

Fractals, traffic modeling, self-similarity, long range dependence, short range dependence.

Introducción

La necesidad de conocer el comportamiento deltráfico telemático subyace a toda discusión rela-cionada con el dimensionamiento y diseño decontroles en redes de telecomunicaciones.

Se puede afirmar que la evolución del mundo delos servicios de telecomunicación desde haceuna década ha venido determinada por dos he-chos fundamentales:

� En primer lugar, por una mayor globalizaciónde los servicios, que hasta ahora ha podidoser posible especialmente por el desarrollode una mayor conectividad, pero sobre todopor la fulgurante expansión de un protoco-lo distribuido como Internet.

� En segundo lugar, se ha constatado la nece-sidad de una progresiva integración de losservicios que rompe de plano la separacióntradicional de las redes físicas exclusiva-mente pensadas para un tipo de servicio(básicamente redes de distribución de TV,redes telefónicas y redes de datos). Estaintegración obliga a compaginar sobre unamisma red exigencias de calidad de servi-cio muy diversas, que van desde el bajoretardo y cierta tolerancia a pérdidas delos servicios de voz, a la tolerancia a retar-dos y las pérdidas nulas exigidas por mu-chos servicios de datos.

Page 3: Trafico Autosemejante

Hallazgos - Revista de Investigaciones 121

Cualquiera que sea el escenario definitivo con-creto sobre el que se asiente este universo do-minado por la integración y la exigencia de cali-dad, el hecho indiscutible es que existe la nece-sidad de definir diversos controles y mecanis-mos de gestión de tráfico que garanticen, demanera individualizada, la calidad exigida porcada servicio. Actualmente muchos de estoscontroles se encuentran en estado embrionarioo, cuando menos, por optimizar de una maneraeficiente.

Por su parte, la correcta definición de estos con-troles, así como el dimensionamiento de com-ponentes de la transmisión (buffers, enlaces �),exige un amplio conocimiento de los flujos detráfico que van a ser transmitidos. Este conoci-miento implica caracterizar, modelar e inclusopredecir con precisión el comportamiento dedichos flujos. Por todas estas razones, el mode-lado de tráfico telemático se encuentra en elnúcleo de la problemática actual de las redesintegradas.

Modelamiento del tráfico

Se entiende por modelado de tráfico una abs-tracción matemática más o menos compleja quetrata de imitar alguna o varias características es-tadísticas de un tipo de tráfico real o de un flujoconcreto en particular. Dado que los modelospoissonianos tradicionalmente usados con el trá-fico telefónico se han demostrado insuficientespara caracterizar las nuevas fuentes de tráfico,buena parte del esfuerzo investigador en estosúltimos años se ha centrado en el modelado demuestras obtenidas en redes reales (Casilari et al.).

Desde el trabajo de Kleinrock a mediados de los60, se encuentra la existencia de dependenciatemporal que ha sido objeto de estudio por par-te de numerosos autores, destacando el descu-brimiento del enorme impacto que puede lle-gar a tener sobre las prestaciones de un sistema

de colas. A la vista de este hecho, han ido apare-ciendo nuevos modelos de tráfico de entradaque exhiben estructuras de correlación más omenos complejas, aplicados a casos en que elmodelo del sistema de comunicaciones en es-tudio permite mantener la tratabilidad analítica.En cualquier caso, estos modelos (fundamental-mente markovianos) desprecian la correlación apartir de determinada separación en el tiempo,aunque ésta puede ser aumentada a costa de com-plicar el modelo con parámetros adicionales.

Sin embargo, un trabajo presentado por Leland,Willinger, Taqqu y Wilson en ACM SIGCOMM �93mostraba, tras la observación de exhaustivas me-diciones realizadas sobre una red Ethernet enBellcore (NJ, USA), que el tráfico (número de tra-mas en la red por unidad de tiempo) era de natu-raleza fractal, �autosimilar� o �autosemejante�(self-similar), que implica la existencia de una acu-sada correlación a largo plazo (Long-RangeDependence �LRD�).

Posteriormente, el mismo carácter fractal ha sidoobservado en redes WAN, en los datos de SS7, enel tráfico debido a la World Wide Web (WWW), oincluso en el tráfico de video de tasa variable(Variable Bit Rate �VBR�). Todos estos hallazgoshan contribuido enormemente a un replantea-miento muy significativo de la modelaciónestocástica del tráfico de entrada y del análisisde prestaciones, ya que muchos estudios hanpuesto de relieve el enorme impacto que la de-pendencia temporal a largo plazo puede llegara tener sobre las prestaciones de las redes decomunicaciones, frente a otros modelos que sehan venido usando hasta hace poco y que, obien no presentan correlación temporal algunapor simplicidad analítica, o exhiben una estruc-tura de correlación más complicada analíticamen-te (como los modelos markovianos o autorre-gresivos habitualmente utilizados), pero que po-dríamos denominar a corto plazo (Short-RangeDependence-SRD) (López, José).

Page 4: Trafico Autosemejante

Universidad Santo Tomás122

En este sentido, al investigador le caben dos op-ciones: muestrear el tráfico en una red a la quetenga acceso y autorización para �espiar� (estohabitualmente sólo es posible para una red deárea local LAN) o recurrir a las múltiples basesde datos con muestras de tráfico que ofreceInternet. Los ejemplos de este último tipo sonnumerosos, tanto para tráfico Ethernet, tráfico enredes de área metropolitana, tráfico TCP/IP co-rrespondiente a servicios HTTP (Web) o tráficode video VBR correspondiente a estándares MPEGy M-JPEG.

La principal ventaja de trabajar con bases de da-tos conocidas es la posibilidad de tener un mar-co común de experimentación en el que se pue-den cotejar los modelos obtenidos con los co-rrespondientes a otras propuestas. Por su parte,el muestreo puede ser directo, analizando el trá-fico que directamente fluye por el enlace, o in-directo, estudiando de una manera off-line, so-bre un servidor, el volumen de información (fi-cheros en servidores FTP, tamaño de correos elec-trónicos, páginas Web, películas MPEG,�) a laque los clientes tendrán acceso. En el primercaso (medida directa), la muestra se ve fuerte-mente determinada por la torre de protocolosde la red concreta que se muestrea. En el se-gundo caso, el muestreo se produce a nivel deaplicación, por lo que el modelo resultante seríaindependiente de los niveles inferiores.

Otro aspecto clave a la hora de definir un mode-lo es decidir la escala de tiempos a la que elmodelo debe representar convenientemente larealidad. A menudo resulta completamente in-útil y costoso tratar de modelar las fluctuacionesque se producen a todas las escalas en ciertotráfico. La aplicación final del modelo estableceuna escala de interés sobre la que debe centrar-se el esfuerzo modelador y que determina losfactores claves a imitar y los que pueden serobviados. Así, si el problema reside, por ejem-plo, en dimensionar una red WAN para períodosde meses o años, el modelo debe ser capaz depredecir la evolución del mercado. Si, por el con-trario, el dimensionado ha de hacerse a más cortoplazo, tratando de analizar la hora cargada al cabode un día, el elemento central es el usuario,mientras que para controles destinados a gestio-nar la calidad de la aplicación, ésta se puedeconvertir en el factor clave. Así mismo, si el con-trol a diseñar trabaja a escalas de tiempo puederesultar fundamental modelar con cuidado losefectos que imponen los niveles inferiores de latorre de protocolos.

El objetivo básico de un modelo de tráfico es sercapaz de imitar el �comportamiento� del tráficoreal. Sin embargo, esta cualidad (la correspon-dencia con la realidad) no es el único conceptoque debe considerarse a la hora de elegir unaestrategia de modelado. Así, resultan de espe-cial interés otros aspectos como:

1,9(/�)Ì6,&2 1,9(/�'(�$3/,&$&,Ð1�

(92/8&,Ð1�'(/�0(5&$'2�<�/$�7(&12/2*Ì$

868$5,21,9(/(6�'(�(1/$&(��5('�75$163257(����

(VFDOD�GH�WLHPSR

µ�VHJ �PVHJ �����VHJ VHJXQGRV PLQXWRV KRUDV GtDV PHVHV DxRV

Márgenes de actuación a grandes rasgos de los factores genéricos

de influencia en el tráfico telemático

Page 5: Trafico Autosemejante

Hallazgos - Revista de Investigaciones 123

� La tratabilidad analítica del modelo; esto es,la capacidad intrínseca del modelo de arrojarresultados analíticos, sin necesidad de simu-lación.

� La facilidad de implementación, ya sea víasoftware para proceder a simulaciones o víahardware con el objetivo de disponer de ungenerador de tráfico sintético en tiempo real.Esta característica exige simplicidad no sóloa la propia estructura del modelo, sino tam-bién a la algoritmia y los costes computa-cionales que exige su implementación.

� La �parsimonia� del modelo. Con este con-cepto, que recurre al significado original dela palabra parsimonia, se describe la capaci-dad del modelo para ser descrito medianteun conjunto reducido de parámetros. Deigual importancia, resulta la posible signifi-cación física de los parámetros. Se debe serconsciente de que al usuario final hay queofrecerle una representación de la realidadcomprensible, flexible, pero con una variabili-dad acotada y controlable mediante unosparámetros que posean una conexión eviden-te con la realidad (por ejemplo: velocidad máxi-ma, velocidad de pico, tamaño de ráfaga�).

� Capacidad de modelar otros tipos de tráfico,en especial tráfico agregado. En numerosasocasiones se puede exigir de un modelo,en especial de los generalistas, la maniobra-bilidad suficiente para que, mediante cier-tos cambios de sus parámetros, sea capazde imitar otros tipos de tráficos o incluso elpropio tráfico agregado que resulta demultiplexar sobre un canal varias fuentesindividuales.

Una manera razonable de clasificar los modelosde tráf ico es mediante el análisis de laautocorrelación que presentan. La función de co-eficientes de autocorrelación R

X(k) de cierta se-

ñal X[n] es un indicador del grado de dependen-cia lineal que existe entre una muestra X[i+k] yla k-ésima muestra anterior:

Donde E[�] es el operador esperanza matemáti-ca, mientras que σ

X2 y µ

x indican, respectivamen-

te, la varianza y la media de la señal X[n], la cual,en el caso de modelado de tráfico, lleva apareja-do la evolución en el tiempo de una variablefísica (por ejemplo: número de usuarios conec-tados, duración de una llamada, número de bitstransmitidos durante cierto intervalo, tiempoentre paquetes, tamaño del paquete...).

De acuerdo con la forma en que el modelo im-pone a esta función, se puede distinguir entre:

� Modelos no correlacionadoso ruidos blancos

Se trata de señales en donde no existe relaciónde ningún tipo entre las muestras de la secuen-cia (R

X(k)=0 para todo k≠0), de tal modo que

cada muestra es generada a partir de la mismafunción de distribución estadística, pero con to-tal independencia de las anteriores. Estos mode-los estadísticamente independientes se han pro-bado válidos para modelar ciertos aspectos de lageneración del tráfico, entre los que podemosmencionar el tiempo entre llamadas, la duraciónde la llamada o el tamaño de los ficheros trans-mitidos. Dentro de este grupo, habría que in-cluir a modelos clásicos muy extendidos en todoslos ámbitos, como el de Poisson (en donde el tiem-po entre eventos se distribuye exponencialmente),o los ruidos normales o gaussianos (Casilari et al.).

� Modelos sin memoria

Los tiempos entre llegadas, T, son independien-tes y exponencialmente distribuidos, de manera

[ ] [ ][ ]�����

��� [[

[

[L;NL;(N5 µµ

σ−−+=

Page 6: Trafico Autosemejante

Universidad Santo Tomás124

que el tiempo que toca esperar hasta ver la próxi-ma llegada es independiente del instante en quese empiece a observar, esto se conoce como la«falta de memoria» de la distribución exponencial.

Esta propiedad también aparece en modelos detiempo discreto en los que, en cada ranura detiempo, la llegada de un paquete se da con pro-babilidad p, independientemente de otras ranu-ras. El número de llegadas en intervalos de n ra-nuras es una variable binomial (n, p), mientrasque el número de ranuras N que toca esperarhasta ver la llegada del próximo paquete es unavariable geométrica que también carece de me-moria (Alzate, Marco y Peña, Néstor).

� Modelos de renovación

Los procesos de renovación son una extensiónde los modelos de tráfico sin memoria, en losque los intervalos de tiempo entre llegadas depaquetes son independientes e idénticamentedistribuidos, aunque no necesariamenteexponenciales o geométricos.

El tiempo que falta esperar hasta ver la llegadadel próximo paquete depende de hace cuántotiempo llegó el último paquete. Aunque estamemoria incrementa la complejidad analítica delos procesos generales de renovación con respec-to a los procesos sin memoria, sigue siendo nulala correlación entre los tiempos entre llegadasde paquetes consecutivos, lo cual hace que es-tos modelos sigan siendo analíticamente trata-bles para estudiar el desempeño de los elemen-tos de la red (Alzate, Marco y Peña, Néstor).

� Modelos de dependenciaa corto plazo

El carácter intermitente (o por ráfagas) del flujode datos impuso desde un principio la necesi-dad de introducir correlación en los modelos de

tráfico, ya que la llegada de paquetes se encuentrafuertemente correlacionada. Las primeras solu-ciones de este tipo pasaron por sencillas cade-nas markovianas de pocos estados. En un proce-so markoviano, la correlación viene dada por elhecho de que el estado actual del sistema de-pende exclusivamente del estado anterior. Eneste grupo de procesos markovianos habría queincluir un modelo tan extendido como los pro-cesos On-Off, aproximación simple y razonablede las fuentes de datos y voz. Una fuente On-Off consta de dos estados. Durante el estadoOn se emite tráfico a tasa constante mientrasque durante el estado Off (período de silencioen el caso de la voz) la fuente permanece ocio-sa. Los tiempos de permanencia en cada estadoen principio son exponenciales, aunque otrasdistribuciones son posibles (procesos semimar-kovianos).

Otros modelos muy conocidos los constituyenlos procesos modulados por Markov, en especialel MMPP (Markov Modulated Poisson Process)de dos estados. De acuerdo con este modelo,apropiado para modelar el agregado de fuentesOn-Off, la generación de tráfico evoluciona en-tre dos estados con generación poissoniana, perode tasa media distinta. Por el contrario, la nece-sidad de definir una matriz con las probabilida-des de conmutación entre estados hace que elnúmero de parámetros crezca geométricamentecon el número de estados considerado. En esecaso, y a costa de perder la mencionadatratabilidad, se puede recurrir a los filtros ARMA(Auto Regresive Moving Average), en los que elvalor de la muestra actual X[n] se obtiene a par-tir de N

a valores anteriores de X[n] y N

b valores

de un ruido blanco aleatorio w[n] denominadoproceso de innovación, del modo

[ ] [ ] [ ]LQZELQ;DDQ;E

1

W

W$50$

1

W

WR$50$−+−+= ∑∑

==

����

Page 7: Trafico Autosemejante

Hallazgos - Revista de Investigaciones 125

Donde Na y Nb se corresponden con los órdenesde la parte AR y MA, respectivamente, y los co-eficientes ai y bi son diseñados para imitar losprimeros coeficientes de autocorrelación (Casilariet al.).

Los filtros ARMA (Procesos Autorregresivos deMedias Móviles) son la unión del Proceso AR(Autorregresivo), el cual es un filtro todo polos ycuya ecuación en diferencias que relaciona laentrada y la salida es:

�������

QZLQ[DQ[1D

L

L=−⋅+ ∑

=

Proceso de MA (Medias Móviles), el cual es unfiltro todo ceros y cuya ecuación en diferenciaspara la relación entrada-salida es:

¦

�� 1E

L

LLQZEQ[

����

Los procesos ARMA son entonces un filtro linealque tiene polos y ceros finitos en el plano Z(Proakis, Jhon G. y Manolakis, D.).

Otro modelo autorregresivo es el modelo TES(Transform Expand Sample). Este modelo, ademásde invertir la función de distribución acumulativade los tiempos entre llegadas, consiste en gene-rar probabilidades de éstas mediante númerospseudoaleatorios correlacionados, opera con arit-mética módulo 1 y no es lineal. Por lo tanto, coneste modelo se pueden ajustar la autocorrelaciónde muestras reales de tráfico y la distribuciónmarginal de los tiempos entre llegadas (Alzate,Marco y Peña, Néstor).

En cualquier caso, los procesos markovianos ylos filtros ARMA, así como alguna otra soluciónmás compleja que se podría englobar en estegrupo, como los procesos TES, tienen en comúnsu incapacidad para aproximar la función de

autocorrelación para valores altos del retraso k.Efectivamente, estos procesos se diseñan paraajustar las dependencias a corto plazo o SRD(Short Range Dependence) y presentan indefec-tiblemente una caída exponencial de la funciónde autocorrelación (Casilari, A. et al.):

∞→− N����FXDQGR������NH[S��N5;

���� α

� Modelos de dependenciasa largo plazo

Las LRD, que se reflejan estadísticamente en co-eficientes de autocorrelación con un decaimien-to lento o hiperbólico, se asocian a la existenciade una variabilidad del tráfico en una amplia gamade escalas temporales que los modelos tradicio-nalmente empleados no son capaces de recogery que pueden tener consecuencias graves paramuchos esquemas de control, donde se suponeuna escala "natural" y acotada, en donde se ma-nifiesta el carácter rafagueante del tráfico.

Por su parte, esta variabilidad de la señal se ligaa cierto grado de autosemejanza o fractalidadque ha permitido aplicar en este campo las con-clusiones y la analítica desarrollada porMandelbrot y otros autores que han estudiadoprocesos fractales en otras ramas de la ciencia.Las LRD han venido a revolucionar, al menos par-cialmente, el ámbito del modelado de tráficotelemático, ya que también se han detectadoen otros tipos de tráfico: servicios Web, tráficoIP, tráfico de video, tráfico de enlaces metropoli-tanos y de red de área extensa. El argumentohabitualmente esgrimido para explicar las LRDen series temporales es la existencia de una es-tructura multinivel de generación. Así, para justi-f icar la LRD del tráfico Web se apela a lainteracción del comportamiento del usuario (pre-ferencias por ciertos ficheros, tiempo de análisisde páginas Web,...) con las políticas de caché de

Page 8: Trafico Autosemejante

Universidad Santo Tomás126

los buscadores, el tamaño subexponencial de losobjetos en las páginas Web y el agregado detráfico que resulta en la LAN. En el caso de lassecuencias de video, las LRD se suelen funda-mentar por la existencia de una escala de tiem-po superior cuya duración se ha probadosubexponencial. Efectivamente se puede probarque un proceso cuyos niveles de actividad (tasamedia de generación) oscilan de acuerdo conuna temporización de colas pesadas presentarácaracterísticas LRD. Hasta la fecha existen dostécnicas genéricas en las que se podrían agru-par los modelos planteados para aproximar lanaturaleza LRD de una señal de tráfico:

� Modelos multinivel. En estos modelos se imi-ta directamente la variabilidad existente auna serie de niveles o escalas de tiempo.Cada nivel suele modelarse mediante un pro-ceso "clásico" (habitualmente cadenas deMarkov) que modula la generación a nive-les inferiores. Su variabilidad en ese caso selimita a las escalas contempladas (modelos"quasi-fractales") presentando el inconvenien-te de que ofrecen estructuras complicadas,de escasa tratabilidad, cuya definición requie-re un número amplio de parámetros, lo queperjudica la parsimonia del modelo.

� Modelos autosemejantes. Estos modelos yaresponden a estructuras estrictamentefractales, es decir, de variabilidad a todas lasescalas de tiempo. Se corresponden conmodelos generalistas bien conocidos, comolos ruidos gaussianos fraccionarios o FGN(Fractional Gaussian Noise), o los procesosARMA integrados fraccionarios, o FARIMA.Mientras que los primeros generan señalesfractales puras (con la misma forma de dis-tribución estadística con independencia dela escala temporal desde la que son con-templados), los segundos son capaces deañadir el ajuste de las dependencias a cortoplazo, o SRD, incorporando una típica es-

tructura autorregresiva de media móvil(ARMA). La principal ventaja de estos mode-los, frente a la aproximación desarrollada porlos del grupo anterior, es que son capacesde representar la LRD mediante un únicovalor, el parámetro H o de Hurst, que deno-ta el grado de autosemejanza de la muestraa modelar.

�����FRQ

N��FXDQGR���N��N5/5'

<<∞→−

βα β ���

De esta manera, estos modelos presentanun alto grado de parsimonia. Por el contra-rio, su principal desventaja radica precisa-mente en la dificultad de una estimaciónajustada de H, el cual es un valor acotadoentre 0.5 y 1. Esta dificultad se explica porla propia naturaleza de los estimadores pro-puestos, los cuales se basan en la mediciónde comportamientos asintóticos o en laminimización de funciones que suponenpreviamente una forma al espectro y queintroducen siempre cierto sesgo en la me-dida, ya de por sí limitada a un estrechointervalo. Esta problemática se agrava cuan-do estos diversos estimadores se aplicansobre series de tráfico real finitas y con posi-bles problemas de no estacionariedad. A estadificultad hay que añadir la complejidadcomputacional de la propia estimación, asícomo la complejidad de generación que laejecución rigurosa de estos métodos reque-riría, aunque se debe apuntar que existensoluciones aproximadas (que, por ejemplo,acotan el número de coeficientes a consi-derar) que pueden solventar parcialmenteeste problema a efectos prácticos (Casilariet al.).

De esta manera, la aproximación a la naturalezaLRD exige decidir en un compromiso a favor dela parsimonia o de la complejidad de medida y

Page 9: Trafico Autosemejante

Hallazgos - Revista de Investigaciones 127

generación. En cualquier caso, hay que reseñarque el éxito de los modelos fractales vendrá de-terminado por las consecuencias prácticas queen la realidad posee la existencia de la LRD enel tráfico telemático.

Así, uno de los principales efectos de cargar unmultiplexor con tráfico autosemejante o fractales el hecho de que las pérdidas decaen muylentamente conforme aumenta el buffer de con-tención; en oposición, los modelos clásicos(incorrelados o SRD) aumentar el buffer provocacaídas exponenciales de las pérdidas. Esto pue-de implicar la inutilidad de las técnicas debuffering al tratar con tráfico fractal, ya que au-mentar el buffer provoca incrementos en el re-traso sin obtener ganancias significativas en cuan-to a pérdidas. Sin embargo, son muchos los au-tores que opinan que este fenómeno puede seromitido, pues sólo comienza a ponerse de ma-nifiesto con tamaños de buffer muy grandes, in-tolerables de por sí para muchos tipos de servi-cios, especialmente todos los que conllevan trans-misiones en tiempo real, como muchos servi-cios de video.

Otra problemática asociada a la fractalidad es suescasa tratabilidad analítica, así como la conver-gencia más lenta de las medidas de simulaciónque imponen estos procesos de variabilidad alargo plazo (las simulaciones con procesosfractales pueden llegar a ver su duraciónincrementada en varios órdenes para obtenerresultados con la misma fiabilidad que los quese pueden conseguir con procesos SRD o nocorrelacionados similares) (Casilari et al.).

A modo de resumen, podría decirse que la apa-rición de los modelos fractales en el campo dela modelación estocástica del tráfico ha resulta-do fundamental, debido a su capacidad de exhi-bir dependencia a largo plazo sobre todas lasescalas temporales mediante el uso de pocosparámetros (modelación "parsimoniosa"). Como

consecuencia de ello, se ha abierto un amplioespectro de líneas de investigación que condu-cen, por un lado, a resolver nuevos problemasplanteados en la aplicación de los modelosfractales en el análisis de prestaciones; y, por otrolado, a disponer de resultados y argumentos querevelen el impacto de la estructura de correlación(a largo y a corto plazo) sobre las prestaciones delas redes (López, José).

La autosimilitud estocástica, al igual que ladeterminística, se puede ilustrar gráficamente,como se ve en la figura anterior con la señal devideo MPEG y con el ruido autosemejante. Con-siderando que el tráfico es una traza muestralde un proceso estocástico y restringiendo la si-militud a ciertas estadísticas de las series de tiem-po reescalizadas, se puede apreciar fácilmenteautosimilitud exacta en los objetos matemáticosabstractos y autosimilitud aproximada en las rea-lizaciones específicas (Alzate Monroy, MarcoAurelio).

Para medir la autosimilitud estocástica, se pue-den utilizar las estadísticas de segundo ordenque capturan la variabilidad de los procesos. Dehecho, la invarianza a la escala se puede definir

Page 10: Trafico Autosemejante

Universidad Santo Tomás128

en términos de la función de autocorrelación,pues el decrecimiento polinómico (en vez deexponencial) de esta función es la manifesta-ción de la "dependencia de largo rango" que, enuna importante clase de procesos, es equivalen-te a la autosimilitud.

Aunque los fenómenos de autosimilitud en eltráfico de las actuales redes de comunicacionesse descubrieron hace una década aproximada-mente, en nuestro medio no se ha abordadoformalmente el tema, pues todavía se le consi-dera como un aspecto muy avanzado de lateleinformática. Sin embargo, los efectos queeste fenómeno produce en el desempeño delas redes exigen un estudio inminente del tema.Si se quiere hacer un estudio serio del tema, sedebe ubicar al nivel de abstracción matemáticoque se necesita; por eso, la presentación de losconceptos no puede dejar de ser formal (AlzateM., Marco Aurelio).

Definición en tiempo continuo

Una definición común de procesos estocásticosen tiempo continuo está basada en un escala-miento directo de la variable de tiempo conti-nuo. Un proceso estocástico x(t) esestadísticamente autosimilar con parámetro H

������ ≤≤ + si por cualquier real a>0, el proce-

so a-H(at) tiene las mismas propiedades que x(t).Esta relación puede ser expresada por las siguien-tes tres condiciones:

�+DDW[(

W[(�@�>

�@�> = media

�+DDW[9DU

W[9DU�

�@�>�@�> = varianza

�+

[

[ DDVDW5

VW5�

������ = autocorrelación

El parámetro H, conocido como el parámetro deHurst, es la llave para medir la autosimilitud. Másprecisamente, H es una medida de la persisten-cia de un fenómeno estadístico y es una medi-da de la longitud de la dependencia de rangolargo en un proceso estocástico (Stallings, W.,1998) Un valor de H=0.5 indica la ausencia deautosimilitud. El valor más alto de H es 1, elmayor grado de persistencia de una dependen-cia de rango largo y la aleatoriedad desaparece.La condición H<0.5 es artificiosamente irreal, ycon H>1 se pierde la estacionariedad del proce-so (Alzate M., Marco Aurelio, 2001).

Como un ejemplo basado en esta definición, sepasa a considerar el proceso de MovimientoBrowniano Fraccional (FBM), que es una genera-lización del proceso de movimiento browniano.El proceso FBM es frecuentemente usado en elanálisis del tráfico de datos autosimilar.

��+���������W��;WW% +

+<≤>=��

Donde X es una variable aleatoria normalmentedistribuida con media cero y varianza 1, y H esel parámetro del proceso. Así, el valor del proce-so en el tiempo t es igual al valor de la variablealeatoria multiplicada por el intervalo de tiempoelevado por la potencia H.

Tenemos que E[BH(t)]=0 porque E[X]=0. Igual-mente, para cualquier variable aleatoria X y unaconstante a, Var(aX)=a2Var(X). Por consiguien-te, Var[B

H(t)]=Var[tH X]=t2H. Para H=0.5, el pro-

ceso FMB se reduce a un proceso de movimien-to browniano ordinario.

La densidad de probabilidad de un movimientobrowniano tiene la forma:

+

+

W[

+%

HW

W[I��

��

��

���� −=

π

Page 11: Trafico Autosemejante

Hallazgos - Revista de Investigaciones 129

Se puede ver que este proceso tiene incrementos estacionarios y que:

�@

������>��@���> VWV

+%W

+%(V

+%W

+%9DU −=−=−

La autocorrelación de BH(t) es expresada como RB(t,s)=E[BH(t)BH(s)], y puede ser deducida de lasiguiente manera:

�@�������

���

>@�

�����>� V+%W+%V+%W+%(V+%WK%( −+=−

( )@������>��@�

�>�@�

�>

��@���> V

+%W

+%(V

+%(W

+%(V

+%W

+%( −−+=

( )�@���>�@�>�@�>��

�@���> V%W%9DUV%9DUW%9DUV%W%(++++++

−−+=

( )+++

++VWVWV%W%(

���

��

�@���> −−+=

Nuevamente, con H=0.5 se reduce la autocorrelación a la de un proceso de movimiento browniano.

Para ver que el proceso FMB es autosimilar, se debe satisfacer las tres condiciones anteriores. Conside-rando el proceso BH(at)=X(at)H, es fácil ver que E[BH(at)]=aH E[BH(at)]=0, lo que satisface la primeracondición [Stallings, W., 1998].

Var[BH

(at)]=Var[X(at)H]=(at)2H Var[X]= (at)2H, lo que satisface la segunda condición. La terceracondición se cumple de la siguiente forma:

( )+++

%DVDWDVDWDVDW5

+

��� ������

��� −−+=

( )+++

+

%VWVW

DDVDW5

+

���

���� −−+=

������ � VW5DDVDW5++ %

+

%=

Considerando la correlación entre los incrementos desde -t hasta 0 y los incrementos desde 0 hasta t:

( )( )[ ] [ ]�������������� W+

%W+

%(+

%W+

%W+

%+

%( −−=−−−

Page 12: Trafico Autosemejante

Universidad Santo Tomás130

( )( )[ ] ( )+

WW+

W+

W+

%W+

%W+

%+

%(

�����

����������� −−−+−−=−−−

( )( )[ ] +W

+W

+%W

+%W

+%

+%(

�����

����������� −=−−−

Para H=0.5, la correlación de los incrementos pasados y futuros desaparece, como se requiere para unmovimiento browniano que tiene incrementos independientes. Pero, para H>0.5, se tiene una carac-terística apreciable de persistencia (Stallings, W., 1998).

Definición en tiempo discreto

Para una serie de tiempo estacionaria x, se considera el "proceso agregado" con nivel de agregaciónm, X(m) obtenido del proceso original X mediante la siguiente suma normalizada:

∑−−=

=NP

PNPL

L

P

N[

P;

���

�� �

Una forma de ver el proceso de agregación es como una técnica para compresión de la escala detiempo. Esto es, se hace una partición de X(t) en bloques no sobrelapados de tamaño m y se promedianlos valores de cada bloque. Se puede considerar X(t), ser la más alta manifestación o la mayor resolu-ción posible para estas series de tiempo. Por ejemplo, el proceso X(3) es el proceso reducido enmagnificación por un factor de 3. Si las estadísticas del proceso (media, varianza, correlación, etc.) sepreservan con la compresión, entonces estamos tratando con un proceso autosimilar.

Para un proceso ergódico, el tiempo promedio puede ser igual al promedio total, y la varianza deltiempo promedio puede ir a cero relativamente rápido a medida que m se vuelve más grande. Esto nopasa para un proceso autosimilar; la varianza también va a cero, pero lo hace mucho más lentamenteque un proceso ergódico estacionario.

Un proceso X se dice que es exactamente autosimilar con parámetro ß (0<ß<1), si para todo m =1,2,...se tiene:

EP

[9DU[9DU P

���� �� varianza

���� N5N5[[

P autocorrelación

El parámetro ß está relacionado con el parámetro de Hurst, definido como H=1-(ß/2). Para un procesoestacionario ergódico, ß=1 y la varianza del tiempo promedio decaen a cero en una rata de 1/m. Paraun proceso autosimilar, la varianza del tiempo promedio decae más suavemente.

Page 13: Trafico Autosemejante

Hallazgos - Revista de Investigaciones 131

Se dice que un proceso X es asintóticamente autosimilar si para todo valor de k:

βP[9DU

[9DU P��

�� �� = varianza

∞→→ PN5N5[

[P

���� autocorrelación

Con estas definiciones de autosemejanza, la autocorrelación del proceso agregado tiene la mismaforma que el proceso original. Esto sugiere que el grado de variabilidad o de ráfaga puede ser elmismo a diferentes escalas.

Una interesante característica de la definición anterior es que la autocorrelación del proceso agregadoautosimilar no va a cero cuando m-> ∞ . Esto en contraste con los procesos estocásticos típicamenteusados para el modelo de paquetes de datos, que tiene la siguiente relación:

∞→→ P5 P ����� τ

Una autocorrelación de la función R(τ), que es igual a cero, es consistente con el ruido blanco. En lafigura anterior se puede ver que a medida que el nivel de agregación incrementa (incrementa m) nose tiene una estructura similar. Otra interesante característica es que la varianza x(m) decrece mássuavemente que 1/m cuando m-> ∞ ; esto es, que decrece proporcionalmente a 1/mß (Stallings, W.,1998).

Dependencia de rango largo

Una de las propiedades más significativas de los procesos autosimilares es referida a la dependenciade rango largo. Esta propiedad es definida en términos de la conducta de la autocovarianza C(τ)cuando τ incrementa.

Para muchos procesos, la autocovarianza decae rápidamente con τ. Por ejemplo, para un proceso dePoisson con incremento L y media λ, la autocovarianza para valores de τ >L es:

����� ��� =−=−= λλλττ 5&

En general, un proceso de dependencia de rango corto satisface la condición de que su autocovarianzadecae exponencialmente:

���a�� <<∞→ DND��N& N

Donde a denota que la expresión a ambos lados es asintóticamente proporcional a la otra.

Page 14: Trafico Autosemejante

Universidad Santo Tomás132

Los tipos de modelos de tráfico típicamente utilizados en la literatura emplean sólo modelos dedependencia de corto rango, usando la ecuación:

∑∞

=

<−

=�

���

N

N [[

[

Se puede ver que la sumatoria ∑ NN& �� es finita.

En contraste, un proceso de dependencia de rango largo tiene una autocovarianza que decaehiperbólicamente:

Donde β es el mismo parámetro definido anteriormente y que está relacionado con el parámetro deHurst (Stallings, W., 1998).

La dependencia de rango largo refleja la persistencia del fenómeno en procesos autosimilares (Stallings,W., 1998). Hay diferencia conceptual entre autosimilitud y dependencia de rango largo. Hay procesosautosimilares que no poseen dependencia de rango largo y viceversa. Sin embargo, bajo la restricción0.5<H<1, existe una doble implicación entre autosimilitud y dependencia de rango largo; por eso,muchas veces se usan como conceptos idénticos (Alzate, M., Marco Aurelio).

Densidad espectral

Una formulación equivalente de la dependencia de rango largo se puede dar en el dominio de lafrecuencia. Específicamente la densidad espectral de potencia obedece a la ley de potencia cerca delorigen:

������ <<→ γωω

ω γ�

a6

Donde γ =1-β=2H-1. Esta divergencia de la densidad espectral de potencia cerca al origen indica unaimportante contribución de los componentes de baja frecuencia.

La densidad espectral para un proceso estocástico en tiempo discreto es:

∑∑∞

−∞=

−∞=

− ==NN

NM N56HN56 ��������� � ωω

En contraste, los procesos de dependencia de rango corto son caracterizados por una densidad espec-tral finita cuando ω->0. Esto ocurre cuando γ = 0 ó, H=0.5 (Stallings, W., 1998).

���a�� <<∞→− ββNN�N&

Page 15: Trafico Autosemejante

Hallazgos - Revista de Investigaciones 133

Distribuciones de colas pesadas

Las distribuciones de cola pesada pueden ser usadas para caracterizar densidades de probabilidad quedescriben el proceso de tráfico como paquetes a intervalos de tiempo y longitud de ráfagas.

La distribución de una variable aleatoria X se dice que es de cola pesada, si:

αα <∞→>=− ��@3U>��� [[�

a[;[)

En general, una variable aleatoria con distribución de cola pesada exhibe una alta varianza o inclusoinfinita varianza.

La distribución de cola pesada más simple es la distribución de Pareto con parámetros k y a (k,a>0),con una densidad y una función de distribución:

������� N[[)[I ≤==

����������

>>

−=

=

+

αα αα

N[[N

[)[N

N[I

Y el valor de la media es:

����

@> >−

= αα

αN[(

El parámetro k especifica el mínimo valor que lavariable aleatoria puede tener. El parámetro αdetermina la media y la varianza de la variable

aleatoria: si �≤α , entonces la distribución tiene

varianza infinita; y si �≤α , tiene media y varianzainfinitas.

La distribución de Pareto ha sido observada enuna amplia variedad de fenómenos de las cien-cias sociales, físicas y de comunicaciones(Stallings, W., 1998).

� Modelos FARIMA

Si la salida de un filtro ARMA se integra multi-plicando su transformada Z con un integrador

(1-z-1)d, donde d∈(-0.5, 0.5), se obtiene un pro-

ceso autorregresivo integrado de promedio mó-viles (FARIMA).

En particular, si d se encuentra en el intervaloabierto (0,1/2), los procesos FARIMA poseen pro-piedades LRD. Además de eso, poseen simultá-neamente propiedades SRD debido a que sepueden descomponer en un proceso ARMA yotro FARIMA. El correspondiente procesoacumulativo es autosemejante con H=d+0.5(Alzate, M. y Peña, N.).

� Modelos wavelet multifractales

El análisis Wavelet es un método eficaz para elestudio de procesos autosemejantes, esto sedebe a que está orientado al estudio multirreso-

Page 16: Trafico Autosemejante

Universidad Santo Tomás134

lución de señales, como la lectura de encefalo-gramas, con lo cual se puede analizar el com-portamiento de la señal a diferentes escalas detiempo simultáneamente.

Por medio de la transformada Wavelet se puedetransformar un proceso autosimilar con una es-tructura de correlación compleja en una secuen-cia de procesos gaussianos, independientes en-tre sí y no autocorrelacionados.

La ventaja que presenta la Transformada Waveletes que es posible hacer que la varianza de loscoeficientes Wavelet en cada escala conservenla información del grado de autosemejanza delproceso, analizado todo esto por medio del pro-cesamiento digital de señales multitasa.

Gracias a los procesos Wavelet, específicamenteel Modelo Wavelet Multifractal (MWM), es posi-ble hacer una sinterización de los procesosmultifractales en el dominio de la escala (Alzate,M. y Peña, N.).

Conclusiones

Se presenta en este trabajo una introducción alos modelos de tráfico, describiendo las caracte-rísticas que éstos deben tener para que seanmodelos tratables desde todo punto de vista, yhaciendo una caracterización de estos dependien-do de sus cualidades. Inherentemente a estascualidades se ve la evolución de estos modelosde tráfico, y precisamente por esto se hace ma-yor hincapié en los modelos de dependencia derango largo, ya que los modelos tradicionalesson insuficientes para caracterizar el tráfico enlas actuales redes de datos. Se introduce a losprincipales conceptos y modelos que son unamanifestación de la complejidad de las redes detelecomunicaciones que actualmente el hom-bre ha desarrollado gracias a su ingenio investi-gador.

Se pretende con este trabajo generar interésen este tema, que es un área de estudio nue-va y que los ingenieros que se desempeñanen el área de las comunicaciones no puedendejar pasar.

Referencias

ALZATE, Marco y PEÑA, Néstor. Modelos de tráfi-co en análisis y control de redes de comunica-ciones. Universidad Distrital-Universidad de LosAndes.

ALZATE MONROY, Marco Aurelio. «Introduccional tráfico autosimilar redes de comunicaciones».En: Revista Ingeniería. Universidad Distrital Fran-cisco José de Caldas, v.6, n.2, 2001.

ARACIL, J. "Características del tráfico en la Internete implicaciones para el análisis y dimen-sionamiento de redes de ordenadores". En:Novática, n. 124, Noviembre/diciembre, 1996, pp.18-26.

CASILARI, A.; REYES LECUONA, A.; DÍAZ, Estrella ySANDOVAL, F. Modelado de tráfico telemático.Universidad de Málaga, Departamento de Tec-nología Electrónica, E.T.S.I. Telecomunicación.

LÓPEZ ARDAO, José Carlos. Contribución al aná-lisis del impacto de la correlación en las presta-ciones de las redes de alta velocidad. Universi-dad de Vigo: Departamento de Tecnologías delas Comunicaciones.

PROAKIS, John G. y MANOLAKIS, Dimitris G. Tra-tamiento digital de señales.

STALLINGS, W. Hight speed networks TCP/IP andATM design principles. Prentice may, Inc., 1998.