Modelos Probabilisticos

28
Editorial DOMS Modelos Probabilistic o Edición N°1- Enero 2015 1

description

 

Transcript of Modelos Probabilisticos

Page 1: Modelos Probabilisticos

1

Editorial DOMS

Modelos Probabilistico

Edición N°1- Enero 2015

Page 2: Modelos Probabilisticos

2

Edita:Editorial DOMS

Creación de Contenido:

Dimitri Franco

Sebastián Páez

Miguel Sánchez

Oscar Bernal

Coordinación:Oscar Bernal

Revisión:Carlena

Astudillo

Diseño:Dimitri Franco

Page 3: Modelos Probabilisticos

3

Prologo

En nuestros días, la estadística se ha convertido en un método efectivo para describir con exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos o físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo en el proceso de “interpretación” de esa información.

Los métodos probabilísticos tienen como objeto dar herramientas para una buena toma de decisiones a fin de optimizar los resultados dados generalmente en una empresa así como en situaciones cotidianas que se pudiesen generar, estos métodos pueden utilizarse para confirmar hipótesis de trabajo o bien para explorar conjuntos de datos sin hipótesis previas. Ambas finalidades, la confirmación y la exploración, están vinculadas a la naturaleza de los objetivos del estudio, a la actitud con que el investigador se enfrenta a los datos y a los términos en que deberán interpretarse los resultados. Una hipótesis se confirma cuando se diseña un estudio con el propósito de hacerlo. Se explora cuando se rastrean datos en busca de información, sin objetivos concretos y formales que hayan gobernado el diseño del estudio. La exploración puede servir para sugerir nuevas hipótesis, pero de ningún modo para contrastarlas, sino que la confirmación deberá obtenerse en un nuevo estudio diseñado específicamente para ello.

Page 4: Modelos Probabilisticos

PROCESOS ESTOCÁSTICOSEn el estudio de las variables aleatorias realizado hasta ahora se han explorado las car-

acterísticas aleatorias del fenómeno pero se ha mantenido una premisa por defecto, que esas características aleatorias permanecen constantes a través del tiempo. Al incluir en el estu- dio la presencia de la variable determinística tiempo se está considerando que, de alguna forma, la variable aleatoria depende del tiempo. En otras palabras, la variable aleatoria dependerá del fenómeno probabilístico y del tiempo. En consecuencia, cualquier función que se establezca en términos de la variable aleatoria, como lo son la función de distribución o la función de densidad, serán también dependientes del tiempo.

Uno de los objetivos de este capítulo es construir un modelo que nos permita explicar la estructura y preveer la evolución, al menos a corto plazo, de una variable que observamos a lo largo del tiempo. La variable observada puede ser económica (I.P.C., demanda de un producto, existencias en un determinado almacén, etc...), física (temperatura de un proceso, velocidad del viento en una central eólica, concentración en la atmósfera de un contaminante, etc..) o social (número de nacimientos, votos de un determinado partido, etc..). Supondremos a lo largo del tema que los datos se obtienen en intervalos regulares de tiempo (horas, días, años,..) y el objetivo es utilizar la posible ”inercia” en el comportamiento de la serie con el fin preveer su evolución futura. Así, una serie temporal será una sucesión de valores de una variable obtenidos de manera secuencial durante el tiempo.

Concepto de proceso estocástico.

Definición Un proceso estocástico es una colección o familia de variables aleatorias {Xt, con t ∈ T }, ordenadas según el subíndice t que en general se suele identificar con eltiempo.

Por tanto, para cada instante t tendremos una variable aleatoria distinta representada por Xt , con lo que un proceso estocástico puede interpretarse como una sucesión de vari-

ables aleatorias cuyas características pueden variar a lo largo del tiempo. Por ejemplo, si observamos sólo unos pocos valores de t, tendríamos una imagen similar a la de la figura siguiente:

Page 5: Modelos Probabilisticos

en la que se representa para cada t la función de densidad correspondiente a Xt. Aunqueen la figura se han representado unas funciones de densidad variables, un proceso estocás-tico no tiene por que presentar esas diferencias en la función de densidad a lo largo del tiempo. Como más adelante se comentará presentan un especial interés aquellos procesos cuyo comportamiento se mantiene constante a lo largo de t.

A los posibles valores que puede tomar la variable aleatoria se le denominaran estados,por lo que se puede tener un espacio de estados discreto y un espacio de estados continuo.Por otro lado, la variable tiempo puede ser de tipo discreto o de tipo continuo. En el caso deltiempo discreto se podría tomar como ejemplo que los cambios de estado ocurran cada día, cada mes, cada año, etc.. En el caso del tiempo continuo, los cambios de estado se podrían realizar en cualquier instante.

Por tanto, dependiendo de cómo sea el conjunto de subíndices T y el tipo de variable aleatoria dado por Xt se puede establecer la siguiente clasificación de los procesos estocásti-

cos:

Si el conjunto T es continuo, por ejemplo R+, diremos que Xt es un proceso estocásticode parámetro continuo.

Si por el contrario T es discreto, por ejemplo N, diremos que nos encontramos frente aun proceso estocástico de parámetro discreto.

Si para cada instante t la variable aleatoria Xt es de tipo continuo, diremos que elproceso estocástico es de estado continuo.

Si para cada instante t la variable aleatoria Xt es de tipo discreto, diremos que elproceso estocástico es de estado discreto.

Una Cadena es un proceso estocástico en el cual el tiempo se mueve en forma discretay la variable aleatoria sólo toma valores discretos en el espacio de estados. Un Proceso de Saltos Puros es un proceso estocástico en el cual los cambios de estados ocurren en forma aislada y aleatoria pero la variable aleatoria sólo toma valores discretos en el espacio de estados. En un Proceso Continuo los cambios de estado se producen en cualquier instante y hacia cualquier estado dentro de un espacio continuo de estados.

Como un ejemplo de una Cadena, considere una máquina dentro de una fábrica. Los posibles estados para la máquina son que esté operando o que esté fuera de funcionamientoy la verificación de esta característica se realizará al principio de cada día de trabajo. Sihacemos corresponder el estado ’fuera de funcionamiento’ con el valor 0 y el estado ’en

y tiempo continuo ( Proc. Saltos Puros)

(Velocidad de un vehículo en

t Discreto t Continuo

X Discreta

Proceso de estado discretoy tiempo discreto (Cadena) (Unidades producidas mensualmente de un producto)

Proceso de estado discreto

(Unidades producidas hasta el instante t)

X Continua

Proceso de estado continuoy tiempo discreto(Toneladas de producción diaria de un producto)

Proceso de estado continuoy tiempo continuo (Proceso Continuo)

el instante t)

Page 6: Modelos Probabilisticos

operación’ con el valor 1, la siguiente figura muestra una posible secuencia de cambios deestado a través del tiempo para esa máquina.

Para el caso de los Procesos de Saltos Puros se puede considerar como un ejemplo unaseñal telegráfica. Sólo hay dos posibles estados (por ejemplo 1 y -1) pero la oportunidad del cambio de estado se da en cualquier instante en el tiempo, es decir, el instante del cambio de estado es aleatorio. La siguiente figura muestra una señal telegráfica.

Como un ejemplo de un Proceso Continuo, se puede mencionar la señal de voz vistaen la pantalla de un osciloscopio. Esta señal acústica es transformada en una señal eléctrica analógica que puede tomar cualquier valor en un intervalo continuo de estados. La figura siguiente muestra una señal de voz la cual está modulada en amplitud.

Page 7: Modelos Probabilisticos

En el caso de procesos estocásticos con espacio de estados discreto, una secuencia de variables que indique el valor del proceso en instantes sucesivos suele representarse de la siguiente manera:

{X0 = x0, X1 = x1, ..., Xn−1 = xn−1, Xn = xn}

en la que cada variable Xi , i = 0, ..., n, tiene una distribución de probabilidades que, en general, es distinta de las otras variables aunque podrían tener características comunes.

El principal interés del estudio a realizar en el caso discreto es el cálculo de probabilidades de ocupación de cada estado a partir de las probabilidades de cambio de estado. Si en el instante n − 1 se está en el estado xn−1, ¿con qué probabilidad se estará en el estado xn en

el instante siguiente n?. Esta probabilidad de denotará como:

P (Xn = xn/Xn−1 = xn−1)

A este tipo de probabilidad condicionada se le denomina probabilidad de transición o de cambio de estado. A las probabilidades del tipo P (Xn = xn) se les denomina

probabilidades de ocupación de estado.Otro tipo de probabilidad de interés es la de ocupar un cierto estado en un instante n,

dado que en todos los instantes anteriores, desde n = 0 hasta n − 1, se conoce en qué estados estuvo el proceso. Esto se puede escribir como:

P (Xn = xn/X0 = x0, X1 = x1, ..., Xn−1 = xn−1)

Nótese que esta probabilidad depende de toda la historia pasada del proceso, mientras que la probabilidad de transición depende únicamente del estado actual que ocupe el proceso.

Propiedad de Markov: Se dice que un proceso cumple la propiedad de Markov cuando toda la historia pasada del proceso se puede resumir en la posición actual que ocupa el proceso para poder calcular la probabilidad de cambiar a otro estado, es decir, se cumple la propiedad siguiente:

P (Xn = xn/X0 = x0, X1 = x1, ..., Xn−1 = xn−1) = P (Xn = xn/Xn−1 = xn−1)

Aquellas Cadenas que cumplen la propiedad de Markov se llaman Cadenas de Markov. Otra manera de denotar a las probabilidades de transición es de la forma siguiente:

P (Xn = j/Xn−1 = i) = pij (n)

Una propiedad interesante que puede tener una Cadena es que los valores pij (n) no de-

pendan del valor de n. Es decir, las probabilidades de cambiar de estado son las mismas en cualquier instante. Esta propiedad indica que las probabilidades de transición son esta- cionarias.Cadenas de MarkovConsidere un equipo de computación el cual será revisado al inicio de cada día para verificar si está operativo o si está dañado. El diagrama de estados de la siguiente figura muestra los dos posibles estados del proceso y las relaciones que se deben cumplir para pasar de un

Procesos de Estado Discreto.

Page 8: Modelos Probabilisticos

estado al otro. Así, con probabilidad PO-D se pasa del estado operativo al estado dañado;ésta es una probabilidad de transición o de cambio de estado. En el caso de que el valor de la probabilidad anterior no cambie a través del tiempo y, esto se repite para todas las probabilidades involucradas en la figura, se dice que la Cadena es estacionaria.

Si en un día cualquiera el ordenador está dañado al comenzar el día, sólo puede ocurriruna de dos cosas para el inicio del siguiente día: que siga dañado (con probabilidad PD- D) o que haya sido reparado en ese día (con probabilidad PD-O). Por otro lado, si en un día cualquiera el ordenador está funcionando correctamente al comenzar el día, sólo puede ocurrir una de dos cosas para el inicio del siguiente día: que se dañe (con probabilidad PO- D) o que se mantenga operativo (con probabilidad PO-O). Estos son los únicos eventos que pueden ocurrir.

Si se define una variable aleatoria Xn como el estado del ordenador al inicio del día n, se podrían asignar los valores 0 y 1 a los posibles estados ’dañado’ u ’operativo’,

respectiva- mente.Otra pregunta de interés es, ¿con qué probabilidad el estado del computador en el día n

es ’operativo’ ?; ésta es una probabilidad de ocupación de estado. Esa probabilidad se denotacomo P (Xn = 1) o también πn(1). De igual forma, la probabilidad, por ejemplo, de que elcomputador esté dañado en la primera oportunidad de ser observado será π0(0).

Utilizando la nomenclatura descrita anteriormente, se puede escribir:P (Xn+1 = 1/Xn = 0) = p ⇒ P (Xn+1 = 0/Xn = 0) = 1 − pP (Xn+1 = 0/Xn = 1) = q ⇒ P (Xn+1 = 1/Xn = 1) = 1 − q

Estos datos se podrían resumir en una matriz que se llama matriz de probabilidades de transición o matriz de transición de estados.

µ ¶ µ

P (Xn+1 = 0/Xn = 0) P (Xn+1 = 1/Xn = 0)P (Xn+1 = 0/Xn = 1) P (Xn+1 = 1/Xn = 1)

1 − p pPn = q 1 − qEn general, consideremos una cadena de Markov con k estados posibles s1, s2, ..., sk y

probabilidades estacionarias. Para i = 1, 2, 3, ..., k y j = 1, 2, 3, ..., k, denotaremos por pij

a la probabilidad condicionada de que el proceso esté en el estado sj en un determinadomomento si estuvo en el estado si en el momento inmediatamente anterior. Entonces lamatriz de transición de la cadena dek × k de la siguiente forma:

Markov se define como una matriz cuadrada

P = ⎜

⎟p11

p21

.

p12

p22

.

p1k

p2k

.

· · ·

· · · ⎜ ⎟⎜ ⎟.

pk

1

.pk

2

.pk

k

⎝ ⎠· · ·

Page 9: Modelos Probabilisticos

El elemento en la fila i, columna j, pij = P (Xn = sj /Xn−1 = si), representa la probabil-idad de transición de un paso.

El usar esta representación en forma matricial nos facilita el cómputo de las probabili- dades de transición en más de un paso. En general P × P = P2 corresponde a las probabili- dades de transición en dos pasos, y P3, P4, ..., Pm, ... corresponden a las probabilidades de transición en 3, 4, ..., m pasos respectivamente. De hecho, la matriz Pm se conoce como la matriz de transición en m pasos de la cadena de Markov.

Distribución Inicial de la Cadena.En ocasiones no se conoce a ciencia cierta la ubicación del proceso en el instante inicial.

Esta ocupación podría presentarse en forma probabilística como un vector de ocupación inicial π0. Este vector tiene como componentes la probabilidad de ocupar cada uno de los

estados en el instante inicial, es decir, los términos π0(j), para cada estado j = 1, 2, ..., k.

π0 = (π0(1), π0(2), π0(3), ..., π0(k))

con:k

π0(j) ≥ 0, X

π0(j) = 1 j=1

Distribución de las probabilidades de ocupación de estados de la Cadena en un instante cualquiera.

Al igual que para el instante inicial, se puede definir un vector de ocupación de estado

para cada instante n. Se le llamará πn. Este vector tiene como componentes la probabilidad de ocupar cada uno de los estados en el instante n:

πn = (πn(1), πn(2), πn(3), ..., πn(k))

con:

k

πn(j) ≥ 0, X

πn(j) = 1 j=1

En general se tiene la siguiente relación:k k

πn(j) = P (Xn = j) = X

P (X0 = i) · P (Xn = j/X0 = i) = X

π0(i) · P (Xn = j/X0 = i)i=1

que matricialmente se escribe:

i=1

πn = π0 · Pn

Ejercicio Después de mucho estudio sobre el clima, hemos visto que si un día está soleado,en el 70% de los casos el día siguiente continua soleado y en el 30% se pone nublado. También nos fijamos en que si un día está nublado, la probabilidad de que esté soleado el día siguiente es 0.6 y la probabilidad de que se ponga nublado es 0.4. Además, si un día está soleado la probabilidad de que continúe soleado el día siguiente es 0.7 y la probabilidad de que al día siguiente esté nublado es 0.3. Entonces:

a) Construir la matriz de transición de la cadena.b) Obtener la matriz de transición tras dos días.c) Si hoy está nublado, ¿cuál es la probabilidad de que esté nublado tres días después?.

Page 10: Modelos Probabilisticos

En este caso, el proceso sigue siendo discreto en estados pero la gran diferencia es que los cambios de estado ocurren en cualquier instante en el tiempo (tiempo continuo). Hemos apuntado anteriormente que un ejemplo típico de procesos de saltos puros es la señal telegrá- fica.

Otros ejemplos de procesos de saltos puros son los siguientes:

Definición Un proceso estocástico en tiempo continuo {N (t), t ≥ 0} se dice que es un Pro-ceso de Conteo si representa el número de veces que ocurre un suceso hasta el instante de tiempo t.

En particular, se tiene que N (t) ∈ N, y N (s) ≤ N (t) ∀s < t.

Definición Un proceso de conteo se dice que es un Proceso de Poisson homogéneo de tasa λ > 0, si:

1. N (0) = 02. N (t1) − N (t0), N (t2) − N (t1), ..., N (tn) − N (tn−1) son variables aleatorias inde-

pendientes (proceso de incrementos independientes).

3. N (t + s) − N (s) (”No de sucesos que ocurren entre el instante s y el instante t + s)sigue una distribución de Poisson de parámetro λt.

El proceso de Poisson se utiliza basicamente para modelar los llamados procesos de colas.En ellos se pueden incluir muchos procesos: coches que llegan al peaje de una autopista, clientes que llegan a un banco, peticiones que llegan a un servidor de Internet, llamadas que pasan por una centralita, etc.

Consideremos, por ejemplo, el caso de un servidor de Internet. Queremos estudiar las peticiones que va recibiendo este servidor. Podemos suponer que las peticiones llegan de una en una. Si llamamos N (t) al número de peticiones que ha recibido el servidor hasta el instante t, encontramos que una posible realizacion de este proceso sera del tipo:

Procesos de Saltos Puros

Page 11: Modelos Probabilisticos

donde S(1) indica el instante en que llega la primera petición, S(2) indica el instante enque llega la segunda y, en general, S(i) indica el instante en que llega la i-ésima. Éste es un ejemplo de un proceso que se puede representar utilizando el proceso de Poisson.

Tiene algunas características fundamentales:

• Para cada instante t, N (t) seguirá una distribución de Poisson de parámetro λt.

• Las diferencias entre los tiempos de llegadas consecutivas siguen una distribución expo- nencial de parámetro λ, es decir, S(i + 1) − S(i) siguen una exponencial de parámetro λ.

Realización de un Proceso Estocástico: Series temporales.Un concepto que debe ser definido es el de realización: una realización de una experiencia

aleatoria es el resultado de una repetición de esa experiencia. Así, en la experiencia aleatoria”lanzar una vez un dado” una realización sería el cinco que nos ha salido en ese

únicolanzamiento. En ese caso, la realización se reduce a un único número {X }. Si repetimos

la experiencia, obtendremos otra realización distinta. En una experiencia bidimensional, por ejemplo la identificación de unos individuos a través de su peso y su estatura, un realización sería el resultado obtenido al tomar un individuo al azar y medir en él ambos parámetros. Ahora la realización es una pareja de números {Xl , X2}. En una experiencia n-dimensional

tendríamos análogamente un grupo de n valores {Xl , ...., Xn} y, siguiendo con la analogía,

en un proceso estocástico tendríamos un grupo de infinitos valores {Xt}, con t ∈ Θ.Veamos un ejemplo de realización de un proceso estocástico. Consideremos

que estamosinteresados en estudiar cómo evoluciona la temperatura en un punto P de un motor durante una hora de funcionamiento del mismo a régimen constante. Podemos considerar que la variable ”temperatura instantánea en ese punto P ” es un proceso estocástico continuo de parámetro continuo. Si realizamos la experiencia una vez obtendremos una gráfica temporal de la evolución de la temperatura: esa gráfica (o los valores numéricos asociados) es una realización del proceso estocástico. Si repetimos la experiencia en las mismas condiciones obtendremos otra realización, representada por otra gráfica o por sus correspondientes re- sultados numéricos.

Procesos de Estado Continuo.

Page 12: Modelos Probabilisticos

Por tanto, una realización de un proceso estocástico es una sucesión de infinitos valores deuna cierta variable a lo largo del tiempo. Si t tiene una consideración continua obtendremos una representación continua , mientras que si t es discreto obtendremos una sucesión de puntos.

Si recordamos la definición de serie temporal que dimos en la introducción, ”una serie temporal será una sucesión de valores de una variable obtenidos de manera secuencial durante el tiempo”, la única diferencia que hay entre ellas radica en que la realización consta de infinitos elementos y la serie temporal de un número limitado. Así, desde el punto de vista de los procesos estocásticos, diremos que

Definición: Una serie temporal es una realización parcial de un proceso estocástico deparámetro tiempo discreto.

Por tanto, la teoría de los procesos estocásticos será de aplicación a las series temporales.No obstante, nos encontraremos con una fuerte restricción que radica en el hecho de que en muchas series temporales, ellas son la única realización observable del proceso estocástico que las ha generado (por ejemplo, la serie de turistas que visitan España mes a mes, o la unidades producidas diariamente en una factoría, etc.). Esto, en general nos colocará, cuando queramos deducir las características del proceso a partir de las de la serie, en una situación hasta cierto punto similar a la que tendríamos al intentar describir la composición de una urna en base a una única bola extraída. Tal problema, que parece insalvable, requerirá que apliquemos una serie de restricciones e hipótesis al tipo de proceso que queramos analizar.

Características de un proceso estocástico.Del mismo modo que en una variable unidimensional X , podemos calcular su media,

su varianza y otras características, y en variables n-dimensionales obtenemos un vector de medias, matriz de covarianzas, etc., en un proceso estocástico podemos obtener algunas características que describen su comportamiento: medias, varianzas y covarianzas. Puesto que las características del proceso pueden variar a lo largo de t estas características no serán parámetros sino que serán funciones de t. Así:

Page 13: Modelos Probabilisticos

Definición: Llamaremos función de medias del proceso a una función de t que proporcionalas medias de las distribuciones marginales para cada instante t

µt = E(Xt)

Definición: Llamaremos función de varianzas del proceso a una función de t que propor-ciona las varianzas de las distribuciones marginales para cada instante t

σ2 = V ar(Xt )t

Definición: Llamaremos función de autocovarianzas del proceso a la función que propor-ciona la covarianza existente entre dos instante de tiempo cualesquiera:

Cov(t, s) = Cov(s, t) = Cov(Xt , Xs)

y por último,

Definición: Llamaremos función de autocorrelación a la estandarización de la función decovarianzas:

Cov(t, s)ρt,s = σ σt s

En general, estas dos últimas funciones dependen de dos parámetros (dos instantes).Una condición de estabilidad que aparece en muchos fenómenos es que la dependencia sólo dependa, valga la redundancia, de la ”distancia” entre ellos y no del instante considerado. En estos casos tendremos:

Cov(t, t + j) = Cov(s, s + j) = γj j = 0, ±1, ±2, ...

Por otro lado, si estudiamos casos concretos como la evolución de las ventas de unaempresa o la concentración de un contaminante, sólo disponemos de una única realización y aunque el proceso estocástico exista, al menos conceptualmente, para poder estimar las características ”transversales” del proceso (medias, varianzas, etc..) a partir de la serie es necesario suponer que estas permanecen ”estables” a lo largo de t. Esta idea nos conduce a lo que se entiende por condiciones de estacionariedad de un proceso estocástico (o de una serie temporal).

Procesos estocásticos estacionarios.En una primera aproximación, llamaremos estacionarios a aquellos procesos estocásticos

que tengan un comportamiento constante a lo largo del tiempo. Si buscamos el correspon- diente comportamiento de las series temporales asociadas a esos procesos, veremos gráficas que se mantienen en un nivel constante con unas pautas estables de oscilación. La sigu- iente figura muestra un ejemplo de serie estacionaria, realización de un proceso estocástico estacionario.

Page 14: Modelos Probabilisticos

En la práctica del análisis de series encontraremos series con problemas de estacionariedadque afecten a cualquiera de sus parámetros básicos, siendo los que más suelen afectar al pro- ceso de análisis las inconstancias en media y varianza. En las siguientes figuras se muestran dos ejemplos de series no estacionarias, la primera en media y la segunda en varianza.

Definición: Diremos que un proceso es estacionario en sentido estricto si al realizar unmismo desplazamiento en el tiempo de todas las variables de cualquier distribución conjunta finita, resulta que esta distribución no varía, es decir:

F (Xi1 , Xi2 , ..., Xir ) = F (Xi1 +j , Xi2 +j , ..., Xir +j )

para todo conjunto de índices (i1, i2, ..., ir ) y todo j.

Esta condición resulta bastante restrictiva y por consiguiente se adoptan otras un pocomás ”débiles”

Definición: Diremos que un proceso estocástico es estacionario en sentido débil si mantieneconstantes todas sus características lo largo del tiempo, es decir, si para todo t :

1. µt = µ

2. σ2 = σ2t

3. Cov(t, t + j) = Cov(s, s + j) = γj j = 0, ±1, ±2, ...

Nota.-En algunos libros este tipo de estacionariedad recibe el nombre de estacionariedad en

sentido amplio o estacionariedad de segundo orden. Por otro lado si sólo exigimos que la función de medias sea constante se dirá que el proceso es estacionario de primer orden o en media. Por último, indicar que la estacionariedad en sentido débil no garantiza la estacionariedad, ahora bien bajo la suposición de normalidad de las variables si se verifica esta igualdad.

Page 15: Modelos Probabilisticos

Es inmediato probar que si un proceso es estacionario en sentido débil la función deautocorrelación viene dada por:

γj γjρj = =

σ2γ0

Obviamente esta función es simétrica (ρj = ρ−j ) y sólo dependerá de la distancia oretardo entre los instantes de tiempo o también llamado ”decalaje” . Así:Definición: Se denomina función de autocorrelación simple (acf ) a dicha función:

γj γjρj = =σ2γ0

y la representación gráfica en forma de nombre de correlograma.

diagrama de barras de sus valores recibe el

Observar que el correlograma, tal y como se ha definido, sólo tiene sentido para seriesestacionarias.

Proceso de ruido blanco.Un proceso estocástico que emplearemos con frecuencia en los apartados siguientes es

el llamado proceso de ruido blanco. Se trata de un proceso estacionario εt que cumple las siguientes características:

• E(εt) = 0

• V ar(εt) = σ2

• Cov(εt, εs) = 0 si t = s

Podemos interpretar un ruido blanco como una sucesión de valores sin relación alguna entre ellos, oscilando en tomo al cero dentro de un margen constante. En este tipo de procesos, conocer valores pasados no proporciona ninguna información sobre el futuro ya que el proceso es ”puramente aleatorio” y por consiguiente ”carece de memoria”

Una de las características principales de un proceso estocástico es su correlograma y en el caso del proceso de ruido blanco no puede ser más sencillo: puesto que las variables correspondientes a distintos instantes están incorreladas, todos los coeficientes de correlación serán 0 salvo el correspondiente a un retardo 0 que será 1.

Page 16: Modelos Probabilisticos

Modelos Auto-Regresivos de orden p, AR(p).Al tratar de representar la influencia que hechos pasados tienen sobre el presente (y

en consecuencia sobre el futuro) de un proceso estocástico, podemos considerar diferentes expresiones alternativas. Una de ellas consiste en colocar el valor actual del proceso como dependiente de modo lineal de valores pasados del propio proceso, más una perturbación aleatoria, que supondremos normalmente distribuida, que evite que el modelo sea determinista:

Xt = δ + a1Xt−1 + a2Xt−2 + ... + apXt−p + εt

donde δ representa una constante.(1)

A esta formulación la llamaremos autorregresiva, pues en la misma expresión se apreciael porque de la denominación: de algún modo es un modelo de regresión del proceso sobre si mismo.

Si observamos el modelo propuesto en (1), si lo consideramos estacionario, con E(Xt) = µ,se tiene que:

δµ = δ(1 + a1µ + a2µ + ...apµ) ⇒ µ =

1 − a1 − a 2 − .. − a p

por consiguiente, para que exista la media, necesitamos que:

a1 + a2 + .. + ap = 1

Sin perder generalidad, en el desarrollo del apartado supondremos que el proceso está cen- trado, esto es, δ = 0.

Un elemento que resulta de gran interés en estudio de estos modelos procesos lineales es el llamado operador retardo B. Tal operador actúa sobre un término de un proceso estocástico reduciendo el índice temporal en una unidad:

kB Xt = Xt−1 ⇒ B Xt = Xt−k

y por tanto, un proceso autorregresivo puede expresarse en la forma:

εt = (1 − a1B − a2B2 − ... − apBp )Xt

Consideremos la expresión autorregresiva antes definida. En principio, no hay nada que nos limite el número de periodos del pasado que influyen en el valor actual del proceso, sin embargo tal planteamiento (probablemente cierto en términos teóricos) provoca problemas no justificables por las ventajas prácticas obtenidas: el hecho de tener que estimar infinitos coeficientes de regresión no se justifica cuando en la práctica se observa que sólo los periodos más recientes tienen influencia significativa en el valor actual del proceso. Con ello, la expresión anterior se trunca, dejando el valor actual dependiente de los últimos p valores del proceso, más una perturbación aleatoria:

εt = (1 − a1B − a2B2 − ... − apBp )Xt

Un proceso de estas características se denomina proceso autorregresivo de orden p AR(p). Si denotamos por ap (B) = 1 −a1B −a2B2 − ... −ap Bp, al llamado polinomio característico del proceso obtenemos, el siguiente resultado que nos garantiza la estacionariedad del proceso.

Page 17: Modelos Probabilisticos

Proposición: La condición necesaria y suficiente para que un proceso AR(p) sea esta-cionario es que las raíces de su polinomio característico estén fuera del círculo unidad del plano complejo.

Determinación del orden y de los parámetros del modelo AR.

Los dos problemas fundamentales que nos presentan los procesos autorregresivos son:

• Determinación del grado p del polinomio autorregresivo.

• Una vez fijado este, determinar los parámetros ai del modelo.

Determinación de los parámetros del modeloEn esta sección nos centraremos en la segunda de las cuestiones. Así, si consideramos un

proceso AR(p):Xt = a1Xt−1 + a2Xt−2 + ... + ap Xt−p + εt

multiplicando por Xt−j y tomado esperanzas(2)

E(XtXt−j ) = a1E(Xt−1Xt−j ) + a2E(Xt−2Xt−j ) + ... + apE(Xt−pXt−j ) + E(εtXt−j ) (3)

para j = 0 al ser la función de autocovarianzas simétrica se tiene:

γ0 = a1γ1 + a2γ2 + ... + apγp + σε2

puesto que al ser E(εt εt−j ) = 0 para j > 0 se tiene (sin mas que aplicar de manera recursiva2(2)) E(εtXt−j ) = σε . Por otro lado, dividiendo en (3) por γ0 es fácil probar que la función

de autocorrelación asociada al proceso debe verificar la misma ecuación en diferencias:

ρj = a1ρj−1 + a2ρj−2 + ... + apρj−p j > 0

Particularizando la ecuación anterior para j = 1, 2..., p se obtiene un sistema de ecuacionesque relaciona las p primeras autocorrelaciones con los parámetros del proceso. Llamaremos ecuaciones de Yule-Walker al sistema:

ρ1

ρj

==

a1 + a2ρ1 + ... + ap ρp−1

a1ρ1 + a2ρ2... + apρp−2

ρj = a1ρp−1 + a2ρp−2 + ... + ap

llamando:

a0 = (a1, a2, ..., ap) ρ0 = (ρ1, ρ2, ..., ρp)

R = ⎜

⎟1.

ρ1

.ρp−1

.· · ·

. . .· · · 1

⎝ ⎠

Page 18: Modelos Probabilisticos

el sistema anterior se escribe matricialmente:

ρ = R · a ⇒ a = R−1 · ρ

por consiguiente, los valores de los parámetros a se pueden obtener una vez estimada la matriz de autocorrelaciones de orden p.

Veamos que el modelo de Yule-Walker nos da estimadores óptimos según mínimos cuadra-dos de los coeficientes ak a partir de un conjunto términos observados de la serie. Así, siconsideramos un proceso AR(p):

Xt = a1Xt−1 + a2Xt−2 + ... + ap Xt−p + εt

a partir de n valores observados de la serie, x1, x2, ..., xn, los residuos et vendrán dados por:

et = xt − (a1xt−1 + a2xt−2 + ... + ap xt−p ) = xt − xˆt

donde por xˆt denotamos el valor estimado de la serie.Con el fin obtener los estimadores óptimos de los parámetros según mínimos cuadra-

dos, calcularemos las derivadas parciales respecto de ak . Igualando estas parciales a cero, obtenemos las llamadas ecuaciones normales del modelo:p n nX

ak

X xi k x =

X x x j = 1, 2, ...p− i−j i i−j

k=1 i=1 i=1

Si denotamos por:nX

i=1

ρˆk−j

el sistema anterior se transforma en:

= ρˆj−k = xi−k xi−j

pX ak · ρˆk = ρˆ j = 1, 2, ...pj k−

k=1

que se corresponden con las ecuaciones de Yule-Walker donde se ha sustituido las correla-ciones teóricas por sus estimaciones.

Determinación del orden de la autorregresión.Determinar el orden de un proceso autorregresivo a partir de su función de autocor-

relación es difícil. En general esta función es una mezcla de decrecimientos exponenciales y sinusoidales, que se amortiguan al avanzar el retardo, y no presenta rasgos fácilmente iden- tificables con el orden del proceso. Para resolver este problema se introduce la función de autocorrelación parcial.

Si comparamos un AR(1) con un AR(2) vemos que aunque en ambos cada observaciónestá relacionada con las anteriores, el tipo de relación entre observaciones separadas

dosperíodos, es distinto. En el AR(1) el efecto de Xt−2 sobre Xt , es siempre a través de Xt−1,y no existe efecto directo entre ambas. Conocidoprever Xt, Esta dependencia puede ilustrarse:

Xt−1, el valor de Xt−2 es irrelevante para

AR(1) : Xt−3 → Xt−2 → Xt−1 → Xt

Page 19: Modelos Probabilisticos

Sin embargo, en un AR(2) además del efecto de Xt−2 que se transmite a Xt, a través deXt−1, existe un efecto directo de Xt−2, sobre Xt, Podemos escribir:

p qAR(2) : Xt−3 → Xt−2 → Xt−1 → Xt

cb

La función de autocorrelación simple tiene cionadas en ambos casos, pero si medimos la

sólo en cuenta que Xt, y Xt−2 están rela-relación directa entre Xt y Xt−2, esto es,

eliminando del efecto total debido a Xt−1, encontraremos que para un AR(1) este efecto esnulo y para un AR(2) no.

En general, un AR(p) presenta efectos directos de observaciones separadas por 1, 2,

..., p retardos y los efectos directos de las p + 1, ... son nulos. Esta idea es la clave para la utilización de la función de autocorrelación parcial, entendiendo el coeficiente de autocorrelación parcial de orden k como una medida de la relación lineal entre observaciones separadas k períodos con independencia de los valores intermedios. Llamaremos función de autocorrelación parcial (fap) a la representación de los coeficientes de correlación parcial en función del retardo. De esta definición se deduce que un proceso AR(p) tendrá los p primeros coeficientes de autocorrelación parcial distintos de cero, y por tanto, en la f ap el número de coeficientes ”significativamente” distintos de cero indica el orden del proceso AR. Esta propiedad va a ser clave para identificar el orden de un proceso autorregresivo.

Page 20: Modelos Probabilisticos

SITEMA DE ESPERA

Una línea de espera es el efecto resultante en un sistema cuando la demanda de un serviciosupera la capacidad de proporcionar dicho servicio. Este sistema está formado por un conjunto de entidades en paralelo que proporcionan un servicio a las transacciones que aleatoriamente entran al sistema. Dependiendo del sistema que se trate, las entidades pueden ser cajeras, máquinas, semáforos, grúas, etcétera, mientras que las transacciones pueden ser: clientes, piezas, autos, barcos, etcétera. Tanto el tiempo de servicio como las entradas al sistema son fenómenos que generalmente tienen asociadas fuentes de variación que se encuentran fuera del control del tomador de decisiones, de tal forma que se hace necesaria la utilización de modelos estocásticos que permitan el estudio de este tipo de sistemas.Una línea de espera puede modelarse como un proceso estocástico en el cual la variable aleatoria se define como el número de transacciones en el sistema en un momento dado; el conjunto de valores que puede tomar dicha variable es {O, 1, 2, . . . , N\ y cada uno de ellos tiene asociada una probabilidad de ocurrencia

En las líneas de espera, existen dos costos perfectamente identificados: el costo de las transacciones, que representa la cuantificación monetaria de la pérdida de tiempo al esperar recibir un servicio o la pérdida de clientes por abandono del sistema, y el costo de proporcionar el servicio, que representa la cantidad de dinero que hay que pagar por cuestión de sueldos y salarios, energía, mantenimiento y depreciación del personal o equipo. De tal forma que en un estudio de líneas de espera el objetivo es determinar qué nivel de servicio, ya sea por cantidad de entidades o por la velocidad de ellas, proporcionar para minimizar el costo total del sistema. Este costo está formado tanto por costo de servicio como por el que causa la espera. Matemáticamente podemos representarlo de la siguiente forma:

Page 21: Modelos Probabilisticos

Estos conceptos se pueden representar gráficamente de acuerdo con el esquema mostradoen la figura.

Esquema de optimización de una línea de espera.

Un sistema de espera se representa mediante la llegada de transacciones a un sistema con el fin de recibir un servicio por cualquiera de una o más entidades dispuestas para ello, conocidas como servidores. En caso de que todas las entidades se encuentren ocupadas, la transacción permanece en espera en la fila hasta que decide abandonar la fila sin ser atendido, o bien, es seleccionado de acuerdo con cierta regla para recibir atención. Una vez que el servicio ha sido completamente proporcionado, la transacción sale del sistema y se convierte de nuevo en una transacción potencial.ServidoresRepresentan al mecanismo por el cual las transacciones reciben de una manera completa el servicio deseado. Estas entidades se encuentran dispuestas en forma paralela a la fila, de tal manera que las transacciones pueden seleccionar a cualquiera de ellas para el suministro de dicho servicio. Las dos características principales de los servidores son: la cantidadasignada por cada fila existente en el sistema y la distribución de probabilidad del tiempo de atención a las transacciones o de la velocidad de servicio; dentro de las distribuciones más comunes están la exponencial, la Erlang, la hiperexponencial, la degenerada.Transacciones potencialesRepresentan el número total de clientes que podrían requerir el servicio proporcionado por el sistema y es necesario definir dos características para este conjunto de elementos.

ESTRUCTURA

Page 22: Modelos Probabilisticos

La primera tiene que ver con el tamaño del conjunto potencial de clientes, dando, enconsecuencia, conjuntos limitados o finitos y en otros casos conjuntos ilimitados o infinitos. La segunda caracterísitica se refiere a la distribución de probabilidad del tiempo entre llegadas o bien a la tasa de entrada promedio. Es común encontrarse la suposición de tasas de llegada que siguen un proceso Poisson, el cual ocurre cuando las llegadas a un sistema se llevan a cabo de forma aleatoria; es importante hacer notar que una de las propiedades de esta distribución es su relación con el tiempo entre llegadas consecutivas, que se representa en forma paralela, de acuerdo con un proceso de tipo exponencial. Existen algunos sistemas donde la tasa de llegadas se ve afectada por la decisión de una transacción de rehusar su entrada al sistema por razones diversas, por ejemplo del tamaño de la fila.

FILAEs el conjunto de transacciones que espera ser atendido por alguno de los servidores del sistema. Una fila tiene tres características principales, la primera se refiere a la capacidad, o sea, al número máximo de transacciones que pueden permanecer en ella en un mismo instante y de acuerdo con este número se clasifican como finitas o infinitas. Hay que hacer notar que en el caso de los modelos con tamaño finito, la solución es mucho más fácil de encontrar a partir

Estructura general de un sistema de líneasde espera.

de las ecuaciones generales ya que la solución del modelo se reduce a un sistema de ecuaciones simultáneas y a la evaluación de las medidas de desempeño mediante promedios ponderados, mientras que, en el caso de modelos de tipo ilimitado o infinito, es necesario recurrir a la solución del sistema de ecuaciones así como a la evaluación de las medidas de desempeño y a algunas series geométricas que dificultan en cierto grado el manejo algebraico de la solución. La segunda característica es el orden en que las transacciones son extraídas de la fila para su atención, en ese caso podemos encontrar: primeras llegadas, primeros servicios, por prioridad, aleatorio, etcétera y, por último/la forma de salir de la fila, que puede darse mediante el proceso de servicio o bien, mediante el abandono por factores como desesperación, hastío, etcétera.

Page 23: Modelos Probabilisticos

u,7l

E(t) V(t) E(á) V(a)CQC

2

capacidad del servidor cuando hay n clientes en el sistema. tiempo promedio de proceso por clientevariancia del tiempo de procesotiempo promedio entre llegadas variancia del tiempo entre llegadascoeficiente cuadrado de variación del flujo de clientes que entran al sistema

coeficiente cuadrado de variación del tiempo de servicio coeficiente cuadrado de variación del flujo de clientes que salen del sistema PIJ

probabilidad de que el sistema cambie de un estado i a un estado y después de un intervalo de tiempo

SCp

Pn

L Lq

W Wq

p CtCeCq

probabilidad en estado estable de que existan n clientes en el sistema número promedio de clientes en el sistemanúmero promedio de clientes en la filatiempo promedio de permanencia en el sistema tiempo promedio de permanencia en la fila utilización promedio del serviciocosto total promedio del sistema de líneas de espera por unidad decosto promedio de servicio por cliente por unidad de tiempo costo promedio de espera por cliente por unidad de tiempo

S n NA,,t

número de servidoresnúmero de clientes en el sistemanúmero máximo de clientes permitidos en el sistema

flujo de clientes que entran cuando hay n clientes en el sistema

NOMENCLATURA

Page 24: Modelos Probabilisticos

ECUACIONES GENERALESLas medidas de desempeño con que se trabaja en teoría de colas son principalmente las siguientes:Utilización del servicioRepresenta el porcentaje de tiempo en que los servidores atienden a los clientes y se calcula como la razón entre la tasa promedio de llegadas y la capacidad total del sistema para proporcionar el servicio.

Tasa de entrada promedioEs el valor ponderado de las tasas de entrada a un sistema y representa el número promedio de clientes que, efectivamente, ingresan al sistema convirtiéndose de clientes potenciales en clientes reales. A su vez, esta variable es la tasa de salida del sistema; en el caso de sistemas de manufactura esta variable representa la producción que en promedio está logrando el sistema.

Número promedio de clientes en el sistemaEs el promedio ponderado de los diferentes estados del sistema, definiendo el estado del sistema como el número de clientes que se encuentran acumulados tanto en espera como en servicio en cualquier momento.

Page 25: Modelos Probabilisticos

PROCESOS MARKOVIANOSEl proceso estocástico utilizado en la modelación de una línea de espera tiene la propiedadmarkoviana, ya que la probabilidad condicional de llegar a un estado futuro depende exclusivamente del estado actual en el que se encuentre el sistema, sin importar el estado inicial de dicho sistema. Este conjunto de probabilidades condicionales se conoce como probabilidades de transición de un paso y hay que considerar que son estacionarias, o sea que no cambian con el tiempo. Estas probabilidades se expresan como p¿j. Hay que recordar que en este caso, el estado se define como número de transacciones dentro del sistema en un momento dado. La tabla 2.1 muestra la representación matricial del comportamiento de una línea de espera, donde los índices de la primera columna representan el estado actual del sistema y los del primer renglón los estados futuros,relacionados entre ellos por la probabilidad condicional de que el sistema cambie del estadoactual al estado futuro.Las probabilidades condicionales de la matriz deben de cumplir con:

Las probabilidades de estado estacionario Pj representan el comportamiento probabilístico de cada estado del sistema a largo plazo.

Page 26: Modelos Probabilisticos

Ejemplo. Se desea evaluar el costo promedio/hora en un sistema de producción en el cual laentrada de materia prima a un proceso de taladrado sigue una distribución Poisson con una tasa promedio de 9 piezas/hora. Se cuenta con un taladro manual en donde 6 minutos es el tiempo promedio de proceso que sigue una distribución exponencial. Los costos de funcionamiento del taladro y de inventario de piezas se estiman en $1.3/hora y $0.50 respectivamente.

Figura Diagrama simplificado de probabilidadesde un paso.

El modelo queda clasificado como (M/M/l)(FCFS/oo/oo) y el diagrama de probabilidadesde un paso que se muestra en la figura 2.8, se emplea para evaluar en términos de costo se utiliza la ecuación 2.1; sustituyendo los costos de espera y de servicio se obtiene:

lo que requiere el cálculo del número promedio de piezas en espera. Para esto se necesitaconstruir la siguiente matriz de estado transitorio:

TablaProbabilidades de un paso para un modelo

Aplicando las ecuaciones 2.15 y 2.16 para calcular las probabilidades de estadoestacionario, se tiene el siguiente sistema de ecuaciones:

Page 27: Modelos Probabilisticos
Page 28: Modelos Probabilisticos