DEFINICIONES BASICAS Un proceso estocástico¡gina 3 de 1960. Defina claramente el proceso...

13
Decid cuando yo muera L (¡y el día esté lejano! 1 ): Soberbio y desdeñoso, pródigo y turbulento, en el vital deliquio por siempre insaciado, era una llama al viento L. DEFINICIONES BASICAS Un proceso estocástico: es una sucesión de variables aleatorias {Z t / t I Z }. El subíndice que indica como varía t es el índice 2 es del proceso. Una serie de tiempo es una sucesión z t , generada al obtener una y solo una observación de cada una de las variables aleatorias que definen un proceso estocástico. Las observaciones son tomadas a intervalos de tiempo o de distancia iguales, según lo indica el índice t que genera la sucesión. En este sentido, la serie es una realización de un proceso estocástico. Notación: Z t : Variable aleatoria definida en el tiempo t. z t : Valor tomado por la variable aleatoria Z t en el tiempo t o realización de Z t en el período t. z 1 , z 2 , z 3 , L, z n : Serie de tiempo que tiene n observaciones o una realización del proceso { Z t } cuando t varía entre 1 y n. n: Origen de los pronósticos. Entero que indica la posición de la última observación disponible, el presente, o el punto a partir del cual se empieza a pronosticar. : Número entero que indica la posición con respecto a n (número de períodos contados a partir de n). Como z t es un valor que toma la variable aleatoria Z t en el tiempo t, si t < n, z t es una observación del pasado; si t = n, z t es la observación presente; y si t > n, z t es un valor que tomará la variable Z t . Es claro que los valores de z t para t > n son desconocidos, uno de los objetivos es estudiar métodos para estimarlos. 1 Lejanía, que origina la posibilidad de predecir la evolución de una llama al viento. 2 El índice puede variar en un subconjunto de los reales, generando así procesos continuos. Aquí solo se considerarán procesos estocásticos discretos, cuando el índice varía en los enteros.

Transcript of DEFINICIONES BASICAS Un proceso estocástico¡gina 3 de 1960. Defina claramente el proceso...

Page 1: DEFINICIONES BASICAS Un proceso estocástico¡gina 3 de 1960. Defina claramente el proceso estocástico que genera la serie, grafique las observaciones y haga un análisis descriptivo

Decid cuando yo muera L (¡y el día esté lejano!1):

Soberbio y desdeñoso, pródigo y turbulento,

en el vital deliquio por siempre insaciado,

era una llama al viento L.

DEFINICIONES BASICAS

Un proceso estocástico: es una sucesión de variables aleatorias

{Zt/t I∈ ⊆ ZZ }. El subíndice que indica como varía t es el índice2 es del

proceso.

Una serie de tiempo es una sucesión zt, generada al obtener una y solo una

observación de cada una de las variables aleatorias que definen un proceso

estocástico. Las observaciones son tomadas a intervalos de tiempo o de

distancia iguales, según lo indica el índice t que genera la sucesión. En

este sentido, la serie es una realización de un proceso estocástico.

Notación:

Zt: Variable aleatoria definida en el tiempo t.

zt: Valor tomado por la variable aleatoria Zt en el tiempo t o realización

de Zt en el período t.

z1, z2, z3, LL, zn: Serie de tiempo que tiene n observaciones o una

realización del proceso { Zt } cuando t varía entre 1 y n.

n: Origen de los pronósticos. Entero que indica la posición de la última

observación disponible, el presente, o el punto a partir del cual se empieza

a pronosticar.

l: Número entero que indica la posición con respecto a n (número de períodos

contados a partir de n).

Como zt es un valor que toma la variable aleatoria Zt en el tiempo t, si

t < n, zt es una observación del pasado; si t = n, zt es la observación

presente; y si t > n, zt es un valor que tomará la variable Zt. Es claro que

los valores de zt para t > n son desconocidos, uno de los objetivos es

estudiar métodos para estimarlos.

1 Lejanía, que origina la posibilidad de predecir la evolución de una llama alviento.2 El índice puede variar en un subconjunto de los reales, generando asíprocesos continuos. Aquí solo se considerarán procesos estocásticos discretos,cuando el índice varía en los enteros.

Page 2: DEFINICIONES BASICAS Un proceso estocástico¡gina 3 de 1960. Defina claramente el proceso estocástico que genera la serie, grafique las observaciones y haga un análisis descriptivo

página 2

Pronóstico. Predicción de un valor una variable aleatoria, Zn+l, de un

proceso estocástico. n es el origen del pronóstico y l la posición relativa

de la variable a pronosticar con respecto a n.

Generalmente se está interesado en pronósticos de variables aleatorias

futuras, esto es, en predecir valores que toma Zt cuando t > n. (o cuando

l > 0, si se considera n como origen o como valor presente).

Para estimar un pronóstico de la variable Zn + l

, conocida una realización de

Z1, Z2, Z3, LL, Zn, se define un estimador, $ $ ()z o zn n+l l , como:

$ $ $z = z () = En+ nl l [Z n + l |Z1, Z2, LL, Zn] EI-6

$zn + l

es, entonces, una estimación de la esperanza condicional de la

variable aleatoria Zn + l

dado que una realización de Z1, Z2, Z3, LL, Zn es

conocida u ocurrió.

$ $ ()z o zn n+l l denota el pronóstico de Zn + l

calculado con la información

recolectada hasta n. Si l < 0, el pronóstico es una estimación de una

observación pasada; si l = 0 es la estimación de la observación presente; y

si l > 0 representa la estimación de un valor futuro.

$ $ ()z o zn n+l l también es llamado pronóstico calculado en n de una variable

ubicada l períodos adelante.

EJEMPLOS

zz Ejemplo I-1. 3

Sea zt una serie que representa los miles de pasajes internacionales

mensualmente vendidos por una empresa aérea entre enero de 1949 y diciembre

3 Serie tomada del texto Time Series Analysis. Box-Jenkins. Serie estudiada enmuchos textos de series de tiempo para explicar los modelos ARIMA estacionalesmultiplicativos.

Page 3: DEFINICIONES BASICAS Un proceso estocástico¡gina 3 de 1960. Defina claramente el proceso estocástico que genera la serie, grafique las observaciones y haga un análisis descriptivo

página 3

de 1960. Defina claramente el proceso estocástico que genera la serie,

grafique las observaciones y haga un análisis descriptivo de ella.

Solución:

Zt: Miles de pasajes internacionales vendidos en el mes t. Zt es una

variable aleatoria. Al variar t entre 1 y 144, se genera un proceso

estocástico discreto. Las observaciones de este proceso en el período

comprendido entre enero de 1949 y diciembre de 1960, gráfica GI-1a, forman

una serie de tiempo que tiene 144 datos. El período de esta serie es un mes.

Del análisis de la gráfica se concluye que la serie presenta: 1. una

tendencia lineal creciente (note que las observaciones parecen oscilar

alrededor de la recta trazada ); 2. un patrón estacional de período

estacional 12, porque cada año en los meses 7 y 8 se venden más pasajes y en

los meses 11 y 12 se venden menos; este comportamiento repetido a lo largo

de los años produce (cada 12 meses) una periodicidad anual claramente

observada en la gráfica, las porciones de gráfica dentro de las cuadrículas

que definen un año tienen aproximadamente la misma forma. Además se observa

que la amplitud del patrón estacional aumenta con el tiempo y por ello la

estacionalidad es multiplicativa; y 3. una componente aleatoria que altera

la forma determinística de la serie.

Gráfica GI-1a

Del análisis descriptivo se concluye: Zt = Tt * St * εt o Zt = Tt * St + εt

donde Tt = βo + β1t; St tiene una periodicidad 12 (s = 12) y por lo tanto está

Page 4: DEFINICIONES BASICAS Un proceso estocástico¡gina 3 de 1960. Defina claramente el proceso estocástico que genera la serie, grafique las observaciones y haga un análisis descriptivo

página 4

definida por 12 valores; y εt es la componente aleatoria, luego

Zt = (βo + β1t )*St * εt. o Zt = (βo + β1t )*St + εt.

Es mas simple modelar una serie con estacionalidad aditiva que una con

estacionalidad multiplicativa porque en la primera puede suponerse varianza

constante. Por esta razón la mayoría de las series multiplicativas se

transforman en aditivas, éstas se modelan y al final se estima la

transformada inversa de los pronósticos, se corrige el sesgo en los

intervalos de predicción y así se obtienen los pronósticos y los intervalos

de predicción de la serie original.

Con este ejemplo también se quiere comprobar que una serie con

estacionalidad multiplicativa, cuando se ajusta a la primera ecuación, puede

transformarse mediante la función logaritmo en una serie con estacionalidad

aditiva porque ln(Zt) = ln(Tt) + ln(St ) + ln(εt); luego la serie ln(Zt) debe

presentar una serie con estacionalidad aditiva. La gráfica GI-1b de ln(Zt)

vs t confirma la existencia de una tendencia lineal y una estacionalidad

aditiva. Además con la serie aditiva se ilustrará numérica y gráficamente

como una serie (lnzt) puede expresarse en términos de su tendencia,

componente estacional y componente aleatoria.

Gráfica GI-1b

En la tabla TI-1 aparecen las primeras 72 observaciones de Zt, su logaritmo

natural de Zt (lnzt), la tendencia estimada (tend), la componente estacional

(est) y la componente aleatoria (aleat) para la serie lnzt. Esta

información se organizó en grupos de 12 para resaltar el aspecto estacional

Page 5: DEFINICIONES BASICAS Un proceso estocástico¡gina 3 de 1960. Defina claramente el proceso estocástico que genera la serie, grafique las observaciones y haga un análisis descriptivo

página 5

de la serie. En esta tabla puede comprobarse la igualdad planteada para una

serie estacional aditiva (lnzt) y además puede observarse que los valores de

la componente estacional se repiten cada 12 períodos.

Tabla TI-1OBS ZT LNZT TEND EST ALEAT OBS ZT LNZT TEND EST ALEAT

1 112 4.72 4.82 -0.09 -0.02 37 171 5.14 5.18 -0.09 0.04 2 118 4.77 4.83 -0.11 0.05 38 180 5.19 5.19 -0.11 0.11 3 132 4.88 4.84 0.02 0.02 39 193 5.26 5.20 0.02 0.04 4 129 4.86 4.85 -0.01 0.02 40 181 5.20 5.21 -0.01 -0.01 5 121 4.80 4.86 -0.01 -0.06 41 183 5.21 5.23 -0.01 0.00 6 135 4.91 4.87 0.11 -0.08 42 218 5.38 5.24 0.11 0.04 7 148 5.00 4.88 0.22 -0.10 43 230 5.44 5.25 0.22 -0.02 8 148 5.00 4.89 0.21 -0.10 44 242 5.49 5.26 0.21 0.03 9 136 4.91 4.90 0.06 -0.05 45 209 5.34 5.27 0.06 0.02 10 119 4.78 4.91 -0.08 -0.06 46 191 5.25 5.28 -0.08 0.05 11 104 4.64 4.92 -0.22 -0.06 47 172 5.15 5.29 -0.22 0.08 12 118 4.77 4.93 -0.11 -0.06 48 194 5.27 5.30 -0.11 0.08 13 115 4.74 4.94 -0.09 -0.11 49 196 5.28 5.31 -0.09 0.06 14 126 4.84 4.95 -0.11 -0.01 50 196 5.28 5.32 -0.11 0.07 15 141 4.95 4.96 0.02 -0.04 51 236 5.46 5.33 0.02 0.12 16 135 4.91 4.97 -0.01 -0.06 52 235 5.46 5.34 -0.01 0.13 17 125 4.83 4.98 -0.01 -0.14 53 229 5.43 5.35 -0.01 0.10 18 149 5.00 4.99 0.11 -0.10 54 243 5.49 5.36 0.11 0.03 19 170 5.14 5.00 0.22 -0.08 55 264 5.58 5.37 0.22 -0.01 20 170 5.14 5.01 0.21 -0.08 56 272 5.61 5.38 0.21 0.02 21 158 5.06 5.02 0.06 -0.02 57 237 5.47 5.39 0.06 0.02 22 133 4.89 5.03 -0.08 -0.07 58 211 5.35 5.40 -0.08 0.03 23 114 4.74 5.04 -0.22 -0.09 59 180 5.19 5.41 -0.22 0.01 24 140 4.94 5.05 -0.11 -0.01 60 201 5.30 5.42 -0.11 -0.01 25 145 4.98 5.06 -0.09 0.00 61 204 5.32 5.43 -0.09 -0.02 26 150 5.01 5.07 -0.11 0.04 62 188 5.24 5.44 -0.11 -0.09 27 178 5.18 5.08 0.02 0.07 63 235 5.46 5.45 0.02 -0.01 28 163 5.09 5.09 -0.01 0.01 64 227 5.42 5.46 -0.01 -0.02 29 172 5.15 5.10 -0.01 0.05 65 234 5.46 5.47 -0.01 0.00 30 178 5.18 5.11 0.11 -0.04 66 264 5.58 5.48 0.11 -0.01 31 199 5.29 5.12 0.22 -0.05 67 302 5.71 5.49 0.22 0.01 32 199 5.29 5.13 0.21 -0.05 68 293 5.68 5.50 0.21 -0.02 33 184 5.21 5.14 0.06 0.01 69 259 5.56 5.51 0.06 -0.01 34 162 5.09 5.15 -0.08 0.01 70 229 5.43 5.52 -0.08 -0.01 35 146 4.98 5.16 -0.22 0.04 71 203 5.31 5.53 -0.22 0.01 36 166 5.11 5.17 -0.11 0.04 72 229 5.43 5.54 -0.11 0.00

Las gráficas GI-1c, GI-1d y GI-1e representan las componentes de la serie

lnzt: la tendencia lineal, la componente estacional, y la componente

aleatoria respectivamente, estimadas con un modelo de regresión con

variables indicadoras, es explicado en el capítulo 5. Sin embargo, es

conveniente observar que la componente aleatoria obtenida con este modelo

posiblemente contiene la parte correspondiente a la estructura de

correlación existente entre las observaciones.

Page 6: DEFINICIONES BASICAS Un proceso estocástico¡gina 3 de 1960. Defina claramente el proceso estocástico que genera la serie, grafique las observaciones y haga un análisis descriptivo

página 6

Gráfica GI-1c

Gráfica GI-1d

Gráfica GI-1e

z

Page 7: DEFINICIONES BASICAS Un proceso estocástico¡gina 3 de 1960. Defina claramente el proceso estocástico que genera la serie, grafique las observaciones y haga un análisis descriptivo

página 7

zz Ejemplo I-24

Las observaciones prod, del apéndice, representan la producción mensual de

mesas para computador en un taller de una empresa manufacturera desde enero

de 1994 hasta febrero de 1998. Defina un proceso estocástico que genere la

serie, grafique las observaciones y haga un análisis descriptivo de ellas.

Solución:

prodt: La producción de mesas para computador en el mes t es una variable

aleatoria que depende de t. Al variar t entre 1 y 50 se genera un proceso

estocástico.

Gráfica GI-2

Producción de mesas de computador

La sucesión prodt formada al observar la producción mensual desde enero de

1994 hasta febrero de 1998 es una serie de tiempo que tiene 50 datos

(gráfica GI-2). El período de la serie es un mes.

El análisis descriptivo muestra la existencia de una tendencia creciente

cuadrática o cúbica, y de una componente aleatoria que altera la forma

determinística de la serie; no se aprecia un patrón estacional. Por lo tanto

las formas funcionales para modelar la parte estructural de la serie:

Zt = βo + β1t + β2t2 + εt o Zt = βo + β1t + β2t

2 + β3t3 + εt.z

4 Serie simulada.

Page 8: DEFINICIONES BASICAS Un proceso estocástico¡gina 3 de 1960. Defina claramente el proceso estocástico que genera la serie, grafique las observaciones y haga un análisis descriptivo

página 8

zz Ejemplo I-35

Haga el análisis descriptivo del proceso Zt: Indice de precios al consumidor

a nivel nacional en México, en el mes t. Año base 1970.

Solución:

La serie generada por este proceso en el período comprendido entre enero de

1969 y agosto de 1976 consta de 92 observaciones mensuales (gráfica GI-3a).

Gráfica GI-3a

Indice de precios al consumidor. México

Base: 1970 - 100

Origen: Enero 1969

El análisis de la gráfica GI-3a indica la existencia: 1. de una tendencia

creciente, exponencial o lineal con cambio de pendiente alrededor del mes

48; y 2. de una componente aleatoria que altera la forma determinística de

la serie. No se observa un patrón o componente estacional.

Cuando una serie económica presenta una variabilidad alta, generalmente se

modela el porcentaje o la tasa de cambio de Zt (tasa = 100*(Zt - Zt-1)/Zt ) y

esta última serie se modela y pronostica.

5 Ejemplo del texto. Análisis Estadístico de Series de Tiempo Económicas.Víctor Guerrero.

Page 9: DEFINICIONES BASICAS Un proceso estocástico¡gina 3 de 1960. Defina claramente el proceso estocástico que genera la serie, grafique las observaciones y haga un análisis descriptivo

página 9

Gráfica GI-3b

La gráfica GI-3b representa la tasa de cambio mensual del índice de precios

al consumidor en México. El análisis descriptivo muestra una serie de

tendencia constante, con un posible en el nivel de la serie a partir de 48;

también se observa que después de 48 la varianza de la serie aumenta.z

zz Ejemplo I-4

La ficha técnica siguiente corresponde a la serie que representa el

porcentaje trimestral de desempleo en siete ciudades colombianas en el

período comprendido entre el primer trimestre del 84 y el cuarto trimestre

del 96. La información procede de la librería Cedebase de la Universidad de

los Andes.

DEMOGRAFIA Y FUERZA LABORAL TASA DE DESEMPLEO PARA SIETE CIUDADES Bogotá, Cali, Medellín, Barranquilla, Bucaramanga, Manizales yPasto.

Datos comprendidos entre : Marzo 1984 - Diciembre 1996Período : TrimestralUnidades : PorcentajeFuente : Veinte años Encuesta de Hogares 1970 - 1990. Colombia

Estadística 1991, 1992. Encuesta Nacional de Hogares: cuadro No.4,diciembre 1996. Indicadores de Coyuntura Económica, Resultados Preliminaresde 1996, Volumen 2, Numero 1.

Entidad Productora :DANENota Metodológica : A partir del año 1984, se agregaron las ciudades

de Bucaramanga, Manizales y Pasto.

Page 10: DEFINICIONES BASICAS Un proceso estocástico¡gina 3 de 1960. Defina claramente el proceso estocástico que genera la serie, grafique las observaciones y haga un análisis descriptivo

página 10

TRIMESTREAÑO I II III IV1984 13.7 13.6 13.2 13.11985 14.1 14.5 13.9 12.81986 13.9 14.7 13.0 12.21987 13.5 12.2 11.2 10.31988 12.8 11.9 10.2 10.41989 11.0 10.4 9.0 9.41990 10.1 10.9 10.2 10.61991 10.7 10.7 9.8 9.41992 10.6 10.7 10.7 9.81993 9.4 10.8 11.1 9.11994 9.8 9.6 9.1 7.81995 7.8 10.2 9.8 9.51996 10.2 11.4 11.9 11.5

Realice un análisis descriptivo de esta serie.

Solución:

Gráfica GI-4

La serie, t_desem,( gráfica GI-4) presenta: una tendencia decreciente que

puede ser exponencial o lineal en tramos; una componente estacional de

período 4, posiblemente aditiva; una componente aleatoria; y cambios en su

tendencia a partir segundo trimestre del 89 y segundo trimestre del 93,

aproximadamente. zz

Page 11: DEFINICIONES BASICAS Un proceso estocástico¡gina 3 de 1960. Defina claramente el proceso estocástico que genera la serie, grafique las observaciones y haga un análisis descriptivo

página 11

zz Ejemplo I-5 6

Problema. La ciudad de Los Angeles presenta un problema de contaminación en

el aire generado por reacciones químicas entre algunos contaminantes

primarios tales como óxidos de nitrógeno e hidrocarburos reactivos a la luz

solar. Estas reacciones químicas son las responsables de un tipo polución

que produce irritación en los ojos y daños en los pulmones.

Una medida del grado de contaminación fotoquímica es la cantidad de

partículas por millón (ppm) de ozono en la atmósfera. La serie zt representa

el promedio mensual de las lecturas diarias de las ppm de ozono en el centro

de los Angeles, en el período comprendido entre enero de 1955 y diciembre de

1972. La gráfica GI-5 indica su evolución en el intervalo indicado.

Para controlar este problema, la municipalidad de Los Angeles adoptó las

siguientes medidas: 1. En enero de 1960, entró en funcionamiento un

sistema vial alterno, que evita la circulación innecesaria de tráfico por el

centro de la ciudad y empezó la vigencia de una ley que controla el

porcentaje de hidrocarburos reactivos en la gasolina vendida en la ciudad.

2. En enero de 1966 empezó a regir una nueva reglamentación que exigía un

tipo especial de filtro en el carburador de los carros.

El estudio del impacto de estas medidas fue estudiado por Box y Tiao por

medio de un modelo de intervención Arima; aquí se analizará este impacto con

modelos autorregresivos.

Realice un análisis descriptivo del proceso Zt en el período comprendido

entre enero de 1955 y diciembre de 1972 y observe los cambios generados por

estas políticas.

Solución:

1. Análisis descriptivo de la serie, sin tener en cuenta las

intervenciones. En la gráfica GI-5a se observa presencia de una tendencia

decreciente lineal y de una componente estacional posiblemente

multiplicativa de período estacional 12, que alcanza los valores más altos

en los meses 7, 8 y 9 (meses de días más largos y de más sol) y los mas

bajos en los meses 12, 1 y 2 (meses de días más cortos), y de una componente

aleatoria.

6 Box, G. E. P. and Tiao, G. C.(1975) Intervention analysis withapplications to economic and environmental problems. J. Amer.Statis.Assoc.,70, 70-79.

Page 12: DEFINICIONES BASICAS Un proceso estocástico¡gina 3 de 1960. Defina claramente el proceso estocástico que genera la serie, grafique las observaciones y haga un análisis descriptivo

página 12

Gráfica GI-5aPromedio mensual de las partes por millón de ozono

en el centro de los Angeles

POZONO

Mes

2. Para tener en cuenta las intervenciones, se consideran tres secciones: 1a

Sección: Período comprendido entre enero 1955 y diciembre 1959 no hay

regulaciones para controlar la contaminación; 2a Sección. Inicia en enero de

1960, con la apertura del nuevo sistema vial y la regulación sobre el tipo

de gasolina y termina en enero de 1966, con la puesta en marcha de la

segunda medida de control y 3a Sección. Empieza en enero de 1966 con la

regulación sobre las medidas sobre especificaciones en el tipo de carburador

en los motores.

De la gráfica GI-5b se podría concluir que la acción de las políticas

implementadas sólo afectó la amplitud del período estacional. Observe que

el promedio mensual de las ppm de ozono disminuyó en los meses 7, 8 y 9. Un

efecto similar parece ser el resultado producido por la segunda

intervención. Cambios en la tendencia y en el nivel medio de la serie o en

la estructura de la serie no se aprecian (esto no significa que no existan).

En conclusión, la efectividad de las intervenciones se aprecia en los meses

de verano. Observe el cambio en la amplitud de la onda anual.

3. La gráfica GI-5c, muestra las tendencias significativas obtenidas al

modelar las intervenciones sufridas por la serie. De ella se puede

concluir: la primera sección de la serie presenta una tendencia constante, Zt

oscila periódicamente alrededor de un valor promedio, y no lineal

decreciente, como la gráfica total lo sugiere. La puesta en marcha de las

primeras medidas (2a sección) causó una disminución en el nivel promedio

mensual de las ppm de ozono y en la amplitud de la onda estacional, pero no

cambió la tendencia de la serie constante. Y finalmente se observa que la

Page 13: DEFINICIONES BASICAS Un proceso estocástico¡gina 3 de 1960. Defina claramente el proceso estocástico que genera la serie, grafique las observaciones y haga un análisis descriptivo

página 13

segunda intervención (3a sección) produjo en la serie una tendencia lineal

decreciente y quizás un cambio en la amplitud de la onda anual.

Gráfica GI-5bModelación de la tendencia sin considerar las

intervenciones

POZONO

Mes

Gráfica GI-5cCambios en la tendencia producidas por las

intervenciones

POZONO

Mes

Con este ejemplo se quiere mostrar que si existe una información adicional

sobre factores externos que afectan el proceso bajo estudio, el manejo de la

serie es más objetivo y además tiene más aplicación práctica.z