UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis...

107
UNIVERSIDAD TECNOL ´ OGICA DE LA MIXTECA “AN ´ ALISIS DE LA DEMANDA DE ENERG ´ IA EL ´ ECTRICA USANDO SERIES DE TIEMPO” Tesis Para Obtener El T ´ ıtulo De: Licenciado En Matem ´ aticas Aplicadas PRESENTA: MAR ´ IA ASUNCI ´ ON GONZ ´ ALEZ SIERRA DIRECTOR DE TESIS: M.C. JOS ´ E DEL CARMEN JIM ´ ENEZ HERN ´ ANDEZ HUAJUAPAN DE LE ´ ON, OAXACA JULIO DE 2010

Transcript of UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis...

Page 1: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

UNIVERSIDAD TECNOLOGICA DE LA MIXTECA

“ANALISIS DE LA DEMANDA DE ENERGIA

ELECTRICA USANDO SERIES DE TIEMPO”

Tesis

Para Obtener El Tıtulo De:

Licenciado En Matematicas Aplicadas

PRESENTA:

MARIA ASUNCION GONZALEZ SIERRA

DIRECTOR DE TESIS:

M.C. JOSE DEL CARMEN JIMENEZ HERNANDEZ

HUAJUAPAN DE LEON, OAXACAJULIO DE 2010

Page 2: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

A Mis Padres,

Con Todo mi Amor.

Page 3: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

Agradecimientos

A Dios, por permitirme vivir y por la familia maravillosa de la cual me concedio la dichade formar parte.

A los seres a quienes mas amo en la vida, mis padres, Constantino Gonzalez Sierra yReyna Sierra Rojas. Por haber puesto toda su confianza en mı, porque no dudaron ni porun instante que yo lograrıa cumplir este sueno. Porque siempre han procurado el bienestary felicidad sus hijos, sin escatimar esfuerzos. Por todos los sabios consejos que me han dadoy que no han pasado desapercibidos en mi vida. A ellos, que nunca terminare de agradecerel haberme dado la vida y el permitirme realizar este sueno. Y sobre todo porque ellos sonmi mas grande ejemplo a seguir.

A mis hermanos, Alex, Nicolas, Reyna, Daniel y Rene, porque de alguna manera memotivan a superarme, y a seguir adelante dıa a dıa.

Mi mas sincero agradecimiento a mi asesor de tesis, M.C. Jose del Carmen Jimenez H.,por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; porsu paciencia, tiempo y apoyo que me brindo. A mis sinodales M.C. Marisol Lopez Cerino,M.C. Ana Delia Olvera Cervantes y al M.C. Vulfrano Tochihuitl Bueno, por el tiempo quedispusieron a la revision de este trabajo y por sus valiosos comentarios y observaciones.Tambien agradezco a la M.C. Veronica Borja Macıas y al Dr. Jesus Fernando Tenorio Ar-vide, quienes me indujeron a concluir esta tesis a tiempo y me ayudaron con los tramitesde la misma.

A David, sin quien la realizacion de este sueno no hubiera sido posible. Por el apoyoincondicional y comprension que me brindo durante mi estancia en la Universidad. Porquesiempre estuvo a mi lado para apoyarme, ayudarme a levantar cuando caıa y seguir adelanteen los momentos mas difıciles de mi vida. Por haberme ensenado, que todo sueno por difıcilque parezca de realizar, es posible. Porque siempre busco la manera de motivarme paraseguir adelante. Por compartir conmigo su amplio conocimiento, y sobre todo, por tener uncorazon tan noble y porque nunca dejo de creer en mı, me enseno a confiar en mı misma yme ayudo a ser una mejor persona.

iii

Page 4: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

iv

A mis companeros de grupo y demas amigos de quienes no menciono nombres para noomitir alguno, por haberme hecho mas agradables los momentos que compartimos duranteestos cinco anos. Porque despues de convivir con ellos tanto tiempo aprendı a quererloscomo a una familia.

A todos los maestros que tampoco menciono nombres por no omitir alguno, que en algunmomento me transmitieron sus amplios conocimientos dentro y fuera de las aulas de estaalma mater.

Y a todos aquellos que de alguna manera, influyeron para que este trabajo pudierarealizarse.

Page 5: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

Indice general

Indice general V

1. Preliminares 3

1.1. Demanda de energıa electrica . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.2. Series de tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.2.1. Objetivos de las series de tiempo . . . . . . . . . . . . . . . . . . . . 7

1.2.2. Aplicaciones de las series de tiempo . . . . . . . . . . . . . . . . . . 8

1.2.3. Analisis de las series de tiempo . . . . . . . . . . . . . . . . . . . . . 8

2. Conceptos de probabilidad y estadıstica 13

2.1. Definiciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.1.1. Variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.1.2. Distribuciones de probabilidad . . . . . . . . . . . . . . . . . . . . . 21

2.1.3. Variables aleatorias multiples . . . . . . . . . . . . . . . . . . . . . . 23

2.2. Estadıstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.2.1. Estimacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

2.2.2. Metodos de estimacion puntual . . . . . . . . . . . . . . . . . . . . . 31

2.3. Procesos estocasticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3. Fundamentos de series de tiempo 41

3.1. Fundamentos y tecnicas descriptivas de series de tiempo . . . . . . . . . . . 41

3.1.1. Transformaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.1.2. Analisis de series que contienen tendencia . . . . . . . . . . . . . . . 42

3.1.3. Analisis de series que contienen variacion estacional . . . . . . . . . 47

3.2. Modelos que describen series de tiempo . . . . . . . . . . . . . . . . . . . . 49

3.2.1. Funcion autocorrelacion parcial . . . . . . . . . . . . . . . . . . . . . 50

3.2.2. Procesos puramente aleatorios . . . . . . . . . . . . . . . . . . . . . 53

3.2.3. Funciones autocorrelacion y autocovarianza muestral . . . . . . . . . 54

3.2.4. Procesos lineales estacionarios . . . . . . . . . . . . . . . . . . . . . . 56

3.2.5. Modelos de series de tiempo estacionarios . . . . . . . . . . . . . . . 60

3.3. Identificacion de modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

3.3.1. Pasos para la identificacion . . . . . . . . . . . . . . . . . . . . . . . 72

v

Page 6: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

vi INDICE GENERAL

3.4. Estimacion de parametros . . . . . . . . . . . . . . . . . . . . . . . . . . . . 733.4.1. Estimacion de los parametros de un proceso autorregresivo . . . . . 733.4.2. Estimacion de los parametros de un proceso de medias moviles . . . 753.4.3. Estimacion de los parametros de un proceso autorregresivo de medias

moviles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 763.5. Verificacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

3.5.1. Analisis residual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

4. Aplicacion 794.1. Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 794.2. Analisis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

5. Conclusiones 91

A. Datos 93

B. Correlogramas 95

Bibliografıa 101

Page 7: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

Introduccion

Existen distintas herramientas estadısticas que son de utilidad cuando se requiere unmodelo para ajustar a un conjunto de datos, una de estas herramientas son las series detiempo. Muchas aplicaciones reales se han trabajado con series de tiempo y han obtenidomuy buenos resultados. En general, cuando se tienen datos ordenados cronologicamente enel tiempo, resulta util modelarlos aplicando estas herramientas. En la vida real, la mayorıade datos que por una u otra razon deben registrarse se encuentran ordenados en el tiempo,es por esto que resulta facil modelarlos mediante una serie de tiempo.

Se pueden encontrar datos que, por su naturaleza no permiten realizar un buen ajuste,es decir, ademas de ser no estacionarios, su comportamiento no permite identificar clara-mente sus componentes. Esto complica el analisis y se tienen que probar diferentes metodosantes de obtener el que logre ajustar los datos. Sin embargo, una vez que ya se cuenta conel modelo tentativo, se debe verificar que el modelo realmente sea el adecuado, es decir, elajuste no es tan aleatorio como se esperarıa.

El objetivo de esta tesis, consiste en llevar a cabo el analisis de los datos de demandamaxima mensual de energıa electrica correspondientes a una subestacion de la ComisionFederal de Electricidad (CFE), para ver si alguna de las componentes de serie de tiempo seencuentran presentes en los datos y realizar el ajuste mediante un modelo.

En el Capıtulo 1, se presenta una introduccion a la demanda de energıa electrica, ası co-mo a las series de tiempo, sus aplicaciones, objetivos y clasificacion.

En el Capıtulo 2, se expone parte de la teorıa de probabilidad, estadıstica y procesosestocasticos, haciendo enfasis en estos ultimos, por ser la principal base sobre la que sesustenta el estudio de las series de tiempo.

En el Capıtulo 3, se muestran los modelos principales de series de tiempo, las tecnicasque las describen, ası como tambien los metodos clasicos para realizar el analisis de unaserie de tiempo.

La aplicacion de series de tiempo para datos de demanda de energıa electrica se muestra

1

Page 8: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

2 INDICE GENERAL

en el Capıtulo 4, se lleva a cabo el analisis de los datos y el ajuste del modelo para los mismos.

Finalmente, en el Capıtulo 5 se muestran las conclusiones obtenidas a partir del analisisen el Capıtulo 4.

En el Apendice A se muestran los datos de demanda maxima mensual de energıa electri-ca utilizados para llevar a cabo el analisis.

En el Apendice B se presentan los patrones mas comunes para determinar los modelosque corresponden a una serie de tiempo, esto basandose en las caracterısticas de la funcionautocorrelacion y la funcion autocorrelacion parcial.

Hoy en dıa, existen tambien herramientas computacionales que facilitan el estudio yanalisis de las teorıas probabilısticas y estadısticas. Una de estas herramientas nos la pro-porciona el software estadıstico R project, bajo licencia GNU General Public Licence, paraWindows. Las graficas y analisis presentadas en este trabajo fueron realizados con la ayudade dicho paquete.

Page 9: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

Capıtulo 1

Preliminares

Una rama de las ciencias exactas que mas aplicaciones tiene en la solucion de problemasreales, es la matematica. La probabilidad y la estadıstica son ramas de esta que a lo largode los anos han mostrado una gran variedad de aplicaciones. En cualquier analisis de unproblema real que involucre probabilidad y/o estadıstica se tiene presencia de incertidum-bre. En el proceso de modelacion y solucion de un problema, se usan datos incompletos oaproximaciones, por lo que no se tiene una certeza completa de la solucion. Esto se debe,en gran parte, a la naturaleza misma del problema, a la aproximacion de cantidades en elprocedimiento de solucion y a la incertidumbre de los datos, los cuales deben ser tomadosen cuenta, aunque esto no quiere decir que resolver un problema usando teorıa de pro-babilidad y estadıstica no resulte confiable. Actualmente existen tecnicas estadısticas, queson utilizadas para describir el comportamiento de los datos recolectados en determinadaarea o investigacion. En este trabajo se lleva a cabo un analisis de la demanda de energıaelectrica usando series de tiempo; esto con el fin de observar si alguna de sus componentesse encuentran presentes en los datos.

En nuestra vida diaria existen fenomenos que son clasificados como deterministas yaleatorios. Los fenomenos deterministas son aquellos que, repetidos un cierto numero deveces, siempre se obtienen los mismos resultados. Sin embargo, es posible repetir el mismoexperimento bajo las mismas condiciones y obtener diferentes resultados, a esto es a lo quese conoce como fenomenos aleatorios. La demanda de energıa electrica de una ciudad esconsiderada como un fenomeno aleatorio.

Este capıtulo se divide en dos secciones. En la primera se habla acerca de los aspectosgenerales referentes a la demanda de energıa electrica, mientras que en la segunda se hacereferencia a las de series de tiempo.

3

Page 10: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

4 CAPITULO 1. PRELIMINARES

1.1. Demanda de energıa electrica

El proceso de generacion y distribucion de energıa electrica resulta ser muy complicado.Pocas personas imaginan la gran cantidad de ordenes que se mandan a distintas centraleselectricas por el simple hecho de encender o apagar una lampara. En este trabajo no seaborda el tema de generacion mas bien el de la demanda de energıa electrica. Se realizaun analisis del comportamiento de los datos de esta demanda en una subestacion de laComision Federal de Electricidad (CFE).

La energıa electrica, es un concepto asociado al tiempo y a la potencia nominal de unadeterminada carga electrica. La unidad de medida de la energıa electrica es el kilovatio-hora o kiloWatt-hora (kWh). El medidor de energıa, almacena el valor acumulado de todala energıa consumida durante el ciclo de lectura.

En lo referente a la generacion de energıa electrica, en 1937 Mexico padecıa circunstan-cias difıciles en cuanto al abastecimiento y la cobertura del servicio, el cual estaba a cargo deinstituciones privadas. Los objetivos de desarrollo tanto en areas rurales como urbanas, noeran cubiertos por las empresas privadas que tenıan menos del 38 por ciento de la coberturade energıa electrica, por lo que, en agosto de 1937 se creo la CFE cuyo objetivo primordialfue construir la infraestructura necesaria para dotar de energıa electrica a toda la poblacion.

Actualmente, la capacidad instalada que reporta la CFE es de 49,861 Megawatts, divi-diendose esta en diferentes fuentes: las termoelectricas, los productores independientes deenergıa, las hidroelectricas, las carboelectricas, las geotermicas y las eoelectricas [7].

A lo largo de toda la Republica Mexicana, se cuenta con 177 centrales generadoras y secuenta con una red de transmision de 48,527 km. En los ultimos anos se ha presentado unapreocupacion por satisfacer el abastecimiento de energıa, que cubra el ritmo acelerado decrecimiento urbano e industrial que el paıs presenta [7].

Se le denomina demanda electrica a la suma de todas y cada una de las potencias con-sumidas en el mismo instante. Existen varios tipos de demanda entre los cuales estan: lademanda instantanea, que es la potencia electrica consumida en el sistema completo en uninstante concreto; la demanda horaria, que es la energıa utilizada en una hora; y la demandadiaria, que se refiere a la energıa absorbida a lo largo de un dıa.

La demanda de energıa electrica ha ido en aumento desde los ultimos anos. Actualmen-te, esta demanda muestra un gran auge, puesto que la electricidad es usada en todos lossectores. Por ello, la demanda de energıa electrica, ademas de ser el mejor indicador decarga de trabajo a la que se esta sometiendo al conjunto del sistema electrico, tambien esun claro reflejo de la actividad economica y del bienestar de un paıs [7].

Page 11: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

1.1. DEMANDA DE ENERGIA ELECTRICA 5

Los valores de la demanda varıan constantemente, esta variacion depende de muchosfactores de difıcil medicion, por ejemplo, condiciones ambientales, estaciones anuales, segunel dıa de la semana, luminosidad y otros. Es decir, en tan solo un dıa la demanda puedecambiar segun la hora, en un ano segun la estacion en que se encuentre. En [7] se mencionaque las maximas demandas se producen en invierno, en dıas laborables y muy frıos. Esto sedebe principalmente a que en dıas laborables existe un gran movimiento de la poblacion,lo cual trae como consecuencia la utilizacion de mas energıa electrica que la usada en dıasno laborables, cuando la mayor parte de la gente se encuentra en sus casas, es decir, si noes en invierno o en dıas muy frıos, pues de esta manera, las personas que cuentan con ca-lefaccion necesitan de este servicio. Tambien existe incremento de gasto de energıa durantelas primeras horas de la tarde en los dıas de verano, debido principalmente al uso de aireacondicionado, realizando ası un gasto considerable de energıa electrica mayor al de otrosdıas del ano. De este modo, existen curvas tıpicas de invierno y verano que es cuando existemayor consumo de energıa electrica. Por otro lado, tambien se tiene una medicion de lasdemandas bajas de energıa electrica. Estas se observan regularmente en las primeras horasde la manana, en dıas festivos navidenos o en puentes de primavera.

Para medir el consumo total de energıa electrica en tiempo real, existen dos opciones:

• La primera consiste en realizar un conteo de la totalidad de clientes que consumenenergıa en todo el sistema.

• La segunda opcion es llevar a cabo un conteo de los valores instantaneos de todos losgrupos generadores que producen en dicho sistema.

Siempre que se habla de demanda y generacion instantanea en tiempo real, se cumpleque:

Demanda instantanea real = Generacion instantanea real.

De esta manera se puede asegurar que la potencia total generada mas/menos la potenciaque circula por las lıneas de interconexion con otros paıses es equivalente a la potencia totalconsumida o bien es a lo que se llama demanda de energıa electrica.

Para calcular la demanda de energıa electrica se requieren de cientos de equipos de me-dida que operen de manera simultanea, otorgandole a estos equipos, ası como a las vıasy equipos de transmision de las medidas de potencia, una importante responsabilidad, almismo tiempo una alta fiabilidad.

A pesar de que la mayor demanda de energıa electrica ocurre en un numero de horasmuy reducido, el sistema tiene la obligacion de disponer de la capacidad suficiente paraatender dicha demanda.

Page 12: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

6 CAPITULO 1. PRELIMINARES

La estructura del consumo nacional distingue dos destinos de las fuentes energeticas:por una parte el sector productor de energıa, y por otra el consumo final, que a su vez seclasifica en consumo no energetico y en consumo energetico. Este ultimo absorbe la mayorparte de la demanda total y es donde se encuentra el mayor potencial para consolidar elahorro y el uso mas eficiente de los recursos. Dentro de este destino destacan cuatro sectores,que, por orden de importancia, son los siguientes:

a) transporte;

b) industria y minerıa;

c) residencial;

d) comercial y publico;

e) agrıcola.

En resumen, se tiene que la demanda maxima representa para un instante dado, lamaxima coincidencia de cargas electricas (motores, compresores, iluminacion, equipo derefrigeracion, etc.) operando al mismo tiempo. Es decir, la demanda maxima correspondea un valor instantaneo en el tiempo. De esta manera, resulta muy importante medir ypreveer la demanda de energıa electrica, esto ayuda a administrar mejor el sistema electrico.Ademas, tambien se dice que su evolucion resulta ser un gran indicador acerca de la sociedady su desarrollo economico.

1.2. Series de tiempo

Una serie de tiempo es definida como un conjunto de observaciones hechas secuencial-mente en el tiempo; es decir, valores ordenados cronologicamente.

Hoy en dıa las series de tiempo tienen muchas aplicaciones y se usan abundantementeen distintas areas de la ciencia, principalmente en economıa, medicina, ingenierıa, fısica,etc. Claros ejemplos de series de tiempo son, las mediciones diarias de temperatura, los pre-cios de venta de un determinado artıculo, la demanda de energıa electrica en determinadapoblacion, el ındice de natalidad y mortalidad, solo por mencionar algunos. Existen pocasramas de la ciencia en las que no aparecen datos que puedan ser considerados como seriestemporales, puesto que comunmente se hacen las mediciones siguiendo un orden cronologico.

Muchas instituciones requieren conocer el comportamiento futuro de ciertos fenomenoscon el fin de planificar o prevenir, para ello suelen utilizar series de tiempo para predecirlo que ocurrira con una variable en el futuro a partir del comportamiento de esa variableen el pasado, de aquı que las series de tiempo sean una herramienta basica para lograr esteobjetivo.

Page 13: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

1.2. SERIES DE TIEMPO 7

En esta tesis se describen algunos modelos estadısticos para analizar una serie de tiem-po sin tener en cuenta otras variables que puedan influir en la misma, estos metodos sondenominados univariantes. En particular, nos interesa la aproximacion estocastica (frentea la determinista) es decir aquella que supone que la serie temporal tiene un caracter pro-babilıstico, por haber sido generada por alguna variable aleatoria con una distribucion deprobabilidad determinada aunque comunmente desconocida.

Existen series de tiempo continuas y discretas. Se dice que una serie de tiempo escontinua si las observaciones son tomadas continuamente en el tiempo y es discreta si lasobservaciones son tomadas solo en tiempos especıficos, por lo regular estos tiempos sonigualmente espaciados.

1.2.1. Objetivos de las series de tiempo

Los objetivos del analisis de una serie de tiempo son diversos, entre los que puedendestacar, la prediccion, el control de un proceso, la simulacion de procesos, y la generacionde nuevas teorıas fısicas o biologicas, entre otros. A continuacion se hace mencion de estosobjetivos.

• Descripcion: Al momento de graficar los datos se obtienen medidas simples descrip-tivas de la serie de tiempo a analizar, ası como sus principales propiedades y algunascomponentes de las series de tiempo.

• Explicacion: Cuando las observaciones son tomadas en dos o mas variables, es posibleusar la variacion en una serie de tiempo para explicar la variacion en otra.

• Prediccion: Dada una serie de tiempo, es posible que se desee predecir los valoresfuturos que la serie puede tomar, a esto se le llama prediccion. Dicho en otras palabras,es la estimacion de valores futuros de la variable en funcion del comportamiento pasadode la serie. Este objetivo se usa ampliamente en economıa e ingenierıa.

• Control de procesos: Cuando una serie de tiempo es generada, la cual mide la ca-lidad de un procedimiento de manufactura, es decir, se trata de seguir la evolucionde una variable determinada con el fin de regular su resultado. Esta teorıa se utili-za frecuentemente en medicina, en los centros de control de enfermedades y en lasfabricas.

• Simulacion: Se emplea en investigacion aplicada, cuando el proceso es muy complejopara ser estudiado de forma analıtica.

Ademas la naturaleza intrınseca de las series de tiempo es que las observaciones son de-pendientes o estan correlacionadas y el orden de las observaciones es de mucha importancia.

Page 14: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

8 CAPITULO 1. PRELIMINARES

1.2.2. Aplicaciones de las series de tiempo

Debido a la gran diversidad de los campos donde las series de tiempo son aplicadas, estasse han clasificado en diferentes grupos, entre los cuales se pueden mencionar los siguientes:

• Series economicas. En esta categorıa se consideran las series de tiempo que son usadaspara analizar datos economicos como pueden ser precios, valores, deudas, la tasa deinflacion, tasas de desempleo, el producto interno bruto anual, entre otras.

• Series Fısicas (aplicadas a las ciencias). Dentro de este grupo se consideran las seriesque son aplicadas al analisis de datos fısicos como datos meteorologicos, la temperaturamaxima o mınima diaria, las precipitaciones diarias, la velocidad del viento (energıaeolica), la energıa solar, datos sismologicos o vulcanologicos y geofısica.

• Series de mercadotecnia. Este tipo de series tienen relacion con el comercio, el por-centaje de ventas, costos de productos y produccion, entre otros.

• Series demograficas. Se usan cuando se realizan estudios poblacionales, por ejemplo eltotal de habitantes en una determinada poblacion, la tasa de natalidad y mortalidadanual, tasas de dependencia y los censos que verifican el cambio poblacional.

• Control de proceso. Este tipo se series se usan para detectar cambios en la evolucionde un proceso de manufactura, midiendo una variable, la cual muestra la calidad delproceso.

• Procesos binarios. Este tipo especial de series de tiempo ocurren cuando las observa-ciones pueden tomar solo uno de dos valores posibles usualmente estos valores son 0y 1.

• Procesos puntuales. Este tipo de series tienen lugar cuando las observaciones ocurrenaleatoriamente a traves del tiempo, es decir, no siguen una secuencia especıfica.

• Series de telecomunicacion. Son utilizadas en el analisis de senales, por ejemplo midenla intensidad o la frecuencia con que han sido transmitidas ciertas senales de comuni-cacion, estas no siguen un patron, pues resulta difıcil conocer el comportamiento deeste tipo de series.

• Series de transporte. Este tipo de series analizan los datos de trafico, es decir, analizany miden la cantidad de automoviles en movimiento a lo largo del dıa, con esto se realizael analisis de la cantidad de trafico en determinado dıa.

1.2.3. Analisis de las series de tiempo

El analisis de series de tiempo es una descripcion de los elementos que la constituyen.Es decir, consiste en verificar cuales son las componentes presentes en la serie o cual es el

Page 15: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

1.2. SERIES DE TIEMPO 9

comportamiento que los datos observados presentan.

Una caracterıstica en el analisis de las series de tiempo, es el hecho de que las observacio-nes usualmente no son independientes y ademas, es importante tomar en cuenta el orden enque ocurren dichas observaciones. Cuando las observaciones sucesivas son dependientes, losvalores futuros pueden ser determinados (o predecidos) a partir de las observaciones pasadas.

Una serie es determinıstica si puede ser predecida con exactitud. Muchas series de tiem-po son estocasticas, esto es, las predicciones son realizadas basandose en valores pasados,aunque las predicciones exactas resultan casi imposibles.

El primer paso al analizar una serie de tiempo es presentar un grafico temporal queindique la evolucion de la variable en cuestion a lo largo del tiempo, con el valor de la serieen el eje de ordenadas y en el eje de las abscisas se representan los valores del tiempo. Elsegundo paso es determinar si la secuencia de valores es completamente aleatoria o se puedeencontrar algun patron a lo largo del tiempo. Resulta bastante difıcil realizar un analisisde las series de tiempo si no se tienen graficados los datos, pues esto nos permite teneruna visualizacion mucho mas amplia de lo que se esta estudiando y es mas facil obtenerconclusiones.

Componentes de una serie de tiempo

Las tecnicas convencionales del analisis de las series de tiempo consisten principalmenteen descomponer la variacion existente en la serie, algunos tipos de variacion son tendencia,variacion estacional, cambios cıclicos y fluctuaciones irregulares. Estas se conocen tambiencomo componentes de una serie de tiempo.

• Tendencia. Es la direccion general de la variable en el periodo de observacion, es decir,el cambio a largo plazo de la media de la serie. Tambien se le conoce con el nombrede evolucion subyacente.

• Efecto estacional. Existen series de tiempo tales que exhiben variacion en periodosrelativamente cortos de tiempo, puede ser anual, mensual, etc.; es decir, correspondea fluctuaciones periodicas de la variable. Normalmente estos efectos suelen ocurrirdebido a cambios ambientales o condiciones climaticas.

• Cambios cıclicos. Ademas de los efectos estacionales, algunas series de tiempo pre-sentan variacion en un periodo debido a otras causas fısicas o ambientales. Este tipode variacion esta caracterizado por oscilaciones alrededor de la tendencia con unaduracion aproximada de 2 o 8 anos.

• Fluctuaciones irregulares. Despues de extraer de la serie la tendencia y variacionescıclicas, nos quedara una serie de valores residuales, que pueden ser o no totalmentealeatorios. Se vuelve al punto de partida, ahora tambien nos interesa determinar si esa

Page 16: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

10 CAPITULO 1. PRELIMINARES

secuencia temporal de valores residuales puede o no ser considerada como aleatoriapura. Este tipo de variacion corresponde a movimientos erraticos que no sigue unpatron especıfico y que obedecen a diversas causas. Esta componente es practicamenteimpredecible.

La serie temporal es la suma de estas componentes, es decir

Valor observado = Tendencia + Estacionalidad + Componente Irregular,

aunque tambien en ocasiones se puede ver como el producto de estas componentes.

Series de tiempo estacionarias y no estacionarias

Una serie de tiempo es estacionaria si no hay cambios sistematicos en ella, es decir, nohay tendencia; dicho en otras palabras, la media y la variabilidad se mantienen constantesa lo largo del tiempo.Analogamente, una serie es no estacionaria si la media y/o variabilidad cambian a lo largodel tiempo.

Las series no estacionarias pueden mostrar cambios en la varianza, exhibir tendencia (lamedia crece o disminuye a lo largo del tiempo), y ademas presentar efectos estacionales.

Una serie de tiempo estacionaria tiene ciertas ventajas sobre la no estacionaria, porejemplo, las predicciones resultan mas faciles de obtener. Puesto que la media es constante,se puede estimar con todos los datos que se tienen y utilizar este valor para predecir unanueva observacion. Tambien se pueden obtener intervalos de prediccion (confianza) para laspredicciones, asumiendo que la variable considerada sigue una distribucion conocida.

Los modelos cuantitativos se pueden clasificar de acuerdo a la informacion que se tengaen modelos econometricos o multivariados y en modelos univariados o series de tiempo. Enesta tesis unicamente se tratara el modelo univariante.

Los modelos econometricos tratan de explicar el comportamiento de una o mas variablesen funcion de la evolucion de otras variables que se consideran explicativas. Las variablesexplicadas por el modelo se denominan endogenas, mientras que las variables explicativasdel modelo, pero no explicadas por el, se denominan predeterminadas. En este enfoqueno se necesita conocer ninguna relacion de causalidad, explicativa del comportamiento dela variable endogena, ni en su defecto, ninguna informacion relativa al comportamientode otras variable explicativas, ya que en este caso no existe este tipo de variables. Essuficiente con conocer una serie temporal de la variable en estudio, para estimar el modeloque se utilizara para predecir. La prediccion univariante se utiliza, en problemas economicos,principalmente con dos objetivos:

• La prediccion de algunas variables explicativas de un modelo causal, cuando se esperaque en el futuro conserven algunas de las caracterısticas de su evolucion en el pasado.

Page 17: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

1.2. SERIES DE TIEMPO 11

• La prediccion a corto plazo (de 1 a 4 trimestres), debido a su gran capacidad pararecoger la dinamica en el comportamiento de la variable estudiada. Ademas, en con-diciones normales, cuando no existen bruscas alteraciones respecto a la experienciareciente de la variable, estos metodos pueden proporcionar buenas predicciones.

Page 18: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

12 CAPITULO 1. PRELIMINARES

Page 19: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

Capıtulo 2

Conceptos de probabilidad y

estadıstica

La probabilidad es la disciplina matematica que se encarga del estudio de los fenomenoso experimentos aleatorios. Se entiende por fenomenos aleatorios, aquellos experimentos quecuando se repiten bajo las mismas condiciones, los resultados obtenidos no siempre son losmismos. Es importante aceptar que aun cuando un experimento se haya efectuado un grannumero de veces, no es posible predecir los resultados del experimento, aunque se hayallevado a cabo bajo las mismas condiciones iniciales, es por esto que se considera que elexperimento es aleatorio. De esta manera, la teorıa de la probabilidad tiene el objetivo dedesarrollar modelos matematicos para cualquier fenomeno aleatorio.

En este capıtulo se presentan conceptos de probabilidad y estadıstica, ası como unabreve introduccion a los procesos estocasticos.

2.1. Definiciones

El proposito original de la teorıa de probabilidad, era describir la relacion estrecha queexistıa entre la experiencia y los juegos de azar, y el principal objetivo era calcular ciertasprobabilidades. Actualmente, la probabilidad utiliza modelos matematicos para describirfenomenos que presenten incertidumbre. Un concepto importante en el cual se basan estosmodelos es el de experimento aleatorio, el cual se da a continuacion.

Definicion 2.1.1 Un experimento aleatorio es aquel experimento que presenta las siguien-tes condiciones:

a) tiene al menos dos posibles resultados;

b) el conjunto de posibles resultados se conoce antes de que el experimento se realice;

13

Page 20: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

14 CAPITULO 2. CONCEPTOS DE PROBABILIDAD Y ESTADISTICA

c) puede repetirse indefinidamente bajo las mismas condiciones.

Ejemplo 2.1.2 Algunos ejemplos de experimentos aleatorios son:

lanzar una moneda al aire;

lanzar un dado al aire;

abrir un libro en determinada pagina.

Es importante aclarar que existen diferentes interpretaciones de la probabilidad, a con-tinuacion se mencionan estas:

• Interpretacion frecuentista: esta interpretacion se basa en repetir un proceso un nume-ro grande de veces en condiciones similares y se estima la probabilidad de un eventousando la frecuencia con que ocurre.

• Interpretacion clasica: se basa en la idea de los resultados “igualmente verosımiles”(cada uno de los resultados posibles tienen la misma probabilidad de ocurrir).

• Interpretacion subjetiva: esta interpretacion resulta ser personal, se basa en la expe-riencia del investigador, el cual asigna una probabilidad a uno de los posibles resultadosde un proceso, esta asignacion depende de su criterio.

El espacio de probabilidad es el modelo matematico creado para estudiar los fenomenosaleatorios. A continuacion se tiene la definicion de espacio muestral.

Definicion 2.1.3 El espacio muestral o espacio muestra asociado a un experimento alea-torio es el conjunto que consta de todos los posibles resultados de este. El espacio muestralse denotara por el sımbolo Ω.

A cada elemento de Ω se le llama punto muestral. El espacio muestral mas simple esel que contiene un numero finito de n puntos. Si n es muy pequeno, es facil visualizar elespacio. Si Ω es finito se denotan los puntos muestrales como E1, E2,...,En, y si es infinitonumerable se denotara como E1, E2, ...

Los eventos o sucesos en un experimento aleatorio son subconjuntos de un espacio mues-tral. Si el evento consta de un solo punto, entonces el evento es denominado simple. Enadelante, los eventos se denotaran con letras mayusculas.

El numero P (A) representa una forma de medir la posibilidad de observar la ocurrenciadel evento A, al efectuar una vez el experimento aleatorio. Por ejemplo, dado un espaciomuestral Ω finito con puntos muestrales E1, E2, ..., En, existe un numero asociado a cada

Page 21: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

2.1. DEFINICIONES 15

Ej , llamado la probabilidad de Ej y denotado por P(Ej). Estos numeros son no negativostales que

P (E1) + P (E2) + · · · + P (E2) = 1.

Definicion 2.1.4 Dado un experimento aleatorio con un espacio muestral Ω, la funcionP : Ω −→ R, tal que satisface los siguientes axiomas:

a) 0 ≤ P (A) ≤ 1 para toda A ∈ Ω,

b) P (Ω) = 1,

c) Para cualquier sucesion infinita de eventos disjuntos de Ω, A1, A2, ... se cumple que

P

(

∞⋃

i=1

Ai

)

=

∞∑

i=1

P (Ai),

se llama funcion de probabilidad sobre Ω.

Cabe mencionar que la anterior es la definicion axiomatica de la probabilidad, existentambien otros enfoques para definir la probabilidad, sin embargo, para nuestros propositos,basta con referirse a esta.

Independencia de eventos

La independencia es utilizada frecuentemente en esta tesis, y es un rasgo distintivo dela teorıa de la probabilidad. Independencia entre eventos quiere decir que la ocurrencia deun evento no influye en el resultado de otro.

Definicion 2.1.5 Dos eventos A y B son independientes, si

P (A ∩B) = P (A)P (B).

Definicion 2.1.6 Los eventos A1, A2, ..., An son independientes si se cumplen todas y cadauna de las siguientes condiciones:

P (Ai ∩Aj) = P (Ai)P (Aj) i 6= j,

P (Ai ∩Aj ∩Ak) = P (Ai)P (Aj)P (Ak) i 6= j 6= k,

...

P (A1 ∩ · · · ∩An) = P (A1) · · ·P (An).

Page 22: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

16 CAPITULO 2. CONCEPTOS DE PROBABILIDAD Y ESTADISTICA

2.1.1. Variables aleatorias

Una variable aleatoria es una funcion real definida sobre el espacio muestral. Intuitiva-mente se dice que es un valor que depende del resultado de un experimento aleatorio. Elconcepto de variable aleatoria es fundamental en la teorıa de probabilidad, es por eso quea continuacion se da la siguiente definicion.

Definicion 2.1.7 Una variable aleatoria X es una funcion definida sobre Ω, que tomavalores reales, es decir, X : Ω → R.

En general se denotan las variables aleatorias con letras mayusculas X,Y ,..., en adelantese escribira v.a. para hacer referencia a variable aleatoria.

Existen al menos dos tipos de variables aleatorias: las continuas y las discretas.

Definicion 2.1.8 Una v.a. X se dice que es discreta, si solamente puede tomar un numerofinito o infinito numerable de valores distintos, es decir, X(Ω) es a lo mas numerable.

Funcion de distribucion

Toda v.a. tiene asociada una funcion de distribucion de probabilidad. Si la v.a. X esdiscreta, se asigna a cada valor x de X (es decir, a cada x ∈ X(Ω)) su probabilidad como

p(x) = P (X = x),

tal que cumple:

a) p(x) ≥ 0 ∀x;

b)∑

x

p(x) = 1.

A p(x) se le conoce como funcion de distribucion de probabilidad de la v.a. X.

Ejemplo 2.1.9 Supongase que se realiza el experimento que consiste en lanzar dos dadosbalanceados al aire y se observa el resultado obtenido. (x, y) representa un punto del espaciomuestral, donde x es el numero que aparece en el primer dado e y el numero que apareceen el segundo dado.

Page 23: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

2.1. DEFINICIONES 17

El espacio muestral consta de los posibles resultados al lanzar los dados, los cuales son:

Ω = (1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6),

(2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6),

(3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6),

(4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6),

(5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6),

(6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6).

En total se tienen 36 posibles resultados o puntos muestrales, todos equiprobables, es decircada uno de ellos con probabilidad 1

36 .Algunos ejemplos de eventos o sucesos son A = (1, 3), B = (1, 2), (5, 5), (6, 1).

Se define la variable aleatoria X como la suma de los dos numeros obtenidos. El con-junto de posibles valores que la variable aleatoria X puede tomar es:2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12.

Para obtener la probabilidad pi de que la v.a. X tome el valor i, se debe obtener laprobabilidad del evento Ai que consta de todos los pares en Ω tales que la suma de suscomponentes es igual a i. Como cada punto muestral es equiprobable, la probabilidad deAi es P (Ai) = |Ai|

36 , donde |Ai| representa el numero de elementos en Ai. Por ejem-plo, para calcular P (X = 2), se tiene que solo los elementos del par (1, 1) suman 2,

ası P (X = 2) = P ((1, 1)) = |(1,1)|36 = 1

36 .

Analogamente se calculan las probabilidades restantes: p3 =2

36, p4 =

3

36, . . . ,

p11 =2

36, p12 =

1

36.

Funcion de distribucion acumulada

Definicion 2.1.10 La funcion de distribucion acumulada (FDA) de una v.a X se define ydenota por

F (x) = P (X ≤ x) ∀x ∈ R.

Esta funcion, mide la probabilidad acumulada de la v.a. hasta cierto x. Algunas vecesla FDA tambien suele denotarse por FX(x).

Propiedad 2.1.11 La FDA cumple las siguientes propiedades:

a) lımx→−∞

F (x) = lımx→−∞

P (X ≤ x) = 0;

Page 24: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

18 CAPITULO 2. CONCEPTOS DE PROBABILIDAD Y ESTADISTICA

b) lımx→∞

F (x) = lımx→∞

P (X ≤ x) = 1;

c) Si x1 < x2 ⇒ F (x1) ≤ F (x2).

Cuando X es una v.a. discreta, la FDA es una funcion escalonada.

Haciendo uso de la FDA se puede definir una v.a. continua de la siguiente manera:

Definicion 2.1.12 Sea F(x) la FDA de una v.a. X, entonces se dice que X es continua siF(x) es continua.

Funcion de densidad de probabilidad

Definicion 2.1.13 Sea X una v.a. continua, con FDA F(x), entonces la funcion f(x) dadapor

f(x) =d

dx[F (x)],

siempre y cuando la derivada exista, se llama funcion de densidad de probabilidad (fdp) deX.

Si la v.a. X es continua, se asigna la probabilidad al suceso en que la v.a. toma valoresen un determinado intervalo [a, b] como,

P (X ∈ [a, b]) =

∫ b

af(x)dx,

donde f(x) es la fdp de la v.a. X.

Propiedades de la fdp

Si f(x) es la fdp de la v.a. X entonces se cumple que:

a) f(x) ≥ 0;

b)

∫ ∞

−∞f(x)dx = 1.

Algunas otras propiedades que tambien se cumplen son:

a) P (a ≤ x ≤ b) = F (b) − F (a);

b) P (a ≤ x ≤ b) = P (a < x ≤ b) = P (a ≤ x < b) =

∫ b

af(x)dx.

Page 25: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

2.1. DEFINICIONES 19

Valor esperado

El valor esperado de una v.a. es un numero que representa el promedio ponderado o elvalor medio de sus posibles valores.

Definicion 2.1.14 Sea X una v.a. El valor esperado de X denotado por E(X) se definecomo

E(X) =

x

xp(x), si X es discreta;

∫ ∞

−∞xf(x)dx, si X es continua.

Siempre que la suma y la integral sean convergentes para el primer y segundo caso res-pectivamente. El valor esperado tambien se conoce comunmente como esperanza, media,valor promedio o valor medio y se denota por µ.

De manera mas general, si g(X) es una funcion de X, entonces el valor esperado deg(X) esta dado por

E[g(X)] =

x

g(x)p(x), si X es discreta;

∫ ∞

−∞g(x)f(x)dx, si X es continua.

Siempre que la suma y la integral sean covergentes para cada uno de los casos. Por otrolado, si g(X) = Xr, entonces E[Xr] se conoce como el r-esimo momento central.

A continuacion se especifican las propiedades que cumple el valor esperado.

Propiedad 2.1.15 Sea X una v.a con valor esperado finito, y sea c una constante. Entoncesse cumplen:

a) E(c) = c;

b) E(cX) = cE(X);

c) si X ≥ 0, entonces E(X) ≥ 0;

d) sean g1(X), g2(X), ..., gn(X) funciones de X, entonces,

E

[

n∑

i=1

gi(X)

]

=n∑

i=1

E[gi(X)],

siempre que los valores esperados existan.

Demostracion:Vease [12], pag. 95 y [5], pag. 187.

Page 26: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

20 CAPITULO 2. CONCEPTOS DE PROBABILIDAD Y ESTADISTICA

Varianza

La varianza de una v.a. es una medida del grado de dispersion de los diferentes valoresque toma la variable en cuestion.

Definicion 2.1.16 Sea X una v.a. con µ <∞, la varianza de X, denotada por Var(X), sedefine como

Var(X) = E[(X − µ)2].

Se tienen dos expresiones para la varianza, dependiendo si la v.a. X es discreta o conti-nua, las cuales son:

Var(X) =

x

(x− µ)2p(x), si X es discreta;

∫ ∞

−∞(x− µ)2f(x)dx, si X es continua.

Siempre que la suma y la integral sean convergentes para el primer y segundo caso res-pectivamente. La varianza se denota usualmente por σ2. A la raız cuadrada de Var(X) sele llama desviacion estandar y es denotada por σ.

Al igual que el valor esperado, la varianza tambien cumple ciertas propiedades.

Propiedad 2.1.17 Sea X una v.a. con varianza finita, y sea c una constante. Entonces:

a) Var(X) ≥ 0;

b) Var(X) = 0 ⇔ X = c;

c) Var(cX) = c2Var(X);

d) Var(X + c) = Var(X);

e) Var(X) = E(X2) − [E(X)]2 .

Demostracion:Vease [5], pp. 195-196.

Page 27: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

2.1. DEFINICIONES 21

Ejemplo 2.1.18 Para los datos del ejemplo 2.1.9, el valor esperado de la v.a. X es

E(X) =∑

i

i ∗ P (X = i)

=

12∑

i=2

i ∗ pi

= 21

36+ 3

2

36+ 4

3

36+ 5

4

36+ 6

5

36+ 7

6

36

+85

36+ 9

4

36+ 10

3

36+ 11

2

36+ 12

1

36= 7.

La varianza de la v. a. X es

Var(X) =∑

i

(i− E(X))2 ∗ P (X = i)

=12∑

i=2

(i− 7)2 ∗ pi

= (2 − 7)21

36+ (3 − 7)2

2

36+ (4 − 7)2

3

36+ (5 − 7)2

4

36+ (6 − 7)2

5

36+ (7 − 7)2

6

36

+(8 − 7)25

36+ (9 − 7)2

4

36+ (10 − 7)2

3

36+ (11 − 7)2

2

36+ (12 − 7)2

1

36

=35

6≈ 5.8.

Para este ejemplo en particular se obtuvo que E(X) = 7, lo cual indica que 7 es elvalor promedio de los valores de la v.a. X. Por otro lado, se calculo la varianza, es decir,Var(X) ≈ 5.8, esto indica que la desviacion promedio cuadratica alrededor de la media esde aproximadamente 5.8. Es decir, si se repite el experimento un numero grande de vecesy se observan los valores de la v.a. X se encontrara que los valores cercanos a 7 son losmas frecuentes y que la medida de dispersion (x− 7)2 tiene como valores mas frecuentes avalores cercanos a 5.8.

2.1.2. Distribuciones de probabilidad

Una parte importante de las variables aleatorias es su funcion de distribucion. Se es-cribira “X ∼ F” para indicar que la v.a. X tiene cierta funcion de distribucion F. Existendistribuciones discretas y continuas.

Page 28: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

22 CAPITULO 2. CONCEPTOS DE PROBABILIDAD Y ESTADISTICA

Distribuciones discretas

Definicion 2.1.19 La variable aleatoria X tiene distribucion discreta si existe un conjuntoC ⊆ R a lo mas numerable, tal que P (X ∈ C) = 1.

Algunas distribuciones de probabilidad discretas son:

distribucion de probabilidad binomial (Vease [12], pag. 103);

distribucion de probabilidad geometrica (Vease [12], pag. 115);

distribucion de probablidad binomial negativa (Vease [12], pag. 122);

distribucion de probabilidad hipergeometrica (Vease [12], pag. 126).

Distribuciones continuas

Definicion 2.1.20 Una variable X tiene distribucion absolutamente continua si existe unafdp f(x) tal que

P (X ∈ A) =

AfX(x)dx, A ⊆ R.

Se tienen algunas distribuciones continuas importantes. La distribucion de probabilidadnormal es la que mas se utiliza; muchos fenomenos observados en el mundo real tienendistribuciones de frecuencia relativas que pueden ser modeladas mediante una distribucionde este tipo.

Distribucion normal.

Definicion 2.1.21 Se dice que la v.a. continua X tiene una distribucion normal o gau-ssiana si su fdp es

f(x) =1√

2πσ2exp

−1

2

(

x− µ

σ

)2

,

donde µ, x ∈ R y σ > 0. En este caso se dice que X tiene una distribucion normal conparametros µ y σ2 y se denota por

X ∼ N(µ, σ2).

Es facil verificar que si X ∼ N(µ, σ2), entonces se cumple que:

E(X) = µ;

Var(X) = σ2.

Page 29: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

2.1. DEFINICIONES 23

Una v.a. X tiene una distribucion normal estandar si µ = 0 y σ2 = 1, en cuyo caso sufuncion de densidad es la siguiente:

f(x) =1√2π

exp

−x2

2

,

y se escribeX ∼ N(0, 1).

Notese que

X ∼ N(µ, σ2) ⇐⇒ Z =X − µ

σ∼ N(0, 1).

Es decir, la v.a. X con distribucion normal no estandar se transforma a una estandarZ = X−µ

σ , este procedimiento se denomina estandarizacion.

Algunas otras distribuciones continuas son:

distribucion de probabilidad uniforme (Vease [12], pag. 174);

distribucion de probabilidad gamma (Vease [12], pag. 185);

distribucion de probabilidad beta (Vease [12], pag. 194).

2.1.3. Variables aleatorias multiples

Definicion 2.1.22 Un vector aleatorio n-dimensional es una funcion del espacio muestralΩ en R

n.

En particular para n = 2, se tiene un vector bivariado o bidimensional.

Definicion 2.1.23 Si X y Y son variables aleatorias (v.a’s) discretas, entonces se dice queel vector aleatorio (X,Y) es discreto.

Funcion de distribucion conjunta

Para el caso de dos variables se tiene:

Definicion 2.1.24 Sea (X,Y ) un vector aleatorio discreto, la funcion p : R2 −→ R dada

por p(x, y) = P (X = x, Y = y) se llama funcion de distribucion de probabilidad conjunta.

En la definicion, P (X = x, Y = y) significa que es la probabilidad de que X tome elvalor x y Y tome el valor y.

Para cualquier evento A en Ω se cumple:

P ((X,Y ) ∈ A) =∑

(x,y)∈A

P (X = x, Y = y).

Las propiedades que cumple la funcion de distribucion de probabilidad conjunta son:

Page 30: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

24 CAPITULO 2. CONCEPTOS DE PROBABILIDAD Y ESTADISTICA

a) p(x, y) ≥ 0 ∀ x, y;

b)∑

(x,y)

p(x, y) = 1.

Para los vectores bivariados tambien se define la FDA.

Definicion 2.1.25 La FDA conjunta del vector aleatorio (X,Y) se define y denota como

F (x, y) = P (X ≤ x, Y ≤ y).

Para el caso en que (X,Y ) es discreto, se tiene

F (x, y) =∑

s≤x

t≤y

P (X = s, Y = t).

La distribucion de probabilidad marginal para X esta dada por

pX(x) = P (X = x) =∑

y

p(x, y),

analogamente, la distribucion de probabilidad marginal para Y esta dada por

pY (y) = P (Y = y) =∑

x

p(x, y).

Definicion 2.1.26 Sean X,Y v.a’s discretas con distribucion de probabilidad conjuntap(x, y), entonces X y Y son independientes si y solo si

p(x, y) = pX(x)pY (y).

Teniendo los dos ultimos conceptos, dadas dos v.a’s independientes que tienen la mismadistribucion de probabilidad marginal se dice que son v.a’s independientes e identicamentedistribuidas y se denotan por v.a’s iid.

En el caso en que X,Y sean v.a’s continuas, tambien se pueden definir los conceptosanteriores.

Page 31: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

2.1. DEFINICIONES 25

Covarianza

Definicion 2.1.27 Sean X, Y v.a’s. La covarianza de X y Y, se denota y define como

Cov(X,Y ) = E[(X − E(X))(Y − E(Y ))].

La covarianza cumple con una serie de propiedades, las cuales se enuncian en la siguientepropiedad.

Propiedad 2.1.28 (Propiedades de la covarianza. ) Sean X,Y y Z variables aleato-rias y sea c una constante, se cumple que:

a) Cov(X,Y ) = E(XY ) − E(X)E(Y );

b) Cov(X,Y ) = Cov(Y,X);

c) Cov(X,X) = Var(X);

d) Cov(c,X) = 0;

e) Cov(cX, Y ) = cCov(X,Y );

f) Cov(X + Y,Z) = Cov(X,Z) + Cov(Y,Z);

g) Si X y Y son independientes, entonces Cov(X,Y ) = 0;

h) Var(aX + bY ) = a2Var(X) + b2Var(Y ) + 2abCov(X,Y ).

Demostracion:Vease [12], pp. 266-267.

Observese que de g) y h) se obtiene que V(X + Y ) = V(X) + V(Y ) y E(XY ) =E(X)E(Y ).

Coeficiente de correlacion

El coeficiente de correlacion entre dos variables indica el grado de dependencia linealque hay entre ellas.

Definicion 2.1.29 Sean X, Y variables aleatorias con varianza distinta de cero, el coefi-ciente de correlacion entre ellas, se define y denota por

ρ(X,Y ) =Cov(X,Y )

Var(X)Var(Y ).

Page 32: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

26 CAPITULO 2. CONCEPTOS DE PROBABILIDAD Y ESTADISTICA

Propiedad 2.1.30 (Propiedades del coeficiente de correlacion. ) El coeficiente de co-rrelacion cumple las siguientes propiedades:

a) Si X y Y son independientes, entonces ρ(X,Y ) = 0;

b) −1 ≤ ρ(X,Y ) ≤ 1;

c) Si X y Y son independientes e identicamente distribuidas, entonces ρ(X+Y,X−Y ) =0.

Cuando ρ(X,Y ) = 0 entonces se dice que no existe correlacion entreX y Y , si |ρ(X,Y )| =1, entonces se dice que X y Y estan perfectamente correlacionadas. Por otro lado, si X yY son independientes, entonces ρ(X,Y ) = 0, el recıproco no necesariamente es cierto.

Ejemplo 2.1.31 Sean X y Y v.a’s discretas con la siguiente distribucion de probabilidad:

px(−1) = px(1) = 516 = py(−1) = py(1) y px(0) = 6

16 = py(0),y con distribucion de probabilidad conjunta:

x−1 0 1

y−1 1

16316

116

0 316 0 3

16−1 1

16316

116

Para este ejemplo se cumple que X y Y son dependientes pero con covarianza cero.Solucion.

Observese que p(0, 0) = 0. Es claro que

p(0, 0) 6= px(0)py(0),

con lo cual queda demostrado que X y Y son dependientes.

De los datos del ejemplo se observa que E(X) = E(Y ) = 0. Tambien,

E(XY ) =∑

x

y

xyp(x, y)

= (−1)(−1)(1/16) + (−1)(0)(3/16) + (−1)(1)(1/16)

+(0)(−1)(3/16) + (0)(0)(0) + (0)(1)(3/16)

(1)(−1)(1/16) + (−1)(0)(3/16) + (1)(1)(1/16)

= (1/16) − (1/16) − (1/16) + (1/16) = 0.

Page 33: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

2.2. ESTADISTICA 27

Entonces,

Cov(X,Y ) = E(XY ) − E(X)E(Y ) = 0 − 0(0) = 0.

Con lo cual queda probado que si dos v.a’s tienen covarianza cero, no necesariamente sonindependientes. Notese que ρ(X,Y ) = 0 ⇔ Cov(X,Y ) = 0, para cualesquiera v.a’s X,Y .De aquı, se deduce que el hecho de que la correlacion entre dos v.a’s es cero no implica queX y Y son independientes.

2.2. Estadıstica

La estadıstica es la ciencia que trata de la recopilacion, organizacion, presentacion,analisis e interpretacion de datos numericos con el fin de tomar la mejor decision y obtenersignificados precisos.

Es importante mencionar que dependiendo del contexto en el que se utilice, la estadısticatiene tres significados: el termino estadıstico se refiere a una medida obtenida en una mues-tra; por otro lado, la palabra estadıstica es usada para referirse a la informacion estadısticay esta tambien es utilizada para referirse al conjunto de metodos y tecnicas que se utilizanpara analizar la informacion.

Los metodos y tecnicas estadısticas, comunmente se usan para realizar tareas de tipodescriptivas, por ejemplo, para organizar, analizar y resumir datos de tipo numerico.

Definicion 2.2.1 Una poblacion es la coleccion de toda la posible informacion que carac-teriza a un fenomeno.

Definicion 2.2.2 Una muestra aleatoria de la poblacion es una coleccion de v.a’s iidX1,X2,...,Xn. El tamano de la muestra aleatoria es representado por n.

La estadıstica se divide en dos ramas: estadıstica descriptiva y estadıstica inferencial.

La estadıstica descriptiva consiste en representar los datos recolectados en forma detablas y graficas. En este tipo de estadıstica solo resume y describe los datos sin tratar deinferir nada mas.

La estadıstica inferencial por su parte, como su nombre lo indica, hace inferencia acercade los datos recopilados, es decir, hace generalizaciones que van mas alla de la informacionque proporcionan los datos. Analiza una poblacion basandose en una muestra de la poblacionestudiada.

La inferencia estadıstica es definida como el conjunto de tecnicas que permiten formularinferencias inductivas. Con inferencias inductivas se entiende como aquellos razonamientosque van de lo particular a lo general.

Page 34: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

28 CAPITULO 2. CONCEPTOS DE PROBABILIDAD Y ESTADISTICA

Medidas de posicion central

Existen algunas medidas que son llamadas de posicion central, entre las que destacan:la media, la moda, la mediana.

La media muestral es un valor representativo de todos los valores de la muestra, es elpromedio ponderado, es decir,

Definicion 2.2.3 Sean X1,X2, ...,Xn v.a’s iid. La media muestral se define y denota por

X =

∑ni=1Xi

n.

Proposicion 2.2.4 Supongase que X1,X2, ...,Xn son v.a’s iid, con E(Xi) = µ y Var(Xi) =σ2, entonces:

a) E(X) = µ;

b) Var(X) = σ2/n;

c) Cov(X,Xi − X) = 0, para i = 1, 2, ..., n.

La mediana de un conjunto de observaciones es el valor para el cual, cuando las obser-vaciones se ordenan de forma creciente, la mitad de estas es menor que este valor y la otramitad es mayor.

La moda de un conjunto de observaciones es el valor que se repite con mayor frecuencia.

Medidas de dispersion

Las medidas de dispersion proporcionan el grado de propagacion de una variable alrede-dor de una medida de posicion central. Existen dos tipos de medidas de dispersion: medidasde dispersion absoluta y medidas de dispersion relativa.

Dentro de las medidas de dispersion absoluta se encuentran:

El rango (Ra): es la diferencia entre el maximo y el mınimo de la variable en cuestion.

Desviacion absoluta media respecto a la media (de): indican las desviaciones de lamedia con respecto a la media en valor absoluto.

Varianza: mide la dispersion de los valores de la variable respecto a la media. A mayorvarianza existe mayor dispersion.

Desviacion tıpica o estandar.

Page 35: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

2.2. ESTADISTICA 29

Definicion 2.2.5 Sean X1,X2, ...,Xn, v.a’s iid con E(Xi) = µ y Var(Xi) = σ2. La varianzamuestral se denota y define por

S2X =

∑ni=1(Xi − X)2

n− 1.

Ademas, se cumple que E(S2X) = σ2, lo cual indica, que la varianza muestral es un

estimador insesgado de la varianza poblacional.

Definicion 2.2.6 La desviacion tıpica o estandar muestral se define como la raız cuadradapositiva de la varianza,

SX = +√

S2X .

Las medidas de dispersion relativa miden el grado de dispersion de distintas distribu-ciones.

2.2.1. Estimacion

Uno de los objetivos de la estadıstica es hacer inferencias acerca de determinadas ca-racterısticas de la poblacion. Estas caracterısticas se conocen como parametros. Ası, unparametro es una constante fija con valor desconocido. A continuacion se tiene la definicionformal de parametro.

Definicion 2.2.7 Aquella caracterizacion numerica de la distribucion de la poblacion quedescribe, parcial o completamente, la funcion de densidad de probabilidad de la caracterısticade interes es a lo que se le conoce como parametro.

Comunmente un parametro se denota por θ, es importante observar que θ tambien re-presenta en algunas ocasiones un vector, es decir θ = (θ1, θ2, ..., θn), donde θ1, θ2, ..., θn sonparametros.

Las inferencias antes mencionadas se logran haciendo estimacion. Existen dos tipos deestimacion, la estimacion puntual y la estimacion por intervalos. La primera proporcionaun solo valor numerico, este valor debe ser aproximado al parametro objetivo. La segundaconsiste en dar dos numeros que formaran un intervalo que debe contener al parametroobjetivo. Este intervalo recibe el nombre de intervalo de confianza estimado.

Los estimadores puntuales mas comunes son:

la media de la muestra para estimar el valor promedio de la poblacion;

la desviacion estandar de la muestra para estimar la desviacion estandar de la pobla-cion;

la proporcion en la muestra como estimador de la proporcion en la poblacion.

Page 36: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

30 CAPITULO 2. CONCEPTOS DE PROBABILIDAD Y ESTADISTICA

Por otro lado, se define un estadıstico como una funcion que depende de la muestra, esdecir,

Definicion 2.2.8 Un estadıstico T, es funcion de las variables aleatorias observadas en lamuestra que no contiene valores desconocidos y se denota por T = f(X1,X2, ...,Xn).

Con lo anterior, un estadıstico es usado para estimar los valores de los parametros que sedesconocen o funciones de estos. Ademas, un estadıstico es una variable aleatoria, mientrasun parametro es una constante. Para ilustrar el proceso de estimacion se dan las siguientesdefiniciones:

Definicion 2.2.9 Sea θ un parametro arbitrario. Un estimador de θ, denotado por θ esaquel estadıstico usado para estimar el valor del parametro desconocido θ.

La estimacion de θ es un valor especıfico t obtenido de los datos de la muestra. De estamanera, un estimador es un estadıstico mediante el cual se obtiene una estimacion de lasobservaciones de la muestra. Se pueden definir varios estadısticos para estimar un parame-tro desconocido θ.

Para fines practicos se denotara mediante f(x; θ) a la funcion de densidad de probabili-dad de la poblacion de interes, donde θ es un parametro arbitrario y la funcion depende deeste.

Definicion 2.2.10 Sea θ un estimador puntual de θ. Entonces θ es insesgado si E(θ) = θ.En caso contrario, se dice que el estimador es sesgado.

El sesgo B de un estimador puntual θ se define como

B(θ) = E(θ) − θ.

El sesgo de un estimador puede ser positivo, negativo o cero.Un concepto usado en estimacion es el de error cuadratico medio, el cual se define a

continuacion.

Definicion 2.2.11 Sea θ un estimador de un parametro desconocido θ. El error cuadraticomedio del estimador θ del parametro θ se define y denota por

ECM(θ) = E(θ − θ)2.

El error cuadratico medio cumple la siguiente propiedad,

ECM(θ) = Var(θ) +[

θ − E(θ)]2.

Observacion: En la practica es comun encontrar al menos dos estimadores para determi-nado parametro. En estos casos se debe elegir aquel que sea el mejor en el sentido de cumplir

Page 37: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

2.2. ESTADISTICA 31

ciertas propiedades que aproximen mejor al parametro. Para determinar que estimador es elmas adecuado, existen dos metodos. El primero consiste en elegir el estimador tal que tengauna distribucion de muestreo centrada alrededor de θ y la varianza sea la menor posible.Esto es, si θ1 y θ2 son insesgados, entonces se elige aquel que presente menor varianza, esdecir, se elige θ2 si

Var(θ2) < Var(θ1).

El segundo metodo consiste en usar el ECM. Para esto, se calcula el ECM para ambosestimadores y se realiza el cociente entre ellos, si el cociente es menor que 1, entonces sedira que el estimador para el cual su ECM se encuentra en el numerador es el mejor, pueseste tendra el menor ECM. Si el cociente es igual a 1, entonces el metodo no proporcionaninguna informacion respecto a los estimadores.

Definicion 2.2.12 Sea θ un parametro arbitrario y x = (x1, x2, ..., xn) los datos de lamuestra aleatoria. La funcion de verosimilitud para la muestra se denota y define por

L(x; θ) =

n∏

i=1

f(xi; θ). (2.1)

L(x; θ) es funcion de los parametros, en algunas ocasiones se denota a la funcion deverosimilitud con L(θ).

2.2.2. Metodos de estimacion puntual

Existen varios metodos para hallar la estimacion de un parametro. Los mas comunesson: el metodo de los momentos y el metodo de maxima verosimilitud.

El metodo de los momentos consiste en igualar los momentos muestrales y los poblacio-nales.

El metodo de estimacion por maxima verosimilitud consiste en hallar el valor del parame-tro que maximiza la funcion de verosimilitud.

Definicion 2.2.13 Sea L(x; θ) la funcion de verosimilitud de una muestra aleatoria X1,X2,...,Xn de una distribucion con funcion de densidad f(x; θ). Si t = u(x1, x2, ..., xn) es el valorde θ que maximiza L(x; θ), entonces T = u(X1,X2, ...,Xn) se llama estimador de maximaverosimilitud de θ, y t = u(x1, x2, ..., xn) es la estimacion de maxima verosimilitud.

Para simplificar la estructura de la funcion de verosimilitud, se busca maximizar el lo-garitmo natural de L(θ), lo cual se puede hacer pues la funcion ln es creciente y continuaen su dominio, esto asegura que la solucion que maximiza L(θ) tambien maximiza ln[L(θ)].Por motivos practicos, comunmente se escribe l(θ) = ln[L(x; θ)].

Page 38: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

32 CAPITULO 2. CONCEPTOS DE PROBABILIDAD Y ESTADISTICA

Para ilustrar este metodo, se tiene el siguiente ejemplo para estimar la media y lavarianza de una poblacion con distribucion normal.

Ejemplo 2.2.14 Si X1,X2, ...,Xn es una muestra aleatoria de una distribucion normalcuya funcion de densidad de probabilidad esta dada por

f(x;µ, σ2) =1√

2πσ2exp

−1

2

(

x− µ

σ

)2

.

Determinar los estimadores de maxima verosimilitud para µ y σ2 respectivamente.

Solucion:

Para este ejemplo, es facil notar que la funcion de verosimilitud depende tanto de µcomo de σ, es decir, estos son los dos parametros los cuales deben ser estimados (son losvalores para los cuales la funcion de verosimilitud obtiene un valor maximo).

Por definicion,

L(x1, x2, .., xn;µ, σ2) =

n∏

i=1

1√2πσ2

exp

−1

2

(

xi − µ

σ

)2

=

(

1√2πσ2

)n

exp

n∑

i=1

− 1

2

(

xi − µ

σ

)2

,

de aquı,

L(x1, x2, .., xn;µ, σ2) =

(

1√2πσ2

)n

exp

n∑

i=1

− 1

2

(

xi − µ

σ

)2

.

Tomando logaritmos a esta ultima ecuacion:

l(µ, σ2) = ln[L(x1, x2, .., xn;µ, σ2)]

= −n ln(√

2πσ2) − 1

2σ2

n∑

i=1

(xi − µ)2

= −n ln(2πσ2)1/2 − 1

2σ2

n∑

i=1

(xi − µ)2

=−n2

ln(2πσ2) − 1

2σ2

n∑

i=1

(xi − µ)2

= −n2

ln(2π) − n

2ln(σ2) − 1

2σ2

n∑

i=1

(xi − µ)2.

Page 39: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

2.3. PROCESOS ESTOCASTICOS 33

Derivando con respecto a µ y σ2, e igualando a cero estas derivadas se obtiene

∂[l(µ, σ2)]

∂µ= − 2

2σ2

n∑

i=1

(xi − µ) = 0 (2.2)

y

∂[l(µ, σ2)]

∂σ2=

−n2σ2

+1

2σ4

n∑

i=1

(xi − µ)2 = 0. (2.3)

Resolviendo (2.2), para µ se obtiene

µ =

n∑

i=1

xi

n= x.

Sustituyendo este valor en (2.3) y resolviendo para σ2 se tiene,

σ2 =

n∑

i=1

(xi − x)2

n.

Ası, los estadısticos de maxima verosimilitud de µ y σ2 son Tµ = X y Tσ2 =

n∑

i=1

(Xi − X)2

n ,respectivamente.

2.3. Procesos estocasticos

El estudio de los procesos estocasticos consiste en analizar el comportamiento de unavariable aleatoria a traves del tiempo, basandose en caracterısticas no determinısticas, esdecir, fenomenos aleatorios.

Para tener una mejor apreciacion de las propiedades dadas en el analisis de las series detiempo, se daran en esta seccion algunos conceptos fundamentales de procesos estocasticos.

Definicion 2.3.1 Un proceso estocastico se define como una coleccion de v.a’s Xt :t ∈ T parametrizada por un conjunto T ⊂ R de subındices, llamado espacio parametrico.El conjunto T usualmente se interpreta como un conjunto de valores de tiempo.

Se dice que el proceso estocastico es discreto si T es discreto (por ejemplo T = 0,±1,±2,...),y el proceso estocastico es continuo si T puede tomar cualquier valor en un intervalo de R,por ejemplo [0,∞), es decir el tiempo es continuo. Un proceso es llamado de valores reales,

Page 40: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

34 CAPITULO 2. CONCEPTOS DE PROBABILIDAD Y ESTADISTICA

si las variables aleatorias solo pueden tomar valores reales.

Se denota la variable aleatoria en el tiempo t por X(t) si el tiempo es continuo, y por Xt

si el tiempo es discreto. Estas notaciones hacen referencia al estado o posicion del procesoestocastico en el instante t.

Definicion 2.3.2 El espacio de estados de un proceso se define como el conjunto de todoslos posibles valores que las v.a’s Xt pueden tomar, y se denota por E.

Una realizacion de un proceso estocastico es una asignacion de los valores de las v.a’sen el espacio de estados.

Algunos ejemplos de procesos estocasticos son:

X(t): numero de personas que esperan en una parada de autobus durante un instantet donde t es el tiempo medido en minutos del intervalo [9, 10], el espacio de estados esE = 1, 2, 3, ....

Xt: precio del dolar en un dia t del mes de junio de 2010 (t = 1, 2, ..., 30), el espaciode estados para cada v.a. es continuo, por ejemplo [0,20].

Xt: numero de nacimientos en el estado de Oaxaca en el mes t (t = 1, 2, ..., 12),E = 1, 2, 3, ....

Similarmente a las definiciones dadas anteriormente para v.a’s, se tiene la siguientedefinicion.

Definicion 2.3.3 Sea Xt : t ∈ T un proceso estocastico con E(X2t ) < ∞, entonces se

define:

a) la funcion media del proceso por,

µt = E(Xt);

b) la funcion varianza del proceso,

σ2t = E

[

(Xt − µt)2]

;

c) la funcion covarianza entre Xr y Xs,

γ(r, s) = Cov(Xr,Xs) = E[(Xr − µr)(Xs − µs)], donde r, s ∈ T ;

d) y la funcion correlacion entre Xr y Xs por,

ρ(r, s) =γ(r, s)√

σ2rσ

2s

.

Page 41: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

2.3. PROCESOS ESTOCASTICOS 35

Para definir los procesos estocasticos, se debe determinar e identificar la distribucion deprobabilidad asociada a cada v.a.

Clasificacion de los procesos estocasticos

Los procesos estocasticos se pueden clasificar segun: la estructura del conjunto de ındi-ces T y el conjunto de estados E, y segun las caracterısticas probabilısticas de las variablesaleatorias.

Procesos estocasticos basados en la estructura de T y E

Existen cuatro tipos de procesos estocasticos dependiendo de si T y E son continuas odiscretas, de esta forma se tiene la siguiente clasificacion:

cadena si E y T son discretos;

proceso puntual si E es discreto y T es continuo;

sucesion de v.a’s si E es continuo y T discreto;

proceso continuo si E y T son continuos.

Procesos estocasticos basados en las caracterısticas probabilısticas de lasv.a’s.

Otra forma de clasificacion de los procesos estocasticos toma en cuenta las caracterısti-cas de las variables aleatorias en cuestion, de esta forma, los procesos estocasticos se puedenclasificar en:

procesos estacionarios;

procesos Markovianos;

procesos de incrementos independientes.

En particular nos interesa conocer mas acerca de procesos estocasticos estacionarios, espor esta razon que a continuacion se analizan este tipo de procesos.

Procesos estacionarios

Un proceso se dice que es estacionario si Xt no depende del tiempo. Para lograr unamejor comprension de los procesos estacionarios, es necesario definir ciertos conceptos, queson fundamentales para este tipo de procesos. Ademas seran de gran utilidad en el capıtuloposterior.

Page 42: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

36 CAPITULO 2. CONCEPTOS DE PROBABILIDAD Y ESTADISTICA

La funcion de distribucion conjunta n-dimensional para un proceso estocastico se definepor

F (xt1 , xt2 , ..., xtn ) = P (Xt1 ≤ xt1 , ...,Xtn ≤ xtn).

Los procesos estacionarios a su vez se clasifican en procesos estacionarios debiles y pro-cesos estacionarios fuertes.

Un proceso se dice que es debilmente estacionario si todos los momentos de orden nexisten y son independientes del tiempo t. Mas aun, un proceso estacionario de segundoorden1 tiene media y varianza constantes. Formalmente se tiene la siguiente definicion.

Definicion 2.3.4 Un proceso estacionario debil es aquel proceso Xt : t ∈ T, con E(X2t ) <

∞ ∀ t ∈ T , tal que,

a) E(Xt) = m, ∀ t ∈ T ;

b) γ(r, s) = γ(r + t, s+ t), ∀ r, s, t ∈ T.

En a), significa que el valor esperado es constante. El hecho de que γ(r, s) = γ(r+t, s+t)significa que la funcion covarianza toma el mismo valor para dos v.a’s que esten separadaspor un retardo o rezago t en el proceso, independientemente de donde se encuentren situa-das estas v.a’s en el tiempo.

Por otro lado, un proceso se dice que es estrictamente estacionario o fuertemente esta-cionario, si (Xt1 ,Xt2 , ...,Xtn ) tienen la misma distribucion conjunta que (Xt1+k,Xt2+k, ...,Xtn+k).

Definicion 2.3.5 Un proceso estacionario fuerte es aquel proceso Xt : t ∈ T, tal que∀ t ∈ T, E(X2

t ) <∞ si ∀ n ∈ N, ∀ k ∈ T y ∀ t1, t2, ..., tn ∈ T ,

F (xt1 , xt2 , ..., xtn) = F (xt1+k, xt2+k, ..., xtn+k).

Siempre se cumple que un proceso estrictamente estacionario implica un proceso debil-mente estacionario, el recıproco no necesariamente se cumple.

Para un proceso estrictamente estacionario, la funcion media µt = µ es una constan-te, siempre que E(|Xt|) < ∞. Tambien si E(X2

t ) < ∞, entonces σ2t = σ2 para todo t, de

aquı que la varianza tambien es constante.

1Un proceso es estacionario de segundo orden si F (xt1 , xt2) = F (xt1+k, xt2+k), para t1, t2, k, t1+k, t2+k ∈Z.

Page 43: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

2.3. PROCESOS ESTOCASTICOS 37

Funciones de autocorrelacion y autocovarianza

Para un proceso estacionario Xt : t ∈ T, se tiene que la media E(Xt) = µ y lavarianza Var(Xt) = E(Xt − µ) = σ2 son constantes, y la covarianza Cov(Xt,Xs), la cuales una funcion que solo depende del rezago del tiempo. En este caso, en particular paracuando s = t+ k (k es un rezago), se define la funcion de autocovarianza como una funciondependiente solamente del rezago k como:

γk = E[(Xt − µ)(Xt+k − µ)] = Cov(Xt,Xt+k).

Por motivos practicos, algunas veces se debe estandarizar la funcion autocovarianza paraobtener la funcion de autocorrelacion (FAC), dada por

ρk = Corr(Xt,Xt+k) =Cov(Xt,Xt+k)

Var(Xt)Var(Xt+k)=γk

γ0, (2.4)

la cual mide la correlacion entre Xt y Xt+k,

Para un proceso estacionario, la funcion de autocovarianza y la FAC cumplen las si-guientes propiedades:

Propiedad 2.3.6 Sea Xt : t ∈ T un proceso estocastico estacionario, con media µ,varianza σ2, funcion autocovarianza γk y funcion autocorrelacion ρk, entonces:

a) γ0 = Var(Xt) ≥ 0 y ρ0 = 1;

b) |ρk| ≤ 1 y |γk| ≤ γ0;

c) γk = γ−k y ρk = ρ−k para todo k, es decir γk y ρk son funciones pares y de aquı quesean simetricas con respecto a t = 0;

d) γk y ρk son positivas semidefinidas, es decir

n∑

i=1

n∑

j=1

αiαjγ|ti−tj | ≥ 0

yn∑

i=1

n∑

j=1

αiαjρ|ti−tj | ≥ 0,

para cualquier conjunto de puntos t1, t2, ..., tn y cualquier numero real α1, α2, ..., αn.

Demostracion.

a) Se cumple por definicion.

Page 44: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

38 CAPITULO 2. CONCEPTOS DE PROBABILIDAD Y ESTADISTICA

b) Se sabe que Var(aXt + bXt+k) ≥ 0, y por propiedad (2.1.28,h), se tiene que

0 ≤ a2Var(Xt) + b2Var(Xt + k) + 2abCov(Xt,Xt+k)

= a2σ2 + b2σ2 + 2abγk

= (a2 + b2)σ2 + 2abγk.

De aquı se desprenden dos casos:

Si a = b = 1, entonces

0 ≤ 2σ2 + 2γk

0 ≤ σ2 + γk

−γk ≤ σ2.

De esta ultima desigualdad y del hecho de que γ0 = σ2 y ρk = γk

γ0, se sigue que

−1 ≤ ρk. (2.5)

Ahora, si a = 1 y b = −1, entonces

0 ≤ 2σ2 − 2γk

0 ≤ σ2 − γk

γk ≤ σ2

De aquı se obtiene queρk ≤ 1. (2.6)

De (2.5) y (2.6) se obtiene que −1 ≤ ρk ≤ 1, es decir |ρk| ≤ 1.

|γk| ≤ γ0 es consecuencia inmediata del hecho de que −1 ≤ ρk ≤ 1.

c) El resultado se obtiene por el hecho de que la correlacion entre Xt+k y Xt es la mismaque la correlacion entre Xt y Xt−k, esto por ser Xt estacionario. Es decir,

γk = Cov(Xt+k,Xt)

= Cov(Xt,Xt−k)

= γ−k.

d) Definiendo X =∑n

i=1 αiXti , el resultado es inmediato, del hecho de que

0 ≤ Var(X) =

n∑

i=1

n∑

j=1

αiαjCov(Xti ,Xtj ) =

n∑

i=1

n∑

j=1

αiαjγ|ti−tj |.

Analogamente se obtiene el resultado para ρk.

Page 45: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

2.3. PROCESOS ESTOCASTICOS 39

Lo anterior se muestra en el siguiente ejemplo.

Ejemplo 2.3.7 Caminata aleatoria

Supongamos que Zt es un proceso puramente aleatorio2. Un proceso Xt : t ∈ T esllamado caminata aleatoria si

Xt = Xt−1 + Zt.

Comunmente este proceso comienza cuando t = 0, es decir X0 = 0, de la relacionrecursiva anterior se obtiene que

X1 = Z1

y

Xt =

t∑

i=1

Zi.

Es facil verificar que E(Xt) = tµZ y Var(Xt) = tσ2Z . En efecto,

E(Xt) = E

[

t∑

i=1

Zi

]

=t∑

i=1

E[Zi]

= tµZ .

Y para la varianza se tiene,

Var(Xt) = Var

(

t∑

i=1

Zi

)

=

t∑

i=1

Var(Zi)

= tσ2Z .

Como la media y la varianza dependen de t, el proceso es no estacionario.

Por otro lado, la funcion de autocovarianza esta dada por,

2Para un proceso puramente aleatorio se cumple que E(Zt) = µZ y Var(Zt) = σ2Z , ademas las Z′s son

v.a’s iid.

Page 46: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

40 CAPITULO 2. CONCEPTOS DE PROBABILIDAD Y ESTADISTICA

γk = Cov(Xt,Xt+k)

= Cov(Xt,Xt + Zt+1 + ...+ Zt+k)

= Cov(Xt,Xt)

= Var(Xt)

= tσ2Z .

Hasta aquı se mostraron los conceptos basicos correspondientes a la teorıa de probabili-dad y estadıstica, ası como tambien la introduccion a procesos estocasticos, los cuales son labase para el estudio de series de tiempo, dicho estudio se muestra en el siguiente capıtulo.

Page 47: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

Capıtulo 3

Fundamentos de series de tiempo

No siempre es posible predecir con total exactitud algun valor de la serie de tiempo.Sin embargo, se pueden encontrar ciertos patrones en las series de tiempo como tendencia,estacionalidad, entre otros mencionados en el Capıtulo 1, estos pueden describir el compor-tamiento de la serie. Tambien es posible describirlas mediante modelos basados en distribu-ciones de probabilidad. En este capıtulo se estudian las principales tecnicas y modelos quedescriben a las series de tiempo.

3.1. Fundamentos y tecnicas descriptivas de series de tiempo

Graficar los datos que conforman una serie de tiempo resulta ser de gran utilidad parallevar a cabo un buen analisis de la misma. Una vez que los datos han sido graficados esposible observar algunas discontinuidades o irregularidades, incluso datos atıpicos, si es queexisten en la serie de tiempo. En el Capıtulo 1 se describen algunas componentes de lasseries de tiempo, entre las que destacan: tendencia, cambios cıclicos y efecto estacional.Tales discontinuidades pueden ser cambios de nivel repentinos, por lo que serıa de muchautilidad analizar los datos por intervalos o segmentos iguales. Es necesario analizar estascomponentes y si es posible realizar transformaciones o aplicar alguna tecnica para eli-minarlas o modificarlas. Llevando a cabo este proceso, se logra obtener series de tiempoestacionarias. Ciertamente, esto permite realizar un mejor analisis ademas de prediccionesen las series de tiempo. En adelante, solo se tomaran en cuenta las series de tiempo discretas.

Una manera de representar una serie de tiempo es mediante la ecuacion

Xt = mt + st + εt,

donde Xt es un proceso, mt es la componente de tendencia, st es una funcion que representala componente estacional y εt es la componente de ruido aleatorio1. A continuacion sedescriben brevemente estos tipos de analisis.

1E(εt) = 0 y Var(εt) = σ2.

41

Page 48: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

42 CAPITULO 3. FUNDAMENTOS DE SERIES DE TIEMPO

3.1.1. Transformaciones

Es posible realizar transformaciones en los datos graficados con el fin de facilitar el anali-sis de la serie de tiempo. Existen transformaciones logarıtmicas y tranformaciones aplicandoraız cuadrada. Algunas razones para realizar una transformacion son las siguientes:

a) Para estabilizar la varianza. Si en la serie existe tendencia y la varianza incrementa conla media, puede hacerse una transformacion. Si la desviacion estandar es directamenteproporcional a la media, se debe hacer una transformacion logarıtmica.

b) Para hacer aditivo el efecto estacional. Si existe tendencia y el tamano del efectoestacional incrementa con la media, se puede hacer una transformacion para hacerconstante el efecto estacional (cambios periodicos anuales), a esto se le llama efectoestacional aditivo. Si el tamano del efecto estacional es directamente proporcional ala media, entonces se dice que es un efecto estacional multiplicativo. En este caso sedebe hacer una transformacion logarıtmica.

c) Para obtener una distribucion normal en los datos. En muchas ocasiones es importantenormalizar los datos para facilitar el analisis.

3.1.2. Analisis de series que contienen tendencia

El tipo mas simple de tendencia lineal es de la forma tendencia lineal + ruido, aunquepuede definirse de diferentes maneras. La observacion en el tiempo t es una variable aleatoriaXt dada por

Xt = α+ βt+ εt, (3.1)

donde α y β son constantes y εt es un termino de error aleatorio con media cero.

El nivel medio en el tiempo t esta dado por

mt = α+ βt, (3.2)

el cual tambien se llama componente de tendencia. La tendencia en (3.2) es una funcion quedepende del tiempo y en algunas ocasiones la llaman tendencia lineal global. Otros autoreshacen referencia a la tendencia como el cambio en el nivel medio por unidad de tiempo, esdecir toman a β como la tendencia.

Es posible ajustar un modelo para la tendencia mediante una funcion lineal (3.2); estetipo de ajuste tienen la ventaja de ser muy sencillo de analizar, sin embargo, en ocasionesexisten cambios bruscos en la tendencia, es por esta razon que es mas adecuado realizar elanalisis por intervalos. Es decir, ajustar un modelo lineal a trozos. Si se ajusta un modelolineal a trozos es mas facil visualizar los cambios de la tendencia; ademas de que se puedeobservar como α y β evolucionan con el tiempo. Esta evolucion se puede dar de forma

Page 49: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

3.1. FUNDAMENTOS Y TECNICAS DESCRIPTIVAS DE SERIES DE TIEMPO 43

determinista, aunque tambien se puede dar de forma estocastica, con lo cual se obtiene loque se conoce como tendencia estocastica.

Formalmente definimos el modelo con componente estacional de la siguiente manera.

Definicion 3.1.1 El modelo cuya unica componente es la tendencia esta dado por

Xt = mt + εt, para t = 1, 2, ..., n, (3.3)

donde E(εt) = 0.

Observacion 3.1.2 Si E(εt) 6= 0, entonces se reemplazan mt y εt en (3.3) con mt + E(εt)y εt − E(εt), respectivamente.

A continuacion se analizan algunas tecnicas que ayudan a describir la tendencia en unaserie de tiempo.

Estimacion de la tendencia

Uno de los principales metodos no parametricos para la estimacion de tendencia y cons-truccion de modelos es el suavizamiento.

Los siguientes metodos fueron pensados con el fin de estimar la tendencia ajustando unpolinomio y luego eliminarla de los datos. De esta manera es posible encontrar un modeloadecuado de serie de tiempo estacionario para la componente residual; o bien, eliminar latendencia mediante diferenciacion y luego encontrar el modelo apropiado para la serie dife-renciada (componente residual).

Suavizamiento.

A continuacion se presentan dos tipos de suavizamiento que pueden ser usados paraestimar la tendencia en una serie de tiempo.

I. Suavizamiento por filtros. Usar filtros lineales ayuda a convertir una serie de tiempoxt en otra yt mediante

yt =

s∑

r=−q

arxt+r,

donde ar es un conjunto de pesos tales que∑

ar = 1. Esta tecnica hace referencia a unproceso de promedio movil.

Un procedimiento de suavizado en las series puede ser por ejemplo,

Page 50: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

44 CAPITULO 3. FUNDAMENTOS DE SERIES DE TIEMPO

xt−→ Filtro 1yt−→ Filtro 2

zt−→

El filtro 1 con pesos ar actua sobre xt para producir yt. El filtro 2 con pesos bjactua sobre yt para producir zt.

Consideremos el siguiente filtro de promedio movil,

Wt =1

2q + 1

q∑

r=−q

Xt−r, donde q ∈ Z+,

del proceso Xt definido por la ecuacion (3.3). Para q + 1 ≤ t ≤ n− q se tiene,

Wt =1

2q + 1

q∑

r=−q

mt−r +1

2q + 1

q∑

r=−q

Yt−r ≃ mt,

suponiendo que mt es aproximadamente lineal en [t−q, t+q] y que la media de los terminosde error es muy cercana a cero, entonces

mt =1

2q + 1

q∑

r=−q

Xt−r, q + 1 ≤ t ≤ n− q, (3.4)

proporciona un estimador para la tendencia.

La eleccion de los filtros para suavizar es de caracter subjetivo, el investigador debeprobar con diferentes filtros para obtener una mejor estimacion de la tendencia.

II. Suavizamiento exponencial. Una tecnica bastante conocida en la literatura es elsuavizamiento exponencial, esta tambien es una tecnica muy util para estimar la tendencia.

Por ejemplo para cualquier numero fijo a ∈ [0, 1], el proceso mt, t = 1, 2, ..., n definidopor

mt = aXt + (1 − a)mt−1, t = 2, ..., n

ym1 = X1,

puede ser estimado mediante suavizamiento exponencial.

El metodo de suavizamiento exponencial asume que

mt =

t−2∑

j=0

α(1 − α)jXt−j + (1 − α)t−1Xt, (3.5)

Page 51: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

3.1. FUNDAMENTOS Y TECNICAS DESCRIPTIVAS DE SERIES DE TIEMPO 45

donde α es una constante y 0 < α < 1, es un estimador para la tendencia. Los pesosaj = α(1 − α)j decrecen con respecto a j.

El suavizamiento exponencial utiliza valores presentes y pasados de la serie, este metodoes comun cuando se realiza prediccion.

Una vez que se estima la tendencia se pueden observar las fluctuaciones locales,

Res(xt) = residuales del valor suavizado

= xt − sm(xt)

=

s∑

r=−q

brxt+r.

El cual tambien puede ser considerado como un filtro lineal tomando b0 = 1 − a0 ybr = −ar para r 6= 0. Si se tiene que

ar = 1, entonces∑

br = 0 y el filtro elimina latendencia.

Ajuste polinomial.

Para datos anuales es posible ajustar una funcion simple de tiempo como una curvapolinomial (lineal, cuadratica, etc.), una curva Gompertz, una curva logıstica o por algunotro metodo como el conocido por mınimos cuadrados, vease [4].

Por ejemplo por mınimos cuadrados lo que se pretende, una vez que se tiene la tendenciade la forma mt = a0+a1t+a2t

2, es ajustar a los datos x1, x2, ..., xn, eligiendo los parametrosa0, a1, a2, tales que minimicen

∑nt=1(xt −mt)

2.

La curva Gompertz esta dada por

log xt = α+ βrt,

donde α y β son parametros, 0 < r < 1, o bien por

xt = α expβ exp(−γt), γ > 0.

La curva logıstica esta dada por

xt =α′

1 + β′ exp(−ct) .

En las curvas antes mencionadas, t→ ∞, sin embargo, la Gompertz converge mas lentoque la logıstica. Ademas, en estas curvas, la funcion proporciona una medida de la tenden-cia y los residuales, una aproximacion de fluctuaciones locales donde los residuales son lasdiferencias entre las observaciones y los correspondientes valores de la curva ajustada.

Page 52: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

46 CAPITULO 3. FUNDAMENTOS DE SERIES DE TIEMPO

Eliminacion de tendencia

Lo que se intenta ahora en lugar de eliminar los terminos de error, es eliminar la tendenciaen una serie mediante diferenciacion.

Eliminacion por diferenciacion. Diferenciar una serie de tiempo dada hasta lograr ha-cerla estacionaria, es un tipo de filtro particular el cual elimina la tendencia de la serie. Parapoder aplicar esto se necesita que los datos sean no estacionales, es decir, que no presentenfluctuaciones periodicas muy marcadas. Muchas veces basta con obtener las diferencias deprimer orden para lograr la estacionariedad de la serie.

A continuacion se definen dos operadores que seran de gran utilidad tanto en esta sec-cion como en las posteriores.

Definicion 3.1.3 El operador diferencial ∇ esta dado por

∇Xt = Xt −Xt−1 = (1 −B)Xt,

donde B es el operador de retraso dado por

BXt = Xt−1.

Analogamente se definen

Bj(Xt) = Xt−j

y

∇j(Xt) = ∇(∇j−1(Xt)), j ≥ 1, con ∇0(Xt) = Xt.

El metodo de diferenciacion consiste en formar una nueva serie y2, ..., yN apartir de laoriginal x1, ..., xN mediante

yt = Xt −Xt−1 = ∇Xt, t = 2, 3, ..., N.

En algunos casos es necesario obtener la segunda diferencia usando el operador ∇2,

∇2Xt = ∇(∇(Xt))

= (1 −B)(1 −B)Xt

= (1 − 2B +B2)Xt

= Xt − 2Xt−1 −Xt−2.

Page 53: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

3.1. FUNDAMENTOS Y TECNICAS DESCRIPTIVAS DE SERIES DE TIEMPO 47

3.1.3. Analisis de series que contienen variacion estacional

Existen basicamente 3 modelos estacionales:

a) Aditivo,

Xt = mt + st + εt.

b) Multiplicativo,

Xt = mtstεt.

c) Mixto,

Xt = mtst + εt.

donde, en cada una de las ecuaciones, mt es el nivel medio desestacionalizado en el tiempot, st es el efecto estacional en el tiempo t y εt es el error aleatorio.

En el caso multiplicativo, una transformacion logarıtmica es adecuada para obtener unmodelo aditivo lineal.

Los ındices estacionales st normalmente se eligen de tal forma que cambien lentamen-te con el tiempo. Es decir, se debe tener st ≃ st−s, donde s es el numero de observacionespor ano. Regularmente los ındices se normalizan y se hace la suma igual a cero en el casoaditivo, o el promedio igual a 1 en el caso multiplicativo.

Analogo al caso del analisis en que las series muestran tendencia, en las series que mues-tran variacion estacional, el analisis depende de si se desea medir y/o eliminar esta variacion.

Es usual en series que muestran una tendencia pequena estimar el efecto estacional paraun periodo de tiempo determinado. Esto se logra obteniendo el promedio de cada observa-cion del periodo en cuestion restandole el promedio anual para el caso aditivo. En el casomultiplicativo se debe dividir cada observacion de periodo por el promedio anual.

Estimacion de tendencia y componentes estacionales.

En el caso en que la serie dada presenta tendencia y variacion estacional se debe trabajarcon ambas componentes a la vez. Para llevar a cabo este procedimiento se debe seguir unasecuencia de pasos simples.

En primer lugar se estima la tendencia, luego las componentes estacionales y por ultimose vuelve a estimar la tendencia, ahora sin incluir los datos estacionales2.

A continuacion se ilustra este procedimiento.

2Metodo descrito en el libro de Brockwell & Davis [2].

Page 54: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

48 CAPITULO 3. FUNDAMENTOS DE SERIES DE TIEMPO

a) Se estima la tendencia de la serie con alguno de los metodos descritos en la seccion3.1.2, en la parte correspondiente a estimacion de tendencia, suponiendo que se tienenn observaciones. Si el periodo es par (d = 2q), entonces el estimador es

mt =12Xt−q +Xt−q+1 + · · · +Xt+q−1 + 1

2Xt+q

d, q < t ≤ n− q, (3.6)

en caso de que el periodo sea impar entonces se toma d = 2q+1 y se usa el estimador(3.4).

b) Se debe estimar la componente estacional. Se calcula el promedio wk de las desvia-ciones (xk+jd − mk+jd), q < k + jd ≤ n − q, para k = 1, ..., d. Aunque esto resultaser inapropiado pues el promedio de las desviaciones no necesariamente suma cero,entonces se estiman las componentes estacionales mediante

sk = wk −

d∑

i=1

wi

d, k = 1, ..., d,

y sk = sk−d, k > d.

Ahora los datos desestacionalizados son estimados mediante

dt = xt − st, t = 1, ..., n,

es decir las componentes estacionales estimadas son eliminadas del modelo para cons-truir otro.

c) Por ultimo se debe estimar nuevamente la tendencia pero ahora sin las componentesestacionales (dt) usando alguno de los metodos descritos en la seccion 3.1.2.Una vez realizado todo lo anterior, la componente del ruido se podra estimar por

εt = xt − mt − st, t = 1, ..., n.

El siguiente es un ejemplo muy sencillo de como estimar los datos estacionales y ten-dencia.

Ejemplo 3.1.4 Para cuando se tienen datos mensuales, una forma de eliminar el efectoestacional se obtiene al calcular

sm(xt) =12xt−6 + xt−5 + · · · + xt+5 + 1

2xt+6

12. (3.7)

Para datos trimestrales la ecuacion a calcular es:

sm(xt) =12xt−2 + xt−1 + xt+1 + 1

2xt+2

4. (3.8)

Page 55: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

3.2. MODELOS QUE DESCRIBEN SERIES DE TIEMPO 49

De esta manera el efecto estacional para una serie de tiempo se puede estimar haciendoxt − sm(xt) en el caso aditivo o xt

sm(xt)para el caso multiplicativo.

Eliminacion de tendencia y componentes estacionales.

Por otro lado, el efecto estacional en una serie de tiempo tambien puede eliminarse me-diante un filtro simple lineal el cual es llamado diferenciacion estacional.

Por ejemplo, para datos mensuales se debe calcular

∇12Xt = Xt −Xt−12.

Es decir, la tecnica de diferenciacion descrita anteriormente para datos no estacionales,tambien se puede aplicar a datos estacionales de periodo d. Ahora se define el operador ∇d

de la siguiente manera,∇dXt = Xt −Xt−d = (1 −Bd)Xt. (3.9)

Aplicando este operador al modelo

Xt = mt + st + εt,

donde st tiene periodo d, se obtiene

∇dXt = mt −mt−d + εt − εt−d,

el cual da la descomposicion de la diferencia ∇dXt entre una componente de tendencia(mt − mt−d) y el termino de error (εt − εt−d). De esta forma, la tendencia (mt − mt−d)puede ser eliminada usando el metodo descrito en la seccion 3.1.2, en particular aplicandoel operador dado en (3.9).

Estos procedimientos descritos son solo algunos de los existentes para estimar y/o eli-minar tanto la tendencia como el efecto estacional en una serie de tiempo. Dichos procedi-mientos seran de utilidad mas adelante con fines practicos.

3.2. Modelos que describen series de tiempo

Como se menciono en el Capıtulo 2, un proceso estocastico es una familia de v.a’s in-dexadas por un conjunto que generalmente se asocia a valores de tiempo. Los procesosestocasticos miden la evolucion de alguna o algunas variables a lo largo del tiempo. En estatesis, se hara enfasis en los procesos para los cuales el conjunto de ındices es discreto, eneste caso, se puede ver al proceso Xt : t ∈ T como una sucesion de v.a’s.

Una realizacion de un proceso estocastico Xt : t ∈ T, es una asignacion de valorespara cada una de las v.a’s de este proceso.

Page 56: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

50 CAPITULO 3. FUNDAMENTOS DE SERIES DE TIEMPO

Una serie de tiempo se puede ver como una realizacion de algun proceso estocasticodiscreto. Por motivos practicos se supone que cada observacion xt es un valor realizado decierta v.a. Xt.

Formalmente se tiene la siguiente definicion de serie de tiempo.

Definicion 3.2.1 Una serie de tiempo para los datos observados xt es una especificacion delas distribuciones conjuntas de una sucesion de v.a’s Xt, de las cuales xt son tomadascomo realizaciones.

3.2.1. Funcion autocorrelacion parcial

Comunmente, ademas de la autocorrelacion entre las variables Xt y Xt+k, se deseaconocer la correlacion entre estas variables, excluyendo la dependencia lineal entre Xt yXt+k y las variables Xt+1,Xt+2, · · · ,Xt+k−1. Esto se denota como la correlacion condicional

Corr(Xt,Xt+k|Xt+1, ...,Xt+k−1),

la cual es conocida como funcion autocorrelacion parcial (FACP). El proceso para encontrardicha autocorrelacion es el siguiente.

Considerese un proceso estacionario Xt, del cual se asume que E(Xt) = 03. Ladependencia lineal de Xt+k con Xt+1,Xt+2, · · · ,Xt+k−1 se define como el mejor estima-dor lineal de Xt+k, en el sentido de mınimos cuadrados como una combinacion lineal deXt+1,Xt+2, · · · ,Xt+k−1. Es decir,

Xt+k = α1Xt+k−1 + α2Xt+k−2 + · · · + αk−1Xt+1,

donde αi(1 ≤ i ≤ k − 1) es el coeficiente de regresion lineal de mınimos cuadrados queminimiza

E(Xt+k − Xt+k)2 = E(Xt+k − α1Xt+k−1 − · · · − αk−1Xt+1)

2.

Aplicando las condiciones necesarias de minimizacion, se obtiene el siguiente sistema deecuaciones lineales para las variables α1, α2, ..., αk−1,

γ1 = α1γ0 + α2γ−1 + · · · + αk−1γ−k

γ2 = α1γ1 + α2γ0 + · · · + αk−1γ1−k

...

γk−1 = α1γk−2 + α2γk−3 + · · · + αk−1γ0.

Como ρ cumple (2.4), entonces el sistema de ecuaciones anterior se transforma en:

3Si E(Xt) 6= 0, entonces se puede hacer una transformacion de Xt a Xt−E(Xt) y aplicar el procedimiento

Page 57: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

3.2. MODELOS QUE DESCRIBEN SERIES DE TIEMPO 51

ρ1 = α1ρ0 + α2ρ−1 + · · · + αk−1ρ−k

ρ2 = α1ρ1 + α2ρ0 + · · · + αk−1ρ1−k

...

ρk−1 = α1ρk−2 + α2ρk−3 + · · · + αk−1ρ0,

cuya forma matricial es la siguiente,

ρ1

ρ2...

ρk−1

=

1 ρ1 ρ2 · · · ρk−2

ρ1 1 ρ1 · · · ρk−3...

......

...ρk−2 ρk−3 ρk−4 · · · 1

α1

α2...

αk−1

. (3.10)

De forma similar se define la dependencia lineal de Xt con las variablesXt+1,Xt+2, · · · ,Xt+k−1, como el mejor estimador de mınimos cuadrados de Xt como com-binacion lineal de Xt+1,Xt+2, · · · ,Xt+k−1, es decir,

Xt = β1Xt+1 + β2Xt+2 + · · · + βk−1Xt+k−1,

donde los escalares βi(1 ≤ i ≤ k − 1) son los coeficientes de regresion lineal por mınimoscuadrados que minimizan

E(Xt − Xt)2 = E(Xt − β1Xt+1 − · · · − βk−1Xt+k−1)

2.

De aquı se obtiene el sistema de ecuaciones siguiente

ρ1

ρ2...

ρk−1

=

1 ρ1 ρ2 · · · ρk−2

ρ1 1 ρ1 · · · ρk−3...

......

...ρk−2 ρk−3 ρk−4 · · · 1

β1

β2...

βk−1

. (3.11)

Notese que (3.10) y (3.11) son equivalentes, es decir tienen la misma solucion. Esto im-plica que αi = βi para cada i = 1, 2, ..., k − 1.

Ahora se tiene que (Xt − Xt) es la variable que resulta al eliminar la dependencia linealde Xt respecto de Xt+1,Xt+2, ...,Xt+k−1. Analogamente (Xt+k − Xt+k) es la variable queresulta de eliminar la dependencia lineal de Xt+k respecto de Xt+1,Xt+2, ...,Xt+k−1. Ası,la autocorrelacion parcial entre Xt y Xt+k, que por definicion es la correlacion despuesde eliminar la independencia lineal antes mencionada, es igual a la correlacion entre lasvariables (Xt − Xt) y (Xt+k − Xt+k). Es decir

Pk =Cov[(Xt − Xt)(Xt+k − Xt+k)]

Var(Xt − Xt)Var(Xt+k − Xt+k),

Page 58: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

52 CAPITULO 3. FUNDAMENTOS DE SERIES DE TIEMPO

a partir de esta ecuacion se obtiene que

P1 = ρ1,

P2 =

1 ρ1

ρ1 ρ2

1 ρ1

ρ1 ρ1

,

P3 =

1 ρ1 ρ1

ρ1 1 ρ2

ρ2 ρ1 ρ3

1 ρ1 ρ2

ρ1 1 ρ1

ρ2 ρ1 1

,

...

Pk =

1 ρ1 ρ2 · · · ρk−2 ρ1

ρ1 1 ρ1 · · · ρk−3 ρ2...

......

......

ρk−1 ρk−2 ρk−3 · · · ρ1 ρk

1 ρ1 ρ2 · · · ρk−2 ρk−1

ρ1 1 ρ1 · · · ρk−3 ρk−2...

......

......

ρk−1 ρk−2 ρk−3 · · · ρ1 ρ1

.

Los cuales son valores de la funcion autocorrelacion parcial entre Xt y Xt+l, paral = 1, ..., k.

Existe otra forma de obtener la funcion de autocorrelacion parcial entre dos variables.Considerese una variable Xt+k de un proceso estacionario con media cero que depende delas variables de regresion Xt+k−1,Xt+k−2, ...,Xt, es decir,

Xt+k = φk1Xt+k−1 + φk2Xt+k−2 + · · · + φkkXt + et+k (3.12)

donde φki denota el i-esimo coeficiente de regresion y et+k es un termino de error normal nocorrelacionado con Xt+k−j para j ≥ 1. Multiplicando por Xt+k−j en ambos lados de (3.12)y tomando el valor esperado de la expresion resultante se obtiene:

γj = φk1γj−1 + φk2γj−2 + · · · + φkkγj−k,

y dividiendo por γ0 se obtiene,

ρj = φk1ρj−1 + φk2ρj−2 + · · · + φkkρj−k,

Page 59: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

3.2. MODELOS QUE DESCRIBEN SERIES DE TIEMPO 53

para j = 1, 2, ..., k se obtienen las siguientes ecuaciones,

ρ1 = φk1ρ0 + φk2ρ1 + · · · + φkkρk−1

ρ2 = φk1ρ1 + φk2ρ0 + · · · + φkkρk−2

...

ρk = φk1ρk−1 + φk2ρk−2 + · · · + φkkρ0.

Con la regla de Cramer se obtiene

φ11 = ρ1,

φ22 =

1 ρ1

ρ1 ρ2

1 ρ1

ρ1 ρ1

,

φ33 =

1 ρ1 ρ1

ρ1 1 ρ2

ρ2 ρ1 ρ3

1 ρ1 ρ2

ρ1 1 ρ1

ρ2 ρ1 1

,

...

φkk =

1 ρ1 ρ2 · · · ρk−2 ρ1

ρ1 1 ρ1 · · · ρk−3 ρ2...

......

......

ρk−1 ρk−2 ρk−3 · · · ρ1 ρk

1 ρ1 ρ2 · · · ρk−2 ρk−1

ρ1 1 ρ1 · · · ρk−3 ρk−2...

......

......

ρk−1 ρk−2 ρk−3 · · · ρ1 ρ1

.

(3.13)

Notese que los coeficientes φkk de regresion lineal cumplen φkk = Pk. Usualmente en laliteratura se denota la funcion autocorrelacion parcial como φkk.

3.2.2. Procesos puramente aleatorios

Definicion 3.2.2 Se dice que un proceso Zt : t ∈ T es un proceso puramente aleatoriosi es una sucesion de v.a’s iid no correlacionadas, donde ademas E(Zt) = µZ, la varianzaes constante, Var(Zt) = σ2

Z y γk = Cov(Zt, Zt+k) = 0, para todo k 6= 0.

Page 60: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

54 CAPITULO 3. FUNDAMENTOS DE SERIES DE TIEMPO

Por otro lado, se dice que el proceso puramente aleatorio Zt es estacionario y se tiene losiguiente.

La funcion autocovarianza (γk = E(ZtZt+k)) esta dada por

γk =

σ2Z , k = 0;0, otro caso.

La funcion autocorrelacion esta dada por

ρk =

1, k = 0;0, otro caso.

Y la funcion autocorrelacion parcial esta dada por

φkk =

1, k = 0;0, otro caso.

En particular si se toma µZ = 0, entonces se hace referencia a un proceso ruido blanco.

3.2.3. Funciones autocorrelacion y autocovarianza muestral

Media muestral

Del ejemplo 2.2.14, se observa que la media muestral resulta ser un buen estimador parala media poblacional. Para el caso cuando se tiene solo una realizacion (una asignacion devalores para las v.a’s.), tambien la media muestral proporciona un estimador para la mediaµ = E(Xt) de un proceso estacionario, esto es

X =1

n

n∑

t=1

Xt,

claramente, X es un estimador insesgado.

Funcion autocovarianza muestral

Se puede proponer un estimador para la funcion autocovarianza γk. Para fines practicosalgunas ocasiones resulta mas util calcular el estimador para γk y despues usar el hecho queρk = γk

γ0para obtener el estimador de ρk. Para una realizacion, el estimador γk de γk, se

define analogamente al caso ordinario como

γk =1

n

n−k∑

t=1

(Xt − X)(Xt+k − X), (3.14)

Page 61: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

3.2. MODELOS QUE DESCRIBEN SERIES DE TIEMPO 55

o

ˆγk =1

n− k

n−k∑

t=1

(Xt − X)(Xt+k − X), (3.15)

aunque ambos estimadores resultan ser sesgados, muchos autores prefieren usar (3.14) pues-to que resulta mejor estimador que (3.15). En efecto,

n−k∑

t=1

(Xt − X)(Xt+k − X) =n−k∑

t=1

[(Xt − µ) − (X − µ)][(Xt+k − µ) − (X − µ)]

=n−k∑

t=1

(Xt − µ)(Xt+k − µ) − (X − µ)n−k∑

t=1

(Xt − µ)

−(X − µ)n−k∑

t=1

(Xt+k − µ) + (n− k)(X − µ)2

≈n−k∑

t=1

(Xt − µ)(Xt+k − µ) − (n− k)(X − µ)2.

Por otro lado

E(γk) = E

[

1

n

n−k∑

t=1

(Xt − X)(Xt+k − X)

]

≃ 1

nE

[

n−k∑

t=1

(Xt − µ)(Xt+k − µ) − (n− k)(X − µ)2

]

=1

n

[

n−k∑

t=1

E[(Xt − µ)(Xt+k − µ)] − (n− k)Var(X)

]

=1

n

[

n−k∑

t=1

Cov(Xt,Xt+k) − (n− k)Var(X)

]

= γk − k

nγk −

(

n− k

n

)

Var(X).

Analogamente

E(ˆγk) = E

[

1

(n− k)

n−k∑

t=1

(Xt − X)(Xt+k − X)

]

≃ 1

(n− k)E

[

n−k∑

t=1

(Xt − µ)(Xt+k − µ) − (n− k)(X − µ)2

]

= γk − Var(X).

Page 62: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

56 CAPITULO 3. FUNDAMENTOS DE SERIES DE TIEMPO

Al ignorar el termino de Var(X) en las ultimas dos ecuaciones, es facil ver que ˆγk se haceinsesgado, mientras γk sigue siendo sesgado. El sesgo de γk es mas grande que el sesgo deˆγk, sobre todo cuando k es grande con respecto a n. Usando el criterio de comparar el ECMde ambos estimadores se encuentra que γk tiene menor ECM que ˆγk. Ademas, γk es positivasemidefinida como lo es γk, mientras que ˆγk no lo es. Por estas razones, es preferible usar(3.14) como funcion autocovarianza muestral para estimar la funcion de autocovarianza γk.

Funcion autocorrelacion muestral

Asociada a la funcion de autocovarianza muestral, tambien es posible definir la funcionde autocorrelacion muestral (FAC muestral) para una serie de tiempo dada X1,X2, ...,Xn,mediante,

ρk =γk

γ0=

n−k∑

t=1

(Xt − X)(Xt+k − X)

n∑

t=1

(Xt − X)2, k = 0, 1, 2, ...

Cuando se grafica ρk contra k, se obtiene a lo que comunmente se le conoce comocorrelograma muestral.

Funcion autocorrelacion parcial muestral

Ademas de las funciones antes mencionadas, es posible definir la funcion autocorrelacionparcial muestral (FACP muestral); esto se logra, sustituyendo en (3.13), ρi por su respectivoestimador ρi. Ahora se tiene un metodo recursivo iniciando con φ11 = ρ1 y

φk+1,k+1 =

ρk+1 −k∑

j=1

φkj ρk+1−j

1 −k∑

j=1

φkj ρj

y

φk+1,j = φkj − φk+1,k+1φk,k+1−j, j = 1, ..., k.

3.2.4. Procesos lineales estacionarios

Es posible representar una serie de tiempo de dos maneras. La primera consiste en escri-bir un proceso Xt como una combinacion lineal de una sucesion de v.a’s no correlacionadasy la segunda forma utiliza el operador de retraso B.

Page 63: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

3.2. MODELOS QUE DESCRIBEN SERIES DE TIEMPO 57

Definicion 3.2.3 Una serie de tiempo Xt es un proceso lineal si se puede representarcomo

Xt =

∞∑

j=−∞

ψjZt−j ∀ t, (3.16)

donde Zt es un proceso ruido blanco, y ψj es una sucesion de constantes tales que∞∑

j=−∞

ψ2j <∞.

Utilizando el operador de retraso B, se puede escribir (3.16) de la siguiente forma:

Xt = ψ(B)Zt,

donde ψ(B) =

∞∑

j=−∞

ψjBj.

Si ψj = 0 para todo j < 0, entonces se tiene

Xt =

∞∑

j=0

ψjZt−j .

Esta forma de escribir un proceso se le denomina representacion de medias moviles.

Notese que Xt esta bien definida, pues la condicion∞∑

j=−∞

ψ2j <∞ asegura que la suma en

(3.16) converge (con probabilidad 1) puesto que E(|Zt|2) = E(Z2t ) = Var(Zt) + (E(Zt))

2 =σ2, de aquı que E(|Zt|) ≤ σ y

E|Xt| ≤∞∑

j=−∞

(|ψt−j |E|Zt−j |) ≤

∞∑

j=−∞

|ψt−j |

σ <∞.

De aquı en adelante, una suma infinita de variables aleatorias es definida como el lımiteen la media cuadratica de la suma finita de sumas parciales. Esto es, (3.16) converge en lamedia cuadrada, es decir, Xt en (3.16) es definida tal que

E

Xt −n∑

j=−n

ψjZt−j

2

→ 0 cuando n → ∞.

Por otro lado, para la representacion de medias moviles se cumple,

E(Xt) = E

∞∑

j=0

ψjZt−j

=

∞∑

j=0

ψjE(Zt−j) = 0,

Page 64: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

58 CAPITULO 3. FUNDAMENTOS DE SERIES DE TIEMPO

Var(Xt) = σ2Z

∞∑

j=0

ψ2j ,

y

E(ZtXt−j) =

σ2Z , j = 0;0, otro caso.

De aquı que,

γk = E(XtXt+k) (3.17)

= E

∞∑

i=0

ψiZt−i

∞∑

j=0

ψjZt+k−j

(3.18)

= E

∞∑

i=0

∞∑

j=0

ψiψjZt−iZt+k−j

(3.19)

= σ2Z

∞∑

i=0

ψiψi+k, (3.20)

es decir,

γk = σ2Z

∞∑

i=0

ψiψi+k (3.21)

y

ρk =

∑∞i=0 ψiψi+k∑∞

i=0 ψ2i

.

Es facil ver que las funciones autocovarianza y autocorrelacion dependen solo de la dife-rencia del tiempo k. Mas aun, puesto que involucran sumas infinitas, para ser estacionarias,se debe probar que γk es finita para cada k. Esto es,

|γk| = |E(XtXt+k)| ≤ [Var(Xt)Var(Xt+k)]1/2 = σ2Z

∞∑

j=0

ψ2j .

De aquı que, tambien∞∑

j=−∞

ψ2j < ∞ es una condicion requerida para que el proceso en

(3.16) sea estacionario.

Para una sucesion de autocovarianzas γk, k = 0,±1,±2, ..., la funcion generadora decovarianzas se define como

γ(B) =∞∑

k=−∞

γkBk,

Page 65: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

3.2. MODELOS QUE DESCRIBEN SERIES DE TIEMPO 59

donde la varianza del proceso γ0, es el coeficiente de B0, y la autocovarianza del rezago k,γk, es el coeficiente tanto de Bk como de B−k. Por el hecho de que el proceso es estacionarioy por (3.21) se sigue que

γk = σ2Z

∞∑

k=−∞

∞∑

i=0

ψiψi+kBk

= σ2Z

∞∑

i=0

∞∑

j=0

ψiψjBj−i

= σ2Z

∞∑

j=0

ψjBj

∞∑

i=0

ψiB−i

= σ2Zψ(B)ψ(B−1),

donde ψj = 0 para j < 0. Analogamente, se define la funcion generadora de autocorrelacion,la cual esta dada por

ρ(B) =

∞∑

k=−∞

ρkBk =

γ(B)

γ0.

Otra forma usual de escribir un proceso Xt es mediante una representacion autorre-gresiva, en la cual el valor Xt es la suma de sus propios valores regresados en el tiempo tmas un proceso aleatorio, es decir,

Xt = π1Xt−1 + π2Xt−2 + · · · + Zt =

∞∑

i=1

πiXt−i + Zt,

o haciendo uso del operador B,

π(B)Xt = Zt, (3.22)

donde π(B) = 1 −∑∞j=1 πjB

j, y 1 +∑∞

j=1 |πj | < ∞. Cuando un proceso puede ser escrito

en esta forma, se dice que es invertible4.

Para que un proceso lineal Xt = ψ(B)Zt sea invertible, debe poder escribirse en termi-nos de un proceso autorregresivo, las raıces de ψ(B) = 0 como funcion de B deben estarfuera del cırculo unitario. Esto es, si β es una raız de ψ(B), entonces |β| > 1, donde | · | esla metrica Euclideana5.

4Box-Jenkins (1976) determinan esta propiedad en los procesos lineales. Ademas argumentan que enprediccion, un proceso que no es invertible no tiene sentido.

5Cuando β es un numero real, |β| es igual al valor absoluto de β, y cuando es un numero complejo,β = c + id, entonces |β| =

√c2 + d2.

Page 66: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

60 CAPITULO 3. FUNDAMENTOS DE SERIES DE TIEMPO

Para que el proceso (3.22) sea estacionario, se debe poder reescribir en una representacionde medias moviles, esto es,

Xt =1

π(B)Zt = ψ(B)Zt,

tal que

∞∑

j=0

ψ2j < ∞ se satisface. Para que esto sea posible, se requiere que las raıces de

π(B) = 0 se encuentren fuera del cırculo unitario.

En la practica, la construccion de estos modelos no es muy util, puesto que contienenun numero infinito de parametros que son imposibles de estimar a partir de un numerofinito de observaciones disponibles. Una forma alternativa, es construir modelos con solo unnumero finito de parametros.

3.2.5. Modelos de series de tiempo estacionarios

Anteriormente se menciono que un proceso estacionario puede escribirse como una com-binacion lineal de v.a’s no correlacionadas. Aquı se presenta la misma idea solo que para unnumero finito de observaciones. En este apartado se da a conocer el modelo autorregresivode medias moviles, el cual es una combinacion del modelo autorregresivo y el de mediasmoviles.

El proceso autorregresivo

Definicion 3.2.4 Sea Zt un proceso puramente aleatorio con media cero y varianza σ2Z.

Se dice que un proceso es autorregresivo de orden p, y se denota por AR(p) si puede serescrito como

Xt = α1Xt−1 + · · · + αpXt−p + Zt (3.23)

oαp(B)Xt = Zt, (3.24)

donde αp(B) = (1 − α1B − · · · − αpBp).

El proceso Xt es regresado en los mismos valores pasados de Xt en ambos casos, de aquı queal proceso se le denomine autorregresivo.

Puesto que

p∑

j=1

|πj | =

p∑

j=1

|αj | <∞, el proceso siempre es invertible. Para que sea esta-

cionario, las raıces de αp(B) = 0, deben estar fuera del cırculo unitario.

Los procesos AR son utiles para describir situaciones en las cuales la serie de tiempopresentada depende de sus valores pasados mas un proceso aleatorio.

Page 67: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

3.2. MODELOS QUE DESCRIBEN SERIES DE TIEMPO 61

Para una mejor comprension de este tipo de modelos, se consideran los siguientes casos.

El proceso autorregresivo de primer orden AR(1)

El proceso autorregresivo de primer orden puede escribirse como

Xt = α1Xt−1 + Zt (3.25)

o usando el operador de retroceso B como,

(1 − α1B)Xt = Zt. (3.26)

Este proceso siempre es invertible, para que sea estacionario, se debe cumplir que laraız de (1−α1B) = 0, debe estar fuera del cırculo unitario. Es decir, para un procesoestacionario se tiene que |α1| < 1. El proceso AR(1) algunas veces es llamado procesode Markov, pues el valor de Xt es completamente determinado a partir de Xt−1.

El proceso (3.25) puede escribirse como un proceso de medias moviles (3.16) de ordeninfinito, en efecto, si se hacen sustituciones se obtiene

Xt = αXt−1 + Zt = α(αXt−2 + Zt−1) + Zt,

si se siguen haciendo sustituciones se llega a que (3.25) se puede reescribir como

Xt = Zt + αZt−1 + α2Zt−2 + α3Zt−3 + · · ·

=∞∑

i=0

αiZt−i.

Analogamente, si se usa el operador B, entonces (3.26) puede ser reescrito como,

Xt =Zt

1 − αB

= (1 + αB + α2B2 + · · · )Zt

=

(

∞∑

i=0

αiBi

)

Zt

=∞∑

i=0

αiZt−i.

A partir de la ultima ecuacion se obtiene que

E(Xt) = 0

Page 68: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

62 CAPITULO 3. FUNDAMENTOS DE SERIES DE TIEMPO

y

Var(Xt) = σ2Z(1 + α2 + α4 + · · · ) =

σ2Z

(1 − α2),

esto, pues las Z ′s son v.a’s iid.

La FAC del proceso AR(1)

La funcion autocovarianza se puede obtener como:

γk = Cov(Xt,Xt+k)

= Cov(Xt, α1Xt+k−1 + Zt+k)

= α1Cov(Xt,Xt+k−1) + Cov(Xt, Zt+k)

= α1γk−1 + 0

= α1(α1γk−2)

...

= αk1γ0

=αk

1σ2X

(1 − α2).

De donde se puede inferir que,

ρk = αk1 , k ≥ 1,

se asume que ρ0 = 1. De aquı que, cuando el proceso es estacionario y |α1| < 1, laFAC decae exponencialmente, dependiendo del signo de α1. Si 0 < α1 < 1, entonceslas autocorrelaciones son positivas y si −1 < α1 < 0, entonces las autocorrelaciones semuestran de forma alternada, es decir, una positiva y otra negativa. En ambos casos,las magnitudes de las correlaciones decaen exponencialmente como se muestra en elapendice B. El caso a) ilustra la FAC cuando α1 > 0 mientras que el caso c) hacereferencia a la FAC cuando α1 < 0.

La FACP del proceso AR(1)

A partir de (3.13), se obtiene

φkk =

ρ1 = α1, k = 1;0, k > 1.

Analogamente, en el apendice B, en la Figura b) se puede observar la FACP paracuando α1 > 0 y en d) el caso cuando α1 < 0 ademas se ve, como se corta despues

Page 69: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

3.2. MODELOS QUE DESCRIBEN SERIES DE TIEMPO 63

del primer rezago en ambos casos.

El proceso autorregresivo de segundo orden AR(2)

En el caso en que p = 2 se tiene el proceso autorregresivo de segundo orden dado por

Xt = α1Xt−1 + α2Xt−2 + Zt

o

(1 − α1B − α2B2)Xt = Zt.

Este proceso siempre es invertible; para que sea estacionario, las raıces de α(B) =(1 − α1B − α2B

2) deben estar fuera del cırculo unitario.

Las siguientes condiciones son necesarias para asegurar la estacionariedad del proceso,sin tomar en cuenta si las raices son reales o complejas:

• −2 < α1 < 2;

• −1 < α1 < 1.

En efecto, supongase que B1 y B2 son las raıces de (1 − α1B − α2B2) = 0, o equiva-

lentemente de α2B2 + α1B − 1 = 0, donde B1 y B2 estan dadas por,

B1 =−α1 +

α21 + 4α2

2α2,

y

B2 =−α1 −

α21 + 4α2

2α2.

De aquı,

1

B1=α1 +

α21 + 4α2

2,

y

1

B2=α1 −

α21 + 4α2

2.

La condicion requerida |Bi| > 1 implica que | 1Bi| < 1 para i = 1, 2. De aquı se tiene,

1

B1· 1

B2

= |α2| < 1

Page 70: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

64 CAPITULO 3. FUNDAMENTOS DE SERIES DE TIEMPO

y

|α1| =

1

B1+

1

B2

< 2

Entonces, para un modelo AR(2) las condiciones de estacionariedad estan dadas por:

• α1 + α2 < 1;

• α2 − α1 < 1;

• −1 < α2 < 1.

Con lo cual se asegura que las raıces seran mayores que 1, y con esto la estacionariedaddel proceso.

Ejemplo 3.2.5 Supongase que se tiene el modelo AR(2) dado por,

Xt = Xt−1 − 0.6Xt−2 + Zt

equivalente a (1−B+0.6B2)Xt = Zt, de donde las raıces de (1−B+0.6B2) = 0 son:B = 0.5617978 ± 0.8988764i, pero con modulo 1.06, lo cual asegura que el proceso esestacionario.

La FAC del proceso AR(2)

La autocovarianza del proceso AR(2) se obtiene de la siguiente manera:

γk = Cov(Xt,Xt+k) = Cov(Xt, α1Xt−k−1 + α2Xt−k−2 + Zt−k)

= α1Cov(Xt,Xt−k−1) + α2Cov(Xt,Xt−k−2) + Cov(Xt, Zt−k)

= α1γk−1 + α2γk−2, k ≥ 1.

De la ecuacion anterior se tiene que

ρk = α1ρk−1 + α2ρk−2, k ≥ 1.

En particular para k = 1 se tiene,

ρ1 = α1 + α2ρ1,

de dondeρ1 =

α1

1 − α2.

La FAC caera exponencialmente si las raıces de (1 − α1B − φ2B2) = 0 son reales y

presentara ondas senoidales en caso de ser complejas.

Page 71: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

3.2. MODELOS QUE DESCRIBEN SERIES DE TIEMPO 65

La FACP del proceso AR(2)

A partir de (3.13) se puede calcular la funcion de autocorrelacion parcial para k ≥ 1,de la siguiente manera:

φ11 = ρ1 =α1

1 − ρ2,

φ22 =

1 ρ1

ρ1 ρ2

1 ρ1

ρ1 ρ1

=ρ2 − ρ2

1

1 − ρ21

=

(

α21+α2−α2

2

1−α2

)

−(

α1

1−α2

)2

1 −(

α1

1−α2

)2

=α2[(1 − α2)

2 − α21]

(1 − α2)2 − α21

= α2.

φ33 =

1 ρ1 ρ1

ρ1 1 ρ2

ρ2 ρ1 ρ3

1 ρ1 ρ2

ρ1 1 ρ1

ρ2 ρ1 1

=

1 ρ1 α1 + α2ρ1

ρ1 1 α1ρ1 + α2

ρ2 ρ1 α1ρ2 + α2ρ1

1 ρ1 ρ2

ρ1 1 ρ1

ρ2 ρ1 1

= 0.

Analogamente, φkk = 0 para k ≥ 3. Es por esta razon que la FACP de un procesoAR(2) se corta despues del segundo rezago.

El proceso general autorregresivo de orden p, AR(p)

El proceso autorregresivo de orden p esta dado por las ecuaciones (3.23) o (3.24).Para este proceso se pueden generalizar los casos particulares anteriores, obteniendo

Page 72: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

66 CAPITULO 3. FUNDAMENTOS DE SERIES DE TIEMPO

sus FAC y FACP respectivamente.

La FAC del proceso AR(p)

Se multiplica por Xt−k en ambos lados de (3.23), para hallar la funcion de autocova-rianza, es decir,

Xt−kXt = α1Xt−kXt−1 + · · · + αpXt−kXt−p +Xt−kZt,

ahora tomando el valor esperado se obtiene,

E[Xt−kXt] = E[α1Xt−kXt−1 + · · · + αpXt−kXt−p +Xt−kZt]

= α1E[Xt−kXt−1] + · · · + αpE[Xt−kXt−p] + E[Xt−kZt]

= α1γk−1 + · · · + αpγk−p, k > 0,

de aquı

γk = α1γk−1 + · · · + αpγk−p.

A partir de la ultima ecuacion se puede obtener la funcion de autocorrelacion de lasiguiente manera,

ρk = α1ρk−1 + · · · + αpρk−p, k > 0.

La FACP del proceso AR(p)De la ecuacion (3.13) y usando el hecho que ρk = α1ρk−1 + · · · + αpρk−p, k > 0,entonces para la ultima columna del numerador de (3.13) se puede ver facilmenteque esta es la combinacion lineal de las columnas anteriores de la misma matriz. Deaquı que para k ≥ p, φkk sera igual a cero.

El proceso de promedio movil

En la representacion media movil de un proceso, si y solo si un numero finito de pesosψi = βi son distintos de cero, entonces el proceso resultante se dice que es un proceso omodelo de medias (promedio) moviles de orden q y se denota por MA(q).

Definicion 3.2.6 Sea Zt un proceso puramente aleatorio con media 0 y varianza σ2Z,

entonces el proceso Xt se dice que es un proceso MA(q) si

Xt = β0Zt + β1Zt−1 + · · · + βqZt−q, (3.27)

Page 73: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

3.2. MODELOS QUE DESCRIBEN SERIES DE TIEMPO 67

donde βi son constantes. Los Z’s se toman de tal forma que β0 = 1. O bien, usando eloperador de retroceso B se obtiene

Xt = β(B)Zt, (3.28)

donde β(B) = (1 + β1B + · · · + βqBq).

Anteriormente se introdujo la idea de que un proceso MA(q) es estacionario. Para quesea invertible, se deben imponer ciertas condiciones. Para explicar estas condiciones deinvertibilidad se usa el operador de retroceso B. Es decir, por definicion (3.27) puede serreescrito en la forma (3.28). Entonces, un proceso MA(q) es invertible, si las raıces de laecuacion

β(B) = 1 + β1B + · · · + βqBq = 0,

se encuentran fuera del cırculo unitario, B en esta ecuacion es considerada como una varia-ble compleja y no como un operador.

El proceso de promedio movil de primer orden MA(1)

Cuando Zt−q = 0 para q > 1, se tiene el proceso de promedio movil de primer orden

Xt = Zt + β1Zt−1

= (1 + β1B)Zt.

La FAC del proceso MA(1)

Haciendo uso del operador de retroceso B, se tiene que las autocovarianzas del procesoson

γk =

(1 + β21)σ2

Z , k = 0;β1σ

2Z , k = 1;

0, k > 1;

y la funcion de autocorrelacion esta dada por

ρk =

1, k = 0;β1

1+β21

, k = 1;

0, k ≥ 2;

1 + β21 siempre es acotado, entonces el proceso MA(1) es estacionario. El proceso

sera invertible, si las raices de (1− β1B) = 0 se encuentran fuera del cırculo unitario,porque B = 1

β1, se requiere que |β1| < 1 para que el proceso MA(1) sea invertible.

Page 74: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

68 CAPITULO 3. FUNDAMENTOS DE SERIES DE TIEMPO

La FACP del proceso MA(1)

A partir de (3.13) se obtiene que

φ11 = ρ1 =β1

1 + β21

=β1(1 − β2

1)

1 − β41

,

en general

φkk =βk

1 (1 − β21)

1 − β2(k+1)1

, k ≥ 1.

Contrario a su FAC, la cual se corta despues del primer rezago, la FACP de un modeloMA(1) decae exponencialmente dependiendo del signo de β1 (Vease apendice B).

El proceso de promedio movil de segundo orden MA(2)

El proceso de promedio movil de orden 2 esta dado por

Xt = Zt + β1Zt−1 + β2Zt−2

= (1 + β1B + β2B2)Zt.

Puesto que un proceso de medias moviles de segundo orden es siempre estacionario,las raıces de (1 + β1B + β2B

2) = 0 deben caer fuera del circulo unitario. De aquı sedesprenden las siguientes condiciones que deben cumplir los parametros β1 y β2.

• β1 + β2 < 1;

• β2 − β1 < 1;

• −1 < β2 < 1.

El proceso general de promedio movil de orden q

El valor esperado y la varianza del proceso de medias moviles de orden q estan dadaspor,

E(Xt) = 0 y Var(Xt) = σ2Z

q∑

i=0

β2i .

Como los Z’s son independientes,

Page 75: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

3.2. MODELOS QUE DESCRIBEN SERIES DE TIEMPO 69

γk = Cov(Xt,Xt+k)

= Cov(β0Zt + · · · + βqZt−q, β0Zt+k + · · · + βqZt+k−q)

=

0, si k > q;

σ2Z

∑q−ki=0 βiβi+k, si k = 0, 1, ..., q;

γ−k, si k < 0.

Puesto que

Cov(Zs, Zt) =

σ2Z , si s = t;0, si s 6= t.

La funcion autocorrelacion de un proceso MA(q) esta dada por

ρk =

1, si k = 0;

∑q−ki=0 βiβi+k/

∑qi=0 β

2i , si k = 1, ..., q;

0, si k > q;

ρ−k, si k < 0.

El proceso autorregresivo de promedio movil

Aunque la representacion autorregresiva y la representacion de promedio movil resultanser muy utiles para representar procesos invertibles y estacionarios, pueden contener mu-chos parametros, lo cual es un problema. En general, un numero muy grande de parametrosreduce la eficiencia en la estimacion. Es por esta razon, que al construir el modelo, es nece-sario incluir ambas representaciones. Es decir, se obtiene una mezcla de ambos, la cual esconocida como representacion autorregresiva de promedios moviles.

En adelante se denotara por ARMA(p, q) un proceso autorregresivo de medias movilesde orden p y q respectivamente.

Definicion 3.2.7 Se dice que Xt es un proceso ARMA(p,q) si es estacionario y si paracada t, se cumple

Xt − α1Xt−1 − · · · − αpXt−p = Zt + β1Zt−1 + · · · + βqZt−q, (3.29)

donde Zt es un proceso ruido blanco.

Page 76: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

70 CAPITULO 3. FUNDAMENTOS DE SERIES DE TIEMPO

Usando el operador de retroceso, se puede escribir (3.29) como,

αp(B)Xt = βq(B)Zt,

dondeαp(B) = 1 − α1B − · · · − αpB

p,

yβq(B) = 1 − β1B − · · · − βqB

q.

Donde p y q representan los grados de los polinomios asociados autorregresivo y depromedio movil, respectivamente.

Para que el proceso sea invertible, se requiere que las raıces de βq(B) = 0 se encuentrenfuera del cıculo unitario. Analogamente, para que el proceso sea estacionario, las raıces deαp(B) = 0 deben estar fuera del cırculo unitario. Ademas, se asume que los polinomiosβq(B) y αp(B) no tienen raıces en comun.

El proceso estacionario e invertible ARMA puede ser escrito como una representacionpura autorregresiva, es decir,

π(B)Xt = Zt,

donde

π(B) =αp(B)

βq(B)= (1 − π1B − π2B

2 − · · · ).

Analogamente, el proceso tambien puede ser reescrito en terminos de un proceso demedias moviles,

Xt = ψ(B)Zt,

donde

ψ(B) =βq(B)

αp(B)= (1 + ψ1B + ψ2B

2 + · · · ).

La funcion autocorrelacion del proceso ARMA(p,q)

Para hallar la FAC del procesoARMA(p, q), se multiplica (3.29) porXt−k, ası se obtiene,

Xt−kXt = α1Xt−kXt−1 + · · · + αpXt−kXt−p +Xt−kZt + β1Xt−kZt−1 + · · · + βqXt−kZt−q.

y tomando el valor esperado,

E[Xt−kXt] = E[α1Xt−kXt−1 + · · · + αpXt−kXt−p +Xt−kZt + β1Xt−kZt−1 +

· · · + βqXt−kZt−q].

De donde se obtiene,

γk = α1γk−1 + · · · + αpγk−p + E(Xt−kZt) + β1E(Xt−kZt−1) +

· · · + βqE(Xt−kZt−q).

Page 77: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

3.3. IDENTIFICACION DE MODELOS 71

Como E(Xt−kZt−i) = 0 para k > i, entonces la ultima igualdad se reduce a

γk = α1γk−1 + · · · + αpγk−p, k ≥ (q + 1),

a apartir de esto ultimo y por definicion, se obtiene la funcion autocorrelacion parcial dadapor,

ρk = α1ρk−1 + · · · + αpρk−p, k ≥ (q + 1).

Observese que la funcion autocorrelacion parcial solamente depende de los parametrosdel termino autorregresivo, es por esta razon, que esta funcion cumple con la propiedad dedicho proceso de que no se corta despues de p rezagos, sino que decae exponencialmente.

La funcion autocorrelacion parcial del proceso ARMA(p,q)

Puesto que este proceso es una mezcla de los procesos AR(p) y MA(q), y el procesoARMA contiene el proceso MA como un caso especial, la FAC parcial tambien sera unamezcla de decaimiento exponencial positivo, negativo o alternando valores, dependiendo delas raıces de α(B) = 0 y de β(B) = 0 (Vease Apendice B).

Cabe mencionar que cuando p = 0 entonces el proceso se reduce a un proceso MA(q) ycuando q = 0, entonces el proceso se reduce a un AR(p).

El proceso ARMA(1,1)El proceso ARMA(1,1) esta dado por

Xt = α1Xt−1 + Zt − β1Zt−1

o usando el operador de retroceso,

(1 − α1B)Xt = (1 − β1B)Zt.

Para que este proceso sea estacionario e invertible, se asume que |α1| < 1 y |β1| < 1respectivamente.

3.3. Identificacion de modelos

Existen diversas tecnicas para identificar modelos de series de tiempo, en esta tesis,unicamente se describe la mas comun que consiste en observar el correlograma y la funcionautocorrelacion parcial.

Page 78: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

72 CAPITULO 3. FUNDAMENTOS DE SERIES DE TIEMPO

3.3.1. Pasos para la identificacion

Para ilustrar la identificacion, considerese el modelo general ARMA(p, q)

Xt − α1Xt−1 − · · · − αpXt−p = Zt + β1Zt−1 + · · · + βqZt−q,

la identificacion se refiere a la metodologıa usada para identificar las transformaciones re-queridas en caso de ser necesarias para estabilizar la varianza, al mismo tiempo que sedeterminan los ordenes p y q respectivamente. De esta manera, para una serie dada, seproponen los siguientes pasos utiles para identificar el modelo adecuado.

Paso 1. Graficar los datos de la serie de tiempo. En cualquier analisis estadıstico, elprimer paso es graficar los datos. Examinando cuidadosamente la grafica se puede daruna idea de si la serie contiene tendencia, estacionalidad, varianza no constante, noestacionariedad, etc. Esto proporciona bases para postular una posible transformaciona los datos.Las transformaciones mas comunes son estabilizar la varianza mediante diferencias oestimando y eliminando sus componentes mediante alguno de los metodos menciona-dos en la seccion 1 de este Capıtulo.

Paso 2. Calcular y examinar la FAC muestral y la FACP muestral de la serie originalpara ver si es necesario realizar diferenciacion, las reglas para determinar esto son:

• si la FAC muestral decae muy lentamente y la FACP se corta despues del primerrezago, esto indica que es necesario obtener la primer diferencia para la serie oaplicar alguna otra tecnica para hacerla estacionaria;

• de manera mas general, para eliminar la no estacionariedad en la serie se puedeconsiderar una diferencia de orden mayor. Comunmente solo se obtienen lasdiferencias para d igual a 0, 1 o 2. Obtener una diferencia de orden mayor a tresocasiona una sobrediferenciacion, es decir, en lugar de obtener un mejor ajustepara el modelo se pierde eficiencia, por lo que estimar y eliminar las componentesde la serie serıa lo recomendado.

Paso 3. Calcular y examinar la FAC muestral y FAC de la serie transformada odiferenciada para identificar los ordenes de p y q respectivamente (p es el orden masgrande en el polinomio autorregresivo (1−α1B−· · ·−αpB

p) y q es el orden mas grandedel polinomio de medias moviles (1 − β1B − · · · − βqB

q)). Usualmente, los ordenesobtenidos para p y q son menores o iguales a 3. Para construir un buen modelo sonnecesarias al menos n = 50 observaciones y el numero de la FAC muestral y FACP aser calculadas es de aproximadamente n/4.Brevemente, para un proceso AR(p) se tiene que la funcion autocorrelacion decaeexponencialmente, mientras que su funcion autocorrelacion parcial se corta despuesdel rezago p. Por otro lado, para el proceso MA(q), la funcion autocorrelacion parcialse corta despues del q-esimo rezago, mientras su funcion autocorrelacion parcial decae

Page 79: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

3.4. ESTIMACION DE PARAMETROS 73

exponencialmente. El Cuadro 3.1 resume estas caracterısticas para los procesos AR(p),MA(q) y ARMA(p, q).

Proceso FAC FACP

AR(p) Decae exponencialmente Se corta despuesdel rezago p

MA(q) Se corta despues Decae exponencialmentedel rezago q

ARMA(p, q) Decae despues Decae despuesdel rezago (q − p) del rezago (p− q)

Cuadro 3.1: Caracterısticas de los procesos AR(p), MA(q) y ARMA(p, q).

3.4. Estimacion de parametros

Una vez que se tiene el modelo tentativo, el siguiente paso es estimar los parametrosdel modelo. Es decir, si ya se ha detectado cual es el modelo mas adecuado para los datosy por consiguiente el orden del modelo, entonces se deben estimar los parametros para queel ajuste del modelo quede completo. Considerese el modelo general ARMA(p, q),

Xt − µ = α1(Xt−1 − µ) + α2(Xt−2 − µ) + · · · + αp(Xt−p − µ) + Zt + β1Zt−1 + β2Zt−2

+ · · · + βqZt−q.

El objetivo de estimacion de parametros consiste en determinar los parametros α1, α2, ..., αp

y β1, β2, ..., βq .

3.4.1. Estimacion de los parametros de un proceso autorregresivo

Supongase que se tiene un proceso AR de orden p, con media µ, dado por

Xt − µ = α1(Xt−1 − µ) + · · · + αp(Xt−p − µ) + Zt.

Supongase tambien que se tienen N observaciones x1, x2, ..., xN , entonces los parametrosµ, α1, ..., αp pueden estimarse por mınimos cuadrados, es decir, minimizar

S =

N∑

t=p+1

[xt − µ− α1(xt−1 − µ) − · · · − αp(xt−p − µ)]2

con respecto a µ, α1, ..., αp. Si Zt es normal, entonces los estimadores son tambien esti-madores de maxima verosimilitud.

Page 80: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

74 CAPITULO 3. FUNDAMENTOS DE SERIES DE TIEMPO

Otro metodo para estimar α = (α1, α2, ..., αp) consiste en usar el hecho de que la funcioncorrelacion para un proceso AR(p) esta dada por ρk = α1ρk−1 +α2ρk−2 + · · ·+αpρk−p parak ≥ 1, a partir de la cual se puede obtener el sistema de ecuaciones siguiente:

ρ1 = α1 + α2ρ1 + α3ρ2 + · · · + αpρp−1

ρ2 = α1ρ1 + α2 + α3ρ1 + · · · + αpρp−2

...

ρp = α1ρp−1 + α2ρp−2 + α3ρp−3 + · · · + αp.

las cuales son conocidas como ecuaciones Yule-Walker. Reemplazando ρk por ρk para cadak = 1, 2..., p se obtiene el sistema:

ρ1 = α1 + α2ρ1 + α3ρ2 + · · · + αpρp−1

ρ2 = α1ρ1 + α2 + α3ρ1 + · · · + αpρp−2

...

ρp = α1ρp−1 + α2ρp−2 + α3ρp−3 + · · · + αp.

Y en forma matricial,

α1

α2...αp

=

1 ρ1 ρ2 · · · ρp−1

ρ1 1 ρ1 · · · ρp−2...

......

...ρp−1 ρp−2 ρp−3 · · · 1

−1

ρ1

ρ2...ρp

. (3.30)

Resolviendo este sistema se obtienen los estimadores para los parametros del procesoAR(p).

En particular para p = 1 se tiene:

α1 = ρ1.

Si p = 2, entonces

α1 ⋍ρ1(1 − ρ2)

(1 − ρ21)

,

y

α2 ⋍(ρ2 − ρ2

1)

(1 − ρ21).

Page 81: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

3.4. ESTIMACION DE PARAMETROS 75

3.4.2. Estimacion de los parametros de un proceso de medias moviles

Estimar los parametros de un proceso de medias moviles es un poco mas complicadoque para un proceso autorregresivo. Comunmente se usan metodos numericos para realizaresta estimacion.

Considerese el proceso de medias moviles,

Xt = β0Zt + β1Zt−1 + · · · + βqZt−q,

recuerdese que la FAC para este proceso esta dada por

ρk =βk + β1βk+1 + · · · + βq−kβq

1 + β21 + · · · β2

1 + · · · + β2q

, k = 1, 2, ..., p.

En particular, para q = 1 se tiene que la funcion autocorrelacion esta dada por

ρ1 =β1

1 + β21

,

de donde se obtiene la ecuacion cuadratica,

ρ1β21 − β1 + ρ1 = 0. (3.31)

resolviendo esta ecuacion para β1 se obtienen las soluciones:

β1 =1

2ρ1+

1

(2ρ1)2− 1

1

2

,

y

β1 =1

2ρ1−

1

(2ρ1)2− 1

1

2

.

Si se sustituyen en estas soluciones β por β y ρ por ρ se obtienen dos estimadores paraβ1. Se debe elegir β1 tal que |β1| < 1.

Alternativamente, para el proceso MA(1) dado por

Xt = µ+ Zt + β1Zt−1,

donde µ y β1 son constantes y Zt representa un proceso puramente aleatorio, se puedeestimar µ y β1, usando un metodo numerico de la siguiente manera.

Seleccionar los valores iniciales adecuados de µ y β1, tales que µ = x y β1 como elvalor de la solucion a la ecuacion (3.31).

Page 82: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

76 CAPITULO 3. FUNDAMENTOS DE SERIES DE TIEMPO

Calcular la suma de residuales cuadrados usando la formula recursiva siguiente,

Zt = Xt − µ− β1Zt−1. (3.32)

Haciendo z0 = 0, calcular z1 = x1 − µ, z2 = x2 − µ− β1z1,...,zN = xN − µ− β1zN−1.Luego se calcula

∑Nt=1 z

2t .

Se repite este procedimiento para otros valores cercanos a µ y β1.

Los valores buscados de µ y β1 son aquellos tales que, minimicen∑

t z2t .

Este procedimiento puede desarrollarse para procesos de orden mayor que uno. El proble-ma con este proceso es que por ser un proceso iterativo se deben realizar muchas iteracionespara alcanzar las soluciones optimas.

3.4.3. Estimacion de los parametros de un proceso autorregresivo de me-

dias moviles

El procedimiento iterativo descrito para estimar los parametros de un proceso de me-dias moviles, puede ser utilizado tambien para estimar los parametros de un procedimientoautorregresivo de medias moviles.

En particular para un proceso ARMA(1, 1), se tiene el siguiente modelo,

Xt − µ = α1(Xt−1 − µ) + Zt + β1Zt−1.

Para N observaciones dadas, x1, x2, ...xN , se proponen valores para µ, α1, β1 y se hacez0 = 0, x0 = µ. Calcular recursivamente los residuales por

z1 = x1 − µ

z2 = x2 − µ− α1(x1 − µ) − β1z1...

zN = xN − µ− α1(xN−1 − µ) − β1zN−1.

Luego se calcula∑N

i=1 z2i . Proponer otros valores para µ, α1, β1 y repetir el mismo pro-

cedimiento seguido para el proceso de medias moviles.

3.5. Verificacion

Una vez que se han estimado los parametros del modelo propuesto, se debe verificarque este modelo sea el mas adecuado para describir los datos, es decir, que ajuste bien losdatos. Para ver si el modelo es el adecuado, se debe verificar que los supuestos del modelose satisfagan. El supuesto basico es que Zt es de ruido blanco, es decir, que las v.a’s Z ′

tsiid son no correlacionadas con media cero y varianza constante. La forma mas comun dellevar a cabo este paso, es analizando los residuales de la serie.

Page 83: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

3.5. VERIFICACION 77

3.5.1. Analisis residual

Los residuales estan dados por

residuales = observacion − valor ajustado,

es decir, supongase que el modelo ajustado para un proceso ARMA(p, q) esta dado por

Xt = α1Xt−1 + · · · + αpXt−p + Zt + β1Zt−1 + · · · + βqZt−q,

entonces los residuales estaran dados por

Zt = Xt − α1Xt−1 − · · · − αpXt−p − β1Zt−1 − · · · − βqZt−q.

En particular para el proceso AR(1) dado por Xt = α1Xt−1 + Zt. Si α1 es el estimadorpara α1, entonces α1xt−1 es el valor ajustado en el tiempo t para α1, es decir, el residualcorrespondiente para el valor observado xt es

zt = xt − α1xt−1.

El simbolo “ . ” en zt indica que el residual es el termino de error estimado. Si α se conocecon exactitud, entonces se puede calcular el error exacto zt = xt −α1xt−1, lo cual no sucedecon datos reales, solo en ejercicios simulados.

Si se tiene un buen modelo, entonces lo que se espera es que los residuales sean aleatoriosy cercanos a cero, y la validacion del modelo se puede llevar a cabo graficando los residualespara comprobar si se cumple esta propiedad. Los residuales tambien son considerados comouna serie de tiempo, esto porque se encuentran ordenados en el tiempo.

Otra forma para llevar a cabo la verificacion del modelo, consiste en graficar los residualesy calcular la FAC. Para probar que los residuales sean de ruido blanco iid, se examina suFAC muestral y se rechaza esta hipotesis si mas de tres valores de los primeros cuarentacaen fuera de la banda de confianza ±1.96/

√n o ±2.58/

√n, donde n es el numero total

de observaciones, o si un valor cae muy lejos de la banda de confianza. De lo contrario, elmodelo propuesto es el adecuado.

Page 84: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

78 CAPITULO 3. FUNDAMENTOS DE SERIES DE TIEMPO

Page 85: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

Capıtulo 4

Aplicacion

En este capıtulo se lleva a cabo una aplicacion de series de tiempo a datos de demandamaxima mensual de energıa electrica, realizando un ajuste para los datos.

En el capıtulo anterior se sentaron las bases necesarias para llevar a cabo el analisisde los datos que forman una serie de tiempo, para realizarlo se deben tomar en cuentaalgunas consideraciones para ajustar el modelo si se quieren obtener buenos resultados.Dichas consideraciones consisten en seguir los siguientes pasos: identificacion del modelo,estimacion de sus parametros y por ultimo verificacion del modelo.

4.1. Datos

Los registros de demanda maxima mensual con los que se cuenta, consisten de unamuestra de seis subestaciones de un sistema de distribucion de la CFE. Cada una de es-tas subestaciones corresponden a un periodo de enero de 1995 a diciembre de 2006. Lassubestaciones 1 y 2 estan compuestas por dos transformadores de potencia cada uno. Parallevar a cabo el analisis se eligio la segunda subestacion y el transformador 1. Debido a queque las demas subestaciones presentan datos faltantes y otras comenzaron operaciones en elano 2004, desde luego que esto no es obstaculo para no llevar a cabo el analisis. Sin embar-go, el objetivo es analizar datos completos y ası poder identificar las componentes de la serie.

Los datos se pueden observar en la Figura 4.1, donde en el eje de las abscisas se representael tiempo (enero de 1995 a diciembre de 2006) y en el eje de las ordenadas se muestra lademanda maxima mensual medida en MW. De primera inspeccion se logra apreciar, quela serie presenta fluctuaciones irregulares, lo cual indica que la varianza no es constante,ademas, es posible observar que existen altas de demanda de energıa electrica en los mesesde diciembre, aunque no de manera constante. Se observa tambien que existe la componentede tendencia la cual no es constante y la componente estacional, lo que indica que la serieno es estacionaria.

79

Page 86: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

80 CAPITULO 4. APLICACION

Tiempo

MW

1996 1998 2000 2002 2004 2006

1820

2224

2628

Figura 4.1: Serie de tiempo de demanda maxima de energıa electrica.

4.2. Analisis

Para iniciar el analisis, se graficaron la FAC y la FACP de la serie original con el fin deidentificar si era necesario diferenciar los datos o aplicar un filtro de medias moviles, estopara eliminar las componentes de tendencia y estacionalidad, de esta forma se puede hacerla serie estacionaria. Las Figuras 4.2 y 4.3, muestran dichas graficas para la serie en cuestion.

Se puede observar que la FAC decae en forma de ondas, por lo que no es necesario dife-renciar la serie, por su parte la FACP no presenta un patron especıfico, es por esta razon quese procedio a estimar las componentes de la serie mediante el procedimiento descrito en laseccion 3.1.3., para despues eliminar las componentes de tendencia y estacional, quedandounicamente la componente residual con la cual se realizo el analisis.

Se uso un filtro de medias moviles dado por (3.4) para estimar la componente de ten-dencia de la serie, es decir, se uso un periodo d = 10 y

mt =0.5xt−5 + xt−4 + · · · + xt+4 + 0.5xt+5

10,

donde 5 < t < 139. Dicha componente se puede observar en la Figura 4.4, esta graficaconfirma el hecho de que la serie es no estacionaria, puesto que la tendencia no es constante.

Page 87: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

4.2. ANALISIS 81

0.0 0.5 1.0 1.5 2.0 2.5 3.0

−0.

20.

00.

20.

40.

60.

81.

0

Rezago

FAC

Figura 4.2: FAC de datos originales.

0.0 0.5 1.0 1.5 2.0 2.5 3.0

−0.

20.

00.

20.

40.

60.

8

Rezago

FAC

P

Figura 4.3: FACP de datos originales.

Page 88: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

82 CAPITULO 4. APLICACION

Tiempo

1996 1998 2000 2002 2004 2006

1820

2224

26

Figura 4.4: Tendencia de demanda de energıa electrica.

Tiempo

1996 1998 2000 2002 2004 2006

−1.

0−

0.5

0.0

0.5

1.0

1.5

2.0

Figura 4.5: Componente estacional.

Page 89: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

4.2. ANALISIS 83

Una vez estimada la tendencia de la serie original, se procedio a eliminar esta componentemt de la serie, es decir, se obtiene

yt = xt −mt,

donde xt representa las observaciones de la serie original.

Utilizando la serie sin tendencia yt se estimo su componente estacional st, esta compo-nente puede apreciarse en la Figura 4.5. Aquı puede observarse, que las altas de demandade energıa electrica tienden a presentarse en el mes de diciembre, lo cual confirma lo que seobservo en la serie original, donde se logra apreciar una leve estacionalidad de la serie.

El siguiente paso consiste en desestacionalizar la serie, es decir, eliminar la componenteestacional st, de esta forma se obtiene,

ut = yt − st.

La serie resultante correspondiente a este paso puede verse en la Figura 4.6.

Tiempo

MW

1996 1998 2000 2002 2004 2006

1820

2224

2628

Figura 4.6: Serie desestacionalizada.

Una vez realizado esto, lo siguiente es estimar nuevamente la tendencia a esta ultimaserie obtenida, dicha serie desestacionalizada con tendencia reestimada se muestra en laFigura 4.7. En esta serie puede apreciarse que la tendencia sigue siendo no constante, sinembargo ahora presenta una forma mas definida, la cual resulta mas facil de hacerla cons-tante y con esto obtener una serie estacionaria.

Page 90: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

84 CAPITULO 4. APLICACION

Tiempo

MW

1996 1998 2000 2002 2004 2006

1820

2224

2628

Figura 4.7: Serie desestacionalizada (con tendencia reestimada).

Por ultimo, se elimino la tendencia de la serie anterior, obteniendo el ruido residual,

rt = xt −m1t − st,

el cual se puede observar en la Figura 4.8, donde se muestra la estacionariedad de la serie.Para determinar cual es el modelo que mejor se ajusta a los datos y determinar el orden,

se calculo y grafico la FAC y la FACP de la ultima serie obtenida, es decir, de la componenteresidual, dichas graficas pueden apreciarse en las Figuras 4.9 y 4.10.

Como se puede observar, la FAC decae en forma de ondas, aunque el decrecimiento no eslento. La FACP es la que muestra un comportamiento interesante, pues se ve que solamentelos dos primeros valores salen de la banda de confianza y los demas se encuentran dentro deesta. Lo anterior llevo a concluir que el modelo que se ajusta a los datos, corresponde a unproceso autorregresivo de medias moviles de orden (2,0) o bien a un proceso autorregresivode orden 2 (ARMA(2,0) o AR(2)). Es decir, el modelo propuesto esta dado por

Xt = α1Xt−1 + α2Xt−2 + Zt, (4.1)

donde α1 y α2 son los parametros a estimar.Para hallar α1 y α2 se utilizan las ecuaciones Yule-Walker dadas por (3.30), en donde

se obtuvo el siguiente sistema para el modelo propuesto,

[

α1

α2

]

=

[

1 ρ1

ρ1 1

]−1 [ρ1

ρ2

]

. (4.2)

Page 91: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

4.2. ANALISIS 85

Tiempo

MW

1996 1998 2000 2002 2004 2006

−4

−2

02

4

Figura 4.8: Componente residual (sin tendencia ni estacionalidad).

0.0 0.5 1.0 1.5 2.0 2.5 3.0

−0.

20.

00.

20.

40.

60.

81.

0

Rezago

FAC

Figura 4.9: FAC de componente residual.

Page 92: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

86 CAPITULO 4. APLICACION

0.0 0.5 1.0 1.5 2.0 2.5 3.0

0.0

0.2

0.4

0.6

Rezago

FAC

P

Figura 4.10: FACP de componente residual.

Ahora bien, resolviendo el sistema (4.2), usando regla de Cramer para α1 se tiene,

α1 =

ρ1 ρ1

ρ2 1

1 ρ1

ρ1 1

=ρ1 − ρ1ρ2

1 − ρ21

=ρ1(1 − ρ2)

1 − ρ21

y para α2,

α2 =

1 ρ1

ρ1 ρ2

1 ρ1

ρ1 1

=ρ2 − ρ2

1

1 − ρ21

.

Page 93: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

4.2. ANALISIS 87

Los primeros 36 valores de la FAC que se obtuvieron se muestran en el Cuadro 4.1,usando los dos primeros valores y reemplazandolos en α1 y α2 se obtienen

α1 =0.864(1 − 0.8)

1 − (0.864)2= 0.681

y

α2 =0.8 − (0.864)2

1 − (0.8642)= 0.211,

cuyos errores estandar son: 0.0817 y 0.0820.

k 1 2 3 4 5 6 7 8 9

ρk 0.864 0.800 0.698 0.596 0.546 0.509 0.497 0.504 0.539

k 10 11 12 13 14 15 16 17 18

ρk 0.540 0.551 0.552 0.484 0.457 0.364 0.277 0.203 0.161

k 19 20 21 22 23 24 25 26 27

ρk 0.137 0.147 0.202 0.219 0.244 0.225 0.186 0.099 0.054

k 28 29 30 31 32 33 34 35 36

ρk -0.023 -0.074 -0.102 -0.130 -0.100 -0.071 -0.059 -0.028 -0.024

Cuadro 4.1: FAC de la componente residual.

Ası, el modelo resultante mas aproximado a los datos es:

Xt = 0.681Xt−1 + 0.211Xt−2 + Zt. (4.3)

La ultima fase en el analisis de la serie consiste en verificar que el modelo propuestoajuste bien a los datos. Esto se llevo a cabo mediante el analisis residual. Los residualesobtenidos se muestran en la Figura 4.11.

De esta figura se puede observar que los residuales tienden a concentrarse alrededor dela media, es decir, los residuales son no correlacionados, con media cero y varianza constante.

Por otro lado se calculo la FAC para los residuales cuyos valores se muestran en elCuadro 4.2.

Graficamente, los residuales se muestran en la Figura 4.12. La grafica muestra, que delos primeros 40 valores, solamente tres valores salen de la banda de confianza, y los demasse encuentran dentro de ella, es decir, son relativamente cercanos a cero. Con este analisisse llega a la conclusion de que el modelo (4.3) ajusta bien a los datos.

Finalmente, la Figura 4.13 muestra el modelo ajustado (4.3) a la serie.

Page 94: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

88 CAPITULO 4. APLICACION

Tiempo

Res

idua

les

1996 1998 2000 2002 2004 2006

−4

−2

02

46

Figura 4.11: Residuales.

0.0 0.5 1.0 1.5 2.0 2.5 3.0

−0.

20.

00.

20.

40.

60.

81.

0

Rezago

FAC

Figura 4.12: FAC de los residuales.

Page 95: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

4.2. ANALISIS 89

k 1 2 3 4 5 6 7 8 9 10

ρk 0.029 0.126 0.024 -0.187 -0.087 -0.102 -0.097 -0.065 0.134 0.031

k 11 12 13 14 15 16 17 18 19 20

ρk 0.125 0.283 -0.019 0.237 0.034 -0.073 -0.143 -0.117 -0.181 -0.166

k 21 22 23 24 25 26 27 28 29 30

ρk 0.122 0.055 0.202 0.171 0.176 -0.090 0.068 -0.089 -0.116 -0.069

k 31 32 33 34 35 36 37 38 39 40

ρk -0.234 -0.035 0.052 -0.038 0.115 0.177 0.162 -0.002 0.103 -0.184

Cuadro 4.2: FAC de los residuales.

Tiempo

MW

1996 1998 2000 2002 2004 2006

1820

2224

2628

S ObservadaS Ajustada

Figura 4.13: Ajuste del modelo a la serie.

Page 96: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

90 CAPITULO 4. APLICACION

Page 97: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

Capıtulo 5

Conclusiones

En este trabajo se establecio la base teorica de series de tiempo necesaria para llevar acabo un analisis. Se presentaron aquellas tecnicas utiles para modelar los datos de deman-da maxima mensual de energıa electrica. Se hizo ademas una revision de los conceptos deprobabilidad y estadıstica utiles para el estudio de las series de tiempo.

Se realizo la aplicacion a los datos antes mencionados, para ello, se llevo a cabo unarevision de las FAC y FACP de los datos originales para decidir que tecnica serıa la que seutilizarıa para hacer estacionaria la serie. Una vez que se decidio que lo mas convenienteserıa estimar las componentes de la serie, se procedio a estimar la componente de tendencia,esto se realizo aplicando un filtro de medias moviles. Despues se elimino esta componente dela serie y se estimo la componente estacional, se volvio a estimar la componente de tendenciapero sin la componente estacional. Luego se elimino esta ultima componente de tendenciaestimada con lo cual se obtuvo una componente residual de la serie, la cual fue estacionariay de aquı se pudo obtener el modelo que ajusta a los datos. Recuerdese que no basta conproponer el modelo, por lo que para realizar la verificacion se obtuvieron los residuales dela serie y su FAC para confirmar que el modelo realmente era el adecuado. Los resultadosobtenidos en este trabajo para los datos de demanda de energıa electrica mensual fueronsatisfactorios, pues se obtuvo un buen ajuste de los datos.

En general, uno de los pasos mas difıciles de llevar a cabo en el ajuste de un modelo deserie de tiempo es el de identificar el modelo. Se debe ser muy meticuloso al momento dehacer el analisis, puesto que un error puede conducir al modelo equivocado. Ajustar un mo-delo de serie de tiempo puede resultar tedioso para datos cuyo comportamiento no permitaidentificar patrones facilmente. En este tipo de analisis se deben ajustar varios modelos yal final elegir aquel que mejor ajuste tenga con los datos originales.

Resultarıa muy interesante retomar estos resultados previos para estudios futuros, par-ticularmente para llevar a cabo la prediccion.

91

Page 98: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

92 CAPITULO 5. CONCLUSIONES

La prediccion es otro de los objetivos de las series de tiempo y resulta de gran utilidaden las empresas que deseen hacer planeacion sobre su produccion principalmente, como enel caso de la CFE.

Page 99: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

Apendice A

Datos

En este apartado se muestran los datos de demanda maxima mensual ocupados en elCapıtulo 4.

Ano Enero Febrero Marzo Abril Mayo Junio Julio

1995 21.150 21.240 20.430 20.430 20.150 20.240 19.5001996 20.800 20.700 19.700 19.700 18.600 17.900 18.0201997 19.980 19.300 19.600 18.840 18.360 17.900 18.2601998 23.960 23.340 23.390 21.790 18.010 22.040 21.4101999 24.600 24.032 24.480 23.750 23.310 22.550 21.6202000 24.890 24.380 23.290 22.448 22.608 22.300 28.3602001 26.800 26.020 25.710 25.730 24.350 23.454 24.2102002 22.587 22.587 22.587 22.960 21.840 21.360 20.8802003 24.160 23.560 23.600 23.080 20.620 22.280 21.3602004 24.360 23.680 23.760 22.320 22.520 22.200 18.7602005 19.800 19.800 19.800 17.720 17.720 17.440 16.4802006 19.800 18.740 18.600 17.740 17.660 17.220 17.720

93

Page 100: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

94 APENDICE A. DATOS

Ano Agosto Septiembre Octubre Noviembre Diciembre

1995 19.900 20.200 20.410 20.240 21.0401996 17.900 18.460 18.710 19.360 21.3901997 17.680 19.580 19.890 20.870 21.8201998 22.000 23.730 23.670 23.870 24.7881999 22.350 22.460 23.730 24.880 26.7102000 23.210 24.390 25.140 26.130 27.5702001 21.760 26.800 24.260 24.260 25.1002002 21.600 22.240 23.200 23.680 25.5202003 23.040 22.680 23.680 24.000 26.2002004 18.880 17.040 17.920 18.360 20.0802005 17.040 17.560 19.400 21.880 21.5602006 17.720 18.000 18.680 18.680 21.360

Page 101: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

Apendice B

Correlogramas

En este apartado se presentan los comportamientos de las FAC y FACP para los mo-delos AR(p), MA(q) y ARMA(p, q). A partir de estas tablas se puede estimar el modeloapropiado para los datos disponibles, una vez que se hayan calculado y graficado la FAC yla FACP correspondientes.

La siguiente tabla muestra el comportamiento de la FAC y la FACP de un procesoAR(1) y MA(1).

ARMA(1,0) ARMA(0,1)

Comportamiento decae solo ρ1 6= 0de ρk exponencialmente

Comportamiento solo φ11 6= 0 decaede φkk exponencialmente

Estimacion de: α1 = ρ1 ρ1 = −β1

1+β21

Region admisible −1 < α1 < 1 −1 < β1 < 1

Aquı, se presentan los comportamientos de la FAC y la FACP de un proceso AR(2) yMA(2).

95

Page 102: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

96 APENDICE B. CORRELOGRAMAS

ARMA(2,0) ARMA(0,2)

Comportamiento mezcla de solo ρ1, ρ2 6= 0de ρk exponenciales u ondas

Comportamiento solo φ11, φ22 6= 0 mezcla dede φkk exponenciales u ondas

Estimacion de: α1 = ρ1(1−ρ2)1−ρ2

1

ρ1 = −β1(1−β2)1+β2

1+β2

2

α2 =ρ2−ρ2

1

1−ρ21

ρ2 = −β2

1+β21+β2

2

Region admisible −1 < α2 < 1 −1 < β2 < 1α2 + α1 < 1 β2 + β1 < 1α2 − α1 < 1 β2 − β1 < 1

A continuacion se resumen las caracterısticas principales de un proceso ARMA(1, 1).

ARMA(1,1)

Comportamiento de ρk decae exponencialmente

Comportamiento de φkk decae exponencialmente

Estimacion de: ρ1 = (1−β1α1)(α1−β1)1+β2

1−2α1β1

ρ2 = ρ1α1

Region admisible −1 < α1 < 1 −1 < β1 < 1

Correlogramas para los modelos AR(1), AR(2), MA(1) y MA(2).

Estos ayudan a identificar de manera mas facil el modelo que se desea ajustar.

0 2 4 6 8 10

0.0

0.2

0.4

0.6

0.8

1.0

Lag

AC

F

FAC de serie AR(1)

(a) FAC AR(1), α > 0.

2 4 6 8 10

0.0

0.2

0.4

0.6

0.8

Lag

Par

tial A

CF

FACP de serie AR(1)

(b) FACP AR(1), α > 0.

Page 103: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

97

0 2 4 6 8 10

−0.

50.

00.

51.

0

Lag

AC

F

FAC de serie AR(1)

(c) FAC AR(1), α < 0.

2 4 6 8 10

−0.

8−

0.6

−0.

4−

0.2

0.0

Lag

Par

tial A

CF

FACP de serie AR(1)

(d) FACP AR(1), α < 0.

0 2 4 6 8 10

−0.

20.

00.

20.

40.

60.

81.

0

Lag

AC

F

FAC de serie AR(2)

(e) FAC AR(2), α1 > 0 y α2 > 0.

2 4 6 8 10

−0.

20.

00.

20.

40.

6

Lag

Par

tial A

CF

FACP de serie AR(2)

(f) FACP AR(1), α1 > 0 y α2 > 0.

0 2 4 6 8 10

−0.

20.

00.

20.

40.

60.

81.

0

Lag

AC

F

FAC de serie AR(2)

(g) FAC AR(2), α1 < 0 y α2 < 0.

2 4 6 8 10

−0.

6−

0.4

−0.

20.

00.

2

Lag

Par

tial A

CF

FACP de serie AR(2)

(h) FACP AR(2), α1 < 0 y α2 < 0.

Page 104: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

98 APENDICE B. CORRELOGRAMAS

0 2 4 6 8 10

−0.

50.

00.

51.

0

Lag

AC

F

FAC de serie AR(2)

(i) FAC AR(2), α1 > 0 y α2 < 0.

2 4 6 8 10

−0.

6−

0.4

−0.

20.

00.

20.

4

Lag

Par

tial A

CF

FACP de serie AR(2)

(j) FACP AR(2), α1 > 0 y α2 < 0.

0 2 4 6 8 10

−0.

50.

00.

51.

0

Lag

AC

F

FAC de serie AR(2)

(k) FAC AR(2), α1 < 0 y α2 > 0.

2 4 6 8 10

−0.

8−

0.6

−0.

4−

0.2

0.0

0.2

Lag

Par

tial A

CF

FACP de serie AR(2)

(l) FACP AR(2), α1 < 0 y α2 > 0.

0 2 4 6 8 10

−0.

50.

00.

51.

0

Lag

AC

F

FAC de serie MA(1)

(m) FAC MA(1), β > 0.

2 4 6 8 10

−0.

5−

0.4

−0.

3−

0.2

−0.

10.

00.

1

Lag

Par

tial A

CF

FACP de serie MA(1)

(n) FACP MA(1), β > 0.

Page 105: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

99

0 2 4 6 8 10

0.0

0.2

0.4

0.6

0.8

1.0

Lag

AC

F

FAC de serie MA(1)

(n) FAC MA(1), β < 0.

2 4 6 8 10

−0.

20.

00.

10.

20.

30.

4

Lag

Par

tial A

CF

FACP de serie MA(1)

(o) FACP MA(1), β < 0.

0 2 4 6 8 10

−0.

20.

00.

20.

40.

60.

81.

0

Lag

AC

F

FAC de serie MA(2)

(p) FAC MA(2), β1 > 0 yβ2 > 0.

2 4 6 8 10

−0.

3−

0.2

−0.

10.

00.

1

Lag

Par

tial A

CF

FACP de serie MA(2)

(q) FACP MA(2), β1 > 0 y β2 > 0.

0 2 4 6 8 10

0.0

0.2

0.4

0.6

0.8

1.0

Lag

AC

F

FAC de serie MA(2)

(r) FAC MA(2), β1 < 0 yβ2 < 0.

2 4 6 8 10

−0.

20.

00.

20.

4

Lag

Par

tial A

CF

FACP de serie MA(2)

(s) FACP MA(2), β1 < 0 y β2 < 0.

Page 106: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

100 APENDICE B. CORRELOGRAMAS

0 2 4 6 8 10

−0.

20.

00.

20.

40.

60.

81.

0

Lag

AC

F

FAC de serie MA(2)

(t) FAC MA(2), β1 < 0 yβ2 > 0.

2 4 6 8 10

−0.

3−

0.1

0.0

0.1

0.2

0.3

Lag

Par

tial A

CF

FACP de serie MA(2)

(u) FACP MA(2), β1 < 0 y β2 > 0.

0 2 4 6 8 10

−0.

50.

00.

51.

0

Lag

AC

F

FAC de serie MA(2)

(v) FAC MA(2), β1 > 0 yβ2 < 0.

2 4 6 8 10

−0.

6−

0.4

−0.

20.

00.

2

Lag

Par

tial A

CF

FACP de serie MA(2)

(w) FACP MA(2), β1 > 0 y β2 < 0.

Page 107: UNIVERSIDAD TECNOLOGICA DE LA MIXTECA´jupiter.utm.mx/~tesis_dig/11114.pdf · por el tema de tesis propuesto y por dirigir mis pasos durante la realizacion de la misma; por su paciencia,

Bibliografıa

[1] Box-Jenkins. “Time Series Analysis, Forecasting and Control”. Holden-day. 1976.

[2] Brockwell,Peter J. y Richard A. Davis. “Introduction to Time Series and Forecasting”.Springer. 1996.

[3] Canavos, George C. “Probabilidad y estadıstica, aplicaciones y metodos”. Segunda Edi-cion. McGraw-Hill. Mexico. 1988.

[4] Chatfield Chris. “The Analysis of Time Series an Introduction”. Texts in StatisticalScience. CHAPMAN & HALL, cuarta edicion. 2004.

[5] DeGroot, Morris H. “Probability an Statistics”. Second Edition. Addison Wesley pu-blishing company.

[6] Kirchgaessner G., Wolters J. “Introduction to Modern Time Series Analysis”. Springer.2007.

[7] Juan Moreno. “Control de la demanda de energıa electrica”. Fısica y sociedad. Num.17, pags. 20-23, (2006)

[8] Papoulis, Athanasios. “Probability, Random Variables and Stochastic Processes”. ThirdEdition. McGraw-Hill. Hill. 1991.

[9] R Development Core Team , R: A language and environment for statistical compu-ting. R Foundation for Statistical Computing, Vienna, Austria, URL http://www.R-project.org, 2010.

[10] Ross, Sheldon M. “Stochastic Processes”. Second Edition. Wiley. 1996.

[11] Taylor, Howard M., Karlin, Samuel. “An introduction to stochastic modeling”. ThirdEdition. Academic Press. 1998.

[12] Wackerly, Dennis D., William Mendenhall III, Richard L. Scheaffer. “Estadıstica ma-tematica con aplicaciones”. Septima edicion. Cengage learning. 2008.

[13] William W.S.Wei. “Time Series Analysis Univariate and Multivariate Methods”.Addison-Wesley Publishing Company, Inc. 1994.

101