Análisis de series de tiempo Cuarta semana Abril Julio 2009.

26
UN IV ER SID A D SIM O N BOLIVAR Análisis de series de tiempo Cuarta semana Abril Julio 2009

Transcript of Análisis de series de tiempo Cuarta semana Abril Julio 2009.

Page 1: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Análisis de series de tiempo

Cuarta semana

Abril Julio 2009

Page 2: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Modelos ARMA

• Son combinaciones de lo anterior; para un proceso estacionario con media cero

0

0

)()(

q

p

tt wBxB

)1( 1

11111

p

qtqtttptt wwwxxx

distinta de cero

Page 3: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Identificación de modelos

Page 4: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Trabajo con series en R

• Serie “recruit” (ejemplo 3.16)• Serie en www.cesma.usb.ve/~llatas/Series/eggs.dat

Page 5: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

ARIMA y SARIMA

• Series integradas: – Se llaman asi por qué son las derivadas las que se comportan como

serie estacionaria

– No trabajar con la serie original sino con la serie de los incrementos de algún orden:

– Ejemplo con la serie de glacial (varve.dat) (ir a R)

11 ln)ln()ln()ln(

t

tttt x

xxxx

Page 6: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

ARIMA y SARIMA

• SARIMA– Season = (estación)

Primero se aplican los operadores diferenciales, y luego se busca un modelo para la parte “estacionaria”

tt

tqs

QtdD

ss

P

wBBxBB

wBBxBB

)1)(1()1)(1(

(0,1,1)1)ARIMA(0,1,

)()()()(

12

12

ts

Qts

P wBxB )()(

Page 7: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Predicción (Conceptos Básicos)

• Se busca pronosticar los valores de la serie {xt} (ojo, puede ser multivariada) para los tiempos T+1, ..., T+H conociendo la historia del proceso hasta el tiempo T.

• H es el horizonte de predicción

es el pronóstico.

• Teorema: La esperanza condicional de xT+h dado el pasado es un estimador insesgado de xT+h , y no hay otro predictor que condicional en el pasado tenga variancia mas pequeña. Esta variancia es el MSFE (mean-square forecast error)

• Obsérvese que el MSFE es UN criterio para escoger un pronóstico, no es el único!.

) hastan Informació(~ Tfx HHT

Page 8: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Predicción (Conceptos Básicos)

• No predecible: Si la distribución condicional de xT+h dado el pasado es igual a la distribución no condicional.

• No informativo: “concepto difuso, pues depende del contexto”• Limite de Pronosticabilidad:

esto es, cuando la variancia del pronostico es mayor a un porcentaje de la variancia incondicional

)()1()|( HTTHT xVxV

Page 9: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Predicción

• Estamos usando filtros lineales, asi que parace natural buscar la predicción basada en combinaciones lineales

• Caso AR es facil: ARMA no tanto!

1;

),,|(

predicción deia la variancMinimizar

00

1

xxx

xxxExn

kkk

nmn

nmnn

mn

Page 10: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Error de predicción

m

jjwmnmn

nmn

mjjmnjmn

xxEP

wx

0

222)~(

~

En R se puede usar la función genérica “predict” para hacer las prediccionesy los errores de predicción

Predicción a largo plazo: va a la media ! con error constante

Ver ejemplo del GNP en R

Page 11: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Estimación

• Suposición:– El proceso es ARMA(p,q) gaussiano

• Métodos fáciles, modelos fáciles:– Método de los momentos para AR (Ecuaciones de Yule –

Walker)

2212

12

1

);,0()(

)()1()0(

,,2,1);()1()(

wwpw

d

pp

pw

p

Nn

p

phphhh

Page 12: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Estimación

• Máxima verosimilitud

• Para modelos ARMA general

)|()|()(),,(

)(

11212

1

nnw

ttt

xxfxxfxfL

wxx

n

tttw xxxfL

111

2 ),|(),,(

Page 13: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Estimación

• Optimización numérica– Newton Raphson

Hessianamatrix la es score, de vector el llamado es ,

derivadas

segundas de matriz la es y gradiente el denota donde

)()(

)2()1(

)2()1(

)0()1(1

)0()2(

)0()1(

ll

ll

ll

Page 14: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Análisis de series de tiempo

Sexta semana

Abril Julio 2009

Page 15: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Análisis espectral

Time

c

0 100 200 300 400 500

-20

12

Time

c +

w

0 100 200 300 400 500

-40

24

Time

c +

5 *

w

0 100 200 300 400 500

-10

010

• Las series presentan ‘regularidades’ que pueden interpretarse como solapamiento de ‘ondas’ periodicas.

• La idea del análisis espectral es transformar la serie al dominio de la frecuencia

• Ciclo: Un período completo de una onda sinusoidal

• Ciclos por observación es la convención que usa el libro

Page 16: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Análisis espectral

)2sin()2cos( 21 tUtUx kkkkt

• Suponiendo las variables independientes

)2cos()(

1.9 Ejercicio

)2sin()2cos(

)2cos(

2

21

hh

tUtU

tAxt

Ui ~ N(0,) A2 ~ 2

medida en ciclos por unidad de tiempo o en ciclos por punto temporal en el caso discreto.

o Para series medidas en tiempos discretosse requiere de al menos dos puntos para obtener un ciclo, por lo que la frecuencia

másalta será 0.5 ciclos por punto.

q

kk

kk hh

1

2

2

)0(

)2cos()(

Page 17: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Superposición de sinusoidales con diferente frecuencias. ... agréguese ruido ...

freq=6/100, amp^2=13

Time

x1

0 20 40 60 80 100

-15

-55

15

freq=10/100, amp^2=41

Time

x2

0 20 40 60 80 100

-15

-55

15

freq=40/100, amp^2=85

Time

x3

0 20 40 60 80 100

-15

-55

15

sum

Time

x

0 20 40 60 80 100

-15

-55

15

Page 18: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Periodograma

)/(ˆ)/(ˆ)/(

Energia""

)/2sin(2

)/(ˆ

)/2cos(2

)/(ˆ

donde

)/2sin()/(ˆ)/2cos()/(ˆ

22

21

12

11

2

2/

01

njnjnjP

ntjxn

nj

ntjxn

nj

ntjnjntjnjx

n

tt

n

tt

n

jt

Regresión de x sobre todas las sinusoidales con ciclos por punto, menores que 0.5

El periodograma puede ser visto como una medida de la correlación de los datos con sinusoidales oscilando a frecuencias j/n.

Page 19: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Señal vs Señal y ruido

0.0 0.1 0.2 0.3 0.4 0.5

020

4060

80

frequency

perio

dogr

am

0.0 0.1 0.2 0.3 0.4 0.50

2040

6080

frequency

perio

dogr

am

Page 20: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Densidad espectral

)2sin()2cos(

)2cos(

21 tUtU

tAxt

0

02

0

20

2/1

2/1

2

22

02

2

0

)(

)(

)(2

)2cos()(

0

U

U

hi

hiU

U

F

dFe

e

hh

Para cualquier proceso estacionariose tiene una representación de lafunción de autocovariancia

2/1

2/1

2 )()( dFeh hi

F Función de distribución espectral

Page 21: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Densidad espectral

hi

hi

ehf

dfeh

f

h

2

2/1

2/1

2

)()(

:aún Más

)()(

función una existe

sumable nteabsolutame es )( general

términode serie la Si

f se le llama densidad espectral ; Ojo: Ver variancia del proceso como la integral de la densidad espectral sobre todas las frecuencias

Page 22: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Ejemplos

• Ruido blanco– Potencia uniforme sobre todas las frecuencias

• Promedio móvil de ruido

• ARMA

Page 23: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Funcion generadora de la autocovariancia

• Para un ARMA

)2()(

)1()()(

)(

2

1

2

)(

)(

ief

BBB

B

w

h

hjj

jw

Bh

h

Page 24: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Estimación del periodograma

• Periodograma y la transformada de Fourier discreta

22

:

2

1

22/1

)()(2

con

)()()(

/;)(

ónDistribuci

j

nj

j

jj

j

n

t

titj

fI

fdI

njexnd j

En R esta implementada la función spec.pgram

El periodograma crudo noes un estimador consistente

Usualmente se suaviza (se promedia sobre valores adyacentes) y en ese caso ladistribucion asintótica eschi-cuadrado con más gradosde libertad...(menos incertidumbre)

Page 25: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Suavización del periodograma

• La idea es que el estimador de la densidad espectral definido con el periodograma I (j), j j/n no es consistente, pero podemos considerar el promedio de los valores en frecuencias adjacentes.

• Se define una banda de frecuencias de tamaño L=2m+1 escogida de manera que los valores del espectro

f(j+k/n), k=-m,-m+1, . . . , 0, . . . ,m-1,m

sean aproximadamente iguales a f().

• Para n grande22)(

)(2L

d

f

fL

Page 26: Análisis de series de tiempo Cuarta semana Abril Julio 2009.

UNIVERSIDADSIMON BOLIVAR

Suavización del periodograma

• Ancho de banda es igual a L/n

• Intervalo de confianza para el valor de la densidad espectral

• Si se toma un ancho de banda muy grande se corre el riesgo de achatar picos importantes, pero con un ancho de banda muy pequeño los intervalos de confianza son tan grandes que los picos no parecen estadísticamente significativos

)2/(

)(2)(

)2/1(

)(222

22

LL

fLf

fL