Series de Tiempo - cimat.mxjortega/MaterialDidactico/ST2013/STClase3.pdf · Semana 3 Semana 3...
Transcript of Series de Tiempo - cimat.mxjortega/MaterialDidactico/ST2013/STClase3.pdf · Semana 3 Semana 3...
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
DescomposiciónSeries de Tiempo
Semana 3
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Esquema
1 Correlaciones
2 Introducción
3 Regresión
4 Diferenciación
5 Suavizamiento
6 Descomposición
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Esquema
1 Correlaciones
2 Introducción
3 Regresión
4 Diferenciación
5 Suavizamiento
6 Descomposición
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Correlaciones
Dividendos de Johnson & Johnson
Time
jj
1960 1965 1970 1975 1980
05
1015
0 1 2 3 4 5 6
−0.2
0.2
0.4
0.6
0.8
1.0
AC
F
ACF para la serie de dividendos de Johnson & Johnson.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Correlaciones
Pasajeros de Pan Am
Time
AP
1950 1952 1954 1956 1958 1960
100
200
300
400
500
600
0 1 2 3 4
−0.2
0.2
0.4
0.6
0.8
1.0
AC
F
ACF para la serie de pasajeros de Pan Am.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Correlaciones
0 2000 4000 6000 8000 10000 12000
020
0060
0010
000
NYSE
1:length(nysevec.mio)
nyse
vec.
mio
0 2000 4000 6000 8000 10000 12000
0.80
0.90
1.00
1.10
nyse
ret.m
io
Indice del NYSE y returns.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Correlaciones
0 10 20 30 40
0.0
0.2
0.4
0.6
0.8
1.0
Lag
AC
F
NYSE
0 10 20 30 40
0.0
0.2
0.4
0.6
0.8
1.0
AC
F
ACF para el índice del NYSE y returns.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Correlaciones
Ruido Blanco
Tiempo
w
0 100 200 300 400 500
−3−1
12
3
Promedio Movil (3)
Tiempo
v
0 100 200 300 400 500
−3−1
12
3
Promedio Movil (7)
Tiempo
v7
0 100 200 300 400 500
−1.0
0.0
1.0
Promedio Movil (15)
Tiempo
v15
0 100 200 300 400 500
−0.6
−0.2
0.2
0.6
Promedio Movil con 3, 7 y 15 datos.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Correlaciones
0 10 20 30 400.
00.
20.
40.
60.
81.
0
Lag
ACF
MA(3)
0 10 20 30 40
−0.2
0.2
0.6
1.0
Lag
ACF
MA(7)
0 10 20 30 40
−0.2
0.2
0.6
1.0
Lag
ACF
MA(15)
ACF para promedio Movil con 3, 7 y 15 datos.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Correlaciones
Grabacion de la silaba aaaaaaahhhhhh (0.1 s.)
Tiempo
spee
ch
0 200 400 600 800 1000
010
0020
0030
0040
00
0 50 100 150 200 250
−0.5
0.0
0.5
1.0
ACF
Series speech
ACF para datos de lenguaje.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Correlaciones
Southern Oscillation Index
1950 1960 1970 1980
−1.0
−0.5
0.0
0.5
1.0
Incremento en la Poblacion de Peces
1950 1960 1970 1980
020
4060
8010
0
Series SOI e Incremento de Peces.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Correlaciones
0 1 2 3 4
−0.4
0.0
0.4
0.8
LagAC
F
Southern Oscillation Index
0 1 2 3 4
−0.2
0.2
0.6
1.0
Lag
ACF
Recruitment
−4 −2 0 2 4
−0.6
−0.2
0.2
Lag
CC
F
SOI vs Recruitment
ACF para SOI e Incremento de Peces.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Esquema
1 Correlaciones
2 Introducción
3 Regresión
4 Diferenciación
5 Suavizamiento
6 Descomposición
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de S TEnfoque General
• Graficar la serie y examinar sus característicasprincipales, en particular examinar si existe
a) una tendencia,b) componentes estacionales,c) cambios repentinos en el comportamiento,d) observations atípicas (outliers).
• Eliminar la tendencia y las componentes estacionalespara obtener residuales estacionarios. Para esto, esposible que sea necesario aplicar una transformacióninicial a los datos.
• Escoger un modelo para los residuales estacionarios,usando diversas estadísticas muestrales, como laautocorrelación muestral.
• Verificar que los residuales que se obtienen una vezajustado el modelo, son ruido blanco.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STEnfoque General
• Graficamos los datos para verificar si haydiscontinuidades aparentes en la serie, como uncambio de nivel o un cambio de variabilidad.
• Posibilidad de analizar la serie en segmentoshomogéneos.
• Las observaciones atípicas deben estudiarsecuidadosamente para ver si es razonable eliminarlas.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STEnfoque General
El gráfico nos puede indicar si es razonable unadescomposición del tipo
Xt = mt + st + Yt
donde• mt es una función que varía lentamente que representa
la tendencia de la serie,• st es una función periódica con período d que
representa la componente estacional y• Yt es un proceso estacionario.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STEnfoque General
Si las fluctuaciones estacionales y las producidas por elruido aumentan con el nivel del proceso, puede sernecesario aplicar una transformación previa a los datos.
Pasajeros de Pan Am en EEUU
Años
Pasa
jeros
(100
0s)
1950 1952 1954 1956 1958 1960
100
200
300
400
500
600
log(AP
)
1950 1952 1954 1956 1958 1960
5.05.5
6.06.5
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Transformación logarítmica de os datos.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STTendencia
Métodos para construcción de modelos:• Ajuste de tendencia polinomial,• Diferenciación.
Métodos No Paramétricos:• Promedios móviles• Núcleo• Regresión local• Lowess• Splines• Suavizamiento Espectral
No resultan adecuados para construcción de modelos
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Esquema
1 Correlaciones
2 Introducción
3 Regresión
4 Diferenciación
5 Suavizamiento
6 Descomposición
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
La gráfica muestra el número de huelgas en USA en elperíodo 1951 - 1980.
Huelgas en USA
Años
Hue
lgas
1950 1955 1960 1965 1970 1975 1980
3500
4000
4500
5000
5500
6000
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
Ajustamos una tendencia cúbica:
mt = β0 + β1t + β2t2 + β3t3
a los datos x1, x2, . . . , xn usando mínimos cuadrados.:Buscamos los parámetros β0, β1, β2, β3 que minimizan lasuma
n∑t=1
(xt −mt )2
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
Huelgas en USA
Años
Hue
lgas
1950 1955 1960 1965 1970 1975 1980
3500
4000
4500
5000
5500
6000
Ajuste de un polinomio cubíco a los datos.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
Huelgas en USA
Años
Res
idua
les
1950 1955 1960 1965 1970 1975 1980
−600
−400
−200
020
040
060
0
Residuales del ajuste de un polinomio cuadrático a los datos.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
Tenemos una serie Xt , t = 1, . . . ,n que es la serie deinterés y queremos analizar la influencia de las seriesZt1,Zt2, . . . ,Ztq, con t = 1, . . . ,n a través de una relaciónlineal:
Xt = β1Zt1 + β2Zt2 + · · ·+ βqZtq + wt
Podemos escribir este modelo lineal de manera generalcomo
Xt = β′Zt + wt
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
Estimamos β por mínimos cuadrados:
Q =n∑
t=1
w2t =
n∑t=1
(Xt − β′Zt )2
La solución de este problema es
β̂ = (Z′Z)−1Z′X
Estos estimadores son insesgados y tienen varianzamínima entre los estimadores lineales insesgados.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
La suma de errores al cuadrado mínimizada se denota porSSE y es
SSE =n∑
t=1
(Xt − β̂′Zt )2 = X′X− β̂Z′X
Si los errores tienen distribución normal, β̂ también es elestimador de máxima verosimilitud de β y tiene distribuciónnormal con
Cov(β̂) = σ2w (Z′Z)−1 ≡ σ2
wC.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
Un estimador insesgado para la varianza es
s2w = MSE =
SSEn − q
donde MSE = Mean Squared Error.
Bajo la hipótesis de normalidad, s2w tiene distribución χ2
n−q yes independiente de β̂.
tn−q =β̂i − βi
sw√
c ii
tiene distribución t con n − q grados de libertad.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
En este esquema podemos usar el análisis de la varianzapara comparar modelos anidados, usando la distribución F .
Este procedimiento puede usarse para seleccionarvariables paso a paso.
Una alternativa que busca comparar modelos sin procedersecuencialmente, evaluando cada modelo por separado, esla siguiente: Supongamos que consideramos un modelo deregresión normal con k coeficientes y llamamos elestimador de MV de la varianza
σ̂2k =
SSEk
n
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
Criterio de AkaikeAkaike sugirió medir la calidad del ajuste para este modelopor una expresión que busca balancear el error del ajustecontra el número de parámetros en el modelo, a través delsiguiente coeficiente
AIC = log σ̂2k +
n + 2kn
donde σ̂2k es el estimador de MV de la varianza y k es el
número de parámetros en el modelo.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
Dos modificaciones de este criterio son las siguientes:
Criterio de Akaike Corregido
AICc = log σ̂2k +
n + kn − k − 2
Criterio de Información Bayesiano
BIC = log σ̂2k +
k log nn
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
Mortalidad Cardiovascular
1970 1972 1974 1976 1978 1980
7080
9010
011
012
013
0
Mortalidad semanal por causas cardiovasculares en Los Angeles County.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
Ajuste de tendencia polinomialConsideramos un modelo de la forma
Xt = mt + Yt
donde mt es la tendencia. Una posible forma de mt esregresión polinomial:
mt = β0 + β1t + · · ·+ βptp
que podemos ajustar por mínimos cuadrados.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●●
●
●
●
●
●●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
Mortalidad Cardiovascular
mor
talid
ad
1970 1972 1974 1976 1978 1980
7080
9010
011
012
013
0
Ajuste de polinomio de grado 3 mostrando tendencia.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
Mortalidad Cardiovascular
Res
idua
les
1970 1972 1974 1976 1978 1980
−10
010
2030
40
Residuales del ajuste de polinomio de grado 3 mostrando tendencia.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
Ajuste de componente estacionalSi tenemos un modelo de la forma
Xt = st + Yt
con componente estacional, podemos superponer a laestimación anterior una componente estacional armónica
st = α0 + α1 cos(2πω1t) + β1 sen(2πω1t) + · · ·+ αp cos(2πωpt) + βp sen(2πωpt)
que podemos ajustar por mínimos cuadrados.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
Mortalidad Cardiovascular
Res
idua
les
1970 1972 1974 1976 1978 1980
−10
010
2030
40
Ajuste de componente armónica mostrando estacionalidad.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
Ajuste de tendencia y componente estacionalSi tenemos un modelo de la forma
Xt = mt + st + Yt
con tendencia y componente estacional, podemossuperponer las estimaciones anteriores:
mt + st = β0 + β1t + · · ·+ βptp
+ α1 cos(2πω1t) + β1 sen(2πω1t) + · · ·+ αp cos(2πωpt) + βp sen(2πωpt)
que podemos ajustar por mínimos cuadrados.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●●
●
●
●
●
●●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
Mortalidad Cardiovascular
mor
talid
ad
1970 1972 1974 1976 1978 1980
7080
9010
011
012
013
0 pol. cúbico
comp. armònica
pol. cúbico
comp. armónica
polinomio cúbico
componente armónica
Ajuste de polinomio de grado 3 mostrando tendencia
y componente armónica mostrando estacionalidad.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●●
●
●
●
●
●
●
●
●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
Mortalidad Cardiovascular
Res
idua
les
1970 1972 1974 1976 1978 1980
−20
−10
010
2030
Residuales del ajuste de polinomio de grado 3
y componente estacional.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
Consideramos ahora un modelo con regresión sobre otrasseries de datos que corresponden a la temperatura y lacomtaminación para el mismo periodo.
En las siguientes láminas mostramos en primer lugar lastres series y luego una matriz de gráficos que muestra lasposibles relaciones entre las distintas variables.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
Mortalidad Cardiovascular
1970 1972 1974 1976 1978 1980
7090
110
130
Temperatura
1970 1972 1974 1976 1978 1980
5060
7080
90
Particulas
1970 1972 1974 1976 1978 1980
2040
6080
100
Series para mortalidad cardiovascular, temperatura y contaminación en Los
Angeles County.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
Mortality
50 60 70 80 90 100
7080
9010
012
0
5060
7080
9010
0
Temperature
70 80 90 100 110 120 130 20 40 60 80 100
2040
6080
100
Particulates
Matriz de gráficos para mortalidad cardiovascular, temperatura y contaminación
en Los Angeles County.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
Intentamos los siguientes modelos:
Mt = β1 + β2t + wt (1)
Mt = β1 + β2t + β3(Tt − T̄ ) + wt (2)
Mt = β1 + β2t + β3(Tt − T̄ ) + β4(Tt − T̄ )2 + wt (3)
Mt = β1 + β2t + β3(Tt − T̄ ) + β4(Tt − T̄ )2 + β5Pt + wt (4)
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STRegresión
Modelo k SSE df MSE R2 AIC BIC(1) 2 40,020 506 79.0 .21 5.38 5.4(2) 3 31,413 505 62.2 .38 5.14 5.17(3) 4 27,985 504 55.5 .45 5.03 5.07(4) 5 20,508 503 40.8 .60 4.72 4.77
El modelo seleccionado sería
M̂t = 81.59− 0.027t − 0.473(Tt − 74.6)
+ .023(Tt − 74.6)2 + 0.255Pt
Los errores estándar de los coeficientes son,respectivamente, 0.002, 0.032, 0.003 y 0.019.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Esquema
1 Correlaciones
2 Introducción
3 Regresión
4 Diferenciación
5 Suavizamiento
6 Descomposición
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STDiferenciación
• Buscamos eliminar la tendencia tomando diferenciasde términos sucesivos.
• Para ello definimos el operador de diferencias ∇ por
∇Xt = Xt − Xt−1 = (1− B)Xt
donde B es el operador de retardo (backward shift)
BXt = BXt−1
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STDiferenciación
• Las potencias de estos operadores se definen de lamanera usual
BjXt = Xt−j , ∇jXt = ∇(∇j−1(Xt )), j ≥ 1
con ∇0(Xt ) = Xt .• Los polinomios en B y ∇ se operan al igual que los
polinomios de variables reales. Por ejemplo
∇2Xt = ∇(∇(Xt )) = (1− B)(1− B)Xt
= (1− 2B + B2)Xt
= Xt − 2Xt−1 + Xt−2
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STDiferenciación
• Si aplicamos el operador ∇ a una función de tendencialineal mt = c0 + c1t , obtenemos una función constante
∇mt = mt −mt−1 = c0 + c1t − (c0 + c1(t − 1)) = c1
• De manera similar cualquier tendencia polinomial degrado k puede ser reducida a una constante aplicandoel operador ∇k .
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STDiferenciación
●
● ●
●
●
●
● ● ●
●●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
Huelgas en USA
Años
Hue
lgas
1950 1955 1960 1965 1970 1975 1980
3500
4500
5500
●
●
●
●
●
●
● ●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
1955 1960 1965 1970 1975 1980
−150
0−5
000
500
Diferenciación de la series de huelgas en USA.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STDiferenciación
Pasajeros de Pan Am en EEUU
Años
Pasa
jeros
(100
0s)
1950 1952 1954 1956 1958 1960
100
200
300
400
500
600
log(AP
)
1950 1952 1954 1956 1958 1960
5.05.5
6.06.5
Número de pasajeros de Pan Am (arriba)
logaritmo de número de pasajeros (abajo).
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STDiferenciación
Time
diff(
AP
)
1950 1952 1954 1956 1958 1960
−100
−50
050
diff(
log(
AP
))
1950 1952 1954 1956 1958 1960
−0.2
−0.1
0.0
0.1
0.2
Diferenciación de las series de pasajeros de Pan Am.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Esquema
1 Correlaciones
2 Introducción
3 Regresión
4 Diferenciación
5 Suavizamiento
6 Descomposición
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STSuavizamiento
Suavizamiento por Promedios MóvilesEste método es útil para hallar tendencias a largo plazo ytambién componentes estacionales.Si xt representa las observaciones entonces
m̂t =k∑
j=−k
ajxt−j
donde aj = a−j ≥ 0 y∑k
j=−k aj = 1 es un promedio móvilsimétrico de los datos.Con frecuencia usamos aj = 1/(2k + 1), que da igual pesoa todos los puntos.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STSuavizamiento
Mortalidad Cardiovascular
1970 1972 1974 1976 1978 1980
7080
9010
011
012
013
0
Mortalidad semanal por causas cardiovasculares en Los Angeles County.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STSuavizamiento
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●●
●
●
●
●
●●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
Mortalidad Cardiovascular
mor
talid
ad
1970 1972 1974 1976 1978 1980
7080
9010
011
012
013
0
Mortalidad semanal por causas cardiovasculares en Los Angeles County.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STSuavizamiento
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●●
●
●
●
●
●●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
Mortalidad Cardiovascular
mor
talid
ad
1970 1972 1974 1976 1978 1980
7080
9010
011
012
013
0 ma5
ma53
ma5
ma53
Ajuste de promedios móviles con 5 (azul) y 53 (rojo) datos,
mostrando tendencia y estacionalidad en la serie.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STSuavizamiento
Podemos pensar que el promedio móvil es un proceso quese obtiene a partir de Xt al aplicar un filtro lineal
m̂t =∞∑
j=−∞ajXt−j
con pesos aj = (2q + 1)−1,−q ≤ j ≤ q.
En este caso particular se trata de un filtro ’pasa bajo’ (lowpass) ya que deja pasar las bajas frecuencias y filtra lasaltas frecuencias. Lo que queda es una estimación de latendencia de Xt que varía lentamente.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STSuavizamiento
Escogiendo los pesos de manera adecuada podemosdiseñar filtros que no sólo serán efectivos en la atenuacióndel ruido, sino que dejan pasar una clase grande defunciones, por ejemplo, los polinomios de grado menor oigual a 3, sin distorsión.
El filtro de 15 puntos de Spencer deja pasar los polinomiosde grado menor o igual que 3 sin distorsión y se define por
(a0,a1, . . . ,a7) +1
320(74,67,46,21,3,−5,−6,−3)
con aj = 0 para |j | > 7 y a−j = aj .
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STSuavizamiento
Suavizamiento local• Los métodos que usamos anteriormente para estimar
la tendencia y la componente estacional son globales:Suponen que la misma función sirve para todo el rangode valores.
• La técnica de promedios móviles, en cambio, es unatécnica local.
• A continuación definimos otros suavizadores locales.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STSuavizamiento
Suavizamiento por núcleo• El suavizamiento por núcleos es un promedio móvil
que usa una función de peso.
m̂t =n∑
i=1
wi(t)xi ,
con pesos
wi(t) =1C
K( t − i
b
), C = 1/
n∑j=1
K( t − i
b
)donde K es la función de núcleo.
• Se conoce como el estimador de Nadaraya-Watson.• Con frecuencia se usa como núcleo la densidad
normal típica.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STSuavizamiento
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●●
●
●
●
●
●●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
Mortalidad Cardiovascular
mor
talid
ad
1970 1972 1974 1976 1978 1980
7080
9010
011
012
013
0 b=104/52=2
b=5/52
Suavizamiento por núcleos con dos anchos de banda.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STSuavizamiento
Suavizamiento por regresión local• El suavizamiento por regresión local usa los datos más
cercanos en el tiempo
xt−k/2, . . . , xt , . . . , xt+k/2
para predecir xt usando una regresión local.• Para los datos de mortalidad por causas
cardiovasculares, la regresión se hizo con k = n/2para estimar la tendencia y k = n/100 para estimar lacomponente estacional.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STSuavizamiento
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●●
●
●
●
●
●●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
Mortalidad Cardiovascular
mor
talid
ad
1970 1972 1974 1976 1978 1980
7080
9010
011
012
013
0
Suavizamiento por regresión local.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STSuavizamiento
Suavizamiento por LOWESS• LOWESS es un método de suavizamiento que usa
regresión local para construir una curva suave quemuestre la tendencia de una nube de puntos.
• También se conoce como regresión polinomial localpesada y fue propuesto por Cleveland en 1979.
• En cada punto se ajusta un polinomio de grado bajousando un subconjunto de datos cercanos al punto enel cual se quiere estimar la respuesta.
• El polinomio se ajusta usando mínimos cuadradospesados, dando mayor peso a los puntos más cercanos
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STSuavizamiento
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●●
●
●
●
●
●●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
Mortalidad Cardiovascular
mor
talid
ad
1970 1972 1974 1976 1978 1980
7080
9010
011
012
013
0
Suavizamiento por LOWESS.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STSuavizamiento
Suavizamiento por Splines• Este método es una extensión de la regresión
polinomial.• En este caso se divide el intervalo de tiempo en k
subintervalos
[t0 = 1, t1], [t1 + 1, t2], . . . , [tk−1 + 1, tk = n]
Los valores t1, t2, . . . , tk se conocen como nudos.• En cada intervalo se ajusta por regresión un polinomio
local de modo que en los nudos coincidan los valoresdel polinomio y de sus primeras derivadas.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STSuavizamiento
Suavizamiento por Splines• Una variación del método de suavizamiento por splines
busca minimizar una combinación de ajuste y el gradode ’suavidad’ de la curva, usando la ecuación
n∑t=1
(xt − st )2 + λ
∫ (s′′t)2dt
donde st es, por ejemplo, un spline cúbico con un nudoen cada t .
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STSuavizamiento
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●●
●
●
●
●
●●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
Mortalidad Cardiovascular
mor
talid
ad
1970 1972 1974 1976 1978 1980
7080
9010
011
012
013
0
Suavizamiento por Splines.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STSuavizamiento
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●●
●
●
●
●
●●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
Mortalidad Cardiovascular
mor
talid
ad
1970 1972 1974 1976 1978 1980
7080
9010
011
012
013
0 ma53
pol. cúbico
núcleo
reg. local
lowess
splines
Métodos de Suavizamiento.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STSuavizamiento
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●●
●
●
●
●
●●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
Mortalidad Cardiovascular
mor
talid
ad
1970 1972 1974 1976 1978 1980
7080
9010
011
012
013
0 ma5
pol. cúbico
núcleo
reg. local
lowess
splines
Métodos de Suavizamiento.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STSuavizamiento
Las técnicas de suavizamiento también pueden aplicarse alsuavizamiento de una serie de tiempo como función de otra.
Vimos anteriormente que hay una relación no-lineal entre laserie de mortalidad y la de temperatura.
La gráfica en la siguiente lámina muestra gráficas dedispersión de Mortalidad como función de la temperatura ysuavizamientos obtenidos con LOWESS y Splines.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STSuavizamiento
50 60 70 80 90 100
7080
9011
013
0
lowess
Temperatura
Mor
talid
ad
50 60 70 80 90 100
7080
9011
013
0
splines
Temperatura
Mor
talid
ad
Suavizamiento.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Esquema
1 Correlaciones
2 Introducción
3 Regresión
4 Diferenciación
5 Suavizamiento
6 Descomposición
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STDescomposición
Muertes accidentales en USA, 1973−78
mue
rtes
1973 1974 1975 1976 1977 1978 1979
7000
8000
9000
1000
011
000
Muertes por causas accidentales en USA 1974-79.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STDescomposición
Primer Enfoque.Estimación de la tendencia y estacionalidad
• Probamos ajustar un modelo con componenteestacional.
• Ajustamos primero un modelo con un armónico confrecuencia 2π/12.
• Luego añadimos un segundo armónico con frecuencia2π/6.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STDescomposición
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
Muertes accidentales en USA, 1973−78
mue
rtes
1973 1974 1975 1976 1977 1978 1979
7000
8000
9000
1000
011
000
Muertes por causas accidentales en USA 1974-79.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STDescomposición
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
Muertes accidentales en USA, 1973−78
mue
rtes
1973 1974 1975 1976 1977 1978 1979
7000
8000
9000
1000
011
000
Muertes por causas accidentales en USA 1974-79.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STDescomposición
Los residuales muestran que hay una tendencia cuadráticaque debe ser estimada y filtrada
Res
idua
les
1973 1974 1975 1976 1977 1978 1979
−100
0−5
000
500
1000
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
Muertes por causas accidentales en USA 1974-79.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STDescomposición
Para ajustar un modelo completo, que incluya tendencia ycomponente estacional, usamos en R la funcióndecompose, que usa promedios móviles para el ajuste
7000
9000
1100
0
obse
rved
8400
8800
9200
9600
trend
−150
00
1000
seas
onal
−400
020
060
0
1973 1974 1975 1976 1977 1978 1979
rand
om
Time
Decomposition of additive time series
Muertes por causas accidentales en USA 1974-79.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STDescomposición
Segundo Enfoque.Diferenciación para eliminar tendencia y estacionalidad
• Suponemos inicialmente que el modelo sólo tiene unacomponente estacional:
Xt = st + Yt
• Aplicamos inicialmente el operador de diferenciación alos datos con un retardo de 12 meses.
• Si la componente estacional st tiene período de 12meses, al hacer esto obtenemos
∇(12)Xt = Yt − Yt−12
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STDescomposición
Las diferencias todavía muestran una tendenciaascendente, así que tomamos una diferencia adicional conretardo 1.
Dife
renc
ias
1974 1975 1976 1977 1978 1979
−100
0−5
000
500
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
Muertes por causas accidentales en USA 1974-79.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STDescomposición
Dife
renc
ias
1974 1975 1976 1977 1978 1979
−500
050
010
00
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
Muertes por causas accidentales en USA 1974-79.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STDiagnóstico
Gráficas de dispersión con retardo para el SOI.
−1.0 0.0 1.0−1
.00.
5
soi(t−1)
soi(t
) 0.6
−1.0 0.0 1.0
−1.0
0.5
soi(t−2)
soi(t
) 0.37
−1.0 0.0 1.0
−1.0
0.5
soi(t−3)
soi(t
) 0.21
−1.0 0.0 1.0
−1.0
0.5
soi(t−4)
soi(t
) 0.05
−1.0 0.0 1.0
−1.0
0.5
soi(t−5)
soi(t
) −0.11
−1.0 0.0 1.0
−1.0
0.5
soi(t−6)
soi(t
) −0.19
−1.0 0.0 1.0
−1.0
0.5
soi(t−7)
soi(t
) −0.18
−1.0 0.0 1.0−1
.00.
5
soi(t−8)
soi(t
) −0.1
−1.0 0.0 1.0
−1.0
0.5
soi(t−9)
soi(t
) 0.05
−1.0 0.0 1.0
−1.0
0.5
soi(t−10)
soi(t
) 0.22
−1.0 0.0 1.0
−1.0
0.5
soi(t−11)
soi(t
) 0.36
−1.0 0.0 1.0
−1.0
0.5
soi(t−12)
soi(t
) 0.41
SOI.
Semana 3
Semana 3
Correlaciones
Introducción
Regresión
Diferenciación
Suavizamiento
Descomposición
Modelación de STDiagnóstico
Gráficas de dispersión con retardo para el SOI y peces.
−1.0 0.0 1.0
040
80
soi(t−0)
rec(
t)
0.02
−1.0 0.0 1.0
040
80
soi(t−1)
rec(
t)
0.01
−1.0 0.0 1.0
040
80
soi(t−2)
rec(
t)
−0.04
−1.0 0.0 1.0
040
80
soi(t−3)
rec(
t)
−0.15
−1.0 0.0 1.0
040
80
soi(t−4)
rec(
t)
−0.3
−1.0 0.0 1.0
040
80
soi(t−5)
rec(
t)
−0.53
−1.0 0.0 1.0
040
80
soi(t−6)
rec(
t)
−0.6
−1.0 0.0 1.0
040
80soi(t−7)
rec(
t)
−0.6
−1.0 0.0 1.0
040
80
soi(t−8)
rec(
t)
−0.56
SOI.