Universidad Mariano Gálvez Ingeniería Electrónica ... · lineal múltiple Se estudia la...

Post on 05-Nov-2018

231 views 0 download

Transcript of Universidad Mariano Gálvez Ingeniería Electrónica ... · lineal múltiple Se estudia la...

Presenta

Dra. En Ing. Rita Victoria de León Ardón

Universidad Mariano Gálvez Ingeniería Electrónica Estadística inferencial

Objetivo de la presentación

Desarrollar el concepto de regresión múltiple y sus aplicaciones.

Introducir los principios básicos de series de tiempos y aplicaciones

Repasar las operaciones con matrices

Recordar la solución de sistemas de ecuaciones

Asistencia a clase 80%

Para los vectores

Encontrar

Dado que

Regresión lineal simple

Se estudia la relación entre dos variables

Regresión lineal múltiple

Se estudia la relación entre tres o más variables

Modelos de regresión

Sxy

Ecuaciones normales

Sxx

Formas adicionales de cálculo

X horas Y puntaje XY X2

4 40 160 16

6 60 360 36

7 50 350 49

10 70 700 100

13 90 1170 169

40 310 2740 370

Y

Ecuaciones normales

Ecuaciones normales

Polinomial

Modelos de producto cruzados

1. Plantear las ecuaciones normales normales

2. Resolver sistema de ecuaciones 3. Obtener ecuación de regresión 4. Obtener e 5. Obtener R

1. Plantear la forma matricial

2. Resolver sistema de ecuaciones 3. Obtener ecuación de regresión

4. Obtener e 5. Obtener R

p: número de parámetros e: error total n: número de observaciones totales

Muestra Muestra Y X1 X2 X1

X2 Y

Datos puntuales medidos en intervalos de tiempo uniformes y sucesivos.

Se asume Estacionariedad es decir que los valores pasados y futuros son estadísticamente similares.

Un concepto importante es el de números índice: son los que expresan un cambio promedio en las variables. Ejemplos: el PIB se incremento en un 45% respecto al 2016.

La tasa de cambio de dólares a quetzales bajó en un 37% respecto al 2013.

Año valor Número índice

1999 7.54

2001 7.45

2002 7.34

2003 7.23

2004 8.98

Tomar como año base

1999

𝐼 = 𝑉𝑎𝑙𝑜𝑟𝑎ñ𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 − 𝑉𝑎𝑙𝑜𝑟𝑎ñ𝑜 𝑏𝑎𝑠𝑒

𝑉𝑎𝑙𝑜𝑟𝑎ñ𝑜 𝑏𝑎𝑠𝑒∗ 100%

La mayoría de los métodos para el análisis de series de tiempo suponen estacionariedad en los datos. Sin embargo, muchos procesos no son estacionarios, exhiben ciclos: ej. ventas anuales, demanda mensual, lluvia, temperatura. Cuando trabajamos con datos no estacionarios, hay que:

1) Transformación matemática de los datos no-estacionarios para aproximar la estacionariedad: es decir, producir una serie que tenga media y varianza constantes.

2) Dividir los datos para realizar análisis separados sobre subconjuntos que sean suficientemente cortos.

Yt= son los valores actuales en un período t St= es el componente estacional índice en el período t Tt= es la tendencia en el período t Et= es el componente irregular en el período t

Tendencia: variación predominante en toda la

serie

Variación estacional: es el cambio entre períodos de la

serie (ejemplo: verano, invierno, día-noche). Menor

a un año.

Variación cíclica: es el cambio que ocurre en períodos mayores a un

año.

Variación accidental: es el cambio que ocurre

de forma imprevisible y ocasional

Variación cíclica

Variación estacional

Tendencia

Determinística: no cambia en el tiempo.

Aleatoria: cambia con el tiempo.

Valores observados Valores pronosticados

Valores estimados

Período t

Error

Presente

periodo observación

pronóstico

Error absoluto

Error Absoluto porcentual

Cálculos

Modelos de autorregresión

Definimos un modelo como autorregresivo si la variable endógena de un período t es explicada por las observaciones de ella misma correspondientes a períodos anteriores añadiéndose, como en los modelos estructurales, un término de error.

Los modelos aUtorregresivos se abrevian con la palabra AR tras la que se indica el orden del modelo: AR(1), AR(2),....AR(P)

Modelo autorregresivo de orden p -AR(p)-: expresión matemática

Xt=variable de respuesta en el tiempo t Xt-P= observación (variable predictiva) en el tiempo t-p ∅𝑃=coeficentes de regresión a estimar Wt= error en el tiempo t

Función de autocorrelación (𝜌𝑘) o (ACF) o (r k)

La correlación entre observaciones en P periodos de tiempo es:

𝜌𝑃 = ∅𝑃

El valor de una serie mañana (𝑋𝑡) es el valor de hoy (𝑋𝑡−1) más un cambio impredecible (w).

Ф está relacionado con el nivel de estabilidad

𝝆𝑷

𝝆𝑷 P

P

ACF for AR(1), phi=0.5

0

0.2

0.4

0.6

0.8

1

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

ACF for AR(1), phi=0.8

0

0.2

0.4

0.6

0.8

1

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

ACF for AR(1), phi=0.99

0

0.2

0.4

0.6

0.8

1

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

¿En cuál de estos gráficos ∅ es negativo o positivo?

datos

tendencia

componente estacional

residuo

¿Qué hago para resolver el problema?

Esto es lo que obtengo de la

experimentación

1. Calcular los promedios móviles

(componente tendencial)

2. Obtener los radios

(componente estacional)

3. Obtener componente

irregular

Nota: hay muchos procedimientos, este sólo es uno de ellos. Lo importante es tener claro que hay un componente tendencial uno estacional y el irregular.

𝑆𝑡𝑖 = 𝑅𝑡𝑖0

𝑛

Para calcularla usar: • Promedios móviles • Promedios móviles

centrados • Promedios móviles

dobles • Promedios con

pesos

Promedios móviles simples pueden definirse para cualquier número impar. Un promedio móvil de orden k, donde k es un número impar está definido como el promedio que consiste en una observación y los m puntos a cada lado.

K= en 5 meses, en dos meses, en tres meses…

Ejemplo: obtener el promedio móvil de la siguiente serie de datos, considerando un promedio móvil de 3.

Mes Datos reales

Datos estimados mediante promedio

móvil

Datos estimados mediante promedio móvil dobles

Pesos Promedio móvil con pesos

Enero 1 266 266 266 0.5 =266*0.5=133

Febrero 2 145.9 =1

3(266+145.9+183.1)=1

98.33

1

3(266+198.33+149.43)=204

.59

0.8 =1

3(266*0.5+145.9*0.8+183.1*0.7)=125.94

Marzo 3 183.1 =1

3(145.9+183.1+119.3)

=149.43

1

3(198.33+149.43+160.9)=1

69.53

0.7 1

3(145.9*0.8+183.1*0.7+119.3*0.6)=105.49

Abril 4 119.3 =1

3(183.1+119.3+180.3)

=160.9

1

3(149.43+160.9+180.3)=16

3.54

0.6 1

3(183.1*0.7+119.3*0.6+180.3*0.5)=96.33

Mayo 5 180.3 180.3 180.3 0.5 90.15

Para calcularla usar: Primero el valor irregular estacional. Segundo calcular el índice estacional. Tercero: des-estacionalizar la serie

Mes Datos reales (yt)

Datos estimados mediante promedio

móvil (Tt)

Rt (valor irregular estacionario)

Enero 1 266 ---- ----

Febrero 2 145.9 198.33 =(145.9/198.33)*100=73.56

Marzo 3 183.1 149.43

=(183.1/149.43)*100=122.53

Abril 4 119.3 160.9 74.14

Mayo 5 180.3 ----- -----

=(73.56+122.53+74.14)/3=90.076

Año Cuatrimestre Ventas Promedio móvil

centrado

Índice r. Valor estacional irregular

Índice r. Valor estacional irregular

Índice estacional (valores r promediados)

Año (1)

Índice estacional -valores r

promediados- (5) Observación (3)

Ventas

(4)

Des-estacionalizadas (6)

5.16=4.8/0.93

Cuatrimestral (2)

Se puede utilizar la regresión lineal simple.

Se puede utilizar el suavizamiento exponencial.

Otros métodos (la ciencia no es estática evoluciona, cada día se crean mejores formas de resolver problemas). Por eso siempre hay que estar investigando y actualizándose.

Cuadrática

Cúbica

Logarítmica

Inversa negativa

Para los datos dados en el ejemplo anterior, obtenga la regresión lineal simple correspondiente para los datos: a) reales; b) suavizados; c) y des-estacionalizados.

Obtenga el pronóstico para la observación, 17, 18 y 19 en los tres casos y compare los errores.

Realice un ajuste estacional para el pronóstico (es decir multiplique el resultado de la recta de regresión des-estacionalizada y multiplique por el índice correspondiente).

Pronóstico

Peso del suavizamiento.

Entre 0 y 1.

Valor real

Pronóstico inmediato anterior

Mes Observación

Metros de tela producidos

Suavizamiento exponencial

Ffeb=0.1(135)+(0.9)(200)=193.5 Fmarzo=0.1(195)+0.9(193.5)=193.65≈193.7

Arrastramos el dato de enero

como el pronóstico de

febrero

El método de pronóstico de Holt

𝛼 𝛼

𝛼

𝛼 𝛽 Coeficientes de suavizamiento exponencial

𝐿𝑡 = 𝑡𝑒𝑛𝑑𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑡𝑢𝑎𝑙

𝐿𝑡−1 = 𝑡𝑒𝑛𝑑𝑒𝑛𝑐𝑖𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟

𝑏𝑡−1 = 𝑡é𝑟𝑚𝑖𝑛𝑜 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟

𝑏𝑡 = 𝑡é𝑟𝑚𝑖𝑛𝑜 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒

𝑑𝑡 = 𝑑𝑎𝑡𝑜 𝑟𝑒𝑎𝑙

𝐹𝑡+1 = 𝑝𝑟𝑜𝑛ó𝑠𝑡𝑖𝑐𝑜

Compruebe usted estos pronósticos mediante Holt.

Compruebe usted estos pronósticos mediante Holt.

Revisar el link: http://www.zaitunsoftware.com

Comparar los resultados del software con los obtenidos en esta tabla.