PRONÓSTICO · >El pronóstico de la demanda de cualquier producto, incluyendo insumos tales como...

Post on 30-Apr-2020

4 views 0 download

Transcript of PRONÓSTICO · >El pronóstico de la demanda de cualquier producto, incluyendo insumos tales como...

2

3

PRONÓSTICO

> ES UNA TÉCNICA QUE PERMITE PREDECIR EL FUTURO, BASÁNDOSE EN:

> ACONTECIMIENTOS PASADOS.> INFORMACIÓN ESTADÍSTICA RECABADA

SOBRE EXPERIENCIAS SIMILARES.> ESTIMACIONES BASADAS EN ESTUDIOS DE

MERCADO U OTROS MEDIOS DE SONDEO.

4

EJEMPLOS DE PRONÓSTICOS

> El pronóstico de la demanda de cualquier producto, incluyendo insumos tales como materias primas, mano de obra y otros gastos de fabricación.

> En base a experiencias previas, también es posible estimar la demanda de órdenes de servicio, información y reclamaciones de los clientes.

> Cifras macroeconómicas; tales como crecimiento del PIB, riesgo país, paridad cambiaria, etc.

5

EL PROCESO DE TOMA DE DECISIONES

ELABORACIÓN DE LOS PRESUPUESTOS

ESTADOS FINANCIEROSPROYECTADOS

DISEÑO DEL PRONÓSTICO

6

FACTORES A CONSIDERAR PARA LA ELECCIÓN DEL MÉTODO

> LA DISPONIBILIDAD DE LOS DATOS.> LA VALIDEZ DE LOS DATOS.> LAS VARIABLES QUE SE PRETENDEN

ESTUDIAR Y SU POSIBLE INTERRELACIÓN.> EL NÚMERO DE VARIABLES QUE SE

REQUIEREN.> EL GRADO DE EXACTITUD DESEADO.> LOS RECURSOS INFORMÁTICOS DE QUE SE

DISPONEN.> LOS CONOCIMIENTOS MATEMÁTICOS.> EL ANÁLISIS COSTO-BENEFICIO DEL

MÉTODO.

7

MÉTODOS CUANTITATIVOSPARA ELABORAR PRONÓSTICOS

> ANÁLISIS DE SERIES DE TIEMPO: PROMEDIOS MÓVILES.

SUAVIZACIÓN EXPONENCIAL.

DESCOMPOSICIÓN DE SERIES DE TIEMPO.

> MODELOS EXPLICATIVOS: REGRESIÓN SIMPLE O MULTIVARIABLE.

CRECIMIENTO LINEAL Y EXPONENCIAL.

MODELOS ECONOMÉTRICOS.

MODELOS DE INSUMO-PRODUCTO.

8

BONDADES DE LOS PRONÓSTICOS CUANTITATIVOS

>UN BUEN PRONÓSTICO SIRVE PARA:• Reducir el costo de manejo de inventarios.• Calcular adecuadamente los costos de materia prima.• Incrementar el grado de satisfacción del cliente.• Efectuar atinados presupuestos de ingresos, egresos

y operaciones en general.• Disminuir los imprevistos.

9

10

DEFINICIÓN

�Se llama Series de Tiempo a un conjunto de observaciones sobre valores que toma una variable (cuantitativa) en diferentes momentos del tiempo.

11

¿Para que se utilizan las series de Tiempo?

�Hoy en día diversas organizacionesrequieren conocer el comportamiento futuro de ciertos fenómenos con el fin de planificar, prevenir,es decir, se utilizan para predecir lo que ocurrirácon una variable en el futuro a partir del comportamiento de esa variable en el pasado.

12

APLICACIONES

�En las organizaciones es de mucha utilidad en predicciones a corto y mediano plazo, por ejemplo ver que ocurriría con la demanda de un cierto producto, las ventas a futuro, decisiones sobre inventario, insumos, etc....

� No así para el diseño de un proceso productivo ya que no se disponen de datos históricos y se trata de un proyecto a largo plazo

13

Modelos de series de tiempoMétodo de proyección

Cantidad de datos históricos

Patrón de los datos Horizonte de proyección

Tiempo de preparación

Antecedentes del personal

Ajuste exponencial simple

5 a 10 observaciones para fijar la ponderación

Los datos deben ser estacionarios Corto Corto Poca sofisticación

Ajuste exponencial de Holt

10 a 15 observaciones para fijar la ponderación

Tendencias pero no estacionalidad Corto a mediano Corto

Ligera sofisticación

Ajuste exponencial de Winter

Por lo menos 4 ò 5 observaciones por

trimestre

Tendencias y estacionalidad Corto a mediano Corto

Sofisticación moderada

Modelos de la tendencia de regresión

10 a 20 observaciones para la

estacionalidad, por lo menos 5 por

trimestre

Tendencias y estacionalidad Corto a mediano Corto Sofisticación

moderada

Modelos de regresión causal

10 observaciones por variable

independiente

Puede manejar patrones complejos Corto , mediano o

largo

Largo tiempo para el desarrollo

, corto para la puesta en ejecución

Sofisticación considerable

Descomposición de las series de tiempo

Suficiente para ver 2 picos y simas

Maneja patrones cíclicos y estacionales puede identificar los

puntos críticosCorto a mediano

Corto tiempo para la

moderaciónPoca sofisticación

Box Jenkins 50 o mas observaciones

Deben ser estacionarios o ser transformados en

estacionarios

Corto , mediano o largo

Largo Alta sofisticación

14

COMPORTAMIENTO DE LOS DATOS

�Los datos se pueden comportar de diferentes formas a través del tiempo, puede que se presente una tendencia, un ciclo; no tener una forma definida o aleatoria, variaciones estacionales (anual, semestral, etc).

15

ELEMENTOS I

> TENDENCIA A LARGO PLAZO INDICA SI LA SERIE TEMPORAL ES CRECIENTE O

DECRECIENTE:.

• LA DEMANDA DE UN PRODUCTO, QUE PUEDE SER ESTACIONARIA O IR DECLINANDO CON EL TIEMPO.

> VARIACIÓN ESTACIONAL. PROBABLEMENTE LA DEMANDA DEL PRODUCTO

DIFIERE SEGÚN LA ÉPOCA DEL AÑO .

*EJEMPLO: LOS ARTÍCULOS NAVIDEÑOS, QUE DE OCTUBRE A DICIEMBRE TIENEN UNA MAYOR DEMANDA QUE EL RESTO DEL AÑO.

16

ELEMENTOS II

> VARIACIÓN CÍCLICA. LA SERIE TEMPORAL PUEDE PRESENTAR UNA MEJORA O

BAJA TEMPORAL QUE NO SIGUE NINGÚN PATRÓN CLARO.

• GENERALMENTE SE ORIGINA POR LOS CICLOS MACROECONÓMICOS (TIPO DE CAMBIO, CRISIS, ETC.).

> EFECTOS ALEATORIOS. EL COMPORTAMIENTO DE LA SERIE ES COMPLETAMENTE

IMPREDECIBLE; NO SIGUE NINGÚN PATRÓN.

*EJEMPLO: LAS VENTAS DE DISCOS DURANTE UN MES CUALQUIERA, SIN FESTIVIDADES, O DE ALGÚN MODELO DE ROPA DE UN DISEÑADOR NO RECONOCIDO.

17

Descomposición de los datos de series de tiempo

18

TENDENCIA A LARGO PLAZO

Venta de un artículo de moda

0

20000

40000

60000

80000

100000

120000

140000

2000 2001 2002 2003 2004 2005 2006

Año

Ventas

19

VÁRIACIÓN ESTACIONAL

Venta de regalos

0

2000

4000

6000

8000

10000

Enero

Febr

ero

Mar

zoAbr

ilM

ayo

Junio Julio

Agosto

Septie

mbr

eOctu

bre

Noviem

bre

Diciem

bre

Mes

Ve

nta

s 2004

2005

2006

20 20

VARIACIÓN CÍCLICA

Precios del Crudo

0

1000

2000

3000

4000

5000

6000

1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006

Año

Precio

21

EFECTOS ALEATORIOS

Ventas de chicles

0

100

200

300

400

500

600

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Ventas

Me

s

Serie1

22

23

PROMEDIOS MÓVILES

> CONSISTE EN CALCULAR EL PROMEDIO DE UN CONJUNTO DE DATOS RECAUDADOS DE UNA MISMA VARIABLE Y UTILIZARLO COMO ESTIMACIÓN DEL VALOR QUE TENDRÁESA MISMA VARIABLE EN EL SIGUIENTE PERIODO.

t t+1 t t+1t t+1 t t+1

n

y...yyF 1nt1tt

1t+−−

+

+++=

24

PROMEDIOS MÓVILES EN EXCEL I

25

PROMEDIOS MÓVILES EN EXCEL II

26

PROMEDIOS MÓVILES EN EXCEL III

27

PROMEDIOS MÓVILES EN EXCEL IV

28

RESULTADO FINAL

29

30

SUAVIZACIÓN EXPONENCIAL

> Esta técnica es usada pronosticar series de tiempo estacionarias.

> Todos los valores de los datos históricos intervienen en la determinación del pronóstico.

> Es similar al método anterior, solo que a los datos más recientes se les da mayor ponderación.

> El pronóstico nuevo es igual al pronóstico del periodo anterior más una corrección proporcional al último error observado.

31

C. EXPONENCIAL EN EXCEL I

32

C. EXPONENCIAL EN EXCEL II

33

RESULTADO FINAL

34

35

ELEMENTOS DE LA SERIE DE TIEMPO> SE DESCOMPONEN LOS ELEMENTOS:

• TENDENCIA• CICLO• ESTACIONALIDAD• ERROR

A EFECTO DE AISLAR E IDENTIFICAR EL

PATRÓN DE COMPORTAMIENTO DE CADA

UNO Y CONSTRUIR EL MODELO

MATEMÁTICO QUE PERMITA PROYECTAR

LA SERIE HACIA EL FUTURO.

36

37

ANÁLISIS DE REGRESIÓN> ESTE MÉTODO SE BASA EN LA

RELACIÓN QUE EXISTE ENTRE DOS O MÁS VARIABLES, QUE PODEMOS LLAMAR INDEPENDIENTES, Y QUE INFLUYEN EN EL COMPORTAMIENTO DE OTRA VARIABLE, QUE LLAMAREMOS DEPENDIENTE.

> UNA VEZ ENCONTRADA ESTA ASOCIACIÓN, Y DEPENDIENDO DE QUÉ TAN FUERTE SEA, SE PROCEDE AL PRONÓSTICO DE LA VARIABLE DEPENDIENTE, DADO(S) DETERMINADO(S) VALOR(ES) DE LA(S) VARIABLE(S) INDEPENDIENTE(S).

38

EJEMPLOS

VARIABLE INDEPENDIENTE(X)

VARIABLE DEPENDIENTE(Y)

* Los gastos de publicidad que se invierten en un periodo.

* Las ventas, pues a medida que se invierta más en publicidad, se espera aumenten las ventas del producto.

* La dimensión en metros cuadrados de un local.

* Las ventas, puesto que en algunos negocios, entre más grande sea el local, mayores serán las ventas.

* El número de miembros que tenga una familia, y el poder adquisitivo de las cabezas.

* Los consumos efectuados en un centro comercial.

39

ESTUDIO CONJUNTO DE DOS VARIABLES

> A continuación se muestra el volumen de ventas registrado por una empresa y los gastos de venta correspondientes a cada periodo.

> Dichas observaciones pueden ser representadas en un diagrama de dispersión (‘scatterplot’). En ellos, cada periodo es un punto, cuyas coordenadas son los valores de las variables.

> Nuestro objetivo será intentar reconocer a partir del mismo si hay relación entre las variables, de qué tipo, y si es posible predecir el valor de una de ellas en función de la otra.

VentasGtos. Pub

162 61

154 60

180 78

158 62

171 66

169 60

166 54

176 84

163 68

... ...

40

DIAGRAMA DE DISPERSIÓN O NUBE DE PUNTOS.

30

40

50

60

70

80

90

100

140 150 160 170 180 190 200

Gastos: $76

Ven

tas:

$ 1

87

Gastos: $50

Ventas: $161

41

RELACIÓN ENTRE LAS VARIABLES

30

40

50

60

70

80

90

100

140 150 160 170 180 190 200

Parece que las ventas aumentan conforme

la publicidad

42

PREDICCIÓN DE UNA VARIABLE EN FUNCIÓN DE LA OTRA.

30

40

50

60

70

80

90

100

140 150 160 170 180 190 200

Aparentemente las ventas se incrementan en $10 por cada $10 de gasto... o sea,Las ventas aumentan en un peso por cada peso de publicidad.

$10

$10

43

RELACIÓN DIRECTA E INVERSA

Incorrelación

30

80

130

180

230

280

330

140 150 160 170 180 190 200

Fuerte relación

directa.

30

40

50

60

70

80

90

100

140 150 160 170 180 190 200

Cierta relación

inversa

0

10

20

30

40

50

60

70

80

140 150 160 170 180 190 200

Para valores de X por encima de la media tenemos valores de Y por encima y por debajo en proporciones similares. Incorrelación.

Para los valores de X mayores que la media le corresponden valores de Y menores. Esto es relación inversa o decreciente.

•Para los valores de X mayores que la media le corresponden valores de Y mayores también.

•Para los valores de X menores que la media le corresponden valores de Y menores también.

•Esto se llama relación directa.

44

¿CUÁNDO ES BUENO UN MODELO DE REGRESIÓN?

> Lo adecuado del modelo depende de la relación entre:

la dispersión marginal de Y La dispersión de Y condicionada a X

> Es decir, fijando valores de X, vemos cómo se distribuye Y

La distribución de Y, para valores fijados de X, se denomina distribución condicionada.

La distribución de Y, independientemente del valor de X, se denomina distribución marginal.

> Si la dispersión se reduce notablemente, el modelo de regresión será adecuado.

150 160 170 180 190

32

03

40

36

03

80

40

04

20

32

03

40

36

03

80

40

04

20

32

03

40

36

03

80

40

04

20

32

03

40

36

03

80

40

04

20

32

03

40

36

03

80

40

04

20 r= 0.415

r^2 = 0.172

150 160 170 180 190

35

036

03

70

38

03

90

35

036

03

70

38

03

90

35

036

03

70

38

03

90

35

036

03

70

38

03

90

35

036

03

70

38

03

90 r= 0.984

r^2 = 0.969

45

COVARIANZA DE DOS VARIABLES X E Y

> La covarianza entre dos variables, Sxy, nos indica si la posible relación entre dos variables es directa o inversa. Directa: Sxy >0

Inversa: Sxy <0

Incorreladas: Sxy =0

> El signo de la covarianza nos dice si el aspecto de la nube de puntos es creciente o no, pero no nos dice nada sobre el grado de relación entre las variables.

))((1

yyxxn

S i

i

ixy −−= ∑

46

COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON

> La coeficiente de correlación lineal de Pearson de dos variables, r, nos indica si los puntos tienen una tendencia a disponerse alineadamente (excluyendo rectas horizontales y verticales).

> tiene el mismo signo que Sxy por tanto de su signo obtenemos el que la posible relación sea directa o inversa.

> r es útil para determinar si hay relación lineal entre dos variables, pero no servirá para otro tipo de relaciones(cuadrática, logarítmica,...)

yx

xy

SS

Sr =

47

Propiedades de R

> Es adimensional> Sólo toma valores en [-1,1]> Las variables son incorreladas � r=0> Relación lineal perfecta entre dos variables � r=+1 o

r=-1 Excluimos los casos de puntos alineados horiz. o verticalmente.

> Cuanto más cerca esté r de +1 o -1 mejor será el grado de relación lineal. Siempre que no existan observaciones anómalas.

-1 +10

Relación inversa perfecta

Relación directa

casi perfecta

Variables incorreladas

48

CORRELACIONES POSITIVAS

r=0,1

30

80

130

180

230

280

330

140 150 160 170 180 190 200

r=0,4

30

40

50

60

70

80

90

100

110

120

130

140 150 160 170 180 190 200

r=0,8

30

40

50

60

70

80

90

100

140 150 160 170 180 190 200

r=0,99

30

40

50

60

70

80

90

100

140 150 160 170 180 190 200

49

CORRELACIONES NEGATIVAS

r=-0,5

0

10

20

30

40

50

60

70

80

90

140 150 160 170 180 190 200

r=-0,7

0

10

20

30

40

50

60

70

80

140 150 160 170 180 190 200

r=-0,95

0

10

20

30

40

50

60

70

80

140 150 160 170 180 190 200

r=-0,999

0

10

20

30

40

50

60

70

80

140 150 160 170 180 190 200

50

Evolución de r y diagrama de dispersión

51

PREGUNTAS FRECUENTES

> ¿Si r=0 eso quiere decir que no las variables son independientes? En la práctica, casi siempre sí, pero no tiene

por qué ser cierto en todos los casos. Lo contrario si es cierto: Independencia

implica incorrelación.

> Me ha salido r=1’2 ¿la relación es “superlineal”[sic]? ¿Super qué? Eso es un error de cálculo. Siempre debe tomar un valor

entre -1 y +1.

> ¿A partir de qué valores se considera que hay “buena relación lineal”? Imposible dar un valor concreto (mirad los gráficos anteriores). Para

este curso digamos que si |r|>0,7 hay buena relación lineal y que si |r|>0,4 hay cierta relación (por decir algo... la cosa es un poco más complicada… observaciones atípicas, homogeneidad de varianzas...)

52

OTROS COEFICIENTES DE CORRELACIÓN

> Cuando las variables en vez de ser numéricas son ordinales, es posible preguntarse sobre si hay algún tipo de correlación entre ellas.

> Disponemos para estos casos de dos estadísticos, aunque no los usaremos en clase: ρ (‘ro’) de Spearman

τ (‘tau’) de Kendall

> No tenéis que estudiar nada sobre ellos en este curso. Recordad sólo que son estadísticos análogos a r y que los encontrareis en publicaciones donde las variables no puedan considerarse numéricas.

53

MODELO DE REGRESIÓN LINEAL SIMPLE

> En el modelo de regresión lineal simple, dado dos variables Y (dependiente) X (independiente, explicativa, predictora)

> buscamos encontrar una función de X muy simple (lineal) que nos permita aproximar Y mediante Ŷ = b0 + b1X

• b0 (ordenada en el origen, constante)• b1 (pendiente de la recta)

> Y e Ŷ rara vez coincidirán por muy bueno que sea el modelo de regresión. A la cantidad e=Y-Ŷ se le denomina residuo o error residual.

54

0

30

60

90

120

150

180

0 10

20

30

40

50

60

70

80

90

10

0

11

0

12

0

13

0

14

0

15

0

16

0

17

0

18

0

19

0

20

0

21

0

22

0

> Retomando el ejemplo de las Ventas: Ŷ = b0 + b1X

• b0=$85 (No interpretar como ventas sin invertir en publicidad)• b1=0,5 (En promedio las ventas se incrementan $0.50 por cada $1 en publicidad)

b0=$85

b1=0,5

55

0

30

60

90

120

150

180

0 10

20

30

40

50

60

70

80

90

10

0

11

0

12

0

13

0

14

0

15

0

16

0

17

0

18

0

19

0

20

0

21

0

22

0

> La relación entre las variables no es exacta. Es natural preguntarse entonces:

Cuál es la mejor recta que sirve para predecir los valores de Y en función de los de X

Qué error cometemos con dicha aproximación (residual).

b0=85 cm

b1=0,5

56

� El modelo lineal de regresión se construye utilizando la técnica de estimación mínimo cuadrática:� Buscar b0, b1 de tal manera que se minimice la cantidad

� Σi ei2

� Se comprueba que para lograr dicho resultado basta con elegir:

� Se obtiene además unas ventajas “de regalo”

� El error residual medio es nulo

� La varianza del error residual es mínima para dicha estimación.

Traducido: En término medio no nos equivocamos. Cualquier otra estimación que no cometa error en término medio, si es de tipo lineal, serápeor por presentar mayor variabilidad con respecto al error medio (que es cero).

xbybS

Srb

X

Y101 −==

57

RESIDUOS DEL MODELO DE REGRESIÓN

58

� Que el error medio de las predicciones sea nulo no quiere decir que las predicciones sean buenas.

� Hay que encontrar un medio de expresar la bondad del ajuste (bondad de la predicción)

Cometió un error de -30 en su

última predicción

No importa. Con los dos últimos clientes me

equivoqué en +10 y +20. En término medio el error

es cero.

59

¿Cómo medir la bondad de una regresión?

¿Cómo medir la bondad de una regresión?

Imaginemos un diagrama de dispersión, y vamosa tratar de comprender en primer lugar qué esel error residual, su relación con la varianza de Y,y de ahí, cómo medir la bondad de un ajuste.

60

Interpretación de la variabilidad en Y

YEn primer lugar olvidemos que existe la variable X. Veamos cuál es la variabilidad en el eje Y.

La franja sombreada indica la zona donde varían los valores de Y.

Proyección sobre el eje Y = olvidar X

61

Interpretación del residuo

YFijémonos ahora en los errores de predicción (líneas verticales). Los proyectamos sobre el eje Y.

Se observa que los errores de predicción, residuos, están menos dispersos que la variable Y original.

Cuanto menos dispersos sean los residuos, mejor será la bondad del ajuste.

62

Bondad de un ajuste

Resumiendo:

• La dispersión del error residual será una fracción de la dispersión original de Y

•Cuanto menor sea la dispersión del error residualmejor será el ajuste de regresión.

Eso hace que definamos como medida debondad de un ajuste de regresión,o coeficiente de determinación a:

2

22 1

Y

e

S

SR −=

Y

22 Ye SS <

63

Descomposición de la varianza

64

Resumen sobre bondad de un ajuste> La bondad de un ajuste de un modelo de regresión se

mide usando el coeficiente de determinación R2

> R2 es una cantidad adimensional que sólo puede tomar valores en [0, 1]

> Cuando un, ajuste es bueno R2 será cercano a uno.

> Cuando un ajuste es malo R2 será cercano a cero.

> R2 también se le denomina porcentaje de variabilidad explicado por el modelo de regresión.

> R2 puede ser pesado de calcular en modelos de regresión general, pero en el modelo lineal simple, la expresión es de lo más sencilla: R2=r2

¿Es coherente lo dicho entonces sobre los valores de R2?

65

Otros modelos de regresión

> Se pueden considerar otros tipos de modelos, en función del aspecto que presente el diagrama de dispersión (regresión no lineal)

> Incluso se puede considerar el que una variable dependa de varias (regresión múltiple).

¿recta o parábola?

140 150 160 170 180 190 200

¿recta o cúbica?

140 150 160 170 180 190 200

66

Modelos de análisis de regresión

Modelos de regresión

Simple Múltiple

Lineal No lineal Lineal No lineal

1 variable explicativa 2+ variables explicativas

En clase sólo tratamos el modelo de regresión lineal simple.En todos los demás la bondad del ajuste se mide usando R2

No ajustaremos modelos a mano. Usaremos para ello excel.

67

REGRESIÓN EN EXCEL I

68

REGRESIÓN EN EXCEL II

69

REGRESIÓN EN EXCEL III

70

REGRESIÓN EN EXCEL IV