eBook Suavizamiento Datos

22
Curso de Suavizamiento de datos Diaman Consulting Services O.Aguilar Ph.D

Transcript of eBook Suavizamiento Datos

  • Curso de Suavizamiento de

    datos

    Diaman Consulting Services O.Aguilar Ph.D

  • Prof. O. Aguilar Universidad Nacional Andrs Bello Apuntes de Anlisis de Datos

    1. METODOS DE SUAVIZACION EN EL PRONSTICO Muchos entornos de manufactura requieren de pronsticos semanales o mensuales tal vez para miles de productos o elementos distintos. En estos casos se requiere de modelos simples, rpidos y con buena precisin, y con uso por parte de usuarios no experimentados. Los modelos ms aplicables son:

    Promedios Mviles (PM) (tambin llamados de medias mviles) Promedios Mviles Ponderados (PMP)

    Suavizacin Exponencial (SE)

    El objetivo de estos mtodos es suavizar las fluctuaciones aleatorias causadas por el componente irregular de la serie. Resultan apropiados para series estables (es decir aquellas que no exhiban ningn comportamiento de tendencia, ni variaciones cclicas ni estacionales). Son relativamente simples y generalmente alcanzan un buen nivel de prediccin en perodos de tiempos cortos. Supongamos que tenemos informacin de la venta de bencina de un servicentro de combustibles. Los datos histricos se componen de informacin de las ltimas 12 semanas y la informacin de venta est representada en miles de litros. Semana 1 2 3 4 5 6 7 8 9 10 11 12 Ventas 17 21 19 23 18 16 20 18 22 20 15 22 Veremos a continuacin como cada mtodo pronostica el valor de venta de bencina para la prxima semana. Recalcamos que los mtodos comentados, solamente son aplicables cuando no existe una tendencia definida (aumento o disminucin de la variable), o si existe la misma es dbil (poca tendencia). Tampoco deben existir variaciones estacionales, por cuanto estos modelos no permiten calcular las correcciones debidas a la estacionalidad o ciclos. Aun con estas limitaciones, estos modelos son muy utilizados para pronsticos de pocos perodos (1 a 3) para muchos conjuntos de datos de manera simultnea. Existen muchos productos de software que muy bien realizan esta tarea, pero para nuestro propsito Excel y Empiricus dan resultados muy satisfactorios para pequeas series de datos.

  • Prof. O. Aguilar Universidad Nacional Andrs Bello Apuntes de Anlisis de Datos

    1.1 PROMEDIOS MOVILES SIMPLES (PMS)

    Utiliza como pronstico para el siguiente perodo (en este caso la semana nro. 13), el promedio de los n valores de datos ms recientes de la serie de tiempo. Matemticamente puede expresarse como

    nrecientes) mas datos de valores (nMovil Promedio =

    El trmino mvil indica que conforme se tiene disponible una nueva observacin de la serie de tiempo, se reemplaza la observacin ms antigua en la ecuacin y se calcula un nuevo pronstico. Como resultado el promedio se modificar, a medida que se agreguen nuevas observaciones. La variable n es una indicacin de cuantos perodos se tomaran para calcular el promedio, generalmente suele variar entre tres (3) a cinco (5), dependiendo de cuantos elementos tiene la serie de datos. En nuestro caso de la venta semanal, elegimos n= 3 (tres semanas) para calcular el promedio. El clculo del promedio para las tres primeras semanas ser:

    Pronstico Semana 4 = Promedio Mvil Semana 1 a 3

    193

    57n

    1921174 Semana Pronostico ==++=

    El valor real de la serie para la semana 4 es 23, por lo tanto el error de pronstico es (23-19) = 4 unidades Acto seguido, calcularemos el promedio mvil para la semana 5. El valor observado real de la semana 4 es 23, y reemplaza el primer valor real por el nuevo elemento de la siguiente manera

    Pronstico Semana 5 = Promedio Mvil Semanas 2 a 4

    213

    63n

    2319215 Semana Pronostico ==++= El valor real de la serie para la semana 5 es 18, por lo tanto el error de pronstico es (21-18) = 3 unidades El procedimiento contina de la misma forma para las semanas siguientes. As podemos completar la tabla siguiente:

  • Prof. O. Aguilar Universidad Nacional Andrs Bello Apuntes de Anlisis de Datos

    Semana Ventas Promedio

    mvil Error (Real - Pronstico)

    Error Cuadrado

    1 17 2 21 3 19 4 23 19 4 16 5 18 21 -3 9 6 16 20 -4 16 7 20 19 1 1 8 18 18 0 0 9 22 18 4 16 10 20 20 0 0 11 15 20 -5 25 12 22 19 3 9 13 PRONOSTICO 19 0 10,22

    La semana 13 es el valor que deseamos pronosticar. En este caso 19 mil litros de nafta podran llegar a venderse. El grfico siguiente resume los valores reales y los predichos por el modelo de Promedios Mviles COMPARACION ENTRE VALORES REALES Y PRONOSTICADOS SEGN EL METODO

    DE PROMEDIOS MOVILES

    Ventas de Bencina

    1015

    2025

    1 2 3 4 5 6 7 8 9 10 11 12 13

    Semanas

    Vent

    as (e

    n m

    iles)

    Ventas

    PromedioMovil

  • Prof. O. Aguilar Universidad Nacional Andrs Bello Apuntes de Anlisis de Datos

    1.2 EXACTITUD DEL PRONSTICO

    Una consideracin de importancia al seleccionar un mtodo de pronstico es la exactitud del mismo. Evidentemente deseamos que los errores de pronstico sean lo ms pequeos posibles, Se suele tomar como medida de error general el valor de Error Medio Cuadrado (EMC) o Mean Square Error (MSE) de la bibliografa inglesa. El EMC se calcula de la siguiente manera:

    ( )dosPronostica ValoresCantidad

    do)Pronostica ValorReal (ValorEMC

    2 =

    El clculo de la sumatoria del trmino superior es el siguiente:

    ( )=

    =++++++++9

    1i922)1922(2)2015(2)2020(2)1822(2)1818(2)1920(2)2016(2)2118(2)1923(

    Para nuestro caso, los valores de pronsticos fueron 9 (semana 4 a 12), por ello el clculo del EMC es:

    22.109

    92EMC ==

    1.3 PROMEDIOS MOVILES PONDERADOS (PMP) Este mtodo consiste en asignar diferentes ponderaciones o pesos a cada valor a considerar en el promedio y a continuacin obtener el promedio mvil segn el mtodo del proceso anterior. Por ejemplo, elegimos para clculo del promedio mvil, tres (3) semanas y asignamos el siguiente peso a los datos: El dato ms reciente es tres veces ms importante que el primero, el segundo dos veces ms importantes que el primero. As el clculo del PMP para la cuarta semana es:

    33.196

    116321

    19*321*217*13 a 1 Semana Movil Promedio ==++++=

    Consecuentemente, el valor pronosticado para la semana 4 es 19.33 contra un valor real de la serie de 23 El procedimiento contina con el resto de los elementos de la serie y se resumen en la siguiente tabla:

  • Prof. O. Aguilar Universidad Nacional Andrs Bello Apuntes de Anlisis de Datos

    Semana Ventas

    Promedio mvil

    Ponderado Error (Real - Pronstico)

    Error Medio Cuadrado

    1 17 2 21 3 19 4 23 19,33 3,67 13,44 5 18 21,33 -3,33 11,11 6 16 19,83 -3,83 14,69 7 20 17,83 2,17 4,69 8 18 18,33 -0,33 0,11 9 22 18,33 3,67 13,44 10 20 20,33 -0,33 0,11 11 15 20,33 -5,33 28,44 12 22 17,83 4,17 17,36

    13 19,33 0,50 11,49 Observamos que el Error Medio Cuadrado (EMC) es mayor que en caso anterior de Promedios Mviles (PM). El grfico de la pgina siguiente resume los valores reales y la prediccin segn este mtodo. COMPARACION ENTRE VALORES REALES Y PRONOSTICADOS POR EL METODO DE

    PROMEDIOS MOVILES PONDERADOS

    Ventas de Bencina

    1415

    1617

    181920

    2122

    2324

    Sema

    na 1 2 3 4 5 6 7 8 9 10 11 12

    Semanas

    Vent

    as (e

    n m

    iles) Ventas

    PromedioMovilPonderado

  • Prof. O. Aguilar Universidad Nacional Andrs Bello Apuntes de Anlisis de Datos

    1.4 SUAVIZACION EXPONENCIAL SIMPLE (SES) Utiliza un promedio ponderado de valores histricos de la serie de tiempo como pronstico; se trata de un caso especial del mtodo de promedios mviles ponderados, en el cual se selecciona solamente un valor de ponderacin, es decir el peso o ponderacin de la observacin ms reciente, Los pesos o ponderaciones para los dems valores se calculan de manera automtica, hacindose ms y ms pequeo conforme las observaciones se van alejando hacia el pasado. El modelo bsico de la suavizacin exponencial (que ya conocemos de clases anteriores) es:

    tF*)(1tY*1tF +=+ Donde:

    1tF + = Pronstico de la serie de tiempo para el perodo t+1 = Factor de suavizacin ( 10 ) tY = Valor real de la serie de tiempo para el perodo t

    tF = Valor de pronstico para el perodo de tiempo t Los clculos se realizan desde el segundo valor de la serie, por cuanto, debe suponerse que F1 = Y1 ; F2 = Y1 + (1-) F1 ; F3 = Y2 + (1- ) F2 Expresado en valores numricos tenemos, suponiendo un valor de = 0.80: F1 = 17 F2 = 0.80 * 17 + (1-0.80) * 17 = 17 F3 = 0.80 * 21 + (1- 0.80) * 17 = 20.20 Y as continua con el resto de los valores. La tabla siguiente resume los valores para este mtodo suponiendo que = 0.80

    Semana Ventas Suavizacin Exponencial = 0,80

    Error (Real - Pronstico) Error Cuadrado

    1 17 17

    2 21 17

    3 19 20,20

    4 23 19,24 3,76 14,14

    5 18 22,25 -4,25 18,05

    6 16 18,85 -2,85 8,12

    7 20 16,57 3,43 11,77

    8 18 19,31 -1,31 1,73

    9 22 18,26 3,74 13,97

    10 20 21,25 -1,25 1,57

    11 15 20,25 -5,25 27,57

    12 22 16,05 5,95 35,40

    13 PRONOSTICO 20.81 1,96 14,70

  • Prof. O. Aguilar Universidad Nacional Andrs Bello Apuntes de Anlisis de Datos

    El Error Medio Cuadrado es 14.70, mayor a los anteriores. Segn observamos, los resultados dependen fundamentalmente de la constante alfa de suavizacin. Veamos otros valores de alfa.

    Semana Ventas

    suavizacin Exponencial = 0,20

    Error (Real - Pronstico)

    Error Cuadrado

    1 17 17 2 21 17 3 19 17,80 4 23 18,04 4,96 24,60 5 18 19,03 -1,03 1,07 6 16 18,83 -2,83 7,98 7 20 18,26 1,74 3,03 8 18 18,61 -0,61 0,37 9 22 18,49 3,51 12,34 10 20 19,19 0,81 0,66 11 15 19,35 -4,35 18,94 12 22 18,48 3,52 12,38 13 19,18 5,72 9,04

    Semana Ventas

    suavizacin Exponencial = 0,50

    Error (Real - Pronstico)

    Error Cuadrado

    1 17 17 2 21 17 3 19 19,00 4 23 19,00 4,00 16,00 5 18 21,00 -3,00 9,00 6 16 19,50 -3,50 12,25 7 20 17,75 2,25 5,06 8 18 18,88 -0,88 0,77 9 22 18,44 3,56 12,69 10 20 20,22 -0,22 0,05 11 15 20,11 -5,11 26,11 12 22 17,55 4,45 19,76 13 19,78 1,55 11,30

  • Prof. O. Aguilar Universidad Nacional Andrs Bello Apuntes de Anlisis de Datos

    Es evidente que los valores pronosticados dependen fuertemente del valor de la constante alfa (). Por ello guindonos en el valor del Error Medio Cuadrado (EMC), este valor debe obtenerse por prueba y error ajustando hasta conseguir el menor valor de Error Medio Cuadrado (EMC). Afortunadamente existen productos de software que ajustan automticamente el mejor coeficiente alfa a la serie de datos. Usando estos, determinamos que el valor ptimo de alfa debe valer = 0.174 y los valores resultantes se resumen en la tabla y grfico siguientes:

    COMPARACION ENTRE DATOS REALES Y PRONOSTICADOS UTILIZANDO SUAVIZACION EXPONENCIAL CON COEFICIENTE OPTIMO

    Semana Ventas

    suavizacin Exponencial = 0,174

    Error (Real - Pronstico)

    Error Cuadrado

    1 17 17 2 21 17 3 19 17,70 4 23 17,92 5,08 25,78 5 18 18,81 -0,81 0,65 6 16 18,67 -2,67 7,11 7 20 18,20 1,80 3,23 8 18 18,51 -0,51 0,27 9 22 18,43 3,57 12,78 10 20 19,05 0,95 0,91 11 15 19,21 -4,21 17,75 12 22 18,48 3,52 12,39 13 19,09 6,72 8,98

  • Prof. O. Aguilar Universidad Nacional Andrs Bello Apuntes de Anlisis de Datos

    Ventas de Bencina

    15

    16

    17

    18

    19

    20

    21

    22

    23

    24

    1 2 3 4 5 6 7 8 9 10 11 12 13

    Semanas

    Vent

    a (e

    n m

    iles) Ventas

    SuavizacionExponencial = 0,174

    Conclusin: Al tener un menor Error Medio Cuadrado, el mtodo de suavizacin Exponencial predice mejor los valores de la semana 13 (prximo perodo) que los mtodos de Promedios Mviles. 5. ANALISIS DE SERIES DE TIEMPO CON TENDENCIAS Los modelos presentados en la seccin anterior, son prcticos en casos donde no existe una tendencia de aumento o disminucin de la serie, por cunto dichos modelos generalmente tienden a subestimar los valores de la serie. Sin embargo dado su simplicidad, se utilizan con mucha frecuencia para resolver pronsticos sobre muchos conjuntos de datos similares (series), tal es el caso de inventarios o ventas a clientes. Sin embargo cuando existe un componente de tendencia, generalmente de tipo lineal, los modelos de suavizacin no son aplicables, excepto si se le agregan correcciones de tendencia. Los modelos que se aplican con mayor frecuencia son los siguientes:

    Regresin Lineal Regresin No Lineal

    Atenuacin Exponencial Doble (Mtodo de Brown) Atenuacin Exponencial Simple Ajustado por Tendencia (Mtodo de Holt)

    Cada uno de ellos tiene pros y contras. A continuacin presentaremos cada modelo.

  • Prof. O. Aguilar Universidad Nacional Andrs Bello Apuntes de Anlisis de Datos

    Trataremos de aplicar estos modelos al siguiente conjunto de datos reales que representan la venta de una determinada publicacin profesional, durante los ltimos 28 meses.

    Perodo 1 2 3 4 5 6 7 Tirada 500 350 250 400 450 350 200

    Perodo 8 9 10 11 12 13 14 Tirada 300 350 200 150 400 550 350

    Perodo 15 16 17 18 19 20 21 Tirada 250 550 650 400 350 600 750

    Perodo 22 23 24 25 26 27 28 Tirada 500 400 650 850 600 450 700

    Se necesita hacer un pronstico para los prximos siete meses El diagrama de dispersin de esta serie tiene la siguiente representacin:

    Publicacion Profesional

    0

    100

    200

    300

    400

    500

    600

    700

    800

    900

    0 5 10 15 20 25 30

    Meses

    Tira

    da

    El resumen de pronsticos por los mtodos comentados en la hoja anterior est resumido en la siguiente tabla:

  • Prof. O. Aguilar Universidad Nacional Andrs Bello Apuntes de Anlisis de Datos

    Perodo Reg. Lineal Reg. No Lineal Mtodo Brown Mtodo Holt 29 635 598 656 612 30 647 576 669 612 31 660 546 683 612 32 673 508 696 612 33 686 461 708 612 34 699 461 723 612 35 712 405 737 612

    Error Medio 19007 15086 25640 24947 Obviamente el mejor mtodo resulta ser el que calcula el menor Error Medio Cuadrado. Pero no siempre es as, en nuestro caso, el modelo de polinomio de cuarto grado, parece ser el mejor modelo, pero predice disminucin bastante pronunciada, cuando los otros modelos pronostican un crecimiento. A continuacin se describen los mtodos con tendencia creciente, sus formulas de calculo y los valores de prediccin para los siguientes 7 meses de la serie de tiempo. 5.1 MODELO DE REGRESION LINEAL SIMPLE (RLS) Consiste en ajustar un modelo representado por la ecuacin de una recta segn lo expresa la siguiente ecuacin:

    Tt = b0 + b1 * t

    Donde en la ecuacin anterior: Tt Es el valor

    pronosticado por el modelo lineal

    b0 Es el valor que intersecta el eje Y (ejemplares) con la lnea de tendencia

    b1 Es el valor de la pendiente de la lnea de tendencia

    t Es la variable de tiempo

    Los valores de las constantes b0 y b1 se obtienen aplicando la tcnica de mnimos cuadrados al conjunto de datos de la serie y su explicacin est ms all de este apunte. Sugerimos consultar el apunte de Modelos de Regresin y Correlacin de esta materia. El pronstico segn este modelo es el siguiente:

  • Prof. O. Aguilar Universidad Nacional Andrs Bello Apuntes de Anlisis de Datos

    La ecuacin de la recta que mejor ajusta los datos reales es:

    Tt = 258.22 + 12.97 * t

    El Error Medio Cuadrado para este modelo es EMC = 19007 y el Coeficiente de Correlacin R = 0.6026, lo que indica que aproximadamente el 60.26% de los datos puede ser ajustado por el modelo, sin embargo predice bien la tendencia. El valor de pronstico para los prximos 7 meses es: Perodo 29 30 31 32 33 34 35 Pronstico 635 647 660 673 686 699 712 Los coeficientes de la ecuacin de correlacin se determinan de la siguiente manera

    n

    n

    1i iX

    1bn

    n

    1i iY

    0b=

    ==

    n

    n

    i iXn

    i iX

    n

    n

    i iY

    n

    i iXn

    i iYiX

    2

    11

    2

    111

    1b

    ==

    ====

    Nota: Los valores de Xi e Yi, son aquellos que corresponden a los perodos y tirada o cantidad de ejemplares impresos.

  • UNAB Prof. O. Aguilar Apuntes

    5.1 Regresin No Lineal (RNL) Estos modelos se caracterizan por adaptar el mejor modelo matemtico que reproduzca los valores de la serie. En nuestro caso, el mejor modelo que ajusta es el siguiente

    Tt = a + b*t + c*t2 + d*t3 + ... + n*tn El Coeficiente de Correlacin en este caso es de R = 79.90 %, bastante bueno, pero observen que sucede con la tendencia, esta cae abruptamente. Esta es la principal desventaja de usar el mejor modelo de correlacin ms all del rango de los datos experimentales. Si usramos por ejemplo un polinomio de 4to grado como buena estimacin,

    podramos tener el siguiente pronstico: Perodo 29 30 31 32 33 34 35 Pronstico 598 576 546 508 461 405 340 5.2 Atenuacin Exponencial Doble (Mtodo de Brown) En este mtodo se calcula primero una suavizacin exponencial simple para cada valor de la serie y luego se vuelve a calcular otra suavizacin exponencial sobre los datos resultantes de la primera. Para ello se usan las siguientes formulas: Suavizacin Exponencial Simple

    1t*)(1tYt += Suavizacin Exponencial Doble

    1tY'*)(1t*tY' +=

    Las variables de esta ecuacin tienen el siguiente significado

    t Valor atenuado segn modelo se suavizacin exponencial simple Constante de suavizacin Exponencial

  • 1t Valor atenuado del perodo anterior al actual (t) 1tY' Valor pronosticado sobre segunda suavizacin exponencial, perodo anterior

    tY' Valor pronosticado sobre segunda suavizacin exponencial

    tY Valor experimental de la serie de datos de tiempo Para pronosticar hacia el futuro, se usa una interpolacin lineal que contempla la componente de tendencia (segunda suavizacin exponencial) del siguiente tipo:

    Donde:

    ptY + Valor pronosticado agregando tendencia lineal

    ta Ordenada de origen para modelo lineal

    tb Pendiente de tendencia lineal p Cantidad de perodos a pronosticar (p = 1,2,3,...)

    La constante emprica es la nica variable en este modelo y debe ser determinada de manera experimental sobre los valores disponibles de la serie de datos. Para nuestro ejemplo el mejor valor de resulta ser 0.17. Con ella se obtiene el siguiente pronstico: Perodo 29 30 31 32 33 34 35 Pronstico 656 669 683 696 708 723 737 El grfico de pronstico asociado a este modelo es:

    El Error Medio Cuadrado (EMC) para este modelo es: EMC = 25640 5.4 Atenuacin Exponencial Ajustado a Tendencia (Mtodo de Holt)

    )tY't(*)(1

    tb

    tY't*2ta

    p*tbtaptY

    =

    =+=+

  • Este modelo tambin basado en la suavizacin exponencial, utiliza dos constantes ( y ) para realizar los pronsticos. Estas constantes deben determinarse experimentalmente para los valores reales de la serie de tiempo. Las Ecuaciones que se Utilizan son Para la suavizacin Exponencial Simple Atenuada

    )1tT1t(*)(1tYt ++=

    En la ecuacin anterior las variables tienen el siguiente significado:

    t Estimacin Exponencial Atenuada para un perodo cualquiera Constante de suavizacin Exponencial Simple

    tY Valor real o experimental de la serie de tiempo

    1t Estimacin Exponencial Atenuada perodo anterior 1tT Estimacin de componente de Tendencia, perodo anterior

    Para la estimacin de la Tendencia

    1tT)(1)1tt(tT += En la ecuacin anterior las variables tienen el siguiente significado:

    tT Valor pronosticado de Tendencia para un perodo t cualquiera Constante de suavizacin Exponencial Simple para Tendencia

    t Valor de Pronstico de serie de tiempo para perodo t

    1t Valor de pronstico de serie de tiempo para perodo anterior 1tT Valor de Tendencia estimada para perodo anterior

    Para pronosticar perodos futuros

    tTptptY +=+

    En la ecuacin anterior las variables tienen el siguiente significado:

    ptY + Valor de pronstico de la serie para perodo futuro (t+p) t Valor Pronosticado de suavizacin Exponencial Atenuado

    tT Valor Pronosticado de Tendencia

  • p Cantidad de perodos futuros a pronosticar (p = 1,2,3,...) En base a este modelo se tiene el siguiente pronstico para los valores ptimos (= 0.31 y = 0.00). La tabla siguiente resume los valores pronosticados. Perodo 29 30 31 32 33 34 35 Pronstico 612 612 612 612 612 612 612 El grfico de pronstico asociado es el siguiente:

    El Error Medio Cuadrado para este mtodo es EMC = 24947

    6. SUAVIZACION EXPONENCIAL CON COMPONENTES ESTACIONALES Se entiende como variacin estacional, aquella distorsin que se produce en la serie de datos debido a que un patrn de comportamiento parece repetirse ao tras ao (o transcurridos una cantidad de perodos). Un ejemplo puede ser las ventas de helado se incrementan en la temporada de verano, las ventas de pirotecnia se incrementan durante el ltimo mes del ao, las ventas de ropa para deportes invernales se incremente en el segundo trimestre, la demanda de pasajes se incrementa en el mes de julio hacia destinos invernales, etc., etc. La lista de ejemplos puede resultar muy larga. Los modelos aplicables en estos casos, deben contener una componente de correccin debida a la tendencia que pudiese llegar a presentarse y otra correccin debido a la estacionalidad presente en la serie de datos. Analicemos por ejemplo la siguiente serie de datos, que consiste en un detalle de importes de ventas de lentes de contacto de una reconocida marca. Se necesita disponer de un pronstico confiable para los prximos doce (12) meses.

    Importes de la Cantidad de Pares de Lentes de Contacto Vendidos Mes Ventas Mes Ventas Mes Ventas

    1 9440 9 9887 17 14114 2 9925 10 9765 18 14998 3 10645 11 9170 19 13679 4 10990 12 8650 20 13265

  • 5 11780 13 10711 21 12067 6 12710 14 10998 22 11974 7 11212 15 11567 23 10658 8 10645 16 13002 24 9900

    Existen varios mtodos que pueden ser aplicados, pero a manera de ejemplo describiremos solamente los siguientes, que resultan ser los ms aplicados:

    Atenuacin Exponencial Ajustada con estimacin de Tendencia y Variacin Estacional (mtodo de Holt-Winters Multiplicativo)

    Atenuacin Exponencial Ajustada con estimacin de Tendencia y Variacin Estacional

    (mtodo de Holt-Winters Aditivo) Ambos mtodos son una extensin del mtodo de Holt presentado en paginas anteriores, agregando una complejidad adicional al incorporar ndices de estacionalidad como una manera de corregir la serie de tiempos evitando estos picos que distorsionan el anlisis de los pronsticos y la prediccin en consecuencia. El grfico que muestra la dispersin de la serie de datos se muestra a continuacin:

    Aqu observamos claramente que existe un incremento de ventas en el mes de junio de cada ao y una disminucin pronunciada en el mes de diciembre del mismo ao. Observamos que existe una ligera tendencia hacia una venta creciente, tal lo muestra el grfico siguiente: 6. METODO DE HOLT-

    WINTERS MULTIPLICATIVO Se basa en el calculo de cuatro componentes:

    (1) Ajuste Exponencial de la Serie de Datos

    )1tT1t( * )(1)j-tS

    tY( *t ++=

    (2) estimacin de Tendencias

    Ventas de Lentes de Contacto

    6

    12

    18

    248000

    9000

    10000

    11000

    12000

    13000

    14000

    15000

    16000

    0 5 10 15 20 25 30

    Mes

    Vent

    as

    Ventas de Lentes de Contacto

    6

    12

    18

    248 0 0 0

    9 0 0 0

    1 0 0 0 0

    1 1 0 0 0

    1 2 0 0 0

    1 3 0 0 0

    1 4 0 0 0

    1 5 0 0 0

    1 6 0 0 0

    0 5 10 15 20 25 30

    Mes

    Vent

    as

  • 1tT*)(1)1tt(*tT +=

    (3) estimacin de Estacionalidad

    jtS*)(1)t

    tY( * tS +=

    (4) Pronstico de Perodos Futuros

    jptS * )tT *pt(ptY ++=+

    Las variables en las ecuaciones tienen el siguiente significado:

    t Es la estimacin exponencialmente suavizada para el perodo t cualquiera Constante de suavizacin exponencial simple de la serie de datos

    tY Valor real de la serie de tiempo para el perodo t cualquiera

    jtS Indice de Estacionalidad calculado para el perodo t-j tT Estimacin de Tendencia para perodo t Constante de suavizacin exponencial de tendencia

    tS Indice de estacionalidad para el perodo t Constante de correccin de estacionalidad j Longitud o duracin de la estacionalidad, en nuestro caso j = 12 (el ciclo se repite

    cada doce meses) p Cantidad de perodos a Pronosticar hacia delante Los valores de , y , deben ser calculados de manera experimental sobre el conjunto de datos de la serie de tiempos disponibles. En nuestro caso, los valores de , y , ptimos son: 0.88, 0.00 y 0.00 respectivamente. Basado en estos valores, el pronstico de los doce meses siguientes se puede resumir en la tabla y grfico siguientes Perodo 25 26 27 28 29 30 Ventas 10833 11389 12216 12612 13518 14585 Perodo 31 32 33 34 35 36 Ventas 12866 12215 11346 11206 10523 9926

  • Podemos observar que el pronstico es bastante acertado, aun cuando el Error Medio Cuadrado fuese alto (EMC = 547576). METODO DE HOLT-WINTERS ADITIVO Se basa en el calculo de cuatro componentes:

    (5) Ajuste Exponencial de la Serie de Datos

    )1tT1t(*)(1)jtSt(Y*t ++=

    (6) Estimacin de Tendencias

    1tT*)(1)1tt(*tT +=

    (7) Estimacin de Estacionalidad

    jtS*)(1)tt(Y*tS +=

    (8) Pronstico de Perodos Futuros

    jptStT*ptptY +++=+ Las variables en las ecuaciones tienen el siguiente significado:

    t Es la estimacin exponencialmente suavizada para el perodo t cualquiera Constante de suavizacin exponencial simple

    tY Valor real de la serie de tiempo para el perodo t cualquiera

    jtS Indice de Estacionalidad tT Estimacin de Tendencia para perodo t Constante de suavizacin exponencial de tendencia

    tS Indice de estacionalidad para el perodo t Constante de correccin de estacionalidad j Longitud o duracin de la estacionalidad, en nuestro caso j = 12 p Cantidad de perodos a Pronosticar hacia adelante los valores de , y , deben ser calculados de manera experimental sobre el conjunto de datos de la serie de tiempos disponibles. En nuestro caso, los valores de , y , ptimos son: 0.98,

  • 0.00 y 0.00 respectivamente. Basado en estos valores, el pronstico de los doce meses siguientes se puede resumir en la tabla y grfico siguientes Perodo 25 26 27 28 29 30 Ventas 10695 11180 11900 12245 13035 13965 Perodo 31 32 33 34 35 36 Ventas 12467 11900 11142 11020 10425 9905

    El Error Medio Cuadrado es alto (EMC = 596939), aun as resulta un buen pronstico para el prximo ao 7. CONCLUSIONES Por lo descripto anteriormente, podemos deducir que los mtodos de pronsticos o forecast son complementarios a los mtodos de regresin y correlacin, algunas veces pueden aplicarse de manera independiente y otras veces de manera

    complementaria. Los mtodos de regresin y correlacin, fallan al tratar de explicar comportamientos de alguna variable ms all del conjunto de datos a partir del cual se obtuvieron las ecuaciones de regresin y coeficientes de correlacin correspondiente, pues la adopcin del mejor modelo de regresin no necesariamente implica que podra utilizarse con total confianza para predecir valores futuros. Es aqu donde los modelos de pronsticos o forecasting tienen su importancia, por concepcin estn pensados para ser utilizados para evaluar el futuro, (dentro de los riesgos del modelo adoptado). Por lo observado no son modelos simples, implican conocimiento de la serie de datos y nociones de estadstica aplicada (probabilidades), para poder generar pronsticos que satisfagan un nivel de certeza adecuado (por ejemplo mayor al 95% de certeza). Hemos explicado las situaciones y modelos ms simples y de mayor uso y difusin, pero tengamos en cuenta que un pronstico no es un valor exacto, tiene un margen de error computable. Si pretendemos mejorar nuestro pronstico, debemos utilizar modelos ms precisos como Box-Jenkins (ARIMA = Promedios Mviles Auto Regresivo Integrado)), que se suelen utilizar para filtrar los datos de la serie, se basa en la suposicin que no existe un patrn de comportamiento predecible, sino por el contrario los valores de una serie dependen de la informacin histrica y un ajuste muy refinado de curvas. Ejemplos de uso es en el mercado de valores, para prediccin de corto plazo de precios o evolucin de un ndice o accin, los cuales se basan en patrones generales del movimiento del mercado de acciones antes que tendencias o ciclos. Obviamente en los precios de acciones, ttulos, commodities, no podemos hablar de comportamientos estacionales o ciclos, por el

  • contrario dado lo aleatorio de su comportamiento, es seguro que estos componentes no existen, sin embargo debe poder predecirse el comportamiento o precio de una variable. El tratamiento de los modelos ARIMA est fuera del alcance de este apunte.