Analisis de Series de Tiempo u Chile

download Analisis de Series de Tiempo u Chile

of 52

Transcript of Analisis de Series de Tiempo u Chile

Universidad de ChileFacultad de Ciencias Fsicas y MatemticasDepartamento de Ciencias de la ComputacinSemestre Primavera 2008Tpicos en Minera de DatosSeries de TiempoNombre: Gonzalo RosProfesor: Carlos HurtadoFecha: 14 de Noviembre de 2008Universidad De ChileFacultad De Ciencias Fsicas y MatemticasEscuela de IngenieraDepartamento de Ciencias de la Computacinndice de Contenidos1 Denicin Bsica de Serie de Tiempo 42 Aplicaciones de Series de Tiempo 53 Componentes de una serie de tiempo: Enfoque clsico 64 Aspectos Importantes en Series de Tiempo 74.1 Pronsticos dentro y fuera de la muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74.2 Pronsticos estticos y dinmicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74.3 Alcance de los pronsticos y toma de decisiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74.4 Conjuntos de entrenamiento y evaluacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74.5 Origen jo versos origen mvil de los pronsticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84.6 Conjunto de entrenamiento de tamao creciente versus conjunto de entrenamiento de tamao constante 84.7 Metodologa de Box-Jenkins . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94.8 Estimacin de parmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 Evaluacin de Modelos de Series de Tiempo 105.1 Evalucin del desempeo predectivo: Medicin del error . . . . . . . . . . . . . . . . . . . . . . . . . 106 Estimacin de la Tendencia 116.1 Promedio Mvil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116.2 Suavizamiento exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 Transformada Discreta de Fourier: Enfoque Espectral 127.1 Denicion Matemtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127.1.1 Calculando los Coecientes de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127.2 Algunas Propiedades de F. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137.3 Relacin entre los coecientes de Fourier exactos y aproximados . . . . . . . . . . . . . . . . . . . . . 137.4 Aplicacin a Series de Tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 Modelos ARIMA: Enfoque Moderno 168.1 Modelamiento de series no estacionarias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168.1.1 Caminata aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168.2 Modelamiento de series estacionarias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178.2.1 Modelos de Media Mvil, MA(q) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178.2.2 Modelos Autorregresivos, AR(p) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178.2.3 Modelos Mixtos Autorregresivos Media Mvil, ARMA(p,q) . . . . . . . . . . . . . . . . . . 178.2.4 Modelos Autorregresivos Integrados de Promedio Mvil, ARIMA(p,d,q) . . . . . . . . . . . . 178.3 Modelos ARIMA con variables de intervencin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188.4 Modelos Autorregresivos con Promedio Mvil y Entradas Exgenas, ARMAX(p,q,n) . . . . . . . . . 198.5 Modelos con varianza cambiante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198.5.1 Modelos de Heterocedasticidad Condicional Autorregresiva, ARCH(p) . . . . . . . . . . . . . 198.5.2 Modelos de Heterocedasticidad Condicional Autorregresiva Generalizado, GARCH(p,q) . . . 198.6 Vericacin en el modelo ARIMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 Autocorrelacin 219.1 Denicin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219.2 Criterios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222Universidad De ChileFacultad De Ciencias Fsicas y MatemticasEscuela de IngenieraDepartamento de Ciencias de la Computacin10 Ejemplos de series de tiempo 2310.1 Funcin sinusoidal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2310.2 Funcin sinusoidal con tendencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2510.3 Funcin multisinusoidal con tendencia y componente aleatoria . . . . . . . . . . . . . . . . . . . . . . 3010.4 Ventas mensuales de una empresa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3411 Tcnicas de Inteligencia Computacional en Series de Tiempo 3811.1 Redes Neuronales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3811.1.1Aplicacin de redes neuronales en series de tiempo. . . . . . . . . . . . . . . . . . . . . . . . 4011.1.2Redes ARIMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4111.2 Support Vector Machines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4511.2.1Deniciones del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4611.2.2Algoritmo de Regresin SVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4712 Modelo para un conjunto de series de tiempo 4712.1 Denicin del problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4712.2 Algunos principios claves . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4712.2.1Concepto de dato "normal" . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4712.2.2Concepto de "distancia" . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4812.3 Caractersticas fundamentales del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4812.3.1Normalizando los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4812.3.2Funcin de distancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4912.3.3Caractersticas de la vecindad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4912.3.4Independencia de los datos con el tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4912.3.5Principio fundamental del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5012.3.6Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5012.4 Explicacin matemtica del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5012.5 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 523Universidad De ChileFacultad De Ciencias Fsicas y MatemticasEscuela de IngenieraDepartamento de Ciencias de la Computacin1 Denicin Bsica de Serie de TiempoSe llama Series de Tiempo a un conjunto de observaciones sobre valores que toma una variable (cuantitativa) endiferentes momentos del tiempo.Los datos se pueden comportar de diferentes formas a travs del tiempo, puedeque se presente una tendencia, un ciclo; no tener una forma denida o aleatoria, variaciones estacionales (anual,semestral, etc) [2]. Las observaciones de una serie de tiempo sern denotadas por Y1,Y2,...,YT , donde Y| es elvalor tomado por el proceso en el instante t. [3]Los modelos de series de tiempo tienen un enfoque netamente predictivo y en ellos los pronsticos se elaborarnslo con base al comportamiento pasado de la variable de inters. Podemos distinguir dos tipos de modelos deseries de tiempo [1]: Modelos deterministas: se trata de mtodos de extrapolacin sencillos en los que no se hace referencia alas fuentes o naturaleza de la aleatoriedad subyacente en la serie. Su simplicidad relativa generalmente vaacompaada de menor precisin.Ejemplo de modelos deterministas son los modelos de promedio mvil enlos que se calcula el pronstico de la variable a partir de un promedio de los n valores inmediatamenteanteriores. Modelos estocsticos: se basan en la descripcin simplicada del proceso aleatorio subyacente en la serie.En trmino sencillos, se asume que la serie observada 11, 12,...,1T se extrae de un grupo de variables aleatoriascon una cierta distribucin conjunta difcil de determinar, por lo que se construyen modelos aproximados quesean tiles para la generacin de pronsticos.La serie {1|T|=1 podr ser estacionaria o no estacionaria [1]: Serie no estacionaria:es aquella cuyas caractersticas de media, varianza y covarianza cambian a travsdel tiempo lo que diculta su modelamiento. Sin embargo, en muchas ocasiones, si dicha serie es diferenciadauna o ms veces la serie resultante ser estacionaria (procesos no estacionarios homogneos). Serie estacionaria: es aquella cuya media y varianza no cambian a travs del tiempo y cuya covarianzaslo es funcin del rezago.Gracias a estas caractersticas podremos modelar el proceso subyacente a travsde una ecuacin con coecientes jos estimados a partir de los datos pasados. Media:1(1|) = 1(1|+n) para todo t, :Varianza: o(1|) = o(1|+n) para todo t, :Covarianza: co(1|, 1|+|) = co(1|+n, 1|+n+|) para todo t, :, /4Universidad De ChileFacultad De Ciencias Fsicas y MatemticasEscuela de IngenieraDepartamento de Ciencias de la Computacin2 Aplicaciones de Series de TiempoHoy en da diversas organizaciones requieren conocer el comportamiento futuro de ciertos fenmenos con el nde planicar, prevenir,es decir, se utilizan para predecir lo que ocurrir con una variable en el futuro a partir delcomportamiento de esa variable en el pasado. En las organizaciones es de mucha utilidad en predicciones a corto ymediano plazo, por ejemplo ver que ocurrira con la demanda de un cierto producto, las ventas a futuro, decisionessobre inventario, insumos, etc [2].Algunas de las reas de aplicacin de Series de Tiempo son [3]: Economa: Precios de un articulo, tasas de desempleo, tasa de inacin, ndice de precios, precio del dlar,precio del cobre, precios de acciones, ingreso nacional bruto, etc. Meteorologa: Cantidad de agua cada, temperatura mxima diaria, Velocidad del viento (energa elica),energa solar, etc. Geofsica: Series sismolgicas. Qumica: Viscosidad de un proceso, temperatura de un proceso. Demografa: Tasas de natalidad, tasas de mortalidad. Medicina: Electrocardiograma, electroencfalograma. Marketing: Series de demanda, gastos, utilidades, ventas, ofertas. Telecomunicaciones: Anlisis de seales. Transporte: Series de trco.5Universidad De ChileFacultad De Ciencias Fsicas y MatemticasEscuela de IngenieraDepartamento de Ciencias de la Computacin3 Componentes de una serie de tiempo: Enfoque clsicoSe dice que una serie de tiempo puede descomponerse en cuatro componentes (cinco si se considera una constantellamada nivel) que no son directamente observables, de los cuales nicamente se pueden obtener estimaciones. Estoscuatro componentes son [3,5]: Tendencia (T): representa el comportamiento predominante de la serie. Esta puede ser denida vagamentecomo el cambio de la media a lo largo de un extenso perodo de tiempo Ciclo (C): caracterizado por oscilaciones alrededor de la tendencia con una larga duracin, y sus factores noson claros. Por ejemplo, fenmenos climticos, que tienen ciclos que duran varios aos. Estacionalidad (E): es un movimiento peridico que se producen dentro de un periodo corto y conocido.Este componente est determinado, por ejemplo, por factores institucionales y climticos. Aleatorio (A): son movimientos errticos que no siguen un patrn especco y que obedecen a causasdiversas. Este componente es prcticamente impredecible. Este comportamiento representan todos los tiposde movimientos de una serie de tiempo que no son tendencia, variaciones estacionales ni uctuaciones cclicas.Un modelo clsico de series de tiempo, supone que la serie Y1,...,YT puede ser expresada como suma o productode sus componentes [3]: Modelo aditivo: Y(t) = T(t)+E(t)+C(t)+A(t) Modelo multiplicativo: Y(t) = T(t)E(t)C(t)A(t)6Universidad De ChileFacultad De Ciencias Fsicas y MatemticasEscuela de IngenieraDepartamento de Ciencias de la Computacin4 Aspectos Importantes en Series de Tiempo4.1 Pronsticos dentro y fuera de la muestraAl hablar de pronsticos, se distingue entre proyecciones dentro y fuera de muestra. En las primeras, las proyeccionesrealizadas se reeren a los mismos datos que se emplearon para la construccin y calibracin del modelo (lamuestra), mientras que en las segundas las proyecciones se reeren a datos ajenos a dicha muestra. En la bsquedade metodologas que generen pronsticos precisos de los valores futuros de una variable, slo son relevantes lasproyecciones fuera de muestra por las siguientes razones: Las proyecciones fuera de muestra replican el funcionamiento de la herramienta de pronsticos en la prctica,por lo que la evaluacin de su desempeo predictivo ser un referente vlido para los futuros errores depronstico. Los modelos de pronstico se construyen minimizando los errores dentro de muestra por lo que los errores depronsticos intramuestrales sobrestiman el potencial predictivo de las herramientas. Un modelo con buen desempeo intramuestral podra tener un muy mal desempeo en proyecciones fuera demuestra.Esto se debe a un sobreajuste (overtting) o memorizacin de los datos muestrales, con lo que elmodelo resultante ser incapaz de responder de buena manera a nuevos valores. [1]4.2 Pronsticos estticos y dinmicosLos pronsticos estticos son aquellos que estn basados en la ltima informacin efectiva disponible, por lo queestn limitados a las proyecciones a un periodo hacia adelante. Los pronsticos dinmicos son caracterizadospor utilizar el ltimo pronstico disponible como dato para el siguiente pronstico, permitiendo la realizacin deproyecciones a dos y ms periodos hacia delante. [1]4.3 Alcance de los pronsticos y toma de decisionesTodo pronstico tiene asociado un alcance, pudiendo ser ste de corto, mediano o largo plazo.Los horizontes detiempo correspondientes a dichos alcances dependern de la industria bajo estudio. En cuanto al atractivo de unou otro pronstico, ste estar sujeto al tipo de decisin que se desea tomar o de accin en desarrollo. A modo deejemplo, en la industria del cobre, alcances convencionales y decisiones comunes en el mercado y la industria son:Tipo de pronstico Alcance DecisionesCortsimo Plazo Minutos, horas Operaciones especulativasCorto Plazo Das, semanas, meses, un ao Operaciones especulativas, de cobertura y degestin comercialMediano Plazo Uno a seis aos Evaluacin y control de los resultados de la gestiny de los negocios de una empresaLargo Plazo 6 a 50 aos Planicacin de la produccin y evaluacin deproyectosRelacionado con el alcance de un pronstico est su nivel de incertidumbre.A mayor alcance del pronstico,mayor es el nivel de incertidumbre que se debe enfrentar. Esta consideracin no debe olvidarse al momento detomar decisiones basadas en datos proyectados.[1]4.4 Conjuntos de entrenamiento y evaluacinExisten dos formas de evaluar la precisin de los pronsticos fuera de muestra: Esperar hasta que se cuente con los valores reales para los periodos pronosticados. Por ejemplo: si, duranteel ao 2006, se pronostica el precio del ao siguiente, esperar hasta conocer el valor efectivo del ao 2007. Evaluar la precisin sobre la base de un conjunto de datos que previamente se separ de la muestra disponibley que no particip de la construccin del modelo. Al conjunto de datos empleados para la construccin del7Universidad De ChileFacultad De Ciencias Fsicas y MatemticasEscuela de IngenieraDepartamento de Ciencias de la Computacinmodelo se le denomina conjunto de entrenamiento, mientras que el resto de los datos conforma el conjuntode evaluacin.La divisin de los datos muestrales es una decisin trascendental en la generacin de pronsticos ya que determinala cantidad de datos para la construccin del modelo y lacantidad de pronsticos fuera de muestra que se podrn evaluar.La denicin del tamao y composicin de los conjuntos de entrenamiento y evaluacin deber considerarfactores tales como: Tamao total de la muestra: en muestras pequeas, grandes conjuntos de evaluacin podran comprometerla calidad del modelo construido, si es que el conjunto de entrenamiento no consigue un tamao que lo hagarepresentativo. Tipo de metodologa de pronstico a emplear: distintas metodologas demandan conjuntos de entrenamientoms o menos numerosos. Representatividad: los componentes del conjunto de entrenamiento deben ser diversos para asegurar que elmodelo pueda captar los diversos patrones de comportamiento de la serie bajo estudio (por ejemplo: preciosen fases depresivas, precios en fases expansivas) [1]4.5 Origen jo versos origen mvil de los pronsticosDados los conjuntos de entrenamiento y evaluacin, se dene como el origen de los pronsticos al ndice T corre-spondiente al ltimo dato del conjunto de entrenamiento y se dene como N al tamao del conjunto de evaluacin.Los pronsticos de origen jo, predicen la variable de inters a partir del dato T, esto es para los periodosT +1, T +2, ..., T +. De este modo, para un origen jo slo se calcularn N pronsticos y slo un pronstico paracada alcance (un pronstico a un periodo, un pronstico a dos periodos, etc.), lo que es insuciente para evaluar eldesempeo de una metodologa.Por el contrario, en los pronsticos de origen mvil, se actualiza sucesivamente el origen de los pronsticos, loque incrementa el nmero de proyecciones para cada alcance.As en la situacin recin descrita, una vez que seproyectaron los valores a partir de T, se calculan los pronsticos a partir deT +1 (T +2, T +3, ..., T +), a partirde T + 2 (T + 3, T + 4, ..., T +) y as sucesivamente. El total de pronsticos calculados ser: ( + 1),2Alcance del pronstico: H ==Nmero de evaluaciones: H + 1Esta ltima relacin entre el alcance de los pronsticos y el nmero de evaluaciones, nos permite dimensionar eltamao absoluto del conjunto de evaluacin. Sea H el mximo alcance de los pronsticos que se desea evaluar y seaM el nmero mnimo de evaluaciones que se desea realizar a dicho alcance, el tamao del conjunto de evaluacinestar dado por: _ ' +H 1Por otra parte, el uso de origen mvil disminuye la inuencia de un determinado origen en los resultados (porejemplo, fase depresiva de un ciclo econmico). Las ventajas del origen mvil por sobre el origen jo hacen que elorigen mvil sea la tcnica preferida en evaluaciones fuera de muestra.El empleo de origen mvil plantea la posibilidad de reestimar el modelo de pronstico en cada actualizacin.Este procedimiento es el ms usado ya que disminuye la inuencia del conjunto de entrenamiento original, aunqueesto signique un aumento de los clculos necesarios.[1]4.6 Conjunto de entrenamiento de tamao creciente versus conjunto de entrenamientode tamao constanteAl utilizar la tcnica de origen mvil, cada nueva evaluacin signica la adicin de un nuevo dato al conjuntode entrenamiento, por lo que se puede optar entre la realizacin de proyecciones sobre la base de un conjunto de8Universidad De ChileFacultad De Ciencias Fsicas y MatemticasEscuela de IngenieraDepartamento de Ciencias de la Computacinentrenamiento de tamao creciente o de tamao constante (xed size rolling window).El uso de un conjunto deentrenamiento de tamao constante implicara que al agregar un nuevo dato, se descarte la observacin ms antigua(pruning), lo que parece recomendable si la trayectoria de precios a travs del tiempo sigue un patrn notoriamentedistinto al del pasado, situacin que parece no aplicar al caso del cobre. [1]4.7 Metodologa de Box-JenkinsEl enfoque de Box-Jenkins es una de las metodologas de uso ms amplio para el modelamiento estocstico deseries de tiempo. Es popular debido a su generalidad, ya que puede manejar cualquier serie, estacionaria o noestacionaria, y por haber sido implementado en numerosos programas computacionales.Los pasos bsicos de la metodologa de Box-Jenkins son [1]:1. Vericar la estacionariedad de la serie. Si sta no es estacionaria, diferenciarla hasta alcanzar estacionariedad.2. Identicar un modelo tentativo.3. Estimar el modelo.4. Vericar el diagnstico (si este no es adecuado, volver al paso 2).5. Usar el modelo para pronosticar.Lo que se trata es de identicar el proceso estocstico que ha generado los datos, estimar los parmetrosque caracterizan dicho proceso, vericar que se cumplan las hiptesis que han permitido la estimacin de dichosparmetros. Si dichos supuestos no se cumplieran, la fase de vericacin sirve como retroalimentacin para unanueva fase de identicacin. Cuando se satisfagan las condiciones de partida, se puede utilizar el modelo parapronosticar.[5]4.8 Estimacin de parmetrosPara estimar los parmetros del modelo se utiliza un algoritmo de mnimos cuadrados de Gauss Marquatt paraminimizar la suma de cuadrados de los residuos.Este algoritmo trata de minimizar la suma de cuadrados de losresiduos, comenzando con algn valor de los parmetros del modelo. El algoritmo busca si otro vector de parmetrosmejora el valor de la funcin objetivo y se produce un proceso de iteracin hasta que se alcanza u cierto criterio deconvergencia. [5]9Universidad De ChileFacultad De Ciencias Fsicas y MatemticasEscuela de IngenieraDepartamento de Ciencias de la Computacin5 Evaluacin de Modelos de Series de Tiempo5.1 Evalucin del desempeo predectivo: Medicin del errorPara la evaluacin del desempeo predictivo se emplean diferentes indicadores que cuantican qu tan cerca estla variable pronosticada de su serie de datos correspondiente.Una de las medidas ms utilizadas es el Promediodel Error Porcentual Absoluto (MAPE)'11 = 1T_T

|=111|_= 1T_T

|=1[1s| 1o| [1o|_100donde11 :error porcentual absoluto.1o|:valor pronosticado de Y|.1s|:valor real de Y|.T: nmero de periodos.El MAPE mide el valor medio del error absoluto en trminos porcentuales al valor real de la variable[1].En lugar de considerar el promedio de error porcentual absoluto, MAX_MAPE indica el valor mximo del errordel modelo respecto a la serie real, en trminos porcentuales y absolutos [6] :'A_'11 = 'A|[1s| 1o| [1o|100Para evaluar la dispersin de los errores se puede calcular el Desvo Estndar del Error porcentual absoluto(APE).1c:io 1:t a:dar 11 =_1TT

|=1(11| '11)2Otra medida del error de pronstico comnmente empleada es la Raz Cuadrtica Media del Error (RMSE):1'o1 =_1TT

|=1(1s| 1o| )2donde1o|:valor pronosticado de Y|.1s|:valor real de Y|.T: nmero de periodos.El RMSE mide la dispersin de la variable simulada en el curso del tiempo, penalizando fuertemente los erroresgrandes al elevarlos al cuadrado. Esta caracterstica hace que el RMSE se recomiende cuando el costo de cometerun error es aproximadamente proporcional al cuadrado de dicho error.No siempre el modelo que genere pronsticos con un menor MAPE generar los pronsticos con el menor RMSEy viceversa, por lo que en la seleccin de los mejores modelos de pronstico se hace necesario establecer la medidade error a utilizar para la elaboracin del ranking de desempeo.Dado que una mala estimacin del precio fututo del cobre se traduce en una prdida de ingresos proporcional altamao del error, el MAPE, y no el RMSE, parece ser la medida de desempeo ms adecuada. A esto se suma laventaja prctica del MAPE de no requerir ser acompaado por la media para dimensionar la magnitud del error.Luego, la medida de error que se emplear para identicar los modelos de mejor desempeo ser el MAPE.[1]10Universidad De ChileFacultad De Ciencias Fsicas y MatemticasEscuela de IngenieraDepartamento de Ciencias de la Computacin6 Estimacin de la TendenciaHay varios mtodos para estimar la tendencia T(t), uno de ellos es utilizar un modelo de regresin lineal. Se puedenutilizar otros tipos de regresiones, como regresin cuadrtica, logstica, exponencial, entre otros.Una forma de visualizar la tendencia, es mediante suavizamiento de la serie. La idea central es denir a partirde la serie observada una nueva serie que ltra o suaviza los efectos ajenos a la tendencia (estacionalidad, efectosaleatorios), de manera que podamos visualizar la tendencia. [3]6.1 Promedio MvilEste mtodo de suavizamiento es uno de los ms usados para describir la tendencia. Consiste en jar un nmero k,preferentemente impar, como 3, 5, 7, etc., y calcular los promedios de todos los grupos de k trminos consecutivosde la serie. Se obtiene una nueva serie suavizada por promedios mviles de orden k. De este modo se tienden aanular las variaciones aleatorias. La formula est dada por7(t) = 1 (t /) +1 (t / + 1) +... +1 (t) +1 (t + 1) +... +1 (t +/)2 + / + 1El suavizamiento de media mvil es muy fcil de aplicar, permite visualizar la tendencia de la serie. Pero tienedos inconvenientes:No es posible obtener estimaciones de la tendencia en extremos y no entrega un medio parahacer predicciones. Si la serie presenta un efecto estacional de perodo k, es conveniente aplicar un suavizamientode media mvil de orden k. En tal caso se elimina el efecto estacional, junto con la variacin aleatoria, observndosesolamente la tendencia.[3]6.2 Suavizamiento exponencialEste modelo se basa en que una observacin suavizada, en tiempo t, es un promedio ponderado entre el valor actualde la serie original y el valor de la serie suavizada, en el tiempo inmediatamente anterior. Si 1 (t) representa laserie de tiempo original, y 7(t) la serie de tiempo suavizada, entonces lo anterior se puede escribir7(t) = c1 (t) + (1 c)7(t 1)en donde c es un nmero entre 0 y 1.Si c es cercano a 1, la serie suavizada pondera ms fuertemente el valor original, luego ambas se parecen, y enconsecuencia, el suavizamiento es poco.Si c se acerca a 1/2, se ponderan moderadamente la serie original y la suavizada, por lo que el suavizamientoes moderado.Si c es cercano a cero, (1-c) es cercano a 1, y la serie suavizada pondera ms fuertemente el valor suavizadoinmediatamente anterior, por lo que el suavizado es importante.Consecuencia de la frmula anterior es que la serie suavizada se puede expresar como7(t) = c1 (t) +c(1 c)1 (t 1) +c(1 c)21 (t 2) +... +c(1 c)|11 (1)Es decir, cada trmino suavizado es un promedio ponderado de todos los trminos histricos de la serie original.Como c est entre 0 y 1, estos nmeros se van achicando a medida que avanzan.Eso signica que a medidaque nos alejamos hacia el pasado, los trmino van inuyendo cada vez menos en el trmino presente.La rapidezcon que disminuye la inuencia es mayor mientras ms grande (cercano a 1) es c.Si la serie vara lentamente, por lo general se eligen valores de c cercanos a 0 (valor tpico c = 0.3). En cambio,si vara bruscamente, se eligen valores de c cercanos a 1 (valor tpico c = 0.7). [3]11Universidad De ChileFacultad De Ciencias Fsicas y MatemticasEscuela de IngenieraDepartamento de Ciencias de la Computacin7 Transformada Discreta de Fourier: Enfoque EspectralLa mayora de los mtodos en series de tiempo se basan en el espacio del tiempo. Otro enfoque muy poderoso esen el espacio de frecuencia, en donde la transformada discreta de fourier tiene un papel primordial.7.1 Denicion MatemticaSea 12(a) = ) : R C [ ) es a jcri odica y _o0 [)(t)[2dt < . Sea ) 12(a) y denotamos por o[)] a su Seriede Fourier, la que viene dada por:o[)](t) =n=1

n=1cnc2tIn ta,donde los cnn2N son sus "coecientes de Fourier", que vienen dados por:cn = 1a_o0)(t)c2tIn tadtAhora, sean o[)] las sumas parciales de la serie anterior, esto es:o[)](t) =n=

n=cnc2tIn taEs bien sabido que las sumas parciales de una funcin ) 12(a) convergen a ella en la norma de 12(0, a).An ms, un teorema debido a Dirichlet seala que si adems para un punto to (0, a) los lmites )(t+o ) y )(t

o )existen, al igual que las derivadas laterales en ese punto, entonces:o[)](to) o[)](t) = 12[)(t+o ) +)(t

o )]Luego conocer la Serie de Fourier de una funcin sucientemente buena puede otorgar bastante informacin sobreesta. Sin embargo, uno precisara conocer una innidad de las constantes cn(lo que a parte de ser costoso, salvocasos muy particulares, es imposible).En la prctica, no es necesario conocer "demasiadas" de estas constantes,por dos razones: La serie ser evaluada numricamente, por lo que se considerar solo una suma parcial de esta. Se tiene que para ) 12(a),n=1

n=1[cn[2< , de donde cn 0 si [:[ . Luego los nicos trmino deinters (numrico) son los de ndice no demasiado grande.Pese a lo anterior, puede ser necesario conocer muchos cn, lo que implicara evaluar muchas integrales. Por lotanto, para efectos prcticos, ser necesario integrar numricamente las expresiones para estos coecientes.Esta es la motivacin original para la Transformada de Fourier Discreta (DFT), vale decir, obtener una expresinaproximada para la Serie de Fourier de una funcin a partir de un "sampleo" de datos conocidos sobre la funcin.Se ver ms adelante que el espectro de problemas en que esta herramienta ha resultado til es mucho ms amplio.7.1.1 Calculando los Coecientes de FourierSuponer que se tiene una funcin a jcri odica ) : R C sobre la cual solo conocemos valores equiespaciadosen (0, a), vale decir:)_/ a_= j| , / = 0, 1, ..., 1La idea es estimar coecientes de la Serie de Fourier de ), la que se asumir converge puntualmente. Porsimplicidad se supondr que es par. As, se estimar cn para : = ,2, ..., ,2 1. De la frmula para12Universidad De ChileFacultad De Ciencias Fsicas y MatemticasEscuela de IngenieraDepartamento de Ciencias de la Computacinlos coecientes de Fourier, se puede integrar mediante el Mtodo del Trapecio, lo que entrega la siguienteaproximacin para cn :cn - 1n :=11

|=0j|nn|, con n = c2iN , : NAdems, de la periodicidad de la exponencial, se verica que1

1|=0 j|nn|= 1n+ , si 2 _ : < 0, dedondecn - 1(n) , con ,(:) = : + ( n