Pronósticos de Precios Del Cobre Usando Algoritmos Genéticos

7
Pron ´ osticos de precios del cobre usando algoritmos gen ´ eticos Ra´ ul Carrasco 1 , Ismael Soto 2 , Pablo Adasme 3 , Miguel Alfaro 4 y Manuel Vargas 5 1 Departamento de Ingenier´ ıa El´ ectrica Universidad de Santiago de Chile e-mail : raul.carrasco.a@usach.cl 2 Departamento de Ingenier´ ıa El´ ectrica Universidad de Santiago de Chile e-mail : ismael.soto@usach.cl 3 Departamento de Ingenier´ ıa El´ ectrica Universidad de Santiago de Chile e-mail : pablo.adasme@usach.cl 4 Departamento de Ingenier´ ıa Industrial Universidad de Santiago de Chile e-mail : miguel.alfaro@usach.cl 5 Escuela de Ingenier´ ıa Universidad Cat´ olica del Norte e-mail : mevargas@ucn.cl Resumen— Este trabajo plantea que es posible apli- car algoritmos gen´ eticos para predecir la variaci´ on en los precios del cobre, con el fin de mejorar el grado de cer- teza al incorporar la inversa del porcentaje de predicci´ on de signo PPS, obteniendo un m´aximo de un 67,12% y una rentabilidad 9,66 %, versus una rentabilidad Buy and Hold del -2,0% para 73 d´ ıas de observaci´on. Abstract— This work suggests that it is possible to apply genetic algorithms to predict the variation in cop- per prices, in order to improve the degree of certainty by incorporating the inverse of the percentage sign prediction PPS, obtaining a maximum of 67.12 % and a yield 9.66 %, versus Buy and Hold a return of -2.0 % for 73 days of observation. Palabras Claves— pron´ osticos, series de tiempo, al- goritmos gen´ eticos 1. Introducci´ on El precio del cobre y sus variaciones es un tema financie- ro imprescindible tanto para las empresas mineras como para el gobierno de Chile, por su impacto en los resultados y en la econom´ ıa, respectivamente. Las series de precios en los mercados en general y de los commodities, como es el caso del cobre, presentan una alta volatilidad, din´amica y turbulencia, debido a esto resulta muy importante estimar su precio. El modelamiento matem´atico y la predicci´ on de valores de commodities es tema de investigaci´on constante por los agentes privados, las aseguradoras y las instituciones gubernamentales para garantizar la libre competencia en el mercado valores. 2. Metodolog´ ıa En esta investigaci´ on se utiliza un algoritmo gen´ etico desarrollado por John Holland [1, 2] para modelar el sis- tema de pron´osticos multivariados din´amicos. Para el mo- delo, una soluci´ on parcial es representada por cadenas bi- narias de largo constante. Esta soluci´ on local es mejorada utilizando m´ etodos de b´ usqueda multipuntos basados en teor´ ıas evolucionistas, logrando soluciones de mejor cali- dad y velocidad en relaci´ on con los algoritmos de b´ usqueda antes investigados. El algoritmo se implementa en plataforma orientada al objeto para la obtenci´ on de pron´osticos sobre los precios del cobre. Por otra parte, el an´alisis de datos se realiza con el programa estad´ ıstico R. En cuanto a la secuencia metodol´ogica, esta define cua- tro etapas con sus respectivos objetivos: 2.1. Etapas del algoritmo gen´ etico Generaci´ on: Generar la poblaci´ on inicial en un proceso estoc´ astico de tama˜ no predefinido. Poblaci´on: Determinar una poblaci´on fija de treinta in- dividuos, la cual se fue renovando mediante la salida de los individuos no aptos con la incorporaci´ on del nuevo material gen´ etico evolucionado. Los pasos en ´ esta etapa son: Preparar la poblaci´ on base para su evaluaci´ on. Eliminar a los individuos que no califican de acuerdo con la funci´ on de aptitud definida en el problema. Incorporar a la poblaci´ on base a los hijos repro- ducidos por los mejores individuos de la pobla- XXI Congreso de la Asociación Chilena de Control Automático ACCA 2014 - 405 - ISSN 0719-5567, Pág. 405-412. Santiago de Chile, 5 al 7 de Noviembre 2014

description

Pronósticos de Precios Del Cobre Usando Algoritmos Genéticos, ACCA 2014

Transcript of Pronósticos de Precios Del Cobre Usando Algoritmos Genéticos

Page 1: Pronósticos de Precios Del Cobre Usando Algoritmos Genéticos

Pronosticos de precios del cobre usando

algoritmos geneticos

Raul Carrasco∗1, Ismael Soto2, Pablo Adasme3, Miguel Alfaro4 y Manuel Vargas5

1Departamento de Ingenierıa ElectricaUniversidad de Santiago de Chilee-mail: [email protected]

2Departamento de Ingenierıa ElectricaUniversidad de Santiago de Chile

e-mail: [email protected]

3Departamento de Ingenierıa ElectricaUniversidad de Santiago de Chilee-mail: [email protected]

4Departamento de Ingenierıa IndustrialUniversidad de Santiago de Chilee-mail: [email protected]

5Escuela de IngenierıaUniversidad Catolica del Norte

e-mail: [email protected]

Resumen— Este trabajo plantea que es posible apli-car algoritmos geneticos para predecir la variacion en losprecios del cobre, con el fin de mejorar el grado de cer-teza al incorporar la inversa del porcentaje de prediccionde signo PPS, obteniendo un maximo de un 67,12% yuna rentabilidad 9,66%, versus una rentabilidad Buy andHold del -2,0% para 73 dıas de observacion.

Abstract— This work suggests that it is possible toapply genetic algorithms to predict the variation in cop-per prices, in order to improve the degree of certainty byincorporating the inverse of the percentage sign predictionPPS, obtaining a maximum of 67.12% and a yield 9.66%,versus Buy and Hold a return of -2.0% for 73 days ofobservation.

Palabras Claves— pronosticos, series de tiempo, al-goritmos geneticos

1. Introduccion

El precio del cobre y sus variaciones es un tema financie-ro imprescindible tanto para las empresas mineras comopara el gobierno de Chile, por su impacto en los resultadosy en la economıa, respectivamente. Las series de precios enlos mercados en general y de los commodities, como es elcaso del cobre, presentan una alta volatilidad, dinamica yturbulencia, debido a esto resulta muy importante estimarsu precio.

El modelamiento matematico y la prediccion de valoresde commodities es tema de investigacion constante porlos agentes privados, las aseguradoras y las institucionesgubernamentales para garantizar la libre competencia enel mercado valores.

2. Metodologıa

En esta investigacion se utiliza un algoritmo geneticodesarrollado por John Holland [1, 2] para modelar el sis-tema de pronosticos multivariados dinamicos. Para el mo-delo, una solucion parcial es representada por cadenas bi-narias de largo constante. Esta solucion local es mejoradautilizando metodos de busqueda multipuntos basados enteorıas evolucionistas, logrando soluciones de mejor cali-dad y velocidad en relacion con los algoritmos de busquedaantes investigados.

El algoritmo se implementa en plataforma orientada alobjeto para la obtencion de pronosticos sobre los preciosdel cobre. Por otra parte, el analisis de datos se realizacon el programa estadıstico R.

En cuanto a la secuencia metodologica, esta define cua-tro etapas con sus respectivos objetivos:

2.1. Etapas del algoritmo genetico

Generacion: Generar la poblacion inicial en un procesoestocastico de tamano predefinido.

Poblacion: Determinar una poblacion fija de treinta in-dividuos, la cual se fue renovando mediante la salidade los individuos no aptos con la incorporacion delnuevo material genetico evolucionado. Los pasos enesta etapa son:

Preparar la poblacion base para su evaluacion.

Eliminar a los individuos que no califican deacuerdo con la funcion de aptitud definida enel problema.

Incorporar a la poblacion base a los hijos repro-ducidos por los mejores individuos de la pobla-

XXI Congreso de la Asociación Chilena de Control Automático ACCA 2014

- 405 -

ISSN 0719-5567, Pág. 405-412. Santiago de Chile, 5 al 7 de Noviembre 2014

Page 2: Pronósticos de Precios Del Cobre Usando Algoritmos Genéticos

cion, anadiendo, de este modo, nuevo materialgenetico.

Acciones: Evaluar y seleccionar a los individuos deacuerdo con la funcion de aptitud, para luego repro-ducir y mutar. Los pasos de esta etapa son:

Evaluar a los individuos de acuerdo con funcionde aptitud.

Seleccionar a los individuos:

• aptos, que se mantendran en la poblacionbase y que traspasaran su material geneticoa la proxima generacion;

• no aptos, que seran eliminados de la pobla-cion base.

Reproducir a los individuos aptos de acuerdo conlos operadores de cruce.

Mutar a los individuos reproducidos de acuerdocon los operadores de mutacion y las restriccio-nes de no duplicar los individuos, los que debenpasar a la poblacion base.

Resultados: Archivar los resultados de cada generaciony, una vez terminado el algoritmo, se procede a rea-lizar una evaluacion y analisis de los resultados paraelaborar un informe de estos.

Las etapas anteriores se muestran en figura 1 de algo-ritmos geneticos.

Población Acciones ResultadosGeneración

Evaluación de lafunción de adaptación

Inserción de los hijos

en la población

Reproducción

Generación de lapoblación inicial

Selección individuos a reproducir

Población base a evaluar

Archivo resultados

Aptittud

Si

Selección individuos a

eliminarNo

(-)

No duplicado

(+)Repetir hasta

que se cumpla el criterio determinación

Informe de resultados

Evaluación de resultados

Inicio

Fin

� �� mutacióncruce ,

Nuevo individuo

Duplicado

Figura 1: Etapas algoritmos geneticos

3. Aplicacion

El objetivo de la aplicacion del algoritmo genetico esencontrar el modelo de pronostico multivariado dinamico,

que maximice el porcentaje predictivo de signo relacionadocon las variaciones diarias de los precios del cobre (Cu)que presenta la Bolsa de Metales de Londres. En otraspalabras, descubrir una formula matematica que generede modo aproximado los patrones historicos de las seriesde tiempo del cobre.

Nuestra serie de tiempo corresponde a una secuenciade valores que miden el precio de mercados a intervalosiguales de tiempo, manteniendo una consistencia en la ac-tividad y el metodo de medicion. En este caso, los datosextramuestrales corresponden a valores de cierre diariosdel perıodo comprendido entre el 24 de febrero 2014 al 29de agosto de 2014. Para el perıodo intramuestral se consi-deraron los dıas de rezagos correspondientes a rolling de60 dıas.

Los modelos de pronostico multivariados dinamicos uti-lizados ayudan a proyectar los precios futuros de la seriesde tiempo[3], comprendiendo el comportamiento y lo queesta ocurriendo con los datos de la variable del Cu y delDow como mercado bursatil, en funcion de sus valoresrezagados.

3.1. Metricas y datos

3.1.1. Determinacion de variaciones

Para determinar las variaciones de precio del Dow yCu, en terminos generales se expresa con el operador dediferencia ∇. Este operador se utiliza para expresar lasrelaciones de tipo ∇Yt = Xt − Xt−1, donde Xt es unavariable de saldo e ∇Yt sera la variable de flujo correspon-diente [4].

Se define ∇ como:

∇Yt = Xt −Xt−1 ∀t, t ∈ Z (1)

donde:

∇Yt es la variacion del precio,

Xt es el precio del periodo,

Xt−1 es el precio del periodo anterior.

Podemos representar las variaciones del Dow y Cu, deacuerdo a la ecuacion (1).

∇Dowt = Dowt −Dowt−1 ∀t, t ∈ Z (2)

donde:

∇Dowt es la variacion del precio del Dow,

Dowt es el precio del periodo del Dow,

Dowt−1 es el precio del periodo anterior del Dow.

∇Cut = Cut − Cut−1 ∀t, t ∈ Z (3)

Raúl Carrasco, Ismael Soto, Pablo Adasme, Miguel Alfaro, Manuel Vargas

- 406 -

Page 3: Pronósticos de Precios Del Cobre Usando Algoritmos Genéticos

donde:

∇Cut es la variacion del precio del Cu,

Cut es el precio del periodo del Cu,

Cut−1 es el precio del periodo anterior del Cu.

3.1.2. Determinacion de proyecciones

La proyeccion de la variacion de Cu la denotaremos enfuncion de las variaciones rezagadas del Dow, Cu de lasecuaciones 2 y 3 y de los errores de prediccion.

Se define en este estudio como:

∇Cut = θ(∇Dowt−1 • βd1 + . . .+∇Dowt−4 • βd4+∇Cut−1 • βc1 + . . .+∇CUt−4 • βc4+

+εt−1 • βe1 + . . .+ εt−4 • βe4) (4)

De esta manera, tambien puede obtenerse la siguienteforma general de ∇Cut:

∇Cut =

4∑i=1

θ(∇Dowt−i • βdi +∇Cut−i • βci + εt−i • βei)(5)

Donde:

∇Cut, es la variacion proyectada,

θ() es la funcion Heaviside , que multiplica los betascalculados con el input de la variable,

∇Dowt−i son los rezagos de las variaciones del Dow,

∇Cut−i son los rezagos de las variaciones del Cu,

εt−i es el error de prediccion.

La proyeccion se realiza minimizando el error al cuadra-do de la estimacion para rolling de 60 dıas, con NewtonRaphson, definido por:

mın(e2(n)

)= mın

(n∑i=1

(∇Cut −∇Cut)2)

(6)

Para n = 60

donde:

e2(n) es el error al cuadrado de la estimacion en los nperiodos,

∇Cut es el valor de la variacion del periodo,

∇Cut es el valor de la variacion proyectada.

La funcion objetivo no se encuentra sujeta a una seriede restricciones.

El vector de variables de decision corresponde a los be-tas calculados, los cuales minimizan la sumatoria de loserrores al cuadro de la prediccion para rolling de 60 dıas.

3.1.3. Determinacion del porcentaje de predic-cion de signo

Por otra parte, hay que determinar el porcentaje deprediccion de signo (PPS)[5]. Para calcular el PPS, secompara el signo de la variacion proyectada con el signode la variacion observada, en cada perıodo del t+n dondeel t = 1, 2 . . . , n empezando del t + 1. Si los signos de lavariacion proyectada y la variacion observada coinciden,se obtiene el valor “1”, el cual representa un exito. En elcaso opuesto, “0” indica un error de prediccion del modelo[6]. Si los signos coinciden, aumenta la efectividad de laprediccion y, en caso de no existir coincidencia, aumenta elerror de prediccion del modelo. El porcentaje de prediccionde signo del modelo esta definida por:

PPS =

∑nj=1 θ

(∇Cuj,t+1 • ∇Cuj,t+1

)n

∀, 1 ≤ j ≤ n (7)

Donde:

PPS es el porcentaje de prediccion de signo (PPS)presentado en la ecuacion,

∇Cut es el valor de la variacion del periodo,

∇Cut es el valor de la variacion proyectada,

θ() es la funcion dicotomica Heaviside θ() = 1 si∇Cuj,t+1 • ∇Cuj,t+1 > 0 y θ() = 0 si ∇Cuj,t+1 •∇Cuj,t+1 ≤ 0,

n es la cantidad total de predicciones realizadas.

La variable PPSmax utilizada sera el maximo entrePPS y el (1− PPS), tal como se muestra en la ecuacion8.

PPSmax = max(PPS, (1− PPS)) (8)

3.1.4. Test de Pesaran y Timmermann

Se aplico el test de acierto direccional de Pesaran yTimmermann [7, 8], con el objeto de medir la significan-cia estadıstica de la capacidad predictiva del modelo depronostico multivariado dinamico con algoritmos geneti-cos.

El test de acierto direccional se usa con el objetivo demedir la significancia estadıstica de la capacidad predic-tiva de los modelos analizados[3, 5]. El test de acierto di-reccional prueba la hipotesis nula de que las variacionesobservadas estan distribuidas independientemente de lasvariaciones proyectadas. Por ello, si se rechaza la hipote-sis nula, se dice que existe evidencia estadıstica de que elmodelo tiene capacidad para predecir la evolucion futurade la variable observada.

Este test compara el signo de la proyeccion, con el delvalor observado para cada j-esima observacion del con-junto muestral (j = 1, 2, ..., n); donde el signo indica la

Pronósticos de precios del cobre usando algoritmos genéticos

- 407 -

Page 4: Pronósticos de Precios Del Cobre Usando Algoritmos Genéticos

direccion en que se movera el mercado accionario: al alza,si es positivo, o a la baja, si es negativo. Si los signos coin-ciden, aumenta la efectividad de la prediccion y, en casode no existir coincidencia, aumenta el error de predicciondel modelo (igual que la metodologıa usada para calcularPPS).

Para obtener el porcentaje de variaciones positivasreales observadas, se representa en la siguiente ecuacion:

P =

∑nj=1 θ (∇Pj,t+1)

n(9)

Donde:

P es el porcentaje de variaciones positivas reales obser-vadas y

θ() es la funcion dicotomica Heaviside θ() = 1 si∇Pj,t+1 > 0 y θ() = 0 si ∇Pj,t+1 ≤ 0.

Para obtener el porcentaje de variaciones positivas deproyeccion, se representa en la siguiente ecuacion:

P =

∑nj=1 θ

(∇P j,t+1

)n

(10)

Donde:

P es el porcentaje de variaciones positivas reales pro-yectadas y

θ() es la funcion dicotomica Heaviside θ() = 1 si∇P j,t+1 > 0 y θ() = 0 si ∇P j,t+1 ≤ 0.

Ademas, el ratio de exito cuando las variaciones realesy las variaciones proyectadas se encuentran independien-temente distribuidas para de ∇Pj,t+1 y ∇P j,t+1 ,SRI,esta dada por:

SRI = P ∗ P + (1− P ) ∗ (1− P ) (11)

Para determinar la varianza del ratio SRI, se definecomo:

var(SRI) =

(n

(2P − 1

)2P (1 − P ) + n (2P − 1)2 P

(1 − P

)+ 4PP (1 − P )

(1 − P

))

n2

(12)

Por su parte, la varianza del ratio de exito SR se definecomo:

var(SR) =SRI (1− SRI)

n2(13)

Finalmente, el test de acierto direccional (DA, Direc-cional Accuracy) de Pesaran y Timmermann [7] esta dadopor:

DA =(SR− SRI)√

var (SR)− var (SRI)(14)

Dicho test sigue una distribucion normal estandar. Elresultado de esta ecuacion se compara con un t crıtico,que dependera del nivel de confianza que se le quiera exi-gir a la prueba. Es decir; si el valor DA esta entre losvalores de rechazo, no se rechaza la hipotesis nula de quelas variaciones observadas esten distribuidas independien-temente de las variaciones proyectadas[9, 10]. De esto ulti-mo se entiende que se busca rechazar la hipotesis nula; esdecir, que el valor DA no se encuentre entre los valorescrıticos mencionados y que, por ende, sı exista capacidadpredictiva.

3.2. Codificacion de las variables

Cada cromosoma tiene varios genes, que correspondena los parametros del problema. Para poder trabajar conestos genes computacionalmente, es necesario codificarlosen una cadena, es decir, en una secuencia de sımbolos com-puesta, en este caso, de ceros y unos.

Para una correcta codificacion y una buena resoluciondel problema. Se construyo por bloques matriciales de losrezagos del Dowt, Cut y εt. Se utilizo la regla heurısti-ca llamada regla de los bloques de construccion, es decir,parametros relacionados entre sı que deben estar cercanosen el cromosoma.

El cromosoma [1010][1110][1101], estara representadopor un string de tres bloque, donde, el primer bloque decuatro genes esta representado por los rezagos del Dowta t − 1, t − 2, t − 3 y t − 4. El segundo bloque de cuatrogenes que van del gen cinco al gen ocho esta representadopor los rezagos de Cut en sus rezagos de t − 1 al t − 4.Para el tercer bloque de cuatro genes que van del gen 9 algen 12 esta representado por los εt en la prediccion parat− 1 al t− 4.

3.3. Generacion de poblacion inicial y pri-mera generacion

Se ha elegido arbitrariamente una poblacion de cromo-somas de Cu de tamano fijo de solo treinta individuos,considerando los tiempos de calculo de nuestros recursoscomputacionales y privilegiando la busqueda y optimiza-cion basadas en la teorıa darwiniana.

Nuestra poblacion inicial, o primera generacion de cro-mosomas, se genera a partir de una generacion aleatoria,siendo los algoritmos geneticos herramientas para obtenersoluciones aproximadas a problemas en los que evaluar lasolucion exacta resultarıa muy costoso en tiempo. Es nece-sario programar de una manera tal que no permita los ge-melos (hermanos iguales) para no evaluar mas de una vezel mismo modelo. Ademas, es recomendable no generar nireproducir un cromosoma nulo, compuesto de ceros paralos tres bloques, representados como: [0000][0000][0000].

A partir de una poblacion inicial de cromosomas deCu generados aleatoriamente de treinta modelos como semuestra en la figura 2. De forma elitista de estos treinta

Raúl Carrasco, Ismael Soto, Pablo Adasme, Miguel Alfaro, Manuel Vargas

- 408 -

Page 5: Pronósticos de Precios Del Cobre Usando Algoritmos Genéticos

Generador de Cromosomas

Aleatorio

Genera Cromosoma

¿Cromosoma ya existe en población?

AlmacenaCromosoma

Población Cromosomas

Población < 30

Fin

No

No

Si

Si

Inicio

Figura 2: Generacion de poblacion inicial

se eligen los diez mejores cromosomas mediante la fun-cion de evaluacion fitness, los cuales pasan a la segundageneracion para reproducirse hasta completar nuevamentetreinta, como se muestra en forma general en figura 1. Deesta forma elitista puede aumentar rapidamente el desem-peno de un algoritmo genetico, ya que ası se evita perderla mejor solucion encontrada [11]. Sin embargo, es posibleque este metodo conduzca rapidamente a un optimo local.

3.4. Evaluacion y seleccion

La funcion evaluacion fitness, de acuerdo con la ecuacion15, juega un papel importante en la clasificacion potencialde las soluciones en terminos de sus caracterısticas; es elcriterio evaluacion de la calidad de los individuos.

Fitness =

PPSmax +

(Rent

4

)2

(15)

Donde:

Fitness es la funcion de evaluacion multi-objetivo,

PPSmax es el PPS maximo entre PPS y (1 − PPS),como se muestra en la ecuacion 8,

Rent es la rentabilidad del individuo o cromosoma.

Aporta mayor potencia y robustez a la tecnica debusqueda, este operador cumple la funcion de hacer unaseleccion de los mejores individuos de manera que estossean considerados en el proceso de generacion de la nueva

poblacion [11]. Este algoritmo genetico utiliza la tecnicade seleccion elitista, para seleccionar a los individuos quedeben copiarse hacia la nueva generacion.

Con esta tecnica se garantiza la seleccion de los miem-bros mas aptos de cada generacion y los conserva paraentregar sus atributos a sus descendientes. Es decir, los se-leccionados como reproductores de la generacion siguiente.

Durante la evaluacion se decodifica el gen, el que se con-vierte en una serie de parametros presentados en el puntocodificacion de la variable. Luego se obtiene la solucion ala que se da un puntaje en funcion del mejor rendimiento.

3.5. Mutacion, reproduccion y parada

Para la funcion de mutacion fue asignado un 5%, elque por restriccion de no permitir individuos duplicadosaumenta la tasa efectiva de mutacion tras cada generacion.

En el traspaso genetico los dos primeros genes de cadabloque los aporta el padre y los dos restantes la madre,los cuales son seleccionados para reproduccion aleatoria deentre los mejores individuos. El criterio de parada se aplicoal completar de evaluar la decimoseptima generacion.

4. Resultados

4.1. Mejores modelos

De acuerdo con el cuadro 1, los dos mejores modelos[1011][0111][0011] y [1001][0111][0011] nacen en la deci-motercera generacion ambos con una capacidad predicti-va (PPS) de 67,12% y una rentabilidad del periodo de9,66% y 7,52%, respectivamente.

En los resultados de las posiciones 3 a la 5 su PPSfue de 65,75%, con una rentabilidad de 10,07%, 8,30% y8,05% respectivamente.

Cuadro 1: Mejores cinco modelos

Cromosoma Pred Rent Gen[1011][0111][0011] 67,12% 9,66% 13o

[1001][0111][0011] 67,12% 7,52% 13o

[1101][0111][0010] 65,75% 10,07% 12o

[1100][1101][1111] 65,75% 8,30% 4o

[0001][1110][0011] 65,75% 8,05% 12o

En la figura 3 se muestra la evolucion de precio relativodel Dow, Cu y el mejor individuo [1011][0111][0011], de-jando a la vista el mejor resultado de la gestion de carteradel cromosoma [1011][0111][0011] sobre la estrategia Buyand Hold de -2,0% representada por Cu.

Pronósticos de precios del cobre usando algoritmos genéticos

- 409 -

Page 6: Pronósticos de Precios Del Cobre Usando Algoritmos Genéticos

95%

100%

105%

110%

19/05/14 18/06/14 18/07/14 17/08/14

DowCu[1011][0111][0011]

Figura 3: Grafico de resultados

4.2. Hallazgos

El PPS de los mejores resultados de los individuos se-leccionados por su mejor fitness en cada generacion, resul-to ser maximo (1−PPS) sobre PPS como se muestra enla ecuacion 8 que es parte de la ecuacion 15.

Al la inversa del porcentaje de prediccion de signo PPS,se obtuvo un mejor resultado final con el PPSmax, comose puede ver en el cuadro 2 en resumen de los estadisti-cos aumentando el promedio de 43.96% a 56.56% y susmaximos de 57.53% a 67.12%.

Cuadro 2: Estadısticos variable PPS y PPSmax

Estadısticos PPS PPSmaxPromedio 43.96086% 56.55577%Desv. estandar 4.750483% 4.005182%Coef. variacion 0.1080616% 0.07081827%Mın. 32.87671% 50.68493%Cuartil 25% 41.09589% 53.42466%Mediana 43.83562% 56.16438%Cuartil 75% 46.57534% 58.90411%Max. 57.53425% 67.12329%n 350 350

Este mejor resultado se observa claramente en el des-plazamiento hacia la derecha de la distribucion del PPSen figura 4 a) al PPSmax en figura 4 b).

dens

ity

35 40 45 50 55

0.00

0.02

0.04

0.06

0.08

0.10

0.12

dens

ity

50 55 60 65

0.00

0.02

0.04

0.06

0.08

0.10

0.12

a) b)

Figura 4: a) Distribucion de PPS, b) Distribucion dePPSmax

4.3. Rentabilidad

Los resultados en rentabilidad de los modelos evaluadosde acuerdo a cuadro 3, promedio de 3.43%, una desviacionestandar 2.3%, un mınimo de 0.007% y un maximo de10.75% de los 350 modelos evaluados.

Cuadro 3: Estadısticos variable Rentabilidad

Estadısticos valorPromedio 3.429396%Desv. estandar 2.297682%Coef. variacion 0.6699961%Mın. 0.007107316%Cuartil 25% 1.71698%Mediana 3.09524%Cuartil 75% 4.813917%Max. 10.74574%n 350

En la figura 5 a) se muestran graficamente los cuarti-les y en figura 5 b) la distribucion de las rentabilidadesobtenidas sesgada a la izquierda.

●●

02

46

810

Ren

t

0 2 4 6 8 100.

000.

050.

100.

15

dens

ity

a) b)

Figura 5: a) Boxplot de rentabilidad, b) Distribucion derentabilidad, todos los modelos evaluados

4.4. Mapa de resultados por generacion

En la Figura 6 se muestran los resultados obtenidos delos diez mejores modelos en las 17 generaciones, se indica:la capacidad de acierto y la rentabilidad obtenida, en quegeneracion surge, cuantas y en cuales generaciones perma-nece. Observando esta figura, se tiene que desde la decimocuarta generacion los 8 mejores modelos se mantienen has-ta la 17o generacion.

5. Conclusiones

La aplicacion de algoritmos geneticos a los modelos deprediccion del precio de Cu, efectivamente permitio obte-ner un mejor modelo [1011][0111][0011] con un PPS maxi-mo de un 67,12% y una rentabilidad 9,66%, versus unarentabilidad Buy and Hold del -2,0% en 73 dıas para in-version entre el 19 de mayo de 2014 y el 29 de agosto de2014.

Raúl Carrasco, Ismael Soto, Pablo Adasme, Miguel Alfaro, Manuel Vargas

- 410 -

Page 7: Pronósticos de Precios Del Cobre Usando Algoritmos Genéticos

Modelo PPS Rent Fitness 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17[1011][0111][0011] 67,12% 9,66% 34,77% X X X X X[1001][0111][0011] 67,12% 7,52% 34,50% X X X X X[1101][0111][0010] 65,75% 10,07% 34,14% X X X X X X[1100][1101][1111] 65,75% 8,30% 33,91% X X X X X X X X X X X X X X[0001][1110][0011] 65,75% 8,05% 33,88% X X X X X X[0111][1111][0010] 65,75% 5,40% 33,55% X X X X X X X X[0001][1111][0011] 64,38% 10,75% 33,53% X X X X[1001][0111][0010] 64,38% 10,01% 33,44% X X X X X X X X X X X X[1001][0011][0011] 64,38% 9,83% 33,42% X[0111][1111][0011] 64,38% 9,37% 33,36% X X X X X X[0110][1111][1111] 64,38% 9,17% 33,34% X X X X X X[1111][0111][1010] 64,38% 8,32% 33,23% X X X X X X X[1101][1010][0111] 64,38% 7,68% 33,15% X X X X X X X X[1001][1010][0111] 64,38% 7,48% 33,13% X X X X X X X X X[0110][1111][0011] 64,38% 6,83% 33,05% X[1101][0011][0110] 64,38% 6,31% 32,98% X X X X X X[1110][0111][0011] 63,01% 8,49% 32,57% X X[1001][1011][1110] 63,01% 7,18% 32,40% X X[0101][1110][1110] 63,01% 6,45% 32,31% X X X[1100][1111][1110] 63,01% 5,91% 32,25% X[0110][1111][1110] 63,01% 5,19% 32,16% X[1101][1111][1110] 63,01% 3,69% 31,97% X X X X[1001][0111][1010] 61,64% 7,56% 31,77% X X X X X X[1001][1010][0110] 61,64% 7,50% 31,76% X X X X[1101][1010][0110] 61,64% 7,40% 31,75% X X X X[1101][0100][1011] 61,64% 5,95% 31,57% X X X[1001][0100][1011] 61,64% 5,43% 31,50% X X X X[1001][1011][0110] 60,27% 9,36% 31,31% X X X X[1101][1000][0011] 60,27% 6,88% 31,00% X[1101][0000][1011] 60,27% 6,88% 31,00% X X X X[1000][1111][1101] 60,27% 6,51% 30,95% X X X[1001][1000][0111] 60,27% 5,58% 30,83% X X X[1101][1000][0111] 60,27% 3,75% 30,61% X[1000][0101][1011] 58,90% 6,34% 30,24% X[1000][1111][1111] 58,90% 3,29% 29,86% X[1000][0111][1010] 58,90% 3,00% 29,83% X X X[1100][1011][0110] 57,53% 5,26% 29,42% X[1000][1011][0110] 57,53% 4,55% 29,34% X[1100][1001][0011] 57,53% 4,23% 29,30% X X[1000][1101][1101] 57,53% 3,82% 29,24% X X[0000][1111][0001] 56,16% 2,44% 28,39% X[1101][1001][0101] 56,16% 1,19% 28,23% X[0010][0101][0111] 54,79% 5,32% 28,06% X[0001][0001][0011] 54,79% 4,67% 27,98% X[0100][1011][0110] 54,79% 4,11% 27,91% X

Generación

Figura 6: Mapa de resultados por generacion

Se mejoraron los resultados en casi 10 puntos (de57,53% a 67,12%) al incorporar, como parte del mode-lo, el PPSmax otorgado en la ecuacion 8.

Los modelos construidos a partir de algoritmos geneti-cos presentaron una capacidad de prediccion estadıstica-mente significativa, como fue demostrado por los resul-tados del test de acierto direccional de Pesaran & Tim-mermann. A su vez, estos modelos obtuvieron la mayorrentabilidad acumulada sobre el periodo de evaluacion.

Agradecimientos

Los autores agradecen el apoyo financiero proporcio-nado por los proyectos “Center for Multidisciplinary Re-search on Signal Processing” (CONICYT/ACT1120 Pro-ject) y USACH/DICYT 061413SG Project.

Referencias

[1] J. H. Holland, Adaptation in natural and artificialsystems: an introductory analysis with applications tobiology, control, and artificial intelligence. Universityof Michigan Press, 1975.

[2] C.-M. Hsu, “A hybrid procedure for stock price pre-diction by integrating self-organizing map and gene-tic programming,” Expert Systems with Applications,vol. 38, pp. 14026–14036, May 2011.

[3] M. Guerino, Tecnicas avanzadas para la prediccionde la variacion de IFN. Tesis para optar al grado demagıster en finanzas, Universidad de Chile, 2006.

[4] V. Guerrero, Analisis estadıstico de series de tiempoeconomicas. Mexico, D.F.: International Thomson,2a. ed., 2003.

[5] A. Parisi, F. Parisi, and D. Dıaz, “Forecasting goldprice changes: Rolling and recursive neural networkmodels,” Journal of Multinational Financial Mana-gement, vol. 18, pp. 477–487, Dec. 2008.

[6] A. Parisi, F. Parisi, and E. Cornejo, “Algoritmosgeneticos y modelos multivariados recursivos en laprediccion de ındices bursatiles de america del nor-te: IPC, TSE, NASDAQ y DJI,” Fondo de CulturaEconomica, vol. 71, no. 284(4), pp. 789–809, 2004.

[7] M. H. Pesaran and A. Timmermann, “A Simple Non-parametric Test of Predictive Performance,” Journalof Business & Economic Statistics, vol. 10, no. 4,pp. 461–465, 1992.

[8] S. Anatolyen and A. Gerko, “A Trading Approachto Testing for Predictability,” Journal of Business &Economic Statistics, vol. 23, no. 4, pp. 455–461, 2005.

[9] I. Garcıa, L. Trigo, S. Costanzo, and E. ter Horst,“Procesos gaussianos en la prediccion de las fluc-tuaciones de la economıa mexicana,” El TrimestreEconomico, vol. 77, no. 3, pp. 585–603, 2010.

[10] L. Trigo and S. Costanzo, “Redes neuronales en laprediccion de las fluctuaciones de la economıa a par-tir del movimiento de los mercados de capitales,” ElTrimestre Economico, vol. 74, no. 74, pp. 415–440,2007.

[11] A. Marczyk, “Algoritmos geneticos y computacionevolutiva,” Departamento de Informatica, Universi-dad de Colorado, 2004.

Pronósticos de precios del cobre usando algoritmos genéticos

- 411 -