Teoría de Cópulas Aplicada a La Predicción

download Teoría de Cópulas Aplicada a La Predicción

of 325

Transcript of Teoría de Cópulas Aplicada a La Predicción

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    1/324

     

    UNIVERSIDAD COMPLUTENSE DE MADRID

    FACULTAD DE CIENCIAS MATEMÁTICASDepartamento de Estadística e Investigación Operativa

    TEORÍA DE CÓPULAS APLICADA A LA PREDICCIÓN

    MEMORIA PARA OPTAR AL GRADO DE DOCTOR

    PRESENTADA POR

    Daniel Vélez Serrano

    Bajo la dirección del doctor:

    Vicente Quesada Paloma

    Madrid, 2007 

    ISBN: 978-84-669-3134-2

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    2/324

    UNIVERSIDAD COMPLUTENSE DE MADRID

    FACULTAD DE CIENCIAS MATEMÁTICAS

    DEPARTAMENTO DE ESTADÍSTICA E INVESTIGACIÓN OPERATIVA

    TEORÍA DE CÓPULAS APLICADA A LA PREDICCIÓN

    Daniel Vélez Serrano

    Noviembre 2006 

    TESIS DOCTORAL

     

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    3/324

      - 2 -

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    4/324

    D. VICENTE QUESADA ALO!A" CATEDR#TICO DEL DEARTA!ENTO DEESTADISTICA E INVESTI$ACI%N OERATIVA DE LA UNIVERSIDADCO!LUTENSE DE !ADRID

    CERTI&ICA'

    Que la presente memoria de título:

    TEOR(A DE C%ULAS ALICADA A LA REDICCI%N 

    Ha sido realizada bajo mi dirección por D. Daniel Vélez Serrano, licenciado enCiencias Matemticas, ! constitu!e su tesis para optar al "rado de Doctor enCiencias Matemticas.

    # para $ue conste, en cumplimiento de la le"islación %i"ente ! a los e&ectos oportunos,&irmo la presente en Madrid a '( de )o%iembre de '**+ 

      - 3 -

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    5/324

      - 4 -

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    6/324

    - I saw...I saw a city in the clouds.- Mmm. Friends you have there.- They were in pain.- It is the future you see.- Future? Will they die?

    oda closes his eyes and lowers his head.

    - !ifficult to see. Always in motion is the future...

    "T#$ $M%I&$ 'T&I($' )*+(,'cript adaptation y awrence (asdan and ei/h )rac0ett from a story y 1eor/e ucas

      - -

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    7/324

      - -

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    8/324

    Agradecimientos

    Creo que una tesis doctoral no es sólo el resultado del esfuerzo compartido entre el director de tesis y su alumno.

    Al menos en mi caso, debo confesar que esta tesis nunca hubiera visto la luz de no haber sido por una relación de

     personas a las que considero tengo mucho que agradecer.

    En primer lugar, me gustaría citar a un compañero de mi primer trabao llamado !gnacio Arbu"s, posiblemente la

     persona m#s inteligente con la que he trabaado. $ue su amplio dominio de la materia, su pasión por las matem#ticas y

    la facilidad con la que era capaz de transmitir sus conocimientos, las que me motivaron a empezar los cursos de

     postgrado para meorar mi grado de formación. %erdí la pista a este asturiano cuando decidió dear la empresa en la que

    trabaaba conmigo, para empezar a prepararse las oposiciones del !&E y lo 'ltimo que s" de "l es que las aprobó, algo

    de lo que nunca tuve duda alguna. En cualquier caso, si alguna ves lees estas líneas, (gracias &acho).

    En segundo lugar quería hacer mención a mi director de tesis, *icente +uesada, dado que fue "l quien, una vez que

    hube conseguido la suficiencia investigadora, me animó a continuar el doctorado y a hacer esta tesis. %ara mi, supuso

    todo un reto emprender este camino estando ya bien situado laboralmente con casi cinco años de eperiencia, y a

    sabiendas de las dificultades y el sacrificio que con seguridad implicaría un compromiso de este tipo. Entre las cosas

    que quiero agradecerle me gustaría destacar el hecho de que haya sabido siempre proponerme temas de investigación

    tan relacionados con los proyectos de an#lisis que desarrollo y a la vez tan innovadores y desconocidos en el mundillo

    en el que me muevo. -ambi"n le agradezco no haberme presionado y haberme dado fleibilidad total a la hora de llevar

    esta tesis adelante, entendiendo las dificultades derivadas de compatibilizar dicha labor con mi trabao.

    A los doctores avier /artín y os" /aría 0arcía 1antesmases, me gustaría agradecer en primer lugar el hecho de que

    me pusieran en contacto con *icente para que me tutelase esta tesis. $ueron ellos adem#s, quienes me ofrecieron mi

     primer trabao como consultor matem#tico y les quiero agradecer la confianza que en mí depositaron desde el primer

    momento para participar y dirigir importantes proyectos de investigación. Entre ellos, guardo un especial recuerdo de

    los realizados para el Departamento de Aná!"!" # S!m$a%!&n de la compañía Ena'á". Agradezco a la responsable del

    departamento 2aura /arín y a todo su equipo la ayuda prestada, de forma especial a Ana 3el"n 0arcía que me ha

    echado una mano con la provisión de datos utilizados para el desarrollo de las aplicaciones pr#cticas que aquí se

    eponen y que adem#s, me ha transmitido muchos #nimos a lo largo de estos 'ltimos años.

    -ambi"n tengo mucho que agradecer a mi círculo de amistades por los buenos ratos que hemos compartido y que espero

    seguir compartiendo. 0racias por sus #nimos constantes a 2uis avier $errero, mi primer compañero de fatigas en la

    carrera, que siempre estuvo ahí. 0racias tambi"n a 1andra /artín, a Amanda 1anz, a os" 2uis &avarro, a os" /aría

    %icado, a /iguel 4edondo 5de manera especial por su ayuda y por sus conseos6, a 7avid 3ueno, a $rancisco

    $ern#ndez, a 7avid 0uti"rrez, a Carlos 4uíz, a %rudencio 8reña, a 9scar *illanueva y a muchos otros que seguro deo

    de nombrar, quienes, a trav"s de su compañía y afecto, han aportado su granito de arena en esta tesis.

    0racias a los padres de mi novia, -om#s y Charo, por sus conseos, su atención, y por esas agradables meriendas y

    cenas en las que nos hemos reunido para ver alguna película o partido. 4atitos de conversación totalmente necesarios.

      - 5 -

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    9/324

    $inalmente, quiero hacer mención especial a mi familia. 7e forma general gracias a todos por sus #nimos y por haberme

    entendido cuando ni yo mismo era capaz de hacerlo.

    7ebo agradecerle a mi hermano os" todas sus enseñanzas de programación, sus charlas matem#ticas y científicas, y

    todos sus conseos a la hora de dar formato para presentar esta tesis. Adem#s considero que, el hecho de quecomenz#ramos al mismo tiempo la andadura en una tesis doctoral y de que nos hayamos motivado mutuamente durante

    todos estos años a seguir adelante, ha sido un factor determinante para el logro de nuestros obetivos.

    +uiero agradecer a mi abuelo %aco las 6partiditas de tute7 espor#dicas que han salpicado muchas de mis tardes y que

    me han ayudado a evadirme en momentos de bastante agobio y tensión. 0racias abuelo por tu inter"s declaradamente

    sincero por todas y cada una de mis labores profesionales.

    -ambi"n quería recordar a mi padre que sólo pudo verme empezar este largo camino aunque muy probablemente se

    marchó con la certeza de que intentaría recorrerlo hasta el final. Creo que debo agradecerle a "l 5o a sus genes6 una parte

    importante de ese car#cter constante y de esa cabezonería que considero imprescindibles para haber afrontado estedesafío. Cualquiera que sea el rinconcito de cielo en el que est"s, (gracias pap#).

    $inalmente quiero dar las gracias a las tres mueres m#s importantes en mi vida y a las que quiero dedicar esta tesis.

    A mi madre que ha sido la que creo que ha aguantado m#s que nadie mis cambios de humor, ha sabido convivir con

    montañas de papeles ininteligibles sobre mi escritorio y a'n así, me ha seguido animando hasta el 'ltimo momento.

    A mi chica, 2eticia, por sus #nimos, por su apoyo, por haberme sabido escuchar y sobre todo, por haber tenido la

     paciencia suficiente para seguir conmigo despu"s de un 'ltimo año 5o dos, o quiz# tres6 especialmente duro en el que tal

    vez haya estado un :poquito; m#s volcado en mis intereses profesionales que personales.

    %ara terminar quiero dar las gracias a mi abuela Consolación que en paz descanse, quien siempre mostró de formaincondicional una confianza ciega en que terminaría consiguiendo cuanto me propusiera. -al vez llevaras razón, abuela.

      - 8 -

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    10/324

    Prólogo

    7icen que el saber no ocupa lugar. 1i el saber es sinónimo de eperiencia tal vez no debiera haber duda alguna al

    respecto. 1i en cambio ese saber es refleo de la formación cultural de una persona, los límites podrían venir marcados

     por su af#n de conocimiento pero tambi"n por su memoria. Estos mismos límites serían aplicables a cualquier individuo

     para el que :saber; no fuera otra cosa que la capacidad para retener en su cabeza un volumen determinado de

    información sin importar que "sta estuviese referida a los n'meros de la guía telefónica o a las palabras del diccionario

    enciclop"dico. En cualquier caso, en el mundo empresarial, la frase se nos antoa aprovechable en uno u otro sentido.

    1eg'n van pasando los días, el ordenador personal permite almacenar m#s información, m#s saber, en menos espacio.

    Eisten grandes bases de datos que recogen históricos de una compañía al nivel de detalle que se desee. 1i bien eisten

    restricciones impuestas en función de la memoria de los equipos, la cantidad de datos recogidos suele ser suficiente para

     plantear estudios de mercado y tomar decisiones que puedan meorar la evolución del negocio.

    %uede ser que este saber no eista. 1ería el caso, por eemplo, de una compañía nueva en cualquiera de los sectores

    5telecomunicaciones, industria, banca, seguros, etc.6 que no tuviese ning'n dato almacenado sobre el que basar alg'n

    an#lisis específico. -ambi"n podría ser ilustrativo el eemplo de una compañía que quisiera lanzar un producto nuevo y

    no tuviera por tanto historia del mismo para poder conocer la respuesta que pudiera esperar tras una campaña comercial.

    8n tercer caso podría venir inducido por un cambio significativo de comportamiento que eperimentara el mercado

    haciendo inservible cualquier información almacenada. Es entonces cuando el saber del eperto de negocio, basado en

    la eperiencia de la que habl#bamos, uega un papel determinante siendo su opinión la que terminar# conduciendo a la

    toma de una decisión final.

    2a situación ideal se plantea cuando se combina la eperiencia del analista en un negocio determinado con unas

    circunstancias del mercado que hacen que los históricos de datos de la compañía resulten de un valor incuestionable.

    El saber del eperto se fusiona con el saber almacenado en sus equipos inform#ticos y esto le permite realizar una

     planificación de las acciones a emprender a corto, medio y largo plazo.

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    11/324

      - :; -

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    12/324

    Índice

    %rólogo................................................................................................................................................. ?

    @. !ntroducción....................................................................................................................................B@. Estado del arte..........................................................................................................................@.D /"todos gr#ficos............................................................................................ HFD.B.F /"todo F> Aproimación analítica de los m"todos gr#ficos............................................HHD.B.H /"todo H> Criterio de información de AGaiGe 5A!C6...................................................... HHD.B.B /"todo B> Contrastes de bondad de auste de una cópula............................................... HBD.B. /"todo > Calidad de las predicciones que proporciona una cópula...............................H

    F. /etodologías para la construcción de funciones cópula................................................................H?F. /"todo de inversión................................................................................................................ H?F.D /"todos geom"tricos...............................................................................................................B@

    F.D. Cópulas singulares con soporte conocido........................................................................B@F.D.D Cópulas construidas como 1uma

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    13/324

    H.D.F /"todo de interpolación mediante polinomios c'bicos de Jermite................................?H.D.F. Condiciones a imponer para que la función construida por interpolación c'bicaverifique las propiedades frontera de las cópulas.................................................................KDH.D.F.D Condiciones a imponer para que la función construida por interpolación c'bicaverifique la propiedad DIcreciente de las cópulas................................................................ KF

    H.D.F.D. Condición a imponer para que una superficie interpoladora de $erguson sea DI

    creciente...........................................................................................................................KHH.D.F.D.D Condición a imponer para que una superficie interpoladora de Jermite sea DIcreciente...........................................................................................................................

    H.D.F.F Condiciones para construir cópulas por interpolación c'bica..................................?BH.D.H Algunas observaciones sobre las cópulas interpoladoras...............................................@@

    B. 1imulación de valores para las cópulas construidas por interpolación........................................ @BB. 1imulación de valores para algunas familias de cópulas [email protected] 1imulación de valores para la cópula construida por interpolación bilineal......................... @KB.F 1imulación de valores para la cópula construida por interpolación c'[email protected] 1imulación de valores para la cópula construida por interpolación mediante polinomios de

    3ernstein......................................................................................................................................@?

    . Empleo de funciones cópula para predecir .................................................................................... Empleo de funciones cópula como modelos de función de transferencia..............................D Empleo de funciones cópula para eplicar dependencia din#mica........................................

    K. Aplicación pr#ctica> %redicción de la demanda de gas natural.................................................... ?K. !ntroducción...........................................................................................................................?K.D %redicción de la demanda de gas natural a medio plazo........................................................DD

    K.D. !ntroducción al problema............................................................................................... DDK.D.D %lanteamiento de la solución..........................................................................................DFK.D.F $A1E !> Construcción de un histórico de demanda en condiciones normales detemperatura..............................................................................................................................DKK.D.H $A1E !!> Construcción de un modelo autorregresivo para hacer una predicción a medio

     plazo........................................................................................................................................ HHK.D.H. !dentificación del patrón estacional semanal..........................................................HBK.D.H.D !dentificación de la variabilidad............................................................................. H?K.D.H.F !dentificación del ciclo anual de la serie................................................................ BF

    K.D.H.F. 0eneración de la variable Ciclo a partir de Lavelets..................................... BHK.D.H.F.D 0eneración de la variable Ciclo a partir de splines de regresión....................B?K.D.H.F.F Comparativa entre los m"todos planteados para la generación de la variable

    Ciclo...............................................................................................................................HK.D.B $A1E !!!> 1imulación del valor esperado de la demanda en situaciones climatológicasetremas..................................................................................................................................

    K.D.B. 0eneración de distribuciones marginales...............................................................K@K.D.B.D 7eterminación de una cópula a trav"s del criterio de selección basado en elestadístico de %earson.........................................................................................................KK.D.B.F Construcción de cópulas que optimizan el estadístico de %earson.........................K

    K.D.B.F. Construcción de una cópula por interpolación bilineal.................................. K?K.D.B.F.D Construcción de una cópula por interpolación c'bica....................................K.D.B.F.F Construcción de una cópula por interpolación mediante polinomios de3ernstein........................................................................................................................H

    K.D.B.H Comparativa de resultados entre las diferentes cópulas candidatas....................... B

      - :2 -

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    14/324

    K.F %redicción de la demanda de gas natural a corto plazo......................................................... ?K.F. !ntroducción al problema............................................................................................... ?K.F.D %lanteamiento de la solución..........................................................................................??

    K.F.D. Auste de una serie mediante un A4!/A complementado con modelos de funciónde transferencia...................................................................................................................D@K.F.D.D Auste de una serie mediante un A4!/A complementado con un algoritmo basado

    en funciones cópula............................................................................................................DK

    . Conclusiones.................................................................................................................................DF?

    ?. $uturos trabaos............................................................................................................................ DHF

    A&EM Algunas familias de cópulas......................................................................................DHBA!. $amilias no param"tricas................................................................................................ DHB

    A!.. $amilias de dependencia etrema........................................................................... DHB

    A!..D 7emostración del lema H.D.......................................................................................DBB

    A&EM< !!!> 7emostración del lema H.F..................................................................................... DBK

    A&EM< !*> 7emostración del lema H.H.....................................................................................D

    A&EM< *> 7emostración del lema H.B...................................................................................... DK?

    A&EM< *!> 7emostración del lema H......................................................................................DF

    A&EM< *!!> 7emostración del teorema H................................................................................D??

    A&EM< *!!!> Contrastes de bondad de auste a una distribución dada......................................F@K

    A&EM< !M> Contraste de NrusGalIOallis...................................................................................F@?

    A&EM< M> An#lisis mediante Lavelets......................................................................................F

    A&EM< M!> An#lisis mediante splines de regresión...................................................................FB

    3ibliografía.......................................................................................................................................FD

      - :3 -

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    15/324

      - :4 -

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    16/324

    0 Introd!cción

    8na de las principales funciones de una empresa transportista de gas es diseñar un plan de operaciones a trav"s del cual

     pueda garantizar la continuidad y seguridad del suministro de gas natural y la correcta coordinación entre los puntos de

    acceso, los almacenamientos, el transporte y la distribución teniendo en cuenta las necesidades y características de cada

    uno de sus tipos de clientes tanto dentro del #mbito industrial como del dom"stico. En nuestro país, Ena'á"  es la

     principal empresa transportista de gas y entre sus activos, cuenta con K.BF Gm de gasoductos de alta presión, tres

     plantas de regasificación 53arcelona, Cartagena y Juelva6 y la propiedad o gestión de los almacenamientos de gas

    natural. 2a gestión del plan de operaciones es una tarea muy complea que se realiza no sólo en función de los recursos

    de gas disponibles sino tambi"n de la demanda prevista a abastecer y del cumplimiento de los compromisos

    contractuales tanto con las empresas suministradoras como con las distribuidoras y comercializadoras.

    2a aparición de las comercializadoras de gas ha tenido lugar a raíz de la reciente liberalización del mercado del gas en

    España 5desde Enero de D@@F6. 1eg'n la nueva normativa, un cliente no tiene porqu" mantenerse en el mercado

    regulado que se rige de acuerdo a las tarifas fiadas por el gobierno, sino que puede comprar directamente en dicho

    mercado, elegir una comercializadora a la que pague una tarifa de menor coste o establecer contratos bilaterales.

    El crecimiento del n'mero de comercializadoras, el incremento esperado del consumo y la capacidad limitada de la red

    de gasoductos, son factores a tener en cuenta a la hora de elaborar el plan de operaciones. 4esulta por ello

    imprescindible para el departamento encargado de su gestión, disponer de unas buenas herramientas de predicción de la

    demanda a distintos horizontes para poder adaptarse de manera adecuada a las necesidades de suministro a corto 5@

    días con detalle horario6 y medio 5IF años6 plazo. Cuanto mayor sea la bondad de las predicciones que proporcionen

    estos sistemas, m#s fielmente se ceñir#n a la realidad los programas y planes de gestión citados y por tanto m#s

     beneficiosos resultar#n los resultados de la operación.

    Eiste un amplio abanico de metodologías matem#ticas para el tratamiento de problemas de predicción de demanda de

    gas a corto y medio plazo. +ueremos observar que por lo general "stas t"cnicas son igualmente aplicables al sector

    el"ctrico y por ello no debe de etrañar que la literatura que nos ha servido de consulta haga referencia indistintamente a

    uno u otro sector. 2a diferencia fundamental radica en el periodo de influencia del factor meteorológico sobre la

    demanda, que abarca al invierno 5calefacción el"ctrica6 y al verano 5aparatos de aire acondicionado6 en el caso el"ctrico

    y sólo al invierno en el caso gasista. Esta circunstancia no afecta desde un punto de vista metodológico sino 'nicamentea la hora de definir las variables clim#ticas que participan en los modelos y es por ello que, aun cuando la eposición

    que hacemos en esta tesis esta centrada en el mercado gasista, ya hemos contrastado la validez de los m"todos que

     proponemos en uno y otro #mbito.

     Introducci

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    17/324

    0.) E*+a,o ,el ar+e

    1i bien como hemos dicho los m"todos de predicción que se manean en la actualidad son aplicables a datos de

    demanda referidos tanto al gas como a la electricidad, la utilización de ellos est# condicionada por el horizonte de

     predicción para el que se plantea el estudio.

    En el tratamiento a corto plazo se pretende obtener predicciones con detalle diario para un horizonte que suele depender

    del m#imo periodo para el que se disponga de una previsión fiable de los agentes climatológicos y que habitualmente

    oscila entre @ y B días. 7espu"s de haber trabaado durante m#s de tres años en problemas de predicción de demanda

    a corto plazo y haber contrastado la eficacia de diversas alternativas creemos que, por las características de este tipo de

    series, es la metodología (o)*+en,!n"  fundamentada en el empleo de modelos ARIMA, la que proporciona unos

    meores resultados 5v"ase por eemplo el estudio para la  )ritish 1as =orth Western que se epone en P$!4EA1-Q6.

    Estos modelos plantean a trav"s de una ecuación lineal 5aditiva en las variables6 la relación entre la demanda en uninstante de tiempo :t ;, el valor de la propia variable en instantes anteriores de tiempo 5parte A4! del modelo6 y el error

    que el modelo ha podido cometer en dichos instantes 5parte /A6. Es esta capacidad para corregirse en función de los

    errores de predicción m#s recientes la que los hace especialmente orientados para la predicción a corto plazo. A trav"s

    de una ecuación autorregresiva el modelo reflea la tendencia, variabilidad y estacionalidad de los datos, captura

    mediante un :an>lisis de intervenci

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    18/324

    Con el fin de meorar los altos costes computacionales que conlleva la implementación de los sistemas difusos, algunos

    autores proponen un modelo híbrido denominado r ed ne$rona d!-$"a que b#sicamente consiste en alimentar con una

     base de reglas difusas a una red neuronal. En este conteto de las redes de neuronas y los sistemas difusos aplicados a la

     predicción de la demanda energ"tica podemos citar por eemplo los artículos de P2=M8EQ , P/8JA!Q o

    P*ACJ8&-AQ.

    Cuando el n'mero de variables eplicativas crece de forma desmesurada, las posibilidades de sobreauste de los

    modelos neuronales aumentan a la vez que disminuye su potencia predictiva. %ara resolver este problema eisten

    t"cnicas de Inte!'en%!a Art!-!%!a como son los a'or!tmo" 'en.t!%o" o los "!"tema" e)perto", de cuya aplicación al

     problema de predicción de la demanda a corto plazo podemos encontrar una breve descripción en P%E4OJ!Q.

    4especto del tratamiento a medio plazo, encontramos tambi"n diferentes propuestas de modelización para la predicción

    con detalle mensual o diario en función del obetivo que se persiga. Así por eemplo seg'n se cita en P/EJ4AQ, para el

    tratamiento mensual acostumbran a utilizarse modeo" e%onom.tr!%o"  planteados a trav"s de una relación de

    ecuaciones en las que la demanda se epresa como una función de factores económicos tales como la población, el

    ingreso per c#pita, el precio de los distintos medios de combustible alternativos a aqu"l que se predice, etc.

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    19/324

    obtener las distribuciones de consumos diarios a partir de las distribuciones de consumo mensuales.

    En esta tesis proponemos nuevos m"todos para predecir a corto y medio plazo la demanda de gas, y por etensión la

    demanda el"ctrica, conugando algunas de las t"cnicas citadas con el empleo de una clase de funciones denominadas

    %&p$a". 2as posibilidades de este tipo de funciones en el #mbito de la simulación las hacen muy atractivas para abordar problemas de predicción a medio plazo y hemos considerado que es "sta una razón de peso para considerar la

    metodología que proponemos como una alternativa m#s de predicción a dicho horizonte, sin intención de establecer una

    comparativa rigurosa con los resultados a los que puedan conducir algunas de las t"cnicas que acabamos de enumerar.

    En cuanto al corto plazo se refiere, las funciones cópula suelen ser utilizadas para predecir series de car#cter financiero

    suetos a una fuerte volatilidad que en el conteto de la demanda energ"tica acostumbra a traducirse en la predicción de

    los precios del gas ySo la electricidad 5v"ase por eemplo PNE--2E4Q6. %or ello, dado que su empleo no parece estar tan

    orientado a la precisión que eige la predicción puntual de la demanda energ"tica para un día determinado y teniendo en

    cuenta la amplia variedad de m"todos que de antemano eiste para tratar el problema, hemos estimado oportuno

    contrastar con alguno de ellos, los resultados a los que conduce un algoritmo que proponemos basado en su utilización.

    7e esta forma pretendemos hacernos una idea de las posibilidades que pueden llegar a ofrecer estas funciones en un

    estudio predictivo a corto plazo y sentar las bases de futuras líneas de investigación. En concreto, hemos decidido

    comparar los resultados conseguidos con dicho algoritmo con aquellos proporcionados por una solución de eficacia

    contrastada en el tratamiento de este tipo de series. 2a solución a la que hacemos referencia y que tambi"n hemos

    mencionado en este capítulo consiste en aplicar la metodología 3oIenGins basada en el empleo de modelos A4!/A

    complementado con modelos de función de transferencia para reflear el efecto de las variables de temperatura.

    0.2 Ob-e+ivo*

    El obetivo fundamental que persigue esta tesis es definir una metodología que automatice el proceso que conlleva

    realizar una predicción diaria a medio plazo 5ID años6 para una serie de demanda energ"tica y, a trav"s de ella, conocer

    el :pico; que se puede presentar durante dicho horizonte. A tal fin hemos utilizado un histórico de datos que reflea la

    demanda de gas natural en /adrid así como las temperaturas m#imas y mínimas registradas en algunos observatorios

    de la provincia. Estos datos han sido proporcionados por el Departamento de Aná!"!" # S!m$a%!&n de la compañía

    Enag#s.

    El m"todo que proponemos sugiere como punto de partida realizar una predicción diaria de la demanda para los dos

     próimos años en condiciones normales de temperatura siendo así posible conocer, bao esta hipótesis de normalidad, el

    valor m#imo que se puede esperar durante un periodo concreto 5un invierno, un año, etc.6. Este planteamiento inicial

    sigue en cierta medida las directrices marcadas por autores como En'e4 Gran'er4 M!t%3em # Ramanat3an 5?K?6 o

    Stanton # G$pta 5?@6 quienes consideran que una forma adecuada de abordar esta problem#tica es estimar la

    demanda  t  de un día gen"rico :t;, y posteriormente considerar el pico esperado para ella como el m>@t T t U .

    %ara hacer esta predicción inicial, establecemos qu" se entiende por condiciones clim#ticas normales y construimos a

     Introducci

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    20/324

     partir de un histórico diario de demanda de gas, aqu"l que hipot"ticamente se hubiera presentado en dichas condiciones.

    Así, a partir de un nuevo histórico cuyo comportamiento est# aislado de la influencia meteorológica, realizamos en una

    segunda fase, una predicción a dos años vista a trav"s de un modelo autorregresivo que incorpora entre sus variables

    eplicativas el patrón cíclico de la serie, la etrapolación del cual permite plantear dicha predicción. %ara la detección

    de este patrón cíclico hemos utilizado t"cnicas de suavizado de curvas como son el an#lisis mediante 5a1eet" y los

    "p!ne" de re're"!&n.

    En una tercera fase, aplicamos la Teor6a de C&p$a" para analizar la relación de dependencia eistente entre las

    desviaciones de los datos reales de demanda con respecto a los datos construidos en condiciones normales y las

    desviaciones entre los valores reales de temperatura y los supuestamente normales y, a partir de dicho an#lisis,

    simulamos el comportamiento que cabría esperar para la demanda en determinados escenarios t"rmicos. Esta es una de

    las características m#s innovadora que aporta esta metodología, el empleo de funciones cópula para analizar a fondo la

    relación demandaStemperatura, cuantificar la respuesta del consumo ante situaciones climatológicas especialmente

    adversas y dar un resultado basado, no en un 'nico valor esperado alrededor del cual se construye un intervalo de

    confianza sim"trico, sino en toda una distribución de valores sueta a posibles asimetrías y apuntamientos que permita

    valorar la probabilidad de que la demanda alcance ciertas cotas y evaluar el riesgo asociado a la toma de determinadas

    decisiones. Es precisamente esta propuesta de utilizar esta teoría en el #mbito de la predicción de la demanda energ"tica

    la que nos ha llevado a profundizar en las posibilidades que puede ofrecer y la que, en cierto modo, nos ha motivado a

    definir a esta tesis como una tesis sobre cópulas.

    +ueremos hacer hincapi" en que, en este conteto de la predicción del pico de demanda, no es tan importante conocer

    con eactitud el valor m#imo esperado para la demanda como la distribución de valores esperados que permita evaluar

    la probabilidad de que "ste se presente y el riesgo que puede conllevar.

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    21/324

    general cuando se trabaa con funciones cópula es determinar aquella familia que meor se auste a la muestra de datos

    dada e identifique de forma adecuada la relación de dependencia en ella implícita. Jemos utilizado un criterio ya

    eistente, basado en someter a un contraste de bondad de auste a una relación de cópulas candidatas 5v"ase P7

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    22/324

    0. La +e*i*

    Esta tesis se encuadra dentro de los obetivos que persigue el programa de doctorado del Departamento de E"tad6"t!%a

    e In1e"t!'a%!&n Operat!1a de a Fa%$tad de Matemát!%a" de a Un!1er"!dad Comp$ten"e de Madr!d, cuya

    finalidad es potenciar la investigación de metodologías y resultados teóricos orientados a dar solución a un problema

     pr#ctico.

    2a eposición que realizamos est# estructurada en dos grandes bloques, uno puramente teórico en el que eponemos

    algunas nociones de la teoría de cópulas que consideramos b#sicas para el meor entendimiento del m"todo de

    construcción de cópulas que planteamos y otro pr#ctico en el que abordamos la predicción de la demanda de gas a corto

    y medio plazo mediante el empleo de este tipo de funciones.

    El bloque teórico se compone de un total de capítulos de los cuales damos a continuación una breve descripción>

     – En el primero de los capítulos, se hace una presentación de las funciones cópula, d#ndose su definición,

    haci"ndose mención de los diferentes tipos y familias que eisten y cit#ndose las diferentes versiones del

    teorema de 1Glar, resultado que supone uno de los pilares sobre el cual se construye esta teoría.

     – El segundo capítulo enumera diversas t"cnicas eistentes que permiten seleccionar la familia de cópulas que

    meor se adapta a la relación de las variables que intervienen en un an#lisis y dentro de la familia seleccionada

    aqu"l miembro que se considera m#s adecuado para ello.

     – El tercer capítulo hace un repaso de los m"todos eistentes para la construcción de funciones cópula tanto

    desde la perspectiva geom"trica como desde la puramente analítica y, en conunción con el capítulo segundo,

    sirve de introducción al siguiente que constituye la aportación teórica fundamental de esta tesis.

     – En el capítulo cuarto se presenta una metodología para la generación de funciones cópula alternativa a las

    epuestas en el anterior. 1e basa en la interpolación polinómica del dominio de definición de aquella función

    subcópula que optimiza el valor del estadístico de %earson. 1eg'n se eplica en el capítulo segundo, este

    estadístico es utilizado por algunos autores como criterio de evaluación de la bondad del auste de las

    funciones cópula a los datos.

    %ara mostrar cómo la construcción de cópulas a partir de subcópulas se complica conforme crece el orden de

    los polinomios interpoladores comparamos, a modo de eemplo, la interpolación bilineal 5realizada mediante

     polinomios de orden 6 con la c'bica, llevada a cabo a trav"s de po!nom!o" de 7erm!te. En este 'ltimo caso,

    se presenta un amplio desarrollo, a raíz del cual se obtienen restricciones a imponer sobre dichos polinomios

     para que el resultado de la interpolación sea una función cópula. Adem#s, se presenta otro m"todo de

     Introducci

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    23/324

    aproimación mediante po!nom!o" de  (ern"te!n  el cual conduce a superficies que, si bien no interpolan

    eactamente el dominio de definición de la subcópula de partida, dan lugar a cópulas de aspecto m#s suave y

    apropiado para ser utilizadas con fines predictivos.

     – El quinto capítulo eplica la utilidad de las funciones cópula para realizar predicciones a medio plazo. Cuando

    el horizonte de predicción se prolonga, es difícil disponer de un valor fiable para todos y cada uno de los

    agentes eplicativos que intervienen en el sistema. En tales circunstancias, el analista acostumbra a plantear

    diferentes escenarios configurados por hipot"ticos valores de estos factores y, de acuerdo a "stos, realiza una

    simulación de la evolución del sistema. Eplicaremos cómo la determinación de una función cópula que se

    auste bien a los datos permite obtener una buena representación de la función de densidad de la variable a

     predecir condicionada a las eplicativas 5densidad cópula condicionada6. 2a simulación de la evolución de

    nuestro sistema se puede establecer a partir de la simulación de valores de la cópula condicionada.

     – $inalmente el seto capítulo detalla una posible forma de aplicar este tipo de funciones para realizar

     predicciones a corto plazo dada una serie temporal. 1e argumentan los posibles problemas que pueden surgir

    con el empleo de este tipo de funciones cuando las variables sobre las que se definen presentan alg'n tipo de

    dependencia temporal y la posibilidad de utilizarlas como m"todo alternativo al empleo de modelos de función

    de transferencia para reflear la influencia de una variable eplicativa en aquella que se desea predecir.

    %or otra parte, el bloque pr#ctico se compone de un 'nico capítulo 5el s"ptimo6 que consta de dos apartados orientados

    respectivamente a la utilización de las funciones cópula para la predicción a corto y a medio plazo>

     – El primero de los apartados trata la predicción a medio plazo 5entre o D años6 con detalle diario. %ara una

    compañía del sector gasista el conocimiento del :pico; diario que puede esperarse para el invierno del año

    siguiente le permite evaluar si la capacidad del gasoducto es suficiente para soportar la demanda de una

    determinada población y, en función de ello, plantear una posible epansión de su infraestructura.

    1i bien en esta tesis analizamos como hemos dicho, una serie de demanda de gas, la metodología seríaigualmente aplicable a una de consumo el"ctrico. %ara una compañía de este sector, el conocimiento del :pico;

    diario de demanda le permite realizar planes para que sus sistemas est"n preparados ante posibles sobrecargas

    de la red. En las provincias del norte peninsular, este valor punta suele darse en invierno como resultado de una

    ola de frío que provoca un efecto de saturación de los sistemas de calefacción el"ctrica. En la zona sur, el

     problema est# m#s asociado a la estación del verano derivado de los aires c#lidos procedentes del 1#hara

    traducidos en un preocupante incremento de la venta de aparatos de aire acondicionado.

    El m"todo que se detalla permite, en una primera fase, la obtención de un patrón de comportamiento diario de

    la demanda a dos años vista en condiciones normales de temperatura 5patrón clim#tico6. En una fase posterior,

    se describe cómo aislar el histórico de datos de demanda del efecto clim#tico para llevar a cabo la predicción a

     Introducci

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    24/324

    tan largo horizonte 5de FB a DVFB días6 a partir de un modelo autorregresivo y de las componentes de baa

    frecuencia resultantes de la descomposición de la serie de demanda mediante funciones Lavelets o splines de

    regresión. En una fase final, las funciones cópula van a permitir simular el crecimiento o decrecimiento

    esperado de la demanda supuesto un incremento del valor de los agentes climatológicos respecto del patrón

    est#ndar establecido. 2a relación entre la demanda y la temperatura no es lineal y adem#s presenta un

    comportamiento difícil de capturar en situaciones etremas. Eisten familias de cópulas que hacen "nfasis en

    la relación entre sucesos :cola; y que, como veremos, se austan bastante bien a este tipo de situaciones.

    -ambi"n veremos que las cópulas obtenidas por la metodología de construcción que se describe en el capítulo

    cuarto del bloque teórico, pueden ser una buena aproimación a estas familias.

     – El segundo de los apartados trata la predicción a corto plazo de demanda de gas.

    2os programas de una empresa responsable de la gestión de las redes de transporte de gas se establecen enfunción de los recursos disponibles 5yacimientos6, la demanda prevista que debe ser abastecida, el

    cumplimiento de compromisos contractuales con empresas suministradoras y comercializadoras, etc.

    2a dificultad para mantener la calidad del gas 5presión6 dentro del gasoducto ustifica la necesidad de que la

     predicción no eceda en demasía el dato real de demanda> el gas calienta menos y, en consecuencia se necesita

    m#s, con la consiguiente p"rdida económica para la compañía. 1i por el contrario el dato predicho se sit'a

    significativamente por debao del real, los clientes industriales podrían ver reducidas sus tasas de producción y

    los dom"sticos plantearse el empleo de otro combustible como forma de calefacción para su hogar.

    2as principales dificultades de modelización surgen a la hora de realizar una predicción condicionada a unas

    circunstancias clim#ticas especialmente desfavorables, m#s a'n cuando "stas se presentan de manera brusca e

    inesperada 5olas de frío en /arzo6. Como ya hemos comentado, entre las diferentes t"cnicas que pueden ser

    contrastadas, los modelos A4!/A con funciones de transferencia para reflear el efecto de las temperaturas

    constituyen tal vez la alternativa que proporciona unos meores resultados. 2a idea que proponemos en su

    lugar, sugerida como veremos por la manera de proceder en el auste a medio plazo, consiste en reemplazar las

    funciones de transferencia por funciones cópula que cuantifiquen de manera diferente la relación de

    dependencia en condiciones etremas 5pico de demanda W ola de frío6.

    2os resultados de este bloque pr#ctico han sido obtenidos a partir de una relación de programas implementados

    fundamentalmente con el softLare '*'  dada las buenas y contrastadas referencias que de "l encontramos para

    el desarrollo de proyectos de !ata Minin/ . En concreto, los módulos utilizados de esta herramienta han sido>

     – '*'A)*'$ .I que soporta el lenguae de programación de la herramienta.

     – '*'A1&*%# .I para todo lo referido al aspecto visual y de representación gr#fica de resultados.

     Introducci

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    25/324

     – '*'A'T*T .I para la obtención de estadísticas b#sicas, realización de contrastes de hipótesis y

     planteamiento de modelos de regresión.

     – '*'A$T' .I para la implementación de modelos A4!/A.

     – '*'AB&.I para la obtención de soluciones a problemas de programación matem#tica 5lineal y no

    lineal, continua y entera6.

    -ambi"n se ha utilizado el paquete estadístico '%C'AW*D$$T'   para la construcción de funciones

    Lavelets. 1i bien "stas pueden tambi"n ser empleadas disponiendo del correspondiente módulo !/2 de '*' ,

    hemos considerado que es el softLare de '%C'  el que ofrece un mayor abanico de opciones asociadas a estetipo de funciones ampliando de manera notable sus posibilidades de uso. 7e todas formas, hemos programado

    con '*'A)*'$  otra t"cnica de suavizado de curvas, alternativa a las funciones Lavelets, basada en splines,

    con la idea de que la herramienta para el tratamiento de series de demanda energ"tica que hemos desarrollado

    estuviera totalmente integrada en '*' .

    En lo que a las cópulas concierne, no hemos encontrado ning'n procedimiento de '*'  que permita gran

    versatilidad a la hora de realizar an#lisis basados en esta teoría. -an sólo el módulo  &I'( !IM$='IB='  ofrece

    algunas posibilidades. %or ello, y aun cuando '%C'   tiene alguna solución orientada al tratamiento con

    cópulas 5'EFI=M$T&I+' 6, hemos considerado de gran utilidad, no sólo de cara a la integración con laherramienta mencionada, sino adem#s para futuros trabaos, implementar en '*'A)*'$   una relación de

    macros específicas que permitan trabaar con ellas.

    En el capítulo octavo de la tesis presentamos las principales conclusiones teóricas y pr#cticas a las que hemos llegado y

    en el noveno, las próimas líneas de investigación que pretendemos seguir en el futuro.

    $inalmente se incluye una relación de Aneos en los cuales se pueden consultar las demostraciones rigurosas de los

    lemas y teoremas que proponemos en el bloque teórico y que constituyen la aportación teórica que hacemos al campo

    de la teoría de cópulas.

    -ambi"n se pueden consultar en este capítulo de aneos las epresiones correspondientes a las familias de cópulas m#s

     populares, así como una introducción a algunos de los m"todos matem#ticos utilizados en el desarrollo pr#ctico como

    son las Lavelets o los splines de regresión. %retendemos con ello dar una idea que facilite el meor entendimiento de

    esta eposición.

     Introducci

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    26/324

    " #!nciones có$!la

    ).) In+ro,/i1n

    8n modelo matem#tico no es m#s que una forma de intentar eplicar la realidad, una forma de medir la relación que

    eiste entre las variables que definen un sistema. Cuando el obetivo es claramente predictivo, acostumbra a plasmarse

    en una relación de ecuaciones param"tricas que plantean una hipótesis sobre el funcionamiento de dicha realidad. Cada

     par#metro de cada ecuación tiene por finalidad cuantificar esa supuesta relación. 2ógicamente es imposible predecir el

    futuro con eactitud y es por ello que una parte del modelo est" reservada al error que asume que cometer#, un t"rmino

    que se considera desconocido.

    Eisten muchos tipos de modelos que pueden ser utilizados para predecir, algunos lineales y param"tricos como los

    modeo" de re're"!&n o los A4!/A, otros no param"tricos como los ár2oe" de de%!"!&n, algunos no lineales como las

    redes neuronales, etc. -odos ellos tratan de detectar la relación de dependencia que liga a las variables del sistema y

    adem#s comparten un aspecto com'n que es la necesidad de disponer de un histórico de datos sobre el que estudiar

    dicha relación. Cuanto mayor sea su volumen y m#s fiable su contenido, de mayor calidad ser#n los resultados que el

    modelo proporcione.

    En el #mbito matem#tico, predecir consiste en conocer el comportamiento futuro de un sistema que puede ser m#s o

    menos compleo. En su versión m#s simplificada, predecir es conocer el valor futuro que se espera que tome unavariable en función de su relación con otra u otras variables. 1i el comportamiento de la variable a predecir est#

    condicionado por su propia historia como ocurre cuando se plantean modelos diseñados para el tratamiento de series

    temporales, la relación se establecer# igualmente entre dos variables> el presente y el pasado de la misma.

    Jemos empleado con cierta familiaridad dos t"rminos que tienen un equivalente matem#tico directo>

     – 2a :esperana; matem#tica de una variable identifica el valor que se :e"pera8 que tome la variable.

     – El t"rmino :%ond!%!onado8 presupone que eiste un conocimiento del valor de las variables que van a

    intervenir como eplicativas en el modelo.

    2a conunción de ambos conceptos da lugar al de :esperana condicionada7 de una variable que viene a ser el valor

    que se espera que tome la variable condicionado a que se tiene un conocimiento del valor de otras que act'an como

    eplicativas. El c#lculo de la esperanza condicionada de una variable   al valor : @7 de otra 5u otras6 G  se realiza a partir

    de la distribución condicionada  ∣ G = @ que es una función que permite conocer como se distribuyen los valores

    de la variable   cuando se sabe que la variable G  toma el valor : @7. El conocimiento de esta distribución permite

     Funciones c

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    27/324

    localizar cu#l es el valor de   que se presenta m#s habitualmente cuando G  vale : @7, viendo cu#l es el valor 5o valores6

    de   alrededor del cual la distribución es m#s densa 5tiene mayor masa o densidad6. Xste puede ser por eemplo la

    media, la mediana o la moda de la distribución y puede ser propuesto como valor esperado o predicción. Adem#s, la

    distribución informa tambi"n del nivel de concentración alrededor del valor que damos como predicción, lo cual

     permite proporcionar una idea de su volatilidad 5o variabilidad6. Esta medida de la dispersión esperada para la

     predicción resulta de gran utilidad para analizar el riesgo derivado de la toma de una posible decisión fundamentada en

    ella. &uevamente se repite el t"rmino matem#tico :esperado; y aparece uno nuevo, :dispersi

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    28/324

    o menos sencillo dado que la propia representación de los valores de la variable nos puede sugerir el empleo de alguna

    de las muchas distribuciones conocidas que eisten 5%oisson, 8niforme, &ormal, Eponencial, etc.6 y, aun en el peor de

    los casos, siempre podemos optar por utilizar una distribución empírica.

    /ucho m#s complicado resultaría proponer una epresión para la distribución conunta, entre otras cosas porque en elladebe venir representada implícitamente la relación de dependencia eistente entre las variables G  e  . 2a solución a este

     problema no es inmediata como veremos a continuación.

    1upongamos un caso muy sencillo en el que tenemos dos variables G  e   con sus respectivas funciones de distribución

    marginales  F  G "@  y 1 "y. Entonces, eisten infinitas funciones de distribución bivariantes conuntas  #  G "@,y  cuyas

    marginales son F  G "@ y 1 "y. /#s aun, podemos encontrarnos con pares de variables 5 G : , :6 y 5 G 2 , 26 que responden a

    estructuras de dependencia diferentes aun cuando las  G i y las  i  presentan la misma distribución y siendo adem#s el

    coeficiente de correlación lineal entre  G :  e  : el mismo que entre G 2  e  2. Es decir, pueden eistir dos funciones de

    distribución conuntas y distintas  # :  y  # 2  asociadas a 5 G, 6, que eplicarían respectivamente y de forma diferente la

    relación de dependencia entre ellas.

     &uestra intención es encontrar la función de distribución conunta #  que meor reflee la relación entre G  e  Y aqu"lla

    que nos garantice que la distribución condicionada que construyamos represente fielmente esa relación y pueda ser

    utilizada por el analista con fines predictivos. Es en este conteto en el que aparecen en ?B? unas funciones bautizadas

     por el matem#tico A2e S,ar  como %&p$a", funciones que, como el autor define, unen 5o copulan6 funciones de

    distribución multivariantes a sus marginales unidimensionales de igual forma que el t"rmino gramatical :cópula; sirve

    de enlace entre el sueto y el predicado de una oración. Es el concepto lingRístico el que sirve de inspiración a 1Glar

     para dar nombre a esta clase de funciones. Citaremos algunos referentes históricos que han sido etraídos del capítulo

    de P&E21E&Q, al cual invitamos al lector a consultar para conocer m#s en detalle algunos de los hitos m#s significativos

    en la historia de esta teoría.

    +uiz# los precedentes m#s remotos de la teoría los encontramos en ?H@I?H, cuando 9a""!# 7oe--d!n' define una

    clase de distribuciones bivariantes estandarizadas cuyo soporte est# contenido en el cuadrado PISD, SDQD y cuyas

    marginales son uniformes sobre PISD, SDQ. 1eg'n S%35e!:er 5??6, si Joeffding hubiese utilizado como dominio de

    definición el intervalo P@,Q en vez de PISD, SDQ, hubiese sido "l quien hubiese descubierto las cópulas.

    1in embargo, el antecedente m#s claro al desarrollo de 1Glar lo encontramos en el trabao de $erón en ?B. $erón

    realizó un estudio sobre distribuciones tridimensionales en el que definía unas funciones auiliares de dominio el

    cuadrado unidad que le permitieron enlazar dichas distribuciones con sus marginales univariantes. 1Glar observa, seg'n

    nos comenta en uno de sus artículos m#s recientes que data de ??, que funciones con características similares a las de

    $erón podían ser definidas para dimensiones mayores o iguales que D, y que de igual manera servirían de enlace entre

    las distribuciones conuntas y sus marginales univariantes. A partir de esta apreciación, 1Glar establece el teorema que

    lleva su nombre y que constituye el pilar fundamental de una teoría que ha despertado a partir de la d"cada de los

    noventa y que, dada su :corta; edad, mantiene hoy día muchas líneas de investigación abiertas.

     Funciones c

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    29/324

    ).2 Deinii1n

    2a mayor parte de los artículos que podemos encontrar sobre cópulas comienzan dando su definición sin hacer alusión aotra clase de funciones a partir de la cual podría definirse en una 'nica frase> las cópulas son subcópulas cuyo dominio

    es el cuadrado unidad. Esta forma de presentarlas que hace Ne"en 5v"ase capítulo D de P&E21E&Q6 nos parece la m#s

    apropiada dado que la metodología que constituye la base teórica de esta tesis se fundamenta en la posibilidad de

    etender cualquier subcópula a una cópula 5v"ase el lema D.F.B de P&E21E&Q6.

    1in embargo, de igual manera que desconoceríamos las tareas de un director si lo 'nico que supi"ramos de "l es que en

    su ausencia es el subdirector quien las desempeña, y a pesar de las ventaas de espacio que ofrece la definición

     propuesta, parece que estamos obligados a eplicar las propiedades que caracterizan a una función subcópula.

    De-!n!%!&n 0;0;* 8na

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    30/324

    ). Teorema ,e S3lar 

    /uchas de las propiedades de las cópulas y las subcópulas son comunes. 1in embargo, el hecho de que se diferencien

    en el dominio de definición, resulta determinante como pone de manifiesto el Teorema de S,ar  5?B?6, que

    constituye el pilar fundamental y una referencia obligada en la teoría de cópulas pues establece la relación que eiste

    ente las distribuciones multivariantes y sus marginales univariantes a trav"s de un cópula.

    Teorema 1.1.- Teorema de Sklar 

    6'ean G e variales aleatorias con funciones de distriuci

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    31/324

    En el caso que nos ocupa, φ=$M es monótona creciente por ser función de distribución.

      = @ = F  G  @ ⇒ −A   = F  G 

    −A     y +  O =+  G = F  G +  G =@,A

    El soporte transformado es el intervalo abierto 5@,6 dado que obviamente

     F  G minT @∣ @∈+  G  U= F  G −∞=@   y F  G ma@T @∣ @∈+  G U= F  G ∞=A

    En consecuencia, podemos aplicar el resultado y establecer que>

    0  O   = f   G  F  G −A  ∗∣

    ∂ F  G −A  

    ∂    ∣∗ I  @,A  

    7ado que  F H  G  @ =  f   G   @ ⇒ F H  G  F  G −A  =  f   G  F  G 

    −A   , la epresión anterior es igual a>

    0  O   = F H  G  F  G −A   ∗∣

    ∂  F  G −A  

    ∂    ∣∗ I @,A  =

    d  F  G  F  G −A  

    d   ∗ I @,A  =

    d ∗ I @,A   = I @,A   que es la

    función de densidad de una uniforme en el intervalo 5@,6

    En consecuencia podemos concluir que  F  G  G =C  Zd 

    C @,A   y 1   =D  Zd 

    C @,A y que la relación que

    establece el teorema de 1Glar entre las marginales y la conunta a trav"s de la cópula +   es #  G  @ , y=+  F  G  @ ,1   y=+ u , v ∀ @ , y∈ ℝ=[−∞ ,∞] .

    Estos resultados ayudan a entender meor la definición de las cópulas que se presenta en P/A--E!1Q 5definición D.D6.

    De-!n!%!&n 0;=;* 8na %&p$a es una función de distribución multivariante F  de variables aleatorias G : ,G 2 ,...,G n cuyas

    distribuciones marginales son uniformes est#ndar, es decir,  G i~ F i   ∀i=A,D ,... ,n

    Como se puede leer en P%A--;* 2as derivadas parciales respecto de C  y D , que en virtud de la monotonía de +  eisten para casi todo

    :u7  y :v7  respectivamente 5salvo conunto de medidas Le2e"'$e  nula6, definen las denominadas %&p$a"

    %ond!%!onada" asociadas a +  y son>

    7ado :u7 fio, la cópula condicionada a :u7 es la función de D ,   v + Au , v =+ v∣u =∂ + ∂ u

    u , v 5.?6 

    7ado :v7 fio, la cópula condicionada a :v7 es la función de C ,   u + D u , v =+ u∣v =∂ + 

    ∂ v u , v 5.@6

    1e puede demostrar que estas funciones así definidas no sólo eisten, sino que adem#s son no decrecientes para casi

    todo punto de P;,:Q 5v"ase el teorema D.K.K de P&E21E&Q6.

    2a consecuencia directa de la adaptación del teorema de 1Glar para distribuciones condicionadas continuas es que las

    distribuciones condicionadas de  ∣ G = @   y  G ∣ = y   vienen dadas, respectivamente, por

     #  / G  y=+ A F  @ ,1  y 5.6

     #  G  /   @=+ D F  @ ,1 y 5.D6

     pues por eemplo>

     Funciones c

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    32/324

    ∂+ ∂ u

      u , v =limh @

    + u , v −+ u−h , v + u , ∞−+ u−h ,∞

    Zmar/.uniformes limh@

    +  F  G  @  , 1  y −+  F  G  @ −h ,1   y

     F C u − F C u−h  Z

    '0lar 

    limh @

     #  @ , y− #  @−h , y

    h= #  y∣ @   siendo C  [ d C @,A   y F C    su F.!

    Esta relación es para nosotros de gran importancia dado que la predicción de una variable   a partir del conocimiento de

    otra variable  G   la plantearemos a partir de la simulación de valores de la distribución condicionada    ∣ G = @  

    mediante el m.todo de a tran"-ormada !n1er"a 5v"ase el apartado D.F de P%A4*A2Q6, siendo para ello necesario

    disponer de su función de distribución #"yR@ que, como vemos, puede ser aproimada mediante una función cópula.

    $inalmente, cabe hablar de función de densidad conunta asociada a las variables C  y D  que viene a denominarse como

    densidad cópula y cuya eistencia est# igualmente garantizada en función del citado teorema D.K.K que encontramos en

    P&E21E&Q.

    De-!n!%!&n 0;?;* 1e define la den"!dad %&p$a condicionada asociada a una cópula +  como>

    + AD u , v =   ∂ + ∂ u ∂ v u , v 5.F6

    %odemos encontrar en P%A--

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    33/324

    El teorema emplea una función denominada cópula condicional, cuya definición tambi"n se presenta en P%A--

    De-!n!%!&n 0;@;* 1e define una

    .   + t u,@∣ F t −A=@ + t @,v∣ F t − A=@   ∀u , v∈[@,A] 5.6

    D.   + t u,A∣ F t −A=u + t A,v∣ F t − A=v   ∀u ,v∈[@,A] 5.K6

    F.   D + t  [uA, uD] @ [ vA, v D]∣ F t −A=+ t  uD, v D∣ F t − A−+ t  uD, vA∣ F t −A−+ t uA, v D∣ F t −A+ t uA, vA∣ F t −A@

    ∀uA, uD, vA, vD   t.K. uAuD, vAvD 5.6

    En cualquiera de sus versiones, el resultado pone de manifiesto que dada una cópula + , y dos funciones de distribución

     F  G  y 1  asociadas respectivamente a dos variables G  e  , es posible construir una función de distribución conunta #  G

     para la bidimensional 5 G, 6, que tiene por funciones de distribución marginales a F  G  y 1 .8na propiedad muy atractiva de las funciones cópula es su independencia con respecto a las unidades en las que son

    medidas las variables G  e  . Así, si por eemplo φ  y ψ  son dos transformaciones crecientes y no lineales, entonces la

    cópula asociada al par  G  ,   es la misma que la asociada al par  G ,   , invarianza que no se mantiene

     para el coeficiente de correlación.

    Jan sido muchos los autores que han propuesto funciones cópula orientadas a reflear uno o varios aspectos

    característicos de la relación eistente entre las variables a analizar. Cada una de ellas proporciona una función  #

    distinta cuando se aplica al par "F  G "@,1 "y. El problema que inevitablemente surge es encontrar la cópula +   que

     permita la obtención de la distribución conunta #  G , que meor eplique el grado de vinculación eistente entre G  e  .

    ).4 Ca5ai,a, ,e la* /nione* 15/la 5ara rele-ar relaione* ,e ,e5en,enia

    2a selección de una u otra función cópula +  suele estar condicionada por la forma en que "sta establece la relación de

    dependencia entre las variables C  y D , relación que es cuantificable de muchas formas.

    Así por eemplo, el %oe-!%!ente de %orrea%!&n  ρ "G, 5que se mueve entre I y 6 nos proporciona un indicador con el

    que valorar la dependencia lineal que eiste entre G  e  . Cuanto m#s próimo a est" en valor absoluto, mayor es la

    relación lineal que vincula a las variables. Adem#s, el signo de este coeficiente nos informa del :sentido; de la relación>si es positivo, G  crece conforme crece  , mientras que si es negativo, una y otra variable se mueven, de forma lineal, en

    sentido opuesto. El hecho de que ρ "G, valga @ es representativo de ausencia de relación lineal entre G  e  , lo cual no

    quiere decir que no pueda eistir alg'n otro tipo de relación 5no lineal6.

    Eisten tambi"n las denominadas med!da" de a"o%!a%!&n8, algunas tan populares como la Ta$ de Benda  y el

    %oe-!%!ente de %orrea%!&n de Spearman, que cuantifican relaciones no necesariamente lineales, sino que se utilizan

    directamente como funciones de evaluación del contraste de independencia>

     # @J F  G  @ , y = F  G  @  F   y   G e indedendientes     vs # AJ F  G   @ , y ≠ F  G  @  F    y .

     Funciones c

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    34/324

    Estas medidas, se mueven tambi"n entre I y . Cuando toman alguno de estos valores etremos, reflean

    respectivamente una relación de dependencia negativa o positiva :perfecta;. Conforme se alea de ellos, la medida es

    sinónimo de falta de dependencia entre las variables. En t"rminos coloquiales, vienen a determinar cómo se relacionan

    los valores :grandes; y :pequeños; de la variable aleatoria G  con los de la variable  .

    El capítulo B de P&E21E&Q analiza en profundidad las diferentes vías en las que las cópulas pueden ser utilizadas paraestudiar la dependencia entre variables. Entre los resultados m#s importantes, destacamos aqu"llos que ponen de

    manifiesto la relación entre una función cópula austada a las muestras asociadas a un par de variables C  y D  y el valor

    muestral de sus medidas de asociación 5teoremas B..F y B..6.

    Teorema 1.&.- ela!i$n entre una !$pula y la Tau de (endall 

    6'ean G e variales aleatorias continuas cuya c

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    35/324

    "%" Ti$os de có$!las en &!nción de s! so$orte

    1eg'n se presenta en P&E21E&Q 5epresión D.H.6 , toda cópula +  se puede descomponer como

      + u , v = *+  u , v ' +  u , v 5.D6

    siendo  *+  u , v =∫@

    u

    ∫@

    v

    ∂D

    ∂ s ∂ t  +  s , t  dsdt  la parte absolutamente continua de la cópula y ' + "u,v  la parte singular.

    Así, podemos hacer una primera clasificación en>

     – C&p$a" "!n'$are";*  aqu"llas que no tienen parte absolutamente continua,

    ∫@

    u

    ∫@

    v

    ∂D

    ∂ s∂ t  +  s , t dsdt =@⇒

    ∂D +  s , t ∂ s∂ t 

      =@   para casi todo    s , t ∈ I D . 1e trata de cópulas cuyo soporte

    son puntos o rectas.

    1on eemplos de este tipo de cópulas las populares cotas inferior y superior de Fr.%3et*7oe--d!n'  dadas

    respectivamente por

    W u , v =ma@ @, uv−A 5.DD6

     M u , v =min u , v  5.DF6.

    2a importancia de estas cópulas es que proporcionan una acotación para cualquier otra función cópula

    verific#ndose la siguiente relación W u , v ≤+ u , v ≤ M u , v ∀c

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    36/324

     – C&p$a" a2"o$tamente %ont!n$a";* aqu"llas que no tienen parte singular, es decir, tales que ' + u ,v=@ .

    8n eemplo de este tipo de cópulas es la cópula producto

      u , v =u∗v 5.DB6

    A trav"s de ella queda caracterizada la independencia entre las variables  G   e  . 3asta observar que

    + A u , v=+ v∣u=v , es decir, la cópula condicionada a un valor :u7 es independiente de dicho valor 5y de

    igual manera + Du ,v=+ u∣v=u 6.

    El hecho de que G   e   sean independientes implica que el valor de cualquiera de las medidas de asociación

    citadas 55.?6 o 5.D@66 sea @. Así por eemplo, para la correlación rango de 1pearman se puede comprobar

    que>    G =AD∬ I 

    D

    + u , v dudv−F=AD∫@

    A

    ∫@

    A

    uvdudv−F=AD∫@

    A

    v∗u

    D

    D  Q@

    Adv−F=AD∫

    @

    Av

    D=AD

     vD

    H  Q@

    A−F=@

     – C&p$a" m!)ta";* aqu"llas con parte singular ' + u ,v≠@ y parte absolutamente continua  *+ u ,v≠@ ,

    no constituyendo ninguna de estas partes una cópula por sí misma por no tener marginales uniformes. 2a

     presencia de una componente singular hace que estas cópulas sean de mayor utilidad cuando las marginales

    univariantes se suponen discretas.

    Alg'n eemplo es la familia de C$adra"*A$'. 5v"ase 5A!.FF66 que responde a la epresión>

    + ! u , v =P minT u , v U Q!∗P u∗v QA−! con   @≤!≤A 5.D6

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    37/324

    7entro de uno y otro grupo, gozan de popularidad la clase de las %&p$a" ar$!med!ana" caracterizada por la facilidad

    con que pueden ser construidas y por la gran variedad de estructuras de dependencia que permiten reproducir. Este

    grupo de cópulas ser# comentado en el siguiente apartado.

    "%* Ti$os de có$!las en &!nción de la relación de de$endencia +!e son ca$aces de re&le,ar 

    2as cópulas tambi"n pueden ser clasificadas en función del tipo de relación que permiten reflear. A este respecto,

    citamos algunas de las clases m#s características y frecuentemente utilizadas>

     – C&p$a" de dependen%!a e)trema;* se caracterizan, como su propio nombre indica, por capturar una relación

    de dependencia etrema entre las variables> dependencia positiva perfecta 5cópula M 6, dependencia negativa

     perfecta 5cópula W 6 o independencia (cópula Π ).

     – C&p$a" e6pt!%a";*  se definen como las cópulas asociadas a las distribuciones elípticas. 1u rasgo m#s

    característico es que representan relaciones de dependencia sim"tricas sin importar que se analice la cola

    izquierda o derecha de las distribuciones implicadas. &ormalmente no se utilizan para an#lisis financieros y de

    compañías aseguradoras en las que surgen asimetrías derivadas del hecho de que grandes p"rdidas suelen ir

    acompañadas de grandes ganancias.

    2os eemplos m#s populares son la cópula 'a$""!ana 5v"ase 5A!.B6 en el Aneo !6, la t*%&p$a o cópula de la t

    de St$dent 5v"ase 5A!.H@66 y, como caso particular de esta 'ltima, la cópula de Ca$%3# 5v"ase 5A!.66. 2a

     principal diferencia entre ellas radica en las posibilidades que presentan de cara a buscar asociaciones entrefenómenos etremos. A este respecto, la tIcópula permite tratar con colas m#s pesadas que la gaussiana.

     – C&p$a" de 1aor e)tremo;* estas cópulas ser#n de gran utilidad para representar relaciones que ponen mayor

    "nfasis entre los sucesos :cola; 5etremos6 de las distribuciones marginales. Como se define por eemplo en

    P1E0E41Q, las cópulas de valor etremo son los posibles límites 5en caso de que eistan6 de cópulas asociadas

    a los m#imos de muestras independientes e id"nticamente distribuidas. Entendamos meor esta definición.

    1ea una muestra de variables aleatorias bidimensionales T5 G : , :6, ..., 5 G n , n6U independientes e id"nticamente

    distribuidas de acuerdo a unas mismas marginales F  G  y 1  y a una misma distribución conunta  #  G  que, en

    virtud del teorema de 1Glar llevar# asociada una cópula + >  #  G  @ , y =+  F  G  @  , 1  y .

    1ean las variables  M n=ma@ T G A, G D,... , G  nU   y = n=ma@ T  A, D,... ,  n U cuyas funciones de distribución

    vienen dadas por  F n  @= % P M n≤ @ Q   y 1n y = % P = n≤ y Q y con distribución conunta

     # n @= % P M n≤ @ , = n≤ y Q .

    1i +  es tambi"n la cópula asociada al par 5 M n ,= n6 y a su posible límite cuando :n; tiende a infinito se dice

    entonces que +  es una cópula de valor etremo 5C*E6. Como se eplica en P1E0E41Q, de acuerdo al teorema

    de De3$e1e"  una cópula +   de valor etremo queda caracterizada por la condición

    u

    A

     , v

    A

    =+ u , v ∀ t "@5.DK6

     Funciones c

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    38/324

    siendo un corolario de "sta el que las cópulas de valor etremo sólo modelizan dependencia positiva.

    Adem#s, eiste un teorema propuesto por P!%,and" 5?6 que permite asociar una representación asociada a

    este tipo de cópulas.

    Teorema 1./.- epresenta!i$n de !$pulas de alor e0tremo

    6Cna c

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    39/324

    7e acuerdo a lo epuesto, queda patente la dificultad de establecer una clasificación 'nica de las cópulas conforme a un

    criterio general dado que, incluso de acuerdo a un mismo criterio, pueden eistir solapamiento entre las clases

    establecidas. Así, la cópula de valor etremo de G$m2e  5v"ase 5A!.6 o 5A!.B66 pertenecen tambi"n a la clase

    arquimediana, si bien ninguna de las clases es subconunto de la otra pues por eemplo la cópula de 7$"er # Re!""

    5v"ase 5A!.?66 es de valor etremo pero no arquimediana mientras que la cópula de Fran,   5v"ase 5A!.F66 esarquimediana pero no de valor etremo6.

    En el Aneo ! se presenta un esquema que trata de ubicar las cópulas m#s populares de acuerdo a una erarquía concreta

    que trata de responder a los dos 'ltimos criterios que hemos definido. El criterio de clasificación de acuerdo al soporte

    5singular, absolutamente continuo o mito6 se ha obviado dado que en su mayor parte 5salvo las cotas de $r"chetI

    Joeffding6 se trata de cópulas no singulares. Así>

     – El primer nivel de esta erarquía se establece de acuerdo al n'mero de par#metros del que depende la familia.

     – El segundo criterio clasifica conforme al tipo de relación de dependencia> cópulas de dependencia etrema,

    cópulas elípticas, cópulas de valor etremo y la clase arquimediana que pudiera considerarse comodín en el

    sentido de que permite reflear distintos tipos de relaciones.

     Funciones c

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    40/324

    ' Elección de la có$!la +!e me,or re&le,a !na relación de de$endencia

    2.) In+ro,/i1n al 5roblema

    8no de los problemas cl#sicos en la estadística es conocer la distribución a la que responde una muestra dada de forma

    que "sta quede bien caracterizada y puedan etraerse conclusiones con fines descriptivos o predictivos. 7entro del

    conteto de la teoría de cópulas, este problema presenta una doble vertiente> una univariante asociada a la

    especificación de las funciones de distribución F  G  y 1  5en adelante F  y 16 correspondientes a las marginales de G  e  ,

    y otra bivariante 5en general multivariante6 asociada a la determinación de aquella conunta  #  G  5en adelante # 6, de las

    infinitas que comparten dichas marginales, que meor captura la relación entre ellas. 2a vertiente bivariante desemboca

    en la b'squeda de una función cópula +  cuyas características puedan esperarse para la verdadera distribución conunta # , siendo el teorema de 1Glar el que establece la transformación final de +  en # .

    En ocasiones, por las características del problema que se est# estudiando, se puede tener una idea preconcebida de la

    familia de cópulas que puede ser m#s apropiada para eplicar la relación entre las variables que se manean. Así por

    eemplo, si el estudio est# orientado a medir el grado de asociación para valores etremos de dos variables, que se

    intuye presenta un comportamiento especial respecto del grado de asociación que pudieran tener para otros valores no

    etremos, suelen ser aconseable utilizar cópulas que enfaticen la relación entre las colas de las distribuciones

    marginales 5cópulas del valor etremo6, como por eemplo las pertenecientes a la familia de 0umbel.

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    41/324

    F. 1elección de una cópula por familia. En el caso param"trico se trata de determinar los valores asociados a los

     par#metros correspondientes a cada familia para lo cual, se suelen utilizar epresiones que permitan el c#lculo

    de dichos par#metros a partir de la estimación muestral de alguna medida de asociación como el coeficiente de

    correlación de 1pearman o la -au de Nendall.

    H. Elección de la cópula de entre todas las que representan a cada una de las familias candidatas. A este respecto,

    eisten muy diversos criterios que eponemos en el apartado D.B.

    2.2 De+erminai1n ,e la* ,i*+rib/ione* mar7inale*

    2a vertiente univariante conlleva la especificación de funciones de distribución asociadas a cada una de las variables.

    1i bien eisten los cl#sicos contrastes de bondad de auste que permiten evaluar el grado de parentesco con alguna

    distribución conocida, una buena aproimación podría venir dada por la la versión continua de la función de

    distribución empírica de cada variable que, como eplica De Matte!" 5v"ase capítulo H de P/A--E!1Q6, se calcula de la

    siguiente manera>

    7ada la muestra T @: , @2 , ..., @nU etraída de la variable G , la función de distribución empírica 5discreta6 viene dada por

    % F n  @ =A

    n&i=A

    n

    A[ G i @ ]  5D.6.

    Consideremos entonces :a7 y :7 dos n'meros reales tales que a≤ @A, @D,... , @n   y - @A, @D,... , @n .

     $lecci

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    42/324

    2. ro5/e*+a ,e /n on-/n+o iniial ,e amilia* ,e 15/la* an,i,a+a*

    El eperto en cópulas conoce las propiedades que caracterizan a las diferentes familias eistentes y que las pueden

    hacer m#s o menos apropiadas para reflear alg'n tipo de relación que, a priori, puede presuponer que eista entre las

    variables. Así por eemplo, seg'n cit#bamos en el apartado .B.F, las familias elípticas resultan m#s convenientes para

    reflear relaciones sim"tricas mientras que las definidas como cópulas de valor etremo enfatizan asimetrías que ganan

    fuerza entre los sucesos :cola; de las distribuciones.

    7ebe ser el conocimiento del analista sobre la relación subyacente a los datos y el que tiene sobre las características de

    las familias de cópulas a su alcance, los factores principales que le lleven a descartar de antemano alguna de estas

    familias y seleccionar algunas otras como candidatas de partida.

    2.4 De+erminai1n ,e la 15/la 15+ima ,en+ro ,e /na amilia

    1i bien como decíamos, el conocimiento del eperto puede llevarle a hacerse una idea de cu#l es la familia m#s

    conveniente para su problema en función del tipo de relación que sospeche eiste entre sus variables, tambi"n

    admitimos que esta intuición puede no eistir si el analista desconoce la relación que cabe esperar a priori. -ambi"n

     puede darse el caso de que el analista encuentre varias familias que desempeñan papeles parecidos y no termine de ver

    claro cu#l de ellas es la m#s apropiada. En estas ocasiones, resulta beneficioso disponer de una amplia gama de familias

    candidatas para poder seleccionar de cada una de ellas un representante 5aquella cópula que meor se austase a la

    muestra de datos disponible6 entre los cuales acabar# eligiendo uno.

    En este conteto, las cópulas arquimedianas, que presentamos en el capítulo anterior, suelen resultar especialmente

     $lecci

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    43/324

    'tiles pues gracias a su gran diversidad permite recoger relaciones de muy distintos tipos. Como tambi"n se eplica en

    el capítulo H de P/A--E!1Q, el procedimiento para determinar la cópula que meor se austa a una muestra aleatoria

     bivariante de 6n7 observaciones T5 @: ,y:6, ..., 5 @n ,yn6U comienza asumiendo que "sta ha sido generada por una distribución

     bivariante desconocida  #"@,y  con marginales continuas  F"@  y 1"y  y cópula arquimediana +"u,v. Jecha esta

    consideración, se trata de determinar a qu" familia pertenece + , o lo que es lo mismo, la forma del generador $ dela cópula que, recordemos, caracteriza a la cópula arquimediana. 1e podr# disponer de varias familias candidatas

    '+ !(!∈) 5con varios tipos de generadores $! 6 y, para cada una de ellas, elegir un representante + !B%T  . Como

    cita 7e /atteis, para la estimación de θ , eisten diferentes alternativas>

     – Estimar en un primer paso las funciones de distribución marginales mediante m"todos param"tricos o no

     param"tricos y, posteriormente, a partir de ellas, estimar θ  mediante el principio de m#ima verosimilitud.

     – -ambi"n es posible hacer la estimación de las marginales y del par#metro θ  en un sólo paso. En este caso, laestimación de θ   puede hacerse de dos formas>

     – Empleando un m"todo param"trico como es el procedimiento de estimación de m#ima verosimilitud,

    siendo la función de verosimilitud " α,θ  ,G, donde α  identifica a los par#metros de las marginales.

     – Empleando un m"todo no param"trico, recomendado por Gene"t # R!1e"t 5??F6 donde θ  es estimado en

    un sólo paso, con independencia de las funciones de distribución marginales. 2a estimación se hace

    empleando la correlación rango de Nendall.

    %rocediendo de la forma que describe P/A--E!1Q para cada una de las familias candidatas, el resultado es un conunto

    de cópulas 5una por familia6 entre las que ser# necesario hacer la selección final.

    2. Selei1n ,e la me-or amilia a 5ar+ir ,e la* 15/la* re5re*en+an+e*

    En este apartado se proponen algunos de los criterios m#s utilizados para decantarse por la selección de una

    determinada cópula dentro de un conunto de candidatas. 7icho conunto puede haber sido el resultado de alguno de los procesos descritos en el apartado anterior. 2a decisión obviamente lleva implícita el optar por una determinada familia.

    '%" -.todo "/ Em$leo de la có$!la em$)rica

    2as %&p$a" emp6r!%a"  fueron estudiadas originalmente por 7eheuvels 5?K?6. 2a idea consiste en construir una

    función cópula a partir de valores muestrales T5 @: ,y:6, ..., 5 @n ,yn6U recogidos para las variables univariantes sin establecer

    dependencia de ning'n par#metro. 7e esta forma, la cópula es no param"trica y queda definida 'nicamente a partir de la

    muestra de datos disponible.

     $lecci

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    44/324

    2a definición de la cópula empírica puede encontrarse en P&E21E&Q 5definición B.B.6 y responde a la epresión>

    + ni

    n ,

      ?

    n=

    nS de pares @ , y enla muestra talesKue @ @i e y y  ?

    n5D.D6

     para T5 @: ,y:6, ..., 5 @n ,yn6U muestra de una distribución bivariante conunta, y siendo  @"i  e  y"  con A≤i , ?≤n los

    estadísticos de orden definidos a partir de dicha muestra.Este primer m"todo, citado por Ca$d!o Romano 5v"ase el apartado H.D de P4

    dn %+ ,+ 0 =&t A= A

    ...&t n=A

    %+ t A

    T   ...

    t n

    T −+ 0 

    t A

    T   ...

    t n

    D

    A /D

    5D.F6

    1i bien estamos partiendo de que ya disponemos de una cópula concreta dentro de cada una de las familias y esta

    distancia nos va a ayudar a seleccionar una de ellas, tambi"n es posible aplicar esta medida a todas las cópulas de una

    misma familia para determinar el valor del par#metro m#s conveniente. Es decir, podríamos prescindir del paso previo

    de estimación que hemos comentado 5la solución param"trica o la no param"trica de 0enest y 4ivest6 y hacer la

    selección de la cópula dentro de cada una de las familias vali"ndonos de dn . Como se eplica en P4

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    45/324

     ( + +  F  G  , 1  ~C  @,A . *aldría nuevamente un gr#fico -plot   asociado a las funciones de

    distribución : (7 correspondientes a cada una de las cópulas candidatas para terminar decant#ndose por aqu"lla

    que m#s se aproime a la recta  y N @.

    '%* -.todo */ A$ro(imación anal)tica de los m.todos gr&icos

    1i bien los m"todos gr#ficos anteriores pueden proporcionar una idea bastante buena de cu#l es la cópula m#s

    apropiada, se puede eliminar la subetividad asociada a la agudeza visual del analista y plantear un test de hipótesis para

    contrastar si las distribuciones de + : "F"@,1"y o ( c "t se aproiman a una 85@,6.

    A este respecto, en P/A--E!1Q 5apartados H.H. y H.H.D6 se citan los dos contrastes cl#sicos de bondad de auste a una

    distribución dada, el de la C3!*%$adrado y el de Bomo'oro1*Sm!rno1. %ara llevar a cabo estos contrastes se trocea el

    rango de variación de la distribución a contrastar en una serie de intervalos y se comprueba si el n'mero de valores

    muestrales observados en cada una de ellos 5Bi6 se parece al n'mero de ellos que cabría esperar 5 $ i6 bao el supuesto de

    que siguieran una distribución 85@,6. %ara una descripción m#s detallada de estos contrastes se puede consultar el

    Aneo *!!!.

     – Contra"te de a C3!*%$adrado 2a"ado en e e"tad6"t!%o de Pear"on

    2a muestra de partida es el conunto de valores + : "F"@i ,1"yi  5o ( c "t i 6 que nos proporcionar# las frecuencias

    observadas 5Bi6 dadas por el n'mero de pares 5 F"@i ,1"yi 6 que caen en cada uno de los intervalos. El obetivo

    es contrastar si "stas frecuencias se aproiman a las esperadas 5 $ i6 para una distribución uniforme est#ndar.

    Aquella cópula +  cuya condicionada + : d" un mayor grado de proimidad entre estas frecuencias 5menor valor

    del estadístico de %earson6 ser# la propuesta para representar la relación entre G  e  .

     – Contra"te de Bomo'oro1*Sm!rno1 2a"ado en e e"tad6"t!%o Dn

    En este caso, + : "F"@i ,1"yi  5o ( c "t i 6 proporcionar# la muestra de valores a partir de la cual se construir# la

    función de distribución empírica  F n. El obetivo es ver si "sta se parece a la función de distribución de una

    85@,6. Así, la cópula +  cuya condicionada + : nos proporcione un valor del estadístico !n  m#s pequeño ser#

    aqu"lla para la que la muestra de valores se aproime m#s a una distribución uniforme est#ndar y por tanto, la

    m#s apropiada para representar la relación entre G  e  .

    '%1 -.todo 1/ Criterio de in&ormación de A2ai2e 3AIC4

  • 8/16/2019 Teoría de Cópulas Aplicada a La Predicción

    46/324

    de par#metros que se estima.

    8tilizar el criterio de AGaiGe supone decantarse por aquel :modelo; que presenta un menor valor del *I+  lo cual es

    representativo de un modelo m#s parsimonioso 5menos par#metros6 y que meor se austa a los datos 5menor error de

     predicción6. 7ado que   representa la probabilidad de que la muestra quede bien representada por los par#metros,

    interesa que   sea próima a lo cual se traducir# en que el logaritmo de  se aproime a @. Es por ello que un  *I+ pequeño es indicativo de que el estimador