Seminario de Matem´atica Financiera MEFF-UAM -...

429
Seminario de Matem´ atica Financiera MEFF-UAM Volumen 2. A˜ nos 1998 y 1999 Directores: Santiago Carrillo Men´ endez Jos´ e Luis Fern´ andez P´ erez

Transcript of Seminario de Matem´atica Financiera MEFF-UAM -...

Page 1: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Seminario de Matematica Financiera

MEFF-UAM

Volumen 2. Anos 1998 y 1999

Directores:Santiago Carrillo Menendez

Jose Luis Fernandez Perez

Page 2: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

c© Santiago Carrillo Menendez, Jose Luis Fernandez Perez y otros

Preparacion de la edicion: Pablo Fernandez GallardoMaquetacion: Aula Documental de Investigacion. Martın de los Heros, 66.28008. MadridEdita: Instituto MEFFImprime: JUMA

ISBN: 84-699-6766-5Deposito Legal M-52027-2001Printed in Spain - Impreso en Espana

Este libro no podra ser reproducido total o parcialmente, ni transmitirse por proce-dimientos electronicos, mecanicos, magneticos o por sistemas de almacenamiento yrecuperacion informaticos o cualquier otro metodo, ni su prestamo, alquiler o cual-quier otra forma de cesion de uso del ejemplar, sin el permiso previo, por escrito, deltitular o titulares del copyright.

Page 3: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Prologo

Este segundo volumen del Seminario de Matematica Financiera MEFF-UAM es unarecopilacion de las conferencias que, durante los anos 1998 y 1999, han dictado unselecto grupo de profesionales en la cita mensual que convocan los profesores San-tiago Carrillo y Jose Luis Fernandez. Pese a que el acto tiene que “competir” enel valioso tiempo de los asistentes con otras actividades mas ludicas que se celebransimultaneamente, el Seminario mantiene un numeroso publico. El prestigio de losponentes y el interes de los temas que plantean, fruto del trabajo cotidiano y de in-vestigacion, explican el exito de audiencia y tambien el seguimiento de muchos fielesadeptos en toda la geografıa espanola quienes, gracias al uso de internet, tienen accesoinmediato a la ponencia escrita.

Esta colaboracion con la Universidad Autonoma de Madrid se enmarca dentro dela polıtica de MEFF de promover la innovacion en el sector financiero de nuestro paısy de impulsar el intercambio continuo de ideas entre los academicos y los profesionalesde los mercados. Sin duda tanto unos como otros se enfrentan ahora mas que nunca aun mundo que obliga a poner en cuestion la relevancia empırica de los modelos teoricosy de las herramientas de gestion predominantes en cada momento. Y creemos queeste tipo de encuentros puede ser una ayuda para interpretar y abordar la complejarealidad.

La publicacion de un libro siempre es el resultado del esfuerzo que realiza unequipo de personas. Y esto es evidente en este ejemplar en el que han participado,ademas de los directores, los autores, el transcriptor y mis companeros de InstitutoMEFF.

A mı me corresponde la labor gratificante de prologar el libro y de expresar ennombre de MEFF nuestro agradecimiento a todos los que lo han hecho posible y muyespecialmente a los directores, Santiago Carrillo y Jose Luis Fernandez, a los queprofeso una gran admiracion y afecto.

Remedios RomeoDirectora General

Instituto MEFF

v

Page 4: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM
Page 5: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Indice

A modo de introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . ix

Cobertura en tiempo discreto de una cartera de opciones . . . . . 1Rafael Salinas Martınez de Lecea

On the relevance of Modeling Volatility for Pricing Purposes . . . 9Manuel Moreno

El uso de las mixturas de distribuciones gaussianas en finanzas:aplicacion en valoracion y cobertura de opciones financieras . . . . 41

Susana Corcuera y Juan Carlos Garcıa Cespedes

La problematica de medicion de la performance . . . . . . . . . . . . 81Prosper Lamothe Fernandez

Equivalencia de los distintos metodos para valorar empresas pordescuento de flujos. Distintas alternativas para valorar el ahorrode impuestos debido al apalancamiento y sus implicaciones sobrela valoracion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

Pablo Fernandez

Redes neuronales para aplicaciones en negocios . . . . . . . . . . . . 129Anıbal R. Figueiras Vidal

Volatilidad estocastica, volatilidad incierta . . . . . . . . . . . . . . . 139Antonio Sanchez Calle

Short-Term Options with Stochastic Volatility: Estimation andEmpirical Performance . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

Gabriele Fiorentini, Angel Leon y Gonzalo Rubio

May static pricing models be useful when pricing catastrophe-linked derivatives? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181

Alejandro Balbas, Inaki R. Longarela y Julio Lucia

Derivatives as Tradeable Assets . . . . . . . . . . . . . . . . . . . . . . 213Terry J. Lyons

Information Transmission around Block Trades on the SpanishStock Exchange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233

Miguel Angel Martınez, Mikel Tapia y J. Yzaguirre

vii

Page 6: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Market integration measures . . . . . . . . . . . . . . . . . . . . . . . . 255Angel Pardo, Alejandro Balbas y Vicente Meneu

Crash Prediction: Science or Alchemy? Common Points betweenEarthquakes, Sand Piles and Markets . . . . . . . . . . . . . . . . . . 281

Gabriele Susinno

Una modelizacion GARCH bivariante del futuro sobre el Ibex-35.Implicaciones para la cobertura del contado . . . . . . . . . . . . . . 291

Juan Angel Lafuente

Risk Assessment and Extreme Value Theory in Finance . . . . . . 315Alberto Suarez

Valoracion y medicion de riesgo de pasivos bancarios sin venci-miento definido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331

Jesus M. Tarriba Unger

Analisis crıtico del mercado electrico espanol . . . . . . . . . . . . . 349Rafael de Benito

Uso de las martingalas en la valoracion de activos derivados . . . . 375Eloy Fontecha

Modelos multivariantes de valoracion de bonos convertibles conriesgo de credito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397

Jesus Perez Colino

viii

Page 7: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

A modo de introduccion

Este segundo volumen del Seminario MEFF-UAM de Matematica Financiera saldra ala luz coincidiendo con el inicio del sexto ano de actividad mensual. En el se recogenlas diecinueve ponencias realizadas en dicho seminario a lo largo de los anos 1998 y1999. Una mirada al ındice de este volumen permite hacerse una idea de la diversidadde temas abordados en estas sesiones.

El problema de la modelizacion de la volatilidad ha sido quizas el tema estrella simedimos su interes por el numero de conferencias que lo han abordado desde diversosangulos: Antonio Sanchez, por una parte y Gabriele Fiorentini, Angel Leon y GonzaloRubio por otra, se han aproximado a los modelos de volatilidad estocastica (tambien alos modelos de volatilidad incierta en el caso del primer ponente). Manuel Moreno haabordado el problema de la modelizacion de la volatilidad en los modelos de evolucionde tipos de interes y su impacto en la valoracion, mientras que Juan Angel Lafuentenos aproxima a los modelos GARCH bivariantes y sus aplicaciones.

Se ha estudiado el uso de metodologıas de implantacion reciente al entorno finan-ciero en varias de las ponencias: redes neuronales (Anıbal Figueiras), teorıa de valoresextremos (Alberto Suarez) y mixturas de normales (Susana Corcuera y Juan CarlosGarcıa Cespedes).

Ha habido ocasion de abordar temas tan diversos como la medicion de la perfor-mance de una cartera (Prosper Lamothe), la valoracion de empresas (Pablo Fernandez),los derivados sobre catastrofes (Alejandro Balbas, Inaki Longarela y Julio Lucıa), lasituacion del mercado electrico espanol (Rafael de Benito), la cobertura en tiempodiscreto de las carteras de opciones (Rafael Salinas) o el uso de modelos multivariantesen riesgo de credito (Jesus Perez Colino).

Eloy Fontecha abordo el uso de los metodos de martingalas en la valoracion deactivos derivados. Terry Lyons se intereso por la dinamica conjunta del subyacente yde la call cuando esta es un valor negociado y de las consecuencias de este hecho parala cobertura. Gabriele Susinno nos aproximo a la “econofısica” con una conferenciadedicada a la prediccion de crisis bursatiles.

Tambien han encontrado acomodo en las sesiones del seminario los interesantestrabajos de M.A. Martınez, M. Tapia y J. Yzaguirre (transmision de la informacionen las transacciones por bloques), de Angel Pardo, Alejandro Balbas y Vicente Meneu(medidas de integracion de mercados) y de Jesus Tarriba (valoracion y medicion deriesgos de pasivos bancarios sin vencimiento definido).

ix

Page 8: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Todo ello hace que este volumen sea una muestra patente de la interesante con-vergencia entre la investigacion academica sobre finanzas y la practica financiera. Entotal doce de estos trabajos tienen autores academicos y los autores de los siete restan-tes son practitioners, aunque resulte difıcil, para quien no los conozca personalmente,decidir quien es quien a la vista de los tıtulos de las ponencias.

Esta convergencia, sena de identidad del Seminario MEFF–UAM, es consecuenciadel talante abierto y de la dedicacion de los ponentes y, tambien, de los asistentes, aquienes dedicamos, con nuestro afecto y sincera gratitud, este volumen.

Santiago Carrillo MenendezJose Luis Fernandez Perez

x

Page 9: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Cobertura en tiempo discreto de

una cartera de opciones

Rafael Salinas Martınez de Lecea1

Resumen

Bajo las hipotesis basicas de Black & Scholes, se obtienen expresiones ana-lıticas del ratio de cobertura eficiente, para una cartera de opciones europeas,que minimiza la varianza de los rendimientos de la cartera de cobertura cuandoel ajuste de la misma se realiza de forma discreta cada ∆t. Como ilustracion serealizan diferentes simulaciones mediante un arbol binomial que nos permitenevaluar como se diferencian el ratio de cobertura tradicional (delta) del ratio decobertura de mınima varianza para distintas sendas del activo subyacente.

1 Introduccion

Una de las primeras dudas que plantea la implementacion practica de la cobertura endelta de un libro de opciones es la frecuencia optima de ajuste del libro.

Los modelos teoricos de valoracion de opciones tipo Black, Scholes & Merton estanbasados en un ajuste continuo de la cartera de cobertura; sin embargo los costes detransaccion, los horarios de mercado y la liquidez de los mismos no permiten realizardicho ajuste teorico.

En este contexto el dilema del gestor se divide entre cubrir el libro con la mayorfrecuencia posible, lo cual implica incorporar toda la volatilidad intradıa e interdıaal coste de nuestra gestion, o realizar una cobertura discreta que intente evitar loscostes que introduce el ruido a corto plazo de la serie de precios, pero que obliga aincorporar una hipotesis sobre cual va a ser la tasa de variacion del activo subyacentedurante el tiempo entre fechas de ajuste.

Otra situacion equivalente a la anterior es la que se plantea en las opciones acorto plazo de mercado organizado, durante la ultima semana a vencimiento. En estecontexto, y especialmente para opciones ATM y OTM, el simple paso de un dıa afectasignificativamente los ratios de cobertura, lo cual obliga a tener que realizar continuosajustes manuales en los programas de gestion.

Siguiendo a Robins & Schachter (1994) y Robins, Sanders & Schachter (1996), ybajo las hipotesis basicas de Black & Scholes, a continuacion se obtienen expresiones

1Rafael Salinas Martınez de Lecea es Director de Gestion de Recursos Propios del Banco BilbaoVizcaya Argentaria. Esta charla se impartio en la sesion del Seminario MEFF-UAM de enero de1998.

Page 10: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

2 Rafael Salinas

analıticas del ratio de cobertura eficiente, para una cartera de opciones europeas, queminimiza la varianza de los rendimientos de la cartera de cobertura cuando el ajustede la misma se realiza de forma discreta cada ∆t.

Como ilustracion se realizan diferentes simulaciones mediante un arbol binomialque nos permiten evaluar como se diferencian el ratio de cobertura tradicional (delta)del ratio de cobertura de mınima varianza para distintas sendas del activo subyacente.

2 El ratio de cobertura de mınima varianza

Consideremos una cartera de opciones vendidas con cobertura dinamica con activosubyacente en el momento inicial t:

Ht = jt w1t St − Dt , (1)

donde Ht es el valor de la cartera en el momento t, St es el valor del activo subyacente,jt w1t es el ratio de cobertura (siendo w1t el delta de la opcion y jt un factor de ajusterespecto a dicho ratio de cobertura tradicional) y Dt es el valor de la opcion call conprecio de ejercicio K y tiempo al vencimiento (T − t).

El rendimiento de esa cartera de cobertura durante un periodo de tiempo ∆t sera

∆Ht

Ht=

jt w1t ∆St − ∆Dt

jt w1t St − Dt, (2)

siendo la varianza de dichos rendimientos

var

(∆Ht

Ht

)=

j2t w2

1t var(∆St) + var(∆Dt) − 2 jt w1t cov(∆St,∆Dt)(jt w1t St − Dt)2

. (3)

Diferenciando con respecto a jt e igualando a cero obtenemos el ratio de coberturaque nos minimiza la varianza de los rendimientos:

jt w1t =St var(∆Dt) − Dt cov(∆St,∆Dt)St cov(∆St,∆Dt) − Dt var(∆St)

. (4)

Bajo los supuestos del entorno Black & Scholes, podemos obtener una expresionanalıtica para la ecuacion (4), desarrollando expresiones para la cov(∆St,∆Dt), lavar(∆St) y la var(∆Dt).

En primer lugar, la expresion de la varianza de una variable aleatoria lognormales

var(∆St) = S2t e2 µ ∆t

(eσ2 ∆t − 1

), (5)

donde σ es la volatilidad del activo subyacente y µ su tasa de rendimiento esperado.

En segundo lugar, sabemos que

cov(∆St,∆Dt) = E(St+∆t · Dt+∆t) − E(St+∆t) · E(Dt+∆t) . (6)

Page 11: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Cobertura en tiempo discreto de una cartera de opciones 3

Aplicando un resultado de Rubinstein (1984), segun el cual el valor esperado de unaopcion europea al final de un periodo ∆t es igual al valor que dicha opcion tendrıa hoysi el nivel del activo subyacente fuera S eµ ∆t y el precio de ejercicio K er ∆t (donde res el tipo de interes sin riesgo), esto es

E(Dt+∆t) = Dt(S eµ ∆t,K er ∆t, T − t, r, σ) , (7)

y conociendo los momentos de una variable aleatoria lognormal, se obtiene que

E(St+∆t) · E(Dt+∆t) = Steµ∆t

(Ste

µ∆tN(x) − Ke−r(T−t−∆t)N(x − σ√

T − t))

,

(8)donde

x =1

σ√

T − t

(ln

(St eµ ∆t

K e−r (T−t−∆t)

)+

σ2

2(T − t)

).

Por otra parte, se puede demostrar que

∫ +∞

−∞N (A + B z)

1√2π

e−z2/2 dz = N(

A√1 − B2

), (9)

donde N () es la funcion de distribucion de la normal y A y B son constantes.

Aplicando este resultado al primer sumando de la parte derecha de la ecuacion (6)se obtiene

E(St+∆t · Dt+∆t) = St eµ ∆t

(St eµ ∆t+σ2 ∆t N

((x +

σ ∆t√T − t

)

−K e−r (T−t−∆t) N(

(x − σ√

T − t +σ ∆t√T − t

))

De igual forma, y en tercer lugar,

var(∆Dt) = E(D2t+∆t) − (E(Dt+∆t))2 . (10)

La expresion analıtica de E(Dt+∆t) ya ha sido indicada en (8). De forma similar a(9) y aplicando el siguiente resultado:∫∫

N (A1 + B1 z1)N (A2 + B2 z2) f(z1, z2, ρ12) dz1 dz2

= N2

(A1√

1 + B21

,A2√

1 + B22

, ρ∗12

),

donde N ( ) es la funcion de distribucion normal univariante, f(z1, z2, ρ) es la funcionde densidad normal bivariante, N2( ) es la funcion de distribucion normal bivariante

Page 12: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

4 Rafael Salinas

y A1, A2, B1 y B2 son constantes, se obtiene que

E(D2t+∆t) =

(St e(σ2/2+µ) ∆t

)2

eσ2 ∆t N2

(y ; y ;

∆t

T − t

)

−2St e(σ2/2+µ) ∆t K e−r (T−t−∆t) N2

(y − σ

√T − t ; g ;

∆t

T − t

)

+(K e−r (T−t−∆t)

)2

N2

(g − σ

√T − t ; g − σ

√T − t ;

∆t

T − t

),

donde

g =1

σ√

T − t

(ln

(St eµ ∆t

K e−r (T−t−∆t)

)+

σ2

2(T − t)

),

y = g +∆t√T − t

.

Para calcular las expresiones anteriores solo se requiere conocer los parametros queentran en la formula de Black & Scholes y la tasa de rendimiento esperado del activosubyacente µ.

3 Resultados empıricos

Para una opcion call ATM, con un subyacente que cotiza a 50, un tasa anual decrecimiento del activo del 20.2%, volatilidad anualizada del 36.105% y tipo de interessin riesgo de 9.8%, Robins & Schachter obtienen los siguientes resultados:

(a) El ratio de cobertura de mınima varianza es mayor que el ratio delta. Enconcreto para distintos vencimientos obtienen:

Tiempo a vto. Delta Ratio Cobertura Mınima-Varianza con ∆t1 dıa 3 dıas 5 dıas

63 dıas 0.5745 0.5785 0.5905 0.594642 dıas 0.5609 0.5660 0.5778 0.589021 dıas 0.5432 0.5535 0.5738 0.5937

(b) Empleando una simulacion de Monte Carlo, con mil series de precios, calcu-lan el rendimiento total de la cobertura para distintos vencimientos y obtienenuna medida del riesgo de la gestion mediante la desviacion estandar de dichosrendimientos. Los resultados que obtienen son los siguientes:

• Para un reajuste diario de la cartera la volatilidad anualizada de los ren-dimientos de la cartera de cobertura son:

Page 13: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Cobertura en tiempo discreto de una cartera de opciones 5

Vencimiento Cobertura Delta Cobertura Minima-Varianza21 dıas 9.45% 8.52%42 dıas 7.95% 7.12%63 dıas 9.84% 8.80%

• Si el reajuste se realiza cada 5 dıas los resultados son

Vencimiento Cobertura Delta Cobertura Minima-Varianza21 dıas 15.04% 11.38%42 dıas 12.10% 9.39%63 dıas 13.78% 11.43%

En terminos de esta medida, ellos interpretan que la cobertura de mınima varianzatiene menos riesgo que una cobertura delta tradicional.

Con datos reales de opciones americanas sobre el ındice S&P100, Robins, Sanders& Schachter realizan un analisis similar al anterior.

Con horquillas de precios de opciones y datos simultaneos del S&P100 para losprimeros 42 dıas habiles de 1986, realizan tantas simulaciones como sean posiblesvendiendo opciones en la mejor oferta, gestionando la cobertura en delta y en ratiode mınima varianza (calculado de forma numerica) para distintos ∆t y recomprandoposteriormente las opciones al precio de demanda.

Los resultados obtenidos en dicho analisis empırico son similares a los de la simu-lacion anterior.

4 Ejemplo numerico

Con objeto de comparar el ratio de cobertura de mınima varianza con el tradicionaldelta, se han generado, en un contexto de neutralidad ante el riesgo, arboles binomialespara un activo subyacente cuya rentabilidad es del 2.5%, volatilidad anualizada del25% y siendo los tipos de interes del 4.5%.

Para vencimientos de 1, 3, 6 meses y 1 ano se comparan el delta tradicional conel ratio de cobertura de mınima varianza, con distintos plazos de ajuste ∆t a lo largode las distintas ramas del arbol binomial (ver cuadros anexos).

Los resultados que se obtienen en este ejemplo coinciden con los resultados yamostrados de Robins & Schachter.

(a) Para un determinado vencimiento los ratios de cobertura de mınima varianzason mayores que el delta tradicional cuanto menor es la frecuencia de ajuste dela cartera.

(b) Para un mismo vencimiento la diferencia entre ambos ratios es mucho massensible a la frecuencia del ajuste en opciones at y out of the money.

Page 14: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

6 Rafael Salinas

Cuadro 1. Diferencia ratio mınima varianza–delta B&S (valor absoluto en puntos por-

centuales). Vencimiento anual, tipo 4.5%, dividendo 2.5%, volatilidad 25%, ajuste cada 3

semanas.

Cuadro 2. Diferencia ratio mınima varianza–delta B&S (valor absoluto en puntos porcen-

tuales). Vencimiento anual, tipo 4.5%, dividendo 2.5%, volatilidad 25%, ajuste mensual.

5 Resumen y conclusiones

En un contexto de cobertura de opciones en tiempo discreto, la cartera que incorporaopciones y su cobertura dinamica con activo subyacente deja de ser una cartera sinriesgo, a diferencia de lo que ocurrıa con la cartera de gestion dinamica en tiempocontinuo.

Page 15: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Cobertura en tiempo discreto de una cartera de opciones 7

Dado que el rendimiento esperado de dicha cartera es la rentabilidad del activosin riesgo, parece intuitivo obtener un ratio de cobertura que minimice la varianza delos rendimientos de la cartera de cobertura.

Robins & Schachter, dentro de los supuestos estandar de teorıa de opciones, ob-tienen una expresion analıtica para dicho ratio de cobertura de mınima varianza en elcaso de una call europea y comprueban empıricamente que dicha cobertura presentauna menor varianza, en los rendimientos, que la tradicional gestion en delta. Por con-tra dicho ratio de cobertura requiere estimar cual es la tasa esperada de rendimientodel activo subyacente entre fechas de ajuste de cartera.

Un simple ejemplo generado a partir de un arbol binomial nos permite comprobarlas diferencias entre el ratio de cobertura delta y el de mınima varianza.

Futuras lıneas de analisis a desarrollar en este campo pueden incluir: obtener re-sultados equivalentes para opciones put y comparar resultados en un libro completode opciones, comprobar cual de los dos metodos de cobertura es mas robusto a es-timaciones erroneas de la volatilidad y/o rentabilidad por dividendos; analisis de lasimplicaciones que para la valoracion del riesgo puede generar tener un libro de opcio-nes cubierto con ratios de mınima varianza pero cuyo riesgo se mide en terminos dedelta, estimar y comparar la gamma de ambas estrategias de cobertura, etc.

Referencias

[1] Robins, R.P. & Schachter, B: “An analysis of the risk in discretely rebalancedoption hedges and delta-based techniques”, Management Science 40 (1994), no.6, pp. 798–808.

[2] Robins, R.P., Sanders, R.W. & Schachter, B: “An empirical investigation of va-riance reduction throught non-delta-neutral hedging”, The Journal of Derivatives4 (1996), no. 2, pp. 59–69.

[3] Rubinstein, M: “A simple formula for the expected rate of return of an optionover a finite holding period”, Journal of Finance 39 (1984), no. 5, pp. 1503–1509.

Rafael Salinas Martınez de LeceaGestion de Recursos Propios

Banco Bilbao Vizcaya ArgentariaPaseo Castellana, 81, pl. 3

28046-Madrid, Espanae-mail : [email protected]

Page 16: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM
Page 17: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

On the Relevance of Modeling

Volatility for Pricing Purposes

Manuel Moreno1

Abstract

This paper presents a two-factor (Vasicek-CIR) model of the term structureof interest rates. We assume that default-free discount bond prices are deter-mined by the time to maturity and two factors, the long-term interest rate andthe spread. Under no-arbitrage conditions, a general bond pricing equation isderived and a closed-form expression for bond prices is obtained. Empirical ev-idence of the model’s performance in comparison with a double Vasicek modelis presented. We conclude that the modeling of the volatility in the long rateprocess improves the fitting and prediction of medium- and long-term rates.However, for the shortest maturities, it is not so clear which is the best modelto use.

1 Introduction

The evolution over time of interest rates for default-free zero-coupon bonds is a topicthat has been extensively analyzed in the financial literature. Initially, the analysisof this evolution was performed by means of one-factor models which assume thatmovements in interest rates are driven by changes in the short-term (instantaneous)riskless interest rate (see, among others, Vasicek (1977), Cox et al (1985) or Chan etal (1992)). However, it is now widely accepted that interest rates are affected by morethan one state variable. In this direction, several papers as Richard (1978), Brennanand Schwartz (1979), Schaefer and Schwartz (1984), Cox et al (1985), Longstaff andSchwartz (1992), Duffie and Kan (1996), Chen (1996), Boudoukh et al (1999) andDai and Singleton (2000), use multiple factors to explain the future movements thatinterest rates may show.

There is substantial empirical evidence2 that shows that movements in interestrates can be decomposed in three types of “basic” changes related to the level ofinterest rates, the slope, and the curvature of the yield curve. As the curvature isusually the less important explanatory variable when dealing with spot interest rates,

1Manuel Moreno Fuentes es Profesor Titular del Departament d’Economıa i Empresa de la Univer-sitat Pompeu Fabra y miembro del Centre de Recerca en Economıa Financera de dicha Universidad.Esta charla se impartio en la sesion del Seminario MEFF-UAM de febrero de 1998.

2See, for instance, Jones (1991), Litterman and Scheinkman (1991), Zhang (1993) and Knez et al(1994).

Page 18: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

10 Manuel Moreno

we can think that movements in spot interest rates may be reasonably well explainedby the two first factors.

In fact, this is the motivation for the model previously presented and developedby Moreno (1996) which uses the long-term interest rate and the spread of interestrates as state variables (that is, the difference between the short-term interest rateand the long-term interest rate is used as a rough measure of the slope of the yieldcurve). In that paper, both factors are assumed to follow a Vasicek process and,therefore, both variables (1) show mean reversion to a certain long term value and (2)their diffusions reflect a constant variance term. Under these assumptions, a generalbond pricing equation was derived and a closed-form expression for zero-coupon bondand for interest rate derivatives prices was computed, This paper also presented theempirical performance of this model in relation to an alternative one-factor model.

It can be argued that one of the assumptions made by Moreno (1996), namely,the constant variance in the diffusion of the processes followed by both factors istoo restrictive from an empirical point of view.3 This restrictive feature leads to thepresent paper whose main objective is to analyze if modeling the volatility improvesthe empirical performance of the Moreno (1996) model. Thus, the same state variableswill be used although we will assume that the long-term interest rate does not followa Vasicek process but a root-square (CIR-type) process. This alternative model willbe denoted hereafter as the Vasicek-CIR model and it can be considered, from atheoretical point of view, as an special case of the Schaefer and Schwartz (1984)model.

The schedule of this paper is as follows. Section 2 presents the main assumptionsof the Vasicek-CIR model and provides the basic pricing equation that any derivativeasset must satisfy. This equation, with the appropriate terminal condition, allows usto obtain the price of any asset that, at maturity, pays a certain payoff as indicatedin such terminal condition. In this section we (a) compute the analytical expressionthat indicate the price of any discount bond under the assumptions given by thistwo-factor model and (b) recall the analogous formula that was obtained by Moreno(1996) (Vasicek-Vasicek model hereafter). Section 3 analyzes the empirical behaviorof both models by comparing the usefulness of these alternative formulas to fit andforecast bond prices, that is, the in- and out-of-sample performance of such expres-sions. The data analyzed correspond to Spanish interest rates and bond prices fordifferent maturities during the period 1991-1995. Finally, Section 4 summarizes andconcludes.

3Interest rate volatility is usually increasing in interest rate level although there is no consensusabout the exact relationship between volatility and level. See Chan et al (1992), Aıt-Sahalia (1996),Conley et al (1997) and Stanton (1997) for this issue.

Page 19: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

On the Relevance of Modeling Volatility for Pricing Purposes 11

2 The Bond Pricing Equation

In this section we present the two-factor (Vasicek-CIR) model that we will use to pricedefault-free discount bonds by deriving (and solving) the pricing equation which mustbe verified by the prices of these bonds.

The main assumption of this model is that the price, at time t, of a default-freediscount bond that pays $1 at maturity T depends only on the current values of twostate variables and time to maturity, τ = T − t. The main motivation for the factorsto be used is the empirical evidence (see footnote 2) that changes in interest ratesare a combination of movements in (a) the level of interest rates, (b) the slope and(c) the curvature of the yield curve, whose effect is usually negligible. Therefore, wecan use the long-term rate and the spread as the variables that help us to explainthe movements in the general level of interest rates and changes in the relationshipbetween the short and the long end of the yield curve. With both variables, we canalso try to explain the intermediate movements of the yield curve.4

Although most previous studies use the short-term interest rate as one of thestate variable, we redefine these variables and, analogously to Schaefer and Schwartz(1984), we use the long-term rate, denoted by L, and the spread, denoted by s, thedifference between the short-term rate, denoted by r, and the long-term rate. Thisselection of state variables allows us to use the assumption of orthogonality betweenthem.5

Once chosen these variables, we assume that their evolution over time is given bythe following stochastic differential equations6:

ds = β1(s, L) dt + σ1(s, L) dw1 ,

dL = β2(s, L) dt + σ2(s, L) dw2 ,(1)

where t denotes calendar time, and dw1 and dw2 are standard Brownian processeswhere E[dw1] = E[dw2] = 0, dw2

1 = dw22 = dt, and (by the orthogonality assumption)

it is verified that E[dw1dw2] = 0. β1(·) and β2(·) are the expected instantaneous ratesof change in the state variables and σ2

1(·) and σ22(·) are the instantaneous variances

of changes in these factors.

Let P (s, L, t, T ) ≡ P (s, L, τ) be the price, at time t, of a default-free discount bondthat pays $1 at maturity T = t + τ . We can express the instantaneous percentage

4Two alternative couples of factors to be used may be: (a) the long-term interest rate and theshort-term interest rate and (b) the short-term interest rate and the spread. However, the above twovariables are chosen because of a better analytical tractability.

5This assumption simplifies the analytical tractability of the model. Empirical evidence thatsupports this assumption can been seen in Ayres and Barry (1980), Schaefer (1980), Nelson andSchaefer (1983) and, for the Spanish case, in Moreno (1996).

6After presenting this generic model and deriving the general pricing equation, we will particu-larize it to obtain the Vasicek-CIR model

Page 20: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

12 Manuel Moreno

change in the price of this bond as the sum of its expected rate of return and theunexpected variations in return due to the random changes in the factors

dP (s, L, t, T )P (s, L, t, T )

= µ(s, L, t, T ) dt + s1(s, L, t, T ) dw1 + s2(s, L, t, T ) dw2 . (2)

The steps to be given to obtain the bond pricing equation are very standard7 and canbe summarized as follows:

1. Application of Ito’s Lemma.

2. Setting up of a (hedging) portfolio, composed of three bonds with differentmaturities, that is instantaneously riskless.

3. Under no-arbitrage conditions, the expected rate of return of this portfolio mustequate the instantaneous riskless rate of interest.

These three steps jointly with a little algebra lead us to the following partial differ-ential equation:

12

[σ21(·)Pss + σ2

2(·)PLL] + [β1(·) − λ1(·)σ1(·)]Ps +

[β2(·) − λ2(·)σ2(·)]PL + Pt − r P = 0 , (3)

where subscripts denote partial derivatives. The coefficients λ1(·) and λ2(·) can beinterpreted as the market prices of the spread and long-term rate risk, respectively.

Therefore, given the stochastic process (1) we have assumed for both variables, (3)is the fundamental equation for the pricing of default-free discount bonds of differentmaturities which depend solely on the spread, the long-term interest rate, and its timeto maturity. In this equation we deal with the market prices of risk, λi(·), because theonly way to tie down the bond prices in our (partial equilibrium) model is by meansof these (exogenous) parameters.

The solution of the equation (3), subject to the terminal condition given by thefinal payment of the bond, P (s, L, 0) = 1, ∀ s, L, is the price of the discount bond weare looking for.

The coefficients of the bond pricing equation (3) are the parameters of the stochas-tic process (1) which was assumed for the two factors and the market prices of therisk related to both state variables. As this equation is too general to be solvedanalytically, we will make the following assumptions about these coefficients:

Assumption 1 The market price of the spread risk is linear in this variable, that is

λ1(·) = a + bs .

7For more details, see Moreno (1996).

Page 21: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

On the Relevance of Modeling Volatility for Pricing Purposes 13

Assumption 2 The market price of the long-term rate risk is proportional to thesquare root of this variable, that is

λ2(·) = d√

L .

Assumption 3 Each of the state variables follow a diffusion process

ds = k1(µ1 − s) dt + σ1 dw1 ,

dL = k2(µ2 − L) dt + σ2

√L dw2 .

(4)

The motivation for the first two assumptions is that a constant market price of riskis too restrictive and quite unrealistic. The first assumption generalizes of the onepresented in Vasicek (1977) while the second one is similar to the one obtained in Coxet al (1985). Regarding the third assumption, the first process, known as Ornstein-Uhlenbeck process, has been used previously by Vasicek (1977) while the second onewas proposed by Cox et al (1985). Both processes show mean reversion, an importantstylized fact that interest rates usually show. In the process assumed for the spread,we find a constant variance in the diffusion term while the variance of the long-termrate is proportional to its level. For each state variable, ki > 0 is the coefficientof mean reversion which reflects the speed of adjustment of the variable towards itslong-run mean value, µi, and dwi are standard Brownian motions.

Under these three assumptions, we can rewrite the equation (3) as

12

σ21 Pss + q1 (µ1 − s)Ps +

12

σ22 L PLL + q2 (µ2 − L)PL + Pt − (L + s)P = 0 , (5)

subject to the terminal condition

P (s, L, 0) = 1, ∀ s, L , (6)

where

q1 = k1 + b σ1 , µ1 = (k1 µ1 − a σ1)/q1 ,

q2 = k2 + dσ2, µ2 = k2 µ2/q2 .

Solving the partial differential equation (5) we obtain the following proposition:

Proposition 1 The value at time t of a discount bond that pays $1 at time T ,P (s, L, t, T ) ≡ P (s, L, τ), is given by

P (s, L, t, T ) = A(τ) e−B(τ)s−C(τ)L , (7)

Page 22: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

14 Manuel Moreno

where τ = T − t and

A(τ) = A1(τ)A2(τ) ,

A1(τ) = exp− σ2

1

4q1B2(τ) + s∗(B(τ) − τ)

,

A2(τ) =

[2γ exp

(q2 + γ) τ

2

(q2 + γ) expγτ + (γ − q2)

]2k2µ2/σ22

, (8)

B(τ) =1 − e−q1τ

q1,

C(τ) =2(expγτ − 1)

(q2 + γ) expγτ + (γ − q2),

withq1 = k1 + bσ1, µ1 = (k1µ1 − aσ1)/q1, s∗ = µ1 − σ2

1/(2q21) ,

q2 = k2 + dσ2, µ2 = k2µ2/q2, γ =√

q22 + 2σ2

2 .(9)

Proof: See Appendix.

The terms in equation (8) verify

0 < Ai(τ) < 1, ∀ τ > 0, Ai(0) = 1, Ai(∞) = 0, i = 1, 20 < B(τ) < τ, ∀ τ > 0, B(0) = 0, B(∞) = 1/q1 , (10)0 < C(τ) < τ, ∀ τ > 0, C(0) = 0, C(∞) = 2/(q2 + γ) .

Substituting t = T into (7), it is shown that the terminal condition for the price bond,P (s, L, 0) = 1, ∀ s, L, is satisfied. Moreover, it is also derived that

P (0, 0, τ) = A(τ) = A1(τ)A2(τ) < 1, ∀ τ > 0 .

It can be checked that the following realistic features are verified

lims→∞P (s, L, τ) = lim

L→∞P (s, L, τ) = lim

τ→∞ P (s, L, τ) = 0 ,

that is, when any of the arguments included in the bond price formula tends to infinity,the price converges to zero. It is also easily shown that the bond price function isdecreasing and convex in both factors and decreasing with the time to maturity.

Once we have obtained the expression (and properties) for the bond price formulaunder the Vasicek-CIR model, we will recall the assumptions made by Moreno (1996)and the corresponding pricing formula that was derived in that paper:

Assumption 1’ (equal to Assumption 1) The market price of the spread risk islinear in this variable, that is

λ1(·) = a + b s .

Page 23: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

On the Relevance of Modeling Volatility for Pricing Purposes 15

Assumption 2’ The market price of the long-term rate risk is linear in this variable,that is

λ3(·) = c + dL .

Assumption 3’ Each of the state variables follow a diffusion process of Vasicek typeds = k1(µ1 − s)dt + σ1dw1

dL = k3(µ3 − L)dt + σ3dw3

(11)

Under these assumptions, we can rewrite the equation (3) as

12σ2

1Pss + q1(µ1 − s)Ps +12σ2

3PLL + q3(µ3 − L)PL + Pt − (L + s)P = 0 , (12)

where

q1 = k1 + bσ1 , µ1 = (k1µ1 − aσ1)/q1 ,

q3 = k3 + dσ3 , µ3 = (k3µ3 − cσ3)/q3 .

The solution of the differential equation (12), subject to the terminal condition givenby the payoff of the bond at maturity (see equation (6)), was established in thefollowing proposition:

Proposition 2 (Proposition 1 in Moreno (1996)) The value at time t of a dis-count bond that pays $1 at time T , P (s, L, t, T ) ≡ P (s, L, τ), is given by

P (s, L, τ) = D(τ) e−E(τ)s−F (τ)L , (13)

where τ = T − t and

D(τ) = D1(τ)D3(τ) ,

D1(τ) = exp− σ2

1

4q1E2(τ) + s∗(E(τ) − τ)

,

D3(τ) = exp− σ2

3

4q3F 2(τ) + L∗(F (τ) − τ)

, (14)

E(τ) =1 − e−q1τ

q1,

F (τ) =1 − e−q3τ

q3,

withq1 = k1 + bσ1 , µ1 = (k1µ1 − aσ1)/q1 , s∗ = µ1 − σ2

1/(2q21) ,

q3 = k3 + dσ3 , µ3 = (k3µ3 − cσ3)/q3 , L∗ = µ3 − σ23/(2q2

3) .(15)

Proof: It is similar to the proof of Proposition 1 and it is omitted for the sake ofbrevity.

Page 24: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

16 Manuel Moreno

3 Empirical Application

In this section, we describe the empirical application in which we compare the fittingand forecasting behavior of the Vasicek-CIR and the Vasicek-Vasicek models. Thiscomparison is performed analyzing the in- and out-of-sample properties of both mod-els. The dataset consists of daily Spanish interest rates and zero-coupon bond pricesand cover the period 1991-1995.8

For each day of this period, we have interest rates (in annualized form) and bondprices for ten different maturities: 1, 7, and 15 days, 1, 3, and 6 months, and 1,3, 5, and 10 years. The interest rates corresponding to the shortest and longestmaturity (1 day/10 years) are used as proxies of the short- and long-term interestrate, respectively.

The main descriptive characteristics of the state variables used in both two-factormodels are:

1. For both interest rate series, the unconditional average is larger than 10%.Short-term interest rates are larger than this mean value until October 1993while the long-term interest rates exceed this level in the whole period exceptfrom June 1993 through June 1994. On the other hand, the spread has a meanvalue very close to zero and ranges between −4% and 8%.

2. The short-term rate is more volatile and moves into a wider interval than long-term rate does.

3. Both state variables show an uniformly high degree of serial correlation.

4. Most of the changes in short-term interest rates are smaller than 100 basis pointswhile changes in long-term rates are much smoother. As a consequence, changesin the spread are quite similar to changes in short-term interest rates.

5. It is seen a small decrease - in mean - in interest rates through the sampleperiod.

6. Evidence of mean reversion in spread and interest rates is derived.

7. The theoretical assumption about the orthogonality between the state variablesis empirically corroborated.

Next we present the empirical performance of both models. We recall that both mod-els use the same factors and the differences between them derive from the alternativeprocesses assumed for the long-term rate, L.

Each state variable of the two competing models, s and L, follows a diffusionprocess (see equations (4) and (11)). The diffusion parameters of these processes

8For more details on these data, see Nunez (1995) for technical details on the estimation procedureused by the Bank of Spain, and Moreno (1996) for a descriptive and graphical analysis.

Page 25: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

On the Relevance of Modeling Volatility for Pricing Purposes 17

(ki, µi, σi, i = 1, 2, 3) are estimated by the Generalized Method of Moments pre-sented in Hansen (1982)9. The econometric specification in discrete time is

st − st−1 = a1 + b1st−1 + εst , εs

t ∼ IID (0, σ21)

Lt − Lt−1 = a2 + b2Lt−1 + εLt , εL

t ∼ IID (0, σ22 Lt−1)

Lt − Lt−1 = a3 + b3Lt−1 + εLt , εL

t ∼ IID (0, σ23)

so thatki = −bi, µi = −ai

bi, i = 1, 2, 3 .

Table I includes the estimation results obtained for the sample period 1991-1995and shows that the parameters bi of the discrete time specification (and hence, thediffusion parameters ki) are significantly different from zero. So, there is evidence ofmean reversion in all the state variables.

In both models, the long-term interest rate tends to a mean value close to 10%while the spread tends to a mean value close to zero. Comparing the two processesassumed for the long-term rate, it may be interesting to recognize that, under theCIR model, the long rate reverts faster to its long-term value than when consideringthe Vasicek assumption.

After estimating the parameters of the diffusion processes followed by the factorsin both models, these values are used to obtain the remaining parameters of equations(7) and (13). Thus, similarly to Moreno (1996), we use the specifications

P = P (q1, q2, s∗|k1, k2, µ1, µ2, σ1, σ2; s, L, τ) + ε ,

P = P (q1, q3, s∗, L∗|k1, k3, µ1, µ3, σ1, σ3; s, L, τ) + ε ,

(16)

where P is the observed price of the discount bonds available at time t, P (·) is theclosed-form pricing equation for each model (see equations (7) and (13)) and ε is anerror term.

The parameters of the equations (16) (qi, i = 1, 2, 3, s∗, L∗) are estimated on adaily basis for the period 1991-1995 by means of a panel of data where we have dailyyield curves containing a cross-section of discount bond prices. Therefore, we havea matrix with 1230 rows and 10 columns where each row includes the (ten) zero-coupon bond prices available at each day and each column contains the bond pricesfor a certain maturity.

We estimate the non-linear equations (16) for each day of the period 1991-1995.The estimation of the first equation provides the parameters of the Vasicek-CIR model(that is, q1, q2, s∗) while the estimation procedure, when applied to the second equa-tion, provides the parameters of the Vasicek-Vasicek model, that is, q1, q3, s∗, L∗.

9For details on this technique and its applications in the estimation of continuous-time models,see Moreno and Pena (1996).

Page 26: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

18 Manuel Moreno

Estimation results for the daily parameters of the Vasicek-CIR model are includedin Table II.10 This table shows the average of the estimated parameters obtained for(a) the full sample period and (b) the sample period divided year by year and reflectsthat all the parameters are positive and highly significant.

The evolution over time of these parameters can be seen graphically in Figure 1.This figure shows that the highest values are attained in 1991 while the lowest (andmore stable) parameters correspond to the period 1994-1995.

In the next step, we can compute the values, day by day, of the market pricesof risk related to each state variable using the estimated parameters obtained fromequation (16) jointly with the expressions (9) and (15) and the Assumptions 1 and2. A graphical representation of these values, for the Vasicek-CIR model, can be seenin Figure 2. The average values of these prices - under both models - for the wholeperiod and for every year, are included in Table III.

Analyzing the two factors of the Vasicek-CIR model, both market prices of riskare highly significant and have a similar behavior across the period 1991-1995: eachprice has always the same sign during all the period 1991-1995 (for the long-termrate, the market price of risk is always positive and the risk related to the spread hasalways a negative price) and both series of market prices are specially low in 1992 andthe second half of the period 1991-1995. In absolute terms, the price of the spreadrisk is, at every moment, much higher than the price of risk of the long-term rate.

On the other hand, for the Vasicek-Vasicek model, we can observe a very differentbehavior between both factors and with respect to the alternative model. Thus, thetwo basic features for the prices of risk in this model are:

1. For the full period, the market prices of risk for both state variables are positiveand significantly different from zero.

2. Analyzing this period on a yearly basis, the parameters are also significantlydifferent from zero but they show a changing sign. Thus, the mean marketprice of risk of the spread is negative in the last two years of the sample periodwhile the average of the market price of risk related to the long-term rate isnegative in 1991-1992 and 1994.

Finally, we will use the values of the diffusion parameters jointly with the parametersestimated in the equation (16) to analyze the fitting and forecasting power of bothtwo-factor models. The within- and out-of-sample periods are 1991-1994 and 1995,respectively.

First, the in-sample estimated data, for each day of the period 1991-1994 and forboth models, are provided by the inclusion of the (daily) estimated parameters andthe estimated parameters of the diffusion processes in the non-linear equation (16).

10We do not show the results for the Vasicek-Vasicek model that can be seen in Table VIII inMoreno (1996). That paper provided all the results for the Vasicek-Vasicek model that are includedin the following tables in this paper.

Page 27: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

On the Relevance of Modeling Volatility for Pricing Purposes 19

Next, we will compare the out-of-sample properties of both models by using thek-step-ahead forecasts that are generated for the bond prices. These t + k-time fore-cast values are built using the coefficients estimated from time t. This procedure isrepeated for each day of 1995.

After obtaining the in- and out-of-sample forecasts, the (within and out-of-sample)pricing errors of both models are computed to compare each other. Thus, we define,for time t, the error, et, and the percentage error, PEt, as

et = Pt − Pt, PEt =Pt − Pt

Pt× 100 ,

where Pt and Pt are, respectively, the observed and the estimated (fitted or forecasted)price, for time t, of the zero-coupon bond with a certain maturity.

For both models, the within-sample (absolute and percentage) pricing errors areshown in Figures 3 and 4. For all the maturities, it can be seen that the Vasicek-Vasicek model provides a very large pricing error in May, 1993. This error coincideswith a sharp change in the short-term rate and in the spread. For both models,neither figure suggests a systematic pattern in these pricing errors.

Denoting by N the number of days of the period to be analyzed, we use the pricingerrors to compute several accuracy measures that help us to compare the empiricalperformance of both models:

1. Mean Error (ME). This measure weights equally the daily errors. Therefore,positive values can be offset with negative values and, thus, this measure maybe small even with large errors. Its expression is

ME =1N

N∑t=1

et =1N

N∑t=1

(Pt − Pt) .

2. Mean Absolute Error (MAE). As the mean error, this measure gives anequal weight to the daily errors but positive and negative errors do not cancelout. It is defined as

MAE =1N

N∑t=1

|et| =1N

N∑t=1

|Pt − Pt| .

3. Root Mean Squared Error (RMSE). It is usually the most common mea-sure of accuracy and its definition is

RMSE =

√√√√ 1N

N∑t=1

(et)2 =

√√√√ 1N

N∑t=1

(Pt − Pt)2 .

Page 28: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

20 Manuel Moreno

4. Mean Percentage Absolute Error (MAPE) Similarly to the mean absoluteerror, the absolute value of the error is used but each error is weighted by thecurrent value of the bond price. Its expression is

MAPE =1N

N∑t=1

|PEt| .

5. Root Mean Squared Percentage Error (RMSPE). This measure is similarto the root mean squared error but, similarly to the MAPE, the daily errors areweighted by the actual bond prices. It is given by

RMSPE =

√√√√ 1N

N∑t=1

(PEt)2 .

These five descriptive measures, for both models, are computed for 1991-1994 (withinsample period), for 1995 (out-of-sample period) and for different subperiods. Thewithin and out-of-sample results are reported in Tables IV-VI and Tables VII-X,respectively.

The performance of both models, for the within-sample period, is included in TableIV. For this period, the Vasicek-Vasicek model underprices the short- and medium-term bonds and overprices the bonds whose maturity is beyond one year. On theother hand, the Vasicek-CIR model overprices the bonds with maturities up to threemonths as well as the 5-year bonds.

All the statistics included in Table IV reflect that both models provide a verybig accuracy to the observed bond prices for all the maturities. It can be seen thatthe pricing errors are increasing with the maturities (the longer the maturity, thelarger the error price) but the MAPE for the Vasicek-Vasicek and the Vasicek-CIRmodels is smaller than 0.26% and 0.02%, respectively. Moreover, in the Vasicek-CIR(Vasicek-Vasicek) model, this statistic is always smaller than 0.01% (0.08%) exceptfor the 5-year bond price.

Comparing both models, the Vasicek-CIR model outperforms the Vasicek-Vasicekmodel for all maturities and for all the statistics. In short-term bonds, with maturi-ties smaller than one month, both models provide negligible errors and the relativeimprovement obtained with the Vasicek-CIR model is not very large.

On the other hand, focusing on the maturities beyond one month, the Vasicek-CIR model provides a huge improvement: the errors from the Vasicek-Vasicek modelare decreased in more than 88% for all these maturities. The biggest improvementin accuracy is achieved in the medium-term maturities (six month and one year) andin 5-year bonds, maturity in which the error measures from the Vasicek-CIR modelare about 6% of the error measures provided by the Vasicek-Vasicek model. Thisconclusion is obtained for all the statistics.

Page 29: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

On the Relevance of Modeling Volatility for Pricing Purposes 21

Table V includes the results obtained for the year 1992. Similarly to the period1991-1994, the Vasicek-Vasicek model underprices the shortest maturities (up to sixmonths). In contrast to what happened in the whole within-sample period, thisunderpricing can also be seen in the Vasicek-CIR model which, on the other hand,overprices the bonds that mature beyond one year.

In this year, both models fit the observed data specially well. The error measuresfor both models are decreased in more than half for most of the maturities with respectto the whole period. Comparing both models, the error measures of the Vasicek-CIRmodel, as in the within-sample period, are about 10% of the statistics provided bythe Vasicek-Vasicek model for all the maturities longer than 15 days.

Therefore, the main conclusion for this year is the same than the obtained for theperiod 1991-1994: for the shortest maturities, both models fit specially well to thedata but, for most of the remaining maturities, the Vasicek-CIR model provides aremarkable large improvement in accuracy.

Several subperiods have been analyzed and, basically, the same conclusions arereached. For illustrative purposes, Table VI includes the within-sample results ob-tained for 1-year bonds for each semester of the period 1991-1994.

Looking at every statistic, it is shown that the Vasicek-CIR model fits better thanits competing model in all the semesters and it works specially well in 1991 and 1994while the Vasicek-Vasicek model obtains its best performance in the first semester of1992 and in the second one of 1994.

Based on a mean absolute error (MAE or MAPE) criterion, the superiority of theVasicek-CIR model implies an improvement of about 90% in all the semesters but thelast one in which the errors from the Vasicek-Vasicek model are decreased in ’just’77%.

For all the semesters, the mean absolute percentage error of the Vasicek-CIR modelis around 0.003% that is about fifteen times smaller than the obtained for the Vasicek-Vasicek model. This superiority is specially remarkable in the second semester of 1991and in the first one of 1994 when the absolute value of the errors are decreased inmore than 96%.

The forecasting power of both models is analyzed by computing one- and five-stepahead forecasts11 of bond prices for every maturity and for every day of the year 1995.Measures of the forecasting pricing errors are included in Tables VII-X.

Tables VII-VIII include the measures for one-step-ahead forecasts. Table VIIprovides the one-step-ahead measures for the whole out-of-sample period. It can beseen that (1) both models forecast quite well, (2) the forecasting power decreases withthe time to maturity, and (3) for both models, the MAPE (RMSPE) is always smallerthan 0.36% (0.48%). It can also be seen that both models perform similarly for the

11Ten-step-ahead forecasts were also computed. Results are available upon request.

Page 30: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

22 Manuel Moreno

shortest maturities and, in fact, the Vasicek-Vasicek model performs slightly betterthan the Vasicek-CIR model.

For maturities beyond one month, the Vasicek-CIR model forecasts better thanthe Vasicek-Vasicek model showing that the modeling of the volatility in the long-termrate process helps to predict the movements in the medium- and long-term interestrates.

This superior forecasting performance is not monotonic in the time to maturity:the largest improvement is obtained in the 1-year bond prices when the error measuresfrom the Vasicek-Vasicek model are decreased in more than 21% (15%) when workingon a (root) mean absolute criterion. In the remaining bonds, the improvement in therelative forecasting power is much smaller (2−7%) and never exceeds 12%, value thatis obtained when forecasting the 5-year bonds.

Table VIII provides the error measures obtained, for every month of 1995, from1-year bonds in which the Vasicek-CIR model achieves its best relative performance.Both models perform better in the second semester (with a MAPE (RMSPE) smallerthan 0.06% (0.08%)) than in the first one, when the MAPE (RMSPE) reaches 0.1%(0.12%). It can also be seen a similar behavior in both models from January to April(with a small superiority of the Vasicek-Vasicek model in this period) and in the twolast months of 1995. In the period May-October, the Vasicek-CIR model leads to animprovement of the out-of-sample performance that ranges between 20% (in May)and 65% (in July).

Finally, Tables IX-X show the results obtained when the forecasting horizon isfive days. Table IX includes the measures obtained with the out-of-sample errors forall the maturities in 1995. Although these measures are bigger than in the previousforecasts, they are reasonably small as reflected in the MAPE or the RMSPE thatare, for both models, smaller than 0.8% and 1%, respectively.

Results are analogous to the obtained with the previous predictions: (1) the fore-casting power decreases with time to maturity, (2) the Vasicek-Vasicek model outper-forms its rival model in the maturities smaller than six months, and (3) the Vasicek-CIR forecasts better than the Vasicek-Vasicek model in the maturities beyond sixmonths. However, this improvement is usually quite small (between 1% and 3%) andonly increases until 5% when forecasting 1-year bond prices.

Finally, Table X provides the quarterly results obtained with five-step-ahead fore-casts for 1- and 5-year bonds. In both maturities, it can be seen a better forecastingbehavior in the second half of 1995 than in the first one. For 1-year bonds, both mod-els show a MAPE smaller than 0.2% in all the quarters and the Vasicek-CIR modeloutperforms the Vasicek-Vasicek model whose error measures are decreased between5% and 15% in the period April-September.

Focusing on the forecasting errors for 5-year bond prices, the MAPE statisticranges between 0.6% and 1%. In this case, the Vasicek-CIR model improves the fore-

Page 31: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

On the Relevance of Modeling Volatility for Pricing Purposes 23

casts from its competing model in 10% from July to September and, in the remainingsubperiods, its improvement is much smaller (1 − 2%).

4 Conclusions

This paper has presented a two-factor (Vasicek-CIR) model in continuous time for theanalysis of the terms structure of interest rates and its empirical behavior has beenanalyzed with respect to a second alternative model. The main common characteristicof these two models is that both employ the same factors (state variables) to explainthe unexpected changes that interest rates may show in the future. These factors arethe long-term interest rate and the spread, the difference between the short- and thelong-term interest rate.

The Vasicek-CIR model assumes that the spread follows a Vasicek process whilethe long-rate is modeled as a CIR-type process. On the other hand, the Vasicek-Vasicek model has assumed that both variables follow a Vasicek process. This secondmodel was previously presented by Moreno (1996) which also developed its pricingproperties, the implications on the term structure of interest rates and analyzed itsempirical properties with a sample of daily interest rates and bond prices during theperiod 1991-1995.

The main objective of this paper is analyze and compare the empirical performanceof both models in the period 1991-1995. Therefore, we can determine if modeling thevolatility of the long-term interest rate may help us to explain the future movementsof interest rates. As a starting point, we have derived a bond pricing equation whosesolution indicates the price of a zero-coupon bond under certain assumptions, namely,this price depends solely on the current values of two state variables (mentioned above)and the time to maturity of the bond.

After this solution is obtained, it is used to analyze the fitting and forecastingproperties of this model. These properties are, in a posterior stage, compared withthe ones derived from the Vasicek-Vasicek model. The parameters of our competingmodels have been estimated in two steps. In the first one, the parameters of the diffu-sion processes have been estimated by the Generalized Method of Moments by Hansen(1982). Once these values are obtained, the remaining parameters are estimated byusing a cross-section technique. As a result of this combination of estimation meth-ods, we have been able to obtain the daily market prices of risk corresponding to thestate variables for both models.

It has been shown that, for the Vasicek-CIR model, these market prices of riskare highly significant and have a constant sign during all the period 1991-1995. Onthe other hand, under the Vasicek-Vasicek model, it can be seen that these pricesare significantly different from zero and positive for 1991-1995 although they show achanging sign when analyzing on a yearly basis this period.

Page 32: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

24 Manuel Moreno

Finally, we have analyzed the fitting and forecasting power of both models. Thewithin- and out-of-sample periods are 1991-1994 and 1995, respectively. After com-puting the within- and out-of-sample forecasts, the pricing errors of both models (andseveral accuracy measures) for different subperiods have been obtained to compareone each other.

All these statistics show the following facts: (1) both models provide a very bigaccuracy to the observed bond prices for all the maturities, (2) the pricing errorsare increasing with the maturities, (3) the MAPE for the Vasicek-Vasicek and theVasicek-CIR models is smaller than 0.26% and 0.02%, and (4) in the Vasicek-CIR(Vasicek-Vasicek) model, this statistic is always smaller than 0.01% (0.08%) exceptfor the 5-year bond price.

Comparing both models, it can be seen that (1) the Vasicek-CIR model outper-forms the Vasicek-Vasicek model for all maturities and for all the statistics, (2) inmaturities smaller than one month, both models provide negligible errors and the rel-ative improvement obtained with the Vasicek-CIR model is not very large, (3) dealingwith maturities greater than one month, the errors from the Vasicek-Vasicek modelare decreased in more than 88% for all these maturities, (4) the biggest improvement(about 90−94%) in accuracy is achieved in the medium-term maturities and in 5-yearbonds. Several subperiods have been analyzed and the same conclusions are reached.

The forecasting power of both models has been analyzed by computing one- andfive-step ahead forecasts for every maturity and for every day of the year 1995. Look-ing at one-step-ahead forecasts, it has been shown that - similarly to the within-sampleperiod - both models perform quite well, the forecasting power decreases with the timeto maturity and, for the shortest maturities, both models perform in a similar way.However, for maturities beyond one month, the Vasicek-CIR model forecasts bet-ter than the Vasicek-Vasicek model although this superior forecasting behavior is notmonotonic in the time to maturity. Best relative performance is obtained in the 1-yearbond prices when the error measures from the Vasicek-Vasicek model are decreasedin more than 21%. In the remaining bonds, the improvement is much smaller rangingbetween 2% and 12%.

Finally, dealing with five-step-ahead forecasts, all the statistics reflect a worse per-formance than in the previous (shorter) forecasts although similar results are shown:(1) the forecasting power decreases with time to maturity, (2) the Vasicek-Vasicekmodel outperforms its rival model in the shortest maturities and (3) the Vasicek-CIRforecasts better than the Vasicek-Vasicek model in the maturities beyond six months.In this case, this improvement is usually quite small, between 1% and 5%.

Therefore, the main conclusion is that the modeling of the volatility in the long-term rate process can help (in a large amount) to fit the observed data and can improve- in a reasonable quantity - the prediction of future movements in the medium- andlong-term interest rates. However, for shorter maturities, it has been shown that thepricing errors are, basically, negligible and it is not so clear which is the best modelto be used.

Page 33: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

On the Relevance of Modeling Volatility for Pricing Purposes 25

Appendix: Proofs

Proof of Proposition 1

The method of the separation of variables allows us to write the solution of theequation (5) subject to (6) as

P (s, L, t, T ) = X(s, t, T ) Z(L, t, T ) , (17)

where X(s, t, T ) solves the equation

12σ2

1Xss + q1(µ1 − s)Xs + Xt − sX = 0 (18)

subject to the terminal condition

X(s, T, T ) = 1, ∀ s , (19)

and Z(L, t, T ) is the solution of the equation

12σ2

2LZLL + q2(µ2 − L)ZL + Zt − LZ = 0 , (20)

with terminal conditionZ(L, T, T ) = 1, ∀ L . (21)

To solve equation (18), we posit a solution of the type

X(s, t, T ) = X(s, τ) = A1(τ)e−B(τ)s . (22)

Hence, the equation (18) becomes

12σ2

1B2(τ) − q1(µ1 − s)B(τ) −[A′

1(τ)A1(τ)

− B′(τ)s]− s = 0 , (23)

where, from (19), the terminal conditions are given by

A1(0) = 1, B(0) = 0 . (24)

Equation (23) is linear in the variable s and, therefore, it becomes null when thecorresponding coefficients are equal to zero. Hence, this equation is equivalent to thefollowing system of first-order differential equations

q1B(τ) + B′(τ) − 1 = 0 (25)12σ2

1B2(τ) − q1µ1B(τ) − A′1(τ)

A1(τ)= 0 , (26)

subject to the terminal conditions (24).

Page 34: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

26 Manuel Moreno

We first solve (25) with terminal condition B(0) = 0. Including this solution in(26), integrating this equation, and using A1(0) = 1, we obtain

B(τ) =1 − e−q1τ

q1,

A1(τ) = exp− σ2

1

4q1B2(τ) + s∗(B(τ) − τ)

, (27)

wheres∗ = µ1 − σ2

1/(2q21) .

Replacing (27) into (22), we obtain the final expression for X(s, t, T ). In a similarway, to solve equation (20), we posit a solution of the type

Z(L, t, T ) = Z(L, τ) = A2(τ)e−C(τ)L . (28)

Hence, the equation (20) becomes

12σ2

2LC2(τ) − q2(µ2 − L)C(τ) −[A′

2(τ)A2(τ)

− C ′(τ)L]− L = 0 , (29)

where, from (21), the terminal conditions are given by

A2(0) = 1, C(0) = 0 . (30)

As equation (29) is linear in the variable L, this equation is equivalent to the followingsystem of first-order differential equations

12σ2

2C2(τ) + q2C(τ) + C ′(τ) − 1 = 0 , (31)

q2µ2C(τ) +A′

2(τ)A2(τ)

= 0 , (32)

subject to the terminal conditions (30).

We first solve (31). It is straightforward to show that this equation can be rewrittenas

− 2σ2

2

dC(τ)(C(τ) − c1)(C(τ) − c2)

= dτ ,

wherec1 =

−q2 + γ

σ22

> 0, c2 =−q2 − γ

σ22

< 0, γ =√

q22 + 2σ2

2 .

Integrating this equation and using the terminal condition C(0) = 0, it is obtainedthat

ln(

C(τ) − c2

C(τ) − c1

)= τ +

ln(

c2

c1

),

Page 35: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

On the Relevance of Modeling Volatility for Pricing Purposes 27

and a little algebra leads to

C(τ) =2 (expγτ − 1)

(q2 + γ) expγτ + (γ − q2). (33)

Once we know C(τ), we can solve the equation (32) or, equivalently

k2µ2C(τ) +A′

2(τ)A2(τ)

= 0 .

Integrating, we have

ln[A2(τ)] = −k2µ2

∫C(τ)dτ + kA . (34)

Let y = expγτ. Then, more algebra gives∫C(τ)dτ =

2σ2

2

[ln((q2 + γ) expγτ + (γ − q2)) − (q2 + γ)

τ

2

].

Replacing this expression in (34) and applying the condition A2(0) = 1, the finalexpression for A2(τ) is given by

A2(τ) =

[2γ exp

(q2 + γ) τ

2

(q2 + γ) expγτ + (γ − q2)

]2k2µ2/σ22

. (35)

Including (33) and (35) into (28), we obtain the final expression for Z(L, t, T ). Thisexpression, jointly with (22), gives the closed-form formula for the default-free dis-count bond prices for all maturities.

Tables and Figures

Table I. Estimates of the Diffusion ParametersThis table provides the parameter estimates (with t-values in parentheses) of the processes followed

by each state variable. The sample period is from January 1991 to December 1995. The parameters

are estimated by means of the Generalized Method of Moments applied to the following equations

st − st−1 = a1 + b1st−1 + εst , εs

t ∼ IID (0, σ21)

Lt − Lt−1 = a2 + b2Lt−1 + εLt , εL

t ∼ IID (0, σ22 Lt−1)

Lt − Lt−1 = a3 + b3Lt−1 + εLt , εL

t ∼ IID (0, σ23)

Variable a b k µ σ

Spread -2.08 ×10−6 -0.01544 0.01544 -0.1347 ×10−3 0.003467(-0.0210) (-3.0756) (3.0756) (-0.021)

Long-Term Rate 1.079 ×10−3 -0.01042 0.01042 0.103532 0.070703(CIR process) (3.5991) (-3.6285) (3.6285) (33.2787)

Long-Term Rate 0.732 ×10−3 -0.00728 0.00728 0.100574 0.001159(Vasicek process) (2.2968) (-2.3988) (2.3988) (20.881)

Page 36: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

28 Manuel Moreno

Table II. Averages of Pure Cross-Sectional RegressionsThis table contains the estimation results, for each day of the period 1991-1995, of the parameters(qi, i = 1, 2, s∗) in the closed-form pricing equation for the Vasicek-CIR model,

P (s, L, t, T ) = P (s, L, τ) = A(τ)e−B(τ)s−C(τ)L ,

where

A(τ) = A1(τ) A2(τ)

A1(τ) = exp

− σ2

1

4q1B2(τ) + s∗(B(τ) − τ)

, A2(τ) =

[ 2γ exp(q2 + γ) τ

2

(q2 + γ) expγτ + (γ − q2)

]2k2µ2/σ22

B(τ) =1 − e−q1τ

q1, C(τ) =

2(expγτ − 1)

(q2 + γ) expγτ + (γ − q2)

withq1 = k1 + bσ1, µ1 = (k1µ1 − aσ1)/q1, s∗ = µ1 − σ2

1/(2q21)

q2 = k2 + dσ2, µ2 = k2µ2/q2, γ =√

q22 + 2σ2

2

Numbers in parentheses represent the average of the t-statistics of cross-sectional regressions. Num-

bers in square brackets [.] represent the standard deviation of the time series of parameter estimates.

1991-1995 1991 1992 1993 1994 19950.6302 0.9068 0.4618 0.8731 0.5440 0.3577

q1 (120.66) (99.92) (116.21) (70.97) (154.12) (162.88)[0.5376] [0.7612] [0.2526] [0.7065] [0.1749] [0.1515]0.6461 0.8175 0.3490 1.2430 0.5823 0.2227

q2 (87.88) (92.79) (77.04) (117.71) (104.31) (46.68)[0.6430] [0.7786] [0.1967] [0.7156] [0.4736] [0.1431]0.0939 0.1059 0.0919 0.1010 0.0828 0.0876

s∗ (784.10) (1559.51) (572.70) (945.38) (580.79) (254.74)[0.0170] [0.0103] [0.0150] [0.0081] [0.0174] [0.0199]

Table III. Averages of Market Prices of RiskThis table contains the estimation results, for each day of the period 1991-1995, of the market

prices of risk (λi, i = 1, 2, 3) related to each state variable in both two-factor models. Numbers in

parentheses represent the average of the t-statistics of these estimates. Numbers in square brackets

[.] represent the standard deviation of the time series of market prices of risk estimates.

Panel A: Vasicek-CIR Model1991-1995 1991 1992 1993 1994 1995

λ1 -16.6370 -25.4189 -11.1207 -19.0044 -15.8773 -11.6185(Spread) (-89.24) (-89.14) (-76.07) (-86.83) (-118.56) (-75.26)

[13.0414] [21.2431] [7.3795] [11.5403] [6.1945] [5.9674]λ2 2.8754 3.8128 1.5872 5.5101 2.4110 0.9865

(Long rate) (85.99) (91.24) (74.87) (116.41) (102.51) (44.00)[2.9495] [3.6390] [0.9426] [3.4294] [1.9340] [0.6534]

Panel B: Vasicek-Vasicek Model1991-1995 1991 1992 1993 1994 1995

λ1 0.2386 3.1513 1.8632 2.6534 -0.7678 -5.7401(Spread) (5.09) (46.88) (34.10) (1.19) (-2.07) (-54.31)

[12.2793] [10.1866] [5.6779] [13.3915] [18.0933] [7.5040]λ3 4.8419 -8.4789 -6.9682 37.8514 -1.7900 2.8856

(Long rate) (15.22) (-49.31) (-30.41) (30.75) (-29.76) (1.75)[41.8299] [32.8720] [15.2471] [59.6728] [44.0095] [20.7386]

Page 37: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

On the Relevance of Modeling Volatility for Pricing Purposes 29

Table IV. Within-Sample Pricing Error Measures. 1991-1994This table contains the within-sample pricing error measures of both two-factor models for the period

1991-1994. We consider zero-coupon bonds with face value of $1 and with maturities ranging from

7 days to 5 years. We have computed five different error measures: the mean error (ME), the mean

absolute error (MAE), the root mean squared error (RMSE), the mean absolute percentage error

(MAPE) and the root mean squared percentage error (RMSPE).

Vasicek-CIR ModelMaturity ME MAE RMSE MAPE RMSPE7-day -0.000000 0.000001 0.000004 0.000083 0.00036615-day -0.000001 0.000002 0.000012 0.000175 0.0012141-month -0.000002 0.000004 0.000034 0.000382 0.0034713-month -0.000001 0.000008 0.000035 0.000803 0.0036516-month 0.000006 0.000013 0.000060 0.001373 0.0064021-year 0.000020 0.000032 0.000115 0.003515 0.0129153-year 0.000003 0.000061 0.000133 0.008256 0.0182305-year -0.000077 0.000119 0.000187 0.019644 0.030982

Vasicek-Vasicek ModelMaturity ME MAE RMSE MAPE RMSPE7-day -0.000000 0.000001 0.000004 0.000106 0.00042115-day 0.000000 0.000003 0.000015 0.000321 0.0015191-month 0.000003 0.000012 0.000053 0.001239 0.0054133-month 0.000034 0.000074 0.000273 0.007631 0.0282546-month 0.000109 0.000200 0.000712 0.021114 0.0756861-year 0.000241 0.000480 0.001457 0.053265 0.1625363-year -0.000081 0.000517 0.001156 0.070541 0.1591145-year -0.000481 0.001547 0.002887 0.256526 0.467754

Table V. Within-Sample Pricing Error Measures. 1992This table contains the within-sample pricing error measures of both two-factor models for the year

1992. Zero-coupon bonds with face value of $1 and with maturities ranging from 7 days to 5 years.

Vasicek-CIR ModelMaturity ME MAE RMSE MAPE RMSPE7-day 0.000000 0.000000 0.000000 0.000021 0.00003315-day 0.000000 0.000000 0.000001 0.000038 0.0000641-month 0.000001 0.000001 0.000001 0.000084 0.0001403-month 0.000004 0.000004 0.000005 0.000428 0.0005516-month 0.000011 0.000012 0.000015 0.001304 0.0016301-year 0.000023 0.000033 0.000041 0.003671 0.0046363-year -0.000012 0.000034 0.000048 0.004963 0.0070235-year -0.000069 0.000119 0.000146 0.020964 0.025712

Vasicek-Vasicek ModelMaturity ME MAE RMSE MAPE RMSPE7-day 0.000000 0.000000 0.000001 0.000035 0.00006815-day 0.000000 0.000001 0.000002 0.000124 0.0002301-month 0.000001 0.000005 0.000009 0.000533 0.0009403-month 0.000005 0.000037 0.000062 0.003838 0.0063576-month 0.000002 0.000109 0.000188 0.011595 0.0199691-year -0.000042 0.000305 0.000510 0.034493 0.0578273-year -0.000081 0.000349 0.000500 0.050313 0.0728725-year 0.000208 0.001013 0.001542 0.181938 0.281741

Page 38: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

30 Manuel Moreno

Table VI. Within-Sample Pricing Error Measures for 1-year BondsThis table contains the within-sample pricing error measures of both two-factor models for each

semester of the period 1991-1994. We consider zero-coupon bonds with face value of $1 and with

maturity of 1 year.

Vasicek-CIR ModelPeriod ME MAE RMSE MAPE RMSPE1991:I 0.000003 0.000023 0.000030 0.002556 0.0034261991:II 0.000007 0.000023 0.000033 0.002587 0.0037001992:I 0.000031 0.000037 0.000045 0.004192 0.0050081992:II 0.000015 0.000028 0.000037 0.003132 0.0042171993:I 0.000040 0.000052 0.000308 0.005884 0.0346211993:II 0.000039 0.000039 0.000045 0.004286 0.0048861994:I 0.000019 0.000024 0.000029 0.002616 0.0030801994:II 0.000008 0.000026 0.000047 0.002821 0.005079

Vasicek-Vasicek ModelPeriod ME MAE RMSE MAPE RMSPE1991:I -0.000138 0.000365 0.000708 0.041316 0.0797411991:II 0.000386 0.000663 0.001082 0.074359 0.1214251992:I -0.000062 0.000269 0.000428 0.030164 0.0480481992:II -0.000022 0.000342 0.000584 0.038968 0.0664391993:I 0.000586 0.000774 0.003241 0.086797 0.3646351993:II 0.000480 0.000493 0.001365 0.053847 0.1494081994:I 0.000753 0.000794 0.001435 0.085701 0.1548301994:II -0.000096 0.000113 0.000444 0.012277 0.048524

Table VII. Comparison of One-Step-Ahead Forecasts. 1995This table contains the out-of-sample pricing error measures of both two-factor models for the year

1995. We compute one-step-ahead forecasts for prices of zero-coupon bonds with face value of $1

and with maturities ranging from 7 days to 5 years.

Vasicek-CIR ModelMaturity ME MAE RMSE MAPE RMSPE7-day 0.000000 0.000016 0.000024 0.001649 0.00241215-day 0.000001 0.000032 0.000047 0.003247 0.0047451-month 0.000002 0.000067 0.000098 0.006782 0.0098993-month 0.000006 0.000176 0.000254 0.017962 0.0259696-month 0.000015 0.000292 0.000417 0.030523 0.0436801-year 0.000036 0.000457 0.000650 0.050227 0.0715883-year 0.000168 0.001273 0.001703 0.173836 0.2335875-year 0.000310 0.001847 0.002397 0.315120 0.411416

Vasicek-Vasicek ModelMaturity ME MAE RMSE MAPE RMSPE7-day 0.000000 0.000016 0.000024 0.001648 0.00241015-day 0.000000 0.000032 0.000047 0.003242 0.0047381-month -0.000001 0.000067 0.000098 0.006781 0.0098743-month -0.000016 0.000180 0.000255 0.018363 0.0260646-month -0.000065 0.000321 0.000436 0.033589 0.0456081-year -0.000209 0.000580 0.000767 0.063822 0.0844623-year -0.000239 0.001320 0.001790 0.180321 0.2454605-year 0.000961 0.002096 0.002760 0.357493 0.473140

Page 39: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

On the Relevance of Modeling Volatility for Pricing Purposes 31

Table VIII. Comparison of One-Step-Ahead Forecasts. 1-year BondsOut-of-sample pricing error measures of both two-factor models for each month of 1995. One-step-

ahead forecasts for prices of zero-coupon bonds with face value of $1 and with maturity of 1 year.

Vasicek-CIR ModelPeriod ME MAE RMSE MAPE RMSPE1995:I -0.000102 0.000830 0.001048 0.091516 0.1155831995:II 0.000037 0.000592 0.000726 0.065100 0.0797751995:III -0.000149 0.000758 0.000971 0.083832 0.1073401995:IV 0.000044 0.000679 0.000821 0.074892 0.0904391995:V -0.000086 0.000650 0.000798 0.071588 0.0879001995:VI 0.000056 0.000299 0.000367 0.032940 0.0404641995:VII 0.000081 0.000171 0.000284 0.018823 0.0312791995:VIII 0.000180 0.000285 0.000396 0.031256 0.0434471995:IX -0.000013 0.000339 0.000485 0.037148 0.0531501995:X 0.000047 0.000187 0.000264 0.020504 0.0289001995:XI 0.000147 0.000274 0.000377 0.029984 0.0411941995:XII 0.000217 0.000462 0.000650 0.050265 0.070714

Vasicek-Vasicek ModelPeriod ME MAE RMSE MAPE RMSPE1995:I -0.000128 0.000806 0.001028 0.088825 0.1134211995:II 0.000042 0.000598 0.000736 0.065687 0.0809221995:III -0.000157 0.000751 0.000966 0.082970 0.1067411995:IV 0.000007 0.000642 0.000755 0.070767 0.0832971995:V -0.000564 0.000861 0.000993 0.094891 0.1094571995:VI -0.000553 0.000726 0.000900 0.080044 0.0992491995:VII -0.000336 0.000522 0.000727 0.057492 0.0800251995:VIII -0.000311 0.000480 0.000628 0.052822 0.0690091995:IX -0.000476 0.000550 0.000713 0.060301 0.0780961995:X -0.000183 0.000272 0.000346 0.029797 0.0378961995:XI 0.000055 0.000278 0.000374 0.030352 0.0408521995:XII 0.000233 0.000458 0.000651 0.049808 0.070898

Table IX. Comparison of Five-Step-Ahead Forecasts. 1995Out-of-sample pricing error measures of both two-factor models for1995. Five-step-ahead forecasts

for prices of zero-coupon bonds with face value of $1; maturities ranging from 7 days to 5 years.

Vasicek-CIR ModelMaturity ME MAE RMSE MAPE RMSPE7-day 0.000000 0.000029 0.000041 0.002910 0.00411515-day 0.000001 0.000057 0.000081 0.005754 0.0081491-month 0.000003 0.000121 0.000171 0.012148 0.0172603-month 0.000019 0.000327 0.000471 0.033447 0.0481756-month 0.000062 0.000581 0.000855 0.060846 0.0895601-year 0.000194 0.001072 0.001558 0.117955 0.1715963-year 0.000868 0.003318 0.004242 0.452690 0.5810565-year 0.001312 0.004669 0.005904 0.795712 1.011933

Vasicek-Vasicek ModelMaturity ME MAE RMSE MAPE RMSPE7-day 0.000000 0.000029 0.000041 0.002909 0.00411215-day 0.000001 0.000057 0.000081 0.005751 0.0081351-month 0.000001 0.000120 0.000171 0.012137 0.0172043-month -0.000003 0.000327 0.000469 0.033434 0.0479366-month -0.000017 0.000590 0.000857 0.061792 0.0897731-year -0.000052 0.001140 0.001600 0.125428 0.1762663-year 0.000457 0.003296 0.004247 0.449916 0.5824095-year 0.001967 0.004852 0.006077 0.826338 1.039909

Page 40: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

32 Manuel Moreno

Table X. Comparison of Five-Step-Ahead Forecasts. 1- and 5-year BondsThis table contains the out-of-sample pricing error measures of both two-factor models for each

quarter of the year 1995. We compute five-step-ahead forecasts for prices of zero-coupon bonds with

face value of $1 and with maturity of 1 and 5 years. We report five different error measures: the

mean error (ME), the mean absolute error (MAE), the root mean squared error (RMSE), the mean

absolute percentage error (MAPE) and the root mean squared percentage error (RMSPE).

Panel A: 1-year Bonds

Vasicek-CIR ModelPeriod ME MAE RMSE MAPE RMSPE1995:I -0.000505 0.001652 0.002308 0.182288 0.2550001995:II 0.000180 0.001082 0.001431 0.119313 0.1576931995:III 0.000447 0.000698 0.000985 0.076596 0.1080321995:IV 0.000667 0.000860 0.001161 0.093834 0.126462

Vasicek-Vasicek ModelPeriod ME MAE RMSE MAPE RMSPE1995:I -0.000513 0.001642 0.002300 0.181183 0.2541491995:II -0.000186 0.001326 0.001612 0.146189 0.1777471995:III -0.000005 0.000761 0.001005 0.083563 0.1103991995:IV 0.000520 0.000836 0.001153 0.091139 0.125664

Panel B: 5-year Bonds

Vasicek-CIR ModelPeriod ME MAE RMSE MAPE RMSPE1995:I -0.001216 0.004647 0.006103 0.822578 1.0862291995:II 0.001559 0.005908 0.007249 1.021432 1.2510521995:III 0.001996 0.004360 0.005489 0.729830 0.9181561995:IV 0.002977 0.003765 0.004417 0.609400 0.711505

Vasicek-Vasicek ModelPeriod ME MAE RMSE MAPE RMSPE1995:I -0.000945 0.004740 0.006169 0.838764 1.0972821995:II 0.002615 0.005902 0.007305 1.019201 1.2587171995:III 0.003061 0.004897 0.005972 0.820306 1.0000551995:IV 0.003184 0.003853 0.004517 0.623691 0.727507

Page 41: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

On the Relevance of Modeling Volatility for Pricing Purposes 33

0 200 400 600 800 1000 1200 14000

5

10

Time

Par

amet

er q

1

Parameter q1 (Vasicek-CIR Model) 1991-1995

0 200 400 600 800 1000 1200 14000

5

10

Time

Par

amet

er q

2

Parameter q2 (Vasicek-CIR Model) 1991-1995

0 200 400 600 800 1000 1200 14000

0.1

0.2

Time

Par

amet

er s

*

Parameter s* (Vasicek-CIR Model) 1991-1995

Figure 1: Plot of pure-cross parameters in the Vasicek-CIR model.

0 200 400 600 800 1000 1200 1400-200

-150

-100

-50

0

Time

Mar

ket P

rice

Market Price of the Spread (Vasicek-CIR Model) 1991-1995

0 200 400 600 800 1000 1200 14000

10

20

30

40

Time

Mar

ket P

rice

Market Price of the Long-term Rate (Vasicek-CIR Model) 1991-1995

Figure 2: Plot of market prices of risk in the Vasicek-CIR model.

Page 42: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

34 Manuel Moreno

0 100 200 300 400 500 600 700 800 900 1000-1.5

-1

-0.5

0

0.5

1x 10

-4

--- Vasicek-Vasicek Model, ... Vasicek-CIR Model

Err

or

Error for 7-day Bonds

0 100 200 300 400 500 600 700 800 900 1000-4

-2

0

2

4x 10

-4

--- Vasicek-Vasicek Model, ... Vasicek-CIR Model

Err

or

Error for 15-day Bonds

0 100 200 300 400 500 600 700 800 900 1000-2

-1

0

1

2x 10

-3

--- Vasicek-Vasicek Model, ... Vasicek-CIR Model

Err

or

Error for 1-month Bonds

0 100 200 300 400 500 600 700 800 900 1000-2

0

2

4

6

8x 10

-3

--- Vasicek-Vasicek Model, ... Vasicek-CIR Model

Err

or

Error for 3-month Bonds

Page 43: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

On the Relevance of Modeling Volatility for Pricing Purposes 35

0 100 200 300 400 500 600 700 800 900 1000

0

10

20x 10

-3

--- Vasicek-Vasicek Model, ... Vasicek-CIR Model

Err

or

Error for 6-month Bonds

0 100 200 300 400 500 600 700 800 900 1000

0

0.02

0.04

--- Vasicek-Vasicek Model, ... Vasicek-CIR Model

Err

or

Error for 1-year Bonds

0 100 200 300 400 500 600 700 800 900 1000-0.01

0

0.01

0.02

0.03

--- Vasicek-Vasicek Model, ... Vasicek-CIR Model

Err

or

Error for 3-year Bonds

0 100 200 300 400 500 600 700 800 900 1000-0.03

-0.02

-0.01

0

0.01

--- Vasicek-Vasicek Model, ... Vasicek-CIR Model

Err

or

Error for 5-year Bonds

Figure 3: Within-Sample Errors of the Vasicek-Vasicek and Vasicek-CIR Models.

Page 44: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

36 Manuel Moreno

0 100 200 300 400 500 600 700 800 900 1000

-0.01

0

0.01

--- Vasicek-Vasicek Model, ... Vasicek-CIR Model

Per

cent

age

Err

or

Percentage Error for 7-day Bonds

0 100 200 300 400 500 600 700 800 900 1000-0.04

-0.02

0

0.02

0.04

--- Vasicek-Vasicek Model, ... Vasicek-CIR Model

Per

cent

age

Err

or

Percentage Error for 15-day Bonds

0 100 200 300 400 500 600 700 800 900 1000-0.2

-0.1

0

0.1

0.2

--- Vasicek-Vasicek Model, ... Vasicek-CIR Model

Per

cent

age

Err

or

Percentage Error for 1-month Bonds

0 100 200 300 400 500 600 700 800 900 1000-0.2

0

0.2

0.4

0.6

0.8

--- Vasicek-Vasicek Model, ... Vasicek-CIR Model

Per

cent

age

Err

or

Percentage Error for 3-month Bonds

Page 45: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

On the Relevance of Modeling Volatility for Pricing Purposes 37

0 100 200 300 400 500 600 700 800 900 1000-0.5

0

0.5

1

1.5

2

--- Vasicek-Vasicek Model, ... Vasicek-CIR Model

Per

cent

age

Err

orPercentage Error for 6-month Bonds

0 100 200 300 400 500 600 700 800 900 1000-1

0

1

2

3

4

--- Vasicek-Vasicek Model, ... Vasicek-CIR Model

Per

cent

age

Err

or

Percentage Error for 1-year Bonds

0 100 200 300 400 500 600 700 800 900 1000-1

0

1

2

3

4

--- Vasicek-Vasicek Model, ... Vasicek-CIR Model

Per

cent

age

Err

or

Percentage Error for 3-year Bonds

0 100 200 300 400 500 600 700 800 900 1000-4

-2

0

2

--- Vasicek-Vasicek Model, ... Vasicek-CIR Model

Per

cent

age

Err

or

Percentage Error for 5-year Bonds

Figure 4: Within-Sample Percentage Errors (Vasicek-Vasicek and Vasicek-CIR).

Page 46: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

38 Manuel Moreno

References

[1] Aıt-Sahalia, Y. (1996). Testing Continuous-Time Models of the Spot InterestRate. Review of Financial Studies 9, 2, 385–426.

[2] Ayres, H.R. and J.Y. Barry (1980). A Theory of the U.S. Treasury Market Equi-librium. Management Science 26, 6, 539–569.

[3] Boudoukh, J., M. Richardson, R. Stanton and R.F. Whitelaw (1999). A Mul-tifactor, Nonlinear, Continuous-Time Model of Interest Rate Volatility, mimeo,New York University.

[4] Brennan, M.J. and E.S. Schwartz (1979). A Continuous Time Approach to thePricing of Bonds. Journal of Banking and Finance 3, 133–155.

[5] Chan, K. C., G.A. Karolyi, F.A. Longstaff and A.B. Sanders (1992). An EmpiricalComparison of Alternative Models of the Short-Term Interest Rate. Journal ofFinance 47, 3, 1209–1227.

[6] Chen, L. (1996). Interest Rate Dynamics, Derivatives Pricing, and Risk Man-agement. Springer-Verlag, Berlin.

[7] Conley, T.G., L.P. Hansen, E.G. Luttmer, and J. Scheinkman (1997). Short-Term Interest Rates as Subordinated Diffusions. Review of Financial Studies 10,3, 525–577.

[8] Cox, J.C., J.E. Ingersoll and S.A. Ross (1985). A Theory of the Term Structureof Interest Rates. Econometrica 53, 385–408.

[9] Dai, Q. and K. Singleton (2000). Specification Analysis of Affine Term StructureModels. Journal of Finance 55, 5, 1943–1978.

[10] Duffie, D. and R. Kan (1996). A Yield-Factor Model of Interest Rates. Mathe-matical Finance 6, 4, 379–406.

[11] Jones, F.J. (1991). “Yield Curve Strategies”. Journal of Fixed Income, 33–41.

[12] Knez, P.J., R. Litterman, R., and J. Scheinkman (1994). “Explorations IntoFactor Explaining Money Market Returns”. Journal of Finance 49, 5, 1861–1882.

[13] Litterman, R. and J. Scheinkman (1991). “Common Factors Affecting Bond Re-turns”. Journal of Fixed Income 1, 1, 54–61.

[14] Longstaff, F.A. and E.S. Schwartz (1992). Interest Rate Volatility and The TermStructure: A Two-Factor General Equilibrium Model. Journal of Finance 47, 4,1259–1282.

Page 47: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

On the Relevance of Modeling Volatility for Pricing Purposes 39

[15] Moreno, M. (1996). “A Two-Mean Reverting-Factor Model of the Term Structureof Interest Rates”. Economics and Business Working Paper, num. 193. Universi-tat Pompeu Fabra de Barcelona. Also as Finance and Banking Discussion PapersSeries, num. 23. Universitat Pompeu Fabra de Barcelona.

[16] Moreno, M. and J.I. Pena (1996). On the Term Structure of Interbank InterestRates: Jump-Diffusion Processes and Option Pricing. In Forecasting FinancialMarkets, edited by Christian Dunis, John Wiley & Sons Ltd., Sussex, England.

[17] Nelson, J. and S.M. Schaefer (1983). The Dynamics of the Term Structure andAlternative Portfolio Immunization Strategies. In Innovations in Bond PortfolioManagement: Duration Analysis and Immunization, eds. G.O. Bierwag, G.G.Kaufman, and A. Toevs, Greenwich, CT: JAI Press.

[18] Nunez, S. (1995). Estimacion de la Estructura Temporal de los Tipos de Interesen Espana: Eleccion entre Metodos Alternativos. Documento de Trabajo 9522.Banco de Espana.

[19] Richard, S.F. (1978). An Arbitrage Model of the Term Structure of InterestRates. Journal of Financial Economics 6, 33–57.

[20] Schaefer, S. and E.S. Schwartz (1984). A Two-Factor Model of the Term Struc-ture: An Approximate Analytical Solution. Journal of Financial and Quantita-tive Analysis 19, 4, 413–424.

[21] Stanton, R. (1997). A Nonparametric Model of Term Structure Dynamics andthe Market Price of Interest Rate Risk. Journal of Finance 52, 5, 1973–2002.

[22] Vasicek, O. (1977). An Equilibrium Characterization of the Term Structure.Journal of Financial Economics 5, 177–188.

[23] Zhang, H. (1993). “Treasury Yield Curves and Cointegration”. Applied Eco-nomics 25, 3, 361–367.

Manuel MorenoDepartament d’Economıa i Empresa

Universitat Pompeu FabraCarrer Ramon Trias Fargas, 25-27

08005 Barcelona, Spaine-mail: [email protected]

Page 48: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM
Page 49: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

El uso de las mixturas de

distribuciones gaussianas en

finanzas: aplicacion en valoracion

y cobertura de opciones

financieras

Susana Corcuera y Juan Carlos Garcıa Cespedes1

Resumen

Pocos anos despues de que el modelo de Black-Scholes fuera universalmenteaceptado por la comunidad financiera, empiezan a ser manifiestas sus principalesdeficiencias: una de ellas, “el smile de volatilidad”, nos empuja claramente aconsiderar modelos con un decrecimiento menor que la normal en las colas (colasmas gruesas que la normal) y muchas veces con probabilidad desigual a grandesdescensos que a grandes ascensos.

Por otro lado, BS cuenta entre sus grandes ventajas con un equilibrio razo-nable entre la bondad del modelo y su sencillez.

Una mixtura de dos normales es, desde esta perspectiva, un modelo queincorpora de forma natural fenomenos como el smile de volatilidad y la mayordensidad de probabilidad en las colas, debido a su mayor flexibilidad y su mejorexplicacion de la formacion de los precios, sin, por otro lado, alejarse demasiadodel mundo de la “normalidad”, lo que permite un uso sencillo y directo delmodelo.

Este artıculo desarrolla las principales ideas acerca del uso de una mixturade normales para la valoracion de productos financieros: que es y que representauna mixtura como distribucion de probabilidad, por que es una buena idea paraexplicar la formacion de precios, etc. Se desarrolla una formula de valoracion yse dan expresiones explıcitas para opciones plain-vanilla, las cuales resultan sercombinaciones lineales (con dos terminos) de las formulas analogas en BS.

Se presentan tambien estudios practicos sobre opciones s/IBEX 35 y S&P500y, finalmente, se analiza el funcionamiento de las griegas (derivadas) en el mo-delo, conjuntamente con ejemplos practicos basados en la cobertura de unacartera.

1Susana Corcuera es analista tecnico de Riesgo en el BBVA. Juan Carlos Garcıa Cespedes esDirector de Metodologıas de Riesgos de BBVA. Esta charla se impartio en la sesion del SeminarioMEFF-UAM de marzo de 1998.

Page 50: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

42 Susana Corcuera y Juan Carlos Garcıa Cespedes

1 Introduccion

Una mixtura de distribuciones es, en general, una distribucion de probabilidad cuyafuncion de densidad es una cierta combinacion ponderada de otras dos (o de otrasmuchas). Son representativas de experimentos en los que con una cierta probabilidadp1 se extrae un numero con la densidad f1, con probabilidad p2 de la f2,. . . y conprobabilidad pn de la densidad fn.

El modelo encaja bien en un contexto financiero en el que con una cierta probabi-lidad (alta) los precios oscilan en una banda corriente de poca volatilidad, y con unaprobabilidad mucho mas baja se produce un sobresalto que conduce a fuertes subidaso a fuertes bajadas (noticias, reacciones en cadena, stop-losses,. . . ).

Posiblemente hoy una de las mayores deficiencias de los modelos normales (BS)radique en que los mayores errores de prediccion se cometen en las colas de la distri-bucion (sucesos extremos). Este hecho nos lleva a la aparicion del fenomeno de smile,para el que no hay explicacion ni posible cobertura (precisamente porque queda fueradel marco del modelo); tambien nos lleva a la aparicion de una nueva problematica,no tanto en el area de valoracion como en el de la medicion de los riesgos, disciplinaque centra precisamente su interes en la medicion de la cola de la distribucion, donde,por desgracia, el modelo normal infravalora. Sin embargo, muchas caracterısticas dela normal, sobre todo en la zona central de la distribucion, permanecen: simetrıa,maxima frecuencia en torno a la media, etc.

El modelo de mixtura es por tanto capaz de mantener las caracterısticas importan-tes de normalidad de las series (porque en el fondo esta formado por dos normales),pero por otro lado introduce una mayor riqueza en la modelizacion permitiendo dis-tribuciones con colas mas gruesas y asimetricas.

Entre las aplicaciones inmediatas de las “mixturas de normales” se pueden men-cionar:

• La medicion de riesgos.

• La estimacion y valoracion de la sonrisa/mueca de volatilidad.

• La cobertura del riesgo de sonrisa/mueca.

• La valoracion de opciones.

En el campo de las opciones financieras, la modelizacion mediante mixturas de gaus-sianas permite el uso casi directo de la conocida teorıa de valoracion de opcionesen el contexto Black-Scholes, con realmente muy pocas modificaciones, a la vez queincorpora de forma natural la existencia del smile.

Page 51: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

El uso de las mixturas de distribuciones gaussianas en finanzas 43

2 Mixtura de distribuciones gaussianas

Sea la variable aleatoria X tal que X = I · X1 + (1 − I) · X2, donde X1 y X2

son dos variables aleatorias con distribuciones X1 ≈ N(µ1, σ1) y X2 ≈ N(µ2, σ2)respectivamente2 e I es una variable aleatoria con distribucion I ≈ B(p), siendo B(p)una distribucion de Bernoulli con probabilidad de exito p. Se dice entonces que lavariable aleatoria X es una mixtura de dos normales.

Se dice que X es una mixtura de n normales cuando X = I1 ·X1 + I2 ·X2 + · · ·+In ·Xn, donde nuevamente X1, X2, . . . , Xn son variables aleatorias con distribucionesX1 ≈ N(µ1, σ1), X2 ≈ N(µ2, σ2), . . . , Xn ≈ N(µn, σn), y la distribucion de Ii vienedada por la siguiente expresion:

Ii =

1 , si B = i,0 , si B = i,

donde la variable aleatoria B es B : Ω −→ 1, 2, . . . , n, con probabilidades3 P (B =k) = pk, para cada k = 1, . . . , n.

Aunque como vemos el concepto de mixtura sirve para un numero arbitrario dedistribuciones, el modelo de valoracion se ha desarrollado para una mixtura de dos,y ası se entendera en lo sucesivo4.

Un ejemplo simple de una mixtura de 2 normales, con probabilidades iguales del50% , serıa el siguiente: se lanza una moneda al aire y si sale cara se extrae unarealizacion de una variable aleatoria N(0, 1); si sale cruz se extrae una realizacion deuna variable aleatoria N(1, 2).

Un poco mas generalmente, una mixtura de dos normales cuyos parametros son(µ1, µ2, σ1, σ2) es una distribucion de probabilidad que refleja un experimento consis-tente en

- con probabilidad p se toma un numero aleatorio con distribucion N(µ1, σ1),

- con probabilidad 1− p se toma un numero aleatorio con distribucion N(µ2, σ2).

La media µmixtura y la varianza σ2mixtura de la mixtura se expresan como funcion de

los parametros de sus dos componentes gaussianas:

• Media de la mixtura:

µmixtura = pµ1 + (1 − p)µ2 .

2N(µ, σ) denota una normal de media µ y desviacion tıpica σ.3La probabilidad de que Ii = 1 es pi que, a su vez, es la probabilidad de extraer un numero de la

normal i-esima.4Es posible trabajar con mixturas de mas de dos normales; de hecho es posible dejar el numero

de normales como un parametro mas que se puede estimar. Sin embargo, en tal caso el numero deparametros empieza a crecer y el modelo deja de ser util (demasiados grados de libertad).

Page 52: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

44 Susana Corcuera y Juan Carlos Garcıa Cespedes

• Varianza de la mixtura:

– Caso particular µ1 = µ2:

σ2mixtura = p σ2

1 + (1 − p)σ22 .

– Caso general:

σ2nixtura = p σ2

1 + (1 − p)σ22 + p (1 − p) (µ1 − µ2)2 .

Representando graficamente la desviacion tıpica de la mixtura en funcion de la proba-bilidad p (tomando σ1 = 1, σ2 = 2 fijos) para varias “diferencias de medias” (µ1−µ2)se obtiene el grafico siguiente:

Para varianzas de las normales componentes fijas, la varianza de la mixtura dependepor tanto de dos factores: la diferencia entre las medias (diferencias mayores en lasmedias generan obviamente varianzas mayores5), y finalmente depende de la proba-bilidad p, llegando a alcanzar un maximo para

pmax =12

+12

σ21 − σ2

2

(µ1 − µ2)2.

Con pmax obtenemos una varianza

σ2max =

12

(σ21 + σ2

2) +14

(µ1 − µ2)2 +14

σ21 − σ2

2

(µ1 − µ2)2.

2.1 La mixtura frente a la normal de igual media y volatilidad

En cada uno de los cuatro graficos siguientes se representa una mixtura con una cier-ta media y varianza frente a la distribucion gaussiana que tiene iguales parametros.Se pone ası de manifiesto que las mixturas permiten generar las distribuciones lep-tocurticas y asimetricas caracterısticas de los activos financieros.

5Es intuitivamente obvio si pensamos en lo que significa el experimento.

Page 53: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

El uso de las mixturas de distribuciones gaussianas en finanzas 45

Parametros de la mixtura: Parametros de la mixtura:p = 0.5, µ1 = 0, σ1 = 1, µ2 = 0, σ2 = 2 p = 0.5, µ1 = 1, σ1 = 1, µ2 = 0, σ2 = 2

Parametros de la mixtura: Parametros de la mixtura:p = 0.75, µ1 = 0, σ1 = 1, µ2 = 0, σ2 = 2 p = 0.5, µ1 = 1, σ1 = 0.5, µ2 = −1, σ2 = 1

¿Cual es la utilidad de la mixturas de gaussianas? ¿Por que se plantea su uso, frentea otras posibles distribuciones? Basicamente por cuatro razones:

1. Una mixtura de dos distribuciones normales es una distribucion de probabilidadcon relativamente pocos parametros6, pero que a su vez, permite la flexibilidadsuficiente para ser un buen modelo para un numero importante de experimentosprobabilısticos.

2. Su interpretacion en muchas situaciones economicas es natural; por ejemplo,ante la posibilidad de que el banco central modifique sus tipos de intervencion:

(a) Con una determinada probabilidad alta, p, el banco central bajara tipos,lo que dara lugar a un escenario de “baja” volatilidad. Esto es lo quedescuenta la mayorıa del mercado.

(b) Sin embargo existe una pequena probabilidad de que el banco central man-tenga tipos, esperandose en tal caso que la volatilidad en el mercado seamayor, con tensiones sobre el nivel de tipos.

Esta situacion se puede modelizar de forma sencilla mediante una mixtura, su-poniendo que la distribucion de tipos de interes es, con probabilidad p, N(µ1, σ1)

6Por ejemplo, una mixtura de 2 normales “solo” tiene 5 parametros, y puede representar adecua-damente distribuciones asimetricas, con dos maximos, leptocurticas, etc.

Page 54: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

46 Susana Corcuera y Juan Carlos Garcıa Cespedes

y con probabilidad 1− p, N(µ2, σ2), donde µ1 < µ2 < 0, p 1− p y σ1 σ2.7

3. Los modelos financieros de saltos (jump-diffussion processes) pueden en ciertaforma asimilarse a mixturas de normales (con, por ejemplo, grandes diferenciasentre las las medias o la volatilidad de las componentes normales). En estesentido, la mixtura es un modelo mas sencillo que el de salto y que puede captarmuchas de sus caracterısticas.

4. La admision de la mixtura como la distribucion base de explicacion de la for-macion de los precios en el mercado tiene dos consecuencias positivas de granrelevancia:

• Por su estrecha relacion con la distribucion normal, la aplicacion de lasmixturas de normales en la valoracion de derivados financieros es muy sen-cilla puesto que, fruto de esta estrecha relacion las formulas que se derivanson ligeras transformaciones de la conocida formula de Black-Scholes.

• Su mayor riqueza le permite captar mejor la formacion de los precios, unaprueba de ello es que el smile de volatilidad no solo queda explicada porla mixtura sino que nace como consecuencia inmediata del modelo.

3 El modelo Black-Scholes “falla”: la sonrisa y lamueca

En los mercados de opciones aparece lo que se denomina sonrisa-mueca de volatilidad,esta es una expresion para subrayar que la volatilidad implıcita es una funcion delstrike con un aspecto grafico de una sonrisa, a lo que debe su nombre.

Este fenomeno esta indicando que la distribucion de rendimientos al plazo de la opcionno es normal (lo que es lo mismo, que la distribucion de precios no es lognormal).

Para argumentar esta afirmacion supongase el caso de la valoracion de una opcionde tipo call asumiendo, para una mayor simplicidad, que el tipo de interes libre de

7La Union monetaria es otra situacion economica en la que el modelo de mixtura encaja perfec-tamente. Con una cierta probabilidad un paıs determinado entrara en la UME, dando lugar a unescenario de tipos de interes bajos y baja volatilidad; con otra probabilidad no entrara, dando lugara un escenario de tipos de interes “altos” y sobre todo de alta volatilidad.

Page 55: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

El uso de las mixturas de distribuciones gaussianas en finanzas 47

riesgo es cero8. El perfil de pagos de una opcion call, con la distribucion del subyacentesuperpuesta se representa en el grafico siguiente:

Como el tipo de interes es cero, el precio de la opcion viene dado por por

Preciocall =∫ ∞

K

(x − K) f(x) dx .

En el caso de que f(x) fuese una distribucion lognormal entonces se tendrıa el modeloBlack-Scholes.

¿Que pasarıa si f(x) no fuese lognormal? En cualquier caso siempre se puedeafirmar que existe una distribucion lognormal yσ(k)(x) tal que se cumple:

∫ ∞

K

(x − K) f(x) dx =∫ ∞

K

(x − K) yσ(k)(x) dx .

A la desviacion estandar σ(k) de la distribucion lognormal yσ(k)(x) que cumple larelacion anterior se le llama volatilidad implıcita9.

A continuacion se dibujan las dos distribuciones, f(x) e yσ(k)(x), para un de-terminado strike K1. Tıpicamente, las distribuciones reales de mercado presentanleptocurtosis, es decir, son de cuerpo mas estrecho y colas mas gruesas; las graficasse presentan siguiendo esta filosofıa:

8Aunque los argumentos y los graficos que se adjuntan se han particularizado al caso de unaopcion de tipo call, el desarrollo teorico es general y sirve para cualquier tipo de perfil de pago.

9Notese que σ(K) es en general una funcion de K: para cada strike K, la volatilidad implıcita esdiferente.

Page 56: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

48 Susana Corcuera y Juan Carlos Garcıa Cespedes

Las distribuciones anteriores, por definicion, cumplen que∫ ∞

K1

(x − K1) f(x) dx =∫ ∞

K1

(x − K1) yσ(K1)(x) dx ,

donde, como ya se ha dicho, σ(K1) es la volatilidad implıcita correspondiente al strikeK1.

Supongase que se desea calcular la volatilidad implıcita σ(K2) para otro strikediferente, K2 (con K2 > K1). Sin necesidad de mas demostracion, dado que ladistribucion f(x) tiene las colas “mas gruesas” (por ser leptocurtica) que yσ(K1)(x),es evidente que la distribucion yσ(K2)(x) que hace que∫ ∞

K2

(x − K2) f(x) dx =∫ ∞

K2

(x − K2) yσ(K2)(x) dx

debe cumplir que σ(K2) > σ(K1).

De ello se deduce que “colas gruesas” (y simetrıa) en la distribucion implican smile(simetrico) en las volatilidades implıcitas.

Si la distribucion f(x), ademas de colas gordas, es asimetrica, da lugar a queaparezca la mueca de volatilidad en lugar de la sonrisa. Se deja al lector el ejerciciode comprobar dicha afirmacion.

Page 57: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

El uso de las mixturas de distribuciones gaussianas en finanzas 49

En resumen, se tiene que:

Distribucion DistribucionAsimetrica Simetrica

Colas gruesas Mueca alegre Sonrisa

Colas delgadas Mueca triste Tristeza

Como se ha visto, la razon de la mueca/sonrisa se explica porque la distribucion delsubyacente no es lognormal. Una manera de tener esto en cuenta es utilizar la mixturade normales para aproximar/modelizar la distribucion implıcita de los subyacentes.

En el siguiente apartado se desarrollara con detalle el modelo de valoracion deopciones en base a una distribucion subyacente que coincide con la mixtura de dosgaussianas.

4 Estimacion de densidades implıcitas a partir deprecios de opciones

Sea St la variable aleatoria que representa los precios de un activo y supongase queel rendimiento instantaneo, Rt, de este activo tiene una distribucion de probabilidadque es una mixtura de dos normales.

Sean X1 y X2 dos variables aleatorias con distribuciones X1 ≈ N(µ1, σ1), X2 ≈N(µ2, σ2) respectivamente, donde N(µ, σ) denota una normal de media µ y desviaciontıpica σ, y sea I otra variable con distribucion I ≈ B(p), siendo B(p) una distribucionde Bernoulli con probabilidad de exito p. Se dice entonces que la variable aleatoriaY = eI X1+(1−I) X2 es una logmixtura de normales.

Vease que la variable aleatoria Y es tambien la siguiente:

Y =

eX1 , si I = 1,eX2 , si I = 0.

= I eX1 + (1 − I) eX2 .

Es decir, una logmixtura de normales es lo mismo que una mixtura de lognormales.

Si, como se ha dicho, Rt = log(St/St−1) es una variable aleatoria que toma valoressegun una mixtura de normales, entonces se tiene que la distribucion de St/St−1 = eRt

es, segun lo anterior, una logmixtura de dos normales y por tanto tambien una mixturade lognormales.

Page 58: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

50 Susana Corcuera y Juan Carlos Garcıa Cespedes

Con lo anterior, queda claro que si los rendimientos de un activo son una mixturade normales, el activo tiene como distribucion una mixtura de lognormales. En talcontexto, ¿cuanto vale una opcion sobre dicho subyacente?

Si se aplica el argumento de neutralidad al riesgo10, el precio C de una opcion oderivado, viene dado por

C = e−r ∆t E (f(St)) ,

donde r es el tipo de interes libre de riesgo, f(·) es el pago final del derivado, St es elprecio del subyacente y E es la esperanza bajo la probabilidad riesgo-neutra.

Esto equivale a

C = e−r ∆t

∫f(St) g(St) dSt ,

donde g(·) es la distribucion riesgo neutral de St.

Supongase que g(St) no es lognormal, sino que es una mixtura de lognormales; esdecir,

g(St) = p g1(St) + (1 − p) g2(St) ,

en donde g1(St) es la densidad lognormal (µ1, σ1) y g2(St) es la densidad lognormal(µ2, σ2).

Aplicar el argumento de neutralidad al riesgo supone que la esperanza del ac-tivo descontado es igual al precio actual. Aplicar esto mismo al precio del propiosubyacente implica que

E(St) = S0 = e−r ∆t S0

(p e(µ1+σ2

1/2) ∆t + (1 − p) e(µ2+σ22/2) ∆t

),

er ∆t = p e(µ1+σ21/2) ∆t + (1 − p) e(µ2+σ2

2/2) ∆t .

Si llamamos m1 = µ1 + σ212 y m2 = µ2 + σ2

22 (donde m1 y m2 son las dos medias de

las dos distribuciones lognormales y µ1 y µ2 son las medias de las dos normales), setiene que

er ∆t = p em1 ∆t + (1 − p) em2 ∆t .

Esta igualdad dice que las medias de las dos distribuciones lognormales estan relacio-nadas con el tipo de interes libre de riesgo11.

Si se asume que r, m1 y m2 son valores cercanos a 0, entonces la igualdad anteriorse puede aproximar, haciendo una reduccion al primer orden, por

(1 + r ∆t) ≈ p (1 + m1 ∆t) + (1 − p) (1 + m2 ∆t) =⇒=⇒ r ≈ pm1 + (1 − p)m2 .

10El argumento de neutralidad al riesgo: “el precio del activo derivado es el valor presente de losflujos esperados bajo la probabilidad riesgo-neutra”.

11En el entorno Black-Scholes, como solo existe una normal, la media de la misma queda inmedia-tamente determinada por el tipo de interes libre de riesgo.

Page 59: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

El uso de las mixturas de distribuciones gaussianas en finanzas 51

Es decir, el tipo de interes libre de riesgo es la media ponderada de las medias de lasdos lognormales de la mixtura.

Volviendo a la expresion inicial, el precio del activo derivado es

C = e−r ∆t

∫f(St) g(St) dSt = e−r ∆t

∫f(St)

(p g1(St) + (1 − p) g2(St)

)dSt ,

que podemos reescribir como

C = e−r ∆t

(p

∫f(St) g1(St) dSt + (1 − p)

∫f(St) g2(St) dSt

)= p em1 ∆t

[e−r ∆t e−m1 ∆t

∫f(St) g1(St) dSt

]+ (1 − p) em2 ∆t

[e−r ∆t e−m2 ∆t

∫f(St) g2(St) dSt

].

Si recordamos que g1(·) es una distribucion lognormal (µ1, σ1) o, en terminos dem1, una distribucion lognormal (m1 − σ2

1/2, σ1) y que, analogamente, g2(·) es unadistribucion lognormal (µ2, σ2) o, en terminos de m2, una distribucion lognormal(m2 − σ2

2/2, σ2), observamos que la expresion anterior equivale a que

C = e−r ∆t(p em1 ∆t C1 + (1 − p) em2 ∆t C2

),

donde

C1 es el precio de la opcion bajo Black-Scholes con m1 como tipo de interes librede riesgo y σ1 como volatilidad,

C2 es el precio de la opcion bajo Black-Scholes con m2 como tipo de interes librede riesgo y σ2 como volatilidad.

Operando la expresion anterior:

C =p em1 ∆t C1 + (1 − p) em2 ∆t C2

p em1 ∆t + (1 − p) em2 ∆t.

O bien

C = pem1 ∆t

p em1 ∆t + (1 − p) em2 ∆tC1 + (1 − p)

em2 ∆t

p em1 ∆t + (1 − p) em2 ∆tC2 .

Si se definen α1 y α2 segun

α1 =em1 ∆t

p em1 ∆t + (1 − p) em2 ∆t, α2 =

em2 ∆t

p em1 ∆t + (1 − p) em2 ∆t,

la expresion anterior queda

C = p α1 C1 + (1 − p)α2 C2 .

Page 60: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

52 Susana Corcuera y Juan Carlos Garcıa Cespedes

La condicion sobre el tipo de interes queda como sigue:

1 = p α1 + (1 − p)α2 .

El precio del derivado tambien se puede expresar como:

C = p e(m1−r)∆t C1 + (1 − p) e(m2−r) ∆t C2 .

Si se definen m1 − r = l1 y m2 − r = l2, entonces se tiene que

C = p el1 ∆t C1 + (1 − p) el2 ∆t C2 .

Ademas se debe cumplir que:

1 = p el1 ∆t + (1 − p) el2 ∆t .

LuegoC = p el1 ∆t C1 + (1 − p el1 ∆t ;

es decir,C = p′ C1 + (1 − p′)C2 ,

donde p′ = p el1 ∆t.

El precio de la opcion bajo la mixtura es una combinacion lineal de los preciosde la opcion bajo las dos distribuciones gaussianas (B-S) ponderadas por la proba-bilidad transformada p′. Esta probabilidad transformada p′ es una correccion de laprobabilidad original en base a la distancia de cada media al tipo de interes libre deriesgo.

4.1 La paridad put-call

Antes de proceder a la estimacion de densidades a partir de los precios de las opciones,es conveniente analizar una cuestion previa que luego aparecera con insistencia y queesta relacionada con los tipos de interes y la paridad put-call.

Existe una igualdad que deben cumplir las opciones, llamada paridad put-call ,segun la cual, suponiendo que no existen dividendos (la existencia de dividendos haceaparecer un factor mas pero basicamente debe seguir cumpliendose una expresion delmismo tipo), debe verificarse que

C + X e−r ∆t = P + S .

En un entorno real de mercado la existencia de una horquilla de precios convierte laigualdad anterior en dos desigualdades, dos condiciones para que no se pueda arbitrar:

Calto + X e−r1 ∆t ≥ P bajo + S ,

Cbajo + X e−r2 ∆t ≤ P alto + S ,

Page 61: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

El uso de las mixturas de distribuciones gaussianas en finanzas 53

donde

• Calto es el precio que hay que pagar para comprar una call,

• Cbajo es el precio que se recibe al vender una call.

• P alto es el precio que hay que pagar para comprar una put.

• P bajo es el precio que se recibe al vender una put.

• r1 es le tipo de interes que se recibe al invertir.

• r2 es el tipo de interes que se paga por los prestamos.

Resolviendo las desigualdades anteriores se llega a que, para evitar que exista arbi-traje, debe ocurrir que

r1 ≤ − 1∆t

log(

P bajo + S − Calto

X

)= rmax ,

r2 ≥ − 1∆t

log(

P alto + S − Cbajo

X

)= rmin .

Resulta que una vez estimados los lımites rmax y rmin, estos son funcion del strike, esdecir, que lo que se debe cumplir es que

r1 ≤ rmax(X) ∀X ,

r2 ≥ rmim(X) ∀X .

Graficamente, para el caso de opciones sobre el ındice S&P (fecha 21/5/98, venci-miento 20/6/98), rmin y rmax tienen la siguiente forma:

Page 62: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

54 Susana Corcuera y Juan Carlos Garcıa Cespedes

Para el IBEX, el subyacente no es el ındice sino el futuro sobre el IBEX 35, ası quela paridad put-call cambia ligeramente. El grafico para los tipos de interes de “noarbitraje” es el que se adjunta (fecha de calculo, 20/5/98 para opciones de vencimiento19/6/98)12:

4.2 La estimacion de distribuciones implıcitas de subyacentes

Consideremos ahora precios reales de opciones sobre un subyacente determinado. Seplantea el problema de tratar de encontrar dos normales cuya mixtura valore lo masajustadamente posible los precios de dichas opciones en el entorno de mercado en elque estos se producen.

Sean c1, c2, . . . , cn precios reales de opciones de compra (calls) y p1, p2, . . . , pm

precios de opciones de venta (puts)13. Entonces debe cumplirse que14

C(K) =p em1 ∆t C1(K) + (1 − p) em2 ∆t C2(K)

p em1 ∆t + (1 − p) em2 ∆t,

donde

C1 es el precio de la call de strike K bajo Black-Scholes con m1 como tipo de intereslibre de riesgo y σ1 como volatilidad.

12Como se vera posteriormente, estas bandas de tipos de interes “cuadran” perfectamente con eltipo de interes que estiman las mixtura. El tipo de interes estimado por la mixtura es, en general,un tipo constante, e intermedio entre ambas bandas; es el tipo de interes constante que mejor ajustaa la vez con los precios bid y ask.

13La eleccion de puts y calls para la estimacion solo es debida a que estos son los contratos deopciones mas lıquidos y a que sus precios aparecen en las principales fuentes suministradoras deinformacion de precios.

14A lo largo del artıculo se han usado X y K indistintamente para denotar el strike.

Page 63: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

El uso de las mixturas de distribuciones gaussianas en finanzas 55

C2 es el precio de la call de strike K bajo Black-Scholes con m2 como tipo de intereslibre de riesgo y σ2 como volatilidad.

Por otro lado, igualmente debe cumplirse que

P (K) =p em1 ∆t P1(K) + (1 − p) em2 ∆t P2(K)

p em1 ∆t + (1 − p) em2 ∆t,

siendo

P1 es el precio de la put de strike K bajo Black-Scholes con m1 como tipo de intereslibre de riesgo y σ1 como volatilidad.

P2 es el precio de la put de strike K bajo Black-Scholes con m2 como tipo de intereslibre de riesgo y σ2 como volatilidad.

Considerense las siguientes funciones:

Ea(m1,m2, σ1, σ2, p) =

√√√√ n∑i=1

(C(Ki) − ci)2 +

m∑i=1

(P (Ki) − pi)2

=

[n∑

i=1

(p em1∆t C1(Ki) + (1 − p) em2 ∆t C2(Ki)

p em1 ∆t + (1 − p) em2 ∆t− ci

)2

+m∑

i=1

(p em1 ∆t P1(Ki) + (1 − p) em2 ∆t P2(Ki)

p em1 ∆t + (1 − p) em2 ∆t− pi

)2]1/2

y

Er(m1,m2, σ1, σ2, p) =

√√√√ n∑i=1

(C(Ki) − ci

ci

)2

+m∑

i=1

(P (Ki) − pi

pi

)2

.

Estas funciones son los errores absolutos y relativos, respectivamente, para cada elec-cion de los parametros de la mixtura: θ = (m1,m2, σ1, σ2, p); trataremos de obtenerlos parametros que minimizan las funciones anteriores.

Antes de continuar, convendrıa hacer alguna matizacion adicional. Existen basi-camente dos formas de proceder en relacion al tipo de interes libre de riesgo (r):

• El valor de r no afecta directamente a las estimaciones (ninguna de las funcionesde error son funciones de r)15. En este sentido, el metodo seguido consiste enestimar los parametros de la mixtura y, bajo condiciones riesgo-neutras, calcularel tipo de interes como

(∗) r =1

∆tlog

(p em1 ∆t + (1 − p) em2 ∆t

).

15En realidad sı, porque en la formula de valoracion se sustituyo en su momento r por su relacioncon m1, m2 y p; en lo que se quiere hacer enfasis es en que r no aparece explıcitamente. Esto noocurre por ejemplo en el caso en el que el subyacente es el futuro. Veanse las estimaciones para lasopciones sobre el futuro del IBEX.

Page 64: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

56 Susana Corcuera y Juan Carlos Garcıa Cespedes

• Otra posibilidad es minimizar imponiendo la restriccion anterior, es decir, im-poniendo que m1, y m2 tienen que ser tales que cumplan (*), con un tipo rprefijado de antemano16. Hay que recordar que r no esta completamente deter-minado, dados los precios bid y ask como se ha visto, para evitar el arbitraje,para cada strike, los tipos r1 y r2 deben cumplir las siguientes relaciones:

r1 ≤ rmax , r2 ≥ rmin .

En este sentido, por tanto, no deberıa existir ninguna preferencia a la hora deimponer un tipo de interes dentro de dicha banda.

Finalmente, una vez estimados los parametros de la mixtura a partir de precios realesde opciones, se obtiene la distribucion mixtura que mejor ajusta a dichos precios.

La distribucion teorica ası obtenida se podra utilizar, entre otras cosas, para va-lorar cualquier otro tipo de opcion diferente de calls o puts, sin que la valoraciondependa de circunstancias como la necesidad de obtener una volatilidad implıcita pa-ra cada strike (esto podrıa ser arbitrario para strikes que no cotizaran en mercado),o mucho mas importante, resuelve el problema de valorar otros derivados financierossin conocer la volatilidad implıcita que como sabemos, depende no solo del strikesino ademas de caracterısticas del instrumento (vease el apartado que trata sobre lavaloracion de digitales).

4.3 Resultados de las estimaciones para opciones sobre el ındiceS&P 500

Dıas: 18/05/98, 20/05/98, 21/05/98 (Fuente: Bloomberg)Resultados de minimizaciones de la funcion de errores

absolutos mediante metodos de Newton y gradiente conjugado.

Dıa 18/05/98

Resultados sobre 60 precios de mercado; 30 calls (15 bid y 15 ask), 30 puts (15 bidy 15 ask), vencimiento 20/6/98. Nivel del subyacente: 1111.8. Se estima una unicamixtura con todos los precios, con strikes desde el 1075 hasta el 1150.

1.- Los parametros obtenidos sin restriccion en las medias de la mixtura (dejando rlibre) sobre la condicion riesgo-neutro son:

Parametros p M1 σ1 1 − p m2 σ2

Anualizados 0.24 -71.6% 19.89% 0.76 26.3% 10.98%En ∆t 0.24 -6.27% 5.89% 0.76 2.31% 3.25%

16En este caso se esta imponiendo la condicion de no arbitraje para la media de la mixtura enla estimacion, y es como si en lugar de tener 5 grados de libertad (5 parametros que estimar), setuvieran solo 4 grados (4 parametros que estimar, al imponer el tipo de interes, se estima m1 o m2,pero nunca ambas).

Page 65: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

El uso de las mixturas de distribuciones gaussianas en finanzas 57

Estos parametros implican que el tipo de interes r es 3.48%, que ademas es el tipo deinteres “constante” que hace que la paridad put-call se cumpla para todos los strikes.

Ea(m1,m2, σ1, σ2, p) = 5.63 (la suma total de precios es 1330.75),Er(m1,m2, σ1, σ2, p) = 24.44% .

La maxima diferencia absoluta en primas (estimadas frente a reales) se produce parael strike 1095 y vale 1.38:

precio real 34.38, precio mixtura 35.7.

La maxima diferencia relativa en primas se produce para el strike 1140 y es un 6.1%

precio real 11.50, precio mixtura 10.80.

Como antes se ha detallado, el tipo de interes r estimado es el que hace que se cumplala paridad put-call, para todos los strikes. Hay que recordar que se esta estimandouna unica distribucion (mid) a partir de precios bid y ask. El precio de las opcionesbajo esta distribucion esta casi en todos los casos dentro de la banda bid -ask, y dalugar a una unica volatilidad implıcita para put y call del mismo strike; por ello lalinea de smile bajo dicha distribucion es unica.

Una vez estimados a partir de precios de opciones los parametros de la mixtura quemejor ajustan dichos precios, se puede obtener una representacion de la distribucionimplıcita (como mixtura), de las dos normales que la componen y de la normal deigual media y varianza que la mixtura:

Page 66: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

58 Susana Corcuera y Juan Carlos Garcıa Cespedes

2.- Si se prefija el tipo de interes de mercado (para este ejemplo se ha tomado r =5.25%), y se obliga a la mixtura a cumplir la condicion de arbitraje sobre el tipo deinteres impuesto:

Parametros p M1 σ1 1 − p m2 σ2

Anualizados 0.24 -68.1% 19.05% 0.76 27.0% 11.49%En ∆t 0.24 -5.97% 5.64% 0.77 2.37% 3.40%

Error absoluto Ea = 8.48, error relativo Er = 43.76%.

El cambio en los parametros estimados es muy pequeno; sin embargo, el errorabsoluto aumenta de 5.63 a 8.48 para ajustar las medias y los pesos a un tipo deinteres del 5.25%. Dentro de la banda de tipos de interes permitida es lıcito cualquiertipo que se escoja; de hecho nos vale 3.48%, que tambien esta dentro de la banda.En este sentido es preferible no imponer restricciones sobre r de este estilo y solocomprobar si el tipo de interes estimado cumple estar o no dentro de la banda.

Dıa 20/05/98

Resultados sobre 60 precios de mercado; 30 calls (15 bid, y 15 ask), 30 puts (15 bid y15 ask), vencimiento 20/6/98. Subyacente en el nivel 1119.10.

Parametros p M1 σ1 1 − p m2 σ2

Anualizados 0.21 -76.3% 18.90% 0.79 26.0% 10.64%En ∆t 0.21 -6.48% 5.51% 0.76 2.20% 3.10%

Tipo de interes estimado: 5.23 %. Errores absolutos: 5.29. Errores relativos: 23.75%.

La maxima diferencia absoluta en precio se produce para el strike 1150 de 1.15:

precio real 33.88, precio mixtura 35.03.

La maxima diferencia relativa en precio se produce para el strike 1140 de 7.02%:

precio real 14.13 , precio mixtura 13.13.

Page 67: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

El uso de las mixturas de distribuciones gaussianas en finanzas 59

Dıa 21/05/98

Resultados sobre 54 precios de mercado; 28 calls (14 bid, y 14 ask), 28 puts (14 bid y14 ask), vencimiento 20/6/98. Subyacente en el nivel 1114.6

Parametros p M1 σ1 1 − p m2 σ2

Anualizados 0.35 -49.3% 17.48% 0.65 31.7% 8.99%En ∆t 0.35 -4.06% 5.01% 0.65 2.60% 2.58%

Tipo de interes estimado: 3.71 %. Errores absolutos: 6.07. Errores relativos: 30.92%.

La maxima diferencia absoluta se produce para el strike 1115 con -1.34:

precio real 23.88, precio mixtura 22.54.

La maxima diferencia relativa se produce para el strike 1150 con 10.57%:

precio real 52.50, precio mixtura 51.32.

Las graficas de ajuste en precios y smile son similares a las de los dıas anteriores.

Estimados los parametros para tres dıas, se puede analizar el cambio en la distri-bucion, y el cambio en el smile.

4.4 Resultados para estimaciones en opciones sobre el futurode Ibex-35

Dıas: 18/05/98, 19/05/98, 20/05/98, 21/05/98Fuente: Datos de cierre de MEFF de opciones call y put

sobre el futuro Ibex-35 Vto 19/06/98

Se han probado tambien para el IBEX los diferentes metodos de minimizacion:cuadrados de errores absolutos, relativos, variaciones logarıtmicas. . . No obstante, elhecho de que el spread (de horquilla) en terminos absolutos permanezca constanteen algunos activos, hace que las diferencias relativas bid/mid, ask/mid en los preciosout of the money sean muy altas (frente a los precios in y at the money), y en estecaso ponderan mucho mas en la funcion de error, lo que proporciona un mejor ajuste

Page 68: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

60 Susana Corcuera y Juan Carlos Garcıa Cespedes

en la zona muy fuera del dinero y un ajuste muy malo en el resto de las zonas deprecios cuando se utilizan criterios de minimizacion relativos. Este ha sido el caso delIBEX, por lo que se ha preferido como criterio de minimizacion la suma de los erroresabsolutos cuadraticos.

En el caso en el que el subyacente es un futuro, la formula de valoracion Black-Scholes es ligeramente diferente de la habitual. Asumiendo que el comportamiento delfuturo sobre un subyacente es identico al del mismo subyacente pagando dividendosa una tasa igual al tipo libre de riesgo, la formula de valoracion (B-S) queda en

C = e−r (T−t)[F N(d1) − K N(d2)

],

P = e−r (T−t)[K N(−d2) − F N(−d1)

],

para la call y la put respectivamente, donde

d1 =log(F/K) + (σ2/2) (T − t)

σ√

T − t, d2 =

log(F/K) − (σ2/2) (T − t)σ√

T − t.

En el caso de la valoracion en entorno mixtura, se utiliza la formula habitual:

C(K) =p m1 Deltat C1(K) + (1 − p) em2 ∆t C2(K)

p em1 ∆t + (1 − p) em2 ∆t,

pero donde ahora

C1 es el precio de la call de strike K bajo Black-Scholes con m1 como tipo de intereslibre de riesgo y σ1 como volatilidad.

C2 es el precio de la call de strike K bajo Black-Scholes con m2 como tipo de intereslibre de riesgo y σ2 como volatilidad.

F es el precio del futuro a fecha de valoracion.

K es el strike.

Por tanto C1 tiene la forma17:

C1 = e−r (T−t)[F N(d1

1) − K N(d12)

],

donde

d11 =

log(F/K) + (m1 − r − σ21/2) (T − t)

σ√

T − t,

d12 =

log(F/K) − (m1 − r − σ21/2) (T − t)

σ√

T − t.

17La expresion para C2 es analoga a la de C1.

Page 69: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

El uso de las mixturas de distribuciones gaussianas en finanzas 61

De forma analoga se obtiene la formula para la put18. Como se ve, se sigue basicamenteen la lınea de la teorıa Black-Scholes, con muy pocas modificaciones.

Se aplica la formula de valoracion obtenida a los precios de opciones con subya-cente el contrato de futuros de MEFF Ibex-35-PLUS. Como se ha dicho, el metodode estimacion de los parametros de la mixtura es minimizar la funcion de erroresabsolutos Ea:

Ea(m1,m2, σ1, σ2, p) =

√√√√ n∑i=1

(C(Ki) − ci

)2

+m∑

i=1

(P (Ki) − pi

)2

,

donde ahora el precio teorico se obtiene con la formula anterior (valida para el fu-turo). Sin embargo, ahora r aparece de forma explıcita en la expresion que se deseaminimizar, en Ea hay un parametro mas que antes. El problema se trata de dosformas:

1. Se estima r junto con el resto de los parametros de la mixtura, sin ningunarestriccion; esto en general conduce a un valor de r muy cercano a cumplir lacondicion de riesgo neutral.

2. Se estiman los parametros imponiendo r tal que cumpla la condicion riesgoneutral (se fija r a un nivel).

Si se analiza como depende la funcion de objetivo del tipo de interes r, se observa que

- Habitualmente se obtiene una estimacion de r en el intervalo (−1.5%, 4%).

- Por lo general la suma de errores cuadraticos es muy poco sensible a variacionesde r en dicho intervalo.

- Cuando se deja r libre, se suele estimar un tipo de interes ligeramente pordebajo de la condicion riesgo-neutro, aunque, en terminos de errores absolutos,hay muy poca diferencia en la estimacion entre imponer el tipo de interes r quecumple la condicion riesgo neutral o dejarlo libre.

En general, se ha tomado la serie entera de precios publicados teniendo en cuentaque, en primer lugar, son precios de cierre19 y, en segundo lugar, el metodo de calculode precios de cierre en MEFF es ultimo precio cruzado salvo en precios muy ITM yOTM donde no suele haber liquidez, y entonces los precios publicados son solamenteindicativos, por lo que la mayorıa de las veces el mercado no esta en esos niveles; estopuede crear algunas dificultades en las estimaciones.

18El hecho de considerar que la tasa r de “dividendos” es igual en cada una de las dos lognormalesque constituyen la mixtura es claramente arbitrario; se puede pensar que los dividendos son diferentespara ambas normales, manteniendo que la tasa “esperada” de dividendos sea r. La ventaja de suponerque es igual es que solo se anade un parametro mas al modelo, y ademas, como veremos, es suficientepara valorar “bien” las opciones.

19Con esto se quiere hacer especial hincapie que no son precios “sıncronos”.

Page 70: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

62 Susana Corcuera y Juan Carlos Garcıa Cespedes

Dıa 18/05/98

Estimaciones finales sobre 225 precios de cierre; 102 calls y 123 puts.

• Sin condicion Riesgo-neutro (SinRN)

Hay varias soluciones muy cercanas segun, sobre todo, el dato inicial de r con el quecomienzan las iteraciones. Se ha barrido una banda grande de parametros iniciales,obteniendose los siguientes mınimos relativos para los parametros que a continuacionse detallan (Eabs es la suma de errores absolutos cuadraticos y Erel es la suma deerrores relativos cuadraticos):

p m1 σ1 1 − p m2 σ2 Tipo RN Eabs Erel

0.276 -110.56% 39.19% 0.724 44.59% 24.21% 3.84% 3.86% 116.20 0.9610.281 -110.83% 38.72% 0.719 44.14% 24.07% 2.68% 2.70% 115.98 0.9200.281 -111.07% 38.67% 0.719 44.13% 24.06% 2.64% 2.66% 115.98 0.916

Suma total de precios mercado: 107,853. La relacion entre el error absoluto y la sumade precios es: 115.98/107, 853 = 0.00108.

• Con condicion Riesgo-neutro (ConRN)

Se impone en la minimizacion la condicion riesgo-neutral:

R =log(p em1 ∆t + (1 − p) em2 ∆t)

∆t.

Ası se obtiene una unica solucion para cualquier valor inicial de los parametros:

p m1 σ1 1 − p m2 σ2 Tipo RN Eabs Erel

0.282 -110.70% 38.71% 0.718 44.16% 24.04% 2.63% 2.63% 116.02 0.913

El ratio entre el error absoluto y la suma de precios es: 116.02/107, 853 = 0.0010753.

Con los parametros obtenidos, se puede “dibujar” la distribucion de la mixtura ycompararla con la de una normal de igual media y varianza, o bien dibujar la mixturajunto con sus gaussianas constituyentes (figura de la derecha):

Page 71: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

El uso de las mixturas de distribuciones gaussianas en finanzas 63

Se puede ası mismo ver el smile de mercado frente al smile teorico dado por lamixtura.

Dıa 19/05/98

Estimaciones sobre 176 datos, 119 calls y 57 puts.

Se han obtenido unicamente dos soluciones para las dos estimaciones (sin condicionRN, con condicion RN) que se detallan a continuacion:

Sin restriccion

p m1 σ1 1 − p m2 σ2

0.276 -108.56% 38.25% 0.724 42.20% 23.93%Tipo RN Eabs Erel Eabs/total1.61% 3.00% 78.734 1.6106 0.001040

Con restriccion

p m1 σ1 1 − p m2 σ2

0.268 -109.04% 38.62% 0.732 42.73% 24.16%Tipo RN Eabs Erel Eabs/total3.00% 3.00% 79.08 1.5916 0.001045

La suma total de precios reales de mercado es 75.699. Con cualquiera de las dossoluciones, el ajuste tanto en precio como en el smile es practicamente igual.

Hay que recordar que se esta utilizando el mismo tipo de interes, tanto para valorarbid como el ask. En este sentido, la estimacion esta proporcionando un cierto “tipo

Page 72: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

64 Susana Corcuera y Juan Carlos Garcıa Cespedes

medio”, el tipo medio que aplicado tanto a la compra como a la venta de opcionesajusta mejor, minimiza al maximo el error respecto de los precios bid y ask.

Es por esto por lo se han utilizado todos los precios, tanto bid como ask, parahallar la distribucion implıcita, aunque evidentemente se cometa siempre el error dela horquilla, porque en realidad el mercado deberıa tender a disminuir las horquillasconforme aumente la liquidez, y ası la distribucion bid y la distribucion ask deberıantender hacia la estimada con todos los precios; pero todo esto, con unas horquillas tangrandes en determinados precios, (sobre todo en niveles relativos) puede ser causa deinestabilidades en los tipos de interes estimados.

Dıa 20/05/98

242 precios de opciones (112 calls, 130 puts). Se obtienen las siguientes estimaciones:

Sin restriccion

p m1 σ1 1 − p m2 σ2

0.343 -94.58% 33.90% 0.657 43.30% 20.89%0.330 -92.74% 34.07% 0.670 44.89% 21.07%0.327 -92.48% 34.10% 0.673 45.17% 21.11%0.325 -92.15% 34.14% 0.675 45.45% 21.14%Tipo RN Eabs Erel Eabs/total

-1.75% -2.19% 93.313 4.9585 0.0008251.00% 1.18% 93.636 5.0519 0.0008281.50% 1.79% 93.763 5.0680 0.0008292.00% 2.40% 93.911 5.0854 0.000830

Con restriccion

p m1 σ1 1 − p m2 σ2

0.336 -93.25% 33.89% 0.664 44.33% 20.99%0.328 -93.56% 34.31% 0.672 44.65% 21.10%0.325 -93.74% 34.50% 0.675 44.78% 21.14%0.321 -94.05% 34.68% 0.679 44.91% 21.19%Tipo RN Eabs Erel Eabs/total

-0.14% -0.14% 93.45 5.0129 0.0008261.00% 1.00% 93.76 5.0491 0.0008291.50% 1.50% 94.10 5.0676 0.0008322.00% 2.00% 94.55 5.0852 0.000836

Como se ve, para cualquiera de las soluciones anteriores la variacion de los parametroses muy pequena. Se puede dibujar la distribucion de la mixtura frente sus gaussianasconstituyentes.

Page 73: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

El uso de las mixturas de distribuciones gaussianas en finanzas 65

Dıa 21/05/98

Estimaciones realizadas sobre 230 precios (110 calls, 120 puts). Se obtienen dos unicassoluciones, una sobre minimizacion libre, y otra con restriccion RN.

Sin restriccion

p m1 σ1 1 − p m2 σ2

0.305 -87.09% 36.03% 0.695 37.54% 21.25%Tipo RN Eabs Erel Eabs/total0.76% 0.86% 110.93 0.2174 0.000987

Con restriccion

p m1 σ1 1 − p m2 σ2

0.307 -87.25% 35.98% 0.693 37.38% 21.16%Tipo RN Eabs Erel Eabs/total0.40% 0.40% 111.04 0.2027 0.000988

Page 74: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

66 Susana Corcuera y Juan Carlos Garcıa Cespedes

4.5 Comentarios finales respecto a la estimacion de las distri-buciones implıcitas

Es conveniente, antes de terminar con el capıtulo de estimacion de densidades, mos-trar en mas detalle los problemas ya mencionados que en la estimacion introduce eldiferencial de precios bid -ask. Recordemos que se han probado basicamente tres tiposde estimaciones, dependiendo de cual vaya a ser la funcion objetivo que se minimice:a saber, la suma de los cuadrados de (1) las diferencias “absolutas” de los precios, (2)las diferencias porcentuales de los precios o (3) las diferencias de los logaritmos de losprecios.

En general, el primer criterio ajusta mejor el precio para las opciones los preciosin the money, los otros dos ajustan mejor los precios out of the money. En generalse ha utilizado el criterio 1, minimizacion de la suma de cuadrados de diferencias deprecios, ya que se ha observado que este criterio es mas robusto que los otros dos.

Trabajar con criterios relativos como son las diferencias porcentuales o las diferen-cias de logaritmos tiene el problema de los spreads entre bid y ask. Es habitual que losspreads entre bid y ask para las opciones sean mas o menos constantes independien-temente del strike; esto hace que para las opciones out of the money la relacion entreel spread (ask–bid) y el precio medio de la opcion (bid+ask)/2 sea incluso superioral 100%. En tal caso, intentar minimizar, por ejemplo, la suma de cuadrados de lasdiferencias porcentuales ocasionara que el ajuste de los precios at o in the money seamalo. A continuacion se presenta la relacion entre el spread de las opciones y el preciomedio para diferentes strikes.

Se ve que el ratio de spread -precio en las opciones sobre el S&P es muy estable(comparandolo al IBEX 35); ello principalmente es debido a que en la muestra deS&P no hay opciones muy dentro o fuera del dinero.

Page 75: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

El uso de las mixturas de distribuciones gaussianas en finanzas 67

De hecho, la estimacion de la densidad implıcita del subyacente para las opciones sobreel S&P por cualquiera de los tres metodos proporciona resultados muy similares, comose puede ver en la grafica adjunta (densidad implıcita del S&P el 21/5/98 obtenidaa partir de precios de opciones con vcto. 20/6/98), cosa que desde luego no sucedetrabajando con el IBEX35, donde la minimizacion bien de variaciones porcentuales,bien de variaciones logarıtmicas, ocasiona estimaciones completamente diferentes yque ademas ajustan pesimamente salvo para el tramo muy fuera del dinero20.

5 Valoracion de opciones con la mixtura

Supongase que se desea valorar una opcion digital segun se presenta en el graficoadjunto. Como dato, es conocido el precio de la call para el mismo strike que laopcion digital. ¿Que precio hay que dar a la opcion digital?

La respuesta inmediata serıa calcular mediante un modelo de tipo B-S el precio dela opcion digital, para lo cual, ¿que volatilidad implıcita usar? ¿La correspondiente ala call de igual strike? Se vera que en general la respuesta es no.

20Existe otro criterio de minimizacion mas complejo: se trata de la suma de los cuadrados delas diferencias de precios entre el precio estimado y “la banda de spread”. Si el precio estimadocae dentro de la banda la diferencia es cero; si el precio cae fuera, la diferencia se toma respecto alextremo de la banda mas cercano al precio. Se han hecho algunas pruebas con este criterio sobreopciones S&P y las diferencias con respecto al criterio normal de mınimos cuadrados han sido muypequenas. El problema de este cuarto criterio es que en general proporciona multiples soluciones.

Page 76: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

68 Susana Corcuera y Juan Carlos Garcıa Cespedes

Recordando la expresion que determina la volatilidad implıcita para una opcion callde strike K, σc(K), es tal que se cumple:

Precio call =∫ ∞

K

(x − K) f(x) dx =∫ ∞

K

(x − K) yσ(K)(x) dx .

De la misma manera se puede definir la volatilidad implıcita de una opcion digital destrike K: σD(K) es tal que se cumple

Precio digital =∫ ∞

K

D f(x) dx =∫ ∞

K

D yσ(K)(x) dx .

Es evidente que, en general, σc(K) = σD(K). Es decir, la volatilidad implıcita quese debe usar para valorar una opcion digital es diferente de la volatilidad implıcitaderivada a partir del precio de una opcion call, y esto es ası porque la volatilidadimplıcita es un concepto que no solo depende del strike, sino del tipo de opcion. Encierto sentido es un concepto como el de TIR, que depende de caracterısticas delinstrumento, del bono, de la opcion21.

Mediante el uso de las mixturas es posible solventar este problema, se puede esti-mar directamente la densidad del subyacente a partir del precio de las opciones call yput para diferentes strikes, utilizando como aproximacion la mixtura de gaussianas.Una vez estimada la mixtura que mejor aproxima a la distribucion real f(x) del sub-yacente se puede calcular el precio de cualquier otro tipo de opcion, por ejemplo unaopcion digital (binaria, cash or nothing), integrando directamente sobre la mixtura.

No obstante, en relacion con lo anterior, la valoracion en mercado de cualquierderivado utilizando el smile producido por las calls y las puts es una practica habitual.A continuacion se puede ver un ejemplo de valoracion de una opcion digital sobre elındice S&P 500 y el IBEX 35, y los errores que produce utilizar la volatilidad implıcitade las calls y puts de igual strike.

En los ejemplos comparativos que se presentan a continuacion, se ha valoradouna opcion digital por B-S utilizando como volatilidad implıcita la correspondiente alos calls y puts, de igual strike22, y por otro lado se ha valorado esta opcion con lamixtura (usando la densidad estimada a partir de calls y puts, vease en el anexo B laderivacion del precio de la digital en el entorno mixtura).

21Aunque en general es cierto lo antedicho, existen algunos casos particulares que “parecen” sal-tarse dicha regla; ası, por ejemplo, las opciones call y put sı que cumplen que para igual strike lavolatilidad implıcita es igual para ambas. Esto es debido a que debe cumplirse la paridad call-put,tanto en el entorno B-S como en el de mixturas, por lo que debe suceder que C + K e−r ∆t = P + S,de donde se deduce que σC es igual a σP .

22El tipo de interes que se ha introducido en la formula de B-S ha sido el que surge de la condicionriesgo-neutro tras la optimizacion.

Page 77: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

El uso de las mixturas de distribuciones gaussianas en finanzas 69

Datos del S& P dıa 18/5/98

Se obtienen los parametros para la mixtura con los que se valorara la opcion digital.

Parametros p m1 σ1 1 − p m2 σ2

0.24 -71.6% 19.89% 0.76 26.3% 10.98%

Por otro lado, el smile de mercado del dıa 18/5/98 para el S&P que se va a utilizarpara valorar la opcion por Black-Scholes se presenta en la siguiente tabla:

strike 1075 1085 1090 1095 1100 1105 1110

volat. 19.96% 19.21% 18.82% 18.44% 18.06% 17.69% 17.33%

strike 1115 1120 1125 1130 1135 1140 1150

volat. 16.98% 16.65% 16.33% 16.03% 15.75% 15.48% 15.01%

Las diferencias obtenidas en precio se representan en el grafico siguiente: el eje deabcisas representa el nivel de strike de una opcion digital que paga 1 cuando elsubyacente queda por debajo del strike, y el eje de ordenadas el precio.

El siguiente grafico presenta las diferencias porcentuales entre ambos precios:

Cuando mas cerca se esta del vencimiento, obviamente las dos valoraciones convergen,pero segun aumenta el plazo hasta el vencimiento se producen las mayores diferen-cias entre un modelo y el otro. Como ejercicio teorico, si se realiza esta valoracioncon exactamente la misma situacion en cuanto a volatilidades implıcitas, pero pa-ra un plazo residual de tres meses para vencimiento, se comprueba que se producendiscrepancias de hasta 25$ sobre 100 en los strikes mas ATM.

Page 78: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

70 Susana Corcuera y Juan Carlos Garcıa Cespedes

Datos del S& P dıa 19/5/98

Los parametros de la mixtura estimados para ese dıa y el smile de mercado son:

strike 1075 1085 1090 1095 1100 1105 1110volat. 20.17% 19.40% 19.00% 18.59% 18.18% 17.77% 17.37%

strike 1115 1120 1125 1130 1135 1140 1150volat. 16.99% 16.62% 16.26% 15.93% 15.61% 15.32% 14.79%

Se obtiene de nuevo la valoracion por las dos vıas:

Datos del IBEX 35 dıa 18/5/98

Los parametros de la mixtura para el IBEX 35 son:

p m1 σ1 1 − p m2 σ2

0.282 -110.70% 38.71% 0.718 44.16% 24.04%

El smile utilizado para valorar con B-S se representa en la siguiente tabla:

strike volatilidad strike volatilidad strike volatilidad

8150 43.01% 9350 36.50% 10200 32.07%

8200 42.83% 9400 36.19% 10250 31.87%

8250 42.64% 9450 35.88% 10300 31.68%

8300 42.44% 9500 35.58% 10350 31.50%

8400 42.01% 9600 34.99% 10400 31.33%

8500 41.54% 9650 34.71% 10500 31.00%

8550 41.30% 9700 34.43% 10600 30.70%

8700 40.50% 9750 34.16% 10700 30.42%

8800 39.92% 9800 33.90% 10800 30.17%

8900 39.32% 9850 33.64% 10850 30.05%

9000 38.71% 9900 33.39% 10900 29.93%

9100 38.08% 9950 33.15% 11000 29.72%

9150 37.76% 10000 32.92% 11200 29.34%

9200 37.44% 10050 32.69% 11350 29.09%

9250 37.12% 10100 32.48%

9300 36.81% 10150 32.27%

Page 79: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

El uso de las mixturas de distribuciones gaussianas en finanzas 71

Finalmente, se obtienen las diferencias en precio que se presentan a continuacion:

6 Cobertura de la sonrisa y la mueca de volatilidad

En el modelo de B-S, uno de los supuestos basicos es que la volatilidad es constante(no depende del precio de ejercicio); sin embargo, como ya hemos visto, en el mercadose observa que esto no es ası, que existen la sonrisa y la mueca de volatilidad. A pesarde eso, se suele utilizar el modelo de B-S, tomando diferentes volatilidades implıcitaspara diferentes precios de ejercicio, calculando diferentes precios y “griegas” paradiferentes precios de ejercicio.

En particular se considera en el entorno B-S la “vega” como una aproximacion oindicador del riesgo que se corre ante cambios en la volatilidad implıcita. Sin embargo,como hemos visto, no existe una volatilidad implıcita, sino una curva de volatilidadesimplıcitas (mas correctamente, una superficie de volatilidades implıcitas si tenemosen cuenta la dimension temporal —el plazo de las opciones—) que depende del strike.

En este contexto, ¿que sentido tiene la “vega” de una cartera de opciones conigual subyacente y diferentes precios de ejercicio? En tal caso, la “vega” mide elriesgo ante movimientos “paralelos” en la curva de volatilidades implıcitas, es decir,incrementos o decrementos “iguales” en las volatilidades implıcitas para todos losprecios de ejercicio. Pero, ¿que pasa si el movimiento no es paralelo? Si el cambio esen la “forma” de la curva de volatilidades implıcitas, la cobertura “vega” que dictael entorno B-S es inadecuada; es el caso, por ejemplo, de “rotaciones” de la curva desmiles”.

Page 80: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

72 Susana Corcuera y Juan Carlos Garcıa Cespedes

En el modelo de opciones para “mixturas”, el smile no es mas que una conse-cuencia de que la “distribucion del subyacente no es lognormal”, y es en generalleptocurtica y asimetrica. Ahora, con la mixtura, en lugar de los dos parametros(media y volatilidad) del modelo B-S, se tienen 5, dos medias, dos volatilidades y unaprobabilidad23. La contrapartida es que con esos cinco parametros se modeliza todala curva de volatilidades.

En este contexto las “griegas” del entorno B-S sufren ligeras transformaciones.Ahora, ademas de Delta, Gamma y Theta aparecen dos Vegas, dos Rhos y Psi (enel anexo A aparecen todas las formulas de valoracion y las derivadas en el entornomixtura ası como su relacion con las formulas en el entorno B-S).

6.1 Las derivadas con mixturas de opciones

En el entorno mixtura, las derivadas son ocho (tres mas que en el entorno B-S):

• Derivada del precio de la opcion respecto del subyacente (Delta).

• Derivada de la Delta de la opcion respecto del subyacente (Gamma).

• Derivada del precio de la opcion respecto de la volatilidad de una de las dosnormales que com ponen la mixtura (Vega 1).

• Derivada del precio de la opcion respecto de la volatilidad de la otra de lasnormales que componen la mixtura (Vega 2).

• Derivada del precio de la opcion respecto de la media de una de las normalesque componen la mixtura (Rho 1).

• Derivada del precio de la opcion respecto de la media de la otra de las dosnormales que componen la mixtura (Rho 2).

• Derivada del precio de la opcion respecto del tiempo (Theta)24.

• Derivada del precio de la opcion respecto de la probabilidad que interviene enla mixtura (Psi).

Las tres nuevas derivadas que aparecen ahora tienen que ver precisamente con elsmile y su cobertura; de hecho, los parametros que caracterizan el smile en el entornomixtura son las dos volatilidades (σ1 y σ2), la distancia entre las dos medias (m1−m2)

23En realidad el modelo de B-S, tal y como se utiliza en el mercado, requiere muchos mas dedos parametros: requiere tantas volatilidades como strikes se coticen; si hay n strikes cotizados, elmodelo requiere n + 1 parametros.

24En el artıculo se presenta la mixtura como una aproximacion de la distribucion del subyacentepara un plazo determinado, sin embargo no se ha determinado un proceso estocastico para modelizarla evolucion en el tiempo del subyacente. En este sentido, el modelo de valoracion es estatico,proporciona valoraciones para un plazo y nada dice de cuanto vale la opcion para plazos diferentes.En tanto en cuanto no se de dicho proceso, no tiene sentido hablar de evolucion del precio de lasopciones en el tiempo ni tiene sentido por tanto hablar de Theta.

Page 81: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

El uso de las mixturas de distribuciones gaussianas en finanzas 73

y la probabilidad (p). Al igual que en el entorno B-S, es posible “cubrir” los riesgosminimizando al maximo las distintas derivadas de las opciones.

Como se ha visto, el modelo de mixtura contempla perfectamente la existenciadel smile; sin embargo, el modelo descrito es estatico, describe las opciones para unvencimiento dado pero no sirve para, conociendo el valor de las opciones para undeterminado vencimiento, valorar otras opciones de diferente vencimiento. En todomomento se ha supuesto que existe un determinado proceso estocastico tal que ladistribucion del subyacente que sigue dicho proceso es una mixtura de gaussianas enun instante t del tiempo. Pero, ¿que pasa antes y despues de t? Con el modelo queaquı se presenta no es posible afirmar nada25 y por tanto nada se puede decir acercade como es “Theta” (derivada de la opcion respecto del tiempo) en este contexto. Apesar de lo anterior, en el anexo A se presenta una Theta que corresponde a una puraextrapolacion de la Theta del modelo B-S al entorno mixtura, que a pesar de la formatan sui generis como se ha calculado parece funcionar bien.

Para comprobar hasta que punto sirven las derivadas en el entorno mixtura se hanrealizado dos ejercicios. El primero ha consistido en comprobar como funciona unaaproximacion de primer orden para el precio de las opciones. Con datos de tres dıas decotizaciones de opciones sobre el ındice S&P se han estimado todos los parametros delas mixturas que mejor ajustan y se han calculado las derivadas (en entorno mixtura).A continuacion, utilizando el precio del primer dıa como base, se han calculado losprecios para los otros dıas usando la siguientes aproximacion de primer orden (salvoen el subyacente):

Preciot+1 ≈ Preciot + ∆Precio = Preciot + Delta ∆S +12

Gamma (∆S)2

+Vega2 ∆σ2 + Rho1 ∆m1 + Rho2 ∆m2 + Psi ∆p2 + Theta∆t .

Ası, se ha comparado el precio real con el precio obtenido a partir de la aproximacion;los resultados se pueden ver en las dos graficas siguientes: la primera grafica presentael precio de las opciones call sobre el S&P el dıa 18/05/98 (vcto. 19/06/98).

25Los autores estan trabajando en esta lınea, intentando caracterizar el proceso estocastico que dalugar a que la distribucion del subyacente sea una mixtura para cualquier instante del tiempo. Todoparece indicar que existe mas de un proceso con dichas caracterısticas y lo ideal serıa identificar, detodos ellos, aquel que no solo explica el smile sino que ademas se ajusta a la estructura temporal delas volatilidades implıcitas.

Page 82: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

74 Susana Corcuera y Juan Carlos Garcıa Cespedes

La segunda presenta los smiles de los tres dıas: el smile del 18/05/98 es la lıneadiscontinua, el dıa 20 sufrio una ligera rotacion y el dıa 21 casi una traslacion paralela.

En el ultimo grafico se presenta, en lınea discontinua, las diferencias reales de preciosde las opciones call entre el 18/05/98 y los dıas 20 y 21. La lınea continua representalas diferencias de precios calculadas a partir de la expansion de Taylor cuasilineal(salvo en el subyacente) antes comentada. Como se ve, las diferencias entre ambascurvas, real y aproximada a traves de las derivadas, son mınimas; esto indica que lasderivadas de la mixtura funcionan bien.

El segundo ejercicio ha consistido en construir, en el momento t, la cobertura a unaposicion en opciones. Concretamente, se deseaba cubrir una posicion de 1.000.000de opciones at the money tomando posiciones en otras cuatro opciones de diferentestrike. En el cuadro adjunto se ve el resultado del ejercicio.

Importe en ptas.strike Posicion en Valor 18/5/98 Variacion 20/5/98 Variacion 21/5/981090 980,869 35,067.628 5,230.504 250.9291100 -1,608.442 -51,888.619 -8,121.848 -277.499110511101115 1,000.000 22,742.391 4,084.510 -202.9591120112511301135 -916.806 -11,700.632 -2,448.559 724.7671140 539.575 5,828.180 1,257.602 -484.6731150

Importe total 22,742.391 2.209 20.565

Page 83: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

El uso de las mixturas de distribuciones gaussianas en finanzas 75

La variacion de la opcion at the money (strike 1115) hubiera sido, sin cobertura, de+4.084.510 y −202.959; con la cobertura tan solo de 2209 y 10565. Como se ve, lacobertura ha funcionado perfectamente26.

Anexo A: precio y derivadas en el entorno mixtura

Aquı se presenta en detalle el precio y las derivadas de una opcion bajo el supuestode mixtura.

El valor de la opcion, de tipo call por ejemplo, en Black-Scholes (B-S) serıa:

C = S N(d1) − X e−r ∆t N(d2) ,

en donde d1 y d2 vienen dados por

d1 =log(S/X) +

(r + σ2/2

)∆t

σ√

∆t,

d2 =log(S/X) +

(r − σ2/2

)∆t

σ√

∆t= d1 − σ

√∆t .

En el caso de usar una mixtura de normales el precio de la opcion, C, vendrıa dadopor:

C =p em1 ∆t C1 + (1 − p) em2 ∆t C2

p em1 ∆t + (1 − p) em2 ∆t,

en donde, para el caso de nuevo de la opcion call por ejemplo:

C1 = S N(d11 − X e−m1 ∆t N(d1

2) ,

C2 = S N(d21 − X e−m2 ∆t N(d2

2) ,

m1 = µ1 +σ2

1

2,

m2 = µ2 +σ2

2

2,

d11 =

log(S/X) + (m1 + σ21/2)∆t

σ1

√∆t

,

d12 =

log(S/X) + (m1 − σ21/2)∆t

σ1

√∆t

= d11 − σ1

√∆t ,

d21 =

log(S/X) + (m2 − σ22/2)∆t

σ2

√∆t

,

d22 =

log(S/X) + (m2 + σ22/2)∆t

σ2

√∆t

= d21 − σ2

√∆t .

26La cobertura se ha calculado mediante la opcion solver de EXCEL 5.0, buscando la posicion enlas otras cuatro opciones que minimiza la variacion “esperada” de la cartera. Por otra parte, serıamuy interesante realizar el mismo ejercicio para varios dıas seguidos (al menos durante un mes); ental caso se verıa mucho mejor la efectividad de la cobertura.

Page 84: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

76 Susana Corcuera y Juan Carlos Garcıa Cespedes

Tambien se puede expresar el precio de la opcion como

Cm = p′ C1 + (1 − p′)C2 ,

en dondep′ = p el1 ∆t , m1 − r = l1 .

Como se ve, conociendo la formula de valoracion de la opcion en entorno B-S, esposible conocer la formula de valoracion en entorno mixtura; no es mas que unacombinacion lineal en donde los pesos de la combinacion son una transformacionsencilla de la probabilidad de la mixtura.

A.1 Las griegas con mixturas

Veamos el caso particular de opciones tipo call bajo entorno B-S o bajo entornomixtura (se deja al lector el ejercicio de calculo de las derivadas para opciones tipoput, digitales,. . . ).

• Delta: La delta de una opcion es la derivada del precio respecto del subyacente.

∆ =∂C

∂S.

En el entorno B-S se tenıa que ∆ = N(d1). En el entorno Mixtura, la delta de laopcion es, como el precio, la combinacion lineal de “dos deltas”:

∆m = p′ ∆1 + (1 − p′)∆2 ,

en donde p′ = p el1 ∆t, m1 − r = l1, ∆1 = N(d11) y ∆2 = N(d2

1).

• Gamma: La gamma de una opcion es la derivada de la delta respecto del precio:

Γ =∂∆∂S

.

En el entorno B-S, la gamma viene dada por

Γ =N ′(d1)

S σ√

∆t.

En el entorno mixtura, la gamma es una combinacion lineal de “dos gammas”:

Γm = p′ Γ1 + (1 − p′) Γ2 ,

donde

p′ = p el1 ∆t , m1 − r = l1 , Γ1 =N ′(d1

1)S σ1

√∆t

, Γ2 =N ′(d2

1)S σ2

√∆t

.

Page 85: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

El uso de las mixturas de distribuciones gaussianas en finanzas 77

• Vega: La vega de una opcion es la derivada del precio respecto de la volatilidad

Λ =∂C

∂σ.

En el entorno B-S la vega viene dada por: Λ = S√

∆t N ′(d1). En el entorno mix-tura, no existe una unica vega, existen dos, una por cada normal constituyente de lamixtura:

Λ1m = p′ Λ1 , Λ2

m = (1 − p′) Λ2 ,

donde

p′ = p el1 ∆t , m1 − r = l1 , Λ1 = S√

∆t N ′(d11) , Λ2 = S

√∆t N ′(d2

1) .

• Rho: La Rho de una opcion es la derivada del precio respecto del tipo de interes

Rho =∂C

∂r.

En el entorno B-S la rho viene dada por Rho = X ∆t e−r ∆t N(d2). En el entornomixtura no existe una rho, existen dos: realmente existen las derivadas del precio delas opciones respecto de las dos medias de las normales constituyentes de las mixturas.

Rho1m = p′ (Rho1 + C1 ∆t) , Rho2

m = (1 − p′) (Rho2 + C2 ∆t) ,

en donde p′ = p el1 ∆t, m1 − r = l1 y

Rho1 =∂C1

∂m1= X ∆t e−m1 ∆t N(d1

2) , Rho2 =∂C2

∂m2= X ∆t e−m2 ∆t N(d2

2) .

• Psi: La Psi de una opcion es la derivada del precio respecto de la probabilidad p:

Ψ =∂C

∂p.

En el entorno B-S, no existe esta derivada. En el entorno mixtura, Psi viene dada por

Ψm = el1 ∆t (C1 − C2) ,

en donde m1 − r = l1.

• Theta: La theta de una opcion es la derivada del precio respecto del tiempo:

Θ =∂C

∂t.

En el entorno B-S, theta viene dada por:

Θ = −S N ′(d1)σ

2√

∆t− r X e−r ∆t N(d2) .

Page 86: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

78 Susana Corcuera y Juan Carlos Garcıa Cespedes

En el entorno mixtura, theta no es exactamente una combinacion lineal, existe untermino adicional:

Θm = p′ θ1 + (1 − p′)Θ2 + l1 p′, (C2 − C1) ,

en donde m1 − r = l1 y

Θ1 = −S N ′(d11)σ1

2√

∆t− m1 X e−m1 ∆t N(d1

2) ,

Θ2 = −S N ′(d21)σ2

2√

∆t− m2 X e−m2 ∆t N(d2

2) .

Anexo B: el precio de las digitales en el entorno mix-tura

El valor de la opcion digital en Black-Scholes (B-S) es:

C = X e−r ∆t N(d2) ,

en donde d2 viene dado por:

d2 =log(S/X) + (r − σ2/2)∆t

σ√

∆t.

En el caso de usar una mixtura de normales, el precio de la opcion, C, viene dadopor:

Cm =p em1 ∆t C1 + (1 − p) em2 ∆t C2

p em1 ∆t + (1 − p) em2 ∆t,

en donde, para el caso de nuevo de la opcion call,

m1 = µ1 +σ2

1

2,

m2 = µ2 +σ2

2

2,

d12 =

log(S/X) + (m1 − σ21/2)∆t

σ1

√∆t

,

d22 =

log(S/X) + (m2 − σ22/2)∆t

σ2

√∆t

.

Tambien se puede expresar el precio de la opcion como

Cm = p′ C1 + (1 − p′)C2 ,

en donde p′ = p el1 ∆t y m1 − r = l1.

Page 87: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

El uso de las mixturas de distribuciones gaussianas en finanzas 79

Referencias

[1] Alexander, Carol y P. Williams, Modelling the term structure of kurtosis: Acomparision of neural network and GARCH methods, 1.997.

[2] Apuntes del seminario, “La gestion de la volatilidad: Valoracion, Prediccion yTrading”, organizado por Instituto MEFF y la Escuela Europea de Finanzas.Enero 1.998

[3] Baxter, Martin y Andrew Rennie, Financial Calculus, an introduction to deriva-tive pricing. Cambridge University Press”, 1.996.

[4] Diebolt, Jean y Christian Robert, Bayesian estimation of finite mixture distri-butions. Part I: Theoretical aspects. L.S.T.A. Universite Paris VI.

[5] Diebolt, Jean y Christian Robert, Bayesian estimation of finite mixture distri-butions. Part II: Sampling implementation. L.S.T.A. Universite Paris VI.

[6] Duffie, Darrell. Security Markets, Stochastic Models, Academic Press.

[7] Duffie, Darrell, Dynamic Asset Pricing Theory. Second edition, Princeton Uni-versity Press, 1.996.

[8] Dupire, Bruno. Pricing and hedging with smiles. Mathematics of derivative secu-rities. Cambridge University Press, 1.997.

[9] Feelders, A.J., Learning from biased data using mixture models. Data DistilleriesLtd., Amsterdam, The Nederlands.

[10] Green, Peter J. y Sylvia Richardson, “On Bayesian analysis of mixtures with anunknown number of components”, presented at the Workshop on Model Interpre-tation and Model Robutness in Highly Structured Stochastic Systems. Revisedversion, October 1.996.

[11] Hamilton, J. “A quasi-Bayesian approach to estimating parameters for mixturesof normal distributions”. Journal of Business and Economic Statistics 9 (1991),no. 1, pp. 27–39.

[12] Haykin, Simon. Neural Networks: A comprehensive foundation. Macmillan Pu-blishing Company, Inc. 1.994.

[13] Hendricks, Darryll, “Evaluation of Value at Risk models using historical data”.Economic Policy Review, Federal Reserve Bank of New York 2, April 1.996, pp.39–69.

[14] Hull, John y Alan White, “Value at Risk when daily changes in market variablesare not normally distributed” forthcoming Journal of Derivatives, Noviembre1.997.

Page 88: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

80 Susana Corcuera y Juan Carlos Garcıa Cespedes

[15] Hull, John y Alan White, “Evalutating the impact of Kurtosis and skewness onderivative prices” forthcoming Net Exposure, Noviembre 1.997.

[16] Hull, John, Options, futures and other derivative securities, Third Edition, Pren-tice Hall.

[17] J.P. Morgan/Reuters, RiskMetricsTM, Technical Document, Fourth Edition, NewYork, 1.996.

[18] Lamberton D. y B. Lapeyre, Introduction to Stochastic Calculus applied to Fi-nance. Chapman & Hall, 1.996.

[19] Robert, Christian P, Mixtures of distributions: Inference and estimation. Dept.de Math., Universite de Rouen et Crest, Insee, Paris.

[20] Roeder, Kathryn y Larry Wasserman, Practical Bayesian density estimationusing mixtures of normals. Carnegie Mellon University, 1.995

[21] Stephens, Matthew, Bayesian methods for mixtures of normal distributions. PhDThesis, University of Oxford, 1.997.

[22] Subu Venkataraman, “Value at Risk for a mixture of normal distributions: Theuse of quasi-bayesian estimation techniques” Economic Perspectives, Federal Re-serve Bank of Chicago.

[23] Zangari, P. “An improved methodology for measuring VaR” RiskMetrics Moni-tor, Reuters/JP Morgan, 1.996.

[24] Zangari, P. “What risk managers should Know about mean reversion and jumpsin prices” RiskMetrics Monitor, Reuters/JP Morgan, 1.997.

Susana CorcueraGestion Global de Riesgo de Mercado BBVA

Paseo de Recoletos, 12, planta 228001-Madrid, Espana

e-mail: [email protected]

Juan Carlos Garcıa CespedesGestion Global de Riesgo de Mercado BBVA

Paseo de Recoletos, 12, planta 228001-Madrid, Espana

e-mail: [email protected]

Page 89: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

La problematica de medicion de

la performance

Prosper Lamothe Fernandez1

Resumen

En este trabajo se realiza un analisis comparativo de los diferentes metodospropuestos en la literatura financiera para analizar la denominada performancede las carteras. A partir de analisis de los ratios clasicos, el autor introducelas nuevas medidas de performance que aparecen en la investigacion y en laindustria a partir de los anos 90. Adicionalmente, se incide en los aspectos atener en cuenta con carteras internacionales y en las carteras mixtas, donde laseleccion del ındice de referencia o benchmark no es evidente. Por otro lado,se comenta la problematica que supone para la medida de la performance laexistencia de diferentes estilos de inversion y algunas soluciones al sesgo queproduce este factor.

1 Introduccion

Uno de los aspectos mas interesantes de la gestion de carteras es la medida de lacalidad del gestor ponderando la rentabilidad alcanzada y el riesgo asumido. Lacalidad de la gestion se conceptua a traves del termino performance que no tiene faciltraduccion al castellano. En general los requisitos para una buena gestion de carterasson dos:

1. Habilidad para obtener una rentabilidad mayor que un ındice de mercado equi-valente a la cartera en terminos de riesgo.

2. Capacidad para eliminar el riesgo no sistematico de la cartera.

El impresionante desarrollo de la industria de gestion de activos ha fomentado latecnologıa de medicion de la performance. Para medir la performance lo primero quetenemos que hacer es medir la rentabilidad obtenida en la realidad por la cartera.De forma periodica, los inversores deben medir la performance de la cartera con unsistema que permita responder a las siguientes cuestiones:

1Prosper Lamothe Fernandez es Catedratico de Economıa Financiera de la Universidad Autonomade Madrid y presidente de Delta Investigacion Financiera. Esta charla se impartio en la sesion delSeminario MEFF-UAM de abril de 1998.

Page 90: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

82 Prosper Lamothe

• ¿Cual es la rentabilidad global de la cartera?

• ¿Como se descompone esta rentabilidad en terminos de plusvalıas, resultadosde cambio y dividendos?

• ¿Cuales son las decisiones que han contribuido mas a la rentabilidad?

• ¿Que diferencial se ha obtenido frente a otros ındices de referencia?

• ¿Se anade valor de forma significativa en la seleccion de acciones en algun mer-cado especıfico?

• ¿Se esta logrando el objetivo de diversificacion?, etc.

Una primera estimacion de la performance de la cartera se logra a traves del calculode los denominados ındices de performance.

2 Los ındices clasicos de performance

2.1 Ratio de Sharpe

El ındice o ratio de Sharpe (1966), se calcula por la siguiente expresion:

S =Rc − Rf

σc,

siendo Rc la rentabilidad de la cartera en el periodo de analisis, Rf la rentabilidaddel activo libre de riesgo en el periodo de analisis y σc la desviacion tıpica de larentabilidad de la cartera durante el periodo de analisis.

Con el ratio de Sharpe estimamos la remuneracion al riesgo que obtiene cadagestor en terminos del diferencial de rentabilidad sobre la tasa libre de riesgo porcada punto porcentual de desviacion tıpica del rendimiento de la cartera.

En el caso de carteras internacionales, un aspecto a analizar en la aplicacion deeste ındice es la definicion de la tasa libre de riesgo. Para una cartera global, estapuede ser la rentabilidad de las letras del tesoro norteamericanas. En el caso decarteras regionales, la mejor opcion es utilizar la rentabilidad del activo libre de riesgoen la economıa mas representativa de la zona. En ultimo caso, podemos utilizar larentabilidad libre de riesgo en la moneda base del inversor.

La medida de Sharpe no presupone la verificacion de ningun modelo, (como porejemplo, el CAPM), mide el riesgo de forma global, pudiendo aplicarse para un amplioespectro de fondos (renta variable, mixtos, fondos internacionales, etc.). Esto haceque el ındice de Sharpe siempre se estime para cualquier cartera en el analisis desu perfil rentabilidad-riesgo. Por ejemplo en el caso de los denominados fondos degestion alternativa (hedge funds), el ındice de Sharpe es uno de los escasos ratios deperformance que se pueden aplicar.

Page 91: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

La problematica de medicion de la performance 83

2.2 Indice de Treynor

El ındice de Treynor (1966), se calcula por la siguiente expresion:

T =Rc − Rf

βc,

significando Rc y Rf lo mismo que en el ındice anterior y donde βc es la beta de lacartera.

El ratio de Treynor supone que la beta es un buen indicador del riesgo sistematicode la cartera y en cierta medida asume la verificacion del CAPM. En el caso de carterasinternacionales, la beta la debemos estimar en base al ındice mas representativo deluniverso de acciones de posible inversion. En algunos casos, por ejemplo, carterasglobales, lo mas apropiado es estimar el ındice por subcarteras (por ejemplo, America,Eurolandia, etc.).

La asuncion de un determinado modelo de equilibrio del mercado de capitaleslimita su aplicacion frente al ındice de Sharpe y otros ratios.

Tal como aparece en la figura 1, el ındice de Treynor nos estima el angulo dela lınea de equilibrio rentabilidad-riesgo sistematico que alcanzan los gestores de losfondos. En el ejemplo que manejamos, hemos partido de la base que los gestores hansuperado a la lınea de equilibrio del mercado de capitales representada por LEMC,obteniendo un mayor premio al riesgo sistematico de sus carteras.

Rentabilidad

Beta0 1

Rf = 8%............

........................

........................

........................

......A B

12%

15%

LEMC

18%

Figura 1: Indice de Treynor: LEMC es la lınea de equilibrio del mercado de capitales.Supuesto de un 4% de prima de rentabilidad Rm − Rf .

Page 92: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

84 Prosper Lamothe

2.3 Indice de Jensen

Como sabemos, segun el CAPM,

Ri − Rf : βi (Rm − Rf ) + ui ,

siendo ui una variable aleatoria. Si un gestor es mejor que el resto del mercado, debesuperar de forma consistente las primas de rentabilidad por riesgo que se obtienen endicho mercado. Si se denomina α a la rentabilidad obtenida en la cartera i por unagestion mejor que la del resto del mercado,

Ri − Rf : αi + βi (Rm − Rf ) + ui .

Y en base a los valores de αi, sabemos que si αi > 0 se ha desarrollado una buenagestion, y para αi < 0 la gestion ha sido negativa.

Realmente αi debe ser positiva y estadısticamente significativa para que el gestorhaya obtenido una adecuada performance.

Si α = 0, los gestores adecuan su cartera a la lınea de equilibrio del mercado decapitales. Si α > 0, los gestores estan incorporando valor anadido en su gestion ysi α < 0, los gestores realizan una mala labor ya que no son capaces de alcanzar larentabilidad correspondiente a una estrategia pasiva en el mercado.

En el caso de una cartera internacional, se debe tener muy en cuenta la composicionde la cartera estrategica a la hora de estimar el α de Jensen. Ası, si la composicionestrategica es 50% en USA, 50% en Japon, tenemos dos soluciones:

a) Estimar las betas y la medida de Jensen de la cartera en relacion a un ındicesintetico formado en un 50% por un ındice USA y en el otro 50% por un ındicejapones.

b) Calcular el ındice de Jensen a nivel de subcarteras. Esta es la opcion masaconsejable, ya que nos permite evaluar la calidad de nuestra gestion a nivelindividual en los diferentes mercados en que invertimos.

El ındice de Jensen tiene problemas similares al ratio de Treynor. Para su correctaaplicacion se deberıa verificar el CAPM, lo cual es una cuestion muy debatida, noaceptada en terminos generales y que se sale del ambito de este trabajo.

Adicionalmente, tanto el ındice de Treynor como el ındice de Sharpe son inadecua-dos en la medicion de la performance de carteras de renta fija y/o activos distintosa las acciones. De los tres ındices clasicos, el ındice de Sharpe es el mas utiliza-do en los mercados. Adicionalmente, se han desarrollado otros ratios e ındices quecomentaremos en los siguientes apartados.

Page 93: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

La problematica de medicion de la performance 85

3 Los nuevos ındices de performance

3.1 El ratio de informacion

En la practica de la gestion de carteras se ha extendido el uso del denominado ratiode informacion que mide la performance de la cartera en relacion a la evolucion delındice o ındices de referencia (benchmarks).

El ratio se calcula por la siguiente expresion:

RI =Rc − Rb

σcd,

siendo Rc la rentabilidad de la cartera en el periodo de analisis, Rb la rentabilidad delındice de referencia o benchmark durante el periodo de analisis, y σcb la desviaciontıpica de los diferenciales de rentabilidad entre la cartera y el benchmark durante elperiodo de analisis.

Este ratio presenta varias ventajas con respecto a las medidas anteriores:

• No asume el cumplimiento de ningun modelo especıfico de equilibrio del mercadode capitales como los ratios de Treynor y Jensen.

• Mide adecuadamente el valor anadido por el gestor al estimar la diferencia derentabilidad entre la cartera y el benchmark. Esta medida es mas correcta quela del ındice de Sharpe. Por ejemplo, el ındice de Sharpe puede dar valoresnegativos para fondos de renta variable en un periodo de caıdas de los preciosbursatiles. ¿Significa eso una mala performance de todos los gestores? No,depende de la rentabilidad alcanzada en relacion a los ındices de mercado.

• En general, para los fondos y carteras gestionados en base a un ındice o ben-chmark, constituye la medida ideal de la calidad de su gestion al relacionar eldiferencial de rentabilidad alcanzado con el riesgo relativo asumido por el ges-tor al separarse en mayor o menor grado de su ındice de referencia o benchmark(riesgo activo).

En nuestra opinion, el ratio de informacion, junto con otros ındices similares de me-dida de la performance, se iran imponiendo progresivamente en la practica y en losambientes academicos.

3.2 La medida M2 de Modigliani-Modigliani

Franco y Leah Modigliani (1997) han propuesto otras medidas de performance quepor simplicidad han denominado ındices M2. En la metodologıa propuesta, el primerpaso consiste en igualar las carteras en terminos de riesgo en relacion al benchmarko ındice de referencia. Ası, si el riesgo de nuestra cartera, estimado por la desviaciontıpica de los rendimientos anuales es σi y la del benchmark σB , sabemos que podemos

Page 94: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

86 Prosper Lamothe

igualar el riesgo de la cartera al ındice de referencia “apalancandonos” (medianteendeudamiento) o “desapalancandonos” en una proporcion di, de modo que

(1 + di)σi = σB ,

y por lo tanto,di =

σB

σi− 1 .

A partir de aquı, M2 se calcula como la rentabilidad de la cartera objeto de estudioapalancada (o desapalancada) para replicar al benchmark :

M2 = (1 + di) ri − di rf .

De forma analoga, podemos calcular una medida M2 en base a betas, que denomina-remos M2

beta, con razonamientos analogos a los anteriores, por la expresion

M2beta =

(BB

Bi

)(ri − rf ) + rf , (1)

y adicionalmente podemos estimar un M2 − α por la igualdad

M2 − α = M2beta − rB ,

siendo rB la rentabilidad del benchmark. Sustituyendo M2beta por su valor en (1) y

agrupando terminos, obtenemos que

M2 − α =αJensen

Bi.

En terminos de jerarquizacion, las medidas M2 no aportan ningun valor anadido.Ahora bien, nos permiten enriquecer el analisis de la performance con la obtencionde rentabilidades de carteras equivalentes en terminos de riesgo.

4 La medicion de la sincronizacion

Los ındices que hemos estudiado en epıgrafes anteriores nos permiten evaluar global-mente la performance de la cartera. Ahora bien, no distinguen las causas por las quelos gestores han podido obtener una buena performance. En un primer analisis, sinconsiderar todavıa los aspectos especıficos de las carteras internacionales, podemosdecir que los gestores pueden obtener rentabilidades superiores al benchmark por dosrazones:

a) Porque seleccionan bien los tıtulos que integran la cartera. Es decir, por unabuena seleccion de valores.

b) Porque anticipan correctamente los movimientos del mercado, lo que les permiteobtener beneficios modulando su exposicion a la renta variable en base a susprecisiones. Esto se denomina sincronizacion.

Page 95: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

La problematica de medicion de la performance 87

La cuestion es como medir lo aportado por los gestores realizando actividades demarket timing, es decir a traves de su sincronizacion con el mercado. Tal como indicaFreixas (1996) y Matallın (2000), existen dos metodos para estimar la sincronizacion:el metodo cuadratico y el metodo basado en la opcion de reestructuracion de lacartera.

Segun el metodo cuadratico, la beta de la cartera variara progresivamente con lasvariaciones del mercado. Aumentara cuando el mercado se halle en fase alcista, porlo que la rentabilidad de la cartera sincronizada sera mayor que la de la cartera debeta constante (no sincronizadas) y en fases de correccion del mercado la rentabi-lidad tambien sera mayor al reducir la beta con una gestion de menor riesgo en lacartera. Una forma de medir este efecto es identificar la convexidad obtenida con lasincronizacion anadiendo un termino cuadratico en la modelizacion de Jensen. Ası,

rct − rft = αc + βc(rmt − rft) + δ(rmt − rft)2 + ucy .

Si δc es positivo y estadısticamente significativo, existen indicios de que los gestoresestan logrando una adecuada sincronizacion.

El segundo metodo asume que el gestor consigue prever solo dos tipos de periodosdistintos, los de mercado alcista y bajista, sin poder modular de forma progresiva labeta de su cartera. En este caso2, la regresion es la siguiente:

rct − rft = αc + βc (rmt − rft) + δc max(0, rf − rmt) + uct .

Bajo este supuesto, el nivel de sincronizacion se corresponde a una opcion put conprecio de ejercicio igual al rendimiento del activo libre de riesgo.

Por ambos metodos, el valor del parametro α no darıa lo anadido a traves de laseleccion de valores y el parametro δ reflejarıa el rendimiento aportado por sincroni-zacion.

Ambos modelos son utiles para medir la sincronizacion. La eleccion de uno y otrose debe realizar en funcion de las caracterısticas propias del proceso de gestion. Encualquier caso, es muy facil estimar ambas regresiones por lo que se puede calcularlos δ y αs por los dos metodos.

5 La atribucion global de la performance

Las carteras formadas por varias categorıas de activos como las carteras de accionesinternacionales exigen un tratamiento especıfico a la hora de medir la calidad de lagestion que realizamos. Planteada una asignacion estrategica de la cartera en terminosde bandas de posible inversion por cada categorıa de activos junto con los niveles de

2Ver Freixas (1996).

Page 96: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

88 Prosper Lamothe

medios de inversion a efectos de medicion de la performance debemos estimar lacontribucion del gestor en terminos de:

- Asignacion de activos: es decir la contribucion positiva o negativa por el pesoasignado a las diferentes categorıas de activos dentro de las bandas preestable-cidas en las que se permite hacer market timing.

- Seleccion de valores: consistente en la medicion de los aportado a traves dela seleccion de tıtulos, segmentos de la curva, etc. dentro de cada categorıa deactivos.

Para una correcta medicion es fundamental una adecuada seleccion de ındices dereferencia o benchmarks para cada categorıa de activos.

A partir de la cartera estrategica, los ındices o benchmarks y los pesos realesmantenidos, obtenemos las siguientes expresiones:

Asignacion de valores: AAi = (wir − wi

b) (rib − Rb) ,

siendo

AAi la contribucion de la Asignacion de Activos de la categorıa i,

W ir el peso real asignado a la categorıa i;

W ib el peso asignado a la categorıa i;

rib la rentabilidad geometrica del mercado i, medida por su benchmark ;

Rb la rentabilidad geometrica de la cartera benchmark :

Rb =∑i=1

wib ri

b ;

La Asignacion de Activos conjunta de la cartera se obtiene por agrupacion (n es elnumero de categorıas basicas):

AAc =n∑

i=1

AAi .

Seleccion de valores: SVi = wir (ri

r − rib) ,

siendo

SVi la contribucion de la seleccion de valores de la categorıa i,

W ir el peso real asignado a la categorıa i;

Page 97: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

La problematica de medicion de la performance 89

Rir la rentabilidad geometrica real de la cartera i;

Rib la rentabilidad geometrica del mercado i, medida por su benchmark.

Para anadir valor la rentabilidad de la cartera ha de ser superior a la de su ındice dereferencia, y la contribucion a la rentabilidad de la cartera sera mayor cuanto mayorsea el peso de la categorıa.

La Seleccion de Valores conjunta de la cartera se obtiene por agrupacion:

SVc =n∑

i=1

SVi .

Se puede observar claramente que la medida de la contribucion de la asignacion deactivos y de la sincronizacion se orientan a la estimacion de la misma variable: la ca-pacidad del gestor (gestores), de anadir valor modulando su exposicion a los diferentesactivos. La medida de sincronizacion es util para el investigador externo que quieremedir de forma exogena, la capacidad de los gestores de anadir valor modificandoel riesgo sistematico de las cartera en funcion de las expectativas sobre la evoluciondel mercado. Los consultores y gestores que tienen datos internos y mas completosde las carteras aplicaran las metodologıa comentada en este epıgrafe para evaluar lacapacidad de sincronizacion con el mercado de un determinado proceso de inversion.

6 Otros factores que afectan a la performance

Otra cuestion importante en la medida de la performance es el estilo de inversion.Con los ratios clasicos podemos tener un gran sesgo derivado de la no identificaciondel estilo de gestion de la cartera. Por ejemplo, empıricamente se ha demostrado quelas carteras value baten a medio y largo plazo al ındice general. La solucion a esteproblema puede basarse en dos enfoques:

• Estimar alfas (al estilo de Jensen) en base a modelos multifactoriales de explica-cion del rendimiento de la cartera. En la medida en que el modelo multifactorialidentifique el riesgo especıfico del factor estilo, los alfas obtenidos me permitenuna mejor evaluacion de la performance.

• Utilizar el metodo propuesto por Sharpe (1992), que parte de la identificacioninicial de los estilos de gestion desarrollados en las carteras, utilizando tambienmodelos multifactoriales.

Obviamente la mejor solucion teorica serıa disponer de un benchmark especıfico paracada estilo, lo que no es siempre posible.

Dada la importancia que esta alcanzando la correcta medida de la performancepara todos los instrumentos de inversion colectiva, no dudamos que en los proximosanos se desarrollaran tecnicas mas depuradas que las actuales para evitar el riesgo delestilo de gestion.

Page 98: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

90 Prosper Lamothe

Referencias

[1] R. Dembo (1997), Optimal Portfolio Replication, Algo Research, Working PaperSeries.

[2] F. Fabozzi (1995), Investment Management, Prentice-Hall, New Jersey.

[3] F.Galan (1996), Riesgo y Rentabilidad de los Fondos de Inversion Mobiliaria enEspana, Tesis Doctoral. Universidad de Cordoba.

[4] P. Lamothe (1999), Gestion de carteras de acciones internacionales, EditorialPiramide, Madrid.

[5] M.C.Jensen (1969), “Risk, the Pricing of Capital Assets, and the Evaluation ofInvestment Portfolios”, Journal of Business, Abril.

[6] J.C. Matallın Saez (2000), Gestion de carteras: evaluacion de los fondos de in-version mobiliaria en Espana, Tesis Doctoral, Universidad Jaime I, Castellon.

[7] F. Modigliani (1997), ”Risk-Adjusted Performance”, The Journal of PortfolioManagement, Invierno, pags. 45–54.

[8] L. Modigliani (1997), Risk-adjusted Performance, en Morgan Stanley Dean Wit-ter(ed.), The Risk Book, Londres, pags. 46-57.

[9] G. Rubio (1993), “La evaluacion de los fondos de inversion el analisis de lacomposicion mensual de las carteras”, Analisis Financiero 59, pags. 64–83.

[10] G. Rubio (1995), “Further Evidence on Performance Evaluation: Portfolio Hol-dings, Recommendations and Turnover Costs”, Review of Quantitative Financeand Accounting 5, pags. 127–153.

[11] W.F. Sharpe (1996), Mutual Fund Performance, Journal of Business 39, Enero.

[12] W. Sharpe (1992), “Asset Allocation: Management Style and Performance Mea-surement”, Journal of Portfolio Management, Invierno, pags. 7–19.

[13] J.L. Treynor (1966), “How to Rate Management Investment Funds”, HarvardBusiness Review 43, Enero-Febrero.

[14] J.L. Treynor, K.K. Mazuy (1992), “¿Pueden los fondos de inversion anticipar elmercado?”, Analisis Financiero 58, pags. 26–31.

Prosper Lamothe FernandezDepartamento de Financiacion e Investigacion Comercial

Universidad Autonoma de MadridCampus de Cantoblanco, s/n

28049-Madrid, Espanae-mail: [email protected]

Page 99: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Equivalencia de los distintos

metodos para valorar empresas

por descuento de flujos.

Distintas alternativas para

valorar el ahorro de impuestos

debido al apalancamiento y sus

implicaciones sobre la valoracion

Pablo Fernandez1

Resumen

Este artıculo se centra en la valoracion de empresas por descuento de flujos.En la primera parte se demuestra que los cuatro metodos mas habituales de

valoracion por descuento de flujos (free cash flow descontado al WACC; flujospara las acciones descontados a la rentabilidad exigida a las acciones; Capitalcash flow descontados al WACC antes de impuestos; y Adjusted Present Value)proporcionan siempre (un periodo, multiperiodo, flujos perpetuos, cualquier es-tructura temporal de los flujos, ratio de endeudamiento constante o variable)el mismo valor. Este resultado es logico, porque todos los metodos analizan lamisma realidad bajo las mismas hipotesis; solo difieren en los flujos que tomancomo punto de partida para la valoracion.

Las discrepancias de las diversas teorıas sobre la valoracion de una empresaprovienen del calculo del ahorro de impuestos debido al apalancamiento (DVTS).El artıculo muestra y analiza 7 teorıas distintas sobre el calculo del DVTS: Mo-digliani y Miller (1963), Myers (1974), Miller (1977), Miles y Ezzell (1980),Harris y Pringle (1985), Ruback (1995), Damodaran (1994), y el metodo de lospracticos. Se demuestra que el metodo de Myers (1974) proporciona resulta-dos inconsistentes. Este trabajo tambien introduce una nueva interpretaciondel resto de las teorıas: que incorporan unos costes de quiebra en la valoracion,entendiendo como tales la diferencia entre el valor de la empresa que propor-cionan Modigliani-Miller (costes de quiebra cero) y el valor de la empresa queproporcionan dichas teorıas. Una manera sencilla de analizar esta diferenciaes a traves del free cash flow ajustado al riesgo del negocio. Para analizar losresultados de las distintas teorıas conviene tener en cuenta que el DVTS no espropiamente el valor actual del ahorro de impuestos debido al pago de intereses

1Pablo Fernandez es profesor de Finanzas en el IESE. Esta charla se impartio en la sesion delSeminario MEFF-UAM de mayo de 1998.

Page 100: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

92 Pablo Fernandez

descontado a una tasa, sino la diferencia de dos valores actuales: el valor actualde los impuestos que paga la empresa sin deuda menos el valor actual de losimpuestos que paga la empresa con deuda. El riesgo de de los impuestos quepaga la empresa sin deuda es inferior al riesgo de los impuestos que paga laempresa con deuda.

Tambien se muestran los cambios que se producen en las formulas de valo-racion cuando el valor de la deuda no coincide con su valor nominal.

1 Introduccion

Este artıculo se centra en la valoracion de empresas por descuento de flujos. En primerlugar se demuestra que los cuatro metodos mas habituales de valoracion por descuentode flujos (WACC, flujos para las acciones, Capital cash flow y APV) proporcionan elmismo valor.

Las discrepancias en la valoracion de una empresa provienen del calculo del ahorrode impuestos debido al apalancamiento (DVTS). El artıculo muestra y analiza 7teorıas distintas sobre el calculo del DVTS. Una de las conclusiones es que el metodode Myers (1974) proporciona resultados inconsistentes. Una interpretacion del restode las teorıas es que incorporan unos costes de quiebra en la valoracion, entendiendocomo tales la diferencia entre el valor que proporcionan Modigliani-Miller (costes dequiebra cero) y el valor que proporcionan dichas teorıas. Una manera sencilla deanalizar esta diferencia es a traves del free cash flow ajustado al riesgo del negocio.

La seccion 2 del artıculo muestra los seis metodos mas habituales de valorar em-presas por descuento de flujos: free cash flow descontado al WACC; flujos para lasacciones descontados a la rentabilidad exigida a las acciones; Capital cash flow des-contados al WACC antes de impuestos; APV; free cash flows ajustados al riesgo delnegocio descontados a la rentabilidad exigida a los activos; y cash flows disponiblespara las acciones ajustados al riesgo del negocio descontados a la rentabilidad exigidaa los activos.

La seccion 3 es una breve resena de los artıculos mas relevantes sobre valoracionde empresas por descuento de flujos. La seccion 4 muestra las principales formulas devaloracion que se derivan de los artıculos mas relevantes: Modigliani y Miller (1963),Myers (1974), Miller (1977), Miles y Ezzell (1980), Harris y Pringle (1985), Ruback(1995), Damodaran (1994), y el metodo de los practicos.

La seccion 5 muestra con un ejemplo las diferencias en la valoracion segun lasalternativas presentadas en la seccion 4. La seccion 6 analiza con mayor detalle elorigen de las diferencias en la valoracion segun los diversos autores: del calculo delahorro de impuestos debido al apalancamiento (DVTS). Tambien proporciona lasdiferencias en la valoracion segun las distintas teorıas.

En el anexo 1 se muestran las abreviaturas utilizadas en este artıculo. En el anexo2 se muestran los cambios que se producen en las formulas de valoracion cuando elvalor de la deuda no coincide con su valor nominal.

Page 101: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion de empresas por descuento de flujos 93

2 Metodos de valoracion de empresas por descuentode flujos

Hay cuatro metodos fundamentales para valorar empresas por descuento de flujos2:

A. A partir del free cash flow y del WACC (coste ponderado de losrecursos)

La formula (1) indica que el valor de la deuda (D) mas el de los recursos propios(E) es el valor actual de los free cash flows (FCF) esperados que generara laempresa, descontados al coste ponderado de la deuda y los recursos propiosdespues de impuestos (WACC):

E0 + D0 = VA0[WACCt ; FCFt] . (1)

La definicion de WACC o “coste ponderado de capital“ (en ingles, weightedaverage cost of capital), viene dada por (2):

WACCt =Et−1 Ket + Dt−1 Kdt (1 − T)

Et−1 + Dt−1. (2)

Ke es la rentabilidad exigida a las acciones, Kd es el coste de la deuda y T esla tasa efectiva del impuesto sobre los beneficios. Et−1 + Dt−1 son valores demercado3.

B. A partir del cash flow esperado disponible para las acciones (CFac)y de la rentabilidad exigida a los recursos propios de la empresa (Ke)La formula (3) indica que el valor de las acciones (E) es el valor actual neto delos cash flows disponibles para las acciones esperados (CFac) descontados a larentabilidad exigida a los recursos propios de la empresa4, (Ke):

E0 = VA0[Ket ; CFact] . (3)

La formula (4) indica que el valor de la deuda (D) es el valor actual neto de loscash flows disponibles para la deuda esperados (CFd) descontados a la rentabi-lidad exigida a la deuda (Kd).

D0 = VA0[Kdt ; CFdt] . (4)

2Las formulas que aparecen a continuacion son validas si el tipo de interes de la deuda coincidecon la rentabilidad exigida a la misma (Ke), o dicho de otro modo, que el valor de mercado de ladeuda es identico a su valor contable. Las formulas para el caso en que esto no sucede aparecen enel anexo 2 y en Fernandez (1999), pp.389-391.

3Realmente, los “valores de mercado” son los valores que se obtienen en la valoracion con laformula (1). Por esto, la valoracion es un proceso iterativo: se descuentan los free cash flows alWACC para calcular el valor de la empresa (D + E), pero para obtener el WACC se necesita el valorde la empresa (D + E).

4Con frecuencia se denomina “coste de los recursos propios” o “coste de las acciones”.

Page 102: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

94 Pablo Fernandez

La expresion que relaciona el FCF con el CFac es5 :

CFact = FCFt + ∆Dt − It (1 − T) , (5)

donde ∆Dt es el aumento de deuda e It son los intereses pagados por la empresa.Es obvio que CFd = It − ∆Dt.

La suma de los valores que proporcionan las formulas (3) y (4) es identica alvalor proporcionado por (1):6

E0 + D0 = VA0[WACCt ; FCFt] = VA0[Ket ; CFact] + VA0[Kdt ; CFdt] .

C. A partir del capital cash flow (CCF) y del WACCBT (coste ponderadode los recursos, antes de impuestos)

Los capital cash flows son los cash flow disponibles para todos los poseedoresde tıtulos de la empresa, sean estos deuda o acciones, y equivalen al cash flowdisponible para las acciones (CFac) mas el cash flow que corresponde a lostenedores de deuda (CFd).

La formula (6) indica que el valor de la deuda hoy (D) mas el de los recursospropios (E), es igual al capital cash flow (CCF) descontado al coste ponderadode la deuda y los recursos propios antes de impuestos7 (WACCBT).

E0 + D0 = VA[WACCBT ; CCFt] . (6)

La definicion de WACCBT es

WACCBT =Et−1 Ket + Dt−1 Kdt

Et−1 + Dt−1. (7)

La expresion (7) se obtiene de igualar (1) con (6). WACCBT representa latasa de descuento que asegura que el valor de la empresa obtenido con ambasexpresiones es el mismo8:

E0 + D0 = VA[WACCBT ; CCFt] = VA[WACCt ; FCFt] .

La expresion que relaciona el CCF con el CFac y con el FCF es

CCFt = CFact + CFdt = CFact − ∆Dt + It = FCFt + It T , (8)

donde ∆Dt = Dt − Dt−1 e It = Dt−1Kdt.5Obviamente, el free cash flow es el hipotetico cash flow disponible para las acciones cuando la

empresa no tiene deuda.6De hecho, una manera de definir el WACC es: el WACC es la tasa a la que se debe descontar el

FCF para obtener el resultado que proporcionan (3) y (4).7BT viene de before taxes (antes de impuestos).8De hecho, una manera de definir el WACCBT es: el WACCBT es la tasa a la que se debe

descontar el CCF para obtener el resultado que proporcionan (3) y (4).

Page 103: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion de empresas por descuento de flujos 95

D. Valor actual ajustado (APV)

La formula del valor actual ajustado, APV (adjusted present value) (9) indicaque el valor de la deuda (D) mas el de los recursos propios (E) de la empresaapalancada, es igual al valor de los recursos propios de la empresa sin apalancarVu mas el valor actual neto del ahorro de impuestos debido al pago de intereses(DVTS):

E0 + D0 = Vu0 + DVTS0 . (9)

Existen varias teorıas para el calculo del DVTS, que analizaremos en la seccion4 de este trabajo9.

Si Ku es la rentabilidad exigida a las acciones en la empresa sin deuda (tambienllamada rentabilidad exigida a los activos), Vu viene dado por

Vu0 = VA0[Kut ; FCFt] . (10)

Por consiguiente,

DVTS0 = E0 + D0 − Vu0 = VA0[WACCt ; FCFt] − VA0[Kut ; FCFt] .

Los cuatro procedimientos descritos proporcionan siempre (un periodo, multiperiodo,flujos perpetuos, cualquier estructura temporal de los flujos, ratio de endeudamientoconstante o variable) el mismo valor de la empresa si se utilizan correctamente. Haydiscrepancias para calcular el APV: existen diversas teorıas sobre la magnitud delDVTS, que analizaremos en este trabajo. La magnitud del DVTS tiene implicacionesen la valoracion y afecta a:

- el valor de las acciones (E) y el de la empresa (E + D),

- la relacion entre la rentabilidad exigida a los activos (Ku) y la rentabilidadexigida a las acciones en la empresa apalancada (Ke);

- la relacion entre el WACC y la rentabilidad exigida a los activos (Ku).

Podemos hablar de un quinto metodo (a partir del free cash flow ajustado al riesgodel negocio), aunque este no es un metodo propiamente nuevo, sino que deriva de losanteriores:

E. A partir del free cash flow ajustado al riesgo del negocio y de Ku(rentabilidad exigida a los activos)

La formula (11) indica que el valor de la deuda (D) mas el de los recursospropios (E) es el valor actual de los free cash flows ajustados al riesgo del negocio(FCF\\Ku) esperados que generara la empresa, descontados a la rentabilidadexigida a los activos (Ku):

E0 + D0 = VA0[Kut ; FCFt\\Ku] . (11)9Las expresiones del valor actual del ahorro de impuestos debido al pago de intereses (DVTS)

para una perpetuidad creciente a la tasa g estan recogidas en la subseccion 4.3.

Page 104: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

96 Pablo Fernandez

Es facil comprobar que la definicion de los free cash flows ajustados al riesgodel negocio10 (FCF\\Ku) es

FCFt\\Ku = FCFt − (Et−1 + Dt−1) [WACCt − Kut] . (12)

Analogamente, podemos hablar de un sexto metodo (a partir del cash flow disponi-ble para las acciones ajustado al riesgo del negocio), aunque este no es un metodopropiamente nuevo, sino que deriva de los anteriores:

F. A partir del cash flow disponible para las acciones ajustado al riesgodel negocio y de Ku (rentabilidad exigida a los activos)

La formula (13) indica que el valor de las acciones (E) es el valor actual netode los cash flows disponibles para las acciones ajustados al riesgo del negocioesperados (CFac\\Ku) descontados a la rentabilidad exigida a los activos (Ku):

E0 = VA0[Kut ; CFact\\Ku] . (13)

Es facil comprobar que la definicion de los cash flows disponibles para las ac-ciones ajustados al riesgo del negocio11 (CFac\\Ku) es

CFact\\Ku = CFact − Et−1 [Ket − Kut] . (14)

Tambien podrıamos hablar de un septimo metodo; a partir del capital cash flowajustado al riesgo del negocio y de Ku (rentabilidad exigida a los activos), peroel capital cash flow ajustado al riesgo del negocio es identico al free cash flowajustado al riesgo del negocio (CCF\\Ku = FCF\\Ku). Por tanto, este metodoserıa identico a (E).

10La expresion (12) resulta de igualar (11) y (1).11La expresion (14) resulta de igualar (13) y (3).En el resto del artıculo se omiten los subındices “t” y “t − 1”.

Page 105: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion de empresas por descuento de flujos 97

• Un ejemplo. La empresa Delta Inc. tiene las previsiones de balance y cuenta deresultados para los proximos anos que se adjuntan en la tabla 1. A partir del ano 3se preve que el balance y la cuenta de resultados creceran al 4% anual.

0 1 2 3 4

NOF (circulante neto) 400 430 515 550 572,00Activo fijo bruto 1.600 1.800 2.300 2.600 2.956,00- amort. acumulada 200 450 720 1.000,80Activo fijo neto 1.600 1.600 1.850 1.880 1.955,20TOTAL ACTIVO 2.000 2.030 2.365 2.430 2.527,20

Deuda (N) 1.000 1.000 1.100 1.100 1.144,00Capital (valor contable) 1.000 1.030 1.265 1.330 1.383,20TOTAL PASIVO 2.000 2.030 2.365 2.430 2.527,20

Cuenta de resultadosMargen 300 500 572 603,20Intereses 120 120 132 132,00BAT 180 380 440 471,20Impuestos 63 133 154 164,92BDT (beneficio neto) 117 247 286 306,28

Tabla 1: Previsiones de balance y cuenta de resultados de Delta Inc.

A partir de las previsiones de balance y cuenta de resultados de la tabla 1 esinmediato obtener los flujos que se adjuntan en la tabla 2. Logicamente, los flujoscrecen al 4% a partir del ano 4.

0 1 2 3 4 5

CF acciones = Dividendos 87,00 12,00 221,00 253,08 263,20

FCF 165,00 -10,00 306,80 294,88 306,68

CFd 120,00 20,00 132,00 88,00 91,52

CCF 207,00 32,00 353,00 341,08 354,72

Tabla 2: Previsiones de flujos de Delta Inc

La beta de los activos (de las acciones de la empresa sin deuda) es 1. La tasa sinriesgo es 10%. El coste de la deuda es 12%. La tasa de impuestos es 35% y la primade riesgo de mercado (risk premium) es 8%. Por consiguiente, utilizando el CAPM, larentabilidad exigida a los activos es de un 18%.12 Con estos parametros, la valoracionde las acciones de esta empresa, utilizando las formulas precedentes, aparece en latabla 3.

12Utilizamos en este ejemplo el CAPM: Ku = RF + βu PM = 10% + 8% = 18%.

Page 106: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

98 Pablo Fernandez

for- 0 1 2 3 4mula Ku 18,00% 18,00% 18,00% 18,00% 18,00%

Ke 21,74% 21,30% 21,01% 20,86% 20,86%

(1) E + D = VA(WACC; FCF) 2.043,41 2.183,23 2.523,21 2.601,29 2.705,34(2) WACC 14,917% 15,114% 15,253% 15,336% 15,336%

(1) −D = E 1.043 1.183 1.423 1.501 1.561

(3) E = VA(Ke;CFac) 1.043 1.183 1.423 1.501 1.561

(4) D = VA(CFd; Kd) 1.000 1.000 1.100 1.100 1.144(6) D + E = VA(WACCBT; CCF) 2.043,41 2.183,23 2.523,21 2.601,29 2.705,34(7) WACCBT 16,972% 17,038% 17,084% 17,112% 17,112%

(6)−D = E 1.043 1.183 1.423 1.501 1.561DVTS = VA(Ku;D T Ku) 442,09 458,66 478,22 495,00 514,80

(10) Vu = VA (Ku;FCF) 1.601 1.725 2.045 2.106 2.191(9) Vu + DVTS 2.043,41 2.183,23 2.523,21 2.601,29 2.705,34

(9) - D = E 1.043 1.183 1.423 1.501 1.561(11) D+E = VA(Ku;FCF\\Ku) 2.043,41 2.183,23 2.523,21 2.601,29 2.705,34(12) FCF\\Ku 228,00 53,00 376,10 364,18

(11) - D = E 1.043 1.183 1.423 1.501 1.561(14) CFac\\Ku 48,00 -27,00 178,10 210,18(13) E = VA(Ku;CFac\\Ku) 1.043 1.183 1.423 1.501 1.561

Tabla 3: Valoracion de Delta Inc.

La rentabilidad exigida a las acciones (Ke) aparece en la segunda lınea de latabla13. La formula (3) permite obtener el valor de las acciones descontando losflujos disponibles para las acciones a la rentabilidad exigida a las acciones (Ke)14.Analogamente, la formula (4) permite obtener el valor de la deuda descontando losflujos para la deuda a la rentabilidad exigida a la deuda (Kd)15. Otro modo de calcularel valor de las acciones es a partir de la formula (1). El valor actual de los free cashflows descontados al WACC (formula (2)) nos proporciona el valor de la empresa, quees el valor de la deuda mas el de las acciones16. Restando a esta cantidad el valor dela deuda se obtiene el valor de las acciones.

Otro modo de calcular el valor de las acciones es a partir de la formula (6). Elvalor actual de los capital cash flows descontados al WACCBT (formula (7)) nosproporciona el valor de la empresa, que es el valor de la deuda mas el de las acciones.Restando a esta cantidad el valor de la deuda se obtiene el valor de las acciones.

El cuarto metodo de calcular el valor de las acciones es a partir del AdjustedPresent Value, la formula (9). El valor de la empresa es la suma del valor de la

13La rentabilidad exigida a las acciones (Ke) se ha calculado segun la teorıa de Modigliani-Miller,que veremos mas tarde.

14La relacion entre el valor de las acciones de dos anos consecutivos es: Et = Et−1 (1+Ket)−CFact.15El valor de la deuda coincide con el nominal (valor contable) de la tabla 1 porque hemos consi-

derado que la rentabilidad exigida a la deuda coincide con su coste (12%).16La relacion entre el valor de la empresa de dos anos consecutivos es:

(D + E)t = (D + E)t−1 (1 + WACCt) − FCFt .

Page 107: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion de empresas por descuento de flujos 99

empresa sin apalancar (formula (10)) mas el valor actual del ahorro de impuestosdebido a la deuda (DVTS)17.

Por ultimo, al final de la tabla 3 se calculan el cash flow disponible para lasacciones y el free cash flow ajustados al riesgo del negocio (CFac\\Ku y FCF\\Ku)segun las formulas (14) y (12). La formula (13) permite obtener el valor de las accionesdescontando los flujos disponibles para las acciones ajustados al riesgo del negocio a larentabilidad exigida a los activos (Ku). Otro modo de calcular el valor de las accioneses a partir de la formula (11). El valor actual de los free cash flows ajustados al riesgodel negocio descontados a la rentabilidad exigida a los activos (Ku) nos proporcionael valor de la empresa, que es el valor de la deuda mas el de las acciones. Restando aesta cantidad el valor de la deuda se obtiene el valor de las acciones.

El ejemplo de la tabla 3 muestra que el resultado obtenido con las seis valoracioneses el mismo. el valor de las acciones hoy es 1.043. Como ya hemos comentado, estasvaloraciones se han realizado segun Modigliani y Miller. Las valoraciones utilizandootras teorıas que se presentan en las siguientes secciones de este artıculo se presentanen la subseccion 5.3.

3 Breve resena de los artıculos mas relevantes sobre

valoracion de empresas por descuento de flujos

Existe una abundante literatura sobre la valoracion de empresas por descuento deflujos. Comentamos aquı los artıculos mas relevantes y hacemos especial hincapieen los que proponen diferentes expresiones para el valor actual de los ahorros deimpuestos por pago de intereses (DVTS).

• Modigliani y Miller (1958), (1961) y (1963) estudiaron el efecto del apalan-camiento en el valor de la empresa. Publicaron sus famosas proposiciones, que siguensiendo punto de referencia en cualquier trabajo sobre finanzas de la empresa en ge-neral y sobre valoracion en particular. Su proposicion 1 (Modigliani y Miller (1958),formula (3)) es que, en ausencia de impuestos, el valor de la empresa es independientedel endeudamiento, esto es,

E0 + D0 = Vu , si T = 0.

Su segunda proposicion (Modigliani y Miller (1958), formula (8)) es que, en ausenciade impuestos, la rentabilidad exigida por los accionistas (Ke) aumenta en proporciondirecta con el endeudamiento (la proporcion D/E) a valor de mercado:

Ke = Ku + (D/E) (Ku − Kd) .

17Como se ha calculado rentabilidad exigida a las acciones (Ke) segun la teorıa de Modigliani-Miller, tambien hemos de calcular el DVTS segun Modigliani-Miller: DVTS = VA(Ku ; D T Ku).

Page 108: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

100 Pablo Fernandez

En presencia de impuestos, su segunda proposicion (Modigliani y Miller (1963),formula (12.c)) es:

Ke = Ku + D (1 − T) (Ku − Kd)/E .

En presencia de impuestos, su primera proposicion, en el caso de una perpetuidad, setransforma en (Modigliani y Miller (1963), formula (3)):

E0 + D0 = Vu + D T .

DT es el aumento de valor debido al apalancamiento (DVTS). Sobre los dividendosafirmaron que —a igualdad de impuestos sobre el cobro de dividendos y plusvalıas—eran irrelevantes: el accionista es indiferente entre cobrar dividendos o vender accionespara obtener una remuneracion prefijada.

Modigliani y Miller (1963) presentan varias formulas de valoracion que utilizaremosen este trabajo:

- Su formula (31.c) es

WACC = Ku[1 − TDE + D

].

- Su formula (11.c) es

WACCBT = Ku − DTKu − KdE + D

.

Tambien afirman en su formula (33.c) que en una inversion que se puede financiar to-talmente con deuda, la rentabilidad exigida a la deuda debe ser igual a la rentabilidadexigida a los activos: si D/(D + E) = 100%, entonces Kd = Ku.

Sin embargo, en la ultima ecuacion de Modigliani y Miller (1963), proponen calcu-lar la estructura de financiacion objetivo de la empresa [D/(D+E)] utilizando valorescontables de D y E, en lugar de valores de mercado.

• Myers (1974) fue el introductor del APV (adjusted present value). Segun Myers,el valor de la empresa apalancada es igual al valor de la empresa sin deuda (Vu) masel valor actual del ahorro de impuestos debido al pago de intereses (DVTS). Myerspropone calcular el DVTS del siguiente modo:

DVTSt = T[

Kd Dt

1 + Kd+

Kd Dt+1

(1 + Kd)2+

KdDt+2

(1 + Kd)3+ · · ·

].

El argumento es que el riesgo de los ahorros de deuda es el mismo que el de la deuda.Y el valor de la empresa es:

APV = E0 + D0 = Vu + DVTSt =N∑

t=1

FCFt

(1 + Ku)t+

N∑t=1

Kd TDt−1

(1 + Kd)t.

Page 109: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion de empresas por descuento de flujos 101

• Arditti y Levy (1977) sugieren calcular el valor de la empresa descontando losCapital Cash Flows (flujo disponible para las acciones mas flujos para la deuda) enlugar del Free Cash Flow. Los Capital Cash Flows (CCF) se deben descontar alWACCBT (WACC antes de impuestos). Es facil demostrar que:

D0 + E0 =∞∑

t=1

FCFt

t∏i=1

(1 + WACCi)

=∞∑

t=1

CCFt

t∏i=1

(1 + WACCBTi)

,

siendo WACCBT su formula (2):

WACCBTt= Ke

Et−1

Et−1 + Dt−1+ Kd

Dt−1

Et−1 + Dt−1.

El artıculo de Arditti y Levy (1977) presenta un problema fundamental: calculanlas ponderaciones de deuda (D/[E + D]) y de recursos propios (E/[E + D]) a valorcontable, en lugar de a valor de mercado. Es por esta razon por la que afirman (pp.28) que el valor de la empresa que se obtiene descontando los FCF es distinto que elque se obtiene descontando los CCF.

• Miller (1977) argumenta que sı que existe una estructura optima de endeuda-miento para el agregado de las empresas, pero no existe para cada empresa. Millerargumenta que debido al efecto clientela, el endeudamiento no anade ningun valor ala empresa. Por consiguiente, segun Miller, E + D = Vu.

Tambien introduce impuestos personales ademas de los impuestos de la empresa.La tasa de impuestos para la empresa es T, la tasa de impuestos personales sobre lasacciones son TPA y la tasa de impuestos personales sobre la deuda es TPD.

Segun Miller, para una perpetuidad, el valor de la empresa sin deuda despues delos impuestos personales es:

Vu = FCF(1 − TPA)

Ku.

Si la empresa tiene deuda de valor nominal N, su valor es:

D = N Kd(1 − TPD)

Kd.

Miller dice que la creacion de valor debida a la deuda, en el caso de una perpetuidad,es:

D[1 − (1 − T) (1 − TPA)

1 − TPD

].

Pero continua diciendo (ver pagina 268) que un intento de una empresa por aumentarde valor endeudandose mas serıa incompatible con el equilibrio del mercado. Elaumento de deuda originarıa cambios en las rentabilidades exigidas a la deuda y a las

Page 110: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

102 Pablo Fernandez

acciones y en los propietarios de las acciones, de manera que el valor de la empresasera independiente del endeudamiento.

Miller continua su artıculo diciendo que si TPA = 0, la oferta agregada de deudadebe ser tal que ofrezca un interes R0/(1−T), siendo R0 la tasa que pagan institucioneslibres de impuestos.

• Miller y Scholes (1978) muestran que, incluso si la tasa del impuesto sobrela renta es mayor que la tasa sobre plusvalıas, muchos inversores no pagaran masque tasa sobre plusvalıas aplicada a los dividendos. Concluyen que los inversoresseran indiferentes entre cobrar dividendos o realizar plusvalıas si la empresa recompraacciones. Segun ellos, el valor de la empresa no dependera de la polıtica de dividendosni siquiera con impuestos personales y con impuestos sobre beneficios.

• DeAngelo y Masulis (1980) extienden el trabajo de Miller. Considerando quela tasa marginal de impuestos es diferente para distintas empresas, predicen que lasempresas utilizaran menos deuda cuantas mas posibilidades tengan de reducir el pagode impuestos por otros medios: amortizacion, desgravacion por inversiones. . .

• Miles y Ezzell (1980) sostienen que el APV y el WACC proporcionan distintovalor: “salvo que el endeudamiento y, en consecuencia, Ke sean exogenos (no dependandel valor de la empresa en cada momento), el WACC tradicional no es apropiado paravalorar empresas”. Segun ellos, la valoracion de una empresa que quiere mantenerun ratio D/E constante se debe realizar de distinto modo que si la empresa tiene unvolumen prefijado de deuda.

En concreto, la formula [20] de su artıculo dice que para una empresa con unobjetivo de endeudamiento [D/(D+E)] fijo, el free cash flow (FCF) se debe descontara la tasa:

WACC = Ku − DE + D

Kd T (1 + Ku)1 + Kd

.

Llegan a esta formula partiendo de su formula (11), que para una perpetuidad cre-ciente es:

Et−1 + Dt−1 =FCFt

Ku − g+

Kd TL (Et−1 + Dt−1)Kd − g

=FCFt

Ku − g+

KdT Dt−1

Kd − g.

L es el endeudamiento. Afirman que la tasa correcta para descontar el ahorro deimpuestos debido a la deuda (Kd TDt−1) es Kd para el ahorro de impuestos delprimer ano, y Ku para el ahorro de impuestos de los anos siguientes.

La expresion de Ke es su formula (22):

Ke = Ku + D(Ku − Kd)1 + Kd (1 − T)

(1 + Kd)E.

Page 111: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion de empresas por descuento de flujos 103

• Miles y Ezzell (1985) muestran en su formula (27) que la relacion entre la betaapalancada y la beta de los activos (suponiendo que la deuda no tiene riesgo y que labeta de la deuda es cero) es

βL = βu +DE

βu[1 − TRF

1 + RF

].

• Chambers, Harris y Pringle (1982) comparan cuatro metodos de valorar em-presas por descuento de flujos: actualizar el flujo disponible para las acciones(CFac)a la tasa Ke (rentabilidad exigida a las acciones); actualizar el Free Cash Flow (FCF)al WACC (coste ponderado de deuda y acciones); actualizar el Capital Cash Flow(CCF) al WACCBT (coste ponderado de deuda y acciones antes de impuestos); y elAPV de Myers (APV). Dicen que los tres primeros metodos proporcionan el mismovalor si el endeudamiento es constante, pero que proporcionan distintos valores si noes constante. Tambien afirman que el APV solo proporciona el mismo resultado quelos otros tres metodos en dos casos: en empresas con solo un periodo, y en el caso deperpetuidades sin crecimiento.

La razon de esta discrepancia es que ellos calculan el ratio de endeudamientoD/[D + E] con valores contables, en lugar de valores de mercado. Su exhibit 3 es unaprueba de ello: no puede ser que el WACC y Ke sean constantes. Si Ke = 11, 2%, comoellos proponen, el WACC correcto es 6,819% el primer ano (en lugar de su 5,81%) yaumenta los anos siguientes; y el WACCBT correcto es 7,738 % el primer ano (en lugarde su 6,94%) y aumenta los anos siguientes. calculando el ratio de endeudamiento(D/[D + E]) con valores de mercado, los tres procedimientos proporcionan el mismovalor.

• Harris y Pringle (1985) proponen en su formula (3) que WACCBT = Ku, y porconsiguiente, su expresion para el WACC es:

WACC = Ku − Kd TD

E + D.

Tambien proponen que el valor actual del ahorro de impuestos debido al pago deintereses (DVTS) se debe calcular descontando el ahorro de impuestos debido a ladeuda (Kd T Dt−1) a la tasa Ku:

DVTSt = T[

Kd Dt

(1 + Ku)+

Kd Dt+1

(1 + Ku)2+

Kd Dt+2

(1 + Ku)3+ · · ·

]

Harris y Pringle proporcionan un ejemplo interesante. Para una perpetuidad con

Ke = 17% , Kd = 11% , T = 46% yD

(D + E)= 30% ,

el resultado de Ku al que se llega por 4 procedimientos distintos es el siguiente:

Page 112: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

104 Pablo Fernandez

a) segun Modigliani y Miller (1963) y Myers (1974): 15,87%b) segun Miller (1977): 13,68%c) segun Miles y Ezzell (1980): 15,26%d) segun Harris y Pringle (1985): 15,20%

Estos resultados de Ku provienen de utilizar las siguientes formulas:

a) segun Modigliani y Miller (1963) y Myers (1974):

Ku =We Ke + Wd Kd (1 − T)

1 − TWd;

b) segun Miller (1977):

Ku = WeKe + WdKd (1 − T) ;

c) segun Miles y Ezzell (1980):

Ku =WeKe + Wd Kd (1 − T) +

TWdKd(1 + Kd)

1 − T WdKd(1 + Kd)

.

d) segun Harris y Pringle (1985):

Ku = WeKe + Wd Kd = WACCBT ,

siendo We = E/(D + E) y Wd = 1 − We.

• Ruback (1995) supone en su formula (2.6) que βL = βu (D + E)/E − βd D/E.Es inmediato comprobar que con esta suposicion: WACCBT = Ku. Llega a unasformulas equivalentes a las de Harris y Pringle (1985).

• Lewellen y Emery (1986) muestran que en el caso de una perpetuidad sin cre-cimiento, el valor de la empresa apalancada de acuerdo a las formulas de Miles yEzzell (1980) es el siguiente (ver su formula (7)):

E0 + D0 = Vu +KdT D + KdTD/Ku

1 + Kd.

Tambien muestran que en el caso de una perpetuidad sin crecimiento, el valor de laempresa apalancada de acuerdo a las formulas de Modigliani y Miller (1963) y Myers(1974) coinciden y es el siguiente (ver su formula (5)):

E + D = Vu + TD .

Mas adelante, muestran que para una perpetuidad creciente a una tasa g, el valor dela empresa apalancada es:

Page 113: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion de empresas por descuento de flujos 105

a) segun Modigliani y Miller (1963):

E0 + D0 = Vu +DTKuKu − g

;

b) segun el APV de Myers (1974):

E0 + D0 = Vu +DTKdKd − g

;

c) segun Miles y Ezzell (1980):

E0 + D0 = Vu +D T Kd (1 + Ku)

(Ku − g) (1 + Kd).

• Taggart (1991) proporciona un buen resumen de formulas de valoracion sin im-puestos personales y con impuestos personales. Propone que las formulas de Miles yEzzell (1980) deben de utilizarse cuando la empresa se ajusta a su objetivo de endeu-damiento una vez al ano y las de Harris y Pringle (1985) cuando la empresa se ajustacontinuamente a su objetivo de endeudamiento.

• Damodaran (1994) argumenta18 que si todo el riesgo del negocio es soportadopor las acciones, entonces la formula que relaciona la beta apalancada (βL) con labeta de los activos(βu) es: βL = βu + (D/E)βu (1 − T). Notese que esta expresionprocede de la relacion entre la beta apalancada, la beta de los activos y la beta de ladeuda de Modigliani-Miller19, suponiendo que la beta de la deuda es cero.

Otro modo de calcular la beta apalancada en funcion de la beta de los activoses el siguiente: βL = βu + (D/E). Denominaremos a esta formula la formula delos practicos, porque se utiliza con mucha frecuencia por consultores y bancos deinversiones20. Es obvio que segun esta formula, a igualdad de βu, se obtiene unasuperior que segun Modigliani-Miller y que segun Damodaran (1994).

18pp. 31. Esta expresion de la beta apalancada aparece en muchos libros y es frecuentementeutilizada por consultores y bancos de inversiones.

19La relacion entre la beta apalancada, la beta de los activos y la beta de la deuda de Modigliani-Miller es: βL = βu + (D/E)(βu − βd)(1 − T).

20Dos de los muchos sitios donde aparece son: Ruback (1995), pp. 5; y Ruback (1989), pp. 2.

Page 114: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

106 Pablo Fernandez

4 Formulas principales de los artıculos mas relevan-tes

En este apartado incluimos las formulas relevantes para la valoracion que se derivande los artıculos mencionados en el apartado anterior. Algunas formulas aparecenexplıcitamente en los artıculos. Otras se derivan a partir de las que aparecen en losartıculos.

4.1 Relacion de la rentabilidad exigida a las acciones (Ke) conla rentabilidad exigida a los activos (Ku)

Las distintas expresiones de Ke (a partir de Ku21) segun los principales artıculos yacomentados son22:

a) segun Modigliani y Miller (1963):

Ke = Ku + D(1 − T)Ku − Kd

E.

b) Segun Myers (1974)23:

Ke = Ku + (D − DVTS)Ku − Kd

E.

Para el caso de una perpetuidad creciente a una tasa g, DVTS = DTKd/(Kd−g) y Ke es:

Ke = Ku + D [Kd (1 − T) − g]Ku − Kd

E (Kd − g).

c) Segun Miller (1977):

Ke = Ku +DE

[Ku − Kd (1 − T)] .

d) Segun Miles y Ezzell (1980):

Ke = Ku + D (Ku − Kd)1 + Kd (1 − T)

(1 + Kd)E.

21La rentabilidad exigida a los activos (Ku) es igual a la rentabilidad exigida a las acciones en laempresa sin deuda.

22Estas son las expresiones que proporcionan una valoracion consistente: igual valor utilizando elWACC, el APV y el descuento del flujo disponible para las acciones.

23Recuerde el lector que segun Myers:

DVTSt = T

[Kd Dt

(1 + Kd)+

Kd Dt+1

(1 + Kd)2+

Kd Dt+2

(1 + Kd)3+ · · ·

].

Page 115: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion de empresas por descuento de flujos 107

e) segun Harris y Pringle (1985) y Ruback (1995):

Ke = Ku +DE

(Ku − Kd) .

f) segun Damodaran (1994):

Ke = Ku +DE

(1 − T) (Ku − RF) .

g) segun el metodo de los practicos:

Ke = Ku +DE

(Ku − RF) .

4.2 Distintas expresiones del WACC y del WACCBT

Las expresiones del WACC (coste ponderado de los recursos) correspondientes con losvalores de Ke del apartado anterior son:

a) segun Modigliani y Miller (1963):

WACC = Ku[1 − TD

E + D

].

b) Segun Myers (1974):

WACC = Ku − DVTS (Ku − Kd) + D KdTE + D

.

Para el caso de una perpetuidad creciente a una tasa g,

DVTS =DTKdKd − g

y

WACC = Ku − 1E + D

(D KdT

Ku − g

Kd − g

).

c) Segun Miller (1977): WACC = Ku.

d) Segun Miles y Ezzell (1980):

WACC = Ku − 1E + D

(Kd T

1 + Ku1 + Kd

).

e) Segun Harris y Pringle (1985) y Ruback (1995):

WACC = Ku − D KdTE + D

.

Page 116: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

108 Pablo Fernandez

f) Segun Damodaran (1994):

WACC = Ku − DTKu − (1 − T) (Kd − RF)

E + D.

g) Segun el metodo de los practicos:

WACC = Ku − DRF − Kd (1 − T)

E + D.

Las expresiones del WACCBT (coste ponderado de los recursos, antes de impuestos)correspondientes con los valores de Ke del apartado anterior son:

a) segun Modigliani y Miller (1963):

WACCBT = Ku − D T (Ku − Kd)E + D

.

b) Segun Myers (1974):

WACCBT = Ku − DVTS (Ku − Kd)E + D

.

Para el caso de una perpetuidad creciente a una tasa g,

DVTS =DT KdKd − g

y

WACCBT = Ku − D T Kd (Ku − Kd)(E + D) (Kd − g)

.

c) Segun Miller (1977):

WACCBT = Ku +D T KdE + D

.

d) Segun Miles y Ezzell (1980):

WACCBT = Ku − D T Kd (Ku − Kd)(E + D) (1 + Kd)

.

e) Segun Harris y Pringle (1985) y Ruback (1995):

WACCBT = Ku .

f) Segun Damodaran (1994):

WACCBT = Ku − D(Kd − RF) − T(Ku − RF)

E + D.

g) Segun el metodo de los practicos:

WACCBT = Ku + DKd − RF

E + D.

Page 117: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion de empresas por descuento de flujos 109

4.3 Distintas expresiones del valor actual del ahorro de im-puestos debido al pago de intereses (DVTS)

Las expresiones del valor creado por el endeudamiento, esto es, del valor actual delahorro de impuestos debido al pago de intereses (DVTS) para una perpetuidad cre-ciente a la tasa g son:

a) segun Modigliani y Miller (1963):

DVTS =DKuTKu − g

.

b) Segun Myers (1974):

DVTS =DKdTKd − g

.

c) Segun Miller (1977):DVTS = 0 .

d) Segun Miles y Ezzell (1980):

DVTS = D KdT1 + Ku

(1 + Kd) (Ku − g).

e) Segun Harris y Pringle (1985) y Ruback (1995):

DVTS =DKdTKu − g

.

f) Segun Damodaran (1994):

DVTS =D Ku T − D (Kd − RF) (1 − T)

Ku − g.

g) Segun el metodo de los practicos:

DVTS =D KuT − D (Kd − RF)

Ku − g.

Page 118: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

110 Pablo Fernandez

4.4 Distintas expresiones de la beta apalancada

Las distintas expresiones de la beta apalancada (βL) en funcion de la beta de losactivos o beta de las acciones en la empresa sin apalancar (βu), segun los distintosartıculos, son:

a) segun Modigliani y Miller (1963)24:

βL = βu +DE

(1 − T) (βu − βd) .

b) Segun Myers (1974):

βL = βu +D − DVTS

E(βu − βd) .

Para el caso de una perpetuidad creciente a una tasa g:

βL = βu + D [Kd (1 − T) − g]βu − βd

E (Kd − g).

c) Segun Miller (1977):

βL = βuD + E

E− D

E

[βd (1 − T) − T

RF

PM

].

d) Segun Miles y Ezzell (1980):

βL = βu +DE

(βu − βd)[1 − T

Kd1 + Kd

].

e) Segun Harris y Pringle (1985) y Ruback (1995):

βL = βu +DE

(βu − βd) .

f) Segun Damodaran (1994):

βL = βu +DE

(1 − T)βu .

g) Segun el metodo de los practicos:

βL = βu +DE

βu .

24Esta formula coincide con la (2A.6) de Taggart (1991), porque el asume que βd = 0

Page 119: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion de empresas por descuento de flujos 111

4.5 Distintas expresiones del flujo disponible para las accionesajustado al riesgo de los activos

Las distintas expresiones de CFac\\Ku (flujo disponible para las acciones ajustado alriesgo de los activos)25 segun los distintos artıculos son:

a) segun Modigliani y Miller (1963):

CFac − D(Ku − Kd) (1 − T) .

b) Segun Myers (1974):

CFac − (Vu − E) (Ku − Kd) .

c) Segun Miller (1977):

CFac − D [Ku − Kd (1 − T)] .

d) Segun Miles y Ezzell (1980):

CFac − D(Ku − Kd)1 + Kd (1 − T)

1 + Kd.

e) Segun Harris y Pringle (1985) y Ruback (1995):

CFac − D(Ku − Kd) .

f) Segun Damodaran (1994):

CFac − D(Ku − RF) (1 − T) .

g) Segun el metodo de los practicos:

CFac − D (Ku − RF) .

25Sobre el significado del flujo disponible para las acciones ajustado al riesgo de los activos, y delde free cash flow ajustado al riesgo de los activos ver Fernandez (1999) pp. 357.

Page 120: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

112 Pablo Fernandez

5 Diferencias en la valoracion segun los artıculosmas relevantes

5.1 Perpetuidad creciente con endeudamiento prefijado del30%

Aplicando las formulas anteriores a una empresa con FCF1 = 100, Ku = 10%, Kd =7%, D/(D + E) = 30%, T = 35%, RF = 5%, y g = 5%; se obtienen los valores dela tabla 4. El valor de la empresa sin apalancar (Vu) es en todos los casos 2.000.Notese como, segun Myers, Ke < Ku = 10%, lo que no tiene sentido. Segun Myers,DVTS > D cuando g > Kd (1−T), en el ejemplo, cuando g > 4, 55%. Como veremosmas adelante, si g > 4, 55%, Ke < Ku, lo que no tiene sentido.

Modigliani-Miller

Myers Miller Miles-Ezzell

Harris-Pringle

Damo-daran

Practicos

WACC 8,950% 8,163% 10,000% 9,244% 9,265% 9,340% 9,865%Ke 10,836% 9,711% 12,336% 11,256% 11,286% 11,393% 12,143%WACCBT 9,685% 8,898% 10,735% 9,979% 10,000% 10,075% 10,600%E+D 2.531,65 3.162,1 2.000,0 2.356,0 2.344,7 2.304,1 2.055,5Vu 2.000,00 2.000,00 2.000,00 2.000,00 2.000,00 2.000,00 2.000,00E 1.772,15 2.213,4 1.400,0 1.649,2 1.641,3 1.612,9 1.438,8D 759,49 948,62 600,00 706,81 703,40 691,24 616,65DVTS 531,65 1.162,06 0,00 356,05 344,67 304,15 55,50CFac 103,42 104,27 102,70 103,18 103,17 103,11 102,77

Tabla 4: Ejemplo de valoracion de una empresa. FCF1 = 100, Ku = 10%, Kd = 7%,

D/(D + E) = 30%, T = 35%, RF = 5%, y g = 5%.

Si introducimos cambios en el crecimiento, las tablas 5 a 11 muestran los parame-tros fundamentales de la valoracion en funcion del crecimiento g. La tabla 5 muestraque el valor de la empresa segun Modigliani-Miller y segun Myers son iguales para unaperpetuidad (cuando no hay crecimiento). Con crecimiento, el valor de la empresasegun Myers es superior al valor de la empresa segun Modigliani-Miller. Todas lasdemas teorıas proporcionan valores inferiores a Modigliani-Miller. Segun Myers elvalor de la empresa es infinito para crecimientos iguales o superiores a g = Kd[D(1−T) + E]/(E + D); en el ejemplo cuando g ≥ 6, 265%.

g Modigliani-Miller

Myers Miller Miles-Ezzell

Harris-Pringle

Damodaran Practicos

0% 1.117,3 1.117,3 1.000,0 1.081,7 1.079,3 1.070,7 1.013,7

1% 1.257,9 1.266,2 1.111,1 1.212,9 1.209,9 1.199,0 1.128,0

3% 1.680,7 1.750,2 1.428,6 1.601,4 1.596,2 1.577,3 1.456,7

4% 2.020,2 2.207,5 1.666,7 1.906,8 1.899,3 1.872,7 1.705,0

6% 3.389,8 9.434,0 2.500,0 3.082,2 3.062,8 2.994,0 2.587,3

7% 5.128,2 ∞ 3.333,3 4.455,5 4.415,0 4.273,5 3.490,4

Tabla 5: Valor de la empresa (E + D) en funcion del crecimiento g (D/(D + E) = 30%).

Page 121: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion de empresas por descuento de flujos 113

La tabla 6 muestra que el WACC de la empresa segun todas las teorıas es indepen-diente del crecimiento, salvo segun Myers. Segun Myers, el WACC desciende cuandoaumenta el crecimiento y es igual al crecimiento cuando g = Kd [D(1−T)+E]/(E+D);en el ejemplo, cuando g = 6, 265%.

g Modigliani-Miller

Myers Miller Miles-Ezzell

Harris-Pringle

Damodaran Practicos

0% 8,95% 8,95% 10,00% 9,24% 9,27% 9,34% 9,87%

2% 8,95% 8,82% 10,00% 9,24% 9,27% 9,34% 9,87%

4% 8,95% 8,53% 10,00% 9,24% 9,27% 9,34% 9,87%

6% 8,95% 7,06% 10,00% 9,24% 9,27% 9,34% 9,87%

Tabla 6: WACC en funcion del crecimiento g (D/(D + E) = 30%).

La tabla 7 muestra que el WACCBT de la empresa segun todas las teorıas es inde-pendiente del crecimiento, salvo segun Myers. Segun Myers, el WACCBT desciendecuando aumenta el crecimiento.

g Modigliani-Miller

Myers Miller Miles-Ezzell

Harris-Pringle

Damodaran Practicos

0% 9,69% 9,69% 10,74% 9,98% 10,00% 10,08% 10,60%

2% 9,69% 9,56% 10,74% 9,98% 10,00% 10,08% 10,60%

4% 9,69% 9,27% 10,74% 9,98% 10,00% 10,08% 10,60%

6% 9,69% 7,80% 10,74% 9,98% 10,00% 10,08% 10,60%

Tabla 7: WACCBT en funcion del crecimiento g (D/(D + E) = 30%).

La tabla 8 muestra que el DVTS segun Modigliani-Miller y segun Myers son igualespara una perpetuidad (cuando no hay crecimiento). Con crecimiento, el valor delDVTS segun Myers es superior al DVTS segun Modigliani-Miller. Todas las demasteorıas proporcionan valores inferiores a Modigliani-Miller.

g Modigliani-Miller

Myers Miller Miles-Ezzell

Harris-Pringle

Damodaran Practicos

0% 117,3 117,3 0,0 81,7 79,3 70,7 13,7

2% 188,8 215,4 0,0 130,4 126,5 112,4 21,5

4% 353,5 540,8 0,0 240,1 232,7 206,0 38,4

5% 531,6 1.162,1 0,0 356,0 344,7 304,1 55,5

6% 889,8 6.934,0 0,0 582,2 562,8 494,0 87,3

7% 1.794,9 ∞ 0,0 1.122,2 1.081,7 940,2 157,1

Tabla 8: DVTS en funcion del crecimiento g (D/(D + E) = 30%).

La tabla 9 muestra el cash flow disponible para las acciones en el ano uno segunlas distintas teorıas. La formula (5) para una perpetuidad se convierte en:

CFac1 = FCF1 + D0 [g − Kd (1 − T)] .

Como FCF = 100, el CFac es mayor cuanto mayor es el valor de la empresa, porquela deuda se ha fijado en el 30% del valor de la empresa.

Page 122: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

114 Pablo Fernandez

g Modigliani-Miller

Myers Miller Miles-Ezzell

Harris-Pringle

Damodaran Practicos

0% 84,7 84,7 86,4 85,2 85,3 85,4 86,2

1% 86,6 86,5 88,2 87,1 87,1 87,2 88,0

2% 89,0 88,8 90,4 89,4 89,5 89,6 90,3

3% 92,2 91,9 93,4 92,6 92,6 92,7 93,2

4% 96,7 96,4 97,3 96,9 96,9 96,9 97,2

5% 103,4 104,3 102,7 103,2 103,2 103,1 102,8

6% 114,7 141,0 110,9 113,4 113,3 113,0 111,3

Tabla 9: Cash flow disponible para las acciones en el periodo 1 (CFac1) en funcion del

crecimiento g (D/(D + E) = 30%).

La tabla 10 muestra que la rentabilidad exigida a las acciones segun todas lasteorıas es independiente del crecimiento, salvo segun Myers. Segun Myers, Ke des-ciende cuando aumenta el crecimiento y es igual a Ku cuando g = Kd (1 − T), en elejemplo para g = 4, 55%. Esto, logicamente, no tiene ningun sentido.

g Modigliani-Miller

Myers Miller Miles-Ezzell

Harris-Pringle

Damodaran Practicos

0% 10,8% 10,8% 12,3% 11,3% 11,3% 11,4% 12,1%

2% 10,8% 10,7% 12,3% 11,3% 11,3% 11,4% 12,1%

4% 10,8% 10,2% 12,3% 11,3% 11,3% 11,4% 12,1%

5% 10,8% 9,7% 12,3% 11,3% 11,3% 11,4% 12,1%

6% 10,8% 8,1% 12,3% 11,3% 11,3% 11,4% 12,1%

7% 10,8% 12,3% 11,3% 11,3% 11,4% 12,1%

Tabla 10: Ke en funcion del crecimiento g (D/(D + E) = 30%).

g Modigliani-Miller

Myers Miller Miles-Ezzell

Harris-Pringle

Damodaran Practicos

0% 782,1 782,1 700,0 757,2 755,5 749,5 709,6

2% 1.007,2 1.025,8 875,0 966,3 963,5 953,7 890,0

4% 1.414,1 1.545,3 1.166,7 1.334,8 1.329,5 1.310,9 1.193,5

6% 2.372,9 6.603,8 1.750,0 2.157,6 2.144,0 2.095,8 1.811,1

7% 3.589,7 ∞ 2.333,3 3.118,9 3.090,5 2.991,5 2.443,3

8% 7.368,4 ∞ 3.500,0 5.625,2 5.533,6 5.223,9 3.753,4

Tabla 11: Valor de las acciones (Eo) en funcion del crecimiento g (D/(D + E) = 30%).

Si cambia el endeudamiento, las tablas 12 a 16 muestran los parametros fundamen-tales de la valoracion en funcion del endeudamiento. La tabla 12 muestra el DVTSen funcion del endeudamiento segun las diferentes teorıas. El valor del DVTS segunMyers es superior al DVTS segun Modigliani-Miller. Todas las demas teorıas pro-porcionan valores inferiores a Modigliani-Miller. Se puede comprobar que el DVTSsegun Myers se hace infinito para un endeudamiento D/(D + E) = (Kd − g)/(T Kd),en nuestro ejemplo 81,63%.

Page 123: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion de empresas por descuento de flujos 115

g Modigliani-Miller

Myers Miller Miles-Ezzell

Harris-Pringle

Damodaran Practicos

0% 0,0 0,0 0,0 0,0 0,0 0,0 0,0

10% 150,5 279,2 0,0 106,1 103,0 92,1 18,2

20% 325,6 649,0 0,0 224,1 217,3 193,0 36,7

30% 531,6 1.162,1 0,0 356,0 344,7 304,1 55,5

40% 777,8 1.921,6 0,0 504,7 487,6 427,2 74,7

50% 1.076,9 3.161,3 0,0 673,3 649,0 564,1 94,2

60% 1.448,3 5.547,2 0,0 866,3 832,9 717,4 114,2

70% 1.921,6 12.035,1 0,0 1.089,4 1.044,1 890,2 134,5

80% 2.545,5 98.000,0 0,0 1.350,0 1.289,5 1.086,4 155,2

90% 3.405,4 ∞ 0,0 1.658,7 1.577,8 1.311,3 176,3

100% 4.666,7 ∞ 0,0 2.030,1 1.921,6 1.571,4 197,8

Tabla 12: Valor actual del ahorro de impuestos por pago de intereses (DVTS) en funcion

del crecimiento g (D/(D + E) = 30%).

La tabla 13 muestra que el WACC de la empresa segun todas las teorıas desciendecon el endeudamiento, salvo segun Miller. Solo segun Myers el WACC llega a serinferior al crecimiento (5%) (para endeudamientos superiores a D/(D + E) > (Kd −g)/(T Kd), en nuestro ejemplo 81,63%).

g Modigliani-Miller

Myers Miller Miles-Ezzell

Harris-Pringle

Damodaran Practicos

0% 10,00% 10,00% 10,00% 10,00% 10,00% 10,00% 10,00%

20% 9,30% 8,78% 10,00% 9,50% 9,51% 9,56% 9,91%

40% 8,60% 7,55% 10,00% 8,99% 9,02% 9,12% 9,82%

60% 7,90% 6,33% 10,00% 8,49% 8,53% 8,68% 9,73%

80% 7,20% 5,10% 10,00% 7,99% 8,04% 8,24% 9,64%

90% 6,85% 4,49% 10,00% 7,73% 7,80% 8,02% 9,60%

100% 6,50% 3,88% 10,00% 7,48% 7,55% 7,80% 9,55%

Tabla 13: Coste ponderado de los recursos (WACC) en funcion del endeudamiento (g=5%).

La tabla 14 muestra que el WACCBT de la empresa en funcion del endeudamiento:desciende con el segun Modigliani-Miller, Myers y Miles-Ezzell; es constante (igual aKu) segun Harris-Pringle y asciende segun Miller, Damodaran y los practicos.

DD+E Modigliani-

MillerMyers Miller Miles-

EzzellHarris-Pringle

Damodaran Practicos

0% 10,00% 10,00% 10,00% 10,00% 10,00% 10,00% 10,00%

20% 9,79% 9,27% 10,49% 9,99% 10,00% 10,05% 10,40%

40% 9,58% 8,53% 10,98% 9,97% 10,00% 10,10% 10,80%

60% 9,37% 7,80% 11,47% 9,96% 10,00% 10,15% 11,20%

80% 9,16% 7,06% 11,96% 9,95% 10,00% 10,20% 11,60%

90% 9,06% 6,69% 12,21% 9,94% 10,00% 10,23% 11,80%

Tabla 14: Coste ponderado de los recursos antes de impuestos (WACCBT) en funcion

del endeudamiento (g=5%).

Page 124: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

116 Pablo Fernandez

DD+E Modigliani-

MillerMyers Miller Miles-

EzzellHarris-Pringle

Damodaran Practicos

0% 10,00% 10,00% 10,00% 10,00% 10,00% 10,00% 10,00%

20% 10,49% 9,83% 11,36% 10,73% 10,75% 10,81% 11,25%

40% 11,30% 9,55% 13,63% 11,95% 12,00% 12,17% 13,33%

60% 12,93% 8,99% 18,18% 14,40% 14,50% 14,88% 17,50%

80% 17,80% 7,30% 31,80% 21,73% 22,00% 23,00% 30,00%

90% 27,55% 3,93% 59,05% 36,38% 37,00% 39,25% 55,00%

95% 47,05% 113,55% 65,69% 67,00% 71,75% 105,00%

Tabla 15: Rentabilidad exigida a las acciones (Ke) segun el endeudamiento (g=5%).

DD+E Modigliani-

MillerMyers Miller Miles-

EzzellHarris-Pringle

Damo-daran

Practicos

0% 2.000,00 2.000,00 2.000,00 2.000,00 2.000,00 2.000,00 2.000,0020% 2.325,58 2.649,01 2.000,00 2.224,07 2.217,29 2.192,98 2.036,6640% 2.777,78 3.921,57 2.000,00 2.504,68 2.487,56 2.427,18 2.074,6960% 3.448,28 7.547,17 2.000,00 2.866,33 2.832,86 2.717,39 2.114,1670% 3.921,57 14.035,09 2.000,00 3.089,36 3.044,14 2.890,17 2.134,4780% 4.545,45 100.000,0 2.000,00 3.350,03 3.289,47 3.086,42 2.155,1790% 5.405,41 −19.512,2 2.000,00 3.658,75 3.577,82 3.311,26 2.176,28100% 6.666,67 −8.888,89 2.000,00 4.030,13 3.921,57 3.571,43 2.197,80

Tabla 16: Valor de la deuda y las acciones (Eo+Do) segun el endeudamiento (g=5%).

5.2 Perpetuidad creciente con deuda prefijada

La tabla 17 es identica a la tabla 4, con la unica diferencia de que se fija el nivel dedeuda inicial en 759,49 (en lugar del ratio de endeudamiento en 30%). Aplicando lasformulas anteriores se obtienen los valores de la tabla 17. El valor de la empresa sinapalancar (Vu) es en todos los casos 2.000. Notese como, segun Myers, Ke < Ku =10%, lo que no tiene mucho sentido.

Modigliani-Miller

Myers Miller Miles-Ezzell

Harris-Pringle

Damo-daran

Practicos

WACC 8,950% 8,413% 10,000% 9,197% 9,216% 9,284% 9,835%Ke 10,836% 9,764% 13,337% 11,372% 11,413% 11,568% 12,901%WACCBT 9,685% 9,048% 10,930% 9,978% 10,000% 10,081% 10,734%E + D 2.531,65 2.930,38 2.000,00 2.382,59 2.372,15 2.334,18 2.068,35Vu 2.000,00 2.000,00 2.000,00 2.000,00 2.000,00 2.000,00 2.000,00E 1.772,15 2.170,89 1.240,51 1.623,09 1.612,66 1.574,68 1.308,86D 759,49 759,49 759,49 759,49 759,49 759,49 759,49DVTS 531,65 930,38 0,00 382,59 372,15 334,18 68,35CFac 103,42 103,42 103,42 103,42 103,42 103,42 103,42D/(D+E) 30,00% 25,92% 37,97% 31,88% 32,02% 32,54% 36,72%

Tabla 17: Ejemplo de valoracion de una empresa. FCF1 = 100, Ku = 10%, Kd = 7%,

D = 759, 49, T = 35%, RF = 5%, y g = 5%.

Page 125: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion de empresas por descuento de flujos 117

Las tablas 18 a 24 muestran los parametros fundamentales de la valoracion enfuncion del crecimiento g. La tabla 18 muestra que el valor de la empresa segunModigliani-Miller y Myers son iguales para una perpetuidad (cuando no hay cre-cimiento). El valor de la empresa segun Myers es superior al valor de la empresasegun Modigliani-Miller. Todas las demas teorıas proporcionan valores inferiores aModigliani-Miller. Segun Myers el valor de la empresa es infinito para crecimientosiguales o superiores a Kd [D (1 − T) + E]/(E + D) (en el ejemplo, para g ≥ 6, 265%).

g Modigliani-Miller

Myers Miller Miles-Ezzell

Harris-Pringle

Damo-daran

Practicos

0% 1.265,8 1.265,8 1.000,0 1.191,3 1.186,1 1.167,1 1.034,2

2% 1.582,3 1.622,2 1.250,0 1.489,1 1.482,6 1.458,9 1.292,7

4% 2.109,7 2.286,9 1.666,7 1.985,5 1.976,8 1.945,1 1.723,6

6% 3.164,6 4.360,8 2.500,0 2.978,2 2.965,2 2.917,7 2.585,4

7% 4.219,4 ∞ 3.333,3 3.971,0 3.953,6 3.890,3 3.447,3

9% 12.658,2 ∞ 10.000,0 11.912,9 11.860,8 11.670,9 10.341,8

Tabla 18: Valor de la empresa (E + D) en funcion del crecimiento g (D = 759, 49).

La tabla 19 muestra que el WACC de la empresa segun todas las teorıas aumentacon el crecimiento, salvo segun Miller. Segun Myers, el WACC es igual al crecimientocuando g = Kd [D (1 − T) + E]/(E + D); en el ejemplo cuando g = 7%.

g Modigliani-Miller

Myers Miller Miles-Ezzell

Harris-Pringle

Damo-daran

Practicos

0% 7,90% 7,90% 10,00% 8,39% 8,43% 8,57% 9,67%

2% 8,32% 8,16% 10,00% 8,72% 8,74% 8,85% 9,74%

4% 8,74% 8,37% 10,00% 9,04% 9,06% 9,14% 9,80%

6% 9,16% 8,29% 10,00% 9,36% 9,37% 9,43% 9,87%

7% 9,37% 10,00% 9,52% 9,53% 9,57% 9,90%

8% 9,58% 10,00% 9,68% 9,69% 9,71% 9,93%

9% 9,79% 10,00% 9,84% 9,84% 9,86% 9,97%

Tabla 19: WACC en funcion del crecimiento g (D = 759, 49).

La tabla 20 muestra que el WACCBT aumenta con g segun Modigliani-Miller yMiles-Ezzell y desciende para el resto (salvo en Harris-Pringle, en que es constante).

g Modigliani-Miller

Myers Miller Miles-Ezzell

Harris-Pringle

Damo-daran

Practicos

0% 9,37% 9,37% 11,86% 9,96% 10,00% 10,16% 11,47%

2% 9,50% 9,31% 11,49% 9,96% 10,00% 10,13% 11,18%

4% 9,62% 9,19% 11,12% 9,97% 10,00% 10,10% 10,88%

6% 9,75% 8,72% 10,74% 9,98% 10,00% 10,07% 10,59%

7% 9,81% 10,56% 9,99% 10,00% 10,05% 10,44%

8% 9,87% 10,37% 9,99% 10,00% 10,03% 10,29%

9% 9,94% 10,19% 10,00% 10,00% 10,02% 10,15%

Tabla 20: WACCBT en funcion del crecimiento g (D = 759, 49).

Page 126: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

118 Pablo Fernandez

La tabla 21 muestra que el DVTS segun Modigliani-Miller y segun Myers soniguales para una perpetuidad (cuando no hay crecimiento). Con crecimiento, el valordel DVTS segun Myers es superior al DVTS segun Modigliani-Miller. Todas las demasteorıas proporcionan valores inferiores a Modigliani-Miller.

g Modigliani-Miller

Myers Miller Miles-Ezzell

Harris-Pringle

Damo-daran

Practicos

0% 265,8 265,8 0,0 191,3 186,1 167,1 34,2

2% 332,3 372,2 0,0 239,1 232,6 208,9 42,7

4% 443,0 620,3 0,0 318,8 310,1 278,5 57,0

6% 664,6 1.860,8 0,0 478,2 465,2 417,7 85,4

7% 886,1 ∞ 0,0 637,6 620,3 557,0 113,9

9% 2.658,2 ∞ 0,0 1.912,9 1.860,8 1.670,9 341,8

Tabla 21: DVTS en funcion del crecimiento g (D = 759, 49).

La tabla 22 muestra que la rentabilidad exigida a las acciones segun todas lasteorıas disminuye con el crecimiento. Segun Myers, Ke es igual a Ku (10%) cuandog = Kd (1 − T) (en el ejemplo, 4, 55%). Esto, logicamente, no tiene ningun sentido.

g Modigliani-Miller

Myers Miller Miles-Ezzell

Harris-Pringle

Damo-daran

Practicos

0% 12,9% 12,9% 27,2% 15,2% 15,3% 16,1% 23,8%

2% 11,8% 11,3% 18,4% 13,1% 13,2% 13,5% 17,1%

4% 11,1% 10,3% 14,6% 11,8% 11,9% 12,1% 13,9%

5% 10,8% 9,8% 13,3% 11,4% 11,4% 11,6% 12,9%

6% 10,6% 9,1% 12,4% 11,0% 11,0% 11,1% 12,1%

7% 10,4% 11,6% 10,7% 10,7% 10,8% 11,4%

9% 10,1% 10,4% 10,2% 10,2% 10,2% 10,4%

10% 10,0% 10,0% 10,0% 10,0% 10,0% 10,0%

Tabla 22: Ke en funcion del crecimiento g (D = 759, 49).

5.3 Diferencias en la valoracion para la empresa de la tabla 1

La tabla 3 contenıa la valoracion de la empresa de la tabla 1 segun Modigliani-Miller.Aquı recogeremos la valoracion de Delta Inc. segun Myers (1974), Harris-Pringle(1985), Ruback (1995), Damodaran (1994) y el metodo de los practicos.

0 1 2 3 4DVTS = VA(Kd;D KdT) 514,92 534,71 556,88 577,50 600,60Ke 20,61% 20,22% 20,17% 19,98% 19,98%E 1.116,25 1.259,28 1.501,86 1.583,79 1.647,14

WACC 14,555% 14,721% 14,940% 14,987% 14,987%E + D 2.116,25 2.259,28 2.601,86 2.683,79 2.791,14

WACCBT 16,540% 16,580% 16,716% 16,709% 16,709%CFac\\Ku 57,90 -15,92 188,41 221,73

FCF\\Ku 237,90 64,08 386,41 375,73

Tabla 23: Valoracion de Delta Inc. segun Myers (1974).

Page 127: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion de empresas por descuento de flujos 119

0 1 2 3 4DVTS 294,72 305,77 318,81 330,00 343,20Ke 24,70% 23,82% 23,22% 22,94% 22,94%E 896,05 1.030,34 1.263,80 1.336,29 1.389,74

WACC 15,785% 15,931% 16,046% 16,104% 16,104%E + D 1.896,05 2.030,34 2.363,80 2.436,29 2.533,74

WACCBT 18,000% 18,000% 18,000% 18,000% 18,000%CFac\\Ku 27,00 -48,00 155,00 187,08

FCF\\Ku 207,00 32,00 353,00 341,08

Tabla 24: Valoracion de Delta Inc. segun Harris y Pringle (1985), y Ruback (1995).

0 1 2 3 4DVTS 350,86 364,02 379,54 392,86 408,57Ke 23,46% 22,78% 22,32% 22,09% 22,09%E 952,19 1.088,58 1.324,53 1.399,14 1.455,11

WACC 15,439% 15,606% 15,732% 15,799% 15,799%D + E 1.952,19 2.088,58 2.424,53 2.499,14 2.599,11

WACC’BT 17,590% 17,617% 17,637% 17,648% 17,648%CFac\\Ku 35,00 -40,00 163,80 195,88

FCF\\Ku 215,00 40,00 361,80 349,88

Tabla 25: Valoracion de Delta Inc. segun Damodaran (1994).

0 1 2 3 4DVTS 154,38 160,17 167,00 172,86 179,77Ke 28,59% 27,04% 25,91% 25,46% 25,46%E 755,71 884,73 1.111,99 1.179,14 1.226,31

WACC 16,747% 16,833% 16,906% 16,938% 16,938%D + E 1.755,71 1.884,73 2.211,99 2.279,14 2.370,31

WACCBT 19,139% 19,061% 18,995% 18,965% 18,965%CFac\\Ku 7,00 -68,00 133,00 165,08

FCF\\Ku 187,00 12,00 331,00 319,08

Tabla 26: Valoracion de Delta Inc. segun el metodo de los practicos.

Page 128: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

120 Pablo Fernandez

6 El problema de fondo: el valor del ahorro de im-puestos debido a los intereses (DVTS)

Definimos Gu como el valor actual de los impuestos en la empresa sin apalancar y GL

como el valor actual de los impuestos en la empresa apalancada. KIU es la rentabilidadexigida a los impuestos en la empresa sin apalancar y KIL es la rentabilidad exigidaa los impuestos en la empresa apalancada. IMPu son los impuestos de la empresa sinapalancar; IMPL son los impuestos de la empresa apalancada.

FCFo es el free cash flow de la empresa sin impuestos y Kuo es la rentabilidadexigida a los activos de la empresa sin impuestos. Vuo es el valor de la empresa sinapalancar y sin impuestos. Por consiguiente,

Vuo = VA[Kuo ; FCFo] .

Si no hay costes derivados del endeudamiento, el valor total de la empresa sin deuda(valor de las acciones, Vu, mas valor actual de los impuestos, Gu) es igual al valortotal de la empresa aplancada (valor de las acciones, E, mas valor de la deuda, D,mas valor actual de los impuestos, GL):

Vuot = Vut + Gut = Et + Dt + GLt . (15)

La formula (16) presenta la igualdad de la suma de los flujos de la empresa sin deuday de la suma de los flujos de la empresa apalancada.

FCFo = IMPu + FCF = IMPL + CFac + CFd = IMPL + CCF . (16)

De (15) y (16) se deriva:

VuoKuo = Vu Ku + Gu KIU = E Ke + D Kd + GL KIL

= (D + E)WACCBT + GL KIL . (17)

El llamado “valor actual neto del ahorro de impuestos debido al pago de intereses”(DVTS) es:

DVTSt = Gut − GLt . (18)

El DVTS es la diferencia de dos valores actuales netos, de dos flujos (el de los im-puestos de la empresa sin apalancar y el de los impuestos de la empresa apalancada)que tienen, obviamente, distinto riesgo. En una perpetuidad creciente:

DVTSt = Gut − GLt =IMPut+1

KIU − g− IMPLt+1

KIL − g. (19)

La relacion entre IMPu y IMPL es:

IMPut+1 − IMPLt+1 = Dt KdT . (20)

Page 129: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion de empresas por descuento de flujos 121

Logicamente, los impuestos de la empresa sin apalancar tienen menos riesgo que losimpuestos de la empresa apalancada, y por consiguiente:

KIU < KIL . (21)

Una logica limitacion del valor del DVTS es que

DVTS < GU . (22)

Despejando el valor de KIU y KIL de (15), (16) y (17) se obtiene:

KIU =VuoKuo − Vu Ku

Vuo − Vu.

KIL =VuoKuo − E Ke − DKd

Vuo − E − D.

La relacion entre KIU y KIL es:

KIL =Gu KIU − E Ke − D Kd + Vu Ku

Vuo − E − D.

En la empresa sin apalancar, la relacion entre los impuestos y el beneficio antes deimpuestos es:

IMPu = TBATu . (23)

La relacion entre el free cash flow y los impuestos de la empresa sin apalancar es

IMPu = TFCF + H

1 − T. (24)

H es un parametro que incorpora el aumento de necesidades operativas de fondos(necesidades de circulante) mas la compra de activos fijos menos la amortizacion delano:

H = ∆(NOF) + ∆(AF) − amortizacion = ∆(NOF) + ∆(AFN) , (25)

siendo AFN los activos fijos netos. En la empresa apalancada, la relacion entre elcash flow para las acciones y los impuestos de la empresa sin apalancar es

IMPL = TCFac + H − ∆D

1 − T. (26)

En una perpetuidad creciente a la tasa g:

H = g NOF + g AFN ≥ 0 ,

Vuo =FCFo

Kuo − g=

IMPuKIU − g

+FCF

Ku − g,

Vuo =FCFo

Kuo − g=

IMPL

KIL − g+

FCFWACC − g

.

Page 130: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

122 Pablo Fernandez

En una perpetuidad creciente, KIU < Ku. Al ser Kuo el coste promedio de KIU y Ku,tambien debe cumplirse que KIU < Kuo. Por consiguiente: KIU < Kuo < Ku.

Segun Myers,

DVTSt = Gut − GLt =IMPut+1

Kd − g− IMPLt+1

Kd − g=

D Kd TKd − g

,

esto es: KIU = KIL = Kd, lo que no tiene sentido.

Segun Harris y Pringle,

DVTSt = Gut − GLt =IMPut+1

Ku − g− IMPLt+1

Ku − g=

D Kd TKu − g

,

esto es: KIU = KIL = Ku, lo que no tiene sentido.

En una perpetuidad sin crecimiento26, resulta (segun Modigliani Miller) que KIU =Ku; y KIL = Ke. Es obvio que en una perpetuidad sin crecimiento:

GL = ET

1 − T; Gu = Vu

T1 − T

.

En las otras teorıas que hemos visto, no es cierto que DVTSt = Gut − GLt.

No es verosımil una teorıa que proporcione un valor del DVTS superior al deModigliani-Miller, porque ello significarıa que el valor conjunto de la empresa apa-lancada (Et + Dt + GLt) es superior al valor conjunto de la empresa sin apalan-car (Vut + Gut). Todas las teorıas proporcionan un valor del DVTS inferior al deModigliani-Miller, excepto la de Myers (1974) en algunos casos: con crecimiento pro-porciona valores del DVTS superiores al de Modigliani-Miller.

Podemos considerar el DVTS de las diversas teorıas como la diferencia entre elDVTS segun Modigliani-Miller (DVTSMM) y un coste del apalancamiento (CA) queintroduce implıcitamente cada teorıa.

E + D = Vu + DVTS = Vu + DVTSMM − CA ,

CA = DVTSMM − DVTS ,

siendo DVTSMM = VA[Ku ; DTKu].

Segun esto, el coste del apalancamiento segun las distintas teorıas resulta:

a) segun Modigliani y Miller (1963): CA = 0.

b) Segun Myers (1974):

CA = VA[Ku ; DTKu] − VA[Kd ; DTKd] .26En una perpetuidad sin crecimiento, H = 0. La compra de activos fijos es identica a la amorti-

zacion y las necesidades operativas de fondos son constantes.

Page 131: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion de empresas por descuento de flujos 123

c) Segun Miller (1977):CA = VA[Ku ; DTKu] .

d) Segun Miles y Ezzell (1980):

CA = VA[Ku ; T DKd]1 + Ku1 + Kd0

.

e) Segun Harris y Pringle (1985) y Ruback (1995):

CA = VA[Ku ; DTKu − DTKd] .

f) Segun Damodaran (1994):

CA = VA[Ku ; D (Kd − RF) (1 − T)] .

g) Segun el metodo de los practicos:

CA = VA[Ku ; D (Kd − RF (1 − T) + D(Ku − RF),T] .

A partir de los resultados anteriores, o bien a partir de las expresiones del valor dela empresa en funcion del free cash flow ajustado al riesgo del negocio o del cashflow disponible para las acciones ajustado al riesgo del negocio, es facil comprobarlas diferencias en la valoracion para una empresa con un nivel de deuda prefijado:

EModigliani y Miller − EDamodaran = VA[Ku ; D(Kd − RF (1 − T)],

EModigliani y Miller − EPracticos = VA[Ku ; D(Kd−RF) (1−T)+DT (Ku−RF)],

EModigliani y Miller − EHarris y Pringle = VA[Ku ; D T (Ku − Kd)],

EModigliani y Miller − EMyers = VA[Ku ; (D T − DVTSMyers) (Ku − Kd)],

EHarris y Pringle − EPracticos = VA[Ku ; D (Kd − RF).

Page 132: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

124 Pablo Fernandez

Anexo 1: abreviaturas utilizadas en el documento

βd Beta de la deuda (Beta, or systematic risk, of the debt).

βu Beta de las acciones de la empresa sin apalancar (Beta, or systematic risk,of the unlevered firm).

βL Beta de las acciones de la empresa apalancada (Beta, or systematic risk,of the levered firm).

CCF (Capital Cash Flow), cash flow disponible para los tenedores de accionesy de deuda. Cash flow available for all stakeholders: equity and debt.

CFac Cash flow disponible para las acciones (available for equityholders).

Dt Valor de la deuda en t. Market value of debt.

DVTS (Discounted Value of Tax Shields), valor actual del ahorro de impuestosdebidos a la deuda.

Et Valor de las acciones en t (Market value of equity).

Evct Valor contable de las acciones en t (Book value of equity).

EVA (Economic Value Added), beneficio antes de intereses menos el valor con-table de la empresa multiplicado por el coste promedio de los recursos.

FCF (Free Cash Flow), cash flow disponible para las acciones si la empresano tuviera deuda (Cash flow available for equityholders in the hypotheticalunlevered firm).

FCFo Free cash flow de la empresa sin impuestos (Cash flow available for equity-holders in the hypothetical unlevered firm without taxes).

g (growth), crecimiento.

GL Valor actual de los impuestos de la empresa apalancada (Present value oftaxes of the levered company).

Gu Valor actual de los impuestos de la empresa sin deuda (Present value oftaxes of the unlevered company).

IMPL Impuestos si la empresa esta apalancada (Taxes of the levered company).

IMPu Impuestos si la empresa no esta apalancada (Taxes of the unlevered com-pany).

Kd Rentabilidad exigida a la deuda (Required return on the debt).

Ke Rentabilidad exigida a las acciones de la empresa apalancada (Cost ofequity. Required return on the equity flows).

Page 133: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion de empresas por descuento de flujos 125

KIU Tasa de descuento de los impuestos pagados por la empresa sin apalancar(Required return on the taxes of the unlevered company).

KIL Tasa de descuento de los impuestos pagados por la empresa apalancada(Required return on the taxes of the levered company).

Ku Rentabilidad exigida a las acciones de la empresa sin apalancar. Rentabi-lidad exigida a los activos (Required return on the firm’s unlevered flows.Unlevered, or all-equity cost of capital).

Kuo Rentabilidad exigida a los activos de la empresa sin impuestos (Requiredreturn on the firm’s unlevered flows without taxes).

NOPAT (Net Operating Profit After Taxes). Beneficio de la empresa sin apalancar(sin deuda). Tambien se llama BAIDT (beneficio antes de intereses despuesde impuestos).

PM Prima de mercado = E(RM) − RF = rentabilidad exigida al mercado porencima de la tasa sin riesgo (Market risk premium).

RF Tasa de interes sin riesgo (Risk free rate).

T Tasa del impuesto sobre el beneficio (Corporate tax rate).

VA Valor Actual (Net present value).

Vu Valor de las acciones de la empresa sin deuda (Market value of the unleveredfirm).

WACC (Weighted Average Cost of Capital). Coste promedio ponderado de los re-cursos (deuda y acciones), utilizando en la ponderacion el valor de mercadode la deuda y las acciones.

WACCBT (Weighted Average Cost of Capital Before Taxes). Coste promedio ponde-rado de los recursos sin tener en cuenta los impuestos.

Anexo 2: metodos de valoracion de empresas pordescuento de flujos cuando el valor de mercado de la

deuda (D) no coincide con su valor nominal (N)

Este anexo contiene las expresiones fundamentales de los cuatro metodos fundamen-tales para valorar empresas por descuento de flujos, cuando el valor de mercado de ladeuda (D) no coincide con su valor nominal (N)27.

27Estas formulas proceden de Fernandez (1999), pp. 389-391.

Page 134: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

126 Pablo Fernandez

Si el valor de la deuda (D) no coincide con su valor nominal (N) es porque larentabilidad exigida a la deuda (Kd) es distinta que el coste de la misma (r). Losintereses pagados en un periodo t son: It = Nt−1 rt. El aumento de deuda en unperiodo t es ∆Nt = Nt −Nt−1. Por consiguiente, el flujo para la deuda en un periodot es:

CFd = It − ∆Nt = Nt−1 rt − (Nt − Nt−1) .

Por consiguiente, el valor de la deuda en t = 0 es:

D0 =∞∑

t=1

Nt−1 rt − (Nt − Nt−1)t∏1

(1 + Kdt)

.

Es facil demostrar que la relacion entre el valor de la deuda (D) y su valor nominal(N) es:

Dt − Dt−1 = Nt − Nt−1 + Dt−1 Kdt − Nt−1 rt .

Por consiguiente,∆Dt = ∆Nt + Dt−1 Kdt − Nt−1 rt .

El hecho de que el valor de la deuda (D) no coincida con su valor nominal (N) afectaa varias formulas del apartado 1 de este trabajo. Las formulas (1), (3), (4), (6), (7),(9) y (10) siguen siendo validas, pero el resto de las formulas cambia.

La expresion del WACC en este caso es:

WACC =E Ke + D Kd − N r T

E + D. (2∗)

La expresion que relaciona el CFac con el FCF es:

CFact = FCFt + (Nt − Nt−1) − Nt−1 rt (1 − T) . (5∗)

La expresion que relaciona el CCF con el CFac y con el FCF es:

CCFt = CFact + CFdt = CFact − (Nt − Nt−1) + Nt−1 rt = FCFt + Nt−1 rt T . (8∗)

• Distintas expresiones del valor actual del ahorro de impuestos debido alpago de intereses (DVTS)

Las expresiones del valor creado por el endeudamiento, esto es, del valor actual delahorro de impuestos debido al pago de intereses (DVTS) cuando el valor de mercadode la deuda (D) no coincide con su valor nominal (N) son:

a) Modigliani y Miller (1963):

DVTS = VA [Kut ; Dt−1 Kut T − (Nt−1 rt − Dt−1 Kdt) T]

Page 135: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion de empresas por descuento de flujos 127

b) Myers (1974):DVTS = VA [Kdt ; Nt−1 rt T] .

c) Miller (1977): DVTS = 0.

d) Miles y Ezzell (1980):

DVTS = VA [Kut ; Nt−1 rt T]1 + Ku1 + Kd

.

e) Harris y Pringle (1985) y Ruback (1995):

DVTS = VA [Kut ; Nt−1 rt T] .

f) Damodaran (1994):

DVTS = VA [Kut ; Nt−1 rt T + Dt−1 T (Kut − RFt) − Dt−1 (Kdt − RFt)] .

g) Metodo de los practicos:

DVTS = VA [Kut ; Nt−1 rt T − Dt−1 (Kdt − RFt)] .

Referencias

[1] Arditti, F. D. y H. Levy (1977), “ The Weighted Average Cost of Capital as a Cu-toff Rate: A Critical Examination of the Classical Textbook Weighted Average”,Financial Management (Fall), pp. 24–34.

[2] Chambers, D.R., R.S. Harris, y J.J. Pringle (1982), “Treatment of FinancingMix Analyzing Investment Opportunities”, Financial Management (Summer),pp. 24–41.

[3] Damodaran, A (1994), Damodaran on Valuation, John Wiley and Sons, NewYork.

[4] DeAngelo, L. y R. Masulis (1980), “Optimal Capital Structure under Corporateand Personal Taxation”, Journal of Financial Economics 8, Marzo, pp. 3–29.

[5] Fernandez, Pablo (1999), Valoracion de Empresas, Ediciones Gestion 2000.

[6] Hamada, R.S. (1972), “The Effect of the Firm’s Capital Structure on the Syste-matic Risk of Common Stock”, Journal of Finance 27 (May), pp. 435–452

[7] Harris, R.S. y J.J. Pringle (1985), “Risk-Adjusted Discount Rates Extensionsform the Average-Risk Case “, J. of Financial Research (Fall), pp. 237–244.

Page 136: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

128 Pablo Fernandez

[8] Inselbag, I. y H. Kaufold (1997), “Two DCF Approaches for Valuing Companiesunder Alternative Financing Strategies (and How to Choose Between Them)”,Journal of Applied Corporate Finance (Spring), pp. 114–122.

[9] Lewellen, W.G. y D.R. Emery (1986), “Corporate Debt Management and theValue of the Firm”, J. of Financial Quantitative Analysis (December), pp. 415–426.

[10] Miles, J.A. y J.R. Ezzell, (1980) “The Weighted Average Cost of Capital”, PerfectCapital Markets and Project Life: A Clarification,” Journal of Financial andQuantitative Analysis (September), pp. 719–730.

[11] Miles, J.A. y J.R. Ezzell, (1985) “Reformulating Tax Shield Valuation: A Note”,Journal of Finance 40, 5 (December), pp. 1485–1492.

[12] Miller, M.H. (1977), “Debt and Taxes”, Journal of Finance (May), pp. 261–276

[13] Miller, M., and F. Modigliani, (1961), “Dividend Policy, Growth and the Valua-tion of Shares, “ Journal of Business 34, pp. 411–433.

[14] Miller, M., y M. Scholes, (1978), “Dividend and Taxes“, Journal of FinancialEconomics (Dec.), pp. 333–364.

[15] Modigliani, F., and M. Miller, (1958), “The Cost of Capital, Corporation Financeand the Theory of Investment”, American Economic Review 48, 261–297.

[16] Modigliani, F y M.H. Miller (1963), “Corporate Income Taxes and the Cost ofCapital: A Correction”, American Economic Review (June), pp. 433–443.

[17] Myers, S.C. (1974), “Interactions of Corporate Financing and Investment Deci-sions - Implications for Capital Budgeting”, J. of Finance (March), pp. 1–25

[18] Ruback, Richard S. (1986), “Calculating the Market Value of Risk-Free CashFlows”, Journal of Financial Economics (March), pp. 323–339.

[19] Ruback, Richard S. (1989), RJR Nabisco. Teaching note, Harvard BusinessSchool, 5-289-057.

[20] Ruback, Richard S. (1995), A Note on Capital Cash Flow Valuation, HarvardBusiness School, 9-295-069.

[21] Taggart, R.A. Jr. (1991) “Consistent Valuation and Cost of Capital. ExpressionsWith Corporate and Personal Taxes” Financial Management (Autumn), 8–20.

Pablo FernandezIESE

Camino del Cerro del Aguila, 328023-Madrid, Espana

e-mail: [email protected]

Page 137: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Redes neuronales para

aplicaciones en negocios

Anıbal R. Figueiras Vidal1

1 Introduccion

En el ambito de los negocios, como en todos los de aplicacion de metodos cientıficoso tecnicos, los problemas a resolver tienen una de las dos formas fundamentales (oca-sionalmente se combinan estas): elegir entre un conjunto numerable de alternativas—problemas de decision o de clasificacion—, o bien evaluar una cantidad no direc-tamente accesible —problemas de estimacion: si el valor que se estima pertenece alfuturo, se utiliza el termino prediccion—.

Los ejemplos de tales tipos de problemas son numerosısimos: la concesion o dene-gacion de un credito es un ejemplo de los primeros (si bien en muchos casos convienetambien calificar la situacion: tıpicamente estimando la probabilidad de mora), laprediccion de un valor futuro de una serie temporal de consumo de un producto esotro. No puede pretenderse aquı no ya exhaustividad, sino ni siquiera una visionsistematica: deteccion de fraude, configuracion de cestas de compra, valoracion deriesgo de una operacion, optimizacion de una polıtica de compras, etc., son ejemplosadicionales que permiten entrever las amplias dimensiones en que nos movemos; seque el lector lo hara con mas facilidad que yo. Solo por mor de completitud harenotar que los casos de agrupamiento o segmentacion, tan habituales en marketing,pueden considerarse como clasificadores que proceden de acuerdo con un criterio pre-establecido.

A diferencia de lo que ocurre en otras aplicaciones, en los casos de negocio no existeun modelo “fısico” que relacione lo que se puede observar con las alternativas a elegiro la variable a estimar: si, por citar un caso, en radar (tras un adecuado tratamientode la senal recibida) se sabe que la presencia o ausencia de un blanco en un lugarimplica disponer de una observacion de un valor ±E (segun el caso) mas un ruidogaussiano, en concesion de creditos no hay tal modelo para relacionar la morosidadcon las variables sociodemograficas o economicas sobre las que se pregunta al cliente.De modo que, en negocios, nos encontramos con situaciones de diseno “muestrales”:se tienen ejemplos etiquetados (de resultado conocido por experiencia anterior), y apartir de ellos hay que construir un decisor o un estimador.

1Anıbal R. Figueiras Vidal es catedratico de la Universidad Carlos III de Madrid y Academicode Numero de la Academia de Ingenierıa. Esta charla se impartio en la sesion del Seminario MEFF-UAM de junio de 1998.

Page 138: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

130 Anıbal R. Figueiras Vidal

Tradicionalmente se han aplicado, y se aplican, metodos estadısticos para la reso-lucion de estos problemas: desde las decisiones “logit” hasta la regresion polinomicason bien conocidos, y su detalle y potencial tambien, ası como una infinidad de re-comendaciones practicas sobre su uso. Los metodos que aquı se examinan, las RedesNeuronales, no son, sustancialmente, algo nuevo respecto a ellos: son simplemente elresultado de considerar o de visualizar de forma distinta posibles arquitecturas conparametros libres (como los coeficientes de una recta de regresion) que, mediante unadecuado metodo de entrenamiento (como la minimizacion del error cuadratico en-tre valores conocidos y los correspondientes a las ordenadas de la recta), establecenuna “maquina” que sirve para haberselas con el problema: a la presentacion de unnuevo conjunto de observaciones (ahora no etiquetadas, naturalmente) responden conla eleccion de una hipotesis (la atribucion a una clase) o con un valor estimado (opredicho). Pero esa nueva forma de considerar y visualizar las arquitecturas tienealgunas implicaciones destacables.

2 Las Redes Neuronales

Formalmente, una Red Neuronal no es cosa distinta que un sistema paralelo no linealcon componentes repetidos en ramas, habitualmente dispuesto en capas. La figura 1presenta el mas tradicional, el Perceptron Multicapa, designado frecuentemente porsus siglas en ingles (MLP, “Multi-Layer Perceptron”).

x

o

(capa oculta)

Figura 1: MLP

Las observaciones x colocadas en su entrada progresan a traves de ramas, en lasque las componentes del vector se multiplican por valores de los parametros de lared, y la suma de los resultados se somete a una operacion no lineal en cada nodo:normalmente consiste en la toma de la tangente hiperbolica. Tal proceso se repite enuna siguiente capa, hasta alcanzar una salida (o varias) que proporciona un indicadorpara la decision o un(os) valor(es) estimado(s).

Page 139: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Redes neuronales para aplicaciones en negocios 131

Esta arquitectura, sobre cuya muy larga historia no voy a entretenerme, puedeparecer arbitraria. No lo es: de un lado, constituye una extension por combinacionprogresiva de una arquitectura tipo logit; de otro, su forma remeda (¡no equivale a!)la de una porcion del sistema nervioso de un animal dotado de este; y, por ultimo, suexpresion matematica, ya cuando solo hay una capa de nodos intermedios (“ocultos”),constituye un aproximador universal para cualquier correspondencia entre entrada ysalida. Y lo tercero es lo que voy a enfatizar aquı: aproximador universal es, por ejem-plo, un polinomio de orden suficiente en las componentes de x: pero todo el mundosabe de las dificultades originadas por la “explosion dimensional” del numero de com-ponentes (numero de parametros) en los modelos polinomicos cuando se pretendenestablecer correspondencias “complicadas”. Tal fenomeno no se interpone aquı ennuestro deseo de disenar un buen decisor o un buen estimador; o, mejor dicho, no seinterpone de forma tan violenta: solo hace falta “acertar” en la eleccion del numerode nodos ocultos para conseguir la potencia expresiva adecuada para el problema, yeso, sin resultar trivial, no es tan difıcil de determinar.

Por otra parte, la forma de entrenar esta maquina se simplifica precisamente porel aspecto paralelo, repetitivo y en capas que se le da: es facil comprender que setrata de una relacion entrada–salida de la forma

o = f

j

w(2)j fj

(∑i

w(1)i xi

) ,

y que la derivacion de tal expresion mediante la Regla de la Cadena conduce a unalgoritmo de busqueda por pendiente de complejidad moderada: no creo que estesea el mejor lugar para exponer detalles, con lo que citare su nombre, Algoritmo deRetropropagacion, y citare un texto [1] que, si bien lo presenta de la misma formaque otros muchos, lo discute (junto con otros temas relevantes para esta clase demaquinas) de manera magistral.

Arquitecturas como la del MLP brindan, ademas, una importante oportunidad:como quiera que lo verdaderamente deseable de cualquier decisor o estimador es unabuena generalizacion (que responda convenientemente ante ejemplos no utilizadosen el entrenamiento), su comparativa compacidad representa una ventaja: es biensabido que la caracterıstica de generalizacion depende del objetivo (analıtico) delentrenamiento, de la forma de aplicar el algoritmo para optimizar el objetivo, de larepresentatividad de las observaciones dedicadas a entrenar, de la relevancia y gradode independencia de las variables observadas, y de la parsimonia de la arquitecturaseleccionada: respecto a este ultimo factor, es claro que encontrarse problemas dedimensionado no extraordinariamente complejos facilita ganar generalizacion a travesde el. En cuanto a los demas, se consideran y solventan de formas no muy distintasa las clasicas.

No pretendo ocultar que estas maquinas tienen sus dificultades y limitaciones:aparte del dimensionado, su entrenamiento es lento y difıcil, ya que la dependencia

Page 140: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

132 Anıbal R. Figueiras Vidal

de la funcion objetivo de los parametros de la maquina da lugar a (hıper)superficiesde busqueda muy irregulares. Pero, sobre todo, la actuacion de las Redes Neuronaleses muy difıcil de ser “interpretada” en los terminos en que se suele explicar la ac-tuacion de otros clasificadores o estimadores: “esta variable, de gran influencia porvenir afectada de un factor de magnitud elevada”, puede arguirse en el caso de unamaquina lineal (en terminos simplificados, aclaro); pues bien, nada parecido puededecirse en el caso de tomar las tangentes hiperbolicas de diversas combinaciones linea-les y combinar linealmente de nuevo los resultados. Esta limitacion hace poco aptoel empleo de Redes Neuronales en situaciones que puedan aparejar actuaciones foren-ses. No obstante lo anterior, debo advertir que se trabaja muy decididamente en eldesarrollo de tecnicas de interpretacion (reduccion a reglas y referencia a prototipos,entre otros; aunque debo confesar que mis esperanzas personales se cifran mas en eldesarrollo de aproximaciones “local-global”: en ellas se regionaliza el problema, y sedisenan soluciones de estructura global, como las polinomicas, para cada region: conla fundada esperanza de que el implıcito compromiso tamano de las regiones-sencillezde los problemas regionales permita explicaciones directamente inteligibles. Mis espe-ranzas se cifran, como digo, en esta opcion porque. . . yo personalmente dedico esfuerzoinvestigador en este tipo de disenos: bien se que quienes lo hacemos aun no hemosresuelto la dificultad de optimizar la regionalizacion en funcion del objetivo generaldel problema observado, pero. . . ¡falta poco!).

Y, ya que hablamos de aproximaciones locales, no podemos olvidar la otra familiamas popular de Redes Neuronales: las Redes de Funciones Radiales de Base (RBFN,“Radial Basis Functions Networks”), cuyo esquema se presenta en la Figura 2.

x

o

(capa oculta)

Figura 2: RBF

En este caso, los vectores de entrada se comparan directamente con una serie de vec-tores de referencia, ci, asociados a los nodos de la red: el resultado de la similitud(normalmente el cuadrado de la distancia euclıdea) se utiliza como argumento de unafuncion decreciente (muchas veces una exponencial negativa), y a las salidas de los

Page 141: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Redes neuronales para aplicaciones en negocios 133

nodos se les aplica un decisor o un estimador lineal convencional. Estas redes, tam-bien, como el MLP, de extraordinaria potencia expresiva, tienen la gran ventaja deque, ademas de permitir entrenamiento por gradiente (u otros metodos de busquedalocal), pueden entrenarse mediante agrupamiento (“clustering”) mas parametrizacionconvencional de los pesos de salida: lo que da lugar a que se puedan aprovechar, enel primero de los pasos, conocimiento previo sobre el problema a resolver (ademas,se evitan numerosas caıdas en optimos locales). Por otro lado, a partir de la solidateorıa de la Minimizacion del Riesgo Empırico del matematico ruso Vladimir Vapnik(hoy en los Laboratorios Bell norteamericanos), puede formularse el diseno de RBFNde modo tal que el dimensionado (numero de nodos) y los pesos de salida se ob-tengan automaticamente por Programacion Cuadratica: el resultado, conocido comoMaquinas de Vectores de Soporte (SVM: “Support Vector Machines”) [2], constitu-ye probablemente la opcion mas potente disponible por el momento para solucionarproblemas de clasificacion; las dificultades de carga computacional elevada y falta deadaptabilidad a posibles variaciones del entorno (de las condiciones del problema) sevan solucionando con pequenos trucos algorıtmicos: nuestro grupo de investigacionde la Universidad Carlos III de Madrid ha construido algoritmos reconocidamenteeficaces.

3 Una discusion comparativa

Presentadas ya las Redes Neuronales y sus caracterısticas principales, procede unadiscusion de sus ventajas e inconvenientes respecto a las alternativas existentes parael tratamiento de los problemas de decision y estimacion.

Empezare diciendo que renuncio a proceder estrictamente de modo dicho en elcaso de los metodos estadısticos clasicos: a mi juicio, y como ya he anticipado, nohay diferencias metodologicas significativas, sino unicamente la proposicion de nuevasarquitecturas, potentes y de manejo (relativamente) comodo, como Redes Neuronales.

Sı hay diferencias significativas en los Sistemas Expertos, que se basan en la apli-cacion de reglas (del tipo “si A y B, entonces C”) en la solucion de estos problemas;extrayendo las reglas del conocimiento de expertos o de un apropiado manejo de lospropios datos. No voy a exponer mi propia opinion acerca de la capacidad de las reglaspara representar el conocimiento experto, que es materia muy conceptual para estemomento: sı debo decir que los Sistemas Expertos tienen obvias ventajas forenses,a cambio de pesimas caracterısticas de generalizacion (derivadas de la resolucion deproblemas de clasificacion mediante el empleo de regiones tıpicamente hipercubicas:cuyo aspecto de puercoespines cuando se trabaja en muchas dimensiones propicia elque se separen muestras muy semejantes y se agrupen otras muy dispares) y de unacasi absoluta imposibilidad de actuar adaptativamente.

Este ultimo defecto tambien lastra los conocidos como Arboles de Decision (ode Estimacion), metodos en los que se van separando grupos de muestras mediante

Page 142: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

134 Anıbal R. Figueiras Vidal

la aplicacion consecutiva de diversos tests, hasta llegar a grupos compuestos pormuestras de una sola clase: vease la Figura 3.

(test 1)

(test 2)terminal

1

terminal

3

(clase A)

nodo

1o2

nodo

2

o1

(clase A)(clase B)

terminal

2

Figura 3: Arboles

La eleccion de los tests es dificultosa; las propiedades de generalizacion, medianas (nosolo dependientes de los tests aplicados, como dicen algunos autores: el mero hechode buscar la detencion por separacion no contribuye a su bondad).

Sin embargo, como los Sistemas Expertos, son facilmente interpretables (si loson los test empleados). Por todo lo anterior, son recomendables para problemasestadısticos de complejidad intermedia: sobre todo, ante necesidades forenses.

Los Metodos “Basados en Memoria” consisten en comparar los valores de las va-riables del caso bajo analisis con los de ejemplos de solucion conocida, y decidir deacuerdo con el caso mas semejante, o en virtud de lo sugerido por las soluciones delgrupo de casos mas similares. Como se aplica a problemas muy variados, resultancrıticas para obtener buenas prestaciones la seleccion de las variables y la medidade la similitud que se aplique: ambas cosas difıciles de determinar en funcion de labusqueda de las mejores prestaciones. Otra limitacion intrınseca radica en que setrabaja de acuerdo con la filosofıa de los bien conocidos procedimientos de “k vecinosmas proximos” (k-NN, “k-Nearest Neighbours”), robustos pero no excesivamente po-tentes; pero cabe advertir que tal forma de actuar puede ampliarse sin dificultad seriaaparente: por ello, opino que estos metodos tienen un muy prometedor futuro; aunadmitiendo que las versiones adaptativas requieren mucho esfuerzo de investigacionadicional.

Otras tecnicas emergentes, como la Logica Difusa y los Algoritmos Genetico-Evolutivos, no son alternativas directas a las vistas: la primera es complementaria

Page 143: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Redes neuronales para aplicaciones en negocios 135

para cualquiera de ellos, ya que proporciona una forma diferente de la habitual derepresentar y tratar variables, y los segundos constituyen un metodo de busquedaglobal, incorporable al diseno de las maquinas que hemos revisado (eso sı, como ensu aplicacion directa, con problemas en la generalizacion alcanzable).

Resumiendo: las Redes Neuronales son una muy recomendable alternativa paraproblemas de elevada complejidad y moderados requisitos de adaptatividad e inter-pretatividad: aunque cada dıa mejoran sus caracterısticas frente a estas demandas.

4 Aplicaciones en negocios

Dicho lo anterior, no es extrano que las Redes Neuronales hayan sido ampliamenteaplicadas en problemas de decision y de estimacion surgidos en el mundo de losnegocios. Serıa inadecuado seleccionar y discutir aquı casos particulares: cualquierlector puede acceder a fuentes mas extensas como [3] y [4], y apreciar allı aplicacionesy resultados. Peros sı conviene resaltar que, en general, la aplicacion de las RedesNeuronales conduce a realizaciones con mejores prestaciones que sus alternativas:siempre que, desde luego, su diseno y aplicacion se lleve a cabo por buenos conocedoresde este ambito (ya que, como se ha advertido, esta llenas de trampas para el usuarioaccidental), y, como en el caso de cualquier metodo, se incorpore debidamente elconocimiento previo general y especıfico que se tenga del problema bajo estudio.

Ası lo hemos podido verificar los componentes del equipo de investigacion que, enel departamento de Tecnologıas de las Comunicaciones de la Universidad Carlos III,hemos disenado Redes Neuronales para su aplicacion en problemas de concesion decreditos, segmentacion de mercados, deteccion de fraude, y otros analogos (ademasde aplicaciones en ambitos de tipo puramente tecnologico, como predistorsionadores eigualadores en telecomunicaciones). Al mismo tiempo, este equipo de investigacion haabordado con estas herramientas problemas de caracter diferente del de los anterio-res, que habitualmente se reunen bajo la denominacion generica de “Minerıa de Da-tos”: trabajando sobre muestras que no son las tıpicas variables sociales, economicas,fısicas, etc., sino representativas de otras informaciones, como las contenidas en untexto (aparicion de ciertos terminos, con sus frecuencias y posiciones relativas, etc), ycuya aplicacion se extiende desde la creciente disciplina de la Gestion del Conocimien-to hasta su empleo para la personalizacion de los servicios y aplicaciones ofrecidos atraves de las redes de telecomunicaciones: por no citar el importantısimo caso de laInteligencia de Negocio, en que datos de mercado, noticias, anuncios, etc., proveenel material “crudo” utilizable para el estudio de la competencia y la toma de deci-siones estrategicas para la empresa (o tambien de instituciones u organizaciones deorientacion no empresarial: es desolador constatar que las administraciones espanolasse encuentran en estado de casi absoluto desconocimiento de estas posibilidades ytecnicas; claro esta que no hay muchas diferencias con otros ambitos. . . )

Page 144: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

136 Anıbal R. Figueiras Vidal

5 Tendencias

No serıa justo negar al lector informacion sobre las tendencias de mayor relevancia enel campo de las Redes Neuronales: aun forzado a la sıntesis, lo hare gustoso.

A mi juicio, y ademas de lo relevante de las variaciones y extensiones de las yacitadas SVM, proporcionaran resultados de importancia:

• Los trabajos de desarrollo de metodologıas y algoritmos para construir asocia-ciones de redes neuronales, en que se busca aprovechar ventajas de diferentestipos de arquitecturas, fraccionar la resolucion de un problema en tareas parcia-les mas asequibles, combinar lo obtenido de acuerdo con criterios diferentes, etc.Vease [5]. En particular, es muy alta mi confianza en los procedimientos enlos que se realiza un agrupamiento (“clustering”) y una posterior aplicacion deuna maquina a los grupos (sea acretiva, sea interpolativamente). La dificultadde disenar el agrupamiento inicial para optimizar las prestaciones del sistemaglobal, o de agrupar en operacion tras un diseno en el que el agrupamiento serealiza implıcitamente optimizando la asignacion de muestras a las maquinasdel nivel de salida, se puede atacar con eficaces heurısticos (suboptimos), de losque nuestro equipo de investigacion analiza varios.

Personalmente considero que estas aproximaciones de tipo “local mas global”brindan una magnıfica vıa para resolver el dilema entre aproximacion median-te funciones globales o mediante funciones locales de siempre abierto en lasmatematicas.

• La aplicacion de conceptos evolutivos, o, para ser mas exactos, probabilısticos,en el diseno de (complejas) maquinas de decision o de estimacion. Como quieraque muchas arquitecturas admiten de forma natural el empleo de algoritmos decrecimiento –por poner un ejemplo sencillo: la construccion de un modelo po-linomico de alto orden mediante la repetida aplicacion de modelos polinomicosde dos variables y orden dos–, recurrir para crecer a una seleccion deterministade opciones en funcion de las prestaciones inmediatamente obtenidas representaun serio riesgo de obtener prestaciones finales limitadas por malas eleccionesintermedias. Si se introduce la aleatoriedad en el crecimiento (con proporcio-nalidad de las oportunidades de aparicion de cada opcion y sus prestacionesinmediatas como en el caso de los Algoritmos Geneticos), el manejo de pobla-ciones de soluciones ası construidas brinda opcion de salir de tales trampas enla construccion. Posibilidades y metodos en esta lınea necesitan aun, no hayque decirlo, de un proceso de maduracion.

Debo senalar tambien que caben combinaciones de las lıneas que he citado, cuyodetalle reviste una complejidad que no propicia su exposicion en estas paginas.

Page 145: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Redes neuronales para aplicaciones en negocios 137

6 Consideraciones finales

Lo que antecede constituye, en apretadısima sıntesis, el resultado de mis experienciasde ya bastantes anos en el empleo de Redes Neuronales en la resolucion de problemasde negocio (y de otros: no debo ocultar que mantengo la opinion de que el trabajo endiversos campos de aplicacion otorga la inapreciable ventaja de aprovechar el trans-plante de conceptos, metodos y procedimientos), junto con unas referencias a fuentesmas extensas de casos concretos —cuya presencia aquı ocluirıa el espacio preciso paracuestiones generales que creo mucho mas relevantes—. Si bien se que su lectura puededespertar la curiosidad, tambien conozco que puede provocar escepticismo, e inclusorechazo. Tales sentimientos se combaten con la verificacion de las reales posibilidadesde las Redes Neuronales: salvo que nazcan del temor de que pongan en compromisola importancia de nuestro propio saber o nuestro propio trabajo. Si bien esta en lanaturaleza humana la aparicion de este temor, me atrevo a alegar que deriva de unainseguridad poco justificada: es manifiesto que el conocer y disponer de un mejorarsenal de herramientas no dana la posicion de quien emplea dichas herramientas, nisiquiera de quien esta al cargo de gestionar el resultado del trabajo de quienes lasemplean. Lo que sı produce peligroso y vano riesgo es renunciar a utiles que puedanresultar definitivos para la mejora del negocio. No hay que temer a las Redes Neu-ronales: como todas sus alternativas, clasicas o emergentes, son una ayuda para lastareas de los humanos, y no un sustituto.

Y ya considerada la primera dificultad que realmente encuentra la aplicacion delas Redes Neuronales, se me permitira recordar una obviedad: de donde no hay, no sepuede sacar. Lo que, traducido a lo que ahora nos ocupa, dice que sin datos, no hayayuda posible. Muchas organizaciones no perciben que hoy incluso se puede hablarde sobreabundancia de datos e informaciones: de ahı viene realmente la expresion“Sociedad de la Informacion”. Muchas organizaciones no reparan en que desperdiciarla informacion supone desventaja: se quedan en el estadio anterior, sin aspirar a in-tegrarse en la “Sociedad del Conocimiento”. Conocer significa interpretar y asimilarinformacion. Esa informacion ha de ser buscada, seleccionada, mantenida, almacena-da,. . . Despues, analizada y explotada: pero si no se toman las providencias posiblespara lo primero, no hay opcion para lo segundo. La informacion es materia prima: elconocimiento, producto.

Agradecimientos

En la concepcion y orientacion de estas paginas han tenido decisiva influenciamuchos colegas. Me permito citar, entre ellos, a quienes han discutido conmigo adiario sobre este tema: los profesores Antonio Artes, Angel Navia y Jesus Cid, de miUniversidad.

Page 146: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

138 Anıbal R. Figueiras Vidal

Referencias

[1] C. M. Bishop: Neural Networks for Pattern Recognition. Oxford: Oxford Univer-sity Press, 1995.

[2] B. Scholkopf, K-K. Sung, C.J.C. Burges, F. Girosi, P. Niyogi, T. Poggio, V. Vap-nik: “Comparing Support Vector Machines with Gaussian Kernels to Radial BasisFunction Classifiers”, IEEE Trans. on Signal Proc. 45 (1997), pp. 2758-2765.

[3] A. S. Weigend, Y. Abu-Mostafa, A.-Paul N. Refenes (eds): Decision Technologiesfor Financial Engineering. Singapore: World Scientific, 1997.

[4] A.-P. N. Refenes, A. N. Burges, J. E. Moody (eds): Decision Technologies forComputational Finance. Dordrecht, The Netherlands: Kluwer, 1998.

[5] A. J. C. Sharkey (ed): Combining Artificial Neural Nets. Ensemble and ModularMulti-Net Systems. London: Springer-Verlag, 1999.

Anıbal R. Figuieras VidalDepartamento de Tecnologıas de las Comunicaciones

Universidad Carlos III de MadridAvenida de la Universidad, 30

20912 Leganes (Madrid)e-mail: [email protected]

Page 147: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Volatilidad estocastica,

volatilidad incierta

Antonio Sanchez Calle1

Resumen

En el modelo de Black-Scholes para la evolucion del precio de activos finan-cieros se hacen varias hipotesis que son una primera aproximacion a la realidady cuyo objetivo principal es hacer el modelo simple y calculable. Que esas su-posicion no son compatibles con los datos de mercado se hace aparente en lasonrisa de volatilidades, volatility clusters, fat tails, etc.

En un intento de solventar estas dificultades se han propuesto ciertos cambiosal modelo de B-S; del que nos vamos a ocupar hoy es de modificar la hipotesisσ = constante.

1 Black-Scholes

Comenzamos con un repaso rapido a Black-Scholes.

1.1 Hipotesis del modelo

• El mercado esta exento de “friccion” y es continuo:

– no hay costes de transaccion,– no hay restriccion en ventas al descubierto;– los activos son infinitamente divisibles;– los activos no pagan dividendos;– el tipo para prestar y tomar prestado es el mismo;– las transacciones tienen lugar en tiempo continuo;– . . .

• El mercado es “eficiente”, es decir, no hay oportunidades de arbitraje.

• Hay un activo sin riesgo, la cuenta corriente Bt, cuya evolucion es

dBt = rBtdt , B0 = 1

y, por tanto,Bt = ert .

1Antonio Sanchez Calle es Catedratico de Analisis Matematico de la Universidad Autonoma deMadrid. Esta charla se impartio en la sesion del Seminario MEFF-UAM de septiembre de 1998.

Page 148: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

140 Antonio Sanchez Calle

• El activo con riesgo, St, sigue una evolucion del tipo

dSt

St= µdt + σ dWt ,

donde µ y σ son constantes (σ = 0) y Wt es un movimiento browniano. Como

consecuencia,St

S0sigue una distribucion lognormal de parametros (µ − σ2

2)t y

σ√

t. Es decir,

Xtdef= log

St

S0∼ Normal

((µ − σ2

2)t, σ

√t

)

1.2 Consecuencias

La hipotesis de ausencia de oportunidades de arbitraje permite valorar derivadosusando carteras autofinanciadas: una cartera esta dada por dos procesos, φt yψt, que representan el numero de activos y bonos, respectivamente. El valor de esacartera en el instante t es

Vt = φtSt + ψtBt .

Una cartera autofinanciada se crea haciendo un desembolso inicial y reajustandola composicion de la cartera a partir de ese momento sin hacer ningun desembolsoadicional (ni positivo ni negativo). Eso se traduce en que su cambio de valor procedeunicamente del cambio en la cotizacion del activo o en el valor del bono; es decir,

dVt = φt dSt + ψt dBt .

Una cartera autofinanciada esta determinada por su valor inicial y por una cualquierade sus partes, φt o ψt. Por ejemplo, dado un φt, la cartera autofinanciada correspon-diente es la solucion a

dVt = r(Vt − φt St) dt + φt dSt .

La ausencia de oportunidades de arbitraje tiene varias consecuencias inmediatas:

• dos carteras autofinanciadas que tengan el mismo valor en algun instante hande tener el mismo valor en todo momento.

• Si un producto derivado tiene payoff X a vencimiento T y hay una carteraautofinanciada que cumple VT = X, entonces el valor de ese producto derivadoen cualquier instante anterior t < T deberıa ser Vt.

Esa ultima observacion proporciona un metodo para valorar derivados: encontrar unacartera autofinanciada que reproduzca el payoff en el instante T y tomar como valordel derivado en el instante t el que tenga la cartera en ese mismo instante.

Observacion: lo anterior nos dice en principio como valorar y ademas como cubrirel riesgo en cada momento formando la susodicha cartera. Pero, ¿como se encuentraesa cartera?; o, de otra manera, ¿cual es el φt? En un momento lo recordaremos.

Page 149: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Volatilidad estocastica, volatilidad incierta 141

1.3 Propiedades del modelo de Black-Scholes

Entre las propiedades de este modelo se pueden destacar:

• este modelo es completo en el sentido siguiente: es posible reproducir un payoff“arbitrario” mediante una cartera autofinanciada.

• El valor en el instante t de un derivado con payoff del tipo f(ST ) dependeunicamente de la cotizacion St del activo en ese instante. Ademas, si V (St, t) esese valor, entonces la funcion V (S, t) verifica la ecuacion de Black-Scholes:

∂tV (S, t) +

12

σ2 S2 ∂2

∂S2V (S, t) + r S

∂SV (S, t) − r V (S, t) = 0 ,

y se tiene

φt =∂

∂SV (St, t) (= la “delta”)

• Una forma alternativa de calcular la cartera autofinanciada es utilizar lo quese conoce como probabilidad riesgo-neutro o probabilidad-martingalaequivalente, que se obtiene reasignando probabilidades a las posibles evolu-ciones del subyacente de forma que se refleje la ausencia de oportunidades dearbitraje. Desde el punto de vista de la evolucion eso significa que

dSt

St= r dt + σ dWt ,

donde Wt es un browniano para esa nueva probabilidad Q.

En terminos de esta Q, el valor de la cartera autofinanciada con payoff X en Tes

Vt = Bt EQ

[X

BT

∣∣∣∣∣Ft

]= e−r(T−t) EQ[X

∣∣Ft] ;

esto es, el valor esperado del payoff conocida la informacion del mercado hastael instante t, descontado a fecha t.

1.4 Volatilidad implıcita

La famosa formula de B-S da el valor de una call de vencimiento T (fijo en lo quesigue) y precio de ejercicio K:

Cbs(K,σ) = S Φ(d+) − K e−rT Φ(d−) ,

con

d± =1

σ√

Tlog

S

Ke−rT± 1

2σ√

T ,

Page 150: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

142 Antonio Sanchez Calle

y donde S es el valor del activo subyacente en t = 0 y Φ(x) es la funcion de distribucionde la Normal(0,1),

Φ(x) =∫ x

−∞e−t2/2 dt√

2π.

Es facil ver que la funcionσ −→ Cbs(K,σ)

es inversible, y su inversa da lugar a lo que se conoce como volatilidad implıcita:si c(K) es el precio de mercado de una call con precio de ejercicio K, entonces lavolatilidad implıcita en ese precio de mercado es la σk tal que

Cbs(K,σk) = c(K) .

Si el modelo de B-S fuese correcto, haciendo esto para distintos strikes se deberıaobtener, esencialmente, un valor independiente de K, pero eso no es ası.

Nota: realmente tenemos una superficie de volatilidades σ(K,T ).

2 Variando la σ

Comenzamos con un repaso somero de los modelos de volatilidad estocastica: su-ponemos que St sigue una evolucion

dSt

St= µt dt + σt dWt ,

con σt (y µt) un proceso aleatorio adaptado a la “informacion disponible en el mer-cado” hasta ese momento, Ft.

Nota: Normalmente se toma como Ft la informacion contenida en el brownianohasta ese instante, o lo que es lo mismo, la dada por la evolucion del activo hastaese momento. En este caso el modelo es completo aunque demasiado general si no seimponen condiciones adicionales sobre el proceso σt.

Page 151: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Volatilidad estocastica, volatilidad incierta 143

Un aparte sobre incompletitud

En el caso en que la informacion en Ft sea mas amplia que la contenida en el browniano, el modeloes, en general, incompleto y eso significa que habra payoffs que no se pueden reproducir por unacartera autofinanciada. Eso conlleva una complicacion a la hora de valorar ciertos productos.

Una posibilidad sensata a la hora de valorar un producto derivado, desde el punto de vista delvendedor, consiste en tomar su payoff X (vencimiento T ) y considerar todas las carteras autofinan-ciadas que cumplen

VT ≥ X .

Se elige como valor el ınfimo de todos los V0’s.

Este procedimiento hace pertinentes ciertas preguntas:

• ¿existe alguna cartera autofinanciada que “domine” el payoff ? (es decir VT ≥ X).

• Si la respuesta es “SI”, ¿corresponde el ınfimo de los V0’s a una cartera autofinanciada?

• Si existe esa cartera “optima” en el instante t = 0, ¿sigue siendo optima en instantes poste-riores? Y, si es ası, ¿la estrategia de cobertura de esa cartera es “calculable”?

Como hemos mencionado, el modelo planteado arriba es demasiado general paraobtener resultados concretos, y se suelen hacer ciertas hipotesis adicionales sobre σt.Por ejemplo,

• se supone que σt de la forma σ(St, t), con σ(S, t) conocida.

• Volatilidad estocastica: se supone que σt verifica una ecuacion diferencialestocastica de la forma

dσt

σt= αt dt + βt dZt ,

con Zt un movimiento browniano que tiene cierta correlacion con el que rige laevolucion de St (“dWt dZt = ρ dt”).

• Volatilidad incierta: se supone que σt es desconocida pero satisface una con-dicion del tipo

0 < m(St, t) ≤ σt ≤ M(St, t) .

2.1 σ = σ(St, t) conocida

Suponemos que St sigue una evolucion del tipo

dSt

St= µ(St, t) dt + σ(St, t) , dWt ;

es decir, la volatilidad depende unicamente de la cotizacion del subyacente en eseinstante. En este caso gran parte de lo que es cierto en el modelo de B-S siguecumpliendose; por ejemplo,

Page 152: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

144 Antonio Sanchez Calle

• El modelo sigue siendo completo, aunque ahora St ya no es lognormal.

• El valor de un derivado con payoff f(ST ) sigue siendo de la forma V (St, t),donde V (S, t) satisface una EDP similar:

∂tV (S, t) +

12

σ2(S, t)S2 ∂2

∂S2V (S, t) + r S

∂SV (S, t) − r V (S, t) = 0 ,

que es tratable por los metodos clasicos de aproximacion numerica.

Ademas tiene una ventaja importante: se puede adaptar la σ(S, t) a los datos demercado en el instante actual (t = 0), al menos teoricamente. Si C(K,T ) representael valor de una call con strike K y vencimiento T (que suponemos conocido para todoK,T ) entonces

σ(K,T ) =2

K2

∂T C(K,T )∂2

K C(K,T ).

Problema: la volatilidad implıcita es realmente una funcion σ∗(t, t+T,K), donde t =instante actual, y estamos ajustando el modelo para un t = 0. Desafortunadamente,la superficie de volatilidades no es muy estable al variar t y el modelo pronto sedesajusta.

Ademas, ¿en que situaciones es razonable suponer que la volatilidad dependeunicamente del nivel del activo?

2.2 Dinamica conjunta para St, σt

Tratamos ahora de modelos en los que la dinamica que rige la evolucion de St, σt esde la forma

dSt

St= µ(St, σt, t) dt + σt dWt ,

dσt

σt= α(St, σt, t) dt + β(St, σt, t) dZt ,

donde Wt y Zt son movimientos brownianos de correlacion ρ, con |ρ| < 1 y la formade los coeficientes se obtiene haciendo hipotesis adicionales sobre el modelo.

Las dificultades en estos modelos no son solo computacionales; estos modelos noson completos debido a que la volatilidad no se negocia (aunque el mercado de opcionesse puede utilizar como un sucedaneo).

• Hull-White (ver Hull y White (1987))

Es uno de los primeros modelos, y en el se supone basicamente que la volatilidad sigueun proceso independiente al del activo:

dSt

St= µ(St, σt, t) dt + σt dWt ,

dσt

σt= α(σt, t) dt + β(σt, t) dZt ,

ρ = 0 .

Page 153: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Volatilidad estocastica, volatilidad incierta 145

Esas hipotesis permiten concluir, entre otras cosas, que conocida la varianza media

Vdef=

1T

∫ T

0

σ2t dt ,

la distribucion de ST /S0 es lognormal como en el caso de B-S, tomando como volati-lidad

√V (tambien analizan el caso ρ = 0 numericamente).

Desafortunadamente, para explicar las sonrisas se necesita hacer otras hipotesisadicionales que ellos mismos consideran poco sensatas.

• Zhu-Avellaneda (ver Zhu y Avellaneda (1998))

La hipotesis adicional es que las calls a muy corto plazo siguen Black-Scholes (parala volatilidad instantanea). Eso hace que si F (S, σ, t) denota el precio de un derivado,entonces formando una cartera con 1 unidad del derivado, ∆ unidades de activo y γunidades de la call a corto plazo, eliminando la parte aleatoria se puede concluir queF verifica una EDP especial que se traduce en una evolucion “riesgo-neutro”

dSt

St= r dt + σt dWt ,

dσt

σt= −1

2ρV σt dt + V dZt

y este es el modelo que se estudia.

Una de sus principales virtudes es que predice sonrisas de volatilidad. Un “li-gero” defecto es que, para el caso de correlacion negativa, la volatilidad explota entiempo finito, aunque en general el tiempo de explosion es grande comparado con losvencimientos habituales.

2.3 Volatilidad incierta

En los modelos de volatilidad incierta (ver Avellaneda, Levy y Paras (1995) y Lyons(1995)) la hipotesis basica es que la volatilidad es desconocida y solo se conocen ciertasrestricciones sobre su comportamiento, en general sobre su tamano.

Suponemos que St sigue una evolucion

dSt

St= µt dt + σt dWt ,

pero sobre σt solo se sabe que, por ejemplo,

0 < σmin ≤ σt ≤ σmax ,

con σmin y σmax constantes.

Page 154: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

146 Antonio Sanchez Calle

Valoracion de Derivados Supongamos que tenemos un payoff f(ST ) a venci-miento T que queremos valorar en el instante t.

Punto de vista del vendedor:

• quiere poder hacer frente a todas las posibles evoluciones.

• Cada eleccion de σ• admisible da lugar a una cartera autofinanciada, V σ•t que

reproduce el payoff en T.

• Es natural, pues, pedir como prima la cantidad

W+(St, t)def= sup

σmin≤σ•≤σmax

V σ•t .

Punto de vista del comprador:

• comprar f(ST ) ≡ vender −f(ST ).

• Cada eleccion de σ• admisible da lugar a una cartera autofinanciada, V σ•t que

reproduce el payoff f(ST ). Entonces −V σ•t reproduce −f(ST ).

• Por tanto, puesto que − sup(−a) = inf(a), un comprador ofrecera

W−(St, t)def= inf

σmin≤σ•≤σmax

V σ•t

por ese producto.

Una pregunta inmediata es ¿como se calculan W±? La respuesta, cuya justificaciones un uso elemental de la formula de Ito, es que ambas satisfacen la EDP

∂tW (S, t) +

12

a2± S2 ∂2

∂S2W (S, t) + r S

∂SW (S, t) − r W (S, t) = 0

W (S, T ) = f(S)

donde para W+ hay que usar

a+def=

σmax si

∂2

∂S2W+(S, t) ≥ 0 ,

σmin si∂2

∂S2W+(S, t) < 0 ,

y para W−

a+def=

σmax si

∂2

∂S2W−(S, t) ≤ 0 ,

σmin si∂2

∂S2W−(S, t) > 0, .

Page 155: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Volatilidad estocastica, volatilidad incierta 147

Desde un punto de vista intuitivo es una ecuacion “razonable”: por ejemplo el ven-dedor (caso +), al considerar el valor de un derivado tipo call, con payoff convexo(es decir ∂2

S > 0) observa que ese valor aumenta con la volatilidad, luego su peorsituacion es cuando esa volatilidad sea σmax. Por otro lado, para un derivado con∂2

S < 0, por ejemplo (activo − call), el mayor valor corresponde a la volatilidad maspequena σmin. ¡Esto es precisamente lo que recoge la a+!

Observacion: W± corresponden a carteras autofinanciadas para posibles evolucio-nes de la volatilidad σ±

t dadas por σ±t

def= a±(∂2SW±).

Comentarios:

• La cobertura de una cartera no es lineal en sus componentes. Si f1(ST ) y f2(ST )son payoffs en T y tomamos f12(ST ) def= f1(ST ) + f2(ST ), entonces

W+12(S, t) ≤ W+

1 (S, t) + W+2 (S, t) ,

W−12(S, t) ≥ W−

1 (S, t) + W−2 (S, t) .

• Para el caso de derivados con “convexidad fija”, por ejemplo calls y puts, W+

y W− corresponden a los valores de Black-Scholes ordinarios tomando comovolatilidad σmax y σmin, respectivamente.

• En el caso de convexidad mixta, por ejemplo en call spreads, eso no es ası. Dehecho la valoracion usando el supremo (sobre σ) de las valoraciones por Black-Scholes para cualquier volatilidad constante σ con σmin ≤ σ ≤ σmax se quedacorta. Ver los graficos en Avellaneda, Levy y Paras (1995).

• Si la σt que el mercado sigue es distinta de la σ+t , entonces la cartera autofinan-

ciada (para esa σt) que en el instante inicial vale W+(S0, 0) y cuya componenteen el activo viene dada por φt = ∂SW+(St, t) tendra un valor final superior af(ST ). En ese caso se podrıa pensar en algun sistema de “cash-back”.

• Existe un modelo discreto usando arboles trinomiales (procedente de metodosnumericos para la EDP).

• Una modificacion posible al modelo anterior consiste en permitir cubrir el “riesgode volatilidad” usando el mercado de opciones sobre el subyacente.

Pero eso. . . ¡ es otra historia !

Page 156: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

148 Antonio Sanchez Calle

Referencias

[1] Avellaneda, M., Levy, A. y Paras A., Pricing and hedging derivative securitiesin markets with uncertain volatilities, Applied Math. Finance 2, 73-88 (1995).

[2] Avellaneda, M. y Paras, A., Managing the volatility risk of portfolios of derivativesecurities: the Lagrangian Uncertain Volatility model, Applied Math. Finance 3,21-52 (1996).

[3] Hull, J. y White, A., The pricing of options on assets with stochastic volatilities,J. of Finance 42, 281-300 (1987).

[4] Lyons, T., Uncertain volatility and the risk-free synthesis of derivatives, AppliedMath. Finance 2, 117-133 (1995).

[5] Zhu, Y., Avellaneda, M., A risk-neutral stochastic volatility model, InternationalJournal of Theoretical and Applied Finance 1, 289-314, (1998).

Antonio Sanchez CalleDepartamento de Matematicas

Universidad Autonoma de MadridCampus de Cantoblanco, s/n

28049-Madride-mail: [email protected]

Page 157: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Short-Term Options with

Stochastic Volatility: Estimation

and Empirical Performance

Gabriele Fiorentini, Angel Leon and Gonzalo Rubio1

Abstract

This paper examines the stochastic volatility model suggested by Heston(1993). We employ a time-series approach to estimate the model and we discussthe potential effects of time-varying skewness and kurtosis on the performance ofthe model. In particular, it is found that the model tends to overprice out-of-the-money calls and underprice in-the-money calls. It is also found that the dailyvolatility risk premium presents a quite volatile behavior over time; however,our evidence suggests that the volatility risk premium has a negligible impacton the pricing performance of Heston’s model2.

1 Introduction

Given the Black-Scholes (1973) (BS henceforth) assumptions, all option prices on thesame underlying security with the same expiration date but with different exerciseprices should have the same implied volatility. However, the well known smiles andsmirks suggest that the BS formula exhibits systematic biases in pricing options.There have been various attempts to deal with this apparent failure of the BS valuationmodel. In principle, as explained by Das and Sundaram (1999), the existence of thesmile effect may be attributed to the presence of excess kurtosis in the conditionalreturn distributions of the underlying assets. It is clear that excess kurtosis makes

1Gabriele Fiorentini es Profesor Titular del Departamento de Fundamentos de Analisis Economicoen la Universidad de Alicante. Angel Leon es Profesor Titular del Departamento de EconomıaFinanciera de la Universidad de Alicante. Gonzalo Rubio es Catedratico de Fundamentos del AnalisisEconomico de la Universidad del Paıs Vasco. Esta charla se impartio en la sesion del SeminarioMEFF-UAM de octubre de 1998.

2We thank Stewart Mayhew, Eduardo Schwartz, Enrique Sentana, Ignacio Pena, Gregorio Serna,Rafael Salinas, Jose Luis Fernandez, Eliseo Navarro, Alejandro Balbas, Rafael Santamarıa and twoanonymous referees for their helpful comments and useful discussions. Earlier versions of this paperwere presented at the European Finance Association in Helsinki (1999), EFM Association Conferencein Paris (1999), Universidad Carlos III, II Foro Finanzas-Segovia, and MEFF Institute for DerivativeAssets. Gabriele Fiorentini, Angel Leon and Gonzalo Rubio acknowledge the financial supportprovided by Direccion Interministerial Cientıfica y Tecnica (DGICYT) grants PB96-0339, PB98-0979 and PB97-0621 respectively. The three authors have benefited from the research grant receivedfrom the Instituto Valenciano de Investigaciones Economicas (IVIE). The contents of this paper arethe sole responsibility of the authors.

Page 158: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

150 Fiorentini, Leon and Rubio

extreme observations more likely than in the BS case. This increases the value of out-of-the-money and in-the-money options relative to at-the-money options, creating thesmile. Meanwhile, if the pattern shown by data contains a clear asymmetry in theshape of the smile, i.e. a smirk pattern, then this may be due to the presence ofskewness in the distribution which has the effect of accentuating just one side of thesmile.

Given this evidence, extensions to the BS model that exhibit excess kurtosis andskewness have been proposed in recent years along two lines of research: Jump-diffusion models under a Poisson-driven jump process, and the stochastic volatilityframework are the key developments in the theoretical option pricing literature3.

A recent and important attempt to summarize alternative option pricing modelsis carried out by Bakshi, Cao and Chen (1997). They are able to derive a closed-formjump-diffusion model that includes previously studied models. It allows not onlystochastic volatility, but also stochastic interest rates and stochastic jumps. More-over, following Bates (1996), they use a cross-sectional framework to implement theirmodel, and analyze the performance and hedging behavior of the nested option pric-ing models. Das and Sundaram (1999) also examine the extent to which these modelsare able to capture the observed anomalies discussed in literature. Bakshi, Cao andChen (1997) find that both stochastic volatility and jumps are important for pric-ing. However, they suggest that recognizing stochastic volatility alone produces thebest hedging performance. On the other hand, Das and Sundaram (1999) arguethat, generally speaking, stochastic volatility models yield better pricing results thanjumps, although none of them is able to explain all patterns of kurtosis, skewness andvolatility smiles found in empirical pricing literature.

Stochastic volatility option valuation start with the bivariate diffusion processesof Hull and White (1987), Scott (1987) and Wiggins (1987). In these models thevolatility risk premium is not rewarded and thus removed from the valuation equation.Further, the correlation between the volatility and the stock return is zero in Hulland White (1987) and Scott (1987). Heston (1993) provides a closed-form solutionfor a European call option without imposing the restrictions of zero correlation andzero price of volatility risk by using Fourier inversion methods.

The key objective of the paper is to analyze the empirical performance of thestochastic volatility model proposed by Heston (1993) relative to the BS frameworkfor options on the Spanish IBEX-35 stock exchange index. At the same time, theempirical and theoretical behavior of the parameters characterizing the diffusion pro-cess assumed for the instantaneous variance is studied. Their behavior is discussed

3Alternatively, Corrado and Su (1996), and Backus, Foresi, Li and Wu (1997) adapt a Gram-Charlier series expansion of the normal density function to obtain skewness and kurtosis adjustmentterms for the BS formula. Eberlein, Keller and Prause (1998) introduce the hyperbolic density toaccount for excess kurtosis and skewness, and they are even able to obtain a closed option pricingformula under this assumption. Rosenberg (1998) suggests the so called flexible density functionmethodology to estimate risk-neutral densities implied by option pricing data.

Page 159: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Short-Term Options with Stochastic Volatility 151

relative to the appropriate skewness and kurtosis underlying in Heston’s model. Thisprovides us with insights clarifying the reasons behind the poor performance foundfor the stochastic volatility option pricing model.

Since the Spanish option market shows a very limited number of exercise pricestraded simultaneously and where liquidity is also less generalized than in the USmarket, then there are serious consequences for the empirical implementation of thecross-sectional estimation of implied parameters proposed by Bates (1996) and Bakshi,Cao and Chen (1997), that is; there are just not enough prices available in order toestimate jointly all parameters embedded in Heston’s model. This forces us to turn toestimate the parameters in two separate steps. First, we estimate the parameters ofthe stochastic volatility, which are required inputs of Heston’s model, by employing theindirect inference estimation technique of Gourieroux, Monfort and Renault (1993)on a time-series of the underlying hourly return. Second, the price of the volatilityrisk and instantaneous variance are backed out by minimizing the sum of squaredpricing errors between the option model and market prices as in Bakshi, Cao andChen (1997). Besides this practical argument, it should also be pointed out that thecross-sectional approach may easily ignore relevant information in the original seriesthat may not be embedded in the option prices

The remainder of the paper is organized as follows: Section 2 contains a briefsummary of the Spanish options market features and the options data. The the-oretical model, i.e. Heston’s model, employed in this paper appears in Section 3.The empirical results regarding the time series estimation of the stochastic volatilityparameters, the theoretical discussion on the relationship between these parametersand the appropriate skewness and kurtosis in Heston’s framework appears in Section4. The implied volatility graphs of the daily implied variance, the estimation andtesting of the volatility risk premium through option prices is shown in Section 5. InSection 6, the out-of-sample pricing performance is carried out. Finally, in Section 7,we conclude with a summary.

2 The Spanish IBEX-35 Index Options

2.1 Market description

The Spanish IBEX-35 index is a value-weighted index comprising the 35 most liquidSpanish stocks traded in the continuous auction market system. The official derivativemarket for risky assets, which is known as MEFF, trades a futures contract on theIBEX-35, the equivalent option contract for calls and puts, and individual optioncontracts for blue-chip stocks. Trading in the derivative market started in 1992. Themarket has experienced tremendous growth from the very beginning. Relative tothe volume traded in the Spanish continuous market, trading in MEFF represented40% of the regular continuous market in 1992, 156% in 1994, and 170% in 1995. Thenumber of all traded contracts in MEFF relative to the contracts traded in the CBOEreached 20% in 1995.

Page 160: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

152 Fiorentini, Leon and Rubio

The IBEX-35 option contract is a cash settled European option with trading duringthe three nearest consecutive months and the other three months of the March-June-September-December cycle. The expiration day is the third Friday of the contractmonth. Trading occurs from 10:30 to 17:15. During the sample period covered bythis research, the contract size is 100 Spanish pesetas times the IBEX-35 index, andprices are quoted in full points, with a minimum price change of one index point or100 pesetas4 . The exercise prices are given in 50 index point intervals.

It is important to point out that liquidity is concentrated in the nearest expirationcontract. Thus, during 1995 and 1996 almost 90% of crossing transactions occurredin this type of contracts. Finally, it should be noticed that options and futurescontracts are directly associated. The futures contract has exactly the same contractspecifications as the IBEX-35 options. This will allow us to employ the futures pricerather than the spot price in our empirical exercise. In fact, this is what is usuallydone by practitioners.

2.2 The data

For this paper, our database is comprised of all call options on the IBEX-35 indextraded daily on MEFF during the period January 3, 1996 through April 30, 1996.Given the concentration in liquidity, our daily set of observations includes only callswith the nearest expiration day. Moreover, we eliminate all transactions taking placeduring the last week before expiration (to avoid the expiration-related price effects).

As usual in this type of research, our primary concern is the use of simultaneousprices for the options and the underlying security. The data, which are based on allreported transactions during each day throughout the sample period, do not allowus to observe simultaneously enough options with the same time-to-expiration onexactly the same underlying security price but with different exercise prices. In orderto avoid large variations in the underlying security price, we restrict our attention tothe 45-minute window from 16:00 to 16:45. It turns out that, on average and duringour sample period, almost 25% of crossing transactions occur during this interval.Moreover, care was also taken to eliminate the potential problems with artificialtrading that are most likely to occur at the end of the day. Thus, all trades after 16:45were eliminated so that we avoid data which may reflect trades to influence marketmaker margin requirements. At the same time, using data from the same period eachday avoids the possibility of intraday effects in the IBEX-35 index options market.

These exclusionary criteria yield a final daily sample of 768 observations. Table1 describes the sample properties of the call option prices employed in this work.Average prices, average relative bid-ask spread and the number of available calls arereported for each moneyness category. Moneyness is defined as the ratio of the exerciseprice to the futures price. A call option is said to be deep out-of-the-money if the ratio

4This has recently been changed to 1,000 pesetas.

Page 161: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Short-Term Options with Stochastic Volatility 153

K/F belongs to the interval (1.03, 1.08); out-of-the-money if 1.03 > K/F ≥ 1.01; at-the-money when 1.01 > K/F ≥ 0.99; in-the-money when 0.99 > K/F ≥ 0.97; anddeep-in-the-money if 0.97 > K/F ≥ 0.90. As we already discussed, there are 768call option observations, with OTM, ATM and ITM options respectively representing51% , 32% and 17% . The average call price ranges from 12.88 pesetas for deep OTMoptions to 185.42 pesetas for deep ITM options. The average relative bid-ask spreadgoes exactly in the opposite direction to the average price. In particular, it rangesfrom 0.39 for deep OTM options to 0.10 for deep ITM calls.

The implied volatility for each of our 768 options is estimated next. Note thatwe take as the underlying asset the average of the bid and ask price quotation givenfor each futures contract associated with each option during the 45-minute interval5.Recall that we are allowed to use futures prices given that the expiration day ofthe futures and options contracts systematically coincides during the expiration datecycle. Moreover, note that dividends are already taken into account by the futuresprice. To proxy for riskless interest rates, we use the daily series of annualized repoT-bill rates with either one week, two weeks or three weeks to maturity. One ofthese three interest rates will be employed depending upon how close the option is tothe expiration day. Finally, as discussed by French (1984), volatility appears to bea phenomenon that is basically related to trading days. However, interest rates arepaid by the calendar day. Thus, in order to estimate the implied volatility of eachoption in our sample, we employ Black’s (1976) option pricing formula adjusted bytwo time measures to reflect both trading days and calendar days until expiration.These implied volatilities will be used later as the basis for comparison with Heston’simplied instantaneous volatilities.

3 Heston’s stochastic volatility option pricing model

Heston (1993) obtains a closed-form solution for the price of a European call optionon an asset with stochastic volatility. Heston works with Fourier transforms of con-ditional probabilities that the option expires in-the-money. The characterization ofthese probabilities is achieved through their characteristic function.

The stochastic volatility model proposed by Heston generalizes Geometric Brown-ian Motion by allowing the volatility of the return process itself to evolve stochasticallyover time in a square root mean-reverting fashion:

dSt = µSt dt +√

Vt St dW1t ,

dVt = κ (θ − Vt) dt + σ√

Vt dW2t ,

dW1t dW2t = ρ dt ,

(1)

5It might be that lack of liquidity in the futures market is responsible for the lack of variationin the price of the underlying asset during the 45-minute window. However, this is not the case. Infact, the futures market is at least as liquid as the spot market in terms of comparable measures oftrading volume.

Page 162: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

154 Fiorentini, Leon and Rubio

where µ is the instantaneous expected rate of return of the underlying asset, Vt isthe instantaneous stochastic variance, θ is the long-term mean of the variance, κgoverns the rate at which the variance converges to this mean, and σ represents thevolatility of the variance process. The parameters of the variance process, θ, κ and σare all strictly positive constants. W1t and W2t are each a standard Brownian motionallowed to be instantaneously correlated. Thus increases (decreases) in volatility couldbe related to the level of the underlying asset.

The risk-neutral probability measure incorporates the market price of volatility,denoted as λ, to distinguish the objective probability measure from the risk-neutralone. The volatility risk premium is assumed to be proportional to the instantaneousvariance, λVt, and its sign arises from the (sign of) correlation between the Brownianprocesses assumed for the instantaneous variance and the (aggregate) consumption.The model is given by:

dSt = r St dt +√

Vt St dW ∗1t ,

dVt = κ∗ (θ∗ − Vt) dt + σ√

Vt dW ∗2t ,

dW ∗1t dW ∗

2t = ρ dt ,

(2)

where κ∗ = κ + λ and θ∗ = κ θ / (κ + λ).

Let c (S, υ, t) be the value of an European call option where S ≡ St and υ ≡ Vt toabbreviate. Heston’s formula is given by:

c (S, υ, t) = St P1 − K e−r (T−t) P2 , (3)

where P1 and P2 are two risk-neutralized probabilities having the same interpretationas in the standard BS expression.

In the application below, we use future options so that the actual version of theformula we employ is given by:

c (F, υ, t) = e−r (T−t) (Ft P1 − K P2) , (4)

where F is the future price on the underlying spot price, and

Pj (x, υ, T − t ; ln [K]) = Prob(xT ≥ ln [K]

∣∣∣xt = x, υt = υ)

, (5)

where, x ≡ ln [Ft], j = 1 or 2 (the probability of the event x ≥ ln [K] depends onwhether we chose the futures for j = 1, or the riskless rate for j = 2), and Pj is,therefore, the conditional probability that the option expires in-the-money. Theseprobabilities depend on the vector of parameters (κ, θ, λ, σ, ρ) given by the processassumed by Heston under the original probability. It is important to note that theexpressions for these probabilities are slightly different from the original values givenby Heston (1993) since we are using futures. The actual formulae employed in thispaper are provided in Appendix A.

Page 163: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Short-Term Options with Stochastic Volatility 155

In the empirical implementation of the model, we could always go to option pricesand implicitly infer the parameters under the risk neutral probabilities. Given thelimited number of daily option prices available to the 45-minute window from 16:00to 16:45, the cross-sectional approach is just not possible if we wish to estimateall the parameters implied in Heston’s model for calculating daily call prices. Ourestimation approach consists of a two step procedure. First, we employ the originalasset data (a time series of the spot IBEX-35 return) to estimate the parameters fromthe true process, i.e. equation (1), by adjusting the discretization biases throughoutthe indirect inference estimation methodology which is discussed in the followingsection. Second, we estimate the volatility risk premium and daily instantaneousvariance from option prices. Definitively, this methodology needs two different sourcesof data for estimating the parameters, both time series data and cross section data.

4 Indirect estimation

4.1 Parameter estimation of the stochastic variance process

To estimate the process under the original probability measure given by (1), we have toassume that available data are discrete-time observations of a continuous time process.If we apply regular econometric methods to discrete-time approximations, we wouldhave a serious estimation -discretization- bias in our results. In order to avoid thisbias, we employ the indirect estimation proposed by Gourieroux, Monfort and Renault(1993). The procedure consists of two steps. First of all, by maximum likelihoodtechniques, we estimate an appropiate auxiliary model. Secondly, the estimates ofthe auxiliary model are compared with estimators based on simulations of the pathof the continuous time process given by (1). More specifically, we have to introducea discrete time analogue of (1) corresponding to a small time unit τ , such that 1/τis an integer. This is done by Euler approximation. Then for a given value of theparameters, we simulate the process, and obtain simulated values for the observationdates by merely selecting the values corresponding to integer indexes. This yields anaccurate simulation of V as long as τ is sufficiently small. In Appendix B, we preciselydescribe the steps necessary for the indirect estimation procedure.

With respect to the empirical results, we first estimate the in-sample period fromJanuary 2, 1994 to January 2, 1996 with continuously compounded hourly returnsfrom the Spanish IBEX-35 index. The calculation of returns is based on the lastrecorded logarithmic index levels over consecutive hourly intervals. It is well knownthat the first hourly return incorporates adjustments to the information which hasarrived overnight, and therefore presents a higher average return variability than anyother hourly return. This basically implies that this first return is not an hourlyreturn, and we consequently delete it from the estimation. Our final sample lengthconsists of 2,450 hourly observations.

The results for the in-sample period are reported in Table 2. We consider fouralternative combinations of simulations and frequencies and the Euler discretization

Page 164: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

156 Fiorentini, Leon and Rubio

specification6 . The results contained in the first column are obtained simulating theprocess once (N = 1), and 2, 450×10 data points since the frequency used is equal toτ = 1/10. In the second column of Table 1, we simulate (η1, η2) 10 times (N = 10),and we generate 10 series of size 2, 450×10 given that the frequency is again τ = 1/10.Hence, our final estimates are based on the following minimization:

minΩ

(Ψ − 1

10

10∑i=1

Ψi

).

In the third column, the process is simulated once (N = 1), but the calibration of theNagarch (1,1) model is performed with more data. In particular, the length of thevector used in the estimation is 2, 450× 10. Given that the frequency is τ = 1/10, wehave a total of 2, 450 × 10 × 10 data points. Note, of course, that once we go backto the Nagarch (1,1) model using simulated data of equal frequency as the real data,we have 2, 450 × 10 observations. This is the methodology employed in the rollingprocedure for the out-of-sample estimation which will be used in testing Heston’soption pricing model under Euler discretization. Finally, the results reported in thefourth column simulate the process once (N = 1), but the frequency is established atτ = 1/50.

The estimations contained in Table 2 suggest that, independently of the alternativeprocedure employed, the results tend to be quite similar. There seems to be someminor difference in the estimator of the volatility of the variance process, and theestimator of the correlation coefficient between the shocks when we use the frequencyat τ = 1/50. In any case, independently of the procedure employed, the estimate of thecorrelation coefficient is, surprisingly, positive and close to zero. Given the asymmetrycoefficient found in the Nagarch (1,1) structure, we would have expected a negativecorrelation coefficient to reflect the asymmetry generally observed in literature toreflect that agents seem to react more to bad news than to good news7.

For the out-of-sample estimation, the same process is estimated 80 times usingsystematically 2,450 past observations. This rolling procedure of the indirect infer-ence is necessary to yield estimates of the parameters involved in Heston’s expressionfor each day between January 3, 1996 and April 30, 1996. Thus, the daily changingestimates of these parameters are used as inputs in Heston’s option pricing formula.Figure 1 presents the evolution of the parameters associated with the stochastic vari-ance process throughout the out-of-sample period. As we can observe from the figure,

6Nowman (1997) discretization was also carried out but the results were similar to Euler dis-cretization.

7Duan (1997) shows that both the Glosten, Jagannathan and Runkle (1993) -GJR (1,1)- andNagarch (1,1) models converge to the same limiting diffusion process for the stochastic volatility,i.e. the mean-reverting Geometric Brownian motion. Leon and Sentana (1998) shows that therelationship between the parameters of this Brownian process and the ones corresponding to theNagarch (1,1) model is exactly given by: ρ = γ

√2

/√1 + 2γ2. Then, it must be the case that

sign(ρ) = sign(γ). Of course, this limiting result does not hold for the square-root mean revertingprocess.

Page 165: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Short-Term Options with Stochastic Volatility 157

the long-term volatility,√

θ, the rate of convergence of the instantaneous variance tothe long-term average, κ, and the volatility of the variance process, σ, remain quitestable over the out-of-sample period. However, the coefficient of correlation betweenthe shocks for the stock and the variance, ρ, increases continuously. As before, itis interesting to observe that the correlation remains positive throughout the out-of-sample period.

4.2 Skewness, kurtosis and the parameters of the stochasticvolatility process

The time-varying behavior of the correlation coefficient found above may have a se-rious impact on the capacity of Heston’s model to explain option pricing data. Itsuggests that, in this case, we may have a similar problem than the one we havewhen assuming constant volatility in the BS context. If correlation between pricesand volatility changes continuously over time, skewness of the underlying asset mayalso exhibit time-varying behavior. This is clearly a potential and relevant problemfor models with stochastic volatility.

On the other hand, according to the estimates shown in Figure 1, it seems thatthe behavior of the volatility of volatility is rather stable over time. This suggeststhat accounting for changing kurtosis of the underlying asset may not be as crucialas taking into consideration changing skewness.

Das and Sundaram (1999) obtain closed-form expressions for conditional and un-conditional skewness and kurtosis under Heston’s stochastic volatility model. Theirexpressions, for a given frequency of ∆t = 1 can be seen in Appendix C.

Given our rolling estimates of ρ and σ from January 1996 to April 1996, we candaily estimate (C1) and (C2) from Appendix C, so that we may observe how thecharacteristics of the distribution of the underlying asset —skewness and kurtosis—change with both the correlation coefficient and the volatility of volatility.

Figure 2 depicts the conditional and unconditional skewness over the sample pe-riod. As we can easily observe, their behavior closely follows the pattern of thecorrelation coefficient of Figure 1. As expected, skewness mainly arises from the cor-relation between changing prices and stochastic volatility of the underlying asset. Theproblem is that, of course, Heston’s model assumes a constant unconditional skewnessover time8.

In Leon and Rubio (2000), it is shown that, all else being constant, the relationshipbetween skewness and the correlation coefficient is positive; i.e. ∂(SKEW )

/∂ρ >

0 for both the conditional and unconditional cases. This explains the behavior ofskewness in Figure 2. Therefore, if (as is in fact the case) the correlation coefficient

8Given the similarity between the behavior of unconditional and conditional skewness, the impactof the instantaneous stochastic variance on the conditional skewness must be negligible relative tothe effect of the correlation coefficient.

Page 166: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

158 Fiorentini, Leon and Rubio

tends to be rather unstable, an option pricing model with a stochastic differentialequation for correlation would be welcomed9. Given this evidence, we should notexpect to find a good performance of the stochastic volatility model when we compareobserved market prices with theoretical prices. We will come back to this issue laterin the paper.

Figure 3 contains the same evidence for the kurtosis case. In principle, the impactof time-varying kurtosis on the misspecification of Heston’s model seems to be muchless severe than the influence of the correlation coefficient. Its pattern over time ismuch more stable than ρ. This is related to the behavior of the volatility of volatility,σ, in Figure 1. This is the parameter that allows for kurtosis in the stochastic volatilityoption pricing model, and it does not seem to change much over time. Once again,in Leon and Rubio (2000), it is shown that the relationship between kurtosis and σis positive, i.e, ∂(KURT )

/∂σ > 0, for both the conditional and unconditional cases.

As a summary, time-varying skewness may be the key issue to analyze if we wantto understand the failure of the tests we report below. Its consequences may be muchmore serious than the potential effects of changing kurtosis. However, this point willbe clarified in Section 6.

5 Estimating the implied variance and the volatilityrisk premium

Volatilities from the BS model and both the instantaneous variance and the volatilityrisk premium from Heston model are estimated every day from option prices, specif-ically all available call options transacted over the 45-minute interval from 16:00 to16:45 during the period January 3, 1996 to April 30, 1996.

5.1 Estimation procedure

Note that, once we have estimated for each day the parameters of the variance process,κ, θ, σ andρ, using the rolling indirect inference procedure, we still need to estimatethe volatility risk premium, λ, and the instantaneous variance, Vt, before we canactually price a given call option under Heston’s model. Therefore, it seems reasonableto expect that we may use cross-sectional data to implicitly infer the parameters thatminimize the sum of squared errors (SSE) in a given day of the sample.

Given the set of parameters of the indirect estimation procedure obtained for aparticular day t in the sample, Ωt =

(κt, θt, σt, ρt

), and for each option i (i = 1, . . . , n)

and each day t, we define the pricing error as:

eit

(Vt, λ ; Ωt

)= cit (Ki) − cit (Ki) , (6)

9See Nandi (1998) for an exhaustive discussion of the importance of the correlation coefficient

Page 167: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Short-Term Options with Stochastic Volatility 159

where cit (Ki) is the theoretical price of call i in day t, and cit (Ki) is the correspondingobserved market price. We then want to find the instantaneous variance, Vt, and therisk premium parameter, λ, to solve:

SSEt ≡ minVt,λ

n∑i=1

[eit

(Vt, λ ; Ωt

)]2

. (7)

Direct inspection of the quadratic form in (7) shows that it is highly valley shapedand, therefore, it is extremely flat along a direction corresponding to a nontrivialcombination of λ and Vt. As a consequence, derivative based minimization methodsare expected to perform poorly since the numerically computed gradient is very un-stable in a neighbourhood of a minimum. This is confirmed by some experiments thatwe performed with the Newton-Raphson method. In order to avoid the above prob-lem, a derivative-free minimization algorithm is called for. Since the function in (7)only depends on two parameters, the downhill simplex method of Nelder and Mead(1965) seems to be a natural candidate. We have robustified the method by choos-ing randomly several starting triplets and in those cases of convergence to differentlocal minima their minimum was selected as the global solution. So, we obtain dailyestimates of both λ and Vt from January 3, 1996 to April 30, 1996; i.e., a sample of80 days. Finally, a series for daily implied volatilities estimated in the correspondingBS’s versions of (6) and (7) is also obtained.

5.2 The volatility risk premium

In Figure 4, we can see that the estimated daily values of λ further suggest thatthe volatility risk premium varies over time in the IBEX-35 futures option market.Notice that this time-varying behavior of volatility risk premium is not consistentwith Heston’s model since λ must be a constant value as we can see in equation(2). The estimated values of λ ranges from −0.252 to 0.333. The mean (median)for the time-series of λ is −0.021 (−0.027) and the standard deviation is 0.113. Theskewness and the excess kurtosis are 0.527 and 0.747 respectively. The p-value ofthe Jarque-Bera test (normality test) for the time-series of λ is 0.085, so the normaldistribution is rejected at the 10% significance level. The null hypothesis of λ = 0was tested under three different methods. First, assuming that λ values were drawnfrom a normal distribution, a Student t test was performed, so the Student t ratio was−1.58 (p-value= 0.1183). Second, a nonparametric test for the population median ofλ values, specifically the sign test10, was performed whose p-value was 0.1544.

Third, we also test H0 : λ = 0 by obtaining accurate confidence intervals forλ based on the “bootstrap-t“ confidence interval (see Efron and Tibshirani, 1993).By selecting 10,000 independent bootstrap samples, each consisting of 80 data values

10Since the empirical distribution is skewed, the sign test is more appropriate than the popular non-parametric Wilcoxon signed-rank test because the last one assumes that the underlying distributionis symmetric (see Rohatgi, 1984).

Page 168: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

160 Fiorentini, Leon and Rubio

drawn with replacement from the series of λ, then the 90% , 95% and 99% bootstrap-tconfidence intervals for the mean are respectively: [−0.0426; 0.0021], [−0.0467; 0.007]and [−0.0551; 0.0175]. Summing up, we conclude that the evidence does not supportrejection of the null hypothesis, i.e. the volatility risk premium is zero. The findingof a zero volatility risk premium for Ibex-35 index options is opposite to those ofGuo (1998), Sarwar and Krehbiel (2000) using currency options, Lin, Strong and Xu(1999) using FTSE 100 index options. Nevertheless, our result is consistent withBakshi, Cao and Chen (1997) who find that the maximum likelihood estimates of κand θ are statistically indistinguisable from their respective S& P 500 option-impliedcounterparts, i.e. κ∗ and θ∗.

Since the λ parameter in Heston’s model is a constant value and given that wecan impose that λ = 0 for the volatility risk premium embedded in Heston optionprices on the Spanish Ibex-35 index, according to the conclusions from the above tests,then we can solve equations (6) and (7) and obtain a daily estimate of instantaneousvariance from January 3, 1996 to April 30, 1996. We also repeat the above procedurefor two alternative λ values, specifically λ = 0.50 and λ = −0.50, in order to analyzethe sensibility of the estimated instantaneous variance under different magnitudes ofλ which are in accordance with our sample of λ values. Definitively, in Section 6 wewill test the out-of-sample pricing performance for Heston’s model under the threecandidate values of λ and compare each with BS’s performance.

5.3 Implied volatility graphs

Figure 5 contains the evolution for several series of implied volatilities from January3, 1996 to April 30, 1996 for each version of Heston’s model, i.e. for λ = −0.5, 0, 0.5and for a different daily λ value, and also, of course, for the BS formula. It canbe easily appreciated that Heston’s volatility, independently of the volatility riskpremium assumed, tends to be higher than BS’s volatility. A priori, this may haveserious implications for pricing. Also, note that the four implied volatility series underHeston’s model are very similar and for λ = −0.5, 0, 0.5, in general, the larger therequired volatility risk premium imposed, the (very slightly) larger the instantaneousvolatility.

To obtain a general picture of the potential misspecifications of the option pricingmodels employed in this research, we report the average pattern of implied volatilitiesacross degree of moneyness. The results are shown in Figure 6.

In the BS case, we back out the implied volatility of each call option and foreach day of the above period using the procedure discussed in sub-section 2.2. Then,the equally-weighted implied volatility for each moneyness category and each day inthe sample period is calculated. There is a U-shaped pattern with a hump in themiddle in Figure 6. This suggests that the BS model tends to underprice deep OTMand deep ITM calls. This is the typical smile pattern of the Spanish option marketanalized by Pena, Rubio and Serna (1999). Any reasonable alternative model to BS

Page 169: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Short-Term Options with Stochastic Volatility 161

must be able to properly price deep OTM and deep ITM call options. Of course,Heston’s stochastic volatility model, given by equations (4) and (5), is a potentialand particularly interesting candidate.

For λ = −0.5, 0, 0.5, we may analyze the pattern of implied volatilities acrossalternative degrees of moneyness. The evidence reported in this regard in Figure 6suggests a rather asymmetric smile in Heston’s model independently of the volatilityrisk premium imposed. It seems that Heston’s approach tends to underprice (deep)ITM calls and overprice (deep) OTM calls.

We now turn to formal tests of the alternative option pricing specifications con-sidered in this paper.

6 Out-of-sample pricing performance

In order to test the out-of-sample pricing performance for each model analyzed inthis work, we employ two years of rolling data to estimate, by indirect inference, theparameters of the stochastic variance process assumed in (1). Given these estimates,and a chosen volatility risk premium, λ, we use all call options available in our 45-minute window to compute for each day from January 2, 1996 to April 29, 1996the instantaneous variance that minimized the squared error between the theoreticalvalue and the market price of the call options according to (6) and (7). We thencompute the theoretical price of each option using the previous day’s instantaneousvariance and the corresponding parameters of the stochastic volatility process. Forthe BS case, the previous day’s implied volatility that minimized the squared errorbetween the theoretical value and the market price of the options is used to obtainthe theoretical BS price of each option in the sample.

In this way, we have 768 pricing errors for each of the calls available from January3, 1996 to April 30, 1996, and for each of the models analyzed. These pricing errorsare the basis for our analysis. Table 3 reports two measures of performance for thealternative model specifications. Panel A contains the absolute pricing error whichis the sample average of the absolute difference between the model price and themarket price for each call in the testing sample period. This statistic is reported foreach moneyness category and for all calls in the sample. In Panel B, the reportedpercentage pricing error is the sample average of the theoretical price minus themarket price, divided by the market price. Again, this statistic is calculated for eachmoneyness category and for all calls in the sample.

Overall, in absolute terms, Heston’s option pricing model tends to value slightlybetter than BS. The absolute pricing error over all calls is approximately 2.8 pesetasfor Heston’s model independently of the volatility risk premium assumed, and 3.2pesetas for the BS model. It is quite important to notice that the level of the volatilityrisk premium does not seem to have any influence on the performance of Heston’sstochastic volatility model. The pricing errors obtained under alternative λ values

Page 170: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

162 Fiorentini, Leon and Rubio

are practically identical. There might be some evidence in favor of a positive riskpremium, but we can safely conclude that option prices do not seem to be sensitiveto the volatility risk premium. This is an important empirical result. Kapadia (1998)shows that the expected value of the delta-hedged gain, under a stochastic volatilitymodel where volatility risk is not priced, is equal to zero. This is exactly the sameresult that holds under BS. Consequently, if we may assume that volatility risk is notpriced, the analysis of the dynamic hedging performance of both models is clearlyfacilitated11.

It should be pointed out that the overall slightly better performance of Heston’smodel is not maintained throughout all moneyness categories. In particular, Heston’smodel tends to value ATM and ITM calls better than BS. However, the oppositeresult holds for OTM calls. This is also the case when we analyze the percentagepricing error in Panel B. Heston’s model, regardless of the volatility risk premiumimposed, tends to overvalue OTM calls and, at the same time, the model undervaluesITM calls. However, the percentage pricing for ATM calls is practically zero. In fact,ATM calls are clearly more consistent with a stochastic volatility model than withthe well known lognormal assumption. BS, on the other hand, tends to undervaluedeep OTM and deep ITM calls. This is consistent with a U-shaped volatility smile.In Heston’s case, the evidence points towards a sneer rather than a regular smile.

6.1 The statistical significance of the out-of-sample perfor-mance

Overall, at least over the sample period studied and regardless of λ, Heston’s modelseems to overvalue, while BS tends to undervalue call options. Unfortunately, how-ever, the simple statistics reported above do not help in making inferences in terms ofthe statistical significance of improvement when we contrast one model versus another.

In this paper, the statistical significance of performance for out-of-sample pricingerrors is assessed by analyzing the proportion of theoretical prices lying outside theircorresponding bid-ask spread boundaries12. The following Z-statistic for the differencebetween two proportions is employed in the tests. The statistic is given by:

Z =p1 − p2√

p1 (1−p1)n1

+ p2 (1−p2)n2

,

where p1 is always the proportion of BS prices outside the bid-ask boundaries, andp2 is the equivalent proportion for alternative Heston’s specifications. n1 and n2

are sample sizes corresponding to these proportions. The statistic is asymptoticallydistributed as a standardized normal variable.

11On the other hand, if volatility risk is priced, the average delta-hedged gain is proportional to themagnitude and sign of the volatility risk premium. Comparisons of the dynamic hedging performancebetween Heston’s model and BS may be much more complicated than the analysis carried out byBakshi, Cao, and Chen (1997).

12See Corrado and Su (1996).

Page 171: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Short-Term Options with Stochastic Volatility 163

The empirical results are reported in Table 4. Given that we are also interestedin knowing whether a given theoretical valuation model undervalues or overvaluesmarket prices, the Z-statistic is also calculated to obtain the proportion for which thetheoretical model yields a price below the bid quote, and the proportion for which themodel gives a price above the ask quote. If a theoretical model tends to undervaluemarket prices, it would yield a higher proportion of prices below the bid quote. If, onthe other hand, the model tends to overvalue market prices, it would have a higherproportion of prices above the ask quote.

When we consider all call options together, the p-value for statistiscal improvementof Heston’s model over the BS formula is equal to 0.068. The proportion of BS priceslying outside the bid-ask boundaries is 48% , while the proportion of Heston’s model,regardless of the volatility risk premium, is about 42% . As we see, there is a slightimprovement, but we might interpret the results as rather disappointing. It is notclear at all that, given the costs of implementation, Heston’s approach is worthwhilein terms of practical applications.

It is also the case that 35% of BS prices are below the bid quote. Given thatHeston’s model yields approximately 18% of prices below the bid, we can conclude thatBS, on average, significantly undervalues market prices relative to Heston’s approach.At the same time, Heston’s prices are 24% of total observations above the ask quote.We can also conclude that Heston’s model tends to significantly overvalue marketprices relative to the BS formula. Thus, mispricing associated with BS is basicallyrelated to the tendency of the model to yield prices below market values. However,Heston’s mispricing is a consequence of the model’s tendency to offer prices abovetheir corresponding market values.

When we classify all call options by moneyness, similar conclusions are obtained. Acall option is said to be OTM if K/F > 1, and a call is classified as ITM when K/F <1. In general, within a given category of moneyness, neither model is statisticallysuperior to the other. However, once again, BS mispricing comes from the tendencyof the model to undervalue either OTM or ITM calls relative to Heston’s model(and relative to market prices). The opposite is true for Heston’s formula relative toBS (and market prices). It should be pointed out that in the latter case, the mainproblem arises when we value OTM with Heston’s formula. There seems to be astrong tendency in Heston’s model to overvalue this type of options. This was alsoreflected in Table 3.

It was mentioned above that the percentage pricing error of Heston’s model forATM calls turns out to be quite small. It may be the case that Heston’s formula worksparticularly well for ATM options. Calls are said to be ATM when 1.01 > K/F ≥ 0.99.The exercise described above is repeated for this type of options. Overall, as expected,Heston’s model tends to yield lower proportions of prices lying outside the bid-askspread than in previously analyzed cases. However, the p-value for the differencerelative to BS proportions is just 0.078. As before, BS tends to yield a statisticallysignificant higher proportion of prices lower than the bid quote relative to Heston’s

Page 172: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

164 Fiorentini, Leon and Rubio

prices, and Heston’s model presents a statistically significant higher proportion ofprices above the ask quote relative to BS prices. Now, however, Heston’s formula hassimilar proportions above the ask or below the bid. Regarding ATM calls, Heston’smisspecification cannot be explained by either overvaluation or undervaluation of callprices.

6.2 The structure of pricing errors

Given the poor empirical performance of both BS formula and Heston’s stochasticvolatility model, a further analysis trying to understand the structure of pricing errorsof these models would seem to be called for. Following the evidence reported byPena, Rubio, and Serna (1999) and Bakshi, Cao, and Chen (1997), we use a simpleregression framework to study the relation between the percentage pricing errors andfactors that are either option-specific or market dependent. We first take as given anoption pricing model, and let ei t be the i-th call option’s percentage pricing error onday t. Finally, we run the following regression for the whole sample period:

eit = α+β1 Xit+β2 τit+β3 spt+β4 volt+β5 termt+β6 skewt+β7 kurtt+ωit , (8)

where X is the moneyness of the i-th call at time t as defined by the ratio between theexercise price (K) and the futures price (F ); τi t is the annualized time to expirationof the i-th call on day t; sp is the average relative bid-ask spread of all calls andputs transacted between 16:00 and 16:45 on date t; volt is the annualized standarddeviation of the IBEX-35 index returns computed from 1-minute intradaily returns;termt is the yield differential between the annualized ten-year government bond andthe annualized one-month repo Treasury bill; skewt is the conditional skewness, andkurtt the conditional kurtosis. They are given by expression (C1)13 from AppendixC.

Table 5 contains the regression results based on the entire sample period and 768call options, and where the standard error for each coefficient estimate is adjusted bythe White (1980) heteroskedasticity-consistent estimator.

The explanatory variables employed in the regressions tend to be statisticallysignificant. However, there are important differences between the percentage errorsassociated with either BS or Heston.

In particular, a key point of the results is the statistical significance of the coef-ficient estimates related to skewness and kurtosis, when we consider Heston’s modelunder any of the three volatility risk premia used in the analysis. This is a veryimportant result. As we argued in sub-section 4.2, the assumption of constant cor-relation between stochastic variance and price changes, and even the assumption of

13The same regression was run using one day lagged values for the market dependent variables.Very similar results were found. The actual regressions employ excess kurtosis as an explanatoryvariable.

Page 173: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Short-Term Options with Stochastic Volatility 165

constant volatility of variance under Heston’s model do not seem to be the appropri-ate assumptions to adequately explain the behavior of option prices even allowing forstochastic volatility.

Note that, on the other hand, the coefficient associated with kurtosis is not sta-tistically significant in the BS case. However, as in Heston’s case, the skewness biasis also relevant to explain the BS pricing errors.

Table 5 also shows that the annualized standard deviation of the IBEX-35 indexslightly explains the percentage pricing errors independently of the model employedin the estimation. On average, pricing errors tend to be lower the higher the volatilityof the index. However, the statistical significance of the coefficients is very weak.

Traditional biases are not corrected for any of the models. The bias associatedwith moneyness has the opposite sign in both types of models. As expected, givenprevious results, Heston tends to price OTM options worse than ITM calls. However,on average, the opposite result is found for BS. Moreover, the bias related to time toexpiration seems to be relevant for both types of models. On average, the percentagepricing errors are larger the longer the time to expiration.

The influence on percentage pricing errors of both the yield differential betweeninterest rates and the average spread for all calls and puts transacted over the 45minute window are, interestingly enough, different for Heston and BS expressions.In the BS case, the higher the long-term yield relative to the short-term rate, thelower the percentage pricing error. However, this result disappears when we allow forstochastic volatility under any of Heston’s specifications.

Let us analyze the spread variable. Regressions of a similar type were run includ-ing the relative bid-ask spread at date t of the call i. This is, contrary to the resultsreported in Table 5, a contract-specific variable. Surprisingly, the estimated coeffi-cients are never significant regardless of the model considered. By doing this, we arereally incorporating a transaction cost variable directly associated with the liquidityof each individual option. Again, this variable does not seem to be significant inexplaining percentage pricing errors. On the other hand, however, when we includethe average spread over all call and put options for a particular day t, the estimatedcoefficient becomes positive and significant in Heston’s case. This aggregate variablemay indicate the average consensus about the uncertainty of trading throughout theoption market. It may be understood as the average adverse selection confrontingmarket makers in trading options on the Spanish index. As we see from Table 5, thelarger the average spread -larger average adverse selection among traders- the higherthe percentage pricing error in Heston’s stochastic volatility models. The impact ofthis type of uncertainty does not seem to be relevant in explaining the percentagepricing errors of BS.

In short, the pricing errors from Heston’s framework have some moneyness, ma-turity, average (aggregate) bid-ask spread, skewness and kurtosis related biases. Onthe other hand, the BS case presents some moneyness, maturity, yield differential and

Page 174: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

166 Fiorentini, Leon and Rubio

skewness associated biases. Neither model seems to capture appropriately the under-lying distribution characteristics of the underlying asset. Further research is clearlyjustified.

7 Conclusions

This paper introduces a two-step procedure, based on both time series and crosssection data, for estimating all the parameters that we need to compute Heston callprice. This estimation approach should be particularly useful in thin markets where asingle cross-sectional estimation approach may be difficult to implement, for instanceSpanish options data on the Ibex-35 stock index. Moreover, to employ just a cross-sectional procedure may ignore relevant information that may be included in theoriginal series but not in the option prices.

The empirical results, however, are quite disappointing. On average, over all calloptions available in our sample, Heston’s model improves the (poor) performance ofBS just marginally. It is clear that this extremely limited improvement cannot justifythe implementation costs involved in the estimation of Heston’s approach14. Theoverall rejection of Heston’s model coincides with recent findings by Bakshi, Cao andChen (1997) and Chernov and Ghysels (1998) for options written on the S& P 500index.

We are quite convinced that the ultimate reasons behind the performance failureof Heston’s model are closely related to the time-varying skewness and kurtosis foundin the data. In particular, the assumption of a constant correlation coefficient betweenreturns and stochastic volatility should be relaxed if we really want to have a richermodel. Unfortunately, of course, the complexities needed to price options seem toincrease without bounds. It may be the case that simple nonparametric methodologiesare able to incorporate the missing (realistic) factors in our option pricing models.

It is also found that the daily volatility risk premium presents a quite volatilebehavior over time. However, our evidence suggests that the volatility risk premiumhas a negligible impact on the pricing performance of Heston’s model.

A potentially interesting area of research might be related to endogenously in-corporating liquidity costs in option pricing models with either stochastic volatility,stochastic jumps or both. Once again, this approach may be extremely demandingfrom a theoretical point of view but it would probably be welcomed.

14Hedging performance of alternative models is not analyzed in this paper. It is possible that thehedging improvement under Heston’s stochastic volatility model might be clearly superior to BS.

Page 175: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Short-Term Options with Stochastic Volatility 167

Appendix A: Heston’s stochastic volatility model us-ing futures options

Given that we use futures options, the actual version of the formula we employ isgiven by:

c (F, υ, t) = e−r (T−t) (Ft P1 − K P2) ,

where F is the future price on the underlying spot price, K is the exercise price andthe probabilities are given by:

Pj =12

+1π

∫ ∞

0

Re(

e−i φ ln[K] fj

i φ

)dφ ; j = 1, 2 ,

where Re(y) is the real part of the function y; i is the imaginary number i =√−1,

and

fj (x, υ, T − t ; φ) = exp [C(T − t ; φ) + D(T − t ; φ) υ + i φ x] ,

where15

C(T − t ; φ) =a

σ2

(bj − ρ σ φ i + d) (T − t) − 2 ln

[1 − g ed (T−t)

1 − g

],

D(T − t;φ) =bj − ρ σ φ i + d

σ2

[1 − ed (T−t)

1 − g ed (T−t)

],

g =bj − ρ σ φ i + d

bj − ρ σ φ i − d,

d =√

(ρ σ φ i − bj)2 − σ2 (2uj φ i − φ2) ,

a = κ θ ,

b1 = κ + λ − ρ σ ,

b2 = κ + λ ,

u1 =12

; u2 = −12

verifying that C(0) = D(0) = 0, and where C(T−t ; φ) and D(T−t ; φ) (and thereforethe probabilities Pj , j = 1, 2) depend on the vector of parameters, (κ, θ, λ, σ, ρ) givenby the processes assumed by Heston under the original probability.

15As we have already pointed out, the expression for C(T − t ; φ) below is slightly different thanthe original value given by Heston (1993) since we are using futures.

Page 176: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

168 Fiorentini, Leon and Rubio

Appendix B: Indirect estimation procedure

1. Let xt ≡ ln St; then equation (1) becomes

dxt =(

µ − Vt

2

)dt + V

1/2t dW1t , (B1)

dVt = κ (θ − Vt) dt + σV1/2t dW2t , (B2)

dW1t dW2t = ρ dt .

The above expressions are used to obtain the set of estimators Ω ≡ (µ, κ, θ, σ, ρ).

2. Let us consider next the Euler discretization16 of both (B1) and (B2) with fre-quency τ :

xt = xt−τ + µ τ − Vt−τ

2τ + V

1/2t−τ τ1/2 η1t , (B3)

Vt = κ θ τ + (1 − κ τ)Vt−τ + εt , (B4)

whereεt = σ τ1/2V

1/2t−τ

[ρ η1t + (1 − ρ2)1/2 η2t

],

(η1t, η2t)′ iid≈ N (0, 1) .

3. Our auxiliary model is given by the Nagarch (1,1) model17:

Rt = µ + ξt; ξt = h1/2t εt; εt

iid≈ N(0, 1) ,

ht = ω + β ht−1 + α(ξt−1 + γ h

1/2t−1

)2

,(B5)

where Rt ≡ xt − xt−1 and γ represents the relation between the shocks and theconditional variance. The set of parameters to be estimated by maximum likelihoodis given by Ψ ≡ (µ, ω, α, β, γ).

4. Now we discuss the steps for the indirect estimation itself:

[4.1] Estimation of the auxiliary Nagarch (1,1) model with the observed data (τ = 1)

=⇒ Ψ ≡(µ, ω, α, β, γ

).

16Bakshi, Cao and Chen (2000) also use the Euler discretization for the method of simulated mo-ments which is employed to estimate the structural parameters of the continuous stochastic volatility(SV) process of the underlying asset. They also use a square root process for the SV model.

17See Leon and Mora (1999) for the behavior of alternative specifications within the GARCHfamily in the Spanish stock market.

Page 177: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Short-Term Options with Stochastic Volatility 169

[4.2] Let Ω0 be a initial value for Ω.

[4.3] We simulate (η1t, η2t)′ with τ = 1

10 , so (η1t, η2t)′ is a (T/τ) × 1 dimensional

vector, i.e.Θτ ≡

(η1t, η2t)′ : t = 1, 2, . . . , T/τ

.

[4.4] Given [4.2] and [4.3], simulate with Euler discretization equation (B4) to gen-erate Vt, and then equation (B3), where the set of simulated values from (B3)is denoted by:

X (Ω0,Θτ ) ≡ xt ; t = 0, τ, 2τ, . . . , T/τ .

[4.5] In order to work with the same frequency as the real data, take from X (Ω0,Θτ )the following values:

Γ (Ω0,Θτ ) ≡ x0, x10τ , x20τ , . . . , xT .

[4.6] Now, we go back to the auxiliary model and with the data from [4.5], we havea new set of Rt in (B5). We estimate the Nagarch model with the simulateddata at real frequency and get Ψ (Ω0,Θτ ) which is the vector of ML estimatorsof the Nagarch model with τ = 1

10 for Γ (Ω0,Θτ ).

[4.7] We have the same number of parameters in Ω and Ψ, so that we, in fact,minimize a distance with I as the weighting matrix18. Then, if

Ψ = Ψ (Ω0,Θτ ) =⇒ indirect estimators are Ω0 =⇒ END.

[4.8] If Ψ = Ψ (Ω0,Θτ ) =⇒ GO TO [4.2]. So, let Ω1 be another new value for Ω,continue the process and stop if Ψ = Ψ (Ω1,Θτ ); otherwise come back to [4.2]and repeat the process until convergence.

18Since the model is exactly identified, the results are unaffected by the choice of the weightingmatrix.

Page 178: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

170 Fiorentini, Leon and Rubio

Appendix C: (Un)conditional skewness and kurtosis

a) The conditional case:

skew =(

3σρeκ/2

√κ

)[θ (2 − 2eκ + κ + κeκ) − υ (1 + κ − eκ)

[θ (1 − eκ + κeκ) + υ (eκ − 1)]3/2

],

kurt = 3[1 + σ2

(θ A1 − υ A2

B

)],

(C1)

where

A1 =(1 + 4eκ − 5e2κ + 4κ eκ + 2κ e2κ

)+ 4ρ2

(6eκ − 6e2κ + 4κ eκ + 2κ e2κ + κ2eκ

)A2 = 2

(1 − e2κ + 2κ eκ

)+ 8 ρ2

(2 eκ − 2 e2κ + 2κ eκ + κ2 eκ

),

B = 2κ[θ (1 − eκ + κ eκ) + υ (eκ − 1)]2

and where υ ≡ Vt.

b) The unconditional case:

skew = 3(

ρ σ√κ θ

) [1 − eκ + κ eκ

κ3/2 eκ

]

kurt = 3[1 +

σ2

κ θ κ2 eκ

(1 − eκ + κ eκ + 4 ρ2 [2 − 2 eκ + κ + κ eκ]

)] (C2)

Appendix D: Tables and Figures

Table 1: Sample Characteristics of Ibex-35 Futures Options

Average prices, average relative bid-ask spread and the number of available calls are reported

for each moneyness category. All call options transacted over the 45 minute interval from

16:00 to 16:45 are employed from January 2, 1996 to April 30, 1996. K is the exercise

price and F denotes the futures price of the IBEX-35 index. Moneyness is defined as the

ratio of the exercise price to the futures price. OTM, ATM, and ITM are out-of-the-money,

at-the-money, and in-the-money options respectively.

Moneyness Average Average Bid- Number of(K/F ) Price Ask-Spread Observations

DEEP OTM CALLS: 1.03-1.08 12.88 0.3903 116OTM CALLS: 1.01-1.03 28.68 0.2205 273ATM CALLS: 0.99-1.01 57.20 0.1491 245ITM CALLS: 0.97-0.99 98.54 0.1273 108DEEP ITM CALLS: 0.90-0.97 185.42 0.0987 26ALL CALLS: — 50.52 0.2015 768

Page 179: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Short-Term Options with Stochastic Volatility 171

Table 2: Indirect Inference In-Sample Estimation(January 1994-December 1995)

The parameters of the following processes:

dSt = µ St dt +√

Vt St dW1t ,

dVt = κ (θ − Vt) dt + σ√

Vt dW2t ,

dW1t dW2t = ρ dt ,

are estimated using the indirect inference technique; µ is the instantaneous expected rate ofreturn of the underlying asset, Vt is the instantaneous stochastic variance, θ is the long-termmean of the variance, κ governs the rate at which the variance converges to this mean, σrepresents the volatility of the variance process, and ρ is the instantaneous correlation. Theauxiliary model employed in the estimation is the following Nagarch(1,1) model19:

Rt = µ + ξt ; ξt = h1/2t εt ; εt

iid≈N(0, 1) ,

ht = ω + β ht−1 + α(ξt−1 + γ h

1/2t−1

)2

,

where Rt is the hourly rate of return of the IBEX-35 index, and γ is the asymmetric param-

eter of the Nagarch. Euler discretization technique is employed in the estimation. Moreover,

alternative frequencies and simulations are also used.

N = 1; τ = 1/10 N = 10; τ = 1/10 N = 1; τ = 1/10 N = 1; τ = 1/50Length = 2,450 Length = 2,450 Length = 2, 450 × 10 Length = 2,450

µ 0.619 0.696 0.702 0.868√θ 12.09 12.77 11.92 11.73

κ 0.029 0.034 0.034 0.025σ 1.631 1.864 1.857 1.542ρ 0.044 0.038 0.020 0.087

Notes:

1. First column: The process is simulated once (N = 1), so that we employ 2, 450 × 10data points since τ = 1/10, where 2,450 is the number of hourly returns available fromJanuary 1994 to December 1995.

2. Second column: The process is simulated 10 times (N = 10), so that we generate 10series of size 2, 450 × 10 since, as in the first column, τ = 1/10.

3. Third column: The process is simulated once (N = 1), but now we employ 2, 450 ×10× 10 data points since τ = 1/10. Thus, the calibration of the Nagarch is done withmore data: 2, 450 × 10.

4. Fourth column: The process is simulated once (N = 1), so that we employ 2, 450× 50data points since τ = 1/50.

5. µ is annualized and is given in percentage terms.

6.√

θ represents the standard deviation of the long-term variance. It is annualized andis given in percentage terms.

7. σ is annualized and is given in percentage terms.

19The estimates of the Nagarch(1,1) parameters are µ = 0.00412, ω = 0.00301, α = 0.07680,

β = 0.89025 and γ = −0.1225.

Page 180: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

172 Fiorentini, Leon and Rubio

Table 3: Out-Of-Sample Pricing Error for Alternative Option PricingModels. Absolute Pricing Error and Percentage Pricing Error

Two years of rolling daily data are employed to estimate by indirect inference the parameters

of the stochastic volatility process under Heston’s model. Given these estimates, and a

chosen volatility risk premium, λ, we use all call options transacted over the 45 minute

interval from 16:00 to 16:45 to compute for each day from January 2, 1996 to April 29, 1996,

the instantaneous variance that minimized the squared error between the theoretical value

and the market price of the options. We then compute the the theoretical price of each

option using the previous day’s instantanteneous variance and the corresponding parameters

of the stochastic volatility process. For the Black-Scholes case, the previous day’s implied

volatility that minimized the squared error between the theoretical value and the market

price of the options is used to obtain the theoretical price of each option in the sample. The

reported absolute pricing error is the sample average of the absolute difference between the

model price and the market price for each call in a given moneyness category. The reported

percentage pricing error is the sample average of the theoretical price minus the market

price, divided by the market price. K is the exercise price and F denotes the futures price

of the IBEX-35 index. Moneyness is defined as the ratio of the exercise price to the futures

price. OTM, ATM, and ITM are out-of-the-money, at-the-money, and in-the-money options

respectively.

Panel A: Absolute Pricing Error

Moneyness Black-Scholes Heston(K/F ) (Pta) (Pta)

λ = 0 λ = 0.5 λ = −0.5

DEEP OTM CALLS: 1.03-1.08 1.829 2.033 2.030 2.038OTM CALLS: 1.01-1.03 2.641 2.815 2.819 2.774ATM CALLS: 0.99-1.01 3.847 2.874 2.854 2.896ITM CALLS: 0.97-0.99 4.690 3.593 3.586 3.600DEEP ITM CALLS: 0.90-0.97 4.357 3.809 3.795 3.823ALL CALLS: — 3.249 2.859 2.852 2.853

Panel B: Percentage Pricing Error

Moneyness Black-Scholes Heston(K/F ) (Pta) (Pta)

λ = 0 λ = 0.5 λ = −0.5

DEEP OTM CALLS: 1.03-1.08 -7.091 5.916 6.009 5.673OTM CALLS: 1.01-1.03 1.189 8.429 8.583 8.310ATM CALLS: 0.99-1.01 -3.894 -0.053 -0.021 -0.089ITM CALLS: 0.97-0.99 -3.285 -1.351 -1.331 -1.371DEEP ITM CALLS: 0.90-0.97 -2.560 -2.251 -2.243 -2.260ALL CALLS: — -2.439 3.607 3.689 3.513

Page 181: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Short-Term Options with Stochastic Volatility 173

Table 4: Nonparametric Testing for Alternative Option Pricing Models

The statistical significance of performance for out-of-sample pricing errors is assessed byanalyzing the proportion of theoretical prices lying outside their corresponding bid-ask spreadboundaries. The following Z-statistic for the difference between two proportions given by:

Z =p1 − p2√

p1 (1 − p1)/n1 + p2 (1 − p2)/n2

is employed in the tests, where p1 is always the proportion of Black-Scholes prices outside

the bid-ask boundaries, and p2 is the equivalent proportion for alternative Heston’s model

specifications. n1 and n2 are sample sizes corresponding to these proportions. The statistic

is asymptotically distributed as a standardized normal variable. All call options transacted

over the 45 minute interval from 16:00 to 16:45 from January 3, 1996 to April 30, 1996

are used in the tests below. K is the exercise price and F denotes the futures price of the

IBEX-35 index. Moneyness is defined as the ratio of the exercise price to the futures price.

Categories BS Heston Z-stat. Heston Z-stat. Heston Z-stat.(λ = 0) (p-value) (λ=0.5) (p-value) (λ=−0.5) (p-value)

All Options

p(Bid>c>Ask) 0.4761 0.4249 1.825 0.4249 1.825 0.4233 1.882(0.068) (0.068) (0.060)

p(c < Bid) 0.3487 0.1837 6.730 0.1821 6.804 0.1901 6.434(0.000) (0.000) (0.000)

p(c > Ask) 0.1274 0.2412 -5.253 0.2428 -5.319 0.2332 -4.919(0.000) (0.000) (0.000)

OTM Options

p(Bid>c>Ask) 0.4821 0.4347 1.421 0.4347 1.421 0.4324 1.421(0.155) (0.155) (0.155)

p(c < Bid) 0.3184 0.1351 6.694 0.1329 6.791 0.1419 6.399(0.000) (0.000) (0.000)

p(c > Ask) 0.1637 0.2995 -4.864 0.3018 -4.940 0.2905 -4.566(0.000) (0.000) (0.000)

ITM Options

p(Bid>c>Ask) 0.4615 0.4011 1.166 0.4011 1.166 0.4011 1.1656(0.244) (0.244) (0.244)

p(c < Bid) 0.423 0.3022 2.418 0.3022 2.418 0.3077 2.303(0.015) (0.015) (0.021)

p(c > Ask) 0.0385 0.0989 -2.294 0.0980 -2.294 0.0934 -2.123(0.022) (0.022) (0.034)

ATM Options

p(Bid>c>Ask) 0.4583 0.3750 1.762 0.3749 1.763 0.3735 1.765(0.078) (0.078) (0.077)

p(c < Bid) 0.3981 0.1806 5.134 0.1800 5.395 0.1893 5.189(0.000) (0.000) (0.000)

p(c > Ask) 0.0602 0.1944 -4.272 0.1987 -4.341 0.1915 -4.231(0.000) (0.000) (0.000)

Notes: OTM Options: K/F > 1. ITM Options: K/F < 1. ATM Options: 1.01 > K/F ≥0.99. c stands for cMODEL.

Page 182: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

174 Fiorentini, Leon and Rubio

Table 5: Percentage Pricing Errors and Explanatory Variables

For a given option pricing model, the following regression is employed to explain the per-centage pricing errors of all call options transacted over the 45 minute interval from 16:00to 16:45 from January 3, 1996 to April 30, 1996:

eit = α + β1 Xit + β2 τit + β3 Spt + β4 Volt + β5 Termt + β6 Skewt + β7 Kurtt + ωit ,

where eit is the percentage pricing error of the ith call on date t; X is the moneyness of

the ith call at time t as defined by the ratio between the strike price (K) and the futures

price (F ); τit is the annualized time to expiration of the ith call on day t; Sp is the average

relative bid-ask spread of all calls and puts transacted between 16:00 and 16:45 on date t;

Volt is the annualized standard deviation of the IBEX-35 index returns computed from

1-minute intradaily returns; Termt is the yield differential between the annualized ten-

year government bond and the annualized one-month repo Treasury bill; Skewt in the

conditional skewness and Kurtt is the conditional (excess) kurtosis. The t-statistic reported

in parenthesis in based on White’s heteroskedasticity consistent estimator of standard errors.

A total of 768 call options are employed in the regressions.

Coefficient Black-Scholes Heston Heston Heston(λ = 0) (λ = 0.5) (λ = −0.5)

Constant 0.683 -0.563 -0.590 -0.550(2.17) (-1.79) (-1.87) (-1.77)

Moneyness (X) -0.746 0.715 0.737 0.694(-2.20) (2.02) (2.08) (1.98)

Time to expiration (τ) 0.025 0.027 0.026 0.027(2.67) (2.84) (2.77) (2.84)

Spread (Sp) 0.225 0.404 0.409 0.406(1.48) (2.69) (2.72) (2.71)

Volatility (Vol) -0.998 -0.976 -0.986 -0.941(-1.69) (-1.70) (-1.72) (-1.64)

Term structure (Term) -0.129 -0.008 -0.007 -0.009(-4.65) (-0.26) (-0.24) (-0.30)

Skewness (Skew) 1.545 1.238 1.227 1.223(2.65) (2.15) (2.13) (2.13)

Kurtosis (Kurt) 0.217 -0.827 -0.805 -0.808(0.77) (-2.38) (-2.31) (-2.33)

Page 183: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Short-Term Options with Stochastic Volatility 175

Figure 1: Indirect Inference (January 96-April 96)

Figure 2: Time varying Skewness (January 96-April 96)

Page 184: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

176 Fiorentini, Leon and Rubio

Figure 3: Time varying Kurtosis (January 96-April 96)

Figure 4: Daily Volatility Risk Premium (January 96-April 96)

Page 185: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Short-Term Options with Stochastic Volatility 177

Figure 5: Daily Implied Volatilities (January 96-April 96)

Figure 6: Smiles (January 96-April 96)

Page 186: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

178 Fiorentini, Leon and Rubio

References

[1] Backus, D., Foresi, S., Li, K, and L. Wu (1997). “Accounting for biases in Black-Scholes”, Working Paper, Stern School of Business, New York University.

[2] Bakshi, G., Cao, C., and Z. Chen (1997). “Empirical performance of alternativeoption pricing models”, Journal of Finance 52, pp. 2003-2049.

[3] Bakshi, G., Cao, C., and Z. Chen (2000).”Pricing and hedging long-term op-tions”, Journal of Econometrics 94, pp. 277-318.

[4] Bates, D. (1996). “Jumps and stochastic volatility: exchange rate processes im-plicit in Deutsche mark options”, Review of Financial Studies 9, pp. 69-107.

[5] Black, F. (1976). “The pricing of commodity contracts”, Journal of FinancialEconomics 3, pp. 167-179.

[6] Black, F. and M. Scholes (1973). “The pricing of options and corporate liabili-ties”, Journal of Political Economy 81, pp. 637-659.

[7] Chernov, M. and E. Ghysels (1998). “What data should be used to price options?,unpublished manuscript, Pennsylvania State University.

[8] Corrado, C., and T. Su (1996). “Skewness and kurtosis in S& P 500 index returnsimplied by option prices”, Journal of Financial Research 19, pp. 175-192.

[9] Das, S., and R. Sundaram (1999). “Of smiles and smirks: A term-structureperspective”, Journal of Financial and Quantitative Analysis 34, pp. 211-239.

[10] Duan, J. (1997). “Augmented GARCH (p,q) process and its diffusion limit”,Journal of Econometrics 79, pp. 97-127.

[11] Eberlein, E., Keller, U. and K. Prause (1998). “New insights into smile, mis-pricing, and value at risk: The hyperbolic model”, Journal of Business 71, pp.371-405.

[12] Efron, B. and R.J. Tibshirani (1993). An introduction to the bootstrap. Chapman& Hall.

[13] French, D. (1984). “The weekend effect on the distribution of stock prices: im-plications for option pricing”, Journal of Financial Economics 13, pp. 547-559.

[14] Glosten, L., Jagannathan, R. and D. Runkle (1993). “On the relation betweenthe expected value and the volatility of the nominal excess return on stocks”,Journal of Finance 48, pp. 1779-1801.

[15] Gourieroux, C, Monfort, A., and E. Renault (1993). “Indirect inference”, Journalof Applied Econometrics 8, pp. 85-118.

Page 187: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Short-Term Options with Stochastic Volatility 179

[16] Guo, D. (1998). “The risk premium of volatility implicit in currency options”,Journal of Business & Economic Statistics, 16, pp. 498-507.

[17] Heston, S. (1993). “A closed-form solution for options with stochastic volatilitywith applications to bond and currency options”, Review of Financial Studies 6,pp. 327-344.

[18] Hull, J. and A. White (1987). “The pricing of options on assets with stochasticvolatilities”, Journal of Finance 42, pp. 281-300.

[19] Kapadia, N. (1998). “Do equity options price volatility risk? Empirical evidence”,Working Paper, University of Massachusetts.

[20] Leon, A. and J. Mora (1999). “Modelling conditional heteroskedasticity: appli-cation to the IBEX-35 stock return index”, Spanish Economic Review 1, pp.215-238.

[21] Leon, A. and E. Sentana (1998). “From discrete to continuous time and backagain”, unpublished manuscript, CEMFI, Madrid.

[22] Leon, A. and G. Rubio (2000) “Smiling under stochastic volatility”, unpublishedmanuscript, University of Alicante and University of Paıs Vasco.

[23] Lin, Y., N. Strong and X. Xu (1999). “Pricing FTSE 100 index options understochastic volatility”, working paper 99/018, The Management School, LancasterUniversity.

[24] Nandi, S. (1998). “How important is the correlation between returns and volatil-ity in a stochastic volatility model? Empirical evidence from pricing and hedgingin the S& P 500 index options market”, Journal of Banking and Finance 22, pp.589-610.

[25] Nelder, J.A. and R. Mead (1965) “A simplex method for function minimization”,Computer Journal 7, pp. 308-313.

[26] Nowman, K. (1997). “Gaussian estimation of single-factor continuous time mod-els of the term structure of interest rates”, Journal of Finance 52, pp. 1695-1706.

[27] Pena, I., Serna, G, and G. Rubio (1999). “Why do we smile? On the determinantsof the implied volatility function”, Journal of Banking and Finance 23, pp. 1151-1179.

[28] Rohatgi, V.K. (1984). Statistical inference. John Wiley & Sons Inc.

[29] Rosenberg, J. (1998). “Pricing multivariate contingent claims using estimatedrisk-neutral density functions”, Journal of International Money and Finance 17,pp. 229-247.

Page 188: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

180 Fiorentini, Leon and Rubio

[30] Sarwar, G. and T. Krehbiel (2000). “Empirical performance of alternative pricingmodels of currrency options”, The Journal of Futures Markets 20, pp. 265-291.

[31] Scott, L.O. (1987). “Option pricing when the variance changes randomly: Theory,estimation and an application”, Journal of Financial and Quantitative Analysis22, pp. 419-438.

[32] White, H. (1980). “A heteroskedasticity-consistent covariance matrix estimatorand a direct test for heteroskedasticity”, Econometrica 48, pp. 817-838.

[33] Wiggins, J.B. (1987). “Option values under stochastic volatilities: Theory andempirical estimates”, Journal of Financial Economics 19, pp. 351-372.

Gabriele FiorentiniDepartamento de Fundamentos del Analisis Economico

Facultad de Ciencias Economicas y EmpresarialesUniversidad de Alicante

Campus San Vicente RaspeigApartado de Correos 99, 03080-Alicante, Spain

e-mail: [email protected]

Angel Leon ValleDepartamento de Economıa Financiera

Facultad de Ciencias Economicas y EmpresarialesUniversidad de Alicante

Campus San Vicente RaspeigApartado de Correos 99, 03080-Alicante, Spain

e-mail: [email protected]

Gonzalo RubioDepartamento de Fundamentos

Facultad de Ciencias EconomicasUniversidad del Paıs Vasco

Avenida L. Aguirre, 8348015 Bilbao, Spain

e-mail: [email protected]

Page 189: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

May static pricing models be

useful when pricing

catastrophe-linked derivatives?

Alejandro Balbas, Inaki R. Longarela and Julio Lucia1

Abstract

This paper deals with the PCS Catastrophe Insurance Option Contracts,providing empirical support on the level of correspondence between real quotesand standard financial theory. The highest possible precision is incorporatedsince the real quotes are perfectly synchronized and the bid-ask spread is alwaysconsidered. A static setting is assumed and the main topics of arbitrage, hedgingand portfolio choice are involved in the analysis. Three significant conclusionsare reached. First, the catastrophe derivatives may be very often priced by ar-bitrage methods, and the paper provides some examples of practical strategiesthat were available in the market. Second, hedging arguments also yield ade-quate criteria to price the derivatives and some real examples are provided aswell. Third, in a variance aversion context many agents could be interested inselling derivatives to invest the money in stocks and bonds. These strategiesshow a suitable level in the variance for any desired expected return. Further-more, the methodology here applied seems to be quite general and may be usefulto price other derivative securities. Simple assumptions on the underlying assetbehavior are the only required conditions.

1 Introduction

New investment and financing opportunities, and innovative risk management tech-niques involving derivatives have been developed to allow individuals and corporationsto cost-effectively reallocate funds and transfer risks to other parties. A growing con-cern on catastrophe losses has particularly brought attention to catastrophe deriva-tives and their potential financing and risk sharing benefits for the insurance industry.

The PCS (Property Claim Services) Catastrophe Insurance Options Contractslaunched by the Chicago Board of Trade (CBOT) on September 29, 1995 are amongthe most significant catastrophe derivatives. These are standardized option contracts

1Alejandro Balbas es Catedratico de Economıa Financiera de la Universidad Carlos III de Madrid.Inaki R. Longarela es Doctor en Economıa por la Universidad Carlos III de Madrid y Associate Pro-fessor of Finance en la Universidad de Estocolmo. Julio Lucia es Profesor Titular en el Departamentode Economıa Financiera y Matematica de la Universidad de Valencia. Esta charla se impartio en lasesion del Seminario MEFF-UAM de noviembre de 1998.

Page 190: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

182 Balbas, Longarela And Lucia

based on indices that track the insured losses, as estimated by PCS, resulting fromcatastrophic events that occur in a given area and period. Previously, the CBOThad traded catastrophe futures and options contracts on an index provided by theInsurance Services Office (ISO). Moreover, the CBOT planned to list PCS Single-Event Catastrophe options in 1998 to broad its product offering. In 1997 the BermudaCommodities Exchange (BCOE) also began trading derivative securities based on theGuy Carpenter Catastrophe Index, an index of losses from climate events in US.

In this paper we focus on the CBOT’s PCS options. Previous literature on theseparticular contracts and other related catastrophe derivatives can be roughly dividedinto two major categories, according to their main objective. The first group ofpapers concentrates on pricing issues. They view catastrophe derivatives as financialinstruments and, accordingly, they take a financial approach to valuing (see Cumminsand Geman (1995), Geman and Yor (1997), among others; Tomas (1998) suggests anactuarial approach). They theorize on the dynamic stochastic behavior of the relevantunderlying variables in order to obtain the desired pricing result. From a theoreticalpoint of view this line of research is really important and very promising. From apractical point of view there are some difficulties due to market imperfections (bid-ask spread, other transaction costs, short-selling restrictions, illiquidity that makes acontinuous trading rather difficult, etc.) and some specific properties shown by theunderlying indices (their stochastic behavior, the absence of any underlying securityavailable for trade, etc.).This motivates the existence of a second group of papersdevoted to describe the contracts and illustrate their most significant applications toboth, insurance and capital markets (e.g. see D’Arcy and France (1992), Canter etal. (1996), Litzenberger et al. (1996), O’Brien (1997) and Jaffee and Russell (1997)).They explore the potential benefits of using catastrophe derivatives for the insuranceindustry, and they compare these securities to other competitive alternatives suchas reinsurance and catastrophe-linked bonds. Some papers analyze the potentiallyattractive new investment opportunities provided by the catastrophe-linked assetsfrom any investor’s perspective. Most of all these papers stress the traders’ need foran understandable and reliable complete pricing methodology for these innovativesecurities.

The present paper may be included in the second group, but the standard staticasset pricing models are applied. We consider real bid and ask prices of catastrophe-linked derivatives and we test their adequacy with static financial theory. Examiningstatic valuation minimizes the impact of real market imperfections, and problemsderiving from the nature of the underlying variables may be solved if one prices anarbitrary derivative by only bearing in mind the interest rates and the prices of otherderivative securities. Thus, we can apply the main topics of asset pricing, arbitrage,hedging and portfolio choice, in a model where bonds and derivatives are the onlymarketed assets.2

2Stocks, whose returns show an insignificant correlation with the PCS indices (see Canter et al.(1996)), can be included too.

Page 191: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Pricing catastrophe-linked derivatives 183

In order to use static theory, we will consider a two periods model characterizedby the current date, the derivatives expiration date, their current bid and ask pricesand their final payoffs. The analysis is independently implemented once a day.

Once the context has been fixed, we will start by analyzing the existence of ar-bitrage portfolios. There are two different perspectives. First, we test the situationof an investor who incurs in the cost of the bid-ask spread, i.e. he/she sells at thebid and buys at the ask price. As expected, we will find it impossible to form anyarbitrage portfolio. Second, we explore the position of any agent who post one ofthe available prices (i.e. either he/she buys at the bid or sells at the ask for a givenasset and incurs on the cost of the bid-ask spread for the rest of assets). If an ar-bitrage portfolio were available in this context, any other agent could offer a betterprice and still retain some of the arbitrage gains. Competition among traders willingto earn money without any risk should lead to a more reduced spread. As will beshown, arbitrage portfolios may be available from this second perspective and, conse-quently, some relative misspricings may be found, narrower spreads may be possible,and traders can sometimes improve real bid or ask quotes without any type of riskor, equivalently, they can price by arbitrage methods.

When a concrete derivative can not be priced by arbitrage methods, we explorethe existence of hedged portfolios containing this derivative. In particular, there mayexist some hedged portfolios with a slightly lower guaranteed positive return than therisk-free return, but with a possible return far larger than it (under some conditions).Our results show that interesting portfolios of this type can actually be formed in somecases. Again, competition among traders trying to exploit the attractive benefits ofthese portfolios should lead to reductions of the spread.

Previous studies, Canter et al. (1996), Litzenberger et al. (1996), utilized empir-ical evidence concerning the insignificant correlation of the PCS national index withthe S&P 500 index (see also Litzenberger et al. (1996) and the references containedtherein for more evidence on this regard). Canter et al. (1996) stress the diver-sification benefits open to investors participating in the new securitized insurancerisk. Litzenberger et al. (1996) illustrate the attractiveness of including some hypo-thetical catastrophe bonds in diversified stocks or bonds portfolios in terms of thenew risk/returns opportunities offered. This paper follows the theoretical frameworkproposed by Fisher Black and Robert Litterman based on the Capital Asset Pric-ing Model (C.A.P.M.) including the calculation of some necessary parameters fromhistorical data of insurance losses and premiums.

While our study on portfolio choice is closely related to these previous studies ittakes a different point of view. We focus on the investment in catastrophe insuranceoptions market. Suppose that an investor, possibly attracted by the accompanieddiversification benefits, adds insurance risk to his/her traditional portfolio of stocks,bonds and real estate. How should he/she efficiently combine PCS options in thisinsurance portfolio with the risk-less asset in order to obtain the desired expected

Page 192: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

184 Balbas, Longarela And Lucia

return with a minimum variance? We will try to answer this question with theassistance of two important theorems concerning the static pricing theory.

We also need the real probability distribution for the underlying insured loss index,and a linear pricing rule compatible with the real quotes. The probability distributionis obtained via simulation and historical catastrophe data. The linear pricing ruleoriginates from a risk-neutral probability measure attained by applying a methodologyproposed by Rubinstein (1994) and a number of others.

Once the probability measure and the pricing rule are established we shall lookfor minimum variance portfolios. An interesting result seems to hold. For investorswhose risk is not correlated with the PCS indices (i.e., investors that are not insurers)it may be very useful to sell catastrophe derivatives and to invest the money in otherkind of assets, like bonds or stocks.

Summarizing, our empirical results confirm the potential interest of catastrophe-linked derivatives. They are useful to insurers because, in some sense, they can beregarded as a special type of reinsurance. Besides, they may also be interesting forother type of Financial Institutions (banks, for instance) because, if arbitrage andhedging arguments lead to low bid-ask spreads, these institutions can adequatelydiversify their portfolios by selling derivatives. Consequently, the high level of riskdue to catastrophic events may be appropriately diversified among large numbers ofinvestors who trade “reinsurances” in a financial market.

Finally, the applied methodology highlights two interesting properties. First, itsusefulness to traders in providing practical criteria and investment strategies. Second,it may be quite general and can be implemented to analyze other kind of securities.Very weak assumptions are then required. Arbitrage and hedging arguments will holdif one is able to identify the underlying uncertainty, i.e., the underlying variables ifwe are working with derivatives. Variance aversion and C.A.P.M.-type argumentswill work well if the probability measure, affecting the underlying uncertainty, can bedetermined.3

The remainder of the paper is organized as follows. Section 2 briefly reviews themain theoretical results we rely on to carry out our empirical analysis of PCS optionsquotes. Section 3 summarizes the foremost characteristics of PCS options and all ourdata. In Section 4 we present the concrete methodology we adopt in our empiricalresearch of PCS options quotes and provide our results. The paper ends with someconcluding remarks in Section 5.

3When the usual C.A.P.M. is tested, it is not possible to describe the underlying probabilityspace, and researchers have to obtain information about it by studying correlations within the set ofavailable securities. Nevertheless, in this case, the underlying PCS indices behavior has been directlyanalyzed and the derivatives quotes and returns were not used for this purpose.

Page 193: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Pricing catastrophe-linked derivatives 185

2 Theoretical Background

Throughout the paper we will consider a static setting to analyze how the theory ofportfolio selection and different asset pricing models may be applied to PCS optioncontracts. Thus, first of all, we must summarize the general framework and the basicassumptions that lead to the most important theoretical results on asset pricing. Abrief review of these topics is the main purpose of the present section. Later, we willprovide the way this theory applies in this article to study the market of PCS optioncontracts.

We focus on the two periods approach characterized by the present date t0, afuture date t1, n securities denoted by S1, S2, . . . , Sn, their bid prices at t0 denotedby v1, v2, . . . , vn, their ask prices c1, c2, . . . , cn, and the future prices (or final payoffs)at t1 which depend on a finite number of states of the world W1,W2, . . . ,Wk andare given by the matrix A = (aij), i = 1, 2, . . . , k, j = 1, 2, . . . , n, being aij ≥ 0the price of Sj if the state Wi takes place.4 µi > 0 will denote the probability ofWi, i = 1, 2, . . . , k, and µ will denote the whole probability measure. The inequalitiescj ≥ vj for j = 1, 2, . . . , n are clear, and we will accept the convention vj = 0 (cj = ∞)if there is no bid (ask) price available for Sj . The inequalities cj > 0 and vj ≥ 0,j = 1, 2, . . . , n, will also be assumed.

The first security S1 will be a riskless asset (its final payoff is 1 and does notdepend on the state of the world) and c1 = v1 > 0.5 As usual, the riskless return isgiven by R = 1/v1.

The row matrix x = (x1, x2, . . . , xn) will represent the portfolio composed of xj

units of Sj , j = 1, 2, . . . , n, and xj ≥ 0 (xj ≤ 0) must hold if vj = 0 (cj = ∞). Itscurrent (at t0) price will be P (x) =

∑nj=1 pjxj being pj = cj (pj = vj) if xj ≥ 0

(xj ≤ 0),6 where we assume the convention ∞ × 0 = 0 if cj = ∞ and xj = 0. Itsprice at t1 depends on the state of the world and is given by the column matrix Axt

where xt is the transpose of x.

For an arbitrary portfolio x, we will consider the portfolios x+ = (x+1 , . . . , x+

n ) andx− = (x−

1 , . . . , x−n ) composed of the purchased and sold securities respectively. To be

precise, x+j = maxxj , 0 and x−

j = max−xj , 0 for j = 1, 2, . . . , n.

The prices of the purchased and sold assets will be denoted by C(x) and V (x)respectively, and are given by

C(x) =n∑

j=1

cjx+j and V (x) =

n∑j=1

vjx−j .

4Almost all the results still hold for a matrix A whose elements are also negative, but the con-straint aij ≥ 0 makes things a little easier and is always fulfilled in our empirical analysis.

5Once again, this assumption can be avoided in a general framework, but it is useful and fulfilledin this article.

6I.e., agents can buy or sell any security but prices are larger if they buy.

Page 194: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

186 Balbas, Longarela And Lucia

The relationships P (x) = C(x) − V (x) and x = x+ − x− are clear.

We will follow the approach proposed for instance by Prisman (1986) or Ingersoll(1987) to introduce the concept of arbitrage.7

Definition 1 The portfolio x is said to be an arbitrage portfolio of the second type,or a strong arbitrage portfolio, if P (x) < 0 and Axt ≥ 0 , or P (x) = 0 and Axt >> 0.

The portfolio x is said to be an arbitrage portfolio of the first type, or a weakarbitrage portfolio, if P (x) = 0 and Axt > 0.

Let us consider a simple numerical example in order to illustrate what is meant byweak and strong arbitrage. Suppose that

A =(

1 1 0 11 0 1 2

),

the bid prices are v1 = 1, v2 = 0.7, v3 = 0.4 and v4 = 2.6, and the ask prices arec1 = 1, c2 = 0.8, c3 = 0.5 and c4 = 3. Then, x′ = (1,−1,−1, 0) is an arbitrageportfolio of the second type because its current price is −0.1 and its final payoffs

are(

00

). The portfolio x′′ = (1.1,−1,−1, 0) is also a strong arbitrage portfolio

because its current price and final payoffs are 0 and(

0.10.1

)respectively. Finally,

x′′′ = (0, 2, 2,−1) is a weak arbitrage portfolio with current price equal to 0 and future

payoffs equal to(

10

).

Previous literature has characterized the absence of arbitrage by the existence ofstate prices or discount factors (see for instance Chamberlain and Rosthchild (1983),Ingersoll (1987) or Hansen and Richard (1987)). The following result is a minorextension that incorporates the bid-ask spread and may be easily proved by readaptingclassical proofs (see also Jouini and Kallal (1995)).

Theorem 1 There are no arbitrage opportunities if and only if there exists a vectord = (d1, d2, . . . , dk) of discount factors such that di > 0, i = 1, 2, . . . , k and

vj ≤k∑

i=1

aij di µi ≤ cj for j = 1, 2, . . . , n. (1)

There are no arbitrage opportunities of the second type if and only if there exists avector d = (d1, d2, . . . , dk) of discount factors such that di ≥ 0, i = 1, 2, . . . , k, and(1) holds.8

7In what follows, Axt ≥ 0 denotes that all the elements in this matrix are larger than or equal to0. Analogously, Axt >> 0 denotes that all the elements are larger than 0, and Axt > 0 denotes thatelements are larger than or equal to 0, but at least one element is strictly positive. Similar notationswill appear in similar cases.

8An analogous result holds if the probability measure µ is not specified. In such a case, thediscount factors d′i > 0 (≥ 0) must verify vj ≤ ∑k

i=1 aij d′i ≤ cj . The proof is trivial since one candefine d′i = di µi.

Page 195: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Pricing catastrophe-linked derivatives 187

Let us remark that (1) leads to 1/R =k∑

i=1

diµi. If we set

λi = R di µi , i = 1, 2, . . . , k, (2)

then λi ≥ 0 andk∑

i=1

λi = 1, and therefore, λ = (λ1, λ2, . . . λk) can be considered as a

probability measure. Furthermore, (1) leads to

vj ≤ 1R

Eλ(Sj) ≤ cj (3)

for j = 1, 2, . . . , n, being Eλ(Sj) the expected value of Sjat t1 computed with the

probability measure λ instead of µ . This is the reason why λ is called a Risk NeutralProbability Measure, and Theorem 1 shows that its existence (and positiveness) is thenecessary and sufficient condition to guarantee the absence of arbitrage of the secondtype (of any kind).

The latter theorem provides a very well known and important condition to ensurethe absence of arbitrage. Nevertheless, if the arbitrage occurs, it will be interestingto measure, in monetary terms, the degree of arbitrage. This measurement will beuseful to improve bid or ask real prices for PCS option contracts, and will also permitto analyze other type of market imperfections. For instance, owing to transactioncosts, the presence of arbitrage could be only apparent but not real.

The following result summarizes some properties of the measures developed byBalbas and Munoz (1998).

Theorem 2 Suppose that the set X of arbitrage strategies of the second type is nonvoid. Then, problems

maxx∈X

−P (x)V (x)

and maxx∈X

−P (x)C(x) + P (x)

achieve an optimal value at the same portfolio x∗.

The ratios in the theorem above represent relative arbitrage profits (−P (x)) withrespect to the price of the sold assets (V (x)) or the total volume of trade (C(x) +V (x), price of the purchased and sold assets without considering a negative sign forthe sold assets). For instance, if we consider the strong arbitrage portfolio x′ =(1,−1,−1, 0) introduced in the previous numerical example, the price of the soldassets is V (x′) = 1.1, the price of the purchased assets is C(x′) = 1 , the total volumeof trade is V (x′) + C(x′) = 2.1 and the price of x′ is P (x′) = C(x′)− V (x′) = −0.1 .Consequently, the relative arbitrage profits with respect to V (x′) and C(x′) + V (x′)are 0.1/1.1 and 0.1/2.1.

Consider the portfolio x∗ whose existence is guaranteed by Theorem 2. The dis-agreement measures m and l are defined by

m =−P (x∗)V (x∗)

and l =−P (x∗)

C(x∗) + V (x∗),

Page 196: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

188 Balbas, Longarela And Lucia

or zero if no arbitrage opportunities of the second type exist. Measures m and lvanish if and only if there are no arbitrage opportunities of the second type. Whenthe arbitrage occurs m (l) yields available relative arbitrage gains with respect to thevalue of the sold (interchanged) assets. The inequalities 0 ≤ l ≤ m ≤ 1 may be proved,and the level of violation of the arbitrage absence grows up as the measures move from0 to 1. The relationship l = m

2−m holds, and thus since [0, 1] z −→ z2−z ∈ [0, 1]

is an increasing one to one function, both measures provide equivalent information.Further details may be found in Balbas and Munoz (1998) or Balbas et al. (1998).9

Let us remark that Theorems 1 and 2 permit to analyze and detect arbitrageportfolios without previously specifying the exact nature of the strategy to be used.For instance, many financial papers empirically test the existence of violations for theusual put-call parity or the relationship between spot and future prices. This typeof test can not be implemented when analyzing PCS options, in which case all theavailable securities must be simultaneously considered and the market globally tested.

Let us turn now to hedging strategies and arbitrage portfolios of the first type.Assume that the model does not allow arbitrage portfolios of the second type. Then, Ris the highest return than can be guaranteed. However, an investor may be interestedin a hedging portfolio whose guaranteed return is very close to R but provides largerreturns in some states of the world.

Let us fix a concrete security Sj0 , and consider the usual way of hedging thepurchase of this security, i.e., solve the problem10

minxj0=1 , Axt≥1

P (x) (4)

If the solution is attained at x, the absence of strong arbitrage ensures that P (x) > 0,and 1/P (x) is the optimal (maximum) guaranteed return if a unit of Sj0 is bought.11

Notice that the solution x of (4) dominates the riskless security and, consequently,x is really a hedged portfolio. Moreover, P (x) ≥ 1/R because, otherwise, investorscould implement strong arbitrage (against our assumptions) by selling the risklessasset and buying x. Furthermore, if P (x) = 1/R then either x replicates the risklessasset or the previous strategy is weak arbitrage. Thus, there are arbitrage portfoliosof the first type such that xj0 = 1 if R = 1/P (x) and Axt > 1.

An analogous analysis may be done to hedge the sale of Sj0 . Just write xj0 = −1in (4) instead of xj0 = 1. Obviously, not only hedging portfolios, but also arbitrage ofthe first type can be detected by computing all the hedging portfolios when j0 movesfrom 1 to n.

9Once again, these results are also verified in a model where µ is not specified. Another procedure,useful to detect arbitrage portfolios, may be found in Garman (1976).

10Recall that Axt ≥ 1 means that all the elements in the column matrix Axt are larger than orequal to 1.

11Clearly, the return 1/P (x) is maximum if and only if the price P (x) is minimum.

Page 197: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Pricing catastrophe-linked derivatives 189

The last part of this synopsis focuses on individual portfolio selection and varianceaversion. Assume that there are no arbitrage opportunities (of any sort) in the model.Then, Theorem 1 shows that the arbitrage absence still holds for some concrete linearpricing rule π such that vj ≤ πj ≤ cj , j = 1, 2, . . . , n, being πj the price of Sj providedby π.12 Besides, π may be considered as a positive real valued linear operator over thespace span(A), span of the columns of A.13 Then, the Riesz Representation Theoremof linear operators in Hilbert spaces allows us to establish the following result (seeChamberlain and Rosthchild (1983)).

Theorem 3 There exists a unique discount factor d such that

k∑i=1

aijdiµi = πj

for j = 1, 2, . . . , n, and dt belongs to span(A).

We will assume that dt is not the payoff of a riskless asset. This hypothesis is notrestrictive (it only affirms that the market is not risk-neutral and, consequently, λ = µ)and will always hold in our empirical test.

In order to achieve an easier notation, denote by Sj the jth-column of A, j =1, 2, . . . , n, and let us identify each feasible portfolio x with its final payoff Axt = y ∈span(A). Denote by π(Axt) = π(y) =

∑ki=1 yi di µi its current price provided by π.

In particular, π(dt) =∑k

i=1 d2i µi > 0. Define by R(y) = y/π(y) the return (provided

by π) of any y ∈ span(A) such that π(y) > 0, and consider its expected valueE

µ(R(y)) and standard deviation σµ(R(y)).14 Then, the statement below, whoseproof is a consequence of the Projection Lemma of Hilbert spaces (see for instanceDuffie (1988)) provides the optimal portfolios in a variance-averse model.

Theorem 4 For any y ∈ span(A) such that π(y) > 0, there exists a linear combina-tion of dt and the riskless asset, ϕS1 + ψ dt, such that

(i) i) ψ ≤ 0

(ii) π(y) = π(ϕS1 + ψ dt)

(iii) Eµ(R(y)) = E

µ (R(ϕS1 + ψ dt))

(iv) σµ(R(y)) ≥ σµ (R(ϕS1 + ψ dt))

12Take, for instance, the linear pricing rule provided by the second term of (3).13I.e., the space of k × 1 column matrices that can be obtained by linear combinations of the

columns of A.14Recall that y and R(y) may be considered random variables and, therefore, E

µ(R(y)) =

1π(y)

∑ki=1 yiµi and σµ(R(y)) = 1

π(y)

(∑ki=1[yi − π(y)Eµ(R(y))]2µi

)1/2

Page 198: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

190 Balbas, Longarela And Lucia

Hence, for a desired expected return, the minimum variance is attained by sellingthe portfolio x such that Axt = dt and investing the price of x, along with the owncapital, in the riskless asset.15

Theorem 4 will play a crucial role in our analysis because it allows to compute theminimum variance portfolios without deriving correlations within the set of availablePCS options. In fact, these portfolios are given by the vector d of discount factorsand, as pointed out by (2), d is the density between a risk neutral measure λ, andthe initial probability measure µ.

3 Markets and Data

CBOT’s PCS Catastrophe options are standardized contracts based on PCS indicesthat track the insured losses resulting from catastrophic events that occur in a givenarea and a risk period, as estimated by PCS.

When PCS estimates that a natural or man-made event within the US is likely tocause more than $25 million in total insured property losses and determines that sucheffect is likely to affect a significant number of policyholders and property/casualtyinsurance companies, PCS identifies the event as a catastrophe and assigns it a catas-trophe serial number. PCS provides nine loss indices daily to the CBOT: a nationalindex, five regional indices, and three state indices (National, Eastern, Northeastern,Southeastern, Midwestern, Western, Florida, Texas and California loss indices). EachPCS loss index represents the sum of current PCS estimates for insured catastrophiclosses in the area and loss period covered, divided by $100 million, and rounded tothe nearest first decimal point.

The loss period is the time during which a catastrophic event must occur in orderfor the resulting losses to be included in a particular index. Most PCS indices havequarterly loss periods, some of them (California and Western) have annual loss peri-ods, and one of them (National) has both quarterly and annual risk periods. Followingthe loss period, there exists a development period (twelve months) during which PCScontinues estimating and reestimating losses for catastrophes occurring during theloss period. The development period estimates affect PCS indices and determine thefinal settlement value of the indices.

Catastrophe options are available for trading till the end of the development pe-riod. They are European and cash-settled (each point equals $200 cash value). Theycan be traded as either “small-cap” or “large-cap” contracts. These caps limit theamount of losses that are included under each contract: insured losses from $0 to $20billion for the small contracts and losses from $20 to $50 billion for large contracts.

15Under the usual CAPM assumptions, the considered securities are stocks and, under the suitablehypotheses on their stochastic behavior, the portfolio x is composed of a long position in the risklessasset and short positions in the stocks. Since the coefficient ψ must be negative, the Market Portfolioconsists of stocks in a long position.

Page 199: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Pricing catastrophe-linked derivatives 191

In practice, traders prefer negotiating call spreads and so further limiting their asso-ciated payoffs. Sophisticated combinations traded as a package, that include severalexpirations dates and indices, are also available.16 Catastrophe options bid and askquotes and the current value of the indices are daily provided by the CBOT. Pre-miums are quoted in (index) points and tenths of a point (each point equals $200).Strikes values are listed in integral multiples of five points.

Our empirical work studies two periods: from February 25 to April 20, 1998 andfrom June 23 to July 30, 1998. The quotes used in the empirical analysis were providedby the CBOT and correspond to synchronized bid and ask quotes posted at the endof each day. For each of the days considered, we have also included a risk-free asset.Its prices were obtained from the coupon-only strips quotes reported by The WallStreet Journal.17 Treasury-bills could have been used instead but strips maturitieswere much closer to the options expiration dates.18

In order to learn about the distributional properties of the catastrophe waitingtimes and their associated amount of insured losses, our data also includes a 25-year(1973-1997) catastrophe record provided by PCS. This record included all catastro-phes occurred in each state with indication of its serial number, begin and end dates,causes and PCS’s estimates of insured losses. The monetary value of losses was con-verted into 1997 dollars by using the Producer Price Index reported by the Bureauof Labor Statistics (US Department of Labor). We restricted our observations of thevalue of the insured losses to the sample period 1990 − 1997 for several reasons thatwill be analyzed in the fourth section (Subsection 4.3).

4 Empirical Research: Methodology and Results

From now onwards, we will first specify the methodology employed in the empiricalanalysis and then we will present the obtained results.

Our analysis only targets those derivatives with a single underlying index and aunique expiration date. We group those derivatives with the same expiration dateand the same underlying index that are available for trading. For a given we requireday a minimum of four assets in each set. For the first period this filtering left us withderivatives associated to the following indices: National Annual-98 (36 valid days),California Annual-98 (36 days), Eastern September-98 (12 days) and SoutheasternSeptember-98 (10 days). For the second period we have the National Annual-98 (27valid days), Eastern September-98 (10) and Southeastern September-98 (10).19 Table

16Henceforth, for short, we will merely say ’derivative’ or ’option’ to refer to a single option or apackage of ones.

17Exact values were obtained through linear interpolation of midpoints of the bid-ask prices byusing the closest maturities to the option expiration dates.

18Some of our computations were also implemented with T-bills returns. Our main results remainedunchanged.

19The expiration dates for the 98 annual contracts and the September 98 contracts are 12/31/99and 09/30/99, respectively.

Page 200: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

192 Balbas, Longarela And Lucia

1 summarizes the number of relevant derivatives satisfying the above criteria and thenumber of their quotes available in the two periods.20 This constitutes our wholesample for Subsections 4.1 and 4.2.

Table 1: Overview of the PCS Catastrophe Options Sample. This table describesour sample of derivatives. For each specific index, we require a minimum of four tradablesecurities in order to include a given day in the analysis. The first column gives cumulatedfigures corresponding to the entire periods, and the subsequent ones summarize the dailynumber of derivatives and quotes.

In Subsections 4.3 and 4.4, a large amount of data on waiting times and their as-sociated amount of losses is required in order to perform reliable simulations and,therefore, the characteristics of our historical data set compel us to exclusively con-centrate on the National Annual-98 Index.

4.1 Pricing by strong arbitrage methods

The price of the PCS derivatives will be analyzed once a day during each testedperiod. Hence, under the notations of the second section, the date t0 will always bethe corresponding day, while securities S2, S3, . . . , Sn will be PCS option contracts(call or put spreads, butterflies etc.), available this day, and with the same underlyingindex W and expiration date t1.21 Their bid and ask prices are perfectly synchronizedand provided by CBOT. S1 will be a pure discount bond available at t0 and such thatits maturity is as close to t1 as possible. Of course, all the data and parameters (datest0 or t1, securities, prices etc.) depend on the concrete day under revision.

Let W1 be the current value of the index and denote by W2, . . . ,Wr the strikingprices, corresponding to Sj , j = 2, 3, . . . , n. The future state of the world will bedetermined by the final (at t1) value of W (any real number greater than W1 androunded to the nearest first decimal point), and the matrix A of final payoffs may be

20We have also detected that it was possible to synthetically produce some other EasternSeptember-98 options based on their corresponding Northeastern and Southeastern options for somedays in our sample. To be consistent, as the latter two negotiated independently, we decided not toinclude the synthesized Eastern options as other derivatives available for trading in our sample.

21i.e., the underlying index and the loss and development periods coincide for all the consideredderivatives.

Page 201: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Pricing catastrophe-linked derivatives 193

easily computed. In fact, all the elements in its first column (payoffs of the risklessasset) are equal to 1, and the rest of the columns are given by the usual differencesbetween W and Wi, i = 1, 2, . . . , r. It is obvious that, for an arbitrary strategy x,its final payoffs verify the constraints Axt ≥ 0, Axt > 0 or Axt >> 0 if and onlyif these constraints are fulfilled when the settlement value of W belongs to the setW1,W2, . . . ,Wr.22 So, the absence or existence of arbitrage may be tested under theassumption that these elements are the only possible states of the world. Furthermore,this simplification neither modifies the value of the disagreement measures m and l,nor affects the results when hedging or weak arbitrage portfolios are being computed.Consequently, we will permit W to attain all the feasible values only when testingportfolio choice models.

Once the available derivatives, their real bid-ask prices provided by CBOT, the rstates of the world and the matrix A are fixed, we can compute the measure m andthe portfolio x∗ introduced in Theorem 2. If m = 0, there are arbitrage opportunities.This case has never appeared along the tested periods.

Next, we fix an arbitrary option Sj0 , j0 = 2, 3, . . . , n, and consider an agent whocan buy this derivative by paying the price vj0 .

23 If the new values for m and x∗

show the presence of arbitrage and the profits represented by m are high enoughto overcome the market frictions, it may be concluded that the market allows us toprice Sj0 by arbitrage methods. An agent can offer a new bid price v′j0 (such thatvj0 ≤ v′j0 ≤ cj0 and, therefore, better than the current bid price vj0) without any kindof risk. The position will be hedged by implementing the arbitrage portfolio x∗ if anew investor accepts the new bid price.

Analogously, one can analyze if the ask price cj0 may be improved. Just considerthat cj0 equals both, the bid and the ask price, and compute the new solutions for mand x∗.24

The above procedure can be applied for all the available securities (for j0 =2, 3, . . . , n) in order to test how often the market allows us to price by strong ar-bitrage methods. The empirical results are confined to Table 2.

22Strategies 1 and 2 below illustrate this fact. Notice that the same property holds if one writes1 instead of 0 in the right side of above inequalities.

23i.e., the bid-ask spread vanishes for the jth0 − security. The rest of the prices is not modified. Of

course, this analysis has not been implemented in cases where vj0 = 0.24This analysis has not been implemented in cases where cj0 = ∞.

Page 202: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

194 Balbas, Longarela And Lucia

Table 2: Second Type Arbitrage Opportunities. The bid-ask spread has been removedfor each option at a time and its price was set equal to alternatively the bid quote and theask quote when possible. The table summarizes the resulting arbitrage opportunities of thesecond type and their associated optimal gains as quantified by the m measure. First twocolumns show the no. of days for which there are some arbitrage opportunities. Subsequentcolumns give statistics computed over those days with arbitrage opportunities (m = 0).

This particular type of arbitrage is quite often detected. It should be noted that theseresults seem to reveal that the price setting process might be improved. Hedging (witharbitrage portfolios) would be feasible. The arbitrage profits are quite large and thisshould be used by investors to offer new prices. For the National Annual-98 index,arbitrage opportunities appear in seven out of 36 days for the first period (see Table2) and in up to three different cases. The maximum value of m is equal to .1398(this corresponds to an l value of .0752). For the second period and the same index,arbitrage is feasible every day for up to three different available premium quotes. Thistime the maximum value of m is .375 (l = .2308). This reflects a riskless benefit thatamounts to a 37.5% of the total monetary value of the sold assets (or a 23.08% of thetotal monetary value of all traded assets). With respect to other indices, Californiaand Eastern include a unique position that allows for arbitrage hedging in the firstperiod (the maximum value of m is .2105 and .0698, respectively) and the same maybe said about the Eastern index in the second period (maximum m = .1023). Nomisspricings were found for the Southeastern index. In any event, the number ofavailable positions were notably low for these last three indices (see Table 1). Thus,note that for a significant percentage of days, agents could analyze the bid-ask spreadand offer more efficient prices in some cases without assuming any kind of risk. Thisfact should lead to smaller spreads.

For illustration purposes, we show in Table 3 the optimal (maximum m value)second type arbitrage portfolio detected on date 07/24/98 for the Eastern September-98 Index (Strategy 1). Figure 1 plots the portfolio payoffs pattern for different levelsof the final index value.

Page 203: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Pricing catastrophe-linked derivatives 195

Table 3: Optimal Second Type Arbitrage on July 24, 1998 for the EasternSeptember-98 Index. This table shows the optimal second type arbitrage opportunitycorresponding to date 7/24/1998 and the Eastern September-98 Index. CA 20 40 and PU50 stand for a call spread and a put with relevant exercise prices as indicated, respectively.All derivatives available for trading together with their bid and ask prices are reported. Theprice for a zero-coupon bond (risk-less asset) with a maturity value of one point is also given.All prices are expressed in points with a value of $200. Bold face is used to indicate thoseassets involved in the detected arbitrage portfolio, and the bought or sold units are givenin parenthesis beside the affected price (a negative sign indicates a sale). The last two rowsgive the portfolio price and the m value. This arbitrage was detected when the bid quotewas set equal to the ask for the PU 50 derivative. The same arbitrage strategy was detectedfor 9 days.

Asset Bid Ask

Bond 0.93867188 0.92867188 (100)

CA 20 40 3 (−4) n.a.

CA 40 60 2.5 (−1) 3.5

CA 150 200 2 n.a.

PU 50 30 45 (−2)

Portfolio Price −10.6328

Value of m 0.1017

Figure 1. Final Payoffs of Strategy 1

Strategy 1 may be interpreted as follows: The bonds can be purchased at 93.87 andcalls can be sold at the bid prices so the net portfolio costs the owner 79.37 now (t0).

Page 204: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

196 Balbas, Longarela And Lucia

Later (t1) the owner cashes the bonds and pays the call owners. It is always adequateto cover the liability for selling the put portfolio. Therefore, the owner can ask aprice of 79.37 for a portfolio of two puts (39.68 per put) and still have a non negativepayoff without paying anything now. This is a weak arbitrage and getting more (45)per put contract provides the owner with an up front arbitrage profit.

We can also check the value of m and l. Since the price of the purchased assets(bonds) is 93.87 and the price of the sold assets is (assuming that both puts are soldat 45 per put) 104.5, then

m =104.5 − 93.87

104.5= 0.101722 and l =

104.5 − 93.87104.5 + 93.87

= 0.05358

The strategy shows that an ask price could have been reduced from 45 to 39.68 indexpoints at least. If the ask price is lower than 39.68 the strategy does not work, but anew strategy might appear. Thus, if we are interested in the lowest possible ask price(actually, it is 39.68 is this case) we have to apply the general procedure provided byTheorem 2 instead of analyzing the previous strategy.

Figure 1 also shows that the final global payoff of the strategy may be easilydetermined by means of the final payoffs obtained when the index final value Wbelongs to the set of striking prices 0, 20, 40, 50, 60, 150, 200 (connect with segmentsthe corresponding points). Moreover, the final payoff is never lower than zero if andonly if the property holds when W belongs to this set. This is the reason why we cansimplify the set of states of the world.

Let us leave Strategy 1 and go back to the general case. Since the offering of betterquotes is sometimes feasible, it is interesting to measure the highest adjustments thatcould have been implemented in the bid (an increase) and ask (a decrease) premiums.To this aim we followed the next algorithm. Focusing on one of the quotes which gaverise to the above arbitrage opportunities, we appropriately moved up or down the im-plied quote only for a tick and then searched again for arbitrage opportunities. Thisprocess was iterated until reaching a total removal of the riskless arbitrage hedging.We carried over this algorithm for each price independently. The corresponding priceand spread final adjustments are given in Table 4. For the National Annual deriva-tives, our results show price changes that range from 2.5% to 100% along with spreadreductions ranging from 5% to 56.52%. Significant adjustments were also possible forthe other indices.

It should be mentioned that some refinements of this procedure point out that amore adjusted set of prices may still be reached. If the above algorithm is not carriedout ceteris paribus, that is, if we keep the final adjusted premium before moving tothe next one, we find that new arbitrage hedging strategies could appear, therebyleading to possible further reductions in the spread.25

25As the ordering might be relevant in this case, we do not report our results.

Page 205: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Pricing catastrophe-linked derivatives 197

In short, although the market quotes studied here do not permit to gain arbitrageprofits to anyone obliged to incur in the cost of the bid-ask spread, better relativepricing by (strong) arbitrage methods is possible in the PCS options market for thestudied periods. This is important for two reasons. First, this information is usefulto traders since the whole arbitrage portfolio may be shown. Second, frictionlesspricing theory suggests that competition among traders should lead to a situationwith correct relative prices, i.e., a set of quotes that should exhaust any exploitablepossibility of making money without any sort of risk.

Table 4. Bid-Ask Spread Reduction This table shows the bid-ask spread reduction thatcan be implemented for each derivative in order to remove the second type arbitrage strategiespreviously detected. Those assets involved are reported on the left side; additionally, inparenthesis we indicate whether changes correspond to the ask quote (a), bid quote (b) orboth bid and ask quotes (b/a). CA 40 60 stands for a call spread with exercise prices 40 and60. PS 40 60 stands for a put spread with relevant exercise prices as indicated. The pricechange and the spread reduction are both given in ticks (i.e. $20 or one tenth of a point)and in percentage terms. For each asset some descriptive statistics have been computed overthose days and quotes for which changes were possible.

Some factors related to the implementation of the detected arbitrage strategiesand not considered so far might explain those relative misspricings. One of them isthe existence of transaction costs. In relation to this, it should be kept in mind thatmeasures m and l represent relative arbitrage profits, and the levels achieved by thesemeasures are high enough to reflect gains after discounting transaction costs.

Page 206: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

198 Balbas, Longarela And Lucia

Another factor is due to the number of units of each asset needed to implementsome arbitrage strategies. This number might not be available for trading. We do nothave any piece of information about the volume associated to the quotes gathered bythe CBOT constituting our sample. Nevertheless, a comparison between the volumecorresponding to the transactions made during our sample periods and the numberof derivatives needed to implement the detected arbitrage strategies lead us to thinkthat in most cases this does not seem to be a real problem.

Some final reasons might be related to margin rules or illiquidity but, anyway, theempirical results seem to be significant for researchers and traders.

4.2 Weak arbitrage and hedging portfolios

Suppose that for a fixed j0 ∈ 2, 3, . . . , n it is still obtained m = 0 after assuming thatvj0 is the ask price (respectively, cj0 is the bid price). Then, problem (4) (respectively,after the modification xj0 = −1) has been solved in order to analyze how the realbid price vj0 (ask price cj0) can be improved. This case will hold when the achievedsolution guarantees a return R or very close to R. If so, investors can offer a newbid (ask) vj0 ≤ v′j0 ≤ cj0 and the solution of (4) provides a portfolio that will almostguarantee the riskless return R if a new agent accepts the new price. Furthermore,this strategy could lead to great returns in some states of the world, and thus, it couldbe interesting for many investors.

Following this procedure hedging strategies were obtained and they were groupedinto first type arbitrage opportunities (with a guaranteed return equal to R and payoffsgreater than one in at least one state of the world) and other optimal hedging strate-gies. Both, the guaranteed net return and the maximum possible net return, werecomputed for each detected position available for hedging and mean values are givenin Table 5. We also report the corresponding mean values after substractioning thereturn guaranteed by the risk-free asset. For some states of the world, extraordinarilylarge returns might be obtained (e.g., there were first type arbitrage opportunitiesthat involved selling one call spread 80/100 and gave rise to a possible net return of2, 215.63). The minimum net return equals that of the risk-free asset for almost allcases.

Thus, an important part of the available positions might have been hedged bymeans of weak (and strong) arbitrage or other optimal strategies leading in manycases to possible returns exceeding largely that of the risk-free asset. Note that thishas been feasible even in a situation in which the underlying index is not tradable,and put derivatives are seldom available. Considerations akin to the ones pointed outat the end of the previous subsection, regarding the proper interpretation of theseresults, also apply here.

Again, for illustration purposes, Table 6 shows the optimal hedging portfolio (weakarbitrage) on date 07/01/98 for the National Annual-98 Index (Strategy 2). Figure 2plots the portfolio payoffs pattern for different levels of the final index value.

Page 207: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Pricing catastrophe-linked derivatives 199

Table 5. Optimal Hedging Portfolios: CA 40 60 stands for a call spread with exerciseprices 40 and 60, and similarly for the other possible exercise prices. CB denotes a butterflycall spread with relevant exercise prices as indicated. For each derivative, the number ofdays for which a hedging strategy was available is given and in parentheses it is indicatedwhether the hedged derivative is bought (b) or sold (s) at the optimal hedging portfolios.Guaranteed and maximum returns in average terms along with the corresponding excessesover the risk free rate, R, are also given.

Table 6. Optimal Hedging Portfolios: (Weak Arbitrage) on July 1, 1998 for the NationalAnnual-98 Index. This table shows the optimal hedging portfolio detected on date 7/1/1998for the National Annual-98 Index. CA 30 50 stands for a call spread with exercise prices30 and 50, and similarly for the other possible exercise prices. CB denotes a butterfly callspread with relevant exercise prices as indicated. The reported portfolio is a weak arbitrageportfolio which permits to hedge the purchase of the CA 60 80 derivative. All derivativesavailable for trading together with their bid and ask prices are reported. The price for a zero-coupon bond (risk-less asset) with a maturity value of one point is also given. All prices areexpressed in points with a value of $200. Bold face is used to indicate those assets involvedin the detected hedging portfolio, and the bought and sold units are given in parenthesis (anegative sign indicates a sale). The last row gives the portfolio price. The same portfoliowas available for 5 consecutive days.

Page 208: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

200 Balbas, Longarela And Lucia

Figure 2. Final Payoffs of Strategy 2

Thus, an important part of the available positions might have been hedged by meansof weak (and strong) arbitrage or other optimal strategies leading in many cases topossible returns exceeding largely that of the risk-free asset. Note that this has beenfeasible even in a situation in which the underlying index is not tradable, and putderivatives are seldom available. Considerations akin to the ones pointed out at theend of the previous subsection, regarding the proper interpretation of these results,also apply here.

The interpretation of Strategy 2 may be as follows: The purchase of five butterfliesand the sale of one CA 40 60 provides an income equal to 2.5 index points, the bidprice for the CA 60 80. Suppose that this call is bought at 2.5. Then the payoffsassociated to the sold assets are dominated (strictly in some states of the world) bythe payoffs associated to the purchased ones. So, the whole portfolio price is zerobut provides (strictly in some states) positive payoffs (weak arbitrage). Besides, if weadd the bond to this portfolio, the final payoffs dominate the bond payoffs (strictlyin some states), but we have to pay now just the bond price.

4.3 Evaluating the index real distribution and the risk-neutralprobability measure

To assess catastrophe options from an actuarial point of view, an analysis of thedistribution of possible future values of the underlying indices is required. Thereare essentially two approaches to form such probability assessments. One is to usecomputer simulation of scenarios based on a vast amount of meteorological, seismo-logical and economic information. The other relies on statistical modelling based onhistorical data.

This subsection is partially devoted to the analysis of the distributional propertiesof the National Annual Index to be used in the rest of the paper and for this matterwe concentrate on the statistical analysis of historical catastrophe data. We developa nonparametric simulation procedure in order to obtain the expected final payoffs.

Page 209: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Pricing catastrophe-linked derivatives 201

This method does not require any distributional assumption, instead, ’it lets the datatalk’. Furthermore, it relies on the empirical distribution of waiting times and theirassociated losses thereby avoiding the traditional shortage of data that is faced whenusing exclusively the empirical distribution of the final historical values of the index.

In addition, from a financial perspective, once we have exhausted the arbitrageand hedging pricing approaches, risk considerations come into place and thereforethe use of probability assessments is also necessary. As stated by Theorems 3 and 4,the underlying index real distribution is required in order to solve minimum varianceproblems. In this case, variables and parameters (dates t0 or t1, the riskless return,securities, prices etc.) are introduced by the procedures already mentioned, but theset of states of the world must be enlarged. Now this set must incorporate all theindex feasible final (at the expiration date t1) values and not only the derivativesstriking prices.

Fix a day t0 and, consequently, let us assume that all the parameters are fixed.To determine the final distribution of the underlying index W , we proceed as follows:First of all, we consider the empirical distribution of random variables T , “time be-tween two consecutive catastrophes”, and L, “losses caused by a specific catastrophe”.It is assumed that T and L can achieve several values with probabilities accordingto the empirical frequencies obtained from the real data described in the third sec-tion. Later, we simulate several values T1, T2, . . . , Ts of T till

∑s−1i=1 Ti ≤ t1 − t0 and∑s

i=1 Ti > t1 − t0, and s − 1 values L1, L2, . . . , Ls−1 of L. Each specific result Li

is incorporated if and only if Li ≥ 25 million of dollars, and we take Li = 0 other-wise. If W0 is the index value at t0, the simulation process provides the total valueW = W0 +

∑s−1i=1 Li where each Li has been previously translated into index points.

The whole simulation process is repeated a high number of times in order to attain anumerical distribution of W .

The risk neutral probabilities, defined in (2), have been determined too. We havefollowed the general method proposed by Hansen and Jagannathan (1997).26 Hence,fix a day t0 and all the parameters of the problem. Suppose that the simulationprocess has already been implemented and, therefore, the (real) probability measureµ = (µ1, µ2, . . . , µk) is known. Then, the (risk-neutral) measure λ is obtained byminimizing

∑ki=1(λi −µi)2 among the row-matrixes λ such that

∑ki=1 λi = 1, λi ≥ 0,

i = 1, 2, . . . , k, and (3) holds.

Once the measures µ and λ have been determined, we can give two theoreticalprices per security. The first one, E

µ(Sj)/R, j = 1, 2, . . . , n, is the Pure Premium,usual in Actuarial Sciences. The second (see (3)), E

λ(Sj)/R, is obtained from afinancial point of view by considering real quotes and applying the most importanttopics on static asset pricing models.

26The Hansen and Jagannathan (1997) method extends the procedure provided by Rubinstein(1994) and by Jackwerth and Rubinstein (1996) to study the effect of the volatility smile on the riskneutral probability measure.

Page 210: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

202 Balbas, Longarela And Lucia

The procedure above has been implemented for all the possible values of thecurrent date t0 (every day of our sample periods).

We restrict our observations of the value of insured losses to the sample period1990−1997 for several reasons. Figure 3 shows the annual number of catastrophes andquantity of their associated losses since 1973. As the figure suggests, while the annualnumber of catastrophes remains reasonably stable along the period, there seems tobe a general positive trend, and a structural change in the behavior of the value ofinsured losses associated with each catastrophe since hurricane Hugo hit US in 1989.However, these patterns may be only illusory. Insured losses are affected by multiplevariables ignored so far such as population growth, development, changes in insurancecoverage, number of premiums, and inflation. When a sufficient long period of time isconsidered, the adjustments of the loss series for these variables tend to homogenize it,approximating past losses to more recent ones.27 Thus, a reasonable approximation tothe adjusted series can be obtained by concentrating on recent (unadjusted) losses.28

Moreover, any adjustment of the series, which become necessary when a long periodof losses is considered, might be methodologically questionable.

Figure 3. Number of Catastrophes and Total Amount of Loss (1973-1997)

With regard to the number of catastrophes, the whole sample since 1973 has beenused. This is expected to surmount the difficulty of getting good estimates based onsmall samples for the probability of low frequency events such as catastrophes.

The simulation process described above has been implemented in order to estimatethe probability distributions of the final (end of 1999) value of the National Annual-98

27An illustration of this effect may be found in Litzenberger et al. (1996). These authors adjusthistorical loss ratios for both, the increase in population and the market penetration of catastrophecoverage.

28Anyway, the results of the simulation process only show slight modifications if adjusted data andlong periods are considered.

Page 211: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Pricing catastrophe-linked derivatives 203

index for every day in both periods. A number of 100, 000 replications has been usedfor each day. Results are given in Figure 4. As the figures show, the probability massis mainly accumulated around the index levels lying approximately in the intervals 20-100 and 160-240. The distributions are bimodal or even trimodal because (probably)the number of catastrophes must be entire. Note also that as days go by and the finaldate approaches, the probability mass tends to concentrate due to the accompanyinguncertainty reduction.

Figure 4. Probability distributions of the index final value. First period (top) and second

period (bottom)

Page 212: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

204 Balbas, Longarela And Lucia

Once the required distributions have been estimated, the next step is to computethe discounted expected options payoffs (pure premiums). These are given in Table7. Notice that the call spreads 100/120 and 120/140 have almost identical discountedexpected payoffs. This is due to the general lack of probability mass in the interval100-140. In general, pure premiums lie around options real quotes.

Table 7. Theoretical Prices for the National Annual-98 Index Derivatives. Thistable shows the average theoretical prices corresponding to the National Annual-98 deriva-tives available for trading on any day during the sample periods. CA 40 60 stands for a callspread with exercise prices 40 and 60, and similarly for the other possible exercise prices.CB denotes a butterfly call spread with relevant exercise prices as indicated. The first twocolumns give the mean pure (actuarial) premiums and the mean risk-neutral (financial)prices. The third column displays the absolute value of the difference between the previoustwo columns and the last two columns show the mean real bid and ask quotes for comparisonpurposes. All figures are given in points, each point with a value of two hundred dollars. Wealso report the mean Euclidean distance between the measures µ and λ (standard deviationin parenthesis) in the last row of each panel.

Page 213: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Pricing catastrophe-linked derivatives 205

We now use this result to infer some conclusions on the individual prices of theseoptions, based on our estimated future probabilities. First, mean midpoints of the bidand ask quotes being around mean pure premiums seem to indicate that, in averageterms, transactions in this market could have been made at reasonable prices, closeto the actuarial ’fair’ ones during the sample periods. These are good news for thoseparticipating in the market that hedge their catastrophe insurance risks: this marketseems to be an attractive alternative to traditional reinsurance, for instance, as it offersreinsurance at ’fair’ prices. However, those willing to participate in the (re)insurancemarket by selling options seeking for attractive returns over the risk-free rate mightfind it difficult to get them, at least when trading with individual options.

Second, for our sample periods, conclusions inferred from spread midpoints maysubstantially change when the real bid-ask spread is taken into account . On the onehand, in general, those hedgers able to buy at bid prices will find this market moreattractive than the usual reinsurance (for most options mean bid prices are lower thanthe mean actuarial ones) but things might turn the other way round for hedgers thatbuy at the ask. On the other hand, keeping aside, at the moment, risk considerations,investors seeking for high returns should try to buy close to the bid or sell close tothe ask.

Third, investors searching for new investment/financing opportunities also attendto risk considerations in their decisions. Analyzing risk and return on an option byoption basis hardly makes sense as it is in a portfolio choice context where risk/returnopportunities are fully understood (it is in this context where risk-pooling benefits,for instance, come into place). These are the topics considered in the next subsection.

Let us now analyze the risk-neutral probabilities. We solve the minimization pro-gram that gives their possible values and we use them to obtain the correspondingtheoretical risk-neutral prices. These are also given in Table 7.29 We also report theaverage value of the objective function for both periods, and the resulting discrep-ancies between pure (actuarial) premiums and prices calculated with the risk-neutralprobabilities. As these figures show, it might well be concluded that real prices, assummarized by the linear pricing rule extracted from them, are reasonably close totheir ’fair’ value.

Lane and Movchan (1999) also consider real market mid-year 1998 prices andcompute a compatible risk neutral probability measure.30 They follow a differentand interesting approach because they do not use any real distribution µ. Instead,they impose the constraints (3) and minimize the differences between the prices ofreal transactions and the theoretical prices provided by the second term of (3). Thismethodology could show some advantages with respect to the one we followed because

29Risk-neutral prices certainly verify the bid and ask quote restrictions day by day, even thoughthe reported mean risk-neutral prices do not have to lie inside the mean bid-ask spread; the bid/askquote may not be present whenever these prices are computed (we use the term ’risk-neutral prices’as has become usual in finance).

30We thank an anonymous referee for pointing out this reference.

Page 214: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

206 Balbas, Longarela And Lucia

we could commit errors when evaluating µ (although the authors assume a specifictype of distribution for the relevant random variables). However, bearing in mindour purposes, we preferred to obtain λ from µ for several reasons. First, one of thepresent paper main objectives is to give well diversified portfolios and (as pointedout by Theorem 4), consequently, the measure µ is required. Second, the theoreticalprices obtained by Lane and Movchan are very close to the risk-neutral prices providedin Table 7. Third, as will be pointed out in next subsection, the main conclusionsconcerning well diversified portfolios seem to be more robust if we take λ as close toµ as possible.

4.4 Looking for well diversified portfolios

Consider an arbitrary date t0, the probability measures λ and µ obtained for t0 inthe previous subsection, and the linear pricing rule π such that πj = E

λ(Sj)/R,j = 1, 2, . . . , n. Then, the (unique) discount factor d of Theorem 3 may be easilyfound by means of the following conditions

dt ∈ span(A)k∑

i=1

aij di µi = πj , j = 1, 2, . . . , n

The condition dt ∈ span(A) leads to a simple linear system of equations. In fact,consider the matrix B = (A,dt) (i.e., add the column dt to A) and impose that theranges of A and B must be identical.

According to Theorem 4, the minimum-variance strategies are obtained by sell-ing the portfolio x = (x1, x2, . . . , xn) such that Axt = dt. The portfolio x∗ =(0, x2, . . . , xn)31 will also provide a very useful information. Depending on the sign ofits theoretical price

∑nj=2 πj xj , we know when variance-averse individuals must sell

or buy derivatives in their reinsurance-linked portfolios. As it will be shown later, itturned out that quite often investors in the PCS options market must sell derivatives(the sign is positive).32

For the empirical analysis we first excluded those redundant derivatives for eachday. See Table 8 for a summary of the main results. With regard to the x∗ portfolio,this was mainly composed of bonds (87.98% and 68.36% in average terms for thefirst and the second periods, respectively) and its mean (gross) return equals .9460and .9096. The portfolio x∗ has a positive value for 77.78% of the days in the firstperiod and 81.48% in the second. Thus, risk-averse investors should view the PCSoptions market as a very profitable source of capital that allows them to finance theirinvestments in other markets.

31I.e., the portfolio x once the bond has been excluded32Notice that we are considering investors willing to participate in the catastrophe insurance market

through PCS options in order to benefit from their new risk/return opportunities when included indiversified stock and bond portfolios. Of course, insurers, who must hedge their proper liabilitieswhen the final index value becomes large, follow different portfolio criteria.

Page 215: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Pricing catastrophe-linked derivatives 207

Table 8. Well Diversified Portfolios. The first two rows show the risk/return charac-teristics of the entire portfolio by providing the expected return and its standard deviation,respectively (returns defined as payoffs divided by the risk neutral price). The third rowgives the weight of x∗ (the derivatives portfolio) over the entire diversified portfolio, whilethe fourth row shows the price of x∗ in index points. Finally, the number of days in whichx∗ has positive price is indicated in the last row.

Table 9. An Example of Two Well Diversified Portfolios. This table shows the assetweights of the derivatives portfolio x∗ for two selected days. Weights were calculated asvalue invested in the asset divided by the portfolio value (a negative sign indicates a sale).The corresponding risk-neutral prices are also reported. The weights for these derivativeportfolios over the entire (bond included) portfolios are 0.29 and 0.63 for panels A and B,respectively.

Page 216: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

208 Balbas, Longarela And Lucia

Let us remark that the last conclusion concerning the sign of the price of x∗ seemsto be robust with respect to the measure λ used in the analysis. In fact, when λis obtained by minimizing the distance to µ, we are minimizing the Risk Premium,difference between the risk-neutral price and the actuarial pure premium. Thus, if wetake a new measure λ′ for which (3) holds but such that λ′ = λ, the risk premiumwill probably increase and short positions in PCS options will probably be moreinteresting for traders.

In order to further illustrate the relationship between probabilities µ and λ, andthe portfolio x∗ payoffs (appropriately standardized), these variables are plotted atFigure 5 for a representative day of both periods. It is clear that the portfolio finalpayoff becomes significantly negative only for states of the world (index final values)with slight probability.

Figure 5. Standardized Payoffs of Portfolio x∗ on February 25, 1998 (top) and July 30,1998 (bottom), along with the corresponding Risk-Neutral Probabilities

Page 217: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Pricing catastrophe-linked derivatives 209

5 Concluding Remarks

All along the paper it has been shown that arbitrage arguments, in a static setting,very often allows us to price catastrophe-linked derivatives and reduce their bid-ask spread. Though the empirical literature concerning the existence of arbitragein real financial markets usually focuses on concrete well-known arbitrage portfolios(put-call parity, relationship between spot and future prices, etc.), this proceduredoes not apply to catastrophe-linked derivatives. We have followed more complexmethodologies that are based on the main principles of asset valuation and providearbitrage portfolios without previously specifying the exact nature of the arbitragestrategy to be used. This seems to be a significant difference with respect to otherfinancial papers. Furthermore, the procedure to detect arbitrage portfolios has beengiven and some illustrative examples have been presented.

Hedging arguments have also been applied and, again, they have shown manypossibilities to price these derivatives. The hedging portfolios have been computed byusing general procedures too, rather than usual particular methods that only applyin special situations. Concrete examples of hedging portfolios have been given.

The Theory of Portfolio Selection also yields suitable strategies to invest. More-over, if the bid-ask spread is reduced by arbitrage, the real quotes available in themarket show very significant particularities. Linear pricing rules compatible with thequotes usually imply theoretical prices quite close to the actuarial pure premiums.However, even though a well diversified portfolio (in a variance aversion context) iscomposed of different catastrophe-linked derivatives in short and long positions, itsprice is usually negative (i.e., the total price of the sold derivatives is greater thanthe total price of the purchased ones) and this capital must be invested in shares andbonds.

Catastrophe-linked derivatives can usually be added to a portfolio of other as-sets to the mean-variance advantage of the portfolio holder. This result emanatesfrom the fact that catastrophe derivatives outcomes are uncorrelated with bonds orstock outcomes. But the conclusion presented in the previous paragraph providesan important additional information. In a well diversified portfolio, the price of thecatastrophe derivatives is usually negative.

The last comment lead to significant implications. Insurers can consider the mar-ket in order to buy reinsurances and hedge their liabilities. The price paid may beadequate paid with respect to the pure premiums. On the contrary, variance averseinvestors whose risk does not depend on the indices can use catastrophe-linked deriva-tives to compose portfolios with negative price that must be invested in other type ofassets. This makes the market very attractive because it allows us to appropriatelydiversify among many investors the risk due to catastrophic events. However, we mustnotice that these properties hold for linear pricing rules and, therefore, it is importantto reduce the real bid-ask spreads observed in the market. As mentioned above, thisis possible by arbitrage and hedging arguments.

Page 218: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

210 Balbas, Longarela And Lucia

Well diversified portfolios have also been determined by applying a very generalmethod. In fact, the optimal mean-variance strategies are given by densities betweenrisk neutral measures and initial probability measures, rather than by correlationsassociated with the returns of the available catastrophe-linked derivatives.

The applied methodology seems to reveal two interesting advantages. It is usefulfor traders because practical criteria and strategies to invest are provided. Moreover,it seems to be general enough to apply in many other contexts. Only two properties areneeded. The underlying uncertainty must be easily identified (arbitrage and hedging),and the probability space that explains its behavior, along with the risk neutralprobability, needs to be determined (variance aversion).

AcknowledgmentsResearch supported by DGICYT (Reference Number: PB95-0729-C02-02), Comu-

nidad Autonoma de Madrid (project on Complex Decision Problems) and FundacionCaja de Madrid.

This paper is a simplified version of Balbas Longarela and Lucia (1999) andcorrespond to those preliminary results presented by the authors at Seminario deMatematica Financiera (organized by MEFF-RV and Universidad Autonoma de Ma-drid, November 1998).

We would like to thank Vicente Meneu (Universidad de Valencia) and Cara Eu-genia Garcia (Universidad Carlos III de Madrid) for very useful comments on thearticle.

We are also very grateful to L.P. Hemond (Chicago Board of Trade) and G. Kerney(Property Claim Service) for providing us several databases. Mr. Kerney also helpedus to clarify interesting aspects of the PCS indices.

Important information to understand some properties of the PCS options contractsand the quotes data was kindly provided by Michael J. Tomas, from CBOT.

The usual caveat applies.

References

[1] Balbas A., P.J. Guerra and M.J. Munoz (1998). “Measuring the Arbitrage Op-portunities in an Intertemporal Dynamic Asset Pricing Model”. Applied DecisionAnalysis, Kluwer, Boston, 159–172.

[2] Balbas A., I.R. Longarela and J. Lucia (1999). “How Financial Theory Applies toCatastrophe-Linked Derivatives. An Empirical Test of Several Pricing Models”.Journal of Risk and Insurance, 66, no. 4, 551–582.

[3] Balbas A. and M.J. Munoz (1998). “Measuring the Degree of Fulfillment of theLaw of One Price. Applications to Financial Market Integration”. InvestigacionesEconomicas, 22, no. 2, 153–177.

Page 219: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Pricing catastrophe-linked derivatives 211

[4] Canter M.S., J.B. Cole and R.L. Sandor (1996). “Insurance Derivatives: A NewAsset Class for the Capital Markets and a New Hedging Tool for the InsuranceIndustry”. Journal of Derivatives, 4, no. 2, 89–105.

[5] Cummins J.D. and H. Geman (1995). “Pricing Catastrophe Insurance Futuresand Call Spreads: An Arbitrage Approach”. The Journal of Fixed Income, 4, no.4, 46–57.

[6] Chamberlain G. and M. Rothschild (1983). “Arbitrage, Factor Structure andMean-Variance Analysis of Large Assets”. Econometrica, 51, no. 5, 1281–1304.

[7] D’Arcy S.P. and V.G. France (1992). “Catastrophe Futures: A Better Hedge forInsurers”. The Journal of Risk and Insurance, 59, no. 4, 575–601.

[8] Duffie D. (1988). “Security Markets: Stochastic Models”, Academic Press.

[9] Garman M.B. (1976). “An Algebra for Evaluating Hedge Portfolios”. Journal ofFinancial Economics, 3, no. 4, 403–427.

[10] Geman H. and M. Yor (1997). “Stochastic Time Changes in Catastrophe OptionPricing”. Insurance Mathematics and Economics, 21, no. 3, 185–194.

[11] Hansen L.P. and R. Jagannathan (1997). “Assessing Specification Errors inStochastic Discount Factor Models”. The Journal of Finance, 52, no. 2, 567–590.

[12] Hansen L.P. and S.F. Richard (1987). “The Role of Conditioning Informationin Deducing Testable Restrictions Implied by Dynamic Asset Pricing Models”.Econometrica, 55, no. 3, 587–613.

[13] Ingersoll J.E. (1987). “Theory of Financial Decision Making”, Rowman & Lit-tlefield Publishers Inc.

[14] Jackwerth J.C. and M. Rubinstein (1996). “Recovering Probability Distributionsfrom Option Prices”. The Journal of Finance, 50, no. 6, 1611–1631.

[15] Jaffee D.M. and T. Russell (1997). “Catastrophe Insurance, Capital Markets andInsurable Risk”. The Journal of Risk and Insurance, 64, no. 2, 205–230.

[16] Jouini E. and H. Kallal (1995). “Martingales and Arbitrage in Securities Marketswith Transaction Costs”. Journal of Economic Theory, 66, no. 1, 178–197.

[17] Lane M. and O. Movchan (1999). “The perfume of the premium II”. DerivativesQuarterly, 5, no. 3, 27–40.

[18] Litzenberger R.H., R.D. Beaglehole and C.E. Reynolds (1996). “Assessing Catas-trophe Reinsurance-Linked Securities as a New Asset Class”. Journal of PortfolioManagement, Special Issue, 76–86.

Page 220: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

212 Balbas, Longarela And Lucia

[19] Prisman E.J. (1986). “Valuation of Risky Assets in Arbitrage Free Economieswith Frictions”. The Journal of Finance, 41, no. 3, 545–56.

[20] O’Brien T. (1997). “Hedging Strategies Using Catastrophe Insurance Options”.Insurance Mathematics and Economics, 21, no. 2, 153–162.

[21] Rubinstein M. (1994). “Implied Binomial Trees”. The Journal of Finance, 69,no. 3, 771–818.

[22] Tomas M.T. (1998). “A Note on Pricing PCS Single-Event Options”. DerivativesQuarterly, 4, no. 3, 23–28.

Alejandro BalbasDepartamento de Economıa de la Empresa

Universidad Carlos IIIC/ Madrid, 126

28903–Getafe (Madrid)[email protected]

Julio LuciaDepartament d’Economia Financera i Matematica

Edifici Dptal Oriental (5e pis)Campus del Tarongers

Universitat de Valencia46071–Valencia

[email protected]

Page 221: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Derivatives as Tradeable Assets

Terry J. Lyons1

1 Introduction

Consider a market with a heavily traded asset, where a secondary market for vanillacall options has developed, and where the voltility in the price of the fundamental assethas a stochastic fluctuations. This paper aims to develop a model and methodology forthe joint behviour of the prices of the call option and underlying asset. In consequence,we are able to provide a more systematic approach to hedging and pricing other lesscommonly traded derivatives.

The existence and market price of the traded derivative should strongly influencethe hedging and pricing behaviour of a bank or intermediary selling the OTC deriva-tive2; it provides a new opportunity to hedge risk, it introduces a danger of arbitrage,and it changes the market price of the OTC derivative via the market practise ofusing implied volatilities.

Our objective can be summarised as the identification of low dimensional models,complete in market priced assets, where the liquid derivatives and the underlying assetsare independent tradeable assets.

To be useful, a model must be consistent3, risk adjusted, and provide a reasonablyexplicit description for the dynamics of the traded assets; it should allow one to reducethe hedging/pricing question to standard and computationally feasible calculationsin the spirit of the classical theory of arbitrage theory. OUr models have all theseproperties.

1.1 Stochastic Volatility —an academic approach

The existing academic literature approaches our question indirectly, looking at modelsfor stochastic volatility and the market premium for risk. We are not happy with thedetails of such an approach, as the relationship between the hard to measure “marketpremium of risk” and the volatility of the liquid derivative, and the underlying assets

1Terry J. Lyons es profesor del Departamento de Matematicas del Imperial College de Londres.Esta charla se impartio en la sesion del Seminario MEFF-UAM de diciembre de 1998.

2For simplicity we use the term OTC derivative when we refer to the derivative an intermediaryis interested in pricing and selling, and a traded derivative when we refer to the derivative with amarket price.

3Force the pricing relationship between derivatives and the underlying that arise because of ar-bitrage. See later for the definition.

Page 222: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

214 Terry J. Lyons

seems too distant to be reliable. As the full matrix of joint volatilities of the tradedassets is the essential quantity that influences price it seems wise to model thesedirectly.

To understand this point consider a basket of underlying assets and the idealisticsituation where a Markov model has been constructed which perfectly describes therandom evolution of their prices and their volatilities:

dSt = µ (St, φt) Stdt + σ (St, φt) StdWt ,

dφt = b (St, φt) dt + ρ (St, φt) dVt ,(1)

where φ is an extra state variable that captures all that is important to the evolutionof the system. In general the state variable will not be directly tradeable. Let us addto our assumption on the model (1) that the dimension of the additional state variableφt in this model can be matched to the number of traded options

Oi |i = 1, ..., d

.

However, on it’s own, and even if the model perfectly captured the behaviour of oursystem, (1) will not price any of the assets Oi; information concerning attitudes torisk must be added.

In his pioneering paper, Vasicek [5], observed that although prices of the Oi arenot determined by such a model, arbitrage assumptions force the prices of differentderivatives products to be mathematically interrelated, and this insight points the wayto the explicit identification of the extra ingredient that must be identified makingthe prices unique.

1.1.1 The market premium for risk

The Markovian assumptions embodied in (1) ensure that at any time t the two statevariables (St, φt) contain all the information that is available at time t concerning thefuture evolution of St. It is therefore at least plausible to assume that the price ofany option or derivative on S should be a function of (St, φt) alone. The arbitragearguments of Vasicek show how the existence of such a family of pricing functions isessentially equivalent to the assumption that the market attaches a consistent marketprice to risk. We will not re-derive the equivalence here, but to set up notation, wewill explain how the model (1) leads to a huge range of different pricing model andhedging strategy, each suggesting it’s own model for the joint volatility of (St, Ot) .

Let b (St, φt) be any bounded function, which we refer to (somewhat loosely) asthe price of risk. Consider the change of measure from P to P

b so that under the newmeasure, the model for (St, φt) satisfies the stochastic differential equation:

dSt = σ (St, φt) dWt ,

dφt =(ρ (St, φt) b (St, φt) + b (St, φt)

)dt + ρ (St, φt) dVt .

(2)

Providing σ do not become zero Pb is absolutely continuous with respect to P, so

that any argument (e.g. about hedging) holds almost surely with respect to the oneprobability measure will also hold almost surely with respect to the other.

Page 223: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Derivatives as Tradeable Assets 215

Suppose for simplicity that the terminal time for each option Oi is T and thatOi

T = F i (ST ). Define Obt by setting

Obt = E

b [F (ST ) |Ft ] .

It follows from the Markov property, that Obt is a function Ob (St, φt, t) of the state

variables. Exploiting the equality of dimension between the variables Obt and φt it will

generically the case that Ob (St, •, t) is at least locally invertible. To make our pointmore simply, we further assume that it is globally invertible so that φt = φb

(Ob

t , St, t)

is it’s inverse.

In this case, the new variables Obt when taken with St are also a complete set of

state variables. Indeed, (Obt , St) will be Markov and we can recover its joint volatility

by differentiating the inverse function. Under Pb the process (Ob

t , St) is a martingaleand satisfies the SDE

dSt = 0dt + σ(St, φ

b(Ob

t , St, t))

StdWt

dObt = ρ

(St, φ

b(Ob

t , St, t)) ∂Ob

∂φ

(St, φ

b(Ob

t , St, t)

, t)

dVt

+σ(St, φ

b(Ob

t , St, t)) ∂Ob

∂S

(St, φ

b(Ob

t , St, t)

, t)

dWt

This system of tradeable assets is obviously complete, and any contingent claim whichis functionally dependent on the underlying assets St (or even on the derivatives Ob

t )can be expressed in a unique way as a stochastic integral against the assets (Ob

t , St).

Therefore our choice of b has lead to a consistent model with known volatility forthe joint evolution of the prices for our fixed choices of options and the underlying.Assuming we have correctly identified market price of risk so that the volatility of theprices corresponds to reality, we can provide a consistent risk free hedging strategyto price any given contingent claim.

1.1.2 The essential difficulty

So what is the problem with the Vasicek approach set out above?

1. There is an obvious difficulty in choosing the function b sensibly, this becomesparticularly tricky when one realises that stable hedging and pricing that is ro-bust to small changes in the modelling relies on understanding the joint volatilityof the traded assets (Ob

t , St). The riskless hedge is completely determined bythe volatility of the tradeable assets, in our case (St, Ot). Get their volatilitywrong, and the second order effects of hedging will cause the portfolio value todrift away from its planned value. The approach outlined above implicitly forces

Page 224: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

216 Terry J. Lyons

one to identify this “market price of risk function” b, solve the PDE to find theprice function Ob for this model, compute the inverse, and the derivative, tofinally get the volatility of the option (St, Ot). Unfortunately, this relationshipis not explicit or local. Changes in the values of b away from the current valuesof the state variables will change the volatility of (St, Ot) ; moreover, the effectis indirect and even obscure. The lack of a transparent relationship betweenparameters and the critical volatilities and lack of measures of the errors in thejoint volatility arising from different price of risk models means that they cannotcurrently be regarded as robust.

2. A second related problem concerns the state variable φ. If it has an intrinsicmeaning as representing some economic factors, then it is going to evolve andhave a value; in theory once the market premium of risk has determined thevalues of (St, φt) each of the options Oi

j has its price completely determined. Ingeneral, this will inevitably produce a conflict with market prices. Recalibrationreplaces this difficulty with an ever changing model for the volatility and hedginglosses.4

1.2 Practitioner approaches

Probably the most common approach adopted by practitioners to accommodate theexistence of prices for traded derivatives is calibration. One can consider modelswhich are complete in the underlying assets but which have a number of undeter-mined parameters. By setting the parameters so that their model produces prices fortraded derivatives that agree with market prices they hope that the Black Scholesframework will adequately reflect the interrelated movement of the OTC option andthe underlying asset and permit it to be hedged.

In other words, implied volatility is used to accommodate the reality of derivativespriced independently by the market, in the hope that the market will incorporate allrelevant historical pricing data relating to the volatility of the underlying.

This approach gives no protection against the implied volatility moving. An in-termediary may well use some vega hedging in an attempt to minimize the impact onportfolio values when the calibration implied by the derivatives undergoes changes.

This “practitioner” approach is computationally feasible and of course this is veryimportant, but it also has considerable limitations. Without a vega hedge, there iscomplete exposure to model risk and a shift in the implied volatility can result in asignificant change in the value of the portfolio. But as we will see later, vega hedgingis an imperfect attempt to avoid this difficulty.

4Our approach in this paper is only free of such criticism if one uses historical data to calibrate thejoint volatility model as the prices of assets and traded derivatives are independently incorporated.However, if one had many traded derivatives and some were used to calibrate our model (e.g. tomatch smile) then our approach would be subject to the same criticism.

Page 225: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Derivatives as Tradeable Assets 217

Moreover, the implicit assumption that the market in the underlying assets iscomplete raises a serious intellectual obstruction to tackling our main question: howshould we hedge when we have traded options. This difficulty arises because theimplicit consequence of this assumption is that the liquid option can be synthesizedas a portfolio in the underlying asset alone. One is forced to conclude that the liquidderivative adds nothing to the market and is redundant when one tries to hedge.

The stochastic volatility approach has more intellectual validity and avoids thissecond conflict. However, it generally lacks computational bite and cannot always betranslated into a realistic hedging strategy. The risk from the need to recalibrate doesnot in general go away.

1.3 This paper

This paper aims to provide a more limited and more computationally valid mathe-matical framework for analyzing and determining the appropriate price for an OTCderivative, and a hedging strategy to synthesize the same, in the presence of nearbyliquid derivatives. In outline one could say that our approach is guided by the principlethat once a product is heavily traded in the market, its price has it’s own independentvolatility and (in so far as it influences the pricing of our OTC options) should beincluded in our vector of prices. The problem is to model that volatility reasonablyaccurately using models that are complete in the visible traded assets including theoptions.

Of course we will never be able to completely characterize the joint volatilitiesof the options and underlying correctly. But we are not so concerned by this forthe following two reasons. We see the situation as parallel to the primeval days whenBlack and Scholes had just arrived and where historical models of volatility sufficientlyaccurate to price and hedge derivatives. The pricing of OTC option is now essentiallya second order process as liquid derivatives can be used to offset much of the risk ina contract and really one only has to price a smaller residual contract; substantialerrors in this residual price will not radically affect the price of the original contractof interest. It is for this reason that banks are willing to enter OTC contracts at all—under the surface they hope they are really entering contracts with much smallertotal downside and pretty uncertain price, but with the uncertainty compensated bylarge profit margins to compensate for the high risks.

Although we leave the investigation of this aspect for another paper, it is quitepossible to introduce non-linear pde’s to take into account the uncertainty of thevolatilities we model, following [2]. We expect this more robust approach to havesimilar features to the intuition we mention above. Residual contracts will see a bigspread between buy and sell reflecting the uncertainties that cannot be hedged away.However, the “nearness” of many OTCs to existing derivatives will result in the priceof a typical OTC being small. The spreads in the prices of the residuals are a reflectionof uncertainties, but will always remain within arbitrage limits.

Page 226: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

218 Terry J. Lyons

The structure of the paper can be summarized as follows:

1. We first review in a less discursive way, two standard industrial approachs tothe existence of liquid derivatives: calibration with implied volatilities and vegahedging.

2. Then, we analyze the above approach for the minimalist example where there isa single stock, cash can be borrowed and lent at zero rate of interest, and thereis exactly one liquid derivative with a price in the market. The liquid derivativewill be a simple European call option of fixed strike price and maturity.

3. Staying with the same simple framework we propose approximate volatilitymodels for the joint volatility of the call and the underlying. We will call sucha volatility model consistent if, with probability one for the associated riskneutral measure, the paths of the call and the underlying coalesce appropriatelyat the maturity time. We illustrate this by showing that our main model isconsistent, but that it is a delicate matter as small perturbations to it are not.The prices of contingent claims can therefore be calculated and hedged usingthe standard known volatility/no arbitrage paradigm. However, the price ofthe liquid derivative and the underlying asset are no longer deterministicallyrelated, and the hedge involves them both in a dynamic way.

4. The basic calculations in (3) do not depend on the underlying model beinglognormal motion, nor are they dependent on there only being one derivativetraded in the market. Combining Dupire’s approach[1] with ours, we believethat the case of a market with traded call options at many different strikes andcould also easily be accommodated.

2 Standard practise explored

2.1 A simplistic example

A very simple example should focus attention. Suppose a single security is freelytraded, and has price processes St and that in addition there is a single option freelytraded on the market with price process OK,t, where for simplicity, the option is aEuropean call, with payout at a fixed maturity T given by (ST −K)+. Now supposethat a client approaches an intermediary wishing to purchase or sell a similar optionon the same underlying, with the same maturity time T , but with a strike priceK ′ = K. There are a number of alternatives that can might taken in developing theprice OK′,t for this new option.

1. In the first case5 one could collect large amounts of data relating to the volatilityof the underlying security, using this historical data, to estimate volatility forthe new option; then use the Black and Scholes model.

5We do not suggest this is sensible or done in practise.

Page 227: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Derivatives as Tradeable Assets 219

2. In the second case one could back out an implied volatility from the tradedoption under the assumption that it satisfies the Black and Scholes model forsome choice of the volatility, and use this implied volatility as a substitute forthe experienced volatility in the Black and Scholes formula to price the newoption.

Hybrid’s are also possible. Of course the first approach ignores the marketed optionand leaves the bank open to arbitrage and is really a non-starter although it mightbe an excellent approach in an immature market where options are not freely traded.The second approach, effectively the industry standard, is an interpolation whichignores historical data and cannot directly accommodate more market prices thanthere are parameters in the model.

Hedging the resulting contract poses additional questions. Some are not easilysettled in the classical theory. Common sense suggests that there is a huge differencebetween a hedging strategy that holds the security and numeraire alone, and one thatalso uses the traded option. Unfortunately, the classical theory following on fromapplying Black and Scholes predicts that the traded option can itself be synthesizedusing the underlying security and so gives no guidance about how much of the tradedoption the bank should hold when hedging the OTC option.

In practise this difficulty in hedging is often finessed, in this case one could pur-chase a unit of the traded option, and then use the underlying to dynamically hedgethe residual liability using the standard theory and implied volatility. For the simplecontracts studied here, this approach, with it’s static hedge in the traded derivativeis obviously a much more stable and lower risk strategy than hedging the originalclaim in terms of the underlying alone. The residual contract has a maximum valueof |K − K ′| and if this is small, even quite substantial errors in hedging the residualwill not seriously affect the price of the original contract. However, it is not obvious,even in this simple example that the static hedge is the best one.

In theory and for K ′ > K, one could develop a hedging strategy by taking note ofthe fact that the call option with strike K ′ > K is an option on an option with thestrike K. So that providing we could identify a model for the volatility of OK, t wecould dynamically hedge the derivative OK′, t in terms of OK, t and cash.

2.2 The generic approach

More generally and for more complex products, we can caricature the industry stan-dard approach as follows:

• Identify and isolate components of the contract that can be priced separately,and also identify the products available in the market which are “financiallyclose” to the OTC contract we are trying to price. Use the market prices ofthese to calibrate a model by backing out the volatility of the underlying assets.The calibrated model is then used to price the new contingent claim and to

Page 228: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

220 Terry J. Lyons

value the existing portfolio. The deltas predicted by this calibrated model areused to decide the mix of cash and the underlying securities required to hedgethe portfolio.

• Also recognize that if the market changes its view of volatility the prices of thetraded options will move independently of the underlying securities to reflectthis, and that such changes are not hedged at all using the approaches outlinedabove. So introduce a second level of hedge (known as vega) —where tradedoptions are introduced into the portfolio so that to first order, the portfolio isneutral to movements in the specified implied volatilities as well as the under-lying.

Both approaches have problems attached to them. The former obviously leaves theintermediary wide open to movements in the market view of volatility. Vega hedgingbrings more subtle problems. If one were to analyze it mathematically, one wouldappreciate that it produces a risk free hedging strategy only if the volatility of theimplied volatility is zero, for in any other case the second order effects of hedgingwill produce a portfolio whose value drifts away from the desired stationary value.It can also have hidden instabilities. None the less one might consider it a plausibleapproach in the case where the “vol of vol” was small.

2.2.1 Vega hedging our simplistic example

Before proceeding to the main part of the article, we briefly look at the consequencesof using implied volatility and vega hedging in the simplistic example of a liquid Eu-ropean option with strike K and an OTC European option with strike K ′ introducedin Section (2.1). Without the stabilising effects of transaction costs etc. vega hedgingexhibits a phase transition making the computation more interesting and acting as ageneral warning of instability. We take advantage of this example to set up notationthat will hold throughout the article.

2.3 Notation

Suppose that the price process St for the securities is modelled by a random Markovprocess

dSit = ai (St) dt + σi, j (St) Si

j dW jt

with risk adjusted probability measure P so that under this law

dSit = σi,j (St) Si

t dW ij .

It is well known that for this model, and under regularity conditions to ensure integra-bility, and conservativeness, the price pF (s, t) of European option with payout F (ST )at a predictable maturity time T and with the current time being t and the currentstock price being St is given by pF (s, t) = E [F (sT )| st = s]. The standard BlackScholes model corresponds to the case where σi, j = σ if i = j and zero otherwise, and

Page 229: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Derivatives as Tradeable Assets 221

there is only one stock. In this case we call the scalar σ the volatility. A call optionwith strike price K corresponds to a payout F (s) = (s − K)+.

Definition 1 Let p (s, τ) denote the standard Black-Scholes arbitrage free price ofan option based on a security with geometric Brownian trajectories, strike price 1,current price, volatility 1, and having τ units of time to run till maturity.

Scaling arguments yield from p the price of an option under different volatility andstrike assumptions. Because the price process is characterized by dst = σ st dWt

standard scaling arguments show

E

[(sT − K)+ |st = s

]= Kp

(s/K, σ2 (T − t)

)and using the representation for st = s0e

σ Vt− 12 σ2t where V is another standard

Brownian motion one can integrate to obtain p in the well known closed form

p (s, τ) :=12

(−1 + s − Erf

(−r + 2 log (s)2√

)+ sErf

(r + 2 log (s)

2√

)). (3)

The closed form is useful for numerical calculations, but for much of what we do inthis paper it is better to use the symbolic form Kp

(s/K, σ2 (T − t)

). The function p

satisfies the well known Black Scholes pde with the following normalisation

12s2 ∂2p

∂s2− ∂p

∂τ= 0 . (4)

Varying σ between 0 and ∞ we see that any market price of the option satisfying thearbitrage bounds (st − K)+ ≤ OK, t ≤ st is attained for a unique τ (OK, t) ∈ [0,∞].

Definition 2 We say τ (OK, t) is the estimated operational time to maturity associ-ated to the current price of an option with security price s, option price OK, t. It isthe unique solution in τ to the equation.

Kp (s/K, τ) = OK, t.

σ =√

τ(OK, t)(T−t) is the implied volatility determined by option price.

Definition 3 The actual operational time to maturity is given by the integral of theempirical volatility between now and maturity∫ T

t

σ2 (St) dt.

The justification for the term operational time should be apparent to anyone withexperience of the classical Black and Scholes model. It is a (random) variable reflect-ing the turbulence to be faced. In the classical model, the standard discrete proofdemonstrates how one can hedge perfectly by reapportioning ones assets every time

Page 230: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

222 Terry J. Lyons

the underlying share goes up or down by a set percentage. The standard continuousresult is obtained by taking the limit. However, the whole approach only works if oneknows, in advance how many such step changes in price there will be before maturity.One does not need to know how regularly, or irregularly these changes occur, onlyhow many there are going to be. In our language, operational time measures thenumber of such intrinsic ticks and in the standard model these come regularly andoperational time is proportional to time; but in the real world where the volatility ofthe security may change, the amount of operational time before maturity will not beknown in advance. In this case, the option price can be regarded as a representationof the market view of exactly how much operational time there will be from time tmaturity.

2.4 Pricing and hedging

The market approach of using implied volatility we described in remark 2 from sec-tion (2.1) can be summarized as saying that one would value the second option atK ′p (s/K ′, τ (OK ,t )). There are then two standard approaches to hedging it.

The first uses only the underlying, and assumes (or hopes?) that the impliedvolatility will not change, and also assumes that the experienced volatility will coincidewith the implied volatility. In other words, it values the portfolio of stock and theoption at

V (s, τ) = ψs − K ′p (s/K ′, τ (OK, t))

and proposes a hedge of ψ = p(1,0) (s/K ′, τ (OK, t)) units of stock. This immunizesthe portfolio to first order against movement of the underlying given that the impliedvolatility remains constant. Providing empirical volatility coincides with the impliedvolatility6, the fact that p in the pricing formulae solves the Black Scholes pde ensuresthat second order price movements are also cancelled out on average which is enoughto hedge. Movements in the implied volatility are unhedged as are differences betweenthe empirical and the implied volatility.

It is a stable hedge, in the sense that the amount of the stock held is alwaysbetween nothing and one unit, swinging between the two according to the extent thatsecurity is out or in the money, and becoming close to one or other of these extremitiesas the estimated operational time goes to zero.

A vega hedge7 would aim to hold ψ units of the underlying, and ξ units of theoption with strike K so that the portfolio is neutralised against movements in priceof the underlying or of volatility. In other words so that the total derivative of theportfolio in the price of the underlying and implied volatility (keeping time fixed, iszero). Because of the way that implied volatility and time always occur together we

6I am told that the market seems to place the implied volatility on the high side of reality,reflecting the fact that the intermediaries tend to be short call options.

7In all that follows, we will assume that we have fully discounted and that the return on a bondis zero. This achieves the usual simplification of presentation without loss of content.

Page 231: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Derivatives as Tradeable Assets 223

see this is the same as asking that in (s, τ) co-ordinates, ∂V∂s and ∂V

∂τ are both zerowhere

V (s, τ) = ψs + ξKp (s/K, τ) − K ′p (s/K ′, τ)

whereas the conventional hedge above would demand that the derivative ∂V∂s = 0 and

set ξ = 0.

The vega hedge an easily be computed from the above.

ψ → −K ′ p(0,1)(

sK′ , τ

)p(1,0)

(sK , τ

)K p(0,1)

(sK , τ

) + p(1,0)( s

K ′ , τ)

ξ → K ′ p(0,1)(

sK′ , τ

)K p(0,1)

(sK , τ

)and from the closed form of the solution one can deduce the portfolio suggested bythe hedge. In the following graphs we show how the mix between the underlying stockψ and the option ξ as operational time goes to zero in the case where K < K ′ andvice versa. Meanwhile in the case where one is in the money, but K ′ < K one getsa much better stability in the money. However, there remains a less serious out ofthe money singularity which could cause some difficulty. This instability seems to begeneric and can be observed in stochastic volatility models as well.

Figure 1: The exotic derivative has strike 1.1 while the liquid derivativehas strike 1.0. Operational time ranges from .01 to 1.5 in steps of .2. Thesuggested hedge goes arbitrarily short in the stock as maturity approaches.

Page 232: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

224 Terry J. Lyons

Figure 2: The exotic derivative has strike 0.9 while the liquid derivativehas strike 1.0. Operational time ranges from .01 to 1.5 in steps of .2. Thesuggested hedge holds positive bounded amounts of the stock and optionas maturity approaches.

3 The joint volatility of the call and the underlying

3.1 Overview

Vega hedging is a hybrid. It aims to hedge to second order in the underlying security,but only delta hedges in the direction of fluctuations in the price of the liquid option.But those fluctuations exist or one would not be interested in vega hedging!

It is the nature of markets and market makers that they impose a price on anytraded security. In the absence of complete knowledge of the volatility of the under-lying, the price of a liquid derivative must fluctuate in relation to any given BlackScholes predictions. The traded derivative has a price of it’s own. It is not a deter-ministic function of the underlying assets, and in effect it becomes a new asset in it’sown right.

If one could model the joint volatility of the underlying price vector (St, OK,t) forthe traded option and the underlying together we could use the classical Black andScholes paradigm to price and hedge a new contingent claim using them both, howeverwe would no longer use the classical Black Scholes formula to price the contingentclaim, but a new function that comes from solving the new pde.

Although this approach seems far more natural than the vega hedging, some ob-vious issues need to be addressed before it can really be considered as a starter.

1. The behaviour of an option and the underlying are clearly not completely in-dependent, and at the maturity of the option there is no independence at all.Therefore any model for the joint volatility of the pair should force this terminalrelationship for the risk neutral measure without further assumptions.

Page 233: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Derivatives as Tradeable Assets 225

2. There needs to be some basic and reasonably natural models for the volatility ofthe pair that can play the role of the geometric Brownian motion in the classicalcase.

3. Time to maturity must play an essential role in the model for the volatility, atleast with respect to the volatility of the option price.

We initiate the study of these issues below, and demonstrate the existence of a work-able class of models.

The approach provides a framework for pricing in a mature market where manyderivatives have market prices, which takes account of those prices, and also providesrational hedging strategies, indicating the correct mix of derivatives and underlyingassets. In addition, including market priced options in the hedging asset mix meansthat their calibration is taken into account automatically via the state of the system,rather than via the parameters. It is therefore possible, without any conflict withmarket prices, to use historical data to improve the model for the joint volatility.

3.2 Connection with classical stochastic volatility papers

Before proceeding to the details of our approach, we make one final remark. Thereare numerous papers on stochastic volatility, reflecting the importance of the topic.Our approach, which constructs some quite explicit models for stochastic behaviourof the implied volatility, is not primarily directed to modelling in a stochastic way,the empirical volatility of the underlying, although this is a bi-product. Our primaryinterest is to identify the volatility of derivatives with prices in the market, along withthat of the underlying.

The volatility of our new price process (St, OK,t) will still be uncertain and themethods of stochastic empirical volatility could be applied in this setting if required.However, the residual nature of most contracts, and large errors one expects, indicatethat an approach based on non-linear pde and uncertain volatility might be simplerand quite adequate.

3.3 Modelling stochastic implied volatility

Suppose that we have two tradeable assets, a security with price St and a Europeancall option Ot then we may always re-scale the units of the stock so that the strikeprice is 1. Our objective is to identify sensible models for volatility of the pair (St, Ot)and to calculate prices based on these models.

Now the process (St, Ot) is forced by arbitrage constraints to live in domain

E = (s, O) |1 + O ≥ s ≥ O, O ≥ 0and any value in E is potentially possible at any time although some values areobviously more likely than others.

Page 234: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

226 Terry J. Lyons

Figure 3: The domain E.

Let p(s, τ) be the function defined in (3), giving the Black-Scholes price of an optionwith current stock price s and with volatility 1, τ units of time to run. Recall that if Ot

is the price of option maturing at time T , then the equation Ot = p (s, τ) always hasa unique solution τ for any point in E. We regard s and τ as a new parameterisationfor E, as the map (s, τ) → (s, p (s, τ)) is one to one, taking R

+ × R+ onto E.

To get started, we make the following modelling assumptions:

• the volatility of the price of stock s is controlled by the value of the estimatedoperational time τ but is independent of the volatility of τ .

• the implied volatility determined by the option and stock prices agrees with thevolatility of the stock price.

Both are only assumed to keep the mathematics relatively simple —but seem rea-sonable to first approximation at least. We have not had the chance to rigorouslytest them against market data. More complicated assumptions would not radicallychange the picture —only the numerical complexity of extracting a solution.

The assumptions restrict us to a model of the form

dSt =√

τt

T − tst dVt + λt dt (5)

dτt = g (T, t) dWt + µt dt (6)

As both assets are assumed tradeable, one knows from the classical complete marketparadigm that to obtain arbitrage prices, the next step is to choose λt and µt soas to make the measure risk neutral, in other words, chosen so that so that St andOt = p (St, τt) are both martingales, and take expectations. The risk free nature ofthese prices make it standard that prices do not dependent on the real values of theseparameters. However, there is a new feature our model must satisfy, and which wehave not seen previously. It is clear that as time approaches maturity, the prices ofthe option and the underlying must become more closely aligned and compatible withthe relationship determined by the payoff of the contingent claim.

Page 235: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Derivatives as Tradeable Assets 227

Definition 4 We say that such a model as (6, 5) is consistent if at the terminal time(ST − 1)+ = OT . In other words if the first exit time of the process (Ot, St) from Eoccurs at time T and at that time the process leaves E through the lower boundary.

As an initial remark in the direction of understanding the condition of consistencywe remark that our models are always “almost” consistent, in the sense of the nextresult.

Lemma 1 In any model in the above class, (St, Ot) will converge to point on one ofthe three lines bounding E at maturity time.

Proof. Since (St, Ot) is a positive martingale in each co-ordinate, it must convergeas t tends to T . Suppose it converges to some point in the interior of E. It followsfrom standard martingale arguments that the Martingale must have finite quadraticvariation along almost every sample path. Moreover, the map from R

+ ×R+ onto E

is smooth with locally bounded and invertible derivative. So the quadratic variationof (St, τt) provides a lower bound for that of (St, Ot) and must also be finite. Howeverthe assumption that (St, τt) converges to an interior point ensures that∫ T

u=t

(√τu

T − uSu

)2

du = ∞

giving a contradiction. From this we conclude that the process (St, Ot) must convergesto a boundary point as t tends to T.

3.4 Fixing the price

In this section we will do the computation giving the values for λt, µt for which(st, P (st, τt)) is martingale. Observe first that the requirement that st is a martingaleimplies that λt ≡ 0 since Vt is already a Brownian motion, and hence a martingale. Soall the interest is in identifying the correct form for µt. For this it seems substantiallysimpler to work in a fairly general way as the explicit form of the Black and Scholesformula does not seem to play a big role. We introduce a notation for the infinitesimalgenerator for the diffusion (s, τt):

L =12

T − t

)s2 ∂2

∂s2+

12

g2 ∂2

∂2τ+ µt

∂τ+

∂t(7)

Then our requirement is to choose µt so that one has Lp (s, τ) = 0.

By hypothesis p (s, τ) is the Black-Scholes solution and satisfies (4) so that

Lp =(

12

g2 ∂2

∂2τ+

(µt +

T − t

))∂

∂τ

)p (s, τ)

and thus the condition that Lp = 0 translates into

∂τlog

∣∣∣∣∂p

∂τ

∣∣∣∣ = −2

(µt +

T−t

))g2

Page 236: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

228 Terry J. Lyons

It remains to compute ∂∂τ log

∣∣∣ ∂p∂τ

∣∣∣ and we will have an explicit form for µ.

We could just go directly into computation using the formula (3) but it is betterand applies more generally to observe that if p is any solution to the equation(

12s2 ∂2

∂s2− ∂

∂τ

)p = 0

then so is ∂p∂τ , and this function can be rewriten as 1

2s2 ∂2

∂s2 aswell. However, fromthis it is obvious that the boundary data corresponding to the solution ∂p

∂τ for ourparticular p is given by a delta function and is hence relatively easy to computewithout computation!

We have ( −τ

T − t

)− g2

2∂

∂τlog

∣∣∣∣∂p

∂τ

∣∣∣∣ = µt

So far we have not used the explicit form of the call option Black and Scholes solution,but on doing this one gets the following result.

Proposition 1 The value of µ making the process (St, Ot) risk neutral is given by

µ =12

18

+12τ

− 12

(ln K

s0

)2

τ2

g2 − τ

T − t

which is deduced from

∂τlog

∣∣∣∣∂p

∂τ

∣∣∣∣ = −18− 1

2τ+

(ln K

s0

)2

2τ2

using the identity

∂τlog

∣∣∣∣∂p

∂τ

∣∣∣∣ = −2

(µ +

T−τ

))g2

from above.

Corollary 1 The risk adjusted process has the infinitesimal generator

L =12

T − t

)2

s2 ∂2

∂s2

+12g (τ, T − t)2

[∂2

∂τ2+

(log

(sK

)2

2τ2− 1

2τ− 1

8

)∂

∂τ

]+

( −τ

T − τ

)∂

∂τ

+∂

∂t

Page 237: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Derivatives as Tradeable Assets 229

Proof. We must be careful about normalisations to get a consistent answer. Define

dst = st dVt or st = s0eVt− 1

2 t

where V is a Brownian motion with variance t at time t, then

p (s, T − t) = E

[(sT − K)+ |st = s

]and

∂tp (s0, T − t) = −1

2s2 d2p

ds2

= E

(−1

2s2 d

ds2(s − K)+ |st = s0

)= −

∫ ∞

0

12ρ (s0, s, T − t) s2 d2

ds2(s − K)+ ds

so that∂

∂τp (s0, τ) =

∫ ∞

0

12ρ (s0, s, τ) s2 d2

ds2(s − K)+ ds

where ρ (s0, s, T − t) is the density of the Log normal distribution. That is, it is thedensity of s0e

Vt− 12 (T−t) at s. A simple calculation shows this to be

ρ (s0, s, τ) =1s

1√2πτ

exp

(−

(12τ + log s − log s0

)2

)Suppose that f is a smooth function of compact support at infinity and bouned atzero then integrating by parts:∫ ∞

0

12

f (s) s2 d2

ds2(s − K)+ ds =

∫ ∞

0

12

(s − K)+d2

ds2

(f (s) s2

)ds

=∫ ∞

K

12

(s − K)d2

ds2

(f (s) s2

)ds

= −∫ ∞

K

12

d

ds(s − K)

d

ds

(f (s) s2

)ds

= −12

∫ ∞

K

d

ds

(f (s) s2

)ds

=12

K2 f (K)

and combining these two remarks we have that

∂τp (s0, τ) =

12

K2ρ (s0, K, τ)

=14K

√2πτ

exp

(−1

8(τ + 2 ln (K/s0))

2

τ

)

Page 238: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

230 Terry J. Lyons

and that

∂τlog

∣∣∣∣∂p

∂τ

∣∣∣∣ = − 12τ

− 2τ (τ + 2 ln (K/s0)) − (τ + 2 ln (K/s0))2

8τ2

= − 12τ

− 2τ (τ + 2 ln (K/s0)) − (τ + 2 ln (K/s0))2

8τ2

= − 12τ

−(τ + 2 ln K

s0

)(τ − 2 ln K

s0

)8τ2

= − 12τ

−τ2 − 4

(ln K

s0

)2

8τ2= −1

8− 1

2τ+

(ln K

s0

)2

2τ2

and the result follows by substitution.

3.5 Models for g

If τ represents number of ticks of “operational time” till maturity —then do we haveany intuition as to how it should behave and how volatile this estimate should be.Suppose then that you regard the volatility of market as a measure of the number nof market actions till maturity, where n is large, then the number that will arrive overa time period of length t is approximately nt±√

nt (mean ± √variance.) So it seems

quite reasonable that the market view of the operational time should swing by thissort of amount over a unit of time, suggesting a model of the form

dSt =√

τt

T − tst dVt (8)

dτt =√

τdWt +

12

18

+12τ

− 12

(ln K

s0

)2

τ2

τ − τ

T − t

dt (9)

for initial experiments. The crucial point is that the volatility of the operational timeis heavily dependent on the time to maturity. Moreover we have not just assumed thatthe volatility of the underlying security is stochastic —more subtly we have assumedthat the option has its own vol depending on maturity. A heuristic example of whatwe have in mind comes from the process of downloading a file across the Internet.Most web browser programmes provide a continual estimate for the time till downloadof the file —it is often based on some compromise between the current and integratedrate of data transfer, and is remarkably frustrating as it can go up as well as down.The relative volatility can get bigger as one gets near the completion of the transfer.

The model above is obviously consistent, as the final term ensures that the processτ, for small time intervals near maturity, is bounded above with probability one; andso combining with the lemma we proved above, about the convergence of the processto one of the three boundaries of the region E, it follows that it must converge to thelower boundary as required for consistency.

Page 239: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Derivatives as Tradeable Assets 231

3.5.1 A second example

A second model sets g =√

τ√

τT−t , and seems rather similar, as we do not expect

the volatility√

τT−t to fluctuate by orders of magnitude as the contracts approach

maturity. This second model has attractive features from a mathematical perspective.

dSt =√

τt

T − tst dVt (10)

dτt =√

τ

√τ

T − tdWt +

12

18

+12τ

− 12

(ln K

St

)2

τ2

ττ

T − t− τ

T − t

dt(11)

In this second example, we may transform this process into a nicer one by introducinga random time change. Let

du =τ

T − tdt

then we can rewrite (10,11) as

dSt = st dVu (12)

dτt =√

τdWu +

12

18

+12τ

− 12

(ln K

St

)2

τ2

τ − 1

du (13)

The fascinating remark is that this model is not consistent. There is always a smallchance that the process τ will escape to infinity.

4 Wider issues

4.1 Robust approaches to hedging

It is therefore open to the bank to devise consistent models for the volatility of un-derlying assets and derivatives at once. It goes without saying that this paper treatsa very special case and is not the complete picture. There are a number of ways inwhich to try to improve it. The first is to note that it is not vital to get the correctvolatility model for the joint behaviour. This is because of the way these approachesto pricing are used in the market. The point is that real contracts have quite smallresidual components after a crude hedge with derivatives, so that the price of thecontract is not ultra-sensitive, and using a robust conservative hedging strategy per-mitting a wide possible range of volatilities need not make a large difference to theprice of a contract. It is also easy to impliment.

Page 240: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

232 Terry J. Lyons

4.2 Broader classes of model and many strikes

In general there are a number of tradeable derivatives, and those that are traded freelyare often change with only those broadly on the money having liquidity. Moreoverdifferent derivatives have different maturity. We certainly do not have a clear model tochoose in every example —although the principle of looking for sensible and consistentmodels is obviously a sensible one. However, we recall the approach of Dupire wherehe uses derivatives at all strikes and maturities to predict a price dependent model forthe volatility of the security. This approach allows one to easily generalise the resultsof this paper to derivatives with different strikes.

4.3 Other relevant work

Like the present paper, Zhu and Avelleneda [6] also use a derivative as an additionalstochastic state variable while explicitly retaining market completeness, although froma somewhat different standpoint. They pre-specifying a lognormal process for theinstantaneous volatility of a single underlying asset, and then make the connectionwith traded derivatives by identifying this volatility with the implied volatility of shortmaturity call options, which necessarily therefore have the same implied volatility.

References

[1] Dupire, B., Pricing and hedging with smiles, in Mathematics of derivative securi-ties (Cambridge, 1995), Publ. Newton Inst. 15, 103–111. Cambridge Univ. Press,Cambridge, 1997.

[2] Hobson D., Stochastic Volatility, Chapter 14 in Statistics in Finance, eds. DavidJ Hand, Saul D. Jacka, Arnold Applications in Science.

[3] Hull J., White A. (1982), The Pricing of Options on Assets with Stochastic Volatil-ities, Journal of Finance 42, 2, 281–300.

[4] Lyons, T.J. Uncertain Volatility and the Risk-Free Synthesis of Derivatives, Ap-plied Mathematical Finance 2 (1995), 117–133.

[5] Vasicek, O.A., An Equilibrium Characterisation of the Term Structure, Journalof Financial Economics 5 (1977), 177–188.

[6] Zhu Y., Avellaneda M., A Risk Neutral Stochastic Volatility Model, InternationalJournal of Theoretical and Applied Finance, 1, 2, 289–310.

Terry J LyonsDepartment of Mathematics

Imperial College, 180 Queens GateLondon SW7 2BZ

Englande-mail: [email protected]

Page 241: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Information Transmission around

Block Trades on the Spanish

Stock Exchange

M. A. Martınez, M. Tapia y J. Yzaguirre1

Abstract

This paper investigates the informational effects of large transactions, orBlock Trades (BT), in the Spanish Stock Exchange (SSE). In the SSE, in theopen market period, this topic was not facilitated as in other markets till 1998.In this way, the SSE provides a special environment for analyzing the informationtransmission of these specific transactions.

We assume that information can be better reflected by changes in true assetvalue, proxied by the midpoint of bid-ask best quotes. Therefore, we will lookat changing true asset value orders instead of trades.

We study three different effects around BTs: price, liquidity and informa-tion transmission. To capture them, we consider three different endogenousvariables: true asset value returns, relative spreads and adverse selection spreadcomponent. With this approach, we find no clear effects of BTs. The mainresult of the paper is that there seems to be an increase in information asym-metries when we look at the adverse selection spread component in some of thedifferent subsample classifications (buyer, seller and sweeping BT), but there isno significant permanent effect on returns. This result could be related to insid-ers trading in the market. In sharp contrast with adverse selection evidence, wealso observe a temporary increase in liquidity around BTs. These changes reflecttemporary liquidity effects related to other spread components (order processingcosts and inventory costs). This opposite evidence could be explained by thefact that there are no special market participants such as specialists or dealersand as a result our market participants are not required to absorb temporaryorder imbalances2.

1Miguel Angel Martınez es Profesor Asociado del Departamento de Fundamentos del AnalisisEconomico de la Universidad del Paıs Vasco. Mikel Tapia es Profesor Titular del Departamento deEconomıa de la Empresa de la Universidad Carlos II de Madrid. J. Yzaguirre trabaja en Calidadde Mercado, Sociedad de Bolsas. Esta charla se impartio en la sesion del Seminario MEFF-UAM deenero de 1999.

2We are grateful to G. Rubio, I. Pena and J. Marhuenda for helpful comments and to participantsat the XXIII Simposio de Analisis Economico, II Encuentro de Economıa Aplicada, II Workshop inFinance de Segovia, 1999 European Financial Management Association Annual Meeting, V EncontroGalego de Novos Investigadores de Analise Economica and Seminars at Universidad de las IslasBaleares, Universidad de Alicante and Universidad Carlos III. We would also like to acknowledgefinancial support from Direccion General Interministerial Cientıfica y Tecnica (DGICYT), projectPB94-1373, PB97-0621 and PB98-030. The contents of this paper are the sole responsibility of theauthors.

Page 242: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

234 Martınez, Tapia e Yzaguirre

1 Introduction

Information transmission through order flow is an important issue in financial re-search. The general markets efficiency assumption is based on this point. Accordingto theoretical financial literature on information, the value of private information de-preciates quickly (see, for example, Foster and Viswanathan (1990)). Thus, informedinvestors prefer large transactions (Block Trades) in order to get into a valuable posi-tion as soon as possible. On the other hand, it is also known that informed investors,in order to conceal their superior private information, are interested in camouflagingtheir desired trades into small or medium size trades (Kyle (1985)). However, giventhe major increase in institutional trading and the internationalization of investors inrecent years, Block Trades (BT) are observed all over the world.

From the empirical point of view, is not clear whether these BTs may be under-stood as strategic trading motivated by information or whether they may be viewedonly as a consequence of institutional investors’ balancing their portfolios.3 Most ofthe empirical research into BTs focuses on information transmission by looking atpermanent and temporary effects of BTs on asset prices or returns. The permanentpart is interpreted as being information motivated, whereas the temporary one is as-sociated with price pressure or liquidity costs. Scholes (1972), Kraus and Stoll (1972),Holthausen, Leftwich and Mayers (1987, 1990) and Chan and Lakonishok (1993, 1995)are interesting examples of this issue on the NYSE. Both effects (permanent and tem-porary) seem to be present and the sign depends on the type of BT. However, theresults depend on the sample and the methodology used in the study.

Similar analyses for order driven markets can be found in Ball and Finn (1989),for the Sidney Stock Exchange, and Riva (1996), for the Paris Bourse. Gemmill(1996), for the London Stock Exchange, has recently analyzed the liquidity effects ofBTs under different publication rules. In related literature, Seppi (1992) and Daley,Hughes and Rayburn (1995) among others, investigate the extent to which block pricechanges around quarterly earnings announcements.

This paper investigates the impact of BTs in the Spanish Stock Exchange (SSE).BT effects should be greater in a market that does not facilitate this type of transac-tions; i.e. where BTs are dealt like small trades. This market microstructure charac-teristic can lead investors to avoid this type of trades because of the effort of crossinga BT and evident risk of interference. For this reason, we expect transacted BTsto be very informative. The SSE offers us a particularly appropriate testing groundfor examining these issues. In the SSE, in the open market period, this topic was

3Formal models of information disclosure through BTs can be found in Easley and O’Hara (1987)and Seppi (1990). Easley and O’Hara (1987) show how BTs significantly increase the probabilitymarket participants attach to the existence of private information. Seppi (1990) develops a modelwhere, under not very restricted circumstances, information-based BTs are traded in a partial-poolingequilibrium.

Page 243: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Information Transmission around Block Trades 235

not facilitated as in other markets till 1998.4 In this way, the SSE provides a specialenvironment for analyzing the information transmission of these specific transactions.

In order to analyze whether these transactions transmit information, we propose anew approach. In sharp contrast with previous BT research, we assume that informa-tion can be better reflected by changes in true asset value, proxied by the midpoint ofbid-ask best quotes. Looking at these intrinsic value changes instead of price changes,we avoid the effects of liquidity (noninformative) trades. These kinds of transactionsmodify asset prices without affecting their true value (the so-called bid-ask bounce).5

At the same time, this allows us to consider very informative bid-ask changes whichdo not result from a new transaction (so that, no new price is established), but whichreflect worthy changes in the investor’s preferences for assets. Therefore, we will lookat changing true asset value orders instead of trades.

Related with information effects, market microstructure literature analyzes howprices absorb information, measured by changes in the adverse selection spread com-ponent.6 Adverse selection can be understood as a measure of information asymme-tries. Thus, if we observe a decrease in adverse selection component around BTs,we could conclude that BTs transmit information diminishing information asymme-tries between agents. This adverse selection component must be differentiated fromliquidity in general. Therefore, we will also analyze the behavior of relative spreadsaround BTs to detect changes in liquidity not related to information transmission.These changes are related to order processing costs and inventory costs. As previousstudies have done, we will also analyze the impact of BTs on true asset returns.

This new approach we propose, together with the special market microstructure weanalyze, makes this study innovative in current literature on information transmissionaround BTs.

The main result of the paper is that there seems to be BT information transmissionwhen we look at the adverse selection spread component in some of the differentsubsample classifications, but there is no significant permanent effect on returns. Wealso observe changes in liquidity around BTs, but this effect is related to temporaryspread component.

The remainder of the article is organized as follows. Section II reviews briefly themicrostructure of the SSE and, particularly, the block trading process. The datasetand sampling rules are presented in section III. Section IV discusses the methodologyused and results obtained in the analysis. Finally, section V offers some concludingremarks.

4Examples of these special BT devices are the upstairs market in the NYSE (Hasbrouck, Sofianosand Sosebee (1993)) and the broader bid-ask spread in the Paris Bourse (Riva (1996)).

5Seppi (1992) also points out that the conclusions obtained by looking at price changes may beaffected by the potential presence of a variety of price pressure effects.

6A good reference is O’Hara (1995).

Page 244: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

236 Martınez, Tapia e Yzaguirre

2 Institutional Settings of the Spanish StockMarket

The electronic continuous market for equities in SSE is a purely order driven market.Through this system, 142 companies are traded. The main characteristic is a singleorder book for every stock. We find three main periods in the daily market:

a) Preopening period (from 9:00h to 10:00h): In this period, introduction, modi-fication and cancellation of limit orders are allowed. Depending on supply anddemand, the system calculates a preopening price in real time. At 10:00h thesystem assigns shares to orders at prices better than or equal to the openingprice.

b) Open market period (from 10:00h to 17:00h): During this period limit andmarket orders are introduced. If a counterpart is found they are automaticallyexecuted. If not, the order remains on the book until an incoming order fits it,or the order is canceled. In this period prices change in real time depending onthe flow of buy and sell orders.

c) Special operations period (from 17:00h to 20:00h): In this period it is possibleto report pre-agreed trades with an effective volume bigger than 20% of thedaily turnover. So, this period is specifically designed for BT transactions.

Traders can also use the preopening period to trade BTs. Introduction of pre-agreedlarge trades in this period consists in buying at the maximum possible price of the day(15% more than the closing price of the previous day) and selling the same quantityof shares with a 15% reduction on the closing price. With this behavior investors canbe sure to trade BTs at the opening price.

We will not use these closed market BTs in this study.7 This is because we wantto identify clear information signals. We could hardly identify BT information effectsbecause of the overnight problem in the opening prices. In order to observe theinformation effects of BTs, we will focus on the open market period. In this way, weavoid other news that could affect the opening asset price during the closed periods.

Investors willing to trade BTs in the open market suffer two handicaps. First,traders must introduce a limit order to execute a BT, so it is impossible to cross atransaction outside the limit order book. Second, it is not possible to trade outsidethe spread of best buy and sell prices. As a result, it is very difficult to trade largeblocks of shares in this period. In this context, a BT trader can face two differentmarket situations:

7During the period analyzed, 11% of the number of BTs was traded in the preopening period,and 15% in the special operations period. Regarding the effective volume, the percentages are 20%and 16% , respectively.

Page 245: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Information Transmission around Block Trades 237

(i) When there is a level of prices available between best buy and best sell (spreadbigger than tick size), traders quickly introduce pre-agreed sell and buy limitorders for the same amount of shares at the price available inside the spread.

(ii) When there is no such available price and traders do not want to wait, theysweep the necessary orders to open the spread and get a price available insideit. This sweeping activity is particularly necessary for stocks that are so liquidthat it is very difficult to find an available price. Obviously, it imposes anadditional cost.

Crossing both types of BTs, when one side order has been introduced, there is alwaysthe possibility that another limit order may arrive and the pre-agreed BT cannot becompletely crossed.8 We call this issue “interference risk”.

3 Data

Data on all orders on the SSE in the open market during the one-year period fromMay 1996 to April 1997 were collected from SSE files. As indicated, we selectedonly orders which change true asset value. From now on, these orders will be termedorders. In spite of the possible existence of other orders between any two of them,they will be considered in our analysis as consecutive. So, the kth order changingthe true asset value and the following one will be referred as the k and k + 1 orders,respectively. The available information for each of these orders includes: time ofoccurrence (stamped to the nearest second), date, bid, ask, transaction price andnumber of shares transacted since the previous order.9 The value of the SSE Index(IBEX-35) for each second was also obtained from SSE files.

As a description of the SSE, Table 1 presents some summary statistics about thesize distribution of all trades crossed in the SSE during the period considered.

8Since November 6th 1998, a new device for reporting and trading BTs in the open market periodhas been operative. This feature allows market members, as other European markets already do, totrade BTs outside the best bid-ask spread of the book. In any case, this possibility is set according toa certain relationship with market prices. Specifically, there are currently two ways to trade a block:(i) For stocks belonging to the IBEX-35 Index (the 35 most liquid stocks on the SSE), members canreport arranged blocks to the Exchange. As a result, interference risk has been eliminated. Minimumrequired amount of shares for trade is 5% of the daily turnover in the last quarter of the year and100 million pesetas (0.59 million euros). In this context, the spread is the on line weighted averageprice of the six best levels of bid and ask. (ii) For all the stocks on the SSE, market members canintroduce orders bigger than 10% of the daily turnover in the last quarter with a deviation of 15%from last closing price and 250 million pesetas (1.5 million euros). Here there is no time and pricepriority rule and members can select any order.

9For orders which do not produce transactions, we consider the price of the corresponding previoustransaction. For the first order of the day we use the accumulated volume of shares transacted inthe preopening period.

Page 246: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

238 Martınez, Tapia e Yzaguirre

number oftrades (%)

trading vol-ume (%)

< 1 mil. 2,413,137(60.28)

810,396(5.9)

> 1 mil. and < 10 mil. 1,335,059(33.35)

4,348,807(31.6)

> 10 mil. and < 50 mil. 226,666(5.66)

4,435,662(32.2)

> 50 mil. 28,420(0.71)

4,174,179(30.3)

< 5% 22,048(0.55)

2,048,370(14.9)

> 5% and < 10% 2,002(0.05)

421,378(3.1)

> 10% and < 20% 1,989(0.05)

442,291(3.2)

> 20% and < 40% 1,099(0.03)

350,160(2.5)

> 40% 1,282(0.03)

911,980(6.6)

All trades 4,003,282 13,769,044

Table 1: Number and effective trading volume (in millions of pesetas) of all trades crossed

in the open SSE during the period May 1996-April 1997, sorted by trading volume. Those

with trading volume greater than 50 million are additionally sorted by their percentage of

the average trading daily volume. The percentage of the total is in parentheses.

As can be observed, the mean trading volume is 3.4 million pesetas. Trades of 1million or less represent more than 60% of all trades, but these trades only represent5.9% of effective trading volume. Throughout this paper, we define BTs as any tradewhose value is over 50 million pesetas and, at the same time, is greater than 20% ofthe average effective trading daily volume for the respective asset.10 According to thisdefinition, there were 2,381 BTs during this period. They represent 9.1% of tradingvolume, but only 0.06% of the total number of trades.

3.1 Sampling rules

In order to select our sample of BTs, some filters were applied to the available firmsand BTs. Firstly, we only consider BTs involving to the 50 most liquid firms. Thisrestriction allows us to use a highly continuous trading sample. In this way, disturbingnontrading effects are eliminated. We exclude a BT if there is a payment or stocksplit (or any payment in the firm) in the 13 calendar-days window for each BT (6

10This cut-off was chosen because it is the institutional requirement for “specially communicatedtrades” on the SSE.

Page 247: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Information Transmission around Block Trades 239

calendar-days before and 6 calendar-days after).11 These BTs are likely to be non-informationally motivated, as Choe and Masoulis (1992) point out. BTs for whichadditional blocks occurred in the stock during the same 13 calendar-days window arealso excluded. In this way, selected BTs are not affected by the close presence of an-other BT. For reasons of data availability (motivated by the estimation period chosen)we also exclude BTs occurring less than 14 calendar-days after the beginning of theperiod analyzed and 14 calendar-days before the end. Finally, we analyze only blocksoccurring between 11:00h and 16:00h. The first and the last hour of the trading dayare excluded because of the disturbing effects of opening and closing trades. Manylarge transactions at opening cannot be considered as BTs: They are merely a largenumber of individual transactions crossed together and printed as one transaction.Likewise, transactions during the last hour may incorporate end-of-the-day effects(see Amihud and Mendelson (1986) and Harris (1986)).

It must be said that some of the BTs selected according to these criteria did notappear in the original sample of orders changing the asset true value proxy. However,we decided to include them because their information effects could operate with somedelay or advance.12

After applying all these sampling rules, the number of BTs we finally consider isreduced to 195, in 41 firms. They represent 1.3% of the trading volume during thewhole of the period analyzed. BT trading volume ranges from 51 to 27,668 millionpesetas and the mean value is about 947 million pesetas.

The analyses will be performed individually for each BT. The estimation periodwe consider is a 29 calendar-days window for each BT (14 calendar-days before and 14calendar-days after BT).13 It is clear, considering the differences between assets, thatthe number of orders in this fixed period is very different from one asset to another.The range goes from 235 orders for the least liquid asset to 4,460 for the most liquid,with 1,487 being the average number for all BTs in the sample.

3.2 Descriptive statistics

Unfortunately, our dataset does not identify the party initiating the large transaction.However, as is clear from empirical literature on BTs, the signs of the expected effectsdiffer for buyer and seller-initiated transactions. A buyer-initiated BT is expected toproduce a permanent increase in the asset price, whereas the inverse effect is expectedfor a seller-initiated BT. In order to sort BTs as buyer or seller-initiated, we calculate

11There is nothing special in this figure. The only interest is to separate BT effects as far aspossible from others.

12We will observe this possibility when traders choose to introduce the BT order not in the firstlevel of book prices. If there is enough time another order may arrive and when the BT is crossedwe will not observe a change in true asset value.

13The estimation period must be long enough to provide precise estimates of parameters and shortenough to keep the number of trades manageable. We consider this period as one which appropriatelymeets both requirements.

Page 248: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

240 Martınez, Tapia e Yzaguirre

the difference between the BT price and the true value proxy at the previous trade.If this difference is positive, we classify the BT as buyer-initiated, whereas if it isnegative we classify it as seller-initiated. BTs whose price equals the previous assettrue value are classified as indeterminate-initiated.14

The dataset identifies most BTs according to an inside the spread or sweeping clas-sification. BTs not included in either of these types are considered as not classified.15

Intuitively, we expect stronger effects in sweeping BTs because of the additional costthey impose. BTs were also sorted by whether or not they change the asset true value.As above, we expect greater effects in BTs that change the asset true value. Addi-tionally, BTs are classified in four groups according to their trading volume. Eachgroup has about the same number of BTs, with BB being the group with the biggestBTs, SS the group with the smallest, and BS and SB the medium size group. Weexpect a direct relationship between information transmission and BT size. Tables 2and 3 illustrate some of the distinguishing features of the BTs in the sample.

Table 2 shows the sample composition regarding the side initiating the BT, typeand changes or not in asset true value. As can be observed in panel A, the sampledistribution is very similar regarding the side initiating the BT, especially in thevolume transacted. The number of indeterminate-initiated BTs seems to be greaterthan the other types for small and medium BTs. Panel B shows that the largest BTsby volume transacted are traded inside the spread, whereas the BTs not classifiedseem to be the small ones. However, the number of BTs in each group is very similar.Panel C shows that the biggest BTs change the asset true value. But this relationshipis reversed for the other size BTs.

Table 3 describes the day-of-the-week and hour-of-the-day distribution of the BTsample. The first value in each cell is the percentage of the number of BTs and thesecond is the corresponding trading volume. We find a clear seasonal pattern in oursample. First, from the microstructure of the SSE, it is clear that investors tend touse the less competitive hours of the day to cross large transactions. We see in table3 that the 13:00-14:00h period is the time of the trading day when the biggest BTsare crossed. We also observe differences in days of the week. Surprisingly, on Friday(the day of the week when futures contracts expire) we observe no special derivativeseffect, whereas we see a large volume activity during the first part of the week.

14This criterion has been used previously by Blume, Mackinlay and Terker (1989) and Hausman,Lo and Mackinlay (1992), among others. The “tick test” algorithm (which classifies a transaction bylooking at the previous transaction’s price) proposed in Lee and Ready (1991), is a less information-consuming method. Hausman, Lo and Mackinlay (1992) consider the true value rule considerablymore accurate.

15These are BTs whose limit orders were introduced in the book but not at the first level of prices,and they await execution.

Page 249: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Information Transmission around Block Trades 241

BB BS SB SS

BTs Vol. BTs Vol. BTs Vol. BTs Vol.

(%) (%) (%) (%) (%) (%) (%) (%)

PANEL A

Buyer-init. 0.35 0.32 0.26 0.32 0.21 0.34 0.22 0.33Seller-init. 0.39 0.45 0.25 0.33 0.29 0.39 0.16 0.34Indeterminate-init. 0.26 0.23 0.49 0.35 0.50 0.30 0.61 0.33

PANEL B

Inside the spread 0.47 0.76 0.34 0.49 0.35 0.48 0.30 0.39Sweeping 0.31 0.20 0.33 0.43 0.32 0.40 0.31 0.53Not classified 0.22 0.04 0.33 0.08 0.33 0.13 0.39 0.08

PANEL C

Change in true as-set value

0.67 0.65 0.47 0.35 0.51 0.35 0.52 0.37

No change in trueasset value

0.33 0.35 0.53 0.65 0.49 0.65 0.48 0.63

Table 2: Size distribution of our sample in number of BTs and trading volume (in per-

centage terms). Regarding trading volume, BTs are classified in four groups, including the

biggest in BB and the smallest in SS. In panel A, BTs are classified according to the side

of the market initiating the BTs (buyer, seller or indeterminate initiated), in panel B they

are classified according to type (inside the spread, sweeping or not classified) and in panel

C according to whether they change the asset true value or not.

MON TUE WED THU FRI All days(%) (%) (%) (%) (%) (%)

11:00-12:00 5.64 5.64 3.59 2.05 1.03 17.956.81 3.17 1.96 0.86 0.18 12.96

12:00-13:00 6.15 8.72 4.10 3.59 6.15 28.725.45 7.63 2.11 3.94 2.45 21.58

13:00-14:00 4.62 4.10 5.64 1.54 6.15 22.057.79 7.98 17.84 1.20 3.89 38.71

14:00-15:00 2.05 6.67 2.05 1.54 6.15 18.460.51 12.10 1.43 0.43 1.29 15.75

15:00-16:00 2.56 3.59 2.05 2.56 2.05 12.821.43 4.25 2.56 2.40 0.36 10.99

All periods 21.03 28.72 17.44 11.28 21.5421.99 35.13 25.91 8.82 8.16

Table 3: Day-of-the-week and hour-of-the-day distributions (in percentages terms) of the

BT sample. The first value is the percentage of the number of blocks and the second one is

the corresponding trading volume.

Page 250: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

242 Martınez, Tapia e Yzaguirre

4 Methodology and Results

There are certain features that characterize our dataset. First, orders are sampledat irregularly spaced random intervals (whenever changes in true value occur), soobservations are unlikely to be identically distributed, since some of them are veryclosely spaced in time while others may be separated by hours. Second, asset prices arealways quoted in discrete units or ticks (discreteness). Among the existing modelsof stock price discreteness, ordered probit is the only specification that can easilycapture the impact of explanatory variables on price changes while also accounting forprice discreteness and irregular transaction intervals.16 However, the use of orderedprobit specification comes up against a major problem with illiquid stocks. We mustlimit tick movements because of the necessary degrees of freedom in the estimationprocedure. So this method is not useful for our sample.

Therefore, in order to diminish the discreteness problem, we will use returns in-stead of prices. Furthermore, to solve the irregular random intervals problem, we willuse two alternative specifications: the use of differences in time between consecutiveorders as an explanatory variable and the use of a time adjustment for our exogenousand endogenous variables.

As mentioned in the introduction, one of the variables we focus on is changes inasset true value. The true value idea is taken from market microstructure literature.Glosten and Milgrom (1985) advocate the use of the midpoint of bid-ask quotes as aproxy for the true value. For asset j, the true value after the kth order is denoted bymjk, and is obtained as:

mjk = (Ajk + Bjk)/2 , (1)

where Ajk and Bjk are the ask and bid prices of asset j on the kth order, respectively.The point here is that if large trades convey valuable information, agents revise theirestimation of the true price and their subsequent orders will modify the book quotes.These modifications are considered informative (whether or not there is a new trans-action), because they represent changes in the amount investors are willing to pay orto receive for assets. We use continuously compounded returns of relative change inthe true value proxy as the information variable. This variable is denoted by Rjk.

BTs imply an important change in Normal Market Size. In addition to informationtransmission, BTs can involve temporary changes in liquidity. The idea is that BTscan affect investors’ optimal portfolio or related variables and impose an inventorycost. These liquidity effects of BTs are analyzed with regard to changes in relativespread. Many market microstructure articles focus on relative spread to study liq-uidity effects around dividend or earning announcements.17 The relative spread forasset j after the kth order is denoted by Sjk, and is defined by:

Sjk = 2Ajk − Bjk

Ajk + Bjk. (2)

16A description of this estimation procedure can be found in Hausman, Lo and Mackinlay (1992).17Lee et al. (1993) and Rubio and Tapia (1996) are representative examples of this literature.

Page 251: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Information Transmission around Block Trades 243

Additionally, we consider that BTs can affect some variables such as accumulated vol-ume and differences in time between orders. One conclusion of market microstructureliterature is that market activity can be measured by trading volume. Some papershave shown that it is important to control for some activity variables when we wantto measure the information flow.18 As Seppi (1992) indicates, when we look at BTswe may consider a proxy of activity. In this way, volume appears as one appropriatevariable reflecting information arrival. We denote Voljk the square root of accumu-lated number of shares traded on asset j between orders k − 1 and k.19 We denotedfurther as Diftjk the square root of the time elapsed in seconds between orders k−1and k on asset j.20 Engle and Lange (1997) show that this variable can signal changesin order flow regime. So we also look at these variables, looking for changes in regimearound BTs.

Preliminary evidence of BT effects on previous variables is shown in table 4.

Sjk Diftjk Voljk Rjk − Rj

-10 2.77 16.69 -25.43* 0.41E-05-9 5.55 -10.11 -2.45 -1.33E-05-8 1.56 3.74 -24.02* -6.93E-05-7 -1.93 8.00 -26.50** -2.53E-05-6 0.63 9.03 -22.09* 2.90E-05-5 -7.28 58.39* 8.67 -4.65E-05-4 -4.31 28.65* -2.13 0.76E-05-3 -13.44* 101.36* 4.41 -3.78E-05-2 -5.11 74.35* 42.44** -0.67E-05-1 -25.45* 118.87* 35.92 -4.13E-050 -5.18 44.52* 5793.02* -3.66E-051 2.13 75.39* 316.71* 1.62E-052 -6.98 54.37* 20.57 -3.72E-053 -6.33 53.76* -14.70 1.17E-054 -5.88 58.32* -0.27 -4.51E-055 -9.77* 56.42* 4.92 0.04E-056 -10.71* 56.35* -12.53 -6.79E-057 -13.75* 28.21** -16.45 -3.28E-058 -11.41* 51.11* 3.71 -3.25E-059 -11.26* 53.99* 42.33** -6.29E-0510 -6.82 22.16 16.56 2.12E-05

Table 4: For the characteristics of relative spread, accumulated volume, and differences intime, we show the percentage changes, averaged across all BTs, according with the followingstatistic:

Kjk =

(Cjk

Cj

− 1

)× 100 ,

where Cj is the average of each characteristic. For returns we use the statistic: Kjk =

Rjk − Rj . The asterisk indicates significance at 5% and double asterisk at 10%.

18Previous research (Lee, Mucklow and Ready (1993) for the NYSE, and Rubio and Tapia (1996)for the SSE) has found clear effects of trade volume on relative spread. Therefore, we will considervolume as a control variable.

19We use the square root to avoid the outlier problem.20When a change of day occurs, we use the time from the market opening.

Page 252: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

244 Martınez, Tapia e Yzaguirre

In this table, we show percentage changes in relative spread, differences in timeand accumulated volume dividing each observation by its average by calculating thefollowing statistic:

Kjk =(

Cjk

Cj

− 1)× 100 , (3)

where C is S, Dift and Vol. For returns we use the statistic:

Kjk = Rjk − Rj . (4)

The average of these statistics across all BTs is calculated for ten orders just beforeand after them. The cross-sectional distribution of each average is used to study thesignificant level of the event.

We can observe different evidence in table 4. First, relative spreads seem todecrease before and after BTs. This indicates an increase in liquidity. This effect isespecially important just after BTs. According to market microstructure theory, thisreduction may be caused by a reduction in information asymmetries or trading cost.We do not observe any significant variation in returns around BTs, but there is adecrease in volume before BTs which, could indicate that agents are waiting for BTsto arrive. The only abnormal volume is the next BT order. This could be a sign ofagents updating their demands and portfolios. The positive and significant numberswe find in time differences show that time between orders increases just before andafter a BT. Again, this could be an indication of investors waiting for trading andupdating their expectations. However, this evidence is contrary to insider tradingbehavior, as is shown in Engle and Lange (1997) and theoretical papers that indicatethat insiders would use noisy trading intervals to camouflage their trades. So thepreliminary evidence around BTs shows different behavior of relevant variables suchas spreads, volume and differences in time.

However, the observed effects on our variables may be due to variables affectingthem other than BT information transmission. In order to isolate the BT effect, weneed to control the endogenous variables considered for alternative influential variablesaround BTs. The control variables we use are well known in financial literature.

As we have pointed out, volume appears to be one appropriate control variablefor information arrival. Therefore, we use Vol as an independent variable in theregression analysis. Three lags of this variable are considered in order to allow forsome delay in its effects. In order to avoid the disturbing overnight effect, we alsoconsider an end-of-the-day dummy variable.21 This variable, denoted by Dend, equals1 if kth order on asset j is the first order of the day and 0 otherwise. We also takeinto account market return as an exogenous variable. We take the IBEX-35 Index asour market index. We take the nearest in seconds value for each order in the sampleperiod. Its return is denoted by RIBEX. We also use three lags of this variable in order

21It has been well-documented that overnight returns differ substantially from intraday returns(Amihud and Mendelson (1987) and Stoll and Whaley (1990)).

Page 253: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Information Transmission around Block Trades 245

to allow for some delay in its effects. The aforementioned Dift is also considered asa control variable.

Finally, to pick up effects around BTs, we consider 21 dummy variables (a windowof 10 orders before and after each BT) denoted DBTτ . Each dummy equals 1 for theorder occurring τ orders after the BT, and 0 otherwise. The order corresponding tothe BT itself is considered as the reference order, τ = 0. So, after controlling by theaforementioned variables, the coefficients show us the effect of BTs on our endogenousvariables before and after they occur.

As pointed out in the introduction, we consider three different endogenous vari-ables: true asset value returns, relative spreads and adverse selection spread compo-nent. They capture price, liquidity and information transmission effects respectively.Because no two firms have an identical timing of orders, we cannot estimate ourregressions as a multivariate system across all BTs, so we run one time-series regres-sion for each BT. The coefficients are therefore averaged over all of them and overthe different subsamples considered. If BTs are relevant for these variables, we willobserve significant coefficients for the appropriate BT dummy variables. These arethe relevant variables in our analysis. The remaining variables are included only tocontrol for external effects.

4.1 Returns Evidence

Next, we show the regression for each BT used to analyze the BT effects on true assetvalue returns. The time-series regression for each BT j is:

Rk = α +−3∑

τ=−1

φτ Rτ +−3∑τ=0

λτ RIBEXτ +−3∑τ=0

βτ Volτ

+γ Dift + ϕDend +10∑

τ=−10

δτ DBTτ + ωk , (5)

where we use three lags of the endogenous variable and DBT stands for the dummyvariable employed to pick up effects around BTs.22 First column of table 5 shows theresults of the above regressions. We only report the results for the total BTs sample.

First, we observe mean reversion in returns. This expected result is consistent withother results in literature. Secondly, clock time measured by Dift is also significant.Other control variables seem relevant and coefficient signs are as expected (RIBEX,Vol, Dend). So the use of these variables to control seems to be justified.

Next, we show the closest BT dummy coefficients. In general, they are not statis-tically significant. The contemporary coefficient is negative and significant. The moststriking result is that in the different subsample classifications this coefficient does not

22The range of observations for each regression goes from 235 to 4,460. We run 195 regressions.

Page 254: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

246 Martınez, Tapia e Yzaguirre

change its sign or is not statistically relevant23 . This is especially important in thebuyer and seller classification. This is not consistent with previous BT studies or withour intuition. In the total sample results, this negative effect of the contemporaneousBT dummy is almost offset by the effect of two orders later. In the end, it seemsthat there is no significant permanent effect on returns. The reason for this resultcould be the specific problems that traders face in the SSE in crossing a BT. Theseproblems could cause BT price not to be the real price. The idea is that investorswilling to buy (sell) a BT would pay (renounce) an additional fee that is not observedby market participants. In this environment, BT prices could be not informative.

Alternatively in order to control for irregular interval problem, we also calculatetime returns according with the expression:

Tark =⌊(1 + Rk)1/Diftk

⌋− 1 . (6)

The analogous regressions we now run for each BT are:

Tark = α +−3∑

τ=−1

φτ Tarτ +−3∑τ=0

λτ TarIBEXτ

+−3∑τ=0

βτ Tavolτ + ϕDend +10∑

τ=−10

δτ DBTτ + ωk , (7)

where TarIBEX is calculated in the same way as Tar, whereas Tavol is Vol/Dift.

With this specification, the results are slightly different. In general, the controlvariables are not relevant or their coefficients are lower than before, and BT dummiesare not significant. Although we cannot construct a statistical test to evaluate theappropriateness of time adjustment, by looking at adjusted R squared we can concludethat, in general, adjustment with Dift as an exogenous variable is better than Tar

adjustment. This is why we do not include these results.

23The subsample results can be obtained from the authors by request.

Page 255: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Information Transmission around Block Trades 247

R Adverse Selection VOL SCONS 1.5588E-05 0.622E-05 13.49* 0.00121*R(−1) -0.32* — — —

R(−2) -0.07* — — —

R(−3) -0.04* — — —

RIBEX 0.40* — — —RIBEX(−1) 0.16* — — —

RIBEX(−2) 0.10* — — —

RIBEX(−3) 0.05* — — —

VOL 0.132E-05* — — -2.41E-05*VOL(−1) 0.00298E-05 — 0.02* 1.59E-05*

VOL(−2) -0.0166E-05 — 0.06* 0.421E-05*

VOL(−3) -0.0194E-05 — 0.04* 0.0720E-05*

S(−1) — — — 0.40441*

S(−2) — — — 0.21956*

S(−3) — — — 0.05397*

DIFT -0.470E-05* — 1.36* -0.169E-05*DEND 52.493E-05* — 64.22* 0.00224*

λ — 0.000290E-05 — —-5 1.5507E-05 -0.0131E-05 -2.93 -4.41E-05-4 8.8251E-05 0.384E-05 2.86 8.45E-05-3 -7.297E-05 -0.0381E-05 -1.99 -24.0E-05-2 -17.42E-05 -0.0255E-05 9.79* 26.2E-05-1 3.8204E-05 0.509E-05 -8.01* -55.5E-05*0 -72.46E-05* -0.0783E-05 348.24* -0.00311*1 -11.36E-05 0.0112E-05 4.38 -29.8E-052 58.358E-05* 5.64E-05 -26.57* -12.2E-053 -8.642E-05 0.753E-05 -19.45* 31.1E-05**4 19.328E-05 0.0724E-05** -5.95* 18.7E-055 -13.33E-05 -0.0206E-05 -2.43* -4.79E-05

Table 5: For each BT in the sample, three time series regressions are run with three differentspecifications. In particular the regressions are:

Rk = α +

−3∑τ=−1

φτ Rτ +

−3∑τ=0

λτ RIBEXτ +

−3∑τ=0

βτVolτ + γDift + ϕDend +

10∑τ=−10

δτDBTτ + ωk

Sk = α +

−3∑τ=−1

φτ Sτ +

−3∑τ=0

βτ Volτ + γ Dift + ϕDend +

10∑τ=−10

δτ DBTτ + ωk ,

Volk = α +

−3∑τ=−1

βτ Volτ + γ Dift + ϕDend +10∑

τ=−10

δτ DBTτ + ωk ,

where RIBEX is the return of IBEX-35, Vol is the square root of accumulated volume between orderschanging asset true value, Dift is the square root of time elapsed between orders, Dend is a dummyvariable for end-of-the-day effects and DBT stands for the dummy variable employed to pick upeffects around BTs. Two time series regressions are run with two different specifications:

Volk = α +

−3∑τ=−1

φτ Rτ +

−3∑τ=−1

βτ Volτ + γ Dift + ϕDend + ωk ,

Rk = α + λ ωk +

10∑τ=−10

δτ ωkDBTτ + uk .

Coefficients are cross sectional averaged across all of them. White (1980) standard errors are used.

Page 256: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

248 Martınez, Tapia e Yzaguirre

4.2 Information Transmission Evidence

To test the information transmission hypothesis, we look at the adverse selectionspread component. The way in which we estimate this component is taken fromFoster and Viswanathan (1993). These authors measure adverse selection as thereturns response to unexpected volume. Given their model, we estimate the followingregression:

VOLk = α +−3∑

τ=−1

φτ Rτ +−3∑

τ=−1

βτ VOLτ + γ Dift + ϕDend + ωk , (8)

Rk = α + λωk +10∑

τ=−10

δτ ωk DBTτ + uk . (9)

The first equation estimates the unexpected volume for each change in true returnthrough residuals. The second equation measures the reaction of returns including asexplanatory variables these residuals and BT dummies. In this context, coefficient λmeasures mean adverse selection and coefficients δ measure abnormal adverse selectionaround BTs. Results are included in the second column of table 5. We can observethat the adverse selection component, measured as the coefficient of residuals, is notsignificant. The only significant coefficient is the one associated with four orders afterBT. These results are consistent with Admati and Pfleiderer (1988) model whereliquidity traders pool their trades. So insiders only act in these periods and not inthe middle of the day, when they would be detected. So, BTs are not as informativeas expected.

As can be observed in table 6, when we look at different subsample classifications,the results are slightly different. The contemporary BT dummy is significantly posi-tive for buyer and seller BTs but not for indeterminate BTs. This is consistent withthe sign of the initiator party. The same dummy is also significant and positive insweeping BTs. This result is also consistent because of the additional cost this typeof BTs imposes. Both results are indicative of information transmission. There existsan increase in adverse selection spread component for these subsamples These resultsare consistent with the presence of insiders trading with these types of orders. Itseems that the knowledge of the BT initiator party increases information asymme-tries among traders. Additionally, the implied greater cost of sweeping BT seems tobe a signal of the quality of the information transmitted to the market.

Page 257: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Information Transmission around Block Trades 249

Buyer-init.

Seller-init. Indetermi-nate init.

Inside thespread

Sweeping Not classi-fied

CONS -4,69E-06 9,02E-06 1,07E-05 1,15E-05 9,20E-07 1,52E-05

λ 4,16E-09 4,64E-09 1,19E-09 -1,31E-09 -3,10E-12 4,16E-08**

-5 -8,85E-07 1,73E-07 1,14E-07 8,59E-07 2,92E-07 -7,55E-06**

-4 5,27E-06 -2,14E-07 5,39E-06 3,73E-06 4,55E-06 -2,13E-07

-3 7,32E-07 -1,95E-06* -8,77E-08 4,66E-07 -4,53E-07 -3,94E-06*

-2 -8,34E-08 -1,35E-07 -4,20E-07 -1,55E-07 -1,18E-07 -1,61E-06

-1 -1,87E-05 -5,33E-07 2,17E-05** 1,01E-05 -9,44E-06 7,47E-05

0 4,11E-06* 1,79E-06* -5,02E-06 -6,44E-06 2,65E-06* 3,99E-06

1 -1,66E-07 -9,73E-07 9,00E-07 1,27E-06 -5,80E-07 -9,08E-07

2 2,69E-06 5,76E-08 1,19E-04 1,42E-04 1,46E-06 1,76E-06

3 -9,93E-07 3,98E-07 1,65E-05 1,97E-05 -3,24E-08 -1,60E-06

4 5,92E-07 1,16E-06 5,44E-07 4,45E-07 7,41E-07 1,95E-06

5 3,49E-09 -6,53E-07 -6,29E-08 -8,57E-08 4,11E-09 -2,13E-06

BB BS SB SS change intrue assetvalue

no changein true as-set value

CONS 3,18E-05* 6,66E-06 -2,70E-05* 1,27E-05 1,17E-05** -9,93E-07

λ 1,89E-09 -3,22E-09 1,12E-08 1,91E-09 5,17E-09 -1,02E-10

-5 2,24E-07 -1,01E-06 2,92E-07 -2,37E-08 3,42E-08 -3,49E-07

-4 4,15E-06 -2,78E-06 5,99E-06 8,04E-06 4,19E-06 3,37E-06

-3 1,09E-07 -5,66E-07 -1,02E-06 -5,82E-08 -2,55E-07 -5,47E-07

-2 -3,66E-07 -2,71E-07 -7,65E-07 3,73E-07 -2,02E-07 -3,24E-07

-1 -1,14E-06** 5,61E-06 2,45E-05 -8,22E-06 1,06E-05 -2,25E-06

0 1,32E-06 9,50E-07 -7,30E-06 1,77E-06 -3,81E-06 3,21E-06*

1 1,45E-08 2,78E-06* -9,08E-07 -1,46E-06 7,80E-07 -7,70E-07

2 -3,63E-07 4,11E-06 3,76E-06 2,17E-04 9,77E-05 1,82E-06

3 3,90E-07* 4,00E-07 -1,41E-06 3,06E-05 1,30E-05 3,07E-07**

4 1,59E-07 -4,12E-08 7,95E-07 1,99E-06 4,36E-07 1,11E-06

5 1,72E-08 -1,28E-08 -8,28E-07 -1,29E-08 -3,62E-07 6,75E-10

Table 6: For each BT in the sample, two time series regressions are run:

Volk = α +

−3∑τ=−1

φτ Rτ +

−3∑τ=−1

βτ Volτ + γ Dift + ϕDend + ωk ,

Rk = α + λ ωk +

10∑τ=−10

δτ ωk DBTτ + uk ,

where Vol is the square root of accumulated volume between orders changing asset true

value,Dift is the square root of time elapsed between orders,Dend is a dummy variable for

end-of-the-day effects and DBT stands for the dummy variable employed to pick up effects

around BTs. The coefficients are cross sectional averaged across all of them. White (1980)

standard errors are used.

Page 258: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

250 Martınez, Tapia e Yzaguirre

As a last test of information transmission, we consider volume as an endogenousvariable. Volume will measure abnormal activity around BTs. In this case, thiswould be a signal of insiders around BTs and information flow in the market.24 Theregressions for each BT are:

Volk = α +−3∑

τ=−1

βτ Volτ + γ Dift + ϕDend +10∑

τ=−10

δτ DBTτ + ωk . (10)

Results are in the third column of table 5. Before the BT we see an unclear pattern,with a negative coefficient just before the BT but a positive one two orders before.However, after BTs there is a significant decrease in market activity that could berelated to the presence of insiders. Those insiders could lead the rest of marketparticipants to decrease transacted volume. This is associated with previous findingson adverse selection.

4.3 Liquidity Evidence

For relative spread, Sk, the time-series regression run for each BT is shown by thefollowing expression:

Sk = α +−3∑

τ=−1

φτ Sτ +−3∑τ=0

βτ Volτ + γ Dift + ϕDend+10∑

τ=−10

δτ DBTτ + ωk . (11)

We show the results in the last column of table 5. The lagged variables are positiveand significant. As expected, we observe an autorregresive process in this variable.Another important variable is volume. We observe a negative contemporaneous coef-ficient and positive lagged ones. Negative relationship has been documented in otherresearch into the SSE (Rubio and Tapia (1996)). This evidence is also consistent withAdmati and Pfleiderer’s (1988) model and, at the same time, is contrary to the resultsof Lee, Mucklow and Ready (1993) for the US market.

The most important result related to liquidity is the negative and significant BTdummy coefficients just before and contemporary with BT arrival. This is related toan increase in liquidity. The increase in liquidity before BT can be explained by thenecessary introduction of pre-agreed BT limit orders for the same amount of sharesat the price available inside the spread. After BTs there is a decrease in liquidity,so part of the effect is temporary. This result is related to a decrease in temporaryspread components such as inventory cost and operative cost. This is relevant becausethese coefficients have been obtained taking into account volume as a control variable.Looking at the SSE, this is a stronger result because previous research did not findany effect on relative spread after controlling for volume.25

24See Admati and Pfeiderer (1988).25Rubio and Tapia (1996) show that relative spreads do not change in the SSE around dividend

announcements when they control for activity variables such as volume and number of transactions.

Page 259: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Information Transmission around Block Trades 251

5 Concluding Remarks

This study analyzes the role of BTs in the SSE. The contribution is the use of ordersthat change true asset value. Moreover, we apply this methodology to a market whereBTs are not facilitated. Thus, BTs are dealt on the SSE like small trades. This marketmicrostructure characteristic gives us a special testing ground.

We study three different effects around BTs: price, liquidity and informationtransmission. To capture them, we consider three different endogenous variables:true asset value returns, relative spreads and adverse selection spread component.With this approach, we find no clear effects of BTs.

There is no significant permanent effect on returns in the different subsampleclassification, which is contrary to previous evidence and to our intuition. In relatedpapers, other authors have obtained clear effects of BTs on prices depending on BTtype. We suspect that the reasons for these differences could be related to methodol-ogy and SSE market microstructure. To discover the source of these differences, thismethodology should be applied to other markets with block trading facilities.

In addition to previous studies, we analyze adverse selection as a measure ofinformation asymmetries and as a consequence of information transmission. It seemsthat there is an increase in information asymmetries when we look at adverse selectionspread component in the different subsample classifications (buyer, seller and sweepingBT). This result could be related to insiders trading in the market.

In sharp contrast with adverse selection evidence, we also observe a temporaryincrease in liquidity around BTs. These changes reflect temporary liquidity effectsrelated to other spread components (order processing costs and inventory costs). Thisopposite evidence could be explained by the fact that there are no special marketparticipants such as specialists or dealers and as a result our market participants arenot required to absorb temporary order imbalances.

Page 260: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

252 Martınez, Tapia e Yzaguirre

References

[1] Admati, A. and P. Pfleiderer: “A Theory of Intraday Patterns: Volume and PriceVariability”, The Review of Financial Studies 1 (1988), pp. 3-40.

[2] Amihud, Y. and H. Mendelson: “Asset Pricing and the Bid-Ask Spread.” Journalof Financial Economics 17 (1986), 2, pp. 223-249.

[3] Amihud, Y. and H. Mendelson: “Trading Mechanisms and Stock Returns: AnEmpirical Investigation.” Journal of Finance 42 (1987), pp. 533-553.

[4] Ball, R. and F. Finn: “The Effect of Block Transactions on Share Prices. Aus-tralian evidence.” Journal of Banking and Finance 13 (1989), pp. 397-419.

[5] Blume, M., C. Mackinlay and B. Terker: ”Order Imbalances and Stock PriceMovements on October 19 and 20, 1987.” Journal of Finance 44 (1989), pp.827-848.

[6] Chan, L. and J. Lakonishok: “Institutional Trades and Intraday Stock PriceBehavior.” Journal of Financial Economics 33 (1993), pp. 173-199.

[7] Chan, L. and J. Lakonishok: “The Behavior of Stock Prices around InstitutionalTrades.” Journal of Finance 50 (1995), pp. 1147-1174.

[8] Choe, H. and R. Masoulis: “Measuring the Impact of Dividend Capture Trading:A Market Microstructure Analysis.” Working paper, Vanderbilt University, 1992.

[9] Daley, L., J. Hughes and J. Raiburn: “The Impacts of Earnings Announcementson the Permanent Price Effects of Block Trades.” Journal of Accounting Research33 (1995), 2, pp. 317-334.

[10] Easley, D. and M. O’Hara: “Prices, Trade Size and Information in SecurityMarkets.” Journal of Financial Economics 19 (1987), pp. 69-90.

[11] Engle and Lange (1997): “Measuring, Forecasting and Explaining Time VaryingLiquidity in the Stock Market.” Discussion Paper 97-12, University of California,San Diego.

[12] Foster, F. and S. Viswanathan: “A Theory of Interday Variations in Volumes,Variances and Trading Costs in Securities Markets” The Review of FinancialStudies 3 (1990), pp. 593-624.

[13] Foster, F. and S. Viswanathan: “Variations in Trading Volume, Return Volatility,and Trading Cost: Evidence on Recent Price Formation Models” Journal ofFinance 48 (1993), pp. 187-211.

[14] Gemmill, G.: “Transparency and Liquidity: A Study of Block Trades on theLondon Stock Exchange under Different Publication Rules.” Journal of Finance5 (1996), pp. 1765-1790.

Page 261: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Information Transmission around Block Trades 253

[15] Glosten, L. and P. Milgrom: “Bid, Ask and Transaction Prices in a Special-ist Market with Heterogeneously Informed Traders.” Journal of Financial Eco-nomics 14 (1985), pp. 71-100.

[16] Harris, L.: ”A Transaction Data Study of Weekly and Intradaily Patterns inStock Returns.” Journal of Financial Economics 16 (1986), 1, pp. 99-117.

[17] Hasbrouck, J., G. Sofianos and D. Sosebee: ”NYSE Systems and Trading Pro-cedure”, NYSE Working Paper. 93-01, 1993.

[18] Hausman, J., A. Lo and C. Mackinlay: “An Ordered Probit Analysis of Trans-action Stock Prices.” Journal of Financial Economics 31 (1992), pp. 319-379.

[19] Holthausen, R., R. Leftwich and D. Mayers: “The Effect of Large Block Transac-tions on Security Prices.” Journal of Financial Economics 19 (1987), pp. 237-267.

[20] Holthausen, R., R. Leftwich and D. Mayers: “Large Block Transactions, theSpeed of response, and Temporary and Permanent Stock-Price Effects.” Journalof Financial Economics 26 (1990), pp. 71-95.

[21] Kraus, A. and H. Stoll: ”Price Impacts of Block Trading on the New York StockExchange.” The Journal of Finance 27 (1972), pp. 569-588.

[22] Kyle, A.: “Continuous Auction and Insider trading.” Econometrica 53 (1985),pp. 1315-1335.

[23] Lee, C., B. Mucklow and M. Ready: “Spreads, Depths and the Impact of Earn-ings Information: An Intraday Analysis.” Review of Financial Studies 6 (1993),pp. 345-374.

[24] Lee, C. and M. Ready: “Inferring Trade Direction from Intraday Data.” TheJournal of Finance 46 (1991), 2, pp. 733-747.

[25] O’Hara, M.: Market Microstructure Theory. Blackwell Publisher, Massachusetts,(1995)

[26] Riva, F.: “Block Trading on the Paris Bourse Central Market: An Empiri-cal Study.”, Proceedings of Organization and Quality of Equity Markets, Paris(1996).

[27] Rubio, G. and M. Tapia: “Adverse Selection, Volume and Transactions aroundDividend Announcements in a Continuous Auction Markets.” European Finan-cial Management 2 (1996), 1, pp. 39-67.

[28] Scholes, M.: ”The Markets for Securities: Substitution versus Price Pressure andthe Effects of Information on Share Prices.” Journal of Business 45 (1972), pp.179-211.

Page 262: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

254 Martınez, Tapia e Yzaguirre

[29] Seppi, D.: “Equilibrium Block Trading and Asymmetric Information.” The Jour-nal of Finance 45 (1990), 1, pp. 73-94.

[30] Seppi, D.: “Block Trading and Information Revelation around Quarterly Earn-ings Announcements.” The Review of Financial Studies 5 (1992), 2, pp. 281-305.

[31] Stoll, H. and R. Whaley.: “Stock Market and Volatility.” Review of FinancialStudies 3 (1990), pp. 37-71.

[32] White, H.: “A Heteroscedasticity-Consistent Covariance Estimator and a DirectTest for Heteroscedasticity.” Econometrica 48 (1980), pp. 817-839.

M. A. MartınezDepartamento de Fundamentos del Analisis Economico

Facultad de Ciencias EconomicasUniversidad del Paıs Vasco

Avenida Lehendakari Aguirre, 8348015 Bilbao, Spain

e-mail: [email protected]

Mikel TapiaDepartamento de Economıa de la Empresa

Universidad Carlos III de MadridC/ Madrid, 126

28093 Getafe (Madrid), Spaine-mail: [email protected]

J. YzaguirreCalidad de MercadoSociedad de Bolsas

C/ Alfonso XI, 6 (Madrid)e-mail: [email protected]

Page 263: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Market integration measures

Angel Pardo, Alejandro Balbas and Vicente Meneu1

Abstract

Many market integration measures are operationalized to compute their nu-merical values during a period characterized by the lack of stability and marketturmoil. The results of the tests give their degree of effectiveness, and revealthat the measures based on the principles of asset valuation, versus statisti-cal measures, more clearly yield the level of integration of financial markets.Besides, cross market arbitrage-linked measures and equilibrium models-linkedmeasures provide complementary information and reflect different properties,and consequently, both types of measures may be useful in practice2.

1 Introduction

The integration of financial markets is a usual issue of special interest that has beenthe objective of numerous papers comparing stock markets, bond markets, foreignexchange markets, commodity markets and derivative markets. A high degree ofintegration among markets indicates that prices are formed in a correct way and,therefore, agents interested in well-diversified portfolios and appropriate risk-returnratios will concentrate on the available assets without taking into account the concretemarkets. Furthermore, if derivative markets are involved, low cost operations can becarried out possibly helping to attract more investors to hedged or deferred positions,increasing market liquidity.

Conversely, a low degree of integration implies quite different pricing rules withthe subsequent effect on the diversification process. It also can dissuade hedgedpositions and leads to arbitrage strategies that generate risk-less profits derived fromdiscrepancies in prices. Finally, some agents can implement speculation strategiesthat take profits from greater predictive power of one market over another.

1Angel Pardo Tornero es Profesor del Departament de Economia Financera i Matematica de laUniversitat de Valencia. Alejandro Balbas es Catedratico de Economıa Financiera de la UniversidadCarlos III de Madrid. Vicente Meneu es Catedratico de Economıa Financiera de la Universitat deValencia. Los tres profesores forman parte de un grupo de investigacion en Economıa Financiera,Optimizacion y Modelizacion Matematica. Esta charla se impartio en la sesion del Seminario MEFF-UAM de febrero de 1999.

2We thank Alfonso Novales and Ignacio Olmeda for helpful comments. We are grateful to JorgeYzaguirre from Spanish Stock Exchange and Remedios Romeo from MEFF-RV for providing thedata necessary to perform this study. Research funded by DGYCIT (reference number: PB95-0729-C02-02) and University of Valencia (project UV98-2716).

Page 264: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

256 Balbas, Meneu and Pardo

In spite of this, a rigorous definition of what is understood by integrated marketsdoes not exist in the financial literature and it is only commonly accepted an intu-itive but imprecise idea: two financial markets are integrated when they evolve ina combined way. Many authors try to formalize the concept and provide numericaland analytic integration measures. Several questions arise. For instance, under whichconditions are they equivalent? Is any of them superior to the rest? Do the responsesto these questions depend on the concrete setting?

Theoretical and empirical approaches may be applied to answer these questions.This paper presents an empirical test that analyzes the effectiveness of a large numberof measures in a situation of clear disintegration. To do that, the measures havebeen classified into two major categories accordingly to their nature. The first groupcontains those measures introduced by statistical and econometric methods, while thesecond focuses on the asset pricing theory.

It should be pointed out that this type of classification has never been previouslyproposed. The purpose is to analyze the convenience of considering the financialtheory to introduce an integration measure. In short, twelve integration measures arerevised; four based on statistical techniques and eight on the basic principles of assetvaluation.

In order to guarantee the lack of integration, the Spanish index IBEX-35 andits derivative market have been chosen during a period characterized by market tur-moil. These markets have shown a high degree of efficiency, as pointed out by Leeand Mathur (1999), but a large number of cross-market arbitrage opportunities wereavailable during the Asian crash of October, 1997 (Balbas et al. 1997).

The applied procedure guarantees the maximal precision since perfectly synchro-nized high frequency data have been used to compute the value of the market inte-gration measures.

Two main results are reached. First, measures based on the principles of assetvaluation provide an absolutely similar degree of integration, minute-by-minute, dur-ing the tested period, while the rest of measures contradict each other. This seems toimply a serious objection for the statistical measures that are not able to give an uni-fied conclusion and, consequently, asset-pricing models could yield a more successfulway to measure the level of market integration.

Second, the measures based on theoretical approaches may be subdivided in mea-sures based on cross-market arbitrage and measures based on equilibrium models.Cross-market arbitrage-linked measures seem to be more adequate when derivativesare involved and hedging or deferred strategies are the focus of the analysis. Besides,equilibrium-linked measures are useful when studying very incomplete markets andseeking for well-diversified portfolios, although the data of long periods are requiredin order to compute some of these measures. Thus, arbitrage and equilibrium argu-ments apply in different settings and reflect different properties, what justifies thatboth sorts of measures may be considered to analyze integration levels.

Page 265: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Market Integration Measures 257

The outline of the paper is as follows: Section 2 is devoted to summarize some in-tegration measures based on statistical and econometric techniques. Section 3 studiesthe measures based on cross-market arbitrage. Section 4 reviews equilibrium-linkedmeasures. Section 5 describes the data and the trading conditions on Spanish Finan-cial Markets during the first days of the Asian crash (October 1997). In Section 6 themeasures are applied to the IBEX-35 futures market. Section 7 concludes the paper.

2 Measures based on Statistical and EconometricTechniques

The first set of measures is based on statistical and econometric methods. The mostwidely used and intuitive measure is the cross correlation of contemporary returns ofthe compared markets. So, he first measure of economic integration can be stated as:

• Measure 1. The spot-futures market integration can be measured by the correla-tion coefficient between simultaneous returns in the markets. The higher the correla-tion coefficient, the stronger the market integration is (Kempf and Korn, 1998).

A correlation coefficient near to one would indicate perfect integration betweenboth markets since they incorporate the information in the same manner. A zero ornegative correlation coefficient would imply segmentation. This measure is usuallyaccompanied by the cross-correlation coefficient analysis of the non-contemporaryreturns of both markets. The purpose is to check if they are not autocorrelated.Through this analysis, another measure of the degree of market integration is defined.

• Measure 2. Spot-futures market integration can be measured by the cross-correlation coefficient between simultaneous returns and the cross-correlation coef-ficients for the spot return with the futures return at different lags. The higher thecontemporaneous coefficient and the minor lagged correlation coefficient, the strongerthe market integration is.

We would like to emphasize that cash market frictions grant some comparativeadvantages to the futures market, which have led to some authors to analyze if pricesin the futures market lead or lag those in the spot market. Consequently, differentworks studied the dynamics between the price returns of market indexes and theirfuture contracts applying either the causality of Granger (1969) (see Kawaller et al.(1987) and Ng (1987)) or the causality of Sims (1972) (see Stoll and Whaley (1990),Chan (1992) and Abhyankar (1995)). For this last case, the regression equation is:

ct = α +p∑

k=−p

βk ft−k + ut (1)

where ct and ft indicate the returns of the cash and of the derivative assets at thedate t, respectively, and k is the number of lags. The coefficients with negative

Page 266: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

258 Balbas, Meneu and Pardo

(positive) subscripts indicate lag (lead) coefficients. The degree of market integrationis deduced, in this case, from the βk values.

• Measure 3. The markets are integrated if the contemporary variable coefficient βk

is greater than zero and all other coefficients are not different from zero. Significantvalues for the coefficients at lags k would indicate that the returns in the futuresmarkets tend to lead those in the spot market, and significant values for the coefficientsat leads k would indicate that the futures market tends to lag the spot market.

It should be pointed out that measures 1, 2 and 3 are characterized for the useof returns (first differences in prices). This causes some inconvenience when spotand futures prices form a cointegrating vector.3 For this reason, the developmentof cointegration techniques at the end of the eighties resulted in a new integrationmeasure based on prices and not on returns.

• Measure 4. Two markets are integrated if a cointegrating structure between themexists.

The study of the integration between the derivative market and its underlyingasset through cointegration analysis lies on the relationship between arbitrage andcointegration. Pricing based on arbitrage must duplicate one asset with another (ora combination of other) asset(s). Hence, if the derivative asset follows a certaintrend, the arbitrage activity should cause the underlying asset to share the sametrend. Consequently, as Arshanapalli and Doukas (1997, pages 258-259) pointed out,“cointegration [...] would imply that the deviation from the common equilibriumpath should cause price realignments, restoring the original equilibrium. On theother hand, lack of cointegration between the index futures and the underlying cashmarket would suggest that the underlying forces which are required to integrate thetwo markets into one market are rather weak”.

The Granger Representation Theorem establishes that if the price series of the twocomparative markets are cointegrated, the short-run adjustments of the series withregard to the equilibrium level are included in an error correction model. If spot andderivative asset prices are cointegrated, then either spot prices lead derivative prices,or derivative prices lead spot prices or a combination of the two effects exits. For thisreason, measure 4, together with measures 2 and 3, have been applied to measure theintegration between markets and to check a possible lead-lag relationship.4

All the measures based on statistical and econometric techniques study the inte-gration between two concrete markets in a time interval and require a wide sample

3The components (price series) of the vector xt are said to be cointegrated of order d, b if allcomponents of xt are integrated of order d, I(d), and there exists a vector α = 0 such that linearcombination is integrated of order d − b, I(d − b), where b > 0. The vector α that allows a linealcombination of variables I(d) with a integration order smaller than d is called a cointegration vector.If α exists a bivariate model that uses only first differences will be mispecified (Engle and Granger,1987).

4See Sutcliffe (1997, pages 162-172) for a complete survey of the empirical studies of leads andlags between spot and futures prices and Stephen and Whaley (1990) and De Jong and Donders(1998) for the case of relationships between options and stock markets.

Page 267: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Market Integration Measures 259

period. However, they do not provide information on the strategy to implement inorder to take advantage of the lack of integration, nor do they consider the transactioncosts that would be incurred when carrying it out. We should stress that all of themshare the characteristic of exclusively reflecting movements in returns or in marketprices of the comparative assets, without taking into account any valuation model.As a result, measures based on the principles of asset valuation are of a particularinterest since they can be applied at any moment in time and, in some cases, theyprovide an optimum arbitrage strategy.

3 Measures based on Cross-Market Arbitrage

The first studies to outline the integration between derivative markets and their un-derlying assets following the basic principles of asset valuation placed great emphasison checking the fulfillment of the Law of One Price (LOP).5 Consequently, the deriva-tive asset has to be duplicated (or the underlying asset from the market price of thederivative asset) and the theoretical price has to be compared with its market price.Since the asset and its replica must offer the same payoffs, the equality between theseprices indicates the fulfillment of the LOP. On the other hand, the mismatches ofthe market prices with the theoretical ones allow a risk-less benefit to be obtainedthrough the purchase of the cheap asset and the sale of the expensive one. Of theabove-mentioned, an integration measure p that compares the deviation between thetheoretical spot price (C ′

t) and the spot price (Ct) can be defined as:

p =C ′

t

Ct. (2)

In this case, the presence (absence) of market integration is studied by means offulfillment (or not) of the Law of One Price.

• Measure 5. If p is equal to one, the LOP is fulfilled and the markets are integrated.Conversely, if p is bigger (smaller) than one the cash index is undervalued (overvalued)with regard to its replica obtained from the derivative contract and the risk-less bond.

This measure allows the incorporation of the transaction costs involved in arbitragestrategy. It also permits the study of market integration between the futures marketand the underlying market, between the options market and the cash market andbetween the futures and the options markets if these last two have a futures contractas an underlying asset.

Recently, Chen and Knez (1995) have introduced a new approach to analyze thedegree of market integration. They define the concept of market integration in aweak and a strong sense and establish the corresponding measures. Two markets areintegrated in a weak sense if the LOP is fulfilled between them.

5See Protopapadakis and Stoll (1983), Cornell and French (1983a and 1983b), Modest and Sun-daresan (1983) and Modest (1984).

Page 268: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

260 Balbas, Meneu and Pardo

• Measure 6. Consider two markets A and B in which the LOP holds separately.The weak integration measure g(A,B) is defined as the smallest difference betweeneach market’s family of state prices and it is calculated as

g(A,B) = mindA∈DA , dB∈DB

‖dA − dB‖2, (3)

where DA and DB are the sets of state prices for each market and ||·|| is the Euclideannorm. If g(A,B) = 0, the markets are integrated in a weak sense, while if g(A,B) > 0,the markets are not integrated and arbitrage opportunities exist. Since the fulfillmentof the LOP does not imply the absence of arbitrage opportunities (AAO),6 Chen andKnez restrict the concept of integration and establish that two markets are integratedin a strong sense if cross-market arbitrage opportunities do not exist between them.They define a new integration measure:

• Measure 7. Consider two markets A and B in which there are not arbitrageopportunities in either market. The integration measure in a strong sense is definedas the smallest difference between the positive state prices and it is calculated as

a(A,B) = mindA∈D+

A , dB∈D+B

‖dA − dB‖2, (4)

where D+A and D+

B are the sets of positive state prices for each market. If a(A,B) = 0,the markets are integrated in a strong sense, while markets are not integrated andarbitrage opportunities exist as long as a(A,B) > 0.

Measures g and a represent an important advance on the measures based onstatistical and econometric techniques and on measure p, since they inform of marketintegration by considering all possible arbitrage portfolios and they are not based onconcrete strategies. Nevertheless, the two integration measures proposed by Chenand Knez are based on differences in state prices and, therefore, they do not allowthe transaction costs to be discounted.

Balbas and Munoz (1998), following the approach by Chen and Knez, propose anew integration measure m based on monetary terms. They use the benefits that canbe obtained from the optimal arbitrage strategy, if it exists. To obtain this measure,they consider a two period model, t and T , and a unique market that incorporates allthe markets that they compare. n assets are traded at a price pi, with i = 1, 2, . . . , nat the date t. A portfolio x is defined as x = (x1, x2, . . . , xn), where the xi indicatesthe bought (positive sign) or sold (negative sign) units of the asset i. Any marketportfolio has a price at tgiven by:

P (x) =n∑

i=1

xi pi .

6The absence of arbitrage opportunities implies the fulfillment of the LOP. In general, the recip-rocal is not true. See Ingersoll (1987, p.59).

Page 269: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Market Integration Measures 261

All the assets take prices that are known at moment T assuming a discrete source ofuncertainty K. If the states of nature are H, only one of them can occur at T . Theprice of portfolio xat moment T is given by:

αx(k) =n∑

i=1

xi αi(k) ,

where αi(k) indicates the pay-off of the asset i in the state of the nature k. Theorem3 of Balbas and Munoz (op.cit. p. 163) proves that when LOP fails, then there existsa solution x∗ for the following optimization problem:

Maximize f(x) =−∑n

i=1 xi pi

−∑i∈Sx

xi pi

subject to

∑ni=1 xi αi(k) = 0 for every k ∈ K,

∑ni=1 xi pi < 0 ,

where Sx represents the set of the sold assets of portfolio x (i.e., xi < 0). Thenumerator of the objective function is the value of the arbitrage portfolio and thedenominator is the aggregate amount of the sales, both expressed in monetary units atmoment t. The quotient can be interpreted as the ratio between the benefit obtainedfrom the arbitrage strategy x∗ and the value of the sold assets. The first constraintimplies that at the moment T the portfolio has a pay-off equal to zero in all statesof nature. The second constraint looks for portfolios that provide an income at themoment t. Notice that the set of opportunities of the problem is the set of possiblearbitrage portfolios.

If the solution is reached at x∗, the integration measure is defined by m = f(x∗)and takes values between 0 and 1. As a result, the new integration measure is:

• Measure 8. If m is equal to zero, the LOP holds and the markets are integrated.If m takes values greater than zero, arbitrage opportunities exist and the markets arenot integrated.

It is possible that arbitrage opportunities exist even when m is equal to zero.To detect them, it is only necessary to modify the sign of the first constraint of theprevious problem, imposing the search for a portfolio whose payoffs at T are biggerthan or equal to zero in all the states of nature. In this case, the optimal value willbe denoted by M . Therefore, following the terminology of Chen and Knez (1995), mand M could be considered the weak and strong integration measures proposed byBalbas and Munoz (1998). Thus, we have a new integration measure:

• Measure 9. If M is equal to zero, the markets are integrated in a strong sense. IfM takes a value greater than zero, arbitrage opportunities exist and the markets arenot integrated.

Page 270: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

262 Balbas, Meneu and Pardo

The measures m and M denote the integration of the market in a global sense,since they consider all the possible arbitrage strategies and they choose the optimalone. Moreover, these measures do not need to make assumptions about the fulfillmentof the LOP or about the AAO on each market, because all the analyzed assets areincluded in only one market.

The use of integration measures based on profits instead of state prices facilitatesthe consideration of the transactions costs paid when carrying out an arbitrage strat-egy. If l is defined as the quotient between the profit of the arbitrage portfolio andthe total value of the exchanged assets, a relationship between l and m (Balbas andMunoz (op.cit, p. 165)) can be stated:

l =m

2 − m.

Assume that the total transactions costs (T ) incurred in arbitrage related strategiesare proportional to the sum of the purchase (P ) and sold (S) quantities and definethe ratio TC as the ratio T/(P + S). The difference between l and TC indicatesthe unitary profit obtained from the arbitrage once the transaction costs have beendiscounted. The consideration of the transaction cost is a fundamental aspect whendetermining if the markets are integrated or not. Arbitrage opportunities can exist,indicating that the markets are not integrated (m > l > 0), but they cannot beexploited since the profit would not compensate the transaction costs (TC > l). It isinteresting to highlight that if l is equal to TC we have:

m′ =2 (TC)1 + TC

,

where m′ is an implicit measure of integration that indicates the minimum value thatm must take so that arbitrage opportunity exists. Or, in an alternative sense, themaximum value that m can take so that the market is integrated.

Therefore, significant results are obtained with the Balbas and Munoz integrationmeasures: the composition of the optimal portfolio and the possibility to discount thetransaction cost.

4 Measures based on Equilibrium Models

The third group of measures is based on the principles of asset valuation but theyrest on equilibrium models. Garbade and Silber (1983) collected this feature in themeasure they suggested for testing the integration level between the cash and futuresmarkets. These authors specified a dynamic equilibrium model and they establishedthat the degree of market integration is a function of the elasticity of supply of arbi-trage services that can be measured from the following model:

C ′t − Ct = α + δ

(C ′

t−1 − Ct−1

)+ εt , (5)

Page 271: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Market Integration Measures 263

where C ′t is the natural logarithm of the theoretical spot price, Ct is the natural

logarithm of the observed spot price and δ is an inverse measure of the elasticity ofsupply of arbitrage services. “In the context of equation [. . . ], δ measures the rateof convergence of cash and futures prices” (op.cit. p. 294) and is the measure ofintegration 10:

• Measure 10. If δ is small, both markets are integrated and prices will convergequickly. If δ is equal to one, both markets are not linked and the futures and spotprices will follow uncoupled random walks.

It is important to note that “although Garbade and Silber have provided a modelto estimate the rate of convergence of cash and futures prices which reflects thecorresponding level of index arbitrage activities, they do not furnish a statistical testfor the significance of the estimated coefficients, [...] which has profound implicationsin the testing for market linkage” (Wang and Yau, 1994, p. 461). Hence, Wang andYau (op.cit.), Yadav (1992) and Kempf and Korn (1998) have outlined the estimationof δ testing for the presence of a unit root in the mispricing series, defined as thedifference between theoretical and market prices. Thus, we have a new measure ofintegration derived from the previous one that would be obtained by testing for thepresence of a unit root in the following model:

∆Mt = α0 + γ Mt−1 +p∑

i=1

γp ∆Mt−p + ξt , (6)

where Mt = C ′t − Ct and γ shows the mean reversion in mispricing. Its value is the

integration measure 11:

• Measure 11. If there is not a unit root in the mispricing series (i.e., γ < 0), marketsare linked. If there is a unit root (i.e., γ = 0), spot and futures price series are notrelated and the markets are not linked. The higher the mean reversion parameter γ,the stronger the market integration is.

In this case, the integration is again wholly related to the existence of arbitrageopportunities. If the previous mispricing was positive (the spot price was under-priced), arbitrage activity would force the change in the mispricing to be negative(the underpricing would decline) and vice versa.7

Yadav et al. (1994) and Dwyer et al. (1996) have generalized the mean reversionanalysis by applying a cost of carry model with nonzero transaction costs to motivateestimation of threshold models between futures and cash indexes. Their results sug-gest that the speed of convergence of the basis to its equilibrium value depends onthe level of mispricing.

Bessembinder (1992) proposed the latest measure we review. This author estab-lishes that assets and futures markets are integrated if expected returns on portfolios

7In perfectly integrated markets this measure is not defined since the mispricing series takes azero value for all t (see Kempf and Korn, 1998).

Page 272: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

264 Balbas, Meneu and Pardo

consisting of asset and futures positions are identical to expected returns on asset-onlyportfolios of identical systematic risk.

The relationship between Et−1 (Rait), the expected next period return on the ith

asset, and its systematic risk is stated as

Et−1 (Rait) = γ0t + βa

it−1 γ1t , (7)

where γ0t is a cross sectional constant, βait−1 γ1t is a 1 × n vector of conditional

sensitivities of i asset to each of n economic variable and γ1t is a n × 1 vector of riskpremiums at time t.

The behavior of futures prices in a model of capital market equilibrium obeys therelation

Et−1

(Rf

it

)= βf

it−1 γ1t , (8)

where βfit−1γ1t is a 1 × n vector of conditional sensitivities of percentage change in

futures prices j to the n economic variable.

Since (7) holds for spot prices and (8) holds for futures, expected returns of port-folios composed of assets and futures are also given by (7). Thus, market integrationimplies that the futures premium and the expected excess return on the spot assetdiffer only if the systematic risk of the spot and futures markets differ. To evaluatethis, conditional betas are estimated and are used to make cross sectional regressionsof the form

Rpt = γ0t + γ∗0t dp +

n∑i=1

[γit βipt + γ∗

it βipt dp

]+ εpt ,

where Rpt is the return on equity portfolio or futures contract p, βipt is the estimatedbeta for portfolio p with respect to the ith economic variable, and dp is a dummyvariable equal to zero for spot assets and equal to unity for futures contracts.

The hypothesis that futures markets are fully integrated with assets markets ischecked by testing that risk premiums are uniform across assets and futures marketsand that the intercept for futures contract is zero.

• Measure 12. The markets are integrated if we cannot reject that the estimates ofγ∗

it and the estimates of γf0t ≡ γ0t + γ∗

0t are equal to zero.

In short, measures 10, 11 and 12 only study the integration between the spot andfutures markets. They have similar characteristics to the measures based on econo-metric techniques but, unlike them, they have to take into account some equilibriummodel.

Table I shows the different financial integration measures described in Sections 2,3 and 4 and a summary of some of their characteristics.

Page 273: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Market Integration Measures 265

5 Data and Trading Conditions

The IBEX-35 futures market (MEFF-RV) began to trade in January 1992 and sincethen it has consolidated itself as one of the most important in Europe.8 The stock andfutures markets open at 10.00 a.m. and close at 5.00 p.m. and 5.15 p.m. respectively.Both markets are electronic and the priority for crossing a transaction is determinedby price. If prices are equal, priority is given to the arrival time of the order.

The data used in this study make reference to the period between the 22nd and30th of October 1997 (7 market sessions). The minute to minute prices of the IBEX-35index and the midquote of the bid and ask price of the futures contract on IBEX-35, with expiration on the 21st of November 1997, have been obtained from theMarket Information System (MIS) of MEFF-RV. The Sociedad de Bolsas providedthe dividends paid out by the IBEX-35 index shares and the interest rates have beenobtained from the Servicio de Series Temporales del Banco de Espana.9

On Thursday, October 23rd, 1997, the Hang Seng index of the Hong Kong StockExchange suffered a fall of 10.41% , which in turn caused a generalized drop in theEuropean markets. The IBEX-35 index fell 2.49% and 0.79% on the 23rd and 24th,respectively (see the third line of Table II).

On the 27th of October the Hong Kong, the Indonesian and the Taiwanese StockExchanges received a large number of sale orders, which caused an important fall inmarket prices. Its effect was reflected, again, in the Spanish market, first, throughincrements in the trading volumes and in the intraday volatility of the markets and,second, through a decline in the IBEX-35 of 4.40% (fifth column of Table II).

The convulsions in the stock and futures markets worldwide continued during themarket session of the 28th of October. The Spanish stock market stopped tradingfrom 4.46 p.m. to 5.30 p.m. due to the spectacular increase in prices in New York (at4.40 p.m., Spanish time). For the first time in the history of the Spanish electronicmarket, an adjusting period was instigated from 5.30 p.m. to 6.00 p.m. in order toallow adjustments in the shares market. At 6.00 p.m. the open session began againand concluded a half an hour later. However, the derivatives market was closed fromthe 5.04 p.m. to 6.43 p.m., at which time trading began once more and continueduninterruptedly until 7.40 p.m. The results of a session with so many incidents canbe summed up under three points: firstly, the stock and the derivative markets onIBEX-35 registered record maximum daily volumes; second, the size of the relativebid-ask spread of the futures contract took values that duplicated the bid-ask spreadin stable periods; and, lastly, the intraday volatility of the minute by minute IBEX-35 index was 0.125% , while the volatility of the IBEX-35 future was 0.235% (sixthcolumn of Table II).

8MEFF-RV, in 1994 and 1995, was the stock index futures market with the largest number offutures contracts traded worldwide (Sutcliffe, 1997, p.59, Table 3.4.).

9Because intraday data were not available for interest rates, the daily middle rate correspondingto the repo operations carried out with Spanish Treasury Bonds has been chosen for all the minutesof the same day.

Page 274: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

266 Balbas, Meneu and Pardo

Market instability continued on the 29th of October. The shares market begantrading 39 minutes late, due to the excessive volume of orders that had been placedduring the adjusting period. The vendors stopped providing information about thespot index from 0.22 p.m. until the 0.49 p.m. Finally, the Spanish stock market roseby 5.66% , the biggest daily rise in the last six years, with an intraday volatility ofover than 0.07% (seventh column of Table II).

To sum up, the beginning of the crisis of the Asian financial markets at the end ofOctober, 1997 caused large variations in the closing prices, high intraday volatilitiesand unprecedented trading volumes in the spot and futures markets. All this justifiesthe choice of this period for the study of the financial integration between the twomarkets, comparing a stable subperiod (the 22nd, 23rd and 24th of October) with anunstable subperiod (the 27th, 28th, 29th and 30thof October).10 The delays, stops andextensions of the trading session in several market sessions have led to the adjust-ment of the sample period for the seven days. Consequently, the degree of financialintegration between stocks and stock index futures has been determined daily.

6 Results

6.1 Measures based on statistical and econometric techniques

The cross correlation analysis of the minute-by-minute returns for IBEX-35 spot andIBEX-35 futures is presented in Table III. The contemporary correlation coefficients(measure 1) are significant at the 1% level every day, except the 29th of October.For this day we cannot reject the segmentation hypothesis between markets (H0 :ρspot,fut = 0) at the 1% level.

In the non-contemporary cross correlation analysis (measure 2) we observe that,firstly, every day presents a cross correlation between spot price changes and one-minute lagged futures price changes (ρspot,fut(−1)) significant at the 1% level andhigher than the contemporary correlation. Secondly, the coefficients with k > 0 aresignificant only starting from the 28th. These results suggest that new informationtends to be reflected first in futures market in stable periods, while during the Asiancrisis a bi-directional effect is observed. According to the second measure, therefore,the 22nd, 23rd and 24th show the highest degree of integration.

Before estimating a bivariate model to determine the degree of market integrationthat measure 3 proposes, it is important to remind that this measure uses returns asvariables (first differences in prices). If the cash and futures series were cointegrated,

10The integration between the derivative markets of the S&P 500 market index and their underlyingasset in stable and volatile periods has been studied in various works in which the sample periodis centered around the crash of October of 1987. Harris (1989) studies the behavior of the basis;Kleidon (1992) and Kleidon and Whaley (1992) carry out a cross correlation analysis of the series ofreturns of the cash and derivative markets; Wang and Yau (1994) analyze the mean reverting of theresiduals of the cointegration equation while Arshanapalli and Doukas (1997) study the integrationusing cointegration and error correction models.

Page 275: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Market Integration Measures 267

a bivariate model expressed in first differences would not be well-specified (Engle andGranger (1987)). Hence, we are going to analyze if a cointegration relationship existsbetween the cash and futures prices on the IBEX-35 index.

The null hypothesis of a single unit root is tested for each of the IBEX-35 spotand futures prices using the non-parametric test of Phillips and Perron.11 Althoughthe null hypothesis is not rejected for the price series at the 5% level, it is for theseries in differences at the 1% level.

Once proven that both series are integrated of the same order, we have tested forthe existence of a stationary linear combination of them (measure 4) by applying themultivariate methodology proposed by Johansen (1988 and 1991) and by Johansenand Juselius (1990). Table V reports the cointegration results. The null hypothesis ofno cointegration is rejected at 10% level and, therefore, we cannot reject the existenceof at least one cointegration vector. These results dissuade the use of integrationmeasure number 3. We highlight in Table V the fact that the null hypothesis isrejected at the 10% level on the 29th of October and at 5% level on the 27th and 28th,while the remaining days it is rejected at the 1% level. Therefore markets appear tohave been highly integrated under normal trading conditions.

After detecting the existence of a cointegration vector, an error correction modelhas been estimated for each day.12 The model that has finally been constructed,according to the Johansen procedure (1988 and 1991) is as follows:

∆lpct = c1 + γ1 zt−1 +p∑

i=1

a1i ∆lpct−i +p∑

i=1

a2i ∆lpft−i + u1t ,

∆lpft = c2 + γ2 zt−1 +p∑

i=1

b1i ∆lpct−i +p∑

i=1

b2i ∆lpft−i + u2t ,

where lpct and lpft indicate the natural logarithm of the prices of the last transactionof the series of the IBEX-35 and the midquote of the futures contract; c1 and c2 areconstant; p indicates the number of lags and zt−1 is the error correction term that isobtained from the following expression

zt−1 = α1 × lpct−1 − c − α2 × lpft−1 ,

11In this section, the term integration is used in an econometric sense. A series is integrated oforder one if it contains a unit root. A series of this type becomes stationary or integrated or orderzero when taking first differences.

12The Schwartz Bayesian Criterion has been used to determine the number of lags of the errorcorrection models. Subsequently, we proved the presence of serial correlation. If correlation did notappear, the chosen number of lags was that proposed for the criterion. Conversely, if serial correlationproblems were detected, the number of lags was increased until eliminating the correlation. Weshould also point out that the number of lags proposed was the same for the both equations andboth variables.

Page 276: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

268 Balbas, Meneu and Pardo

where α1 and α2 indicate the parameters of the cointegrating vector.13

The estimates of error correction coefficients in the spot (γ1) and the futures (γ2)equations are presented in Table VI. γ1 is significant, negative and higher than γ2

in absolute value for every day, while γ2 is only significant on the 27th of October.These results suggest that the spot market responds to the deviation from long-run equilibrium in (t − 1) for every day except for the 27th, where a simultaneousadjustment is observed in the spot and futures markets. Furthermore, the absolutevalue of γ1 diminishes strongly on the 28th and 29th. This indicates a smaller responseof the spot market to the disequilibrium between spot and futures prices during theAsian crisis.14

In short, the measures based on statistical and econometric techniques contradicteach other when determining the absence or presence of market integration. Forexample, according to measure 1 (ρspot−fut) the markets are more integrated on the28th than the 29th (Table II) while, according to measure 4, the markets are notintegrated on the 28th and they are on the 29th at the 5% level (Table VI).

6.2 Measures based on cross-market arbitrage

The study of financial integration measures based on the basic principles of assetsvaluation traditionally starts by measuring the degree of fulfillment of the LOP. Al-though the absence of arbitrage opportunities (AAO) is stronger than LOP (AAOimplies LOP but the converse fails in a general framework), they are equivalent con-ditions in the particular case of a stock index and its replica.15 Consequently, thestudy of the fulfillment of the LOP between the futures market on IBEX-35 and itsunderlying asset (and the risk-less asset) in fact embraces the study of all the possiblearbitrage opportunities. Furthermore, Pardo (1998) proved the equalities g = a andm = M in this particular context.

Measures p, g and m have been calculated for each minute of the days consideredand are summarized in Table VII (second, third, fourth and fifth lines). If we do notconsider the transaction costs all the measures indicate market disintegration. Themaximum disintegration is observed during the 28th, 29th and 30th. On the 28th mea-sure p takes the maximum and the minimum values of the period and, also, measuresg and m reach their highest values. The greatest integration level is detected on the22nd, 23rd and 24th. We also highlight the fact that the minutes with overvaluationsof spot prices with regard to the futures prices (Ct > C ′

t) are greater than those of the

13The models have been estimated for each day and they do not include intercept in the cointegra-tion equation on the 29th and 30th, while the rest of the days include intercept in the cointegratingequation and in the error correction vector.

14The effects of infrequent trading in stocks are modeled through the methodology proposed byJokivuolle (1995) to proxy for the true index prices. The results do not differ significantly from thoseobtained without carrying out this adjustment and they are available upon request.

15See Appendix.

Page 277: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Market Integration Measures 269

undervaluations (C ′t > Ct) on both the Asian crash days and the other days (sixth

and seventh line).

As previously explained, measures p and m allow transaction costs to be dis-counted. Therefore, we can analyze if disparities in prices of the asset and its replicaare or not explained by them. Transaction costs have been considered for each daytaking into account market fees, commissions and market impact costs in the spotand futures markets.16 Having carried out this correction, the measures p and m leadto similar results.

Complementarily, the eight and ninth lines of Table VII show the number ofdetected opportunities of direct and reverse cash-and-carry arbitrage strategies. Inthe days prior to the crash, all (except one) of the deviations between cash and futuresprices are explained by the transaction costs (arbitrage opportunities do not exist andmarkets are integrated). However, during the 28th and 29th, most of the deviationsare not explained by transaction costs (arbitrage opportunities exist and marketsare not integrated). In these circumstances, we still detect the prevalence of inversearbitrage opportunities except on October 30th when the number of direct arbitrageopportunities is greater.

To sum up, the level of integration shown by the integration measures based oncross-market arbitrage coincides as much in stable periods as in volatile periods.

6.3 Measures based on equilibrium models

Finally, we have calculated the difference between the natural logarithms of the the-oretical spot price and of the observed spot price and we have tested whether themispricings follow a mean reversion process (measure 11).17

We used the Augmented Dickey-Fuller (ADF) test (Dickey and Fuller, 1981) tocheck the presence of mean reversion in the mispricings. The results are reported inTable VIII. The estimated ADF values support the absence of a unit root, with theexception of October 27th and 28th. Hence, the mispricing series for both days arenon-stationary and, according to measure 11, the markets are not integrated. Theremaining days, the mispricing series behaves as a stationary series and, therefore,the spot and futures markets are integrated.

Note that the parameter γ is bigger in absolute value the days outside the Asiancrisis period. This indicates a bigger convergence from prices to the equilibrium levelduring those days and the presence of certain disintegration during the Asian crash.

16The estimated transaction costs oscillate between 19 and 22 basic points, on the 22nd and 28th

of October, which implies a m′ value of 0.0038 and 0.0043, respectively.

17Miller et al. (1994) indicate that the mean reversion of the changes in the base is a statisticalillusion, caused by the infrequent trading of stocks within the index. The empirical evidence obtainedby Neal (1996) contradicts the previous results. This author examines 837 S&P 500 index arbitragetrades and he observes a relationship between arbitrage and mean reversion of the mispricing series.

Page 278: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

270 Balbas, Meneu and Pardo

The integration measure of Bessembinder (measure 12) has not been calculatedfor two reasons. First, because this measure needs long time series with low frequencyand, second, because our empirical application includes only one futures markets and“inference with regard to asset pricing models can be sensitive to the exclusion ofsecurities from the cross-sectional analysis” (Bessembinder, 1992, pages 639-640).

If we compare these results with those obtained with the measures based on sta-tistical and econometric techniques, we can conclude that spot and futures marketswere integrated in the stable subperiod (the 22nd, 23rd and 24th). Nevertheless, theresults on market integration are partially contradicted in the volatile subperiod (the27th, 28th, 29th and 30th).18

The comparison with the results achieved when applying the measures based oncross-market arbitrage shows that the lower the mean reversion parameter (γ), thegreater the existence of arbitrage opportunities is.

7 Conclusions

The paper empirically tests the effectiveness of a large number of market integrationmeasures, and the analysis justifies the convenience of classifying them into two majorcategories: statistical measures and measures related to the theory of asset pricing.

A large number of measures are operationalized and their values are computedduring a period characterized by disintegration and the effect of the Asian Crisisof October 1997. The results clearly reveal that measures based on statistical andeconometric techniques contradict each other in volatile periods, and that the level ofintegration shown by measures based on cross-market arbitrage coincides as much instable as in volatile periods. Besides, measures based on cross-market arbitrage andmeasures based on equilibrium models complement each other. In short, when mea-sures based on theoretical approaches show integration, measures based on statisticaland econometric techniques do, but the converse is not true in a general framework.

Hence, pricing models must be taken into account when a measure of marketintegration is being developed. These measures may be defined by arbitrage methodsor by equilibrium arguments. The first group is appropriate if derivative markets areinvolved or if hedging strategies are the main purpose of the analysis. Instead, thesecond is useful to study well-diversified portfolios in incomplete markets. Anyway,there are certain measures that can be applied in both types of settings.

18See the values of ρspot−fut and γ in Tables II and VIII.

Page 279: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Market Integration Measures 271

Appendix

The fulfillment of the Law of One Price (LOP) and the absence of arbitrageopportunities are equivalent properties in some restricted contexts.

Let us consider two dates t < T and three securities denoted by S1, S2 and S3.S1 will be a risk-less asset, S2 a risky one and S3 a futures contract on S2 with Tmaturity. Suppose that S2 does not pay any dividend between t and T and denote itsprice by I(t) > 0 at t and by I(T ) ≥ 0 at T . It is clear that I(t) must be a concretenumerical value while I(T ) must be a random variable. As usual, r > 0 will representthe interest rate between t and T and, consequently, 1/(1 + r) and 1 are the pricesof S1at t and T respectively. Finally, denote by F (t, T ) the future (at T ) price of S2

that can be guaranteed by S3.

Lemma 1 Under latter assumptions, there are no arbitrage opportunities in themodel if and only if the Law of One Price holds.

Proof. Assume that LOP holds. Then,

I(t) =F (t, T )(1 + r)

or I(t) (1 + r) = F (t, T ) (9)

Let x = (x1, x2, x3) be an arbitrary portfolio composed by xi units of Si (i = 1, 2, 3)and denote by P (t) and P (T ) its numerical and random prices at t and T respectively.If x were an arbitrage portfolio, then P (t) ≤ 0 and P (T ) ≥ 0 should hold. Hence, theproof will be finished should the fulfillment of the LOP and latter inequalities lead toP (t) = P (T ) = 0.

Obviously,P (t) =

x1

(1 + r)+ x2 I(t) ≤ 0 , (10)

and

P (T ) = x1 + x2 I(T ) + x3 (I(T ) − F (t, T )) = x1 − (x3 F (t, T )) + I(T ) (x2 + x3) .

Since P (T ) 0 must hold for any final value of the random variable I(T ) 0, futureprice (or payoff) of S2, the following inequalities have to be fulfilled:

x1 − (x3 F (t, T )) ≥ 0 , (11)

x3 ≥ −x2 . (12)

(9) and (11) lead tox1 ≥ x3 I(t) (1 + r) . (13)

We obtain from (10) thatx1 ≤ −x2 I(t) (1 + r) , (14)

and, thus, bearing in mind (12),

x1 ≤ −x2 I(t) (1 + r) ≤ x3 I(t) (1 + r) . (15)

Therefore, (13), (15), (11) and (12) must be equalities and P (t) = P (T ) = 0.

Page 280: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

272 Balbas, Meneu and Pardo

Tab

leI

Inte

grat

ion

mea

sure

sbet

wee

na

finan

cial

mar

ket

and

its

der

ivat

ives

mar

kets

Measures

based

on

statis

tic

sM

easures

based

on

the

asset

pric

ing

theory

and

econom

etric

techniq

ues

Measures

based

on

cross-m

arket

arbit

rage

Measures

based

on

equilib

riu

mm

odels

Seri

es

indiff

ere

nces

Seri

es

inle

vels

Fulfi

llm

ent

of

the

Law

of

One

Pri

ce

Fulfi

llm

ent

of

the

Law

of

One

Pri

ce

and

Abse

nce

of

Arb

itra

ge

Opport

unit

ies

Garb

ade

and

Silber’

sm

odel(1

983)

Cro

ss-c

orr

ela

tion

tech

-niq

ue

Gra

nger

causa

lity

(1969)

Sim

scausa

lity

(1972)

Engle

-Gra

nger

test

for

coin

tegra

tion

(1987)

Coin

tegra

tion

pro

-cedure

pro

pose

dby

Johanse

n(1

988

and

1991)

and

Johanse

nand

Juse

lius

(1990)

Rela

tionsh

ipbetw

een

fu-

ture

contr

act

and

its

un-

derl

yin

gass

et

Put-

call

pari

ty

Measu

res

of

weak

and

stro

ng

inte

gra

tion

ofC

hen

and

Knez

(1995)

Measu

res

of

weak

and

stro

ng

inte

gra

tion

of

Balb

as

and

Munoz

(1998)

Mean

revers

ion

ofth

em

is-

pri

cin

gse

ries

Test

sof

futu

res

mark

ets

inte

gra

tion

of

Bess

em

-bin

der

(1992)

Characteris

tic

sC

haracteris

tic

sC

haracteris

tic

s

Inte

gra

tion

for

one

peri

od

Inte

gra

tion

levelfo

ra

fixed

date

Inte

gra

tion

for

one

peri

od

Lead-lag

rela

tionsh

ips

can

be

est

ablish

ed

Lead-lag

rela

tionsh

ips

cannot

be

est

ablish

ed

Lead-lag

rela

tionsh

ips

cannot

be

est

ablish

ed

Mediu

m,la

sttr

ansa

cti

on

or

clo

sing

pri

ces

Bid

and

ask

,m

ediu

m,la

sttr

ansa

cti

on

or

clo

sing

pri

ces

Mediu

m,

last

transa

cti

on

or

clo

sing

pri

ces

Tra

nsa

cti

on

cost

scannot

be

taken

into

account

Tra

nsa

cti

on

cost

scan

be

taken

into

account

Tra

nsa

cti

on

cost

scannot

(resp

.,can)

be

taken

into

account

by

measu

res

of

Chen

and

Knez

(resp

.,B

alb

as

and

Munoz)

Tra

nsa

cti

on

cost

scannot

be

taken

into

account

Rela

tionsh

ips

betw

een

concre

tem

ark

ets

Concre

test

rate

gie

sN

on-p

redete

rmin

ed

stra

tegie

sC

oncre

test

rate

gie

s

Page 281: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Market Integration Measures 273Tab

leII

Sta

tist

ics

for

the

ibex

-35

cash

index

and

the

ibex

-35

futu

res

contr

act

The

firs

tco

lum

nsh

ows

the

vari

able

sw

her

eas

the

resu

lts

for

the

corr

espondin

gday

appea

ron

the

rem

ain

ing

colu

mns.

The

seco

nd

row

show

sth

enum

ber

ofobse

rved

retu

rns.

The

thir

dro

wgiv

esth

ecl

ose

tocl

ose

vari

ati

on

ofth

eIB

EX

-35

stock

index

.T

he

fourt

h

(fift

h)

row

giv

esth

eIB

EX

-35

stock

index

(IB

EX

-35

futu

res

contr

act

)vola

tility

obta

ined

as

the

standard

dev

iati

on

ofth

em

inute

to

min

ute

retu

rns.

The

sixth

row

pro

vid

esth

esp

ot

retu

rns

auto

corr

elati

on

coeffi

cien

t(ρ

spot)

and

its

p-v

alu

eappea

rsin

pare

nth

esis

.

The

seven

thro

wgiv

esth

eauto

corr

elati

on

coeffi

cien

tofth

efu

ture

sre

turn

s(ρ

fu

t)

and

its

p-v

alu

eappea

rsin

pare

nth

esis

.T

he

eighth

row

show

sth

ere

lati

ve

bid

-ask

spre

ad

ofth

efu

ture

sco

ntr

act

(Sf

ut).

The

nin

thand

tenth

row

sgiv

eth

etr

ansa

ctio

nvolu

me

on

the

spot

and

futu

res

mark

etin

millions

ofpes

etas

and

num

ber

ofco

ntr

act

s,re

spec

tivel

y.

Asi

an

cris

is

VA

RIA

BLE

22

23

24

27

28

29

30

Obse

rvations

415

415

415

415

401

379

407

Vari

ati

on

-0.4

0%

-2.4

9%

-0.7

9%

-4.4

0%

-4.1

8%

5.6

6%

1.1

2%

σspot

0.0

46%

0.0

63%

0.0

56%

0.0

74%

0.1

25%

0.0

78%

0.0

90%

σf

ut

0.0

49%

0.0

69%

0.0

47%

0.0

84%

0.2

35%

0.1

17%

0.1

18%

ρspot

0.0

77

(0.1

15)

0.0

85

(0.0

83)

0.1

97

(0)

0.1

92

(0)

0.1

47

(0.0

03)

0.2

33

(0)

0.3

27

(0)

ρf

ut

0.1

15

(0.0

19)

0.0

37

(0.4

55)

0.0

07

(0.8

8)

0.1

39

(0.0

04)

0.1

75

(0)

0.1

31

(0.0

1)

0.2

45

(0)

Sf

ut

0.0

50.0

50.0

50.0

60.1

10.0

70.0

6V

olspot

138433.3

5124031.9

682628.5

5102194.4

6218310.7

1151003.4

148770.5

7V

olf

ut

21525

30179

22351

38374

93130

54816

61231

Page 282: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

274 Balbas, Meneu and Pardo

Table IIICross-correlation of minute-to-minute intraday returns

Cross-correlation of minute-to-minute intraday returns for stock index and stock indexfutures. The first and last columns show the number of lags (k). The rest of thecolumns gives the cross correlation ρspot,fut(k) for the corresponding day. The t-statistic appears in parenthesis. The numbers in bold are significant at the 1% level.

Asian crisis

k 22 23 24 27 28 29 30 k

-5 -0.001 0.036 -0.001 0.083 0.189 0.012 0.057 -5(-0.024) (0.735) (-0.014) (1.691) (3.789) (0.232) (1.156)

-4 0.138 0.027 0.051 0.064 0.168 0.123 0.077 -4(2.809) (0.548) (1.037) (1.306) (3.368) (2.389) (1.547)

-3 0.154 0.047 0.023 0.123 0.177 0.164 0.208 -3(3.127) (0.947) (0.477) (2.512) (3.548) (3.199) (4.190)

-2 0.210 0.110 0.229 0.249 0.211 0.277 0.408 -2(4.276) (2.231) (4.667) (5.081) (4.223) (5.395) (8.233)

-1 0.360 0.448 0.478 0.476 0.224 0.235 0.512 -1(7.338) (9.126) (9.729) (9.701) (4.492) (4.579) (10.323)

0 0.246 0.333 0.334 0.297 0.136 0.116 0.430 0(5.005) (6.782) (6.800) (6.052) (2.723) (2.266) (8.669)

1 0.091 -0.008 0.007 0.125 0.193 0.101 0.193 1(1.852) (-0.163) (0.147) (2.544) (3.859) (1.972) (3.900)

2 0.060 -0.011 0.096 0.070 0.116 0.074 0.002 2(1.220) (-0.230) (1.954) (1.428) (2.315) (1.439) (0.042)

3 -0.023 -0.013 0.046 0.024 0.120 0.154 0.004 3(-0.477) (-0.261) (0.937) (0.493) (2.403) (3.004) (0.073)

4 0.031 0.085 -0.054 0.013 0.018 0.110 -0.015 4(0.623) (1.734) (-1.106) (0.261) 0.364 (2.134) (-0.305)

5 -0.045 0.001 -0.017 -0.075 -0.020 -0.060 -0.179 5(-0.921) (0.014) (-0.336) (-1.536) -0.398 (-1.166) (-3.607)

Page 283: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Market Integration Measures 275

Table IVPhillips-perron test for unit roots in stock index and stock index futures

prices

ZL and ZD are the Phillips-Perron statistics of the series in levels and in first dif-ferences, respectively. For a model with intercept the MacKinnon critical values are-2.868 and -3.448 at the 1% and 5% levels, respectively.

Panel A: lpct

22 23 24 27 28 29 30ZL -1.348 -1.296 1.820 -1.898 -2.319 -0.872 0.147ZD -18.880 -18.725 -16.390 -17.096 -17.964 -16.080 -14.894

Panel B: lpft

22 23 24 27 28 29 30ZL -1.186 -1.236 2.332 -0.601 -0.605 -0.484 -0.393ZD -18.160 -19.525 -20.300 -17.742 -16.754 -16.731 -15.612

Table VJohansen cointegration test results for stock index and stock index

futures prices

The first column shows the corresponding day and the number of observations andlags are in parenthesis. λi (i = 1, 2) is the estimated value of the characteristic root(eigenvalue). The last column gives the statistic λtrace that tests the null hypothesis,which, versus a more general alternative, considers that the number of distinct coin-tegration vectors is lower or equal to r. Each day has an intercept in a cointegrationequation. October 24th and 30th have intercept and deterministic trend. * , ** and*** denote significance at the 1% , 5% and 10% level. Critical values of the λtrace

statistic are obtained from Osterwald-Lenum (1992).

Day H0 λi λtrace

22 r = 0 0.058 28.153*(416,6) r 1 0.009 3.657

23 r = 0 0.116 52.992*(416,3) r 1 0.006 2.301

24 r = 0 0.078 33.943*(416,4) r 1 0.001 0.578

27 r = 0 0.052 24.361**(416,4) r 1 0.006 2.286

28 r = 0 0.052 22.556***(402,9) r 1 0.004 1.600

29 r = 0 0.029 13.229**(380,7) r 1 0.006 2.341

30 r = 0 0.062 26.625*(408,7) r 1 0.003 1.082

Page 284: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

276 Balbas, Meneu and Pardo

Table VIError corrections model

Parameter estimates of the error correction model for the IBEX-35 spot and futuresprices. γ1 (γ2) give the coefficient of the error correction term in a spot (future)equation and the t-statistic is in parentheses.

Asian crisis22 23 24 27 28 29 30

γ1 -0.152 -0.299 -0.269 -0.150 -0.076 -0.057 -0.158t-stat. (-4.221) (-6.960) (-5.677) (-4.562) (-4.519) (-3.201) (-5.008)

γ2 0.066 -0.053 -0.039 -0.103 -0.011 0.003 -0.098t-stat. (1.464) (-0.943) (-0.756) (-2.309) (-0.289) (0.084) (-1.911)

Table VIIMeasures based on cross-market arbitrage

The first column shows all the measures. The rest of the columns give the resultsfor the corresponding day. The second (third) row gives the maximum (minimum)value of p. The fourth (fifth) row shows the maximum values of g and m. The sixth(seventh) row gives the number of minutes in which the contemporaneous spot price(Ct) is lower (higher) than the theoretical spot price (C ′

t). The eighth row shows thenumber of cash-and-carry (C.C.) arbitrage opportunities. The ninth row shows thenumber of reverse cash-and-carry (R.C.C.) arbitrage opportunities. The transactioncosts have been computed for the corresponding day.

Asian crisisVARIABLE 22 23 24 27 28 29 30Maximum p 1.002382 1.002769 1.002459 1.003566 1.038149 1.004643 1.010057Minimum p 0.997282 0.997058 0.995792 0.989183 0.970087 0.986578 0.995893Maximum g 0.001547 0.001653 0.002358 0.005674 0.017762 0.007035 0.005316Maximum m 0.002718 0.002942 0.004208 0.010817 0.036747 0.013422 0.009957

C′t > Ct 148 100 53 202 31 53 224

Ct > C′t 268 316 363 214 371 327 184

C.C. 0 0 0 0 27 4 20R.C.C. 0 0 1 8 322 125 1

Table VIIIMean reversion in mispricing series

Test of unit roots in mispricing series. The variable ADF represents the AugmentedDickey-Fuller test of a single unit root in the mispricing series. The critical valueof ADF at 1% level is –3.449. γ is the mean reversion parameter of the mispricingprocess and its p-value appears in parentheses.

Asian crisis22 23 24 27 28 29 30

ADF -8.278 -4.645 -8.717 -1.785 -0.920 -3.549 -3.714γ -0.276 -0.241 -0.351 -0.074 -0.011 -0.091 -0.146

p-value (0.000) (0.000) (0.000) (0.075) (0.358) (0.000) (0.000)

Page 285: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Market Integration Measures 277

References

[1] Abhyankar, A.H. (1995): “Return and volatility dynamics in the FT-SE 100 stockindex futures markets”, Journal of Futures Markets 15, No. 4, pages 457–488.

[2] Arshanapalli, B. and Doukas, J. (1997): “The Linkages of S& P 500 Stock Indexand S& P 500 Stock Index Futures Prices during October 1987”, Journal ofEconomic and Business 49, pages 253–266.

[3] Balbas, A.; Longarela, I. R. and Pardo, A. (2000): “Integration and Arbitrage inthe Spanish Financial Markets: an Empirical Approach”, The Journal of FuturesMarkets 20, no. 4, pages 321–44.

[4] Balbas, A. and Munoz, M. J. (1998): “Measuring the Degree of Fulfillment ofthe Law of One Price. Applications to Financial Markets Integration”, Investi-gaciones Economicas, Vol. XXII (2), pages 153–177.

[5] Bessembinder, H. (1992): “Systematic Risk, Hedging, Pressure, and Risk Premi-ums in Futures Markets”, Review of Financial Studies 5, No. 4, pages 637–667.

[6] Chan, K. (1992): “A further analysis of the lead-lag relationship between thecash market and Stock Index Futures Market”, Review of Financial Studies 5,No. 1, pages 123–152.

[7] Chen, Z. and Knez, P.J. (1995), “Measurement of Market Integration and Arbi-trage”, Review of Financial Studies 8, No. 2, pages 563–79.

[8] Cornell, B. and French, K. (1983a): “The pricing of stock index futures”, Journalof Futures Markets 3, pages 1–14.

[9] Cornell, B. and French, K. (1983b): “Taxes and the pricing of stock index fu-tures”, Journal of Finance 38, No. 3, pages 675–694.

[10] Dickey, D.A. and Fuller, W.A. (1981): “Likelihood ratio statistics for autoregres-sive time series with a unit root”, Econometrica 49, pages 1057–1072.

[11] De Jong, F. and Donders, M.W.M. (1998): “Intraday lead-lag relationships be-tween the futures, optins and stock market”, Discussion Paper no. 108, TilburgUniversity.

[12] Engle, R.F. and Granger, C.W. (1987): “Cointegration and error correction rep-resentation, estimation, and testing”, Econometrica 55, No. 2, pages 251–276.

Page 286: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

278 Balbas, Meneu and Pardo

[13] Garbade, K.D. and Silber, W.L. (1983): “Price movements and price discoveryin futures and cash markets”, Review of Economics and Statistics 65, No. 2,pages 289–297.

[14] Granger, C.W.J. (1969):“Investigating causal relations by econometric modelsand cross-spectral methods”, Econometrica 37, pages 424–438.

[15] Harris, L. (1989): “The October 1987 S& P 500 stock-futures basis”, Journal ofFinance 44, No. 1, pages 77–99.

[16] Ingersoll, J.E. Jr. (1987): Theory of Decision Making, Ed. Rowman& LittlefieldPublishers Inc., Maryland.

[17] Johansen, S. (1988): “Statistical analysis of cointegration vectors”, Journal ofEconomic Dynamics and Control 12, pages 231–254.

[18] Johansen, S. (1991): “Estimation and hypothesis testing of cointegrating vectorsin Gaussian Vector autorregresive models”, Econometrica 59, pages 1551–1580.

[19] Johansen, S. and K. Juselius (1990): “Maximum likelihood estimation and in-ference on cointegration with applications to the demand for money”, OxfordBulletin of economics and statistics 52, pages 169–210.

[20] Jokivuolle, E. (1995): “Measuring true stock index value in the present of infre-quent trading”, Journal of Financial and Quantitative Analysis 30, No.3, pages455–464.

[21] Kawaller, I.G.; Koch, P.D. and Koch, T.W. (1987): “The temporal price rela-tionship between S& P 500 futures and the S& P index”, Journal of Finance 5,pages 1309–1330.

[22] Kempf, A. and Korn, O. (1998): “Trading System and Market Integration”,Journal of Financial Intermediation 7, pages 220–239.

[23] Kleidon, A.W. (1992): “Arbitrage, nontrading and Stale prices: october 1987”,Journal of Business 65, No 4, pages 483–507.

[24] Kleidon, A.W. and Whaley, R.E. (1992): “One market? stocks, futures andoptions during October 1987”, Journal of Finance 47, No. 3, pages 851–877.

[25] Lee, C. and Mathur, I. (1999): “Efficiency Tests in the Spanish Futures Markets”,Journal of Futures Markets 19, No. 1, pages 59–78.

Page 287: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Market Integration Measures 279

[26] Miller, M.H.; Muthuswamy, J. and Whaley, R. (1994): “Mean reversion of Stan-dard& Poors 500 index basis changes: arbitrage induced or statisticall illusion?”,Journal of Finance 49, No. 2, pages 479–513.

[27] Modest, D. (1984): “On the pricing of stock index futures”, Journal of PortfolioManagement 10, No. 4, pages 51–57.

[28] Modest, D. and Sundaresan, M. (1983): “The relationship between spot and fu-tures prices in Stock Index Futures Markets: some preliminary evidence”, Journalof Futures Markets 3, No. 1, pages 15–41.

[29] Neal, R. (1996): “Direct tests of Index Arbitrage Models”, Journal of Financialand Quantitative Analysis 31, No. 4, pages 541–562.

[30] Ng, N. (1987): “Detecting spot forecasts in futures prices using causality tests”,Review of Futures Markets 2, pages 250–267.

[31] Osterwald-Lenum, M. (1992): “A Note with Quantiles of the Asymptotic Distri-bution of the Maximum Likelihood Cointegration Rank Test Statistics,” OxfordBulletin of Economics and Statistics 54, pages 461–472.

[32] Pardo, A. (1998): Integracion y arbitraje entre el mercado espanol de renta vari-able y su mercado derivado, PhD Thesis, University of Valencia, Spain.

[33] Protopapadakis, A. and Stoll, H.R. (1983): “Spot and Futures Prices and theLaw of One Price”, Journal of Finance 38, No. 5, pages 1431–55.

[34] Sims, C.A. (1972): “Money, income and causality”, American Economic Review62, No. 4, pages 540–552.

[35] Stephan, J.A. and Whaley, R.E. (1990): “Intraday price change and tradingvolume relations in the stock and stock option markets”, Journal of Finance 45,pages 191–220.

[36] Stoll, H.R. and Whaley, R.E. (1990): “The dynamics of stock index and stockindex futures return”, Journal of Financial and Quantitatie Analysis 25, No. 4,pages 441–468.

[37] Sutcliffe, C. (1997): Stock Index Futures: Theories and International Evidence,2nd. ed., Cambridge, International Thomson Business Press.

[38] Wang, G.H.K. and Yau, J. (1994): “A time series approach to testing for marketlinkage: unit root and cointegration tests”, Journal of Futures Markets 14, No.4, pages 457–474.

Page 288: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

280 Balbas, Meneu and Pardo

[39] Yadav, P.K. (1992): Studies on stock index futures pricing: a UK perspective,PhD Thesis, University of Straathclyde, UK, June.

[40] Yadav, P.K.; Pope, F.P. and Paudyal, K. (1994): “Threshold autoregressivemodeling in finance: the price differences of equivalent assets” MathematicalFinance 4, No. 2, pages 205–221.

Angel PardoDepartamento de Economıa Financiera y Matematica

Facultad de Ciencias Economicas y EmpresarialesUniversidad de Valencia

Campus Naranjos, Edificio Departamental Oriental46071 Valencia

e-mail: [email protected]

Alejandro BalbasDepartamento de Economıa de la Empresa

Universidad Carlos III de MadridC/ Madrid, 126

28903 Getafe (Madrid)e-mail: [email protected]

Vicente MeneuDepartamento de Economıa Financiera y Matematica

Facultad de Ciencias Economicas y EmpresarialesUniversidad de Valencia

Campus Naranjos, Edificio Departamental Oriental46071 Valencia

e-mail: [email protected]

Page 289: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Crash Prediction: Science or

Alchemy?

Common Points Between Earthquakes, Sand

Piles and Markets

Gabriele Susinno1

“The Market has its law. Were there no law,there could be no centre about which prices

could revolve, and therefore, no market.”

R. N. Elliot, The Wave Principle (1938)

Abstract

Financial markets evolution is the macroscopic result of a huge number ofhuman interactions. The term “human” is what separates social sciences andnatural sciences. Indeed the unpredictability of human behaviour is often takenas the key factor for the impossibility to apply methods borrowed from physicsto describe, explain, and predict market evolution. Despite this fact there are anumber of market players struggling to find the Holy Grail by identifying marketinefficiencies allowing them to beat the market, and some of them seem to havesucceeded (at least for some time). From a more scientific viewpoint, a numberof scientists have analysed market’s phenomenology trying to deduce the hid-den rules governing the macroscopic indicators of human interactions. Indeed,similarities between financial markets and a hierarchical system of interactingparticles may be an interesting way to enhance the synergy between social andphysical sciences. From a physicist viewpoint one of the most interesting phe-nomena in financial markets is the occurrence of crashes. What triggers marketto start to act co-operatively in a short time window? Is it possible to identifyprecursors to such catastrophic events? Maybe concepts of scaling, universalityand self-organised systems bring some new light to understand this phenomena.

1 Introduction

Most of the advanced models used in finance are based on basics assumptions thatallow for the pure mathematical tractability. Albeit these models allow for a goodestimation of fair derivative prices for liquid assets during stable periods, they become

1Gabriele Susinno es Director de Capital Management Advisors. Esta charla se impartio en lasesion del Seminario MEFF-UAM de abril de 1999.

Page 290: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

282 Gabriele Susinno

hardly applicable in turmoil. Instable periods are characterised by extreme marketmovement whose behaviour is not in the applicability domain of most models. Twomajor concepts are necessary to cope with large market fluctuations: a correct estima-tion of effects induced by large fluctuations in theoretical prices and hedging factors,and a qualitative understanding of causes producing market instabilities.

Catastrophes on the derivatives market awaken the conscience about implicit riskstaken in neglecting extreme fluctuations. Indeed, extreme events appear to be morefrequent than those predicted by the elementary diffusion processes used in financialmodelling (e.g. geometric Brownian motion). Today the quality of information avail-able from any kind of source allows for a critical view of the traditional Black-Scholesdogma. Pricing mistakes or inaccuracies, produced by unrealistic assumptions, mayconstitute a serious danger for market players. Risk against which they hardly find acorrect protection.

Potters et al. 1998 [11] have shown, by studying in detail the market prices ofoptions on liquid markets, that the market has empirically corrected the simple, butinadequate Black-Scholes formula to account for two important statistical features ofasset fluctuations: ‘fat tails’ and correlation in the amplitudes of fluctuations. Theseaspects, although not included in conventional pricing models, are reflected in theprice fixed by the market as a whole. This means that model’s inadequacies arecomplemented, in average, by the feeling of market participants and in that senseliquid markets behave as rather efficient adaptive systems.

Large fluctuation effects become of utmost importance during instability periodsand crashes. It is during those periods that most of the mathematical models showtheir instabilities and failures just because the fundamental assumptions are no longersatisfied. In this framework some fresh air brought by physicists may be beneficial tofinance. In particular crashes are of particular interest for physicists since they seemto share common points with complex systems. Indeed the challenge is to understandhow simple non-linear behaviours acting repetitively may induce large co-operativebehaviours. Large-scale patterns may arise from a series of repetitive interactions onmany scales that lead to a progressive build-up of large-scale correlation and culminatewith a crisis.

2 Learning Form Nature

In Physics a critical point indicates regimes of large-scale co-operative behaviour.Fundamentally it is a phenomenon resulting from the repeated interaction betweenmicroscopic elements of a system, which progressively construct a macroscopic self-similar state. A system in a critical state lies at the boundary between order anddisorder, it exhibits strong correlation between his different elements, and an ex-treme susceptibility to external factors (a good textbook for an educated reader isreported on ref [6]). Classical examples of such systems are liquids and magnets,

Page 291: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Crash Prediction: Science or Alchemy? 283

where the system progressively orders under small external changes. A typical ex-ample of long range ordering, which we use frequently on our every day life (e.g.magnetic tape recording), is the ferromagnetism. Bulk ferromagnetic materials ex-hibit long range order which creates regions (domains) where magnetic moments ofneighbouring atoms are locked into a rigid parallel order over a large number of atomsin spite of thermal agitation which tends do destroy any atomic level order. But fora given ferromagnetic material the long-range order abruptly disappears at a certaintemperature, which is called the Curie temperature. The abrupt change from longrange order to disorder may share common points whit market crashes. Anotherinteresting experimental observation is that near the critical point systems have nocharacteristic length, which means that if a part of the system is magnified as large asthe original it is impossible to distinguish the magnified part and the original. Neara market crash, individual investors tend to follow big investors, who in turn followbigger investors in a coherent and co-operative way, a generalised euphoria as preludeof a financial distress.

In nature some systems naturally evolve towards a critical state, the so-calledSelf-Organised Critical (SOC) systems [1]. The expression of an underlying unstabledynamical critical point may be found in systems like sand-piles, earthquakes, forestfires, etc. For instance, in sand-piles, starting from an undercritical slope with a steadysupply of grains, the pile grows until the structure become unstable and an avalancheis initiated. In this way, the pile reaches a stationary critical state, characterised bya critical slope, in which additional grains of sand will fall off the pile via avalanchesdistributed in lifetime and size according to a power law (Fig. 1).

Figure 1: Number/Amplitude versus Size/frequency relation for sand piles and S&P500. Both

systems exhibit a power-law behaviour characteristic of scale invariance.

Page 292: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

284 Gabriele Susinno

Albeit the general conditions under which a physical system exhibits SOC arelargely unknown, some facts have however been established:

• The large-scale evolution should obey a diffusion process (like markets are sup-posed to behave) which satisfies a global conservation law.

• More generally a feedback mechanism must operate which attracts the dynamicsto a critical state.

The second point is one of the most neglected in mathematical modelling in financesince market and market players are considered as totally independent and not influ-encing each other [5].

3 What about Markets?

It could be interesting to understand market dynamics and to identify crash precursorsfrom a fundamental structure of the market evolution. In a general view financialmarkets seem to exhibits a scale invariant behaviour [4]. If for a physicist, scaleinvariance means the absence of characteristic scale, from a business point of view,it means the existence of catastrophic risk, which can bankrupt a company (in thesame way the critical slope of sand piles may produce catastrophic avalanches). It israther tempting to identify the mechanism responsible for the scale invariance withSelf-Organised Criticality [13] i.e. the expression of an underlying unstable dynamicalcritical point.

In general co-operative behaviours of complex systems cannot be reduced to a de-composition of elementary causes. A crash emerges naturally as an intrinsic signatureof the functioning of the market. Indeed there is a need to insert in market modelsthe effect of a positive feedback interaction in which traders exchange informationaccording to a hierarchical structure [14]. As a general comment, it is interestingto note the existing similarities between log-periodic structure observed in the mar-ket [14] and Elliot waves [12], an strongly rooted technique in the financial analysis’folklore.

Crash statistics are very poor and the natural excitation, that any kind of evidenceof a crash precursor can produce, should be always moderated by critical views. Albeitit is tempting to see financial crashes as a critical phenomenon described by statisticalmechanics where, in a particular situation, all the subparts of the system react co-operatively, there are only few experimental situations where these scenarios can betested. In that sense, any empirical finding is not statistically significant and couldbe even more dangerous than the crash itself if its conclusions are used to assess astrategy [7], based on an ex ante prediction. To use such empirical results, the lackof statistically relevant set of experimental configurations must be compensated bya a priori knowledge of the market conditions. Any conclusion on a market crashprediction, based on empirical results, must be handled as a bayesian inference onmagnitude and time-scale on the next “catastrophic” event given the knowledge ofthe past.

Page 293: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Crash Prediction: Science or Alchemy? 285

4 Scaling and Criticality in Financial Markets

Which is the cause of the scaling laws and volatility time dependency observed infinancial Markets? Two main hypotheses may be made

• They have the same origin than those characterising physical systems with alarge number of interacting units.

• They reflect an exogenous cascade of information.

Numerical simulation [3, 9, 10] tends to support the first hypothesis.

Suppose that a crash is a natural consequence of a slow build-up of a long-rangecorrelation between market agents. In this case the crash will appear as a second orderphase transition where the system abruptly moves from an ordered to a disorderedstate, very much like ferromagnetism at the Curie temperature.

In this case the natural evolution of the system towards a critical state via a self-reinforcing imitation process can be quantified by the theory of critical phenomena.In this case the critical time, i.e. the time at which the crash occurs, plays the samerole as the Curie temperature in ferromagnetism.

In an efficient market, where the global available information is reflected in currentmarket price, it may be rational for traders to remain invested even if they fear to therisk of a crash. Indeed the remuneration for the risk of a crash can triggers a highergrowth rate of assets in an inflationary bubble. In this case market price reflects thewish of buyers who hope for a price increase and the fear of sellers that it may fall.

Again, as in the example of ferromagnetism, two forces regulate each trader: theopinions of his colleagues (which tend to order the system), and his own decisions,which tend to generate disorder. Moreover a global information is available to eachtrader. Taking forward the analogy with physics, each trader can be modelled as atwo state unit for which buy corresponds to the state +1 and sell to the state –1. Inthis case the state siof a unit i with N(i) neighbours can be modelled as [13, 14]:

si = sign

I

∑j∈N(i)

sj + σi εi + G

,

where i describes the tendency for imitation, σ the idiosyncratic noise induced bythe decision of unit i, εi a random number from N(0, 1), and G an exogenous globalinfluence. By symmetry, in absence of a global influence, the average state of thesystem is zero since units in the state +1 are balanced by units in the state −1.The presence of a global influence (positive or negative) will move the system sinceunits in one state will outnumber the others. The susceptibility χ of the system,i.e. the sensitivity of the average state of the system to an infinitesimal change in

Page 294: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

286 Gabriele Susinno

information will then be a direct measurement of the hazard rate2. Indeed a criticalpoint is characterised by the divergence of the susceptibility of the system, whereinfinitesimal changes of the conditions induce the collapse. A common feature ofsystems near their critical state is that their susceptibility evolves as a power law,i.e.:

χ ∝ |t − tc|−γ,

where γ is called the critical exponent.

In the vicinity of the crash the divergence of the correlation implies a power-lawdivergence of the hazard rate which is strictly related to the assets price evolution, andthis until the crash occurs or the inflationary bubble deflates. An additional featureneeds to be added. Indeed, for hierarchical systems the critical exponent may be acomplex number, in this case the power-law divergence near the critical point startsto be decorated by log-periodic oscillations whose frequency diverges approachingthe critical time. Considering market players organised in a hierarchical structure,organised by size and therefore inducing a different market impact may not be suchan unrealistic assumption.

An exponential evolution of market indexes modulated with log-periodic oscilla-tions of increasing frequency may be a signature of the increasing probability of afuture market crash, and the estimation of the critical time can be obtained by fit-ting the model on observed data. Dynamical critical points exhibit a characteristiclog-periodic signature.

In this case, interesting results have been obtained by Sornette et al. [14] andVandewalle et al. [15] in the analysis of the two major crashes of this century: October1927 (Dow Jones) , October 1987 (S&P500), and October 1997. They found, usinghistorical data before the crashes, a critical time (i.e. the market crash) in very goodagreement with the real timing of the events. They suggest that this agreement reflectthe fundamental co-operative nature of the behaviour of stock markets.

5 Physics and Finance

Unfortunately it is impossible to perform experiments in the market, a scientist canonly observe its evolution and guess from it the underlying mechanism which couldbe responsible for the observed pattern.

In such an investigation game, the role of a physicist appears as a connectorbetween all different and well-established disciplines in economical science, rangingfrom the actuarial approach to equivalent martingale theories. Indeed the instinct ofa physicist is to model the observed phenomenology, to understand the fundamentalprinciples, and to test for the validity of all the assumptions of existing models,constitute his principal asset in this field.

2Hazard rate defined as the probability per unit time that a crash, which has not already hap-pened, will happen in the next instant.

Page 295: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Crash Prediction: Science or Alchemy? 287

Some people do have problems to really understand the interplay between physicsand finance. It is so just because, in the mind of the majority of people, physics hasalways belonged to the abstract world of the deep secrets of the nature. How canthe study of stars or subatomic particles be applied to finance? It probably cannotbe applied directly, but all the technologies, ideas, and computational tools, whichare used for the quest of the nature’s secrets, may be of some use in finance. Butthe most valuable contribution to the field may be brought by the natural instinct ofphysicists to rationalize and then model the problems they tackle. In that respect,two complementary approaches appear. The observation of the market dynamics andall the properties driving the time evolution of traded quantities, allows for a guesson the underlying process followed by the observed phenomena. In the other hand itis of utmost importance to understand why we observe what we observe, what are,if any, the fundamental rules followed by the markets and producing the observedevolution. Indeed it is interesting to analyze the possible correspondence betweenthermodynamic models describing the evolution of a gas of particles and the marketwhere particles are replaced by brains of market players. But if in thermodynamic theinteractions are known and well defined, in finance they can evolve and be modifiedso that a model, which is valid today, will not be anymore so tomorrow. Marketpractitioners seem to solve this problem by continuously re-calibrating their models,which in turn is like adjusting the force strength on a day-by-day basis. Is theresome intrinsic and unavoidable feature of the market itself or what we think to bethe fundamental axioms are only the effect of more fundamental quantities? Byunderstanding this question it will be possible to answer in a much more realistic,and maybe precise way to all VaR dreamers.

6 Conclusions

Since the beginning of this century, with the seminal work of Bachelier, financial worldhas attracted a rising interest from a wide range of scientists.

Applications of scientific methodologies in this field have an increasing successand attract an increasing number of applied mathematicians. They performed anenormous analytical work contributing to the realisation of solid basis for the math-ematical finance.

Unfortunately there is a sizeable mismatch between the complexity, the mathe-matical sophistication of models and the rough description of the underlying objectto which they apply. It is exactly here where physicists can bring their contribution.Indeed, quoting Richard Feynman, “the physicist cannot understand the mathemati-cian’s care in solving an idealised physical problem. The physicist knows the realproblem is much more complicated. It has already been simplified by intuition whichdiscards the unimportant and often approximates the remainder”. It is clear thatphysicists do not have the pretension to come into the financial game bringing, withtheir methods, the absolute way of solving problems.

Page 296: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

288 Gabriele Susinno

Quantitative skills, and their different approach to problems, can contribute toenhance the synergy in financial research. Adapting the existing models and theoriesin such a way, they correctly reproduce the real world observations or, at least, givea coherent estimation of the risk implied in any financial transactions. The basicprinciple allowing for a real progress in any scientific model is based on the followingstrategy:

“First you guess. Don’t laugh, this is the most important step. Thenyou compute the consequences. Compare the consequences to experience.If it disagrees with experience, the guess is wrong. In this simple statementis the key to science.”

Richard P. Feynman

One of the basic dreams of the growing community of “financial physicists” or “econo-physicists” is to achieve a general understanding of market movements and dynamics,by identifying the underlying elementary processes responsible for it. To do so theyhave in mind elementary questions, which often do not have an elementary answer.Why prices move? What determines the amplitude and time scale of those move-ments? How can the different processes influencing demand and supply be identifiedand mathematically modeled? Since few years physicists from academies have startedto collaborate between them to formulate an answer to many question left open infinancial modeling. There is no certitude to contribute with a brand new theory“of everything” to which physicists are affectionate. However a joint effort from thevarious scientific cultures involved in financial research may lead to interesting results.

References

[1] Per Bak, “How Nature Works : The Science of Self-Organized Criticality”,Copernicus Books; ISBN: 0387947914.

[2] P. Bouchaud et al., Risk, 9, no. 3 (March 1996).

[3] S.H. Chen, T. Lux and M. Marchesi, “Testing for Non-Linear Structure in anArtificial Financial Market”,www.ge.infm.it/~ecph/papers/marchesipapers/marchesipapers.html

[4] R. Cont, Proceedings of the CNRS Workshop on Scale Invariance, Les Houches,1997.

[5] J. Cvitanic, in ”Mathematics in Derivative Securities”, Cambridge UniversityPress (1997) and references therein.

[6] K. Huang, “Statistical Mechanics”, John Wiley & Sons.

[7] L. Laloux et al., cond-mat/9804111.

Page 297: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Crash Prediction: Science or Alchemy? 289

[8] D. Lando, in “Mathematics in Derivative Securities”, Cambridge UniversityPress (1997) and references therein.

[9] T. Lux and M. Marchesi, “A Micro-Simulation of Interactive Agents”,www.ge.infm.it/~ecph/papers/marchesipapers/marchesipapers.html

[10] T. Lux and M. Marchesi. “Scaling and Criticality in a Stochastic Multi-AgentModel of a Financial Market”, Nature 397 (1999), 498–500.

[11] M. Potters et al., Europhysics Letters, 41, no. 3 (February 1, 1998).

[12] A. Prost and R. Prechter, “Elliot Waves Principle”, New Classic Library, 1985.R. Beckman, “Elliot Wave Explained”, Probus Publishing, 1992.

[13] D. Sornette, in “Physics of Complexity”, Editions Frontieres.

[14] D. Sornette et al., cond-mat/9510036. D. Sornette and Anders Johansen, cond-mat/9704127.

[15] Vandewalle, N. et al., “How the financial crash of October 1997 could have beenpredicted”, Eur. Phys. J. B 4, 139-141.

Gabriele SusinnoCapital Management Advisorse-mail: [email protected]

Page 298: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM
Page 299: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Una modelizacion GARCH

bivariante del futuro sobre el

Ibex-35. Implicaciones para la

cobertura del contado

Juan Angel Lafuente1

Resumen

En este trabajo se discute la relacion entre el ratio de inversion optimo y elratio de cobertura optimo cuando existe un mercado de futuros para el activode renta variable cuyo valor de mercado se pretende inmunizar. Si bien a nivelteorico el ratio unitario constante serıa la solucion optima tanto en el problemade inversion como de cobertura, los supuestos requeridos son demasiado res-trictivos. En la operativa real, ambos problemas tenderan a tener solucionesdiferentes. El trabajo propone tres metodologıas alternativas para la estima-cion de ratios de cobertura dinamicos, evaluandose su efectividad en terminosde reduccion de volatilidad respecto a la observada en el mercado de contado(posicion no cubierta). La simulacion de una determinada estrategia sugiere quelos ratios estimados con una metodologıa GARCH multivariante consigue unaefectividad similar a la que proporcionan tanto el ratio unitario constante comolos estimados a partir de modelos GARCH univariantes. Sin embargo, un menornumero de contratos por termino medio es utilizado2.

1 Introduccion

La excelente aceptacion de los instrumentos derivados en el sistema financiero espanolha incrementado considerablemente las posibilidades operativas con carteras de rentavariable. En particular, desde Enero de 1992, existe la posibilidad de negociar con-tratos de futuros con el ındice Ibex 35 como activo subyacente, instrumento derivadoespecialmente relevante para efectuar coberturas sobre carteras de renta variable, esdecir, inmunizar el valor de mercado de una cartera frente a las posibles fluctuacionesde cotizaciones de los activos que la integran. Para ello, el valor del ratio de coberturadetermina el numero optimo de contratos de futuros que es necesario vender al llevara cabo la operacion.

1Juan Angel Lafuente es profesor ayudante del Departamento de Finanzas y Contabilidad de laUniversidad Jaume I de Castellon. Esta charla se impartio en la sesion del Seminario MEFF-UAMde mayo de 1999.

2El autor desea agradecer a Alfonso Novales los valiosos comentarios y sugerencias recibidos.Cualquier error es de mi exclusiva responsabilidad.

Page 300: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

292 Juan Angel Lafuente

Con objeto de proceder a la estimacion del ratio de cobertura en los mercadosde futuros financieros, se propuso inicialmente en la literatura la utilizacion de re-gresiones a partir de muestras de cambios en los precios o rendimientos, siendo lasvariables endogena y exogena las correspondientes al mercado de contado y de futurosrespectivamente (vease, por ejemplo, Ederington (1979)).

Los estudios recientes acerca de la estimacion del ratio de cobertura optimo hansenalado fundamentalmente tres cuestiones relevantes acerca de la metodologıa inicial-mente planteada: a) la existencia de una relacion de equilibrio a largo plazo entre losprecios del mercado de futuros y los precios del mercado del contado. Esta pauta debeser incorporada al especificar el modelo econometrico a partir del cual los ratios decobertura seran estimados; vease por ejemplo Ghosh (1993), Lien y Luo (1993) o, masrecientemente, Lien (1996); b) evidencia empırica acerca de la existencia de heteroce-dasticidad condicional autorregresiva para las series de rendimientos de los mercados.Si las distribuciones condicionales difieren de las distribuciones incondicionales, notiene sentido plantear el estimar un ratio de cobertura constante, puesto que tanto lavarianza condicional del mercado de futuros como la covarianza condicional entre losprecios de ambos mercados seran cambiantes en el tiempo, y c) la presencia de unarelacion causal entre ambos mercado, con unas determinada caracterısticas acerca dela interaccion entre rendimientos y volatilidad. La simplificacion de estas relacionesdinamicas intertemporales puede introducir sesgos en la estimacion convencional delos ratios de cobertura (vease, por ejemplo, Theobald y Yallup (1997)).

En este trabajo se revisa la relacion entre el ratio de cobertura de optimo y el ratiode inversion optimo. A partir de un modelo de dos periodos se observa que la expresionanalıtica de ambos ratios es identica si a) el mercado de derivados es eficiente, esdecir, el precio del contrato en un periodo es la proyeccion del precio del contratoen el periodo siguiente o b) la correlacion entre el precio del mercado de futuros yel precio del mercado de contado es perfecta. En la practica ambos supuestos sonexcesivamente simplificadores, de forma que ambos ratios tenderan a no ser iguales.En este sentido, incluso en el caso de que el activo que se pretende inmunizar seauna cartera replica del activo subyacente del contrato de futuros utilizado para lacobertura el ratio no deberıa ser unitario. Partiendo de la base de que el ratio deinversion y cobertura optimo seran diferentes, el trabajo se centra en la estimacionde este ultimo cuando la cartera a cubrir es una replica del Ibex 35. Para ello seproponen tres alternativas metodologicas. Con objeto de comparar su potencialidadoperativa a partir de simulaciones ex-post de operaciones de cobertura se calibra laeficacia en terminos de reduccion de volatilidad respecto a la observada en el mercadode contado (posicion no cubierta), y tomando como marco de referencia el ratio miope(ratio unitario y constante).

Los resultados ponen de manifiesto que, si bien el ratio estimado teniendo en cuen-ta los tres aspectos senalados anteriormente posee una eficacia similar a la obtenidamediante la aplicacion del ratio unitario, un menor numero de contratos por terminomedio es requerido.

Page 301: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Una modelizacion GARCH bivariante del futuro sobre el Ibex-35 293

El trabajo esta estructurado como sigue. En la seccion 2 se presenta la expre-sion teorica del ratio de cobertura a partir del modelo de dos periodos habitualmenteutilizado en la literatura, ası como su relacion con el ratio que subyace al problemade inversion optima. La seccion 3 muestra en detalle las diferentes alternativas me-todologicas que se han considerado para la estimacion del ratio de cobertura. Enla seccion 4 se analiza la eficacia de la cobertura, comparando los resultados que seobtienen al aplicar el ratio estimado con las diferentes alternativas propuestas en laseccion 3. La seccion 5 resume las principales conclusiones obtenidas en el trabajo ysenala lıneas de investigacion futura.

2 El ratio de cobertura y el ratio de inversion

Cuando se pretende efectuar una operacion de cobertura el objetivo es inmunizar elvalor de la cartera frente a las futuras fluctuaciones de los precios de los activos quela integran. Para proceder a la operacion de cobertura, una vez fijado el horizonte dela misma, el elemento crucial es el ratio de cobertura, el cual determina el numero decontratos de futuros que deberıan ser vendidos. El fundamento de la operacion radicaen que las perdidas de un mercado seran compensadas con las ganancias en el otromercado, dado que la posicion de contado es larga mientras que la correspondienteal mercado de derivados es corta. La cobertura puede ser utilizada con el objetivode bloquear las perdidas que esta experimentando una cartera, o alternativamentepara garantizar los beneficios obtenidos hasta una determinada fecha. La aplicacionde ratios sesgados conlleva una perdida de efectividad. Supongamos que para unacartera, la ”verdadera beta”(β∗) es superior a uno, pero el operador la estima con unsesgo negativo, es decir β − β∗ < 0 y se cubre con futuros frente a una posible caıdade cotizaciones spot. En este caso el operador esta infracubierto: podemos resumir elresultado final en un fenomeno dicotomico:

a) si el mercado de contado experimenta un incremento de precios, los beneficiosde contado seran superiores a las perdidas en futuros,

b) si el mercado se comporta a la baja las perdidas de contado seran superiores albeneficio en la posicion de derivados. Por tanto, el operador no estarıa ortogo-nalizando el valor de su cartera respecto al valor de la cartera del mercado.

La expresion del ratio de cobertura para un operador que pretendiera utilizar elcontrato de futuros sobre el Ibex 35 para proteger una determinada cartera es:

(Valor de la cartera) × Beta(Ibex 35) × Multiplicador

. (1)

Segun la anterior expresion, en el caso de que la cartera sea una replica del Ibex 35, elratio de cobertura deberıa ser unitario, puesto que la beta de la cartera del mercadoes la unidad. Este resultado conlleva implıcitamente unos determinados supuestos.Veamos a continuacion este aspecto.

Page 302: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

294 Juan Angel Lafuente

2.1 El ratio de cobertura optimo. Minimizacion de la volati-lidad de la riqueza final

Consideremos un agente que en el periodo t tiene una parte de su riqueza invertidaen dos activos, uno libre de riesgo y otro con riesgo (renta variable) y pretende cubrirel valor de su cartera frente al comportamiento estocastico del precio del activo conriesgo. Supongamos que no hay costes de transaccion, y que la toma de posiciones enel mercado de futuros no requiere ningun desembolso de riqueza (no existen depositosen garantıa). El problema de optimizacion al que se enfrenta este agente sera:

minbt

V ar (Wt+1/Ωt) ≡ V art (Wt+1)

s.t. Wt+1 = (1 + r) [Wt − pt qt] + pt+1 qt + (ft+1 − ft) bt , (2)

donde Wt+1 es la riqueza final (estocastica) en el periodo t+1, Wt is la riqueza inicial,Ωt es el conjunto de informacion disponible al comienzo del periodo t, r es el tipo deinteres del activo libre de riesgo, pj(j = t, t + 1) hace referencia al precio del activocon riesgo en el periodo j, fj(j = t, t + 1) es el precio del contrato de futuros en elperiodo j, qt es el numero de activos con riesgo adquiridos al comienzo del periodot y bt es el numero de contratos de futuros vendidos en el periodo t para cubrir laposicion de contado. A partir de la restriccion presupuestaria, teniendo en cuenta quept, ft ∈ Ωt:

V art (Wt+1) = q2t V art (pt+1) + b2

t V art (ft+1) + 2 qt bt Covt (pt+1, ft+1) . (3)

La condicion de primer orden del problema es:

2[btV art (ft+1) + qt Covt (pt+1, ft+1)

]= 0 .

Por tanto, la solucion optima viene dada por la siguiente expresion:(b∗tqt

)= −Covt (pt+1, ft+1)

V art (ft+1). (4)

El signo negativo indica que la operacion de cobertura para una posicion larga enel mercado de contado requiere vender contratos de futuros (posicion corta en elmercado de derivados), mientras que el valor absoluto del ratio indica la proporcionentre ambas posiciones. La condicion de segundo orden corrobora que el candidato aoptimo corresponde a un mınimo global del problema:

∂2V art (Wt+1)∂b2

t

= 2V art (ft+1) > 0 .

Page 303: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Una modelizacion GARCH bivariante del futuro sobre el Ibex-35 295

2.2 El ratio de inversion optimo. Maximizacion de la utilidadesperada de la riqueza final

A continuacion relacionemos el problema anterior con el de un agente que decideconjuntamente la inversion en el activo con riesgo y la posicion en el mercado dederivados. Supongamos ademas que el inversor posee una funcion de utilidad U (·) vonNeumann-Morgenstern, definida sobre el periodo final t + 1, estrictamente creciente,estrictamente concava y dos veces diferenciable. El problema de optimizacion al quese enfrenta el agente es

maxqt, bt

E [U (Wt+1) /Ωt] ≡ EtU (Wt+1)

s.t. Wt+1 = (1 + r) [Wt − pt qt] + pt+1 qt + (ft+1 − ft) bt . (5)

Las condiciones de primer orden son:

Et [U ′ (Wt+1) [pt+1 − (1 + r) pt]] = 0 ,

Et [U ′ (Wt+1) (ft+1 − ft)] = 0 ,

donde Et es la esperanza condicional al conjunto de informacion disponible en elperiodo t. La condicion de segundo orden identifica un maximo global del problema(5), puesto que

U ′′ (Wt+1)(

pt+1 − (1 + r) pt

ft+1 − ft

)(pt+1 − (1 + r) pt, ft+1 − ft)

es siempre una matriz definida negativa. Bajo el supuesto de que la distribucion con-dicional conjunta del vector (Wt+1, pt+1, ft+1) es Normal, a partir de las ecuaciones(2) y (3), aplicando el resultado3 obtenido en Rubinstein (1976), el valor optimo delratio de inversion es(

q∗tb∗t

)= Σ−1

t+1/t

[Et

(− U

′(Wt+1)

U ′′ (Wt+1)

) (rpt,t+1

rft,t+1

)], (6)

donde Σt+1/t es la matriz de varianzas-covarianzas condicional del vector de preciosdel activo con riesgo y el contrato de futuros,

rpt,t+1 = Et (pt+1) − (1 + r) pt y rf

t,t+1 = Et (ft+1) − ft .

A partir de la ecuacion (6) la expresion del ratio de inversion optimo puede reescribirsede la siguiente forma:(

bt

qt

)∗=

V art (pt+1) rft,t+1 − Covt (ft+1, pt+1) rp

t,t+1

V art (ft+1) rpt,t+1 − Covt (ft+1, pt+1) rf

t,t+1

. (7)

3Sea el vector aleatorio (X, Y ) ∼ N (µ, Σ) y sea g (·) una funcion diferenciable. Entonces

Cov [g (X) , Y ] = E

[dg (X)

dX

]Cov (X, Y ) .

Page 304: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

296 Juan Angel Lafuente

2.3 Relacion entre ambos problemas

Relacionemos a continuacion las expresiones (4) y (7). Para ello, la expresion (7)puede reescribirse de la siguiente forma:(

bt

qt

)∗= −Covt (ft+1, pt+1)

V art (ft+1)+ Ψt,t+1 , (8)

donde

Ψt,t+1 =

[(ρ2

t+1/t − 1)

V art (pt+1)]rft,t+1[

[V art (ft+1)] rpt,t+1 − Covt (ft+1, pt+1) rf

t,t+1

] (9)

y

ρt+1/t =Covt (ft+1, pt+1)√

[V art (ft+1)] [V art (pt+1)].

A partir de (7) y (8) es inmediato observar que la discrepancia entre ambos ratiosviene dada por (9). Por tanto ambos ratios son equivalentes si y solo si Ψt,t+1 = 0,lo cual ocurrira si:

a) rft,t+1 = Et (ft+1) − ft = 0, es decir Et (ft+1) = ft,

b) o bien[(

ρ2t+1/t − 1

)V art (pt+1)

]= 0, lo que implica ρt+1/t = ±1, puesto que

V art (pt+1) > 0.

Interpretemos a continuacion estos resultados. Si la correlacion entre el precio delactivo con riesgo y el del contrato de futuros es perfecta entonces la nube de puntoscorrespondiente a ambos precios debe estar sobre una lınea recta, es decir, existenvalores α y β tal que pt = α + βft, de forma que es posible formar una cartera deriesgo nulo a partir de la combinacion lineal de ambos activos. En este caso, no soloΨt,t+1 = 0, sino que

Covt (ft+1, pt+1)V art (ft+1)

=Covt (ft+1, α + βft+1)

V art (ft+1)=

βCovt (ft+1, ft+1)V art (ft+1)

= β .

Por tanto, en el caso en que no existe riesgo de base, el ratio de cobertura podrıaobtenerse a traves de la estimacion por mınimos cuadrados del parametro4 β en laanterior ecuacion. Teoricamente todos los residuos deberıan ser iguales a cero.

Por otro lado, si el mercado de futuros es eficiente, es decir, el precio de unperiodo refleja toda la informacion relevante, entonces la mejor prediccion del preciodel contrato para el periodo siguiente es el precio cruzado del contrato en el periodopresente. Este es el caso en el que los precios del contrato de futuros evolucionansegun un paseo aleatorio.

4Notese que si, como es habitual, los precios presentan una raız unitaria, entonces serıa necesarioutilizar series de rendimientos o de cambios en los precios. En este ultimo caso se estimarıa laecuacion: st − st−1 = α + β (ft − ft−1) + εt.

Page 305: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Una modelizacion GARCH bivariante del futuro sobre el Ibex-35 297

Por tanto, bajo alguno de los dos supuestos anteriores el ratio de inversion optimoes asimismo un ratio de cobertura optimo. En caso contrario, la discrepancia entreambos ratios dependera del comportamiento estocastico del error de prediccion acercadel precio del contrato de futuros. Si los agentes utilizan de forma optima el conjuntocabrıa esperar que su error de prediccion fuese cero en media, de forma que por terminomedio el ratio de uno u otro problema deberıan ser iguales en terminos estadısticos.

A partir de la ecuacion (1) hemos senalado anteriormente que el ratio de coberturapara una cartera replica del subyacente del contrato de derivados deberıa ser unitario.A continuacion razonamos que este resultado puede obtenerse a partir los supuestosa) y b) junto con la hipotesis de expectativas racionales. En efecto, bajo la hipotesisde expectativas racionales el precio del contrato de futuros deberıa ser un estimadorinsesgado y optimo del valor del subyacente en la fecha del vencimiento del contrato.En el caso del modelo anterior de dos periodos ft = Etpt+1. A partir de la relacionlineal entre ft+1 y pt+1, aplicando esperanzas condicionales al conjunto de informaciondisponible en t: Etpt+1 = α + βEtft+1 = α + βEtft+1, es decir, ft = α + βEtft+1 =α + βft, donde la ultima igualdad es consecuencia del supuesto de paseo aleatoriopara la evolucion de los precios del mercado de futuros. Por tanto, la estimacion dela recta de regresion pt = α + βft deberıa producir estimaciones no significativas dela constante, a la vez que no deberıa rechazarse la hipotesis nula de que la pendientefuese unitaria5.

Sin embargo, el ratio unitario tambien puede interpretarse como solucion optimaen el caso de que el precio del contrato de futuros no presente discrepancia alguna res-pecto a su valoracion cost of carry, es decir bajo la ausencia teorica de oportunidadesde arbitraje6. Ilustremos a continuacion este caso con un sencillo ejemplo en tiempocontinuo. Consideremos que el subyacente evoluciona de acuerdo a un movimientobrowniano geometrico:

dpt = µp pt dt + σt pt dz1,t , (10)

donde pt es la cotizacion spot, µp,t y σs,t son la media y desviacion tıpica condicional dela rentabilidad del mercado de contado, y dz1,t = ε1t

√dt, siendo ε1t i.i.d. ∼ N (0, 1),

un proceso de Wiener.

De acuerdo con la valoracion cost–of–carry, bajo la cual se supone que los mercadosson perfectos, el tipo de interes del activo libre de riesgo es estable a corto plazo, yla cuantıa de los dividendos de que seran pagados por cada uno de los activos queintegran el subyacente es conocida, el precio teorico de un contrato de futuros enel momento del tiempo t con vencimiento en T es igual al coste de oportunidad demantener una cesta replica del activo subyacente desde la fecha de valoracion hasta

5Notese en este caso que, si los precios del mercado de contado y el mercado de futuros sonintegrados de orden uno, entonces existe una relacion de equilibrio a largo plazo, siendo el vector decointegracion (1,-1), es decir, la base es estacionaria.

6En la operativa real pueden existir discrepancias (mispricing) sin que ello implique una opor-tunidad rentable de arbitraje, dada la existencia de costes de transaccion y diferenciales de preciosbid-ask.

Page 306: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

298 Juan Angel Lafuente

la fecha de vencimiento, es decir,

ft,T = pt e(r−d) (T−t), (11)

donde pt es el valor de mercado del subyacente en el periodo t y (r − d) es el costeneto asociado a mantener una cesta replica hasta el vencimiento.

A partir de las ecuaciones (10) y (11), aplicando el Lema de Ito, podemos obtenerla ley de evolucion para el precio del contrato de futuros:

dft,T = µf ft,T dt + σt ft,T dz1,t , (12)

donde7 µf = µp − (r − d).

En este caso, bajo la ausencia de oportunidades teoricas de arbitraje se tiene que:

Et dpt = µp pt,T dt , (13)Et dft,T = µp pt,T dt , (14)

Et (dpt dft,T ) = Et

[µf µp ft,T pt (dt)2 + (µp + µf ) pt ft,T σt dz1,tdt

]+

+Et

[ft,T σt dz1,t dt + pt ft,T σ2

t (dz1,t)2]

= µf µp ft,T pt (dt)2 + pt ft,T σ2t dt . (15)

Por tanto, la covarianza entre los cambios instantaneos en los precios:

Covt (dpt dft,T ) = Et (dpt dft,T ) − [Et dpt] [Et dft,T ] = pt ft,T σ2t dt . (16)

Por otro lado,

V art (dpt) = Et [dpt − Et dpt]2 = Et [σt pt dz1,t]

2 = σ2t p2

t dt , (17)

V art (dft,T ) = Et [dft,T − Et dft,T ]2 = Et [σt ft,T dz1,t]2 = σ2

t f2t,T dt . (18)

Teniendo en cuenta las expresiones (16) (17) y (18) podemos observar que la correla-cion condicional de los cambios instantaneos de los precios es igual a la incondicional,siendo perfecta y positiva:

Covt (dft,T , dpt)√[V art (dft,T )] [V art (dpt)]

=pt ft,T σ2

t dt√(σ2

t p2t dt)

(σ2

t f2t,T dt

) = 1 . (19)

7Notese que a partir de la ecuacion (11), tomando logaritmos neperianos, retardando la ecuacionun periodo y restando las expresiones correspondientes a t y t + 1 se obtiene que

ln

(pt+1

pt

)= ln

(f∗

t+1

f∗t

)+ (r − d) .

Page 307: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Una modelizacion GARCH bivariante del futuro sobre el Ibex-35 299

Por tanto, existen valores δ1 y δ2 > 0 tales que dpt = δ1 + δ2dft,T por lo que el valorabsoluto del ratio de cobertura e inversion optimo sera8:

Covt (dft,T , dpt)√[V art (dft,T )] [V art (dpt)]

=Covt [dft, (δ1 + δ2 dft,T )]√

[V art (dft,T )] [V art (δ1 + δ2 dft,T )]

=δ2 V art (dft,T )√

[V art (dft,T )] [δ22 V art (dft,T )]

= 1 . (20)

Sin embargo, existe evidencia en la literatura no solo acerca de que los precios delos activos no evolucionan a lo largo del tiempo segun en paseo aleatorio (vease, porejemplo, Lo y Mackinlay (1999)), sino tambien sobre la existencia de sistematicasdesviaciones entre el precio teorico de un contrato de futuros segun la valoracioncost-of -carry y el precio cruzado en el mercado (mispricing) (vease Mackinlay yRamaswamy (1988), Lim (1992), Miller et al. (1994), Yadav and Pope (1990, 1994),y Buhler y Kempf (1995), entre otros). Bajo estas pautas de comportamiento lasolucion al problema de cobertura e inversion optima sera diferente, sino que el ratiode cobertura para una cartera replica del subyacente en el contrato de derivados nodeberıa ser unitario, recogiendo el hecho de que en los mercados reales existe un riesgode base. Volveremos sobre esta cuestion en la seccion 4.

3 Estimacion del ratio de cobertura

En este seccion se proponen diferentes especificaciones alternativas para estimar elratio de cobertura de un cartera replica del Ibex 35.

3.1 Datos

El periodo muestral analizado abarca desde el 20 de Diciembre de 1993 hasta el 20de Diciembre de 1996, el cual ha sido seleccionado por tres razones: a) como yahemos observado anteriormente, atendiendo al numero de contratos negociados, eldespegue del mercado de derivados se produce entre 1992 y 1994, de forma que elnivel de liquidez alcanzado a finales de 1993, que permanece estable hasta finales de1996, permite utilizar datos de alta frecuencia; b) las especificaciones del contrato defuturos no han sido objeto de modificacion en dicho periodo; al respecto, debemostener en cuenta que a finales de Enero de 1997 el multiplicador del contrato de futurospaso de 100 ptas. a 1.000 ptas. por punto basico, y c) el periodo considerado, quecomprende aproximadamente el 33% del tiempo de vida del mercado de futuros, sibien es homogeneo en cuanto al nivel de liquidez en el instrumento derivado recogeun comportamiento claramente diferenciado para el mercado de contado, tanto en

8Tengase en cuenta que si el diferencial hace referencia al incremento instantaneo entre ty t + 1 entonces, tendiendo en cuenta que toda variable contenida en el conjunto de informa-cion disponible en t es no estocastica, se tiene que Covt

(ft+1,T , pt+1

)= Covt

(dft,T , dpt

)y

V art(ft+1,T

)= V art

(dft,T

).

Page 308: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

300 Juan Angel Lafuente

lo que concierne a la dinamica de precios como en lo que respecta al nivel de riesgo(considerese el comportamiento de la Bolsa Espanola durante el ano 1996, con alzasgeneralizadas de cotizaciones y bajo nivel de volatilidad, con relacion a los mayorescambios de tendencia de precios observados en los anos 1994 y 1995). Por tanto, elejercicio de simulacion realizado de la seccion 4 pueden considerarse robusto frente alcomportamiento general del mercado de contado.

El contrato de futuros considerado en cada momento del tiempo es siempre el deproximo vencimiento, puesto que es el que sistematicamente presenta un mayor nivelde liquidez y en consecuencia el unico susceptible de ser analizado con datos de altafrecuencia. Las observaciones disponibles para el contrato de futuros sobre el Ibex35 no estan equiespaciadas en el tiempo, dado que la frecuencia de negociacion, sibien es muy alta, no es uniforme a lo largo del periodo de negociacion diario. Portanto, es necesario crear series de precios sobre un intervalo temporal fijo, a la vezque emparejar para cada observacion del futuro el valor del ındice Ibex 35 en elmismo instante de tiempo (identico minuto). La maxima frecuencia de observacionmuestral utilizada es de 5 minutos. En este sentido, cada dıa de negociacion esdividido en intervalos de 5 minutos, comenzando, como ya hemos dicho, a las 11:00horas. Posteriormente seleccionamos el primer cruce de operacion de futuro dentrode cada intervalo, y asociamos a dicho precio el valor del Ibex 35 en el mismo minutoen que se llevo a cabo la operacion en el mercado de derivados. De esta forma, apriori, deberemos disponer de 72 observaciones diarias, puesto que cada dıa estamosconsiderando 6 horas de negociacion; no obstante, para algunos dıas es inevitablela perdida de alguna observacion como fruto de una escasa liquidez ocasional en elmercado de futuros, fundamentalmente entre las 14:30 y las 15:30 horas. La muestradisponible a partir de los 743 dıas de negociacion utilizados contiene contiene 51.929observaciones9.

El objetivo es generar estimaciones del ratio, al menos de frecuencia diaria, conobjeto de simular una determinada estrategia de cobertura y calibrar posteriormentesu eficacia en funcion de cada una de las alternativas de estimacion propuestas.

Existe contundente evidencia empırica en la literatura acerca de que las series deprecios de los mercados de futuros sobre ındice bursatil y los de su correspondientesubyacente presentan una tendencia comun o relacion de equilibrio a largo plazo; parael mercado espanol vease Blanco (1998), Lafuente (1998) y Pardo y Climent (2000),entre otros. En este sentido, en la lınea de lo propuesto en Engle y Granger (1987) larepresentacion VAR bivariante para la dinamica de las series de precios (integradasde orden uno) debe incluir el termino de correccion de error. Esta aspecto sera tenidoen cuenta al proponer las diferentes especificaciones econometricas que pasamos adescribir en las siguientes subsecciones.

9Por tanto, en media, se han perdido aproximadamente dos observaciones diarias.

Page 309: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Una modelizacion GARCH bivariante del futuro sobre el Ibex-35 301

3.2 Modelos de correccion de error con perturbaciones homo-cedasticas

Una primera aproximacion para la estimacion de ratios de cobertura diarios es laestimacion de una recta de regresion a partir de las series de cambios en los precios,pero incluyendo la presencia de una relacion de equilibrio a largo plazo entre losprecios de ambos mercados. Es el modelo inicialmente propuesto en la literatura(vease Ederington (1979)) al que se ha incorporado la presencia de un mecanismode correccion de error. En este sentido, para cada dıa de la muestra, se estima pormınimos cuadrados el siguiente modelo:

∆ ln St = α + β ∆ln Ft + γ ut−1 + εt , (21)

donde B es el operador de retardos, ∆ = 1 − B, St es el valor del ındice y Ft es elprecio cruzado del contrato de futuros, ut−1 = lnSt−1 − θ1 − θ2 ln Ft−1 es el terminode correccion de error, estimado en una primera etapa.

La estimacion del modelo anterior se lleva a cabo cada dıa de negociacion a partirde los datos cada 5 minutos disponibles en el mismo desde las 11:00 horas hasta las17:00 horas. La pendiente estimada del modelo es utilizada como estimacion del ratiode cobertura; si tenemos en cuenta que como estimacion del ratio de cobertura. Laanterior especificacion tiene asociado un bajo coste computacional de estimacion, peropor contrapartida presenta la restriccion de que la perturbacion εt es homocedastica.La figura 1 muestra la evolucion dinamica de los ratios de cobertura estimados me-diante la anterior metodologıa.

Sin embargo tambien existe abundante evidencia empırica en la literatura acercadel comportamiento heterocedastico de las series de rendimientos; para el mercadoespanol, los trabajos de Blanco (1998), Lafuente (1998), Arago (2000) y Leon y Mora(1999), entre otros, ofrecen evidencia de esta pauta de comportamiento tanto para elmercado de futuros sobre el Ibex 35 como para el mercado de contado. Es por ello,que en las siguientes subsecciones se proponen estimaciones alternativas del ratio decobertura a traves de modelos de heterocedasticidad condicional autorregresiva.

3.3 Modelos de heterocedasticidad condicional autorregresiva

En esta seccion consideramos la estimacion del ratio de cobertura a traves de modelosde correccion de error con perturbaciones heterocedasticas. En este caso, dado el ma-yor coste computacional asociado a la estimacion utilizaremos datos de rendimientoshorarios, una vez depurada la muestra de los rendimientos overnight10.

10Con la muestra con datos cada cinco minutos, se ha seleccionado precios horarios comenzandocon el de las 11:00 horas. A partir de las siete observaciones de precios disponibles entre las 11:00 y las17:00 horas se han generado los rendimientos horarios a partir de la primera diferencia logarıtmica,eliminando posteriormente los rendimientos overnight . Por tanto, una vez ası depurada la muestra,se dispone de seis observaciones diarias de rendimientos horarios para cada mercado. Por otro lado,tengase en cuenta que cuanto mayor es la frecuencia de observacion muestral mas leptocurtica es la

Page 310: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

302 Juan Angel Lafuente

3.3.1 Un modelo bivariante de correccion de error

Sean rs,t y rf,t los rendimientos del mercado de contado y de futuros, respectivamente,es decir rs,t = lnSt − ln St−1, y rf,t = lnFt − ln Ft−1. La dinamica propuesta para laevolucion de los rendimientos es descrita por la siguientes ecuaciones:(

rs,t

rf,t

)=

(α11 α12

α21 α22

) (rs,t−1

rf,t−1

)+

(βs

βf

)(st−1 − (γ1 + γ2ft−1)) +

(εs,t

εf,t

), (22)

siendo εt, el vector de perturbaciones, con distribucion condicional Gaussiana: εt =(εs,t εf,t)

′ |Ωt−1 ∼ N (0,Σt), donde Ωt−1 es el conjunto de informacion disponibleen el periodo t − 1 y Σt la matriz de varianzas-covarianza condicional del vector derendimientos. El termino (lnSt−1 − (γ1 + γ2 ln Ft−1)) es el factor de correccion deerror. Los coeficientes βs y βf miden la respuesta ante desviaciones del equilibrio alargo plazo en el mercado de contado y futuros respectivamente. Si el correspondientecoeficiente es estadısticamente significativo, pero pequeno en valor absoluto, entonceslos precios de mercado tienen una escasa capacidad para ajustarse y recuperar elequilibrio de largo plazo.

A partir de la formulacion habitual, la dinamica de la matriz segundos momentoscondicionales correspondiente a un modelo GARCH(p,q) viene dada por la siguienteexpresion:

vechΣt = vechΣ + Θq (B) vech (εt ε′t) + Ψp (B) vechΣt , (23)

donde B es el operador de retardos,

Θq (B) = Θ1 (B) + Θ2

(B2

)+ · · · + Θq (Bq) ,

Ψp(B) = Ψ1 (B) + Ψ2

(B2

)+ · · · + Ψp (Bp) ,

εt es el vector de innovaciones y

vechΣt =(σ2

s,t σsf,t σ2f,t

)′,

vechΣ =(σ2

s σsf σ2f

)′,

vech (εt ε′t) =(ε2

s,t εs,t εf,t ε2f,t

)′.

Esta ecuacion puede asimismo expresarse como un modelo VARMA (vectorial auto-regressive moving average). Consideremos el siguiente vector estocastico trivariante:

ξt = vech(εtε

′t

)− vechΣt . (24)

Sustituyendo la ecuacion (24) en la ecuacion (23) y reordenando:

Γr (B) vech(εtε

′t

)= vechΣ + Φp (B) ξt , (25)

distribucion de frecuencias incondicional ası como que los modelos de heterocedasticidad condicionaltienen una capacidad limitada para capturar el exceso de curtosis en las series de rendimientos.

Page 311: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Una modelizacion GARCH bivariante del futuro sobre el Ibex-35 303

donde Γr (B) = [I − (Ψp (B) + Θq (B))], siendo

r = maxp, q y Φp (B) = [I − Ψp (B)] .

Esto es, una representacion ARMA(r, p) vectorial. De acuerdo con la ecuacion (25),la especificacion utilizada en el trabajo se corresponde con una media movil pura11:

vech(εtε

′t

)= vechΣ +

(φ1B + φ2B

6 + φ3B12 + φ4B

18)ξt . (26)

Si las raıces del polinomio caracterıstico caen fuera del cırculo unidad, la represen-tacion anterior puede expresarse como un modelo autorregresivo de orden infinitoestacionario, es decir, la anterior formulacion puede considerarse un modelo mas par-simonioso para capturar una estructura de dependencia entre los residuos al cuadradoa lo largo de un periodo de tiempo muy amplio.

Como senalan Bollerslev et al. (1994) el potencial numero de parametros en unaformulacion GARCH multivariante es aplastante, y, en consecuencia, toda especifica-cion util, dado un objetivo de partida, debe reducir el numero de parametros. En estesentido, se han introducido las siguientes restricciones:

a) las matrices φ2, φ3, y φ4 son diagonales,

b) y si denotamos por φ1ij, el elemento (i, j) en la matriz φ1, se impone que φ1

12 =φ1

21 = φ122 = φ1

23 = φ132 = 0.

A pesar de las restricciones introducidas, exclusivamente con objeto de evitar proble-mas numericos en la estimacion, el modelo se caracteriza por

• las interacciones cruzadas entre la volatilidad de cada mercado quedan recogidasa traves de los elementos φ1

31 y φ113 de la matriz φ1,

• los elementos de la diagonal principal de las matrices φj (j = 1, 2, 3) capturan elpatron estacional de comportamiento intradıa en forma de “U” en la volatilidady la covarianza de ambos mercados, relacionando cada momento condicional conel observado en la misma hora en dıas previos.

Ademas el modelo es una formulacion mas general que las propuestas habitualmenteen la literatura para el analisis de los principales mercados de futuros sobre ındiceen el sentido de que no se impone un coeficiente de correlacion condicional entrelos rendimientos de ambos mercados constante a lo largo del tiempo (veanse Parky Switzer (1995), Iihara et al. (1996), Koutmos y Tucker (1996), Ackert y Racine(1999), entre otros).

11Esta especificacion responde a las caracterısticas de las funciones de autocorrelacion simple de losrendimientos al cuadrado, ası como de la pauta detectada en la funcion de correlacion cruzada entrelos rendimientos al cuadrado de ambos mercados. Una explicacion detallada del comportamiento dedichas funciones puede encontrarse en Lafuente (2000).

Page 312: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

304 Juan Angel Lafuente

El modelo ha sido estimado por maxima verosimilitud exacta con la toolboox E412.Para estimar, fijamos los tres elementos del vector de constantes vechΣ en la ecuacion(26) igual a los segundos momentos incondicionales estimados con la muestra globalde rendimientos de ambos mercados. Por tanto, el algoritmo de optimizacion (BFGS )no tiene en cuenta dichos parametros en la estimacion13. En conjunto, es necesarioestimar 19 parametros en el modelo bivariante propuesto.

A partir de los segundos momentos condicionales de los rendimientos recuperamosla estimacion del ratio de cobertura a partir en un momento del tiempo t a partir dela siguiente expresion14:

pt−1

ft−1,,T

Covt−1 (∆ ln St,∆ln Ft,T )V art−1 (∆ ln Ft,T )

. (27)

La figura 2 muestra la evolucion del ratio de cobertura estimado a partir del modelomultivariante.

3.3.2 Dos modelos univariantes de correccion de error

Si bien la anterior especificacion en la dinamica de la matriz de varianzas-covarianzascondicional posee un alto grado de parsimonia la estimacion del modelo implica unalto coste computacional, ya que a pesar de que las restricciones impuestas el numerode parametros a estimar es elevado. Es por ello que la convergencia en gradienteen el proceso de estimacion resulta costosa, reflejando el hecho de que la funcion deverosimilitud presenta una superficie excesivamente plana.

Frente a la especificacion multivariante, en esta seccion proponemos la estimacionde un modelo univariante de correccion de error con perturbacion GARCH para lasseries de rendimientos horarios de cada mercado. A partir de la estimacion de lavolatilidad de cada mercado, recuperaremos la covarianza condicional entre los ren-dimientos de ambos mercados a traves del coeficiente de correlacion incondicional

12Una descripcion detallada de la toolbox, desarrollada en el Departamento de Economıa Cuanti-tativa (Universidad Complutense de Madrid) puede encontrarse en Terceiro et. al. (2000).

13Como se muestra en Engle y Mezrich (1996) esta restriccion mejora notablemente el comporta-miento numerico en el proceso de estimacion.

14Tengase en cuenta que dada una variable X, entonces

Xt − Xt−1

Xt−1 ln

Xt

Xt−1

si Xt − Xt−1 0. Esta puede considerarse una buena aproximacion en el caso de rendimientoshorarios. Por tanto se tiene que:

Covt−1

[ln pt

pt−1, ln ft

ft−1,T

]V art−1

[ln ft

ft−1,T

] 1

pt−1

1ft−1,T

1f2

t−1,T

Covt−1

[(pt − pt−1) ,

(ft − ft−1,T

)]V art−1

[(ft − ft−1,T

)]

=ft−1,T

pt−1

Covt−1

[(pt − pt−1) ,

(ft − ft−1,T

)]V art−1

[(ft − ft−1,T

)] ,

puesto que ft−1,T y pt−1 pertenecen al conjunto de informacion disponible en t − 1.

Page 313: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Una modelizacion GARCH bivariante del futuro sobre el Ibex-35 305

entre los rendimientos, estimado con toda la muestra. Ahora, por tanto, no solo seimpone una correlacion constante, sino que ademas no se permite la interaccion enmedia y en varianza entre los dos mercados. Como contrapartida, no restringimos laespecificacion de la parte regular del polinomio a una media movil pura.

El modelo estimado para cada mercado es el siguiente:

rm,t = α rm,t−1 + β (st−1 − (γ1 + γ2 ft−1)) + εm,t , (28)

donde εmt |Ωt−1 ∼ N(0, σ2

m,t

), y el subındice m = s, f denota el mercado de contado

o futuros. Siguiendo la notacion de la ecuacion (26), la dinamica de la varianza con-dicional viene dada por la siguiente expresion ARMA univariante para la innovacional cuadrado:

(1 − ϕ1B)ε2mt = δ1m + θ1m ξt−1 + θ2m ξt−6 + θ3m ξt−12 + θ4m ξt−18 , (29)

donde ξt = ε2mt − σ2

m,t, y B es el operador de retardos. Como senalabamos an-teriormente, ahora la especificacion es menos restrictiva al permitir un parametroautorregresivo en la parte regular del polinomio caracterıstico de ε2

mt. La figura 3muestra la evolucion del ratio de cobertura a partir de la estimacion por maximaverosimilitud de los dos modelos univariantes, del que obtenemos las volatilidadesestimadas para los rendimientos del mercado de contado y futuros, utilizando en laestimacion de la covarianza la correlacion incondicional.

4 Simulacion de operaciones de cobertura

Con objeto de analizar la aplicabilidad practica de los modelos propuestos, en estaseccion se llevan a cabo simulaciones de operaciones de cobertura en donde se aplicael ratio estimado a partir de las tres metodologıas propuestas. Realizamos una simu-lacion para cada uno de los 36 contratos disponibles tomando como punto inicial deriqueza una cesta de Ibex 35 al cierre del dıa posterior al vencimiento del contratoinmediatamente anterior en el tiempo. Suponemos que la revision de la posicion delmercado de derivados se realiza diariamente15 al cierre del mercado de contado (16:55horas), ası como que la cartera a cubrir es una cesta replica del Ibex 35. En este sen-tido, asimismo se lleva a cabo el ejercicio de simulacion aplicando el ratio unitario deforma sistematica. A partir de las series de rendimientos obtenidas correspondientesa cada una de las 36 sendas de valores de mercado de la posicion global se evaluala eficacia de la cobertura de las cuatro alternativas comparando la volatilidad de larentabilidad correspondiente a la posicion cubierta con la volatilidad del mercado (po-sicion no cubierta), es decir tomamos como indicador de efectividad de la coberturael siguiente estadıstico:

100 × dt (posicion cubierta) − dt ( posicion no cubierta)dt ( posicion no cubierta)

, (30)

15Por supuesto, la frecuencia con la que en la practica deberıa revisarse la posicion de derivados notiene que ser tan alta. El objetivo de las simulaciones es conocer que habrıa sucedido si el operadorhubiese tenido que corregir la posicion corta del mercado de futuros con alta periodicidad.

Page 314: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

306 Juan Angel Lafuente

donde dt denota la desviacion tıpica de la senda de rentabilidad. Si el anterior ratioes negativo, cuanto mayor sea su valor absoluto una mayor reduccion de volatilidadrespecto a la observada en el mercado de contado se habra alcanzado.

Las tablas 1 a 3 presentan los ratios medios aplicados con cada contrato segun lametodologıa de estimacion utilizada, mientras que las tablas 4 a 6 muestran el valor delestadıstico dado en (30) no solo para cada una de las especificaciones econometricasutilizadas para la estimacion de la volatilidad de cada mercado, sino tambien para elcaso en que el ratio de cobertura aplicado es sistematicamente unitario.

A partir de la informacion contenida en las tablas 1 a 6 cabe destacar los si-guientes aspectos: a) si bien por termino medio el ratio medio aplicado a partir dela estimacion del modelo de correccion de error con perturbaciones homocedasticases sistematicamente menor, la eficacia de la cobertura es irrelevante a lo largo a lolargo de los vencimientos comprendidos entre Diciembre de 1994 y Diciembre de 1996,como manifiesta la existencia de una contribucion de volatilidad por termino mediorespecto a la observada en el mercado; b) los ratios estimados a partir de la familia demodelos de heterocedasticidad condicional autorregresiva son superiores en el caso dela metodologıa univariante, es decir requieren de un mayor numero de contratos portermino medio. Sin embargo, la reduccion de volatilidad que se consigue aplicandolos ratios estimados con el modelo bivariante es superior a la obtenida con los ratiosestimados a partir de los modelos univariantes en 29 de los 36 contratos analizados.

Por otro lado cabe destacar que si bien el ratio unitario tiene asociado la mayoreficacia en terminos de cobertura, la discrepancia con el modelo bivariante es marginalpor termino medio. Sin embargo, es el caso en el que mayor numero de contratos essistematicamente requerido.

En resumen, las coberturas realizadas a partir de los ratios estimados proceden-tes del modelo bivariante de correccion de error con ruidos heterocedasticos no solorequiere un menor numero de contratos por termino medio sino que tienen asociadoun mayor grado de efectividad respecto a las obtenidas con los modelos univariantes,tanto hetero como homocedasticos. La reduccion de volatilidad conseguida con elmodelo bivariante es muy similar a la que se deriva del ratio miope unitario. Sinembargo un menor numero de contratos es utilizado por termino medio, en torno aun 25% inferior a lo largo de toda de la muestra.

Page 315: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Una modelizacion GARCH bivariante del futuro sobre el Ibex-35 307

5 Resumen y conclusiones

En este trabajo se deriva la expresion del ratio de cobertura optimo a partir de unmodelo de dos periodos en donde un agente cubre su posicion de contado exogenaa traves de un contrato de futuros con identico activo subyacente con el objetivo deminimizar la varianza condicional de su riqueza final. Asimismo el trabajo relacionael problema de cobertura anterior con el problema de inversion optima en donde elagente decide conjuntamente su posicion de contado y de futuros y cuyo objetivo esmaximizar la utilizada esperada de la riqueza final. El trabajo muestra que el ratio deinversion optimo es asimismo un ratio de cobertura optimo cuando a) la correlacionentre el valor del subyacente y el precio del contrato de futuros es perfecta o b) elprecio del contrato de futuros evoluciona segun un paseo aleatorio. Sin embargo,ambos supuestos son excesivamente simplificadores de la realidad operativa de losmercados de futuros, por lo que ambos ratios tenderan a ser diferentes.

Partiendo de la idea anterior el trabajo se centra en la estimacion del ratio decobertura para una cartera replica del Ibex 35. Si bien a nivel teorico la solucionoptima serıa el aplicar un ratio sistematicamente unitario, en la practica, el supues-to de ausencia de discrepancias entre el precio cruzado del contrato de futuros ysu valoracion cost-of-carry es excesivamente restrictivo. En este sentido, el traba-jo propone tres metodologıas alternativas para la estimacion del ratio; partiendo deuna especificacion de correccion de error en media se considera tanto perturbacionesheterocedasticas como homocedasticas.

Finalmente el trabajo calibra el potencial operativo de los ratios estimados a partirde un ejercicio de simulacion de una determinada estrategia de cobertura con revisiondiaria de la posicion de derivados. Los resultados sugieren que a) los modelos conperturbaciones homocedasticas, estimados diariamente, no son efectivos en cuanto areduccion de volatilidad y b) los ratios estimados a partir del modelo GARCH biva-riante consiguen una reduccion de volatilidad superior a la obtenida con los modelosGARCH univariantes y similar a la que se deriva de la aplicacion del ratio miopeunitario. Sin embargo, un menor numero de contratos es utilizado.

Este trabajo abre nuevas lıneas de investigacion futura. Entre otras, serıa intere-sante calibrar la robustez de los resultados obtenidos con los modelos de correccionde error y perturbaciones heterocedasticas para diferentes horizontes de cobertura asıcomo para horas alternativas de revision. Por otro lado, resulta asimismo de interesestimar el ratio dentro de la muestra y efectuar las operaciones de cobertura teniendoen cuenta los costes de transaccion. En este caso la revision de la posicion en el mer-cado de derivados tendra una frecuencia menor, lo que podrıa dar lugar a resultadoscualitativamente diferentes.

Page 316: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

308 Juan Angel Lafuente

Apendice 1: Tablas estadısticas

Tabla 1:Ratios de Cobertura Medios

Ano 1994

Vencimiento UNIV(a) MULTIV(b) MCE(c)

Enero 0.78 0.78 0.57Febrero 1.04 0.78 0.51Marzo 1.08 0.76 0.47Abril 1.17 0.73 0.57Mayo 0.90 0.71 0.61Junio 0.86 0.78 0.62Julio 0.90 0.69 0.52Agosto 0.92 0.76 0.47Septiembre 0.74 0.73 0.66Octubre 0.89 0.71 0.65Noviembre 0.91 0.75 0.63Diciembre 1.08 0.79 0.50

Total 0.94 0.75 0.56

Tabla 2:Ratios de Cobertura Medios

Ano 1995

Vencimiento UNIV(a) MULTIV(b) MCE(c)

Enero 0.77 0.74 0.73Febrero 1.05 0.79 0.38Marzo 0.90 0.72 0.73Abril 0.85 0.76 0.63Mayo 0.93 0.78 0.62Junio 0.93 0.74 0.71Julio 0.93 0.81 0.53Agosto 1.17 0.81 0.45Septiembre 0.99 0.83 0.41Octubre 0.99 0.78 0.54Noviembre 1.22 0.80 0.42Diciembre 0.92 0.80 0.54

Total 0.97 0.78 0.56

Tabla 3:Ratios de Cobertura Medios

Ano 1996

Vencimiento UNIV(a) MULTIV(b) MCE(c)

Enero 1.14 0.79 0.55Febrero 0.88 0.80 0.54Marzo 0.80 0.76 0.82Abril 1.02 0.81 0.64Mayo 0.91 0.83 0.56Junio 1.01 0.82 0.66Julio 0.88 0.79 0.60Agosto 0.84 0.81 0.69Septiembre 0.85 0.79 0.68Octubre 0.97 0.80 0.69Noviembre 1.06 0.80 0.60Diciembre 0.92 0.81 0.73

Total 0.94 0.80 0.65

Notas:(a) Modelos de correccion de error univariantes con perturbaciones GARCH (correlacion incon-

dicional igual a la incondicional).

(b) Modelo de correccion de error bivariante con perturbaciones GARCH (correlacion condicionalno constante).

(c) Modelo de correccion de error con perturbaciones homocedasticas.

Page 317: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Una modelizacion GARCH bivariante del futuro sobre el Ibex-35 309

Tabla 4. Reduccion de volatilidad respecto a la posicion no cubierta

Vencimiento UNIV(a) MULTIV(b) MCE(c) R=1(d)

Enero 94 48% 58% 32% 57%Febrero 94 49% 43% 18% 50%Marzo 94 29% 75% 32% 85%Abril 94 17% 76% 46% 82%Mayo 94 67% 68% 41% 83%Junio 94 57% 72% 60% 77%Julio 94 49% 40% 45% 56%Agosto 94 60% 63% 35% 71%Septiembre 94 57% 72% 64% 83%Octubre 94 54% 67% 57% 78%Noviembre 94 53% 78% 58% 75%Diciembre 94 48% 68% 43% 65%

Total 49% 65% 44% 72%

Notas:(a) Modelos de correccion de error univariantes con perturbaciones GARCH (correlacion incon-

dicional igual a la incondicional).

(b) Modelo de correccion de error bivariante con perturbaciones GARCH (correlacion condicionalno constante).

(c) Modelo de correccion de error con perturbaciones homocedasticas.

(d) Ratio sistematicamente unitario.

Tabla 5. Reduccion de volatilidad respecto a la posicion no cubierta

Vencimiento UNIV(a) MULTIV(b) MCE(c) R=1(d)

Enero 95 68% 65% -26%(∗) 71%Febrero 95 7% 37% -3% 25%Marzo 95 68% 62% -31% 72%Abril 95 71% 74% -31% 78%Mayo 95 55% 68% 7% 66%Junio 95 67% 66% -16% 71%Julio 95 57% 71% -12% 68%Agosto 95 55% 78% –21% 80%Septiembre 95 31% 72% -85% 66%Octubre 95 77% 78% -2% 87%Noviembre 95 40% 80% -17% 81%Diciembre 95 58% 68% -13% 75%

Total 55% 68% -21% 70%

Notas:(a), (b), (c), (d) como en la tabla anterior.

(∗) Un signo negativo indica que la estrategia proporciono un incremento de volatilidad respectode la observada en el mercado de contado.

Page 318: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

310 Juan Angel Lafuente

Tabla 6. Reduccion de volatilidad respecto a la posicion no cubierta

Vencimiento UNIV(a). MULTIV(b). MCE(c) . R=1(d)

Enero 96 62% 63% -20%(∗) 79%Febrero 96 72% 71% -19% –7%Marzo 96 64% 84% -27% 85%Abril 96 75% 79% -77% 82%Mayo 96 73% 69% 0% 73%Junio 96 71% 74% -21% 79%Julio 96 72% 78% -11% 81%Agosto 96 72% 79% -32% 85%Septiembre 96 71% 78% -51% 80%Octubre 96 69% 76% -78% 81%Noviembre 96 58% 66% -7% 64%Diciembre 96 76% 81% -26% 85%

Total 69% 75% -31% 72%

Notas:(a), (b), (c), (d) como en las tablas anteriores.

(∗) En este caso la estrategia proporciono un incremento de volatilidad respecto de la observadaen el mercado de contado.

Apendice 2: Graficos

Figura 1: Ratios de Cobertura. Modelo de Correccion de Error Homocedastico

Page 319: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Una modelizacion GARCH bivariante del futuro sobre el Ibex-35 311

Figura 2: Ratios de Cobertura. Modelo GARCH bivariante

Figura 3: Ratios de Cobertura. Modelo GARCH univariantes

Page 320: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

312 Juan Angel Lafuente

Referencias

[1] Ackert, Lucy F. y M.D. Racine (1999), Stochastic trends and cointegration inthe market for equities, Journal Of Economics And Business 51, no. 2, paginas133–143.

[2] Arago, V. (2000), Vencimiento del contrato de futuros y ratio de cobertura demınima varianza: Evidencia empırica para diferentes horizontes temporales deinversion., Revista Espanola de Financiacion y Contabilidad, en prensa.

[3] Blanco, R. (1998), Transmision de informacion y volatilidad ente el mercado defuturos sobre el ındice Ibex 35 y el mercado al contado, III Jornadas de EconomıaFinanciera, Volumen 1, paginas 219–289.

[4] Bollerslev T., Engle R.E. y D.B. Nelson (1994), ARCH models, Handbook ofEconometrics, Engle R.E. y D.L. McFadden (editores), Volumen 4. Elsevier,Amsterdam.

[5] Buhler, W. y A. Kempf (1995), DAX index futures: mispricing and arbitrage inGerman markets, Journal of Futures Markets 7, paginas 833–859.

[6] Engle, R.F. y C.W. Granger (1987), Cointegration and error correction: Repre-sentation, estimation and testing, Econometrica 55, paginas 251–276.

[7] Ederington, L.H. (1979), The hedging performance of the new futures markets”,The Journal of Finance 3, paginas 157–170.

[8] Ghosh, A. (1993), Hedging with Stock Index Futures: Estimation and Forecastingwith Error Correction Model, The Journal of Futures Markets 13 (7), paginas743–752.

[9] Engle, R.F. and C.W. Granger (1987), Cointegration and error correction: Re-presentation, estimation and testing, Econometrica 55, paginas 251–276.

[10] Engle, R.F. y J. Mezrich (1996), GARCH for groups, Risk 9 (8), paginas 36–40.

[11] Iihara Y., Kato, K. and T. Tokunaga (1996), Intraday returns dynamics betweencash and the futures markets in Japan, Journal of Futures Markets 16, paginas147–162.

[12] Koutmos G. and M. Tucker (1996), Temporal relationships and dynamics inter-actions between spot and futures stock markets, Journal of Futures Markets 16,paginas 55–69.

Page 321: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Una modelizacion GARCH bivariante del futuro sobre el Ibex-35 313

[13] Lafuente, J.A. (1998), Estrategias dinamicas de cobertura en el mercado de futu-ros sobre el Ibex 35, III Jornadas de Economıa Financiera, Volumen 2, paginas85–138.

[14] Lafuente, J.A. (2000) Intraday return and volatility relationships between theIbex 35 stock index and stock index futures markets, Working paper 00-02. Uni-versidad Carlos III de Madrid.

[15] Leon A. y J. Mora (1999), Modelling conditional heteroskedasticity: Applicationto the Ibex 35 stock-return index, Spanish Economic Review 1, no. 3, paginas215–238.

[16] Lien y Luo (1993), Estimating Multiperiod Hedge Ratios in Cointegrated Mar-kets, The Journal of Futures Markets 13, no. 8, paginas 909-920.

[17] Lim, K. (1992), Arbitrage and price behavior of the Nikkei stock index futures,Journal of Futures Markets 12, paginas 151–161.

[18] Lien, D.(1996), The Effect of the Cointegration Relationship on Futures Hedging:A Note, The Journal of Futures Markets 16, no. 7, paginas 773–780.

[19] Lo, A. and A.C. Mackinlay (1999), A non-random walk down Wall street, Prin-ceton Unversity Press.

[20] Mackinlay, A.C. y C. Ramaswamy (1988), Index futures arbitrage and the beha-vior of stock index futures prices, Review of Financial Studies 1, paginas 137–158.

[21] Miller, M.H., Muthuswamy, J. and R.E. Whaley (1994), Mean reversion of Stan-dard & Poor’s 500 index basis changes: Arbitrage-induced or statistical illusion?,Journal of Finance 49, paginas 479–513.

[22] Pardo, A. y F. Climent (2000) Relaciones Temporales entre el Contrato de Futurosobre el Ibex 35 y su Activo Subyacente, Investigaciones Economicas 24 (1),paginas 219–235.

[23] Park T.H. y L.N. Switzer (1995), Bivariate GARCH Estimation of the OptimalHedge Ratios for Stock Index Futures: A Note, The Journal of Futures Markets15, no. 1, paginas 61–67.

[24] Rubinstein, M. (1976), The Valuation of Uncertain Income Streams and thePricing of Options, Bell Journal of Economics 7, paginas 407–425.

[25] Terceiro, J., Casals J.M., Jerez, M., Serrano G. and Sotoca (2000), A MatlabToolbox for reliable time series modeling and forecasting in State-Space. ICAEworking paper.

Page 322: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

314 Juan Angel Lafuente

[26] Theobald, M. y P. Yallup (1997): ”Hedging Ratios and Cash/Futures MarketLinkages”, The Journal of Futures Markets 17, no. 1, paginas 101–115.

[27] Yadav, P.K. and P.F. Pope (1990), Stock index futures arbitrage: Internationalevidence, Journal of Futures Markets 10, paginas 573–603.

[28] Yadav, P.K. and P.F. Pope (1994), Stock index futures mispricing: Profit oppor-tunities or risk premia?, Journal of Banking and Finance 18, paginas 921–953.

Juan Angel LafuenteDepartamento de Finanzas y Contabilidad

Facultad de Ciencias Economicas y EmpresarialesUniversidad Jaume I

12071 Castellone-mail: [email protected]

Page 323: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Risk Assessment and Extreme

Value Theory in Finance

Alberto Suarez1

Abstract

The estimation and management of risk is an important and complex taskwith which market regulators and financial institutions are faced. It has becomeapparent that accurate and reliable quantitative measures of risk are needed inorder to avert, or at least minimize, the undesirable effects on a given portfolioof large fluctuations in the conditions of the market. In order to accomplishthis task, a number of mathematical tools are available. Classical risk analysisfocuses on the estimation of Value at Risk, which is a percentile of the returnsdistribution at a given probability level for a given time horizon. Besides thisstandard measure, it is possible to carry out a more sophisticated risk analysisbased on Extreme Value theory. A series of novel risk measures (Shortfall, Max-VaR, etc.) based in this theory have been introduced by a number of authors inorder to address the insufficiencies of VaR to properly characterize the responseof a given portfolio to fluctuations in market conditions. In order to illustratethe use of these tools, a comprehensive risk analysis for the IBEX35 stock index(Spain) is presented.

1 Introduction

The financial portfolio of an institution comprises a number of products (bonds, as-sets, derivatives, and the like) that are openly traded in financial markets. The pricesof these products depend on the values of a number of risk factors: interest rates,asset prices, volatility, and the like. Market risk analysis consists in estimating theresponse of the portfolio to fluctuations in the values of these risk factors. Portfo-lio managers may use this analysis to assess different strategies. In situations wherethe goal is to secure the value of a portfolio, risk analysis can be used to minimizethe effects of unexpected fluctuations in market conditions. Alternatively, a portfoliomanager may attempt a competitive advantage through a calculated and carefullycontrolled exposure to risk. Market regulators, however, enforce restrictions to dis-courage an excessive or uncontrolled exposure to risk, which can lead to disruptionsin the economic system. These restraints should be also supple enough not to have anegative effect on the functioning of the markets.

1Alberto Suarez es Profesor Titular de la Escuela Tecnica Superior de Informatica (UniversidadAutonoma de Madrid) y responsable de Computacion Cientıfica del Risklab Madrid. Esta charla seimpartio en la sesion del Seminario MEFF-UAM de junio de 1999.

Page 324: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

316 Alberto Suarez

There are several elements that make the problem of risk assessment a difficultone. A partial list includes the complexity of the portfolio itself, the correlationstructure between the different portfolio assets, and a synthesis of these inputs into asmall set of numbers, such as VaR or expected Shortfall, that capture the informationabout the risk profile of the portfolio in a form that is both manageable and easy tocommunicate.

Here, we assume statistically that the portfolio exhibits the same near future be-havior as its recent past. The analysis focuses on a synthetic time-series composedof reconstructed values from the recent past of a hypothetical portfolio whose com-position is fixed and identical to that of the actual portfolio. The reconstructionprocess may involve some portfolio compression, where the portfolio is replaced bya few components that account for a large fraction of risk, replication, and othermanipulations.

With such a time-series, the most common measure of risk is the Value at Risk,VaR (see [1]). The objective is to estimate the worst trading losses of a fixed portfolioover a period T , the time horizon, at a given probability level P . Assuming the timehorizon to be one day, the histogram of daily returns is constructed from the historicaldata. This empirical distribution is then fitted to a parametric model from which apercentile at level P is obtained. The usual assumption is that the daily returns areindependent normally distributed variables.

This procedure is quickly implemented, but has recently come under criticism (see,for instance [2, 3]). Indeed, there seems to be a consensus in the financial communitythat current Value at Risk measures fail to capture some of the essential features ofactual market risks. It is empirically observed that the tails of the distribution ofreturns on financial products have more weight than what would be predicted by afit to a normal distribution. In particular, the assumption of normality is known tofail for large fluctuations in the value of the portfolio [4]. These extreme fluctuationsare precisely the ones that a risk measure such as VaR is trying to capture. Thefailure to represent the behavior of the portfolio correctly in worst-case scenarioshas prompted several suggestions for alternative, more sophisticated models, betterable to deal with extreme events. One extension of the classical VaR methodologydrops the assumption of normality and posits a different distribution with a positivekurtosis and possible skewness (e.g. hyperbolic distributions [5], mixture of Gaussians[4], stable distributions [6]). This provides a more accurate model of the behavior ofthe market. The parameters of these non-normal distributions can be determined bymaximum-likelihood estimation.

Finally, a measure of risk analogous to the normal VaR is extracted by calculationof percentiles. Extreme Value Theory [7, 3, 8] also provides a framework for thedefinition of other non-standard risk measures such as MaxVaR and Shortfall. Inorder to extract these parameters, the analysis focuses on the distribution of extremeevents itself.

Page 325: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Risk Assessment and Extreme Value Theory in Finance 317

The paper is organized as follows: section 2 gives a general introduction to theproblem and describes the computation of VaR with different parametric models(normal, mixture of normals, hyperbolic distribution) for the empirical distributionof portfolio returns. In section 3, risk measures are calculated by analyzing the tailof the distribution, assuming Pareto behavior. Section 4, focuses on the distributionof maxima of the time series. Finally, a summary of the results of a risk analysis forthe IBEX35 data is presented.

0 200 400 600 800 1000 1200

2500

3000

3500

4000

4500

5000

5500

6000

6500

7000

7500

IBEX35 ( from 4/1/93 to 23/12/97)

Figure 1: Daily values for the IBEX35 stock index.

2 Unconditional risk measures

Assume we have a reconstructed series of the negative of the returns of a given port-folio

rt = −St+1 − St

St. (1)

The quantities St are the values of the hypothetical portfolio with the same fixedcomposition as the actual portfolio. We focus on the distribution of losses, since theyare the important quantity in the problem of risk assessment. The negative sign isincluded so that losses appear to the right-hand side of the probability distributions.

A histogram displaying the numbers of observations in non-overlapping segmentscovering the whole range of observed returns gives a graphical representation of the

Page 326: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

318 Alberto Suarez

200 400 600 800 1000 1200−6

−4

−2

0

2

4

6

Rel

ativ

e re

turn

leve

l (%

)

Time

Figure 2: Daily relative returns for the IBEX35 stock index (from 4/1/93 until23/12/97).

empirical probability density distribution for the relative losses (negative of the re-turns) for the portfolio (see figure 3).

The usual risk measure, VaR (Value-at-Risk), is a percentile of the profit-lossdistribution at a given probability level P (expressed as a percentage) for a giventime horizon T . Intuitively, if the time horizon is one day, this quantity representsthe minimum relative loss a portfolio will have in at least P of one hundred days,assuming the composition of the portfolio remains unaltered during that period. Thevalue of this percentile can, in principle, be obtained from the empirical probabilitydensity distribution function (pdf). Due to the limited data available, this measureis not robust. In particular, the VaR estimations are sensitive to sample fluctuations.This is especially true in the tail of the distribution, where extreme losses may occur.Furthermore no out-of-sample VaR estimates can be given by this procedure, whichmay become crucial for situations with small quantities of data, such as portfoliosbased on new markets or new economies products.

A more robust estimate is obtainable if we assume a parametric form for the profit-loss distribution and find the parameters by likelihood maximization. The value ofVaR can be obtained as a percentile of the fitted distribution.

The problem of selecting a model from the data is a difficult one, with no gen-eral solution can be given, except if a market model can be explicitly formulated.In its absence, one can assume various parametric forms as suggested in the litera-

Page 327: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Risk Assessment and Extreme Value Theory in Finance 319

−6 −4 −2 0 2 4 60

20

40

60

80

100

120

Relative loss (%)

Cou

nt

Figure 3: Daily relative losses for the IBEX35 stock index.

ture. Parametric fits with a normal distribution, mixtures of normals, and hyperbolicdistributions are included in the analysis.

2.1 Normal VaR

It is commonly assumed that portfolio returns behave as an asset in a Black-Scholesmodel, and that the relative returns are normally distributed. Figure 4 depicts themain results of a risk analysis with a time horizon of one day and a probability level of99%. The empirical distribution and corresponding normal fit appear on the left handside of figure 4. The results of two different tests to assess the quality of the fit (theKolmogorov-Smirnov statistical test and the quantile-quantile plot) are presented onthe right-hand side of the figure. The Kolmogorov-Smirnov statistical test [9] gives ameasure of the likelihood of the hypothesis that a set of data is an empirical samplingof a given model’s pdf with certain values of the parameters. The test defines a samplestatistic as the maximum distance between the empirical and the model cumulativeprobability distributions. An analytic form for the probability distribution of thisstatistic can be given if the parameters of the model distribution are independent ofthe data. Despite the fact that the parameters are obtained by maximum-likelihoodoptimization from the sample itself,we make use of this analytical form. Nonetheless,it is expected that low values of the likelihood of the hypothesis as measured throughthe Kolmogorov-Smirnov statistic indicate a low quality fit.

The quantile-quantile plot gives the empirical quantiles as a function of the model

Page 328: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

320 Alberto Suarez

−5 0 50

20

40

60

80

100

−4 −2 0 2 4−6

−4

−2

0

2

4

6

X Quantiles

Y Q

uant

iles

Figure 4: Risk measures for the IBEX35 using a normal model. The parameters ofthe fit are µ = −0.0901, σ = 1.0249.

quantiles. It also provides a way to assess the quality of the parametric fit by inspec-tion. If the fit is good, the quantile-quantile plot should be a straight line with slopeone. Deviations from this behavior are easy to detect by inspection in this type ofplot.

Besides the value of VaR at a certain probability level P , it is possible to calculatethe Shortfall for the data as

Shortfall ≡ E [X |X > V aR(P )] . (2)

Shortfall is a measure of the average loss a portfolio would have, given that the loss isabove a certain threshold. It has been proposed by several authors as an alternativemeasure of risk with the desired properties of subadditivity and coherence [10].

There are several indications that the normal model fails to reflect the distributionof extreme events. The Gaussian fit severely underestimates the magnitude of thetails. The low value of the test on the likelihood for the Kolmogorov-Smirnov (KS)statistic indicates that we should be wary of the quality of the fit obtained. Thequantile-quantile plot reveals that the main discrepancies occur at the tails of thedistribution. It can also be seen that the VaR level predicted by the normal fit ismuch lower than the VaR derived directly from the empirical distribution (labeled as“sample VaR” in the figures).

Page 329: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Risk Assessment and Extreme Value Theory in Finance 321

2.2 VaR with mixture models

Among the possible generalizations of the normal model for the portfolio returns, theGaussian Mixture (GM) model is able to expand the range of describable phenomenawhile remaining close to the Gaussian paradigm. The mixture-of-normals model isflexible enough to capture features commonly observed in actual financial time series.An important example is the fact that extreme events in the financial world occur morefrequently than the classical normal models would predict. This leads to distributionfunctions of returns on a financial asset that have tails with greater weight thannormal. This has implications for the pricing of derivative products, for hedging andfor the estimation of risk measures [11]. The parameters of the mixture models areestimated by maximization of a modified likelihood function with an ExpectationMaximization algorithm [12]. Hull and White [11] introduced two new Greeks, Ψand χ, to reflect the sensitivity of a portfolio composed of derivatives to the kurtosisand skewness, respectively, in the distribution of returns. It also shows how a simplemodel based on a mixture of normals is sufficient to capture this effect and correctlymodel the volatility smile implicit in foreign exchange rates and equity options.

Let us examine in Figure 5 the IBEX35 data when the distribution of returns ismodeled by a mixture of two Gaussians. The fit is more plausible, as is indicatedby the value close to one of KS statistic test, and by the quantile-quantile plot. Thevalues of the model and the sample VaR are now close to each other. Given thatwe are obtaining within-sample values of VaR, this is an indication that the modelproduces estimates consistent with the observations.

The mixture model is a simple yet flexible extension of the normal model thatallows one to model features that are observed in actual financial data. In particular,it can be used to carry out a reliable and robust risk analysis, at least up to thesample edges. Note, however, that the decay of the tails of a mixture distribution isstill Gaussian-like. It is unclear at this point whether the actual tail decay is algebraicor exponential. Consequently, out-of-sample extrapolations made with a mixture-of-Gaussians model should be regarded with utmost caution. One should also try to limitthe number of components that enter the mixture, lest some amount of overfittingoccur. Generally two or three components provide an appropriate fit for the data.

2.3 VaR with hyperbolic models

Another proposal in the literature to account for heavy tails models the portfolioreturns with a hyperbolic distribution [5, 13]. The hyperbolic family depends on fourparameters

PHyp(x;α, β, δ, µ) =

√α2 − β2

2α δK1(δ√

α2 − β2)

exp(−α

√δ2 + (x − µ)2 + β(x − µ)

), (3)

Page 330: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

322 Alberto Suarez

−5 0 50

20

40

60

80

100

−10 −5 0 5 10−8

−6

−4

−2

0

2

4

6

X Quantiles

Y Q

uant

iles

Figure 5: Risk measures for the IBEX35 using a mixture of two normal distributions.The parameters of the fit are p1 = 0.8988, µ1 = −0.1052, σ1 = 0.8934 for the firstnormal in the mixture and p2 = 0.1012, µ2 = 0.0438, σ2 = 1.8053 for the secondnormal.

where δ ≥ 0; α > |β| ≥ 0, and K1(x) is a modified Bessel function of the third kindwith index 1. The quantities µ and δ are the location and scale parameters, respec-tively. The values of α and β determine the shape of the distribution. Several otherdistributions (normal, symmetric and asymmetric Laplace, exponential, generalizedinverse Gaussian) appear as limiting cases of this distribution. One advantage of thehyperbolic distribution is that it can be seen as a mixture of an infinite number ofGaussians, where the weights are given by a generalized inverse Gaussian distribution[5]. Furthermore, the hyperbolic distribution appears as a stationary distributionof a continuous-time Markov process described by a particular stochastic differentialequation [5]. This observation justifies its possible use as a model to price options.

Figure 6 displays the fit obtained with IBEX35 data when the distribution ofreturns is modeled by a hyperbolic distribution. The resulting fit is quite reasonable,except possibly at the tails, which still decay exponentially.

3 Modeling the tails: Shortfall

In estimating risk measures we are interested in events in the tails. In contrast to theparametric approach given in the previous section, where one attempts to model thefull pdf of the portfolio fluctuations, one can focus on finding an appropriate modelfor the tail of the distribution alone [7]. Assuming that the tail behaves regularly,

Page 331: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Risk Assessment and Extreme Value Theory in Finance 323

−10 −5 0 5 10−8

−6

−4

−2

0

2

4

6

−5 0 50

10

20

30

40

50

60

70

80

90

100α = 1.84159β = 0.0651013δ = 1.02963µ = −0.157995

Figure 6: Risk measures for the IBEX35 using a hyperbolic distribution.

the probability density distribution should behave asymptotically like a GeneralizedPareto distribution

Ptail(X) =1β

(1 +

ξ

β(X − u)+

)−(1+ 1ξ )

, X > u. (4)

In the literature on extreme events, this method is known as the Peaks Over Threshold(POT) method [7]. Note that the predicted decay is algebraic except if the tail indexξ is close to zero, when it corresponds to exponential decay. The parameter u shouldbe chosen large enough to produce the asymptotic behavior predicted in equation (4),but as small enough to produce adequate data in the tail to yield reliable estimatesfor the remaining parameters ξ and β.

The mean excess above a threshold for a random variable is defined to be theconditional expectation of that variable less the threshold for values of the variableabove the threshold. For an empirical realization with N data samples, the meanexcess is

E [X − µ |X > µ] =1

NX>µ

N∑j=1

(Xj − µ)+, (5)

where NX>µ is the number of instances above the threshold in the sample. If forX > u the distribution of this variable can be approximated as a Generalized Pareto,equation (4), the mean excess should be approximately linear in the threshold. The

Page 332: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

324 Alberto Suarez

analytic formula for the mean excess for a Generalized Pareto pdf is

E [X − µ |X > µ] =β

1 − ξ+

ξ

1 − ξ(µ − u). (6)

To select the parameter u of the Generalized Pareto (GP) distribution, the user shouldinspect the mean excess plot and identify regions for which the plot is approximatelylinear. Then the threshold u is chosen as small as possible, but within the linearregion.

For the IBEX35 data, we present the results with different choices for the thresh-old. Figure 7 displays the results with u = 1, corresponding to the flat region (ξ ≈ 0,exponential decay) in the mean-excess plot. Even though the data are scarce, it is

−5 0 50

50

100

150

200

0 1 2 3

0.5

1

1.5

Figure 7: Risk measures for the IBEX35 data using a Generalized Pareto Fit u = 1.The fit parameters are β = 0.6397, ξ = 0.0141.

possible to identify a separate linear region for values X > 2. The correspondingPareto fit for a threshold u = 2.25 is displayed in Figure 8. In contrast to the previ-ous choice of the threshold, which predicts an exponential decay, this choice predictsalgebraic decay. This question is of particular importance in calculating the shortfall,whose value is very sensitive to the type of decay for edge-of-sample probability levels(around and above 99.9%). It is possible that the true asymptotic decay is algebraic,as is predicted when focusing on points beyond the threshold u = 2.25. One couldalso conclude that the decay is exponential but the algebraic-like behavior observedfor u ≥ 2.25 comes from sample fluctuations. With the available data it is difficult todecide which hypothesis is closer to reality.

Page 333: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Risk Assessment and Extreme Value Theory in Finance 325

−5 0 50

50

100

150

200

0 1 2 30.4

0.6

0.8

1

1.2

1.4

1.6

1.8

Figure 8: Risk measures for the IBEX35 data using a Generalized Pareto Fit u = 2.25.The fit parameters are β = 0.3830, ξ = 0.3864.

4 Modeling extreme events: MaxVaR

The evolution of the value of a portfolio in response to large fluctuations in the riskfactors is one of the important elements in risk management. It is thus useful todevelop models for distributions of extremal events [7]. Under certain relatively weakconditions (identical distribution of events, independence of the maxima), it can beshown that the maxima of a time series follow asymptotically a Generalized ExtremeValue (GEV) distribution for the probability density

P (x) =1ψ

(1 +

ξ

ψ(x − µ)

)−(1+ 1ξ )

exp

(1 +

ξ

ψ(x − µ)

)− 1ξ

,

(1 +

ξ

ψ(x − µ)

)> 0. (7)

Parameter ξ is the tail index introduced in the previous section and should be similarto the one estimated from the Generalized Pareto fit. The analysis proceeds as follows:We choose a time lapse and partition the data into non-overlapping segments of theselected length. A new series is formed using the maximum values for the losseswithin each segment. The box size is chosen by compromising between sufficientlylarge boxes, so that the independence and asymptotic conditions are met, and havingsufficient data to produce reliable estimates of the GEV parameters.

Page 334: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

326 Alberto Suarez

0 1 2 3 4 50

5

10

15

20

25

30

35

0 200 400 6000

1

2

3

4

5

6ξ(10%) = 0.280176

ξ

Figure 9: Risk measures for the weekly maxima of IBEX35 data. The parameters ofthe GEV distribution fitted are µ = 0.6084, ψ = 0.6179, ξ = 0.0324.

Let us consider the MaxVaR analysis for the IBEX35 data. We focus on weeklymaxima (Figure 9) and biweekly maxima (Figure 10).

The novel elements in Figures 9, 10 are the Hill plot and the risk analysis based onmaxima. The Hill plot permits the estimation of the parameter ξ when it is positive.The points in the time series X1, X2, . . . , XT , are ordered ascendingly

XT ;T ≤ XT−1;T ≤ . . . ≤ X2;T ≤ X1;T . (8)

The Hill plot gives the value of the Hill estimator for the tail index

ξ(H) =1k

k∑j=1

logXj;T

Xk;T(9)

as a function of the integer k = 1, 2 . . . T . The point selected in the graphic by a crossis the 10% Hill estimator (k10% = 0.1T ). We observe that this estimate is close tothe tail index found by a fit to a GP with a threshold u = 2.25, which indicates analgebraic decay in the distribution tails. However, the maximum-likelihood estimatesfor the distributions of weekly and biweekly maxima predict a tail index close to 0(exponential decay of the tails), in agreement with the Pareto fit with a thresholdu = 1. In Figs 9, 10 we have also selected two probability levels Pl = 5% andPu = 95%. By calculating the corresponding percentiles of the GEV distribution,one obtains a range where the corresponding maxima can be found with a certain

Page 335: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Risk Assessment and Extreme Value Theory in Finance 327

0 1 2 3 4 50

5

10

15

20

25

30

35

0 200 400 6000

1

2

3

4

5

6ξ(10%) = 0.280176

ξ

Figure 10: Risk measures for the biweekly maxima of IBEX35 data. The parametersof the GEV distribution fitted are µ = 0.9666, ψ = 0.5864, ξ = 0.0774.

probability [Maxl,Maxu]. The expected value for the maxima conditioned on beingin the range derived is also reported in Figures 9, 10

E [Max|Maxl ≤ Max ≤ Maxu] . (10)

5 Summary of results for IBEX35

The main results obtained for Value-at-Risk and shortfall for the IBEX35 data aresummarized in tables 1 and 2. Table 1 displays Value at Risk and table 2 Shortfall fordifferent probability levels and with different parametric fits. The rows are labeled ac-cording to the model used to compute the values: empirical distribution VaR (sample),normal (GM1), mixture models (GM2, GM3, mixtures with 2 and 3 Gaussians, re-spectively), hyperbolic distribution (HYP), and Generalize Pareto distributions (GP,with the chosen threshold in parentheses). The second column displays the resultof the Kolmogorov Smirnov statistical test (KS test). The remaining columns arelabeled according to the probability level at which the risk measures are computed.

We observe that within-sample risk measures (95%) are insensitive to the modelselected. For probability level P = 99%, all parametric fits predict essentially thesame risk measures, except for the normal one, which severely underestimates bothVaR and Shortfall. This tendency becomes marked for higher probability levels.Beyond this probability level, data are scarce and sample-derived measures shouldnot be trusted.

Page 336: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

328 Alberto Suarez

For edge-of-sample probability levels P = 99.9 % and beyond, whether the asymp-totic decay is algebraic or exponential is of some consequence. Shortfall is especiallysensitive to this issue. We observe that the model with a mixture of two Gaussiansand the Pareto fit with u = 1 predict fairly consistent risk measures. The hyperbolicmodel, with fast decaying exponential tails displays excellent agreement for the bodyof the distribution but predicts thinner tails than observed. Much higher values forthe risk measures are predicted by the Pareto fit with u = 2.25, which shows slowalgebraic decay. The model fit with three Gaussians lies somewhere between.

Table 1: Comparison between different measures of VaR

KS test 95% 99% 99.9% 99.99%Sample 1.58 2.48 4.34 5.11GM1 0.12 1.60 2.29 3.08 3.72GM2 0.88 1.54 2.53 4.25 5.63GM3 0.99 1.58 2.46 4.41 6.86HYP 0.99 1.59 2.57 3.91 5.30

GP (u = 1) 0.78 1.57 2.63 4.18 5.78GP (u = 2.25) 0.96 * 2.45 4.16 8.34

Table 2: Comparison between different measures of Shortfall

KS test 95% 99% 99.9% 99.99%Sample 2.19 3.16 4.81 5.22GM1 0.12 2.02 2.64 3.36 3.97GM2 0.88 2.16 3.27 4.86 6.13GM3 0.99 2.17 3.21 5.51 7.69HYP 0.99 2.20 3.13 4.49 5.80

GP (u = 1) 0.78 2.23 3.30 4.87 6.50GP (u = 2.25) 0.96 * 3.21 5.98 12.79

Page 337: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Risk Assessment and Extreme Value Theory in Finance 329

References

[1] P. Jorion. Value at Risk: The new Benchmark for Controlling Market Risk.McGraw-Hill, New York, 1997.

[2] P. Artzner, F. Delbaen, J.-M. Eber, and D. Heath. Thinking coherently. Risk10 (1997), no. 11, pp. 68–71.

[3] P. Embrechts, S. Resnick, and G. Samorodnitsky. Living on the edge. Risk(January 1998), pp. 96–100.

[4] J. Hull and A. White. Value at risk when daily changes in market variables arenot normally distributed. Journal of Derivatives 5 (1998), no. 3, pp. 9–19.

[5] E. Eberlein and U. Keller. Hyperbolic distributions in finance. Bernoulli 1(1995), pp. 281–299.

[6] J. H. McCulloh. Financial Applications of Stable Distributions, in StatisticalMethods in Finance, Handbook of Statistics Vol. 14. G.S. Maddala and C. R.Rao eds. North Holland, NY, 1996.

[7] P. Embrechts, C. Kluplelberg, and T. Mikosch. Modelling Extremal Events forInsurance and Finance. Springer-Verlag, Berlin, 1997.

[8] J. Danielsson, P. Hartmann, and C. de Vries. The cost of conservatism. Risk(January 1998), pp. 101–103.

[9] W. Press, W. T. Teukolsky, S. A. Vetterling, and B. Flannery. Numerical Recipesin C: The Art of Scientific Computing. Cambridge Univ. Press, Cambridge, 1993.

[10] P. Artzner, Delbaen F., J.-M. Eber, and D. Heath. Coherent measures of risk.Mathematical Finance 9 (1999), no. 3, pp. 203–228.

[11] J. Hull and A. White. Evaluating the impact of kurtosis and skewness on deriva-tive prices. NetExposure 3 (1997), pp. 81–90.

[12] J. D. Hamilton. A quasi-bayesian approach to estimating parameters for mixturesof normal distributions. Journal of Business and Economic Statistics 9 (1991),no. 1, pp. 27–39.

[13] U. Kuchler, K. Neumann, M. Soerensen, and A. Streller. Stock returns andhyperbolic distributions. Sonderforschungsbereich 373, Humboldt-Universtat zuBerlin, (23): 1–18, 1994.

Alberto SuarezETS de Informatica

Universidad Autonoma de MadridCiudad Universitaria de Cantoblanco

28049-Madride-mail: [email protected]

Page 338: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM
Page 339: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion y medicion de riesgo

de pasivos bancarios sin

vencimiento definido

Jesus M. Tarriba Unger1

Resumen

En el contexto de la gestion del riesgo de mercado de activos y pasivos enel balance de bancos comerciales, se presenta el problema de valuar y medirla sensibilidad ante movimientos de las tasas de interes de los instrumentos decaptacion que no tienen un vencimiento contractual definido. Como ejemplo sepuede citar el caso de cuentas de ahorro y de cheques, en las que el cliente tienela opcion de retirar el dinero cuando ası lo desee, opcion por la que normalmentepaga un costo de oportunidad al recibir rendimientos por debajo de los ofrecidosen el mercado de dinero. Existen diversas propuestas metodologicas, enfocadasprincipalmente al sistema bancario norteamericano, que buscan sustentar sobrebases mas solidas el tratamiento de los pasivos sin vencimiento definido. Losmodelos parten de ajustes econometricos para describir la dependencia del ni-vel de los saldos con las tasas de interes de mercado y el rendimiento de lascuentas, que se complementan con formalismos desarrollados en el contexto dela valuacion de derivados de tasa de interes. En este documento se presentael formalismo y resultados teoricos de un modelo que ilustra el tipo de acerca-mientos encontrados en la literatura sobre el problema de estimar la duracionefectiva de pasivos sin vencimientos. El objetivo es dar un idea general de lariqueza de comportamiento a que dan lugar este tipo de modelos, con todas lassimplificaciones de la realidad que presuponen.

1 Introduccion

En el contexto de la gestion del riesgo de mercado de activos y pasivos en el balancede bancos comerciales, se presenta el problema de valuar y medir la sensibilidad antemovimientos de las tasas de interes de los instrumentos de captacion que no tienenun vencimiento contractual definido. Como ejemplo se puede citar el caso de cuentasde ahorro y de cheques, en las que el cliente tiene la opcion de retirar el dinerocuando ası lo desee, opcion por la que normalmente paga un costo de oportunidadal recibir rendimientos por debajo de los ofrecidos en el mercado de dinero. Esta

1Jesus M. Tarriba Unger trabaja en el area de Riesgo de Mercado Global del Banco SantanderCentral Hispano. Esta charla se impartio en la sesion del Seminario MEFF-UAM de septiembre de1999.

Page 340: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

332 Jesus M. Tarriba

“prima” representa un contribucion importante al margen financiero de los bancoscomerciales, ajustado desde luego por los costos derivados del servicio de las cuentas.Asimismo, el banco se reserva la opcion de reducir los rendimientos e inclusive aplicarcomisiones de manejo de cuenta en el caso en que movimientos a la baja en el nivelgeneral de las tasa de interes reduzca el margen de intermediacion.

Debido a la dificultad de modelar y cuantificar estos efectos, es practica comun obien ignorar total o parcialmente este tipo de pasivos al agregar la estructura de ven-cimientos del balance, o bien asignarles de forma arbitraria una estructura de plazossin un analisis que lo sustente (ver p.e. [12]). Sin embargo, existen diversas propues-tas metodologicas enfocadas principalmente al sistema bancario norteamericano y quebuscan sustentar sobre bases mas solidas el tratamiento de los pasivos sin vencimientodefinido, [1], [2], [5], [7], [8], [10], [11]. Todos los acercamientos parten de modelar dosaspectos esenciales al problema:

(a) Para el caso de cuenta remuneradas, la relacion entre las tasas de referencia yla tasa o costo que los bancos comerciales pagan a los clientes.

(b) El comportamiento de los volumenes o saldos de las cuentas en el tiempo y surelacion con el comportamiento de las tasas de interes de mercado de referenciay el rendimiento pagado por las cuentas.

Los modelos combinan ajustes econometricos de las variables arriba mencionadascon formalismos desarrollados en el contexto de la valuacion de derivados de tasa deinteres, en los cuales el valor presente de un instrumento se calcula promediando elvalor presente de los flujos de efectivo futuros bajo cierta distribucion de probabilidadpara la evolucion estocastica de las estructura de los tipos de interes. Los parametrosde la distribucion de probabilidad usada se deben calibrar para que sea consistentecon el la estructura de tipos y sus volatilidades a la fecha de valuacion, aplicandoargumentos de no-arbitraje, [6], [9].

En este documento se presenta el formalismo y resultados teoricos de un modeloque ilustra el tipo de acercamientos encontrados en la literatura sobre el problema deestimar la duracion efectiva de pasivos sin vencimientos. El objetivo es dar un ideageneral de la riqueza de comportamiento a que dan lugar este tipo de modelos, contodas las substanciales simplificaciones de la realidad que presuponen. En la practica,las dificultades reales se encuentran al tratar de ajustar los modelos a datos empıricos,generalmente de corto alcance historico y contaminados por multiples factores que elmodelo no considera, lo que convierte el analisis en una labor casi artesanal de trata-miento caso por caso que se debe complementar con supuestos economicos razonables.

En la seccion 2 se describe una version simplificada de balance a partir del cual seconstruye el modelo. En la seccion 3 se describe el tratamiento estatico del problema,el cual se sofistica en la seccion 4 donde se presenta la version dinamica. Finalmenteen la seccion 5 se presentan los resultados de un ejemplo ilustrativo y se comentan losresultados.

Page 341: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion y riesgo de pasivos bancarios sin vencimiento definido 333

2 Modelo de balance

En la tabla 1 se representa de forma muy esquematica el balance de un banco co-mercial. El banco capta recursos financieros a diversos plazos y costos que se colocanen el lado de los activos segun las lıneas de negocio que gestione. Los activos gene-ran un rendimiento bruto normalmente por arriba del costo financiero incurrido enfinanciarlos. A la diferencia entre el rendimiento de los activos y el costo financierode los pasivos es lo que se conoce como el margen financiero del banco. Este margenfinanciero, neto de costos operativos y comisiones, representa una fuente importantea los ingresos de un banco comercial.

En particular, una parte de los recursos pueden ser canalizados a otorgar prestamosa empresas y particulares, asumiendo el riesgo de credito aparejado y por lo que elbanco cobra una sobretasa sobre el nivel de los tipos “libres de riesgo”, por los que seentiende el rendimiento pagado por deuda gubernamental o prestamos colateralizadosal 100%.

ACTIVOS PASIVOS

Mercado interbancario Mercado interbancarioCartera Crediticia Depositos Clientes Plazo FijoInversiones Varias Depositos Clientes sin vencimiento definido

Activos Fijos Deuda Largo PlazoCapital

Tabla 1: Esquema de hoja de balance de banca comercial.

Otra fuente importante de margen financiero, relevante para los fines del presen-te analisis, proviene de la captacion de recursos por abajo del tipo libre de riesgo,tıpicamente a traves de depositos de clientes, que pueden ir desde instrumentos aplazo hasta cuentas de cheques y de ahorro sin vencimiento definido. Como nuestrointeres es precisamente estimar de alguna forma la contribucion de este grupo de pa-sivos al riesgo de tasa de interes del balance, se construye un balance simplificado quese ilustra en la siguiente tabla:

ACTIVOS PASIVOS

Mercado interbancario Depositos Clientes sin vencimiento definido

Tabla 2: Esquema de hoja de balance simplificada.

En el modelo simplificado de banco, al tiempo t = 0 se recibe un ingreso D0 en unacuenta de ahorro o de cheques. El banco invierte al corto plazo el dinero en el mercadointerbancario, y hace lo propio con cualquier nuevo ingreso que reciba en el futuro,

Page 342: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

334 Jesus M. Tarriba

retirandolo cuando se requiera liquidar a los clientes. Los nuevos ingresos/retiros yel pago de intereses en las cuentas y en el marcado de dinero se efectua en intervalosregulares de tiempo ∆t. Denotamos por rt el rendimiento interbancario al tiempo t,st el rendimiento o costo de las cuentas y Dt el saldo de las mismas al principio delperiodo (t, t + ∆t). Entonces, los flujos de caja al tiempo t son2:

Activo (Mercado de Dinero): Cat = (Dt − Dt−1) + Dt−1 rt−1 ∆t

Pasivo (Cuentas de Ahorro) : Cpt = −(Dt − Dt−1) − Dt−1 st−1 ∆t

Neto: ∆Ct = Dt−1 (rt−1 − st−1)∆t

En las dos primera ecuaciones, el primer termino corresponde al flujo proveniente delincremento (o decremento) neto en el saldo de las cuentas. Como el banco invierte(retira) de la cuenta de los activos cualquier ingreso (egreso) realizado en la cuenta delos pasivos, el flujo neto debido al cambio en los saldos se cancela. Por tanto, el flujogenerado en cualquier intervalo futuro depende solo del nivel de los saldos al principiodel intervalo y del diferencial entre la tasa interbancaria y el costo de las cuentas. Enel balance simplificado de banco, la unica fuente de ingresos es el margen financieropositivo neto de costo operativo, cuyo valor presente determina el valor teorico delbalance.

3 Tratamiento estatico

Supongase primero que en fecha de valuacion (t = 0) tanto los tipos de interes decorto plazo como el costo de las cuentas y los saldos se conocen de antemano paratodo tiempo futuro. En este caso, los flujos del balance simplificado descrito arribaestan a su vez predeterminados y en el lımite continuo su valor presente esta dadopor

V =∫ ∞

0

Dt (rt − st) e−Zt t dt , (1)

donde Zt es el rendimiento anualizado a t = 0 de un bono cupon cero que vence alplazo t. Por argumentos de arbitrajes, a tasas deterministas las tasas cupon cero yde corto plazo futuras deben cumplir la relacion:

e−Zt t =∫ t

0

e−rs s ds . (2)

A continuacion se examinan varios casos lımites, suponiendo por simplicidad unaestructura de tasas de interes planas, i.e., Zt = rt = t para toda t.

2Si existen requerimientos de encaje o reservas exigidos por las autoridades supervisoras, solouna porcion de los depositos podran ser invertidos a tasa interbancaria, en cuyo caso el termino delrendimiento se multiplica por la fraccion restante, p.e., 0.9 si el encaje es del 10%.

Page 343: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion y riesgo de pasivos bancarios sin vencimiento definido 335

3.1 s < r constante, independiente de r y saldo constante D

En este caso los pasivos se tratan como una perpetuidad. El valor del balance estadado por

V =∫ ∞

0

D [r − s] e−rt = D[1 − s

r

]. (3)

El valor del pasivo es, simplemente,

VP = −Ds

r, (4)

y por tanto su sensibilidad 1% y duracion modificada estan dadas por:

ρ1% = 0.01dVP

dr= 0.01D

s

r2, (5)

TP = − 1VP

dVP

dr=

1r

. (6)

Para tasas del 6% se estarıa hablando de una duracion modificada de casi 17 anos.Sin embargo, para fines de la gestion de riesgo de mercado, el plazo relevante esaquel al que se deben invertir los activos si se quiere tener un balance inmunizadoante pequenos desplazamientos en el nivel de las tasas de interes. Para obtener esteplazo, supongase que el banco invierte el dinero del deposito a cierto plazo T en uninstrumento que genera rendimientos a tasa r en composicion continua, de forma queel valor inicial de los activos esta a la par y la duracion modificada del activo esprecisamente T . El valor del balance de nuevo esta dado por la ecuacion (3), pero eneste caso la sensibilidad 1% de valor de balance es:

ρ1%(T ) = −0.01D0

[T − s

r2

]. (7)

Por tanto, el plazo al que el banco debe invertir el deposito para obtener un balanceneutral a pequenos movimientos en la tasa es:

Tρ1%=0 =s

r2=

s

r

1r

=s

rTP . (8)

De lo anterior se deduce que la duracion modificada que deben tener los activos paraneutralizar el riesgo de tasa de interes no es igual a la duracion de la perpetuidad, sinoa esta ultima escalada por la razon entre el costo de la cuenta y la tasa interbancaria.Por ejemplo, con niveles de tasas de 6%, si una cuenta se puede considerar como unaperpetuidad con costo fijo del 1%, el plazo en que habrıa de invertir los activos paracancelar el riesgo de tasa de interes resulta del orden de (.01/.06)/(.06) = 2.8. Estopuede sonar paradojico, en la medida en que existe la inclinacion a pensar que el tenerfinanciamiento barato al muy largo plazo implica que se puede invertir al muy largoplazo sin incurrir en riesgo de tasa de interes. Esto es cierto en cuanto al riesgo devariaciones en margen futuro, pero no en cuanto al valor presente de dicho margen,que a final de cuentas determina la contribucion al valor economico del balance de lascuentas sin vencimiento.

Page 344: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

336 Jesus M. Tarriba

3.2 s flota con r de forma que s = k r, para cierta constantek < 1, y saldo constante D

En este caso, el valor del banco esta dado por:

V =∫ ∞

0

D0 [r − k r] e−r t dt = D0 [1 − k] , (9)

con V p = −k D0 independiente de r, por lo que la sensibilidad puntos basicos yduracion en este caso son cero tanto en el pasivo como en el activo.

3.3 s constante, saldos dependientes de las tasas de interes

Ahora considerese el caso en que el saldo de los depositos depende de la tasa r deacuerdo a la ecuacion

D0 ≈ w rα . (10)

La constante α se puede interpretar como la elasticidad de los saldos de las cuentasante movimientos en el nivel de la tasa de interes y es tal que, para cambios pequenosen r, se cumple que

∆D0

D0≈ α

∆r

r. (11)

La ecuacion (10) es la relacion de equilibrio en el largo plazo que se asume en variosde los modelos analizados en la literatura, sobre los que se volvera mas adelante.Por ahora baste para ilustrar la contribucion a la sensibilidad 1% que proviene de laelasticidad de los saldos respecto al nivel de las tasas de interes. En efecto, para elcaso de costo constante, la sensibilidad total del valor del balance esta dada por laexpresion

ρ1% = 0.01(

∂D0

∂r

[1 − s

r

]− D0

[T − s

r2

]). (12)

Asumiendo que se cumple la ecuacion (10),

∂D0

∂r= α w rα−1 =

α

rD0 , (13)

y se obtiene, sustituyendo en la ecuacion (12),

ρ1% = 0.01D0

r

[1 − s

r

]−

[T − s

r2

]), (14)

de donde inmediato obtener el plazo efectivo de inversion de los activos tal que lasensibilidad 1% del balance se anule:

Tρ1%=0 =α

r

[1 − s

r

]+

s

r2=

[1 − s

r

]+

s

r

)TP . (15)

En la ecuacion anterior, ademas de la correccion sobre la duracion de la perpetuidadobtenida anteriormente, se tiene un termino adicional que proviene de la constanteα que determina la dependencia del nivel de los saldos respecto al nivel de las tasade interes. Como en general s < r, entonces el efecto de α < 0 es reducir el plazoefectivo. Con r = 6%, s = 1% y α = −0.1 se tiene Tρ1% = 1.4, aproximadamente.

Page 345: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion y riesgo de pasivos bancarios sin vencimiento definido 337

3.4 Formula general

Las expresiones anteriores se puede generalizar de forma directa para el caso en queel tanto el volumen de las cuentas como el costo dependen de forma arbitraria de r,aunque r en sı sigue siendo tratada como variable determinista. En este caso, lasexpresiones para el valor siguen siendo igual a (1), pero se tienen contribuciones adi-cionales en la sensibilidad. Por ejemplo, la sensibilidad 1% de los pasivos se convierteen

ρ1% = −0.01d

dr

[D(r)

s(r)r

]= −0.01

[s

r

dD(r)dr

+D(r)

r

ds(r)dr

+D(r)s

r2

]. (16)

En la medida en que las observaciones empıricas de un conjunto de cuentas en parti-cular se puedan adecuar a alguno de los casos sencillos considerados, el tratamientode las cuentas se simplifica enormemente.

4 Tratamiento dinamico

Como ya se menciono, determinar la relacion del volumen con las tasas de interes esun problema complejo, que por lo general involucra asumir una forma funcional concierto numero de parametros libres, que se ajustan para tratar de reproducir los datosempıricos lo mejor posible. A continuacion se describe los formalismos desarrolladosen las referencias [7] y [11], que ilustran la idea basica detras del tipo de modelosusados.

4.1 Modelos para el volumen: cuentas no remuneradas

Se parte de suponer que, a un valor dado de todos los demas factores que inciden enel comportamiento de los volumenes, existe un nivel de equilibrio Deq proporcional acierta potencia α de la tasa de interes r, de forma que

Deqt = kt rα

t , (17)

que se expresa alternativamente en forma logarıtmica:

ln (Deqt ) = ln (kt) + α ln (rt) . (18)

Dado que r y los demas factores incluidos en la funcion k(t) estan en constantemovimiento, D(t) en general se encontrara fuera de su nivel de equilibrio y por tantosu dinamica al corto plazo estara dominada por la tendencia a regresar a dicho nivel.Esto se expresa en la ecuacion siguiente:

ln (Dt+1) − ln (Dt) = −κ (ln (Dt) − ln (Deqt )) , (19)

para cierta κ > 0. De acuerdo a la ecuacion (19), si el nivel de los saldos esta porarriba de su valor de equilibrio Deq, la evolucion temporal tendera a revertir a Deq.

Page 346: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

338 Jesus M. Tarriba

Introduciendo (19) en (18) y definiendo los parametros

γ0 = 1 − κ , (20)γ1 = κα = (1 − γ0)α , (21)Xt = κ ln (kt) , (22)

se obtiene la siguiente ecuacion lineal en los logaritmos de los volumenes y la tasa:

ln (Dt+1) = γ0 ln (Dt) + γ1 ln (rt) + Xt , (23)

donde se incluyen en Xt todas las variables no relacionadas con las tasas de interes quepudiesen influir en el nivel de los saldos, tales como factores estacionales, tendencia,etc.

Los parametros relevantes en la ecuacion (23) son γ0 y γ1, que gobiernan la de-pendencia de Dt respecto a la tasa de interes y su velocidad de reversion al equilibrio.En el corto plazo, la elasticidad de los saldos a movimientos en las tasas esta dada porla constante γ1, mientras que, en el largo plazo, lo esta por la constante α definida enla ecuacion (17) y que se puede obtener a partir de γ0 y γ1 como

α =γ1

1 − γ0. (24)

4.2 Modelo para el volumen: cuentas remuneradas

Se procede en las mismas lıneas que en la argumentacion anterior, con la diferencia deque, en este caso, el nivel de saldos de equilibrio se asumen dados por una expresionde la forma:

Deqt = F (rt , st) ; (25)

i.e., el saldo de equilibrio depende adicionalmente del rendimiento st que paga lacuenta. Por ejemplo, si se asume que la relacion es de la forma3

Deqt = kt rα1

t sα2t , (26)

se llega, procediendo como en el caso anterior, a la siguiente ecuacion:

ln (Dt+1) = γ0 ln (Dt) + γ1 ln (rt) + γ2 ln (st) + Xt . (27)

Una vez especificado el modelo para determinar la evolucion de los saldos dada laevolucion de las tasas de interes y el rendimiento de las cuentas, se procede a modelarla relacion funcional entre dichas variables.

3La relacion funcional supuesta entre saldos y tasa varia segun el autor. Puede incluir mas omenos terminos de retraso (lags) y puede o no ser lineal en los logaritmos de las diferentes variables.

Page 347: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion y riesgo de pasivos bancarios sin vencimiento definido 339

4.3 Modelo para comportamiento del costo de las cuentas co-mo funcion de las tasas interbancarias

Para modelar el comportamiento del costo de las cuentas en la simulacion, seguimosla lınea de argumentacion de las referencias [5] y [8]. Se asume que existe un nivel derendimiento de las cuentas de equilibrio, esto es, el nivel al que tenderıa el costo a unnivel de tasa de mercado con todas las demas variables constantes. Este rendimientode equilibrio se asume compuesto de una parte fija y una flotante:

s∗t = a1 rt + a0 . (28)

En un mercado con competencia perfecta y donde los clientes actuan eficientemente,a1 estarıa dado por la proporcion de reservas requeridas a los bancos, y a0 por loscostos no financieros de la gestion de las cuentas. En la practica, efectos de monopolioy de comportamiento de la base clientes se traducirıa en valores diferentes para estasconstantes4.

Al igual que en el caso de los saldos, la dinamica de corto plazo del rendimientode las cuentas esta gobernada por la tendencia a regresar a su valor de equilibrio. Sinembargo, una diferencia importante es que en este caso se introduce la posibilidad deuna asimetrıa entre la velocidad de reversion segun los rendimientos esten por arribao por abajo de su valor de equilibrio, por lo que en la ecuacion dinamica se introducendos constantes segun el caso:

st+1 − st = −β+ (st − s∗t ) Θ (st − s∗t ) − β− (st − s∗t ) (1 − Θ(st − s∗t )) + Xt , (29)

donde Xt representa todas las demas variables que pudieran impactar el nivel de loscostos y Θ(x) es la funcion escalon de Heaviside, definida como:

Θ (st − s∗t ) =

1 , si st ≥ s∗t ,

0 , si st < s∗t .(30)

De acuerdo a la ecuacion (30), si el costo financiero se encuentra por arriba de suvalor de equilibrio, revierte a este con velocidad β+; pero si se encuentra por debajo,lo hace con velocidad β−. Esta asimetrıa se observa en la practica y se debe a ladisparidad con la que reaccionan ante los movimientos de tasas los tenedores de lascuentas y los bancos. Este comportamiento se ilustra en las graficas 1 y 2. En ellasse aprecia el efecto de disminuir el valor del parametro β+ de un valor de 0.2 a 0.05.Cuanto menor sea el valor del parametro, mas lenta es la respuesta de la variablecosto, pareciendose mas las cuentas remuneradas a un instrumento de tasa fija. Enambas simulaciones se utiliza el mismo parametro para reversion, β− = 0.5, que lohace revertir rapidamente a su valor de equilibro en escenarios de tasas a la baja.

4Ver p.e. la referencia [1].

Page 348: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

340 Jesus M. Tarriba

Grafica 1: Simulacion tasa y rendimiento de cuentas: β+ = 0.2, β− = 0.5

Grafica 2: Simulacion tasa y rendimiento de cuentas: β+ = 0.05, β− = 0.5

Page 349: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion y riesgo de pasivos bancarios sin vencimiento definido 341

Como en el caso de los saldos, para proceder hay que introducir la relacion deequilibrio en la ecuacion dinamica (30) y aplicar algun algoritmo de ajuste para esti-mar los parametros a partir de la serie historica que se quiera analizar. Dado el valordel rendimiento de las cuentas de acuerdo al modelo, el costo total estara dado porla expresion:

ct = st + cNF , (31)

donde se introduce la constante cNF , que representa el costo no financiero de lavariable, que incluirıa todos los costes variables (i.e., por unidad de saldo en cuenta)asociados al manejo de las cuentas no incluidos en el rendimiento que pagan.

4.4 Modelo para la evolucion de las tasas de interes

De acuerdo a la teorıa moderna de valuacion de activos financieros5, la forma apropia-da de valuar instrumentos de renta fija con pagos contingentes es calcular el valor es-perado de todos los flujos futuros, utilizando una distribucion de probabilidad neutralal riesgo consistente con la estructura de tasa de interes y volatilidad prevalecientes.

Denotando por E(∗) el operador de valor esperado bajo dicha probabilidad, laexpresion general para el valor de nuestro banco simplificado es

V = E

(∫ ∞

0

D(rt) (rt − ct) e−∫ t0 rk dk dt

). (32)

El termino dentro del operador de valor esperado representa el valor presente de todoslos flujos futuros del banco para cada posible trayectoria de la tasa de corto plazo rt.El operador de valor esperado indica que para obtener el valor del banco se tiene quetomar un promedio de los flujos descontados sobre todas las trayectorias futuras.

En un esquema de simulacion Monte Carlo (que se adopta en el presente trabajo),las trayectorias se generan a partir de asumir un modelo estocastico para las tasas deinteres. Un modelo de uso comun por su sencillez es el de Cox-Ingersoll-Ross (CIR),en el cual los cambios en la tasas de interes en tiempos pequenos estan gobernadospor la expresion

dr = k (rm − r) dt + σ r1/2 dZ , (33)

donde dZ es una variable estocastica que sigue una distribucion normal con mediacero y varianza dt. Los parametros k, σ y rm se estiman a partir de la estructura detasas de mercado a fecha de valuacion y su serie historica.

5Ver, p.e., la referencia [9].

Page 350: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

342 Jesus M. Tarriba

4.5 Simulacion Monte Carlo

Una vez determinados los parametros para controlan la dinamica de las tasas de interesy de los saldos en el tiempo, se procede a realizar la simulacion Monte Carlo, donde sebusca aproximar numericamente la esperanza del valor presente de las cuentas. Comoplazo de la simulacion se toman usualmente 30 anos, para un total de 360 meses, siendoun mes el intervalo discreto fijado para la evolucion de las variables. Sin embargo,en los resultados presentados en la siguiente seccion se utilizo un horizonte de 1000meses, que equivale para todo fin practico a suponer un balance de alcance perpetuo.

Para cada periodo se generan las trayectorias de tasas mediante la ecuacion

ri+1 = ri + k (rm − ri)112

+ σ r1/2i N(1, 0)

1√12

, (34)

donde N(1, 0) representa numeros aleatorios generados de acuerdo a una distribucionnormal estandar. Para cada posible trayectoria j, se genera el comportamiento de lossaldos de acuerdo a la ecuacion (23) o (27), segun las cuentas sean o no remuneradas,los costos financieros de acuerdo a la ecuacion (29) y se calculan los flujos correspon-dientes, que a su vez son descontados sobre la misma trayectoria seguida por las tasas.La contribucion al valor presente bajo la trayectoria j-esima esta dada por

V j0 =

1000∑t=1

112

Dt,j (rt,j − st,j − cNF )(1 + r1,j/12) (1 + r2,j/12) · · · (1 + rt,j/12)

, (35)

y el valor teorico del banco es

V0 =1N

N∑j=1

V j0 , (36)

donde N es el numero de escenarios Monte Carlo generados. Para calcular la sensi-bilidad a puntos basicos del balance, se desplazan los escenarios un punto basico y serecalcula el valor esperado dado por la ecuacion (36). Dada la sensibilidad 1 puntobasico se puede derivar la duracion efectiva de los activos en los que hay que invertirel saldo de los depositos para obtener la misma sensibilidad estimada:

Tef ≈ − 104

D0 N

N∑j=1

[V j

1pb − V j0

]. (37)

Page 351: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion y riesgo de pasivos bancarios sin vencimiento definido 343

5 Ejemplo

A continuacion se presentan resultados obtenidos a partir de un ejemplo sencillo, queda una idea del efecto de variar tres de los principales parametros del modelo. Lastasas de interes a corto plazo r se fijan en un 6% y la remuneracion inicial de lascuentas s en 3%, y se asume que en equilibrio s = 0.5 r. La velocidad de reversion ala media en el modelo CIR se fija en 0.3 y se considera el caso en que el nivel de lossaldos en equilibrio depende solo de las tasas de interes interbancarias, fijando en 0.5el parametro γ0 en la ecuacion (23). Se examinan los siguientes casos:

(a) Asumiendo un rendimiento de las cuentas estrictamente fijo (i.e., β+ = β− = 0en la ecuacion (29)), se calcula el plazo efectivo variando la elasticidad de cortoplazo de los saldos frente a movimientos a la tasa de interes (la constante γ1 enla ecuacion (23)).

(b) Lo mismo que en el caso (a), pero considerando la opcion del banco de revisarlos costos a la baja cuando las tasas bajan tanto que el margen financiero tiendea cero. En el ejemplo mostrado se asume simplemente que la revision se llevaa cabo en caso de que el margen se reduzca a cero, de forma que si r < 3%,entonces s = r. Esto implica que en la region r < 3% las cuentas se comportancomo un instrumento a tasa flotante.

(c) Asumiendo saldo constante, independiente de la tasa de interes (γ1 = 0), se cal-cula el plazo efectivo variando la velocidad de ajuste entre tasa y el rendimientode las cuentas, las constantes β+ y β− de la ecuacion (29), que para fines delejemplo se asumen iguales.

(d) Lo mismo que en el caso (c), pero considerando la opcion del banco de revisarlos costos a la baja cuando las tasas bajan tanto que el margen financiero tiendea cero, opcion que se trata como en el caso (b).

En la grafica 3 se presentan los resultados para el caso (a), variando la constanteγ1 entre 0 y -0.18 para volatilidades CIR entre 0 y 6%. Para el caso de volatilidadesanalizadas entre 0 y 4% CIR (del orden de 100 puntos basicos en terminos absolutos y16% en relativos para el ejemplo considerado), el efecto del caracter estocastico de lastasas de interes es mınimo. El comportamiento de las duracion efectiva como funcionde la elasticidad negativa de los saldos sigue un patron monotono decreciente, comoera de esperarse de la ecuacion (15) derivada en el analisis estatico. Para volatilidadesmayores se incrementa el plazo efectivo, pero el orden de magnitud y comportamientocualitativo se mantiene. El aumento en la duracion para volatilidades altas conformeaumenta la elasticidad negativa de los saldos se puede entender considerando que suefecto es reducir la contribucion relativa de los escenarios de tasas a la alza respectoal lımite de volatilidad cero, aumentando la contribucion de los escenarios a la baja.Como estos ultimos descuentan a tasas menores, se traducen en duraciones efectivasmayores, todo lo demas constante.

Page 352: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

344 Jesus M. Tarriba

En la grafica 4 se presentan los resultados correspondientes al caso (b), introdu-ciendo en el modelo la opcion del banco de revisar a la baja los rendimientos cuando elmargen se hace negativo. De nuevo, para volatilidades moderadas las cosas cambianpoco, pero ahora para volatilidades entre 4 y 6% se observa una reduccion drasticaen la duracion efectiva conforme la volatilidad aumenta, llegando a tomar inclusivevalores negativos. El efecto de las volatilidades altas es poblar de escenarios la zonaen que se activa la opcion de banco, en la que las cuentas se comportan fundamental-mente como un instrumento a tasa flotante, i.e., de duracion cero. Para volatilidadessuficientemente altas, el efecto de la opcion de banco es tal que invierte el signo dela sensibilidad, lo que se traduce en duraciones efectivas negativas para el balancesimplificado.

En la grafica 5 se presentan los resultados para el caso (c), a saldo constante,variando la velocidad de ajuste anualizada de la tasa y el rendimiento de las cuentasentre 0 y 0.45, sin considerar la opcion de banco. En este caso el efecto de la volatilidades nulo, observandose el mismo patron decreciente conforme el instrumento se asemejamas a un instrumento de tasa flotante. La duracion efectiva pasa de su valor derendimiento fijo (8.33 anos aproximadamente) a un valor alrededor de 1 ano para12β+ = 12β− = 0.45. Esto se puede entender si se piensa que una velocidad dereversion anualizada del orden de 0.5 implica un tiempo medio de repreciacion delrendimiento del orden de 2 anos. Como adicionalmente se tiene que en este caso elpasivo esta aproximadamente a 50% de su valor par, el plazo efectivo al que se debeninvertir los saldos para neutralizar la sensibilidad del balance simplificado se situaalrededor de 1 ano.

En la grafica 6 se presentan los resultados para el caso (d), a saldo constante,variando la velocidad de ajuste anualizada de la tasa y el rendimiento de las cuentasentre 0 y 0.45, pero ahora incluyendo la opcion del banco. De nuevo, el efecto de laopcionalidad modifica significativamente la duracion efectiva para volatilidades altas,pero en contraste con el caso anterior, las duraciones para las diferentes volatilida-des convergen conforme la velocidad de ajuste crece. Esto es de esperar, dado queconforme la relacion entre el rendimiento y la tasa de interes se parece mas al de unflotante, el efecto de la opcionalidad disminuye.

Page 353: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion y riesgo de pasivos bancarios sin vencimiento definido 345

Grafica 3: Plazo efectivo vs elasticidad de corto plazo para diferentes volatilidadesCIR. Caso sin opcion del banco

Grafica 4: Plazo efectivo vs elasticidad de corto plazo para diferentes volatilidadesCIR. Caso con opcion del banco

Page 354: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

346 Jesus M. Tarriba

Grafica 5: Plazo efectivo vs velocidad de ajuste tasa-rendimiento para diferentesvolatilidades CIR. Caso sin opcion del banco

Grafica 6: Plazo efectivo vs velocidad de ajuste tasa-rendimiento para diferentesvolatilidades CIR. Caso con opcion del banco

Page 355: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Valoracion y riesgo de pasivos bancarios sin vencimiento definido 347

Referencias

[1] Hutchison, D., Pennachi, G., Measuring Rents and Interest Rate Risk in Imper-fect Financial Markets: The Case of Retail Bank Deposits. Journal of Financialand Quantitative Analysis 31, no. 3, September 1996, P. 339.

[2] Jarrow, R., van Deventer, D., Disease or Cure. Risk 9, no 2, Feb 1996.

[3] Jarrow, R., van Deventer, D., The arbitrage-free valuation and hedging of de-mand deposits and credit card loans. Journal of Banking & Finance 22 (1998)249-271.

[4] Judge, G. et al., The Theory and practice of econometrics. Wiley series in Pro-bability and Mathematical Statistics. John Wiley, 1980.

[5] Moore, G. R. et. al., Modeling the Disaggregated Demands for M2 and M1: TheU.S. Experience in the 1980s. Board of Governors of the Federal Reserve System,1990.

[6] Nefti, Salhi N., Mathematics of Financial Derivatives. Academic Press 1996

[7] O’Brien, James M., Estimating the Values and Interest Rate Risk of Interest-Bearing Transaction Deposits. Board of Governors of the Federal Reserve System,2000.

[8] O’Brien, J., Orphanides, A., Small, D., Estimating the interest Rate Sensitivity ofLiquid Retail Deposits Values. Proceeding of the Bank Structure and Competition1994 conference. p. 400-435. Federal Reserve Bank of Chicago.

[9] Rebonato, R., Interest-Rate Option Models, 2nd ed. Wiley 1996.

[10] Sanyal, Ani, The Core of the Matter (parts I and II). Balance Sheet -Auntum1997 and Winter 1997-98.

[11] Selvaggio, R. D., Using the OAS Methodology to value and hedge commercialbank retail demand deposits premiums, in “The Hand Book of Asset/LiabilityManagement”. Compiled by F. Fabozzi, Irwin 1996.

[12] Uyemura, D., van Deventer, D., Financial Risk Management in Banking pp.188., Irwin 1993.

Jesus M. Tarriba UngerBanco Santander Central Hispano

Paseo de la Castellana 75, p. 628046-Madrid

e-mail: [email protected]

Page 356: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM
Page 357: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Analisis crıtico del mercado

electrico espanol

Rafael de Benito1

Resumen

La liberalizacion del mercado electrico iniciada en espana el 1 de enero de1998 culminara el 1 de enero de 2003 con la posibilidad de que todos los clientespodamos elegir suministrador. Desde hace ya casi cuatro anos, los precios de laelectricidad en el mercado mayorista no estan intervenidos y surge un nuevo ries-go que las empresas electricas deberan gestionar. En este artıculo se resumen loshechos mas relevantes ocasionados por las aprobacion de la Ley 54/97 de 27 denoviembre del Sector Electrico, incidiendo especialmente en el funcionamientodel mercado de contado gestionado por la empresa OMEL. Asimismo, se ha-ce especial hincapie en el desarrollo de instrumentos financieros para le gestiondel riesgo de precio. Por ultimo, se realiza una breve mencion a alguno de losenfoques que han tratado de explicar el comportamiento del precio de la electri-cidad, el cual registro altos niveles de volatilidad motivado, principalmente, porla imposibilidad de poder almacenar esta mercaderıa.

1 Introduccion

La Ley 54/97 de 27 de noviembre representa la piedra angular del proceso de liberali-zacion del mercado electrico espanol. Una de las consecuencias mas importantes de lanueva regulacion es la creacion de un mercado de contado de la energıa electrica, enel que oferta y demanda presentan sus ofertas de venta y adquisicion de electricidadpara el dıa siguiente. En el nuevo marco legal se separan las diferentes actividades degeneracion, comercializacion, transporte y distribucion. Las dos primeras pasan a seractividades liberalizadas sujetas a las fuerzas del mercado, mientras que las otras dosconservan su status de reguladas.

No todos los clientes tienen la posibilidad de acceder al nuevo mercado libre de elec-tricidad, sino que deben registrar un mınimo de consumo anual de energıa electrica.Estos son los llamados clientes cualificados. Estos clientes pueden adquirir la elec-tricidad, bien acudiendo directamente al pool (mercado organizado de contado), biencontratando con un generador, bien a traves de un comercializador o bien mante-niendose con la tarifa. Estas modalidades son, de momento, compatibles entre sı.

1Rafael de Benito es Director de la Division de Energıa de FC&M y responsable del desarrollodel mercado de futuros de electricidad de la Sociedad Rectora del Mercado de Futuros y Opcionessobre Cıtricos. Esta charla se impartio en la sesion del Seminario MEFF-UAM de octubre de 1999.

Page 358: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

350 Rafael de Benito

Los umbrales de consumo para acceder a la categorıa de cualificado se han idoreduciendo paulatinamente de la manera en que se muestra en la tabla adjunta.

Fecha Umbral de consumo anual1998 15 GWh

01/01/99 5 GWh01/04/99 3 GWh01/07/99 2 GWh01/10/99 1 GWh

01/07/2000 1 kV (nivel de tension)

El numero de clientes elegibles el 1 de octubre de 1999 se estima en unos 7.850, cuyoconsumo anual ascenderıa a unos 72.500 GWh (alrededor del 47,5% del total espanol).El valor monetario de este consumo se situarıa en el entorno de los 621.795 millonesde pesetas (3.737 millones de euros).

Un nuevo criterio de elegibilidad para adquirir la condicion de cliente cualificadose establecio con el objeto de que los consumidores conectados a la red a una tensionde 1 kV puedan serlo desde el 1 de julio de 2000. Se estima que la cifra de clientescualificados se situa en unos 68.000, con lo que el grado de apertura traera consigoun escenario de alta competitividad en el ambito de la comercializacion.

En enero del 2007 esta previsto que todos los consumidores puedan librementeelegir suministrador, si bien desde el Ministerio de Industria y Energıa se ha apuntadorecientemente que esa fecha podrıa adelantarse en tres anos como ya ha ocurrido conlos umbrales previos, que en algun caso se ha adelantado en casi 5 anos. Esta fecha hasido modificada por un Real Decreto posterior al cual se hace referencia en un puntoposterior.

Por lo que se refiere a la nueva figura de los comercializadores, estos pueden venderelectricidad a los clientes cualificados debiendo adquirirla previamente en el pool. Son,por lo tanto, una figura que, al igual que productores y clientes cualificados que acudenal pool, esta expuesta al riesgo de precios.

2 Funcionamiento, organizacion y caracterısticas delMercado Mayorista de Electricidad

El mercado mayorista de electricidad esta gestionado por la Companıa Operadora delMercado, OMEL (a partir de ahora pool). En dicho mercado se vende y adquierela energıa electrica para el dıa siguiente. Esto significa, como es comun en todoslos mercados de electricidad, que el contado equivale a que la transaccion debe tenerlugar en D+1. Las transacciones cuya perfeccion tiene lugar en un plazo superior sonconsideradas operaciones a plazo y, en todo caso, en la actualidad OMEL no gestionaun mercado cuyo horizonte temporal rebase el dıa siguiente o day ahead, como seindica en lengua inglesa.

Page 359: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Analisis crıtico del mercado electrico espanol 351

Segun el artıculo 2 del R.D. 2019/97 por el que se organiza y regula el mercadode produccion de energıa electrica,

“El Mercado de Produccion de energıa electrica es el integrado porel conjunto de transacciones comerciales de compra y venta de energıay de otros servicios relacionados con el suministro de energıa electrica.El Mercado de Produccion de energıa electrica se estructura en Mercadodiario y Mercado de servicios complementarios, integrandose tambien enel los contratos bilaterales fısicos. Adicionalmente, existira un mercado deajustes de programacion de caracter intradiario, que se denomina MercadoIntradiario”.

Los agentes que actuan o que pueden actuar en el mercado de electricidad son los quea continuacion se enumeran:

- Productores.

- Distribuidores (mientras subsista la tarifa regulada).

- Comercializadores.

- Agentes externos (compradores y vendedores).

- Consumidores cualificados.

A grandes rasgos, la definicion de cada uno de estos cinco grupos es la siguiente:

- Los productores son las empresas de generacion que vierten electricidad a lared. Pueden vender su energıa al pool o firmar contratos bilaterales fısicos conclientes cualificados.

- Los distribuidores son los responsables de las redes de media y baja tension.Para aquellos consumidores sujetos a tarifa regulada (la mayorıa) el distribuidorhace tambien las veces de comercializador, pues es quien factura por la energıaconsumida.

- Los comercializadores son una figura nueva creada por la Ley Electrica de1997, y son quienes pueden vender a los clientes cualificados. No han de sernecesariamente titualres de la red de distribucion que llega hasta el contadordel cliente final. Con la normativa actual, la unica manera en que puedenadquirir energıa electrica es comprandola en el pool.

- Los agentes externos son aquellas empresas que importan a Espana energıaelectrica desde fuera de nuestras fronteras (vendedores) o que la exportan desdeEspana (compradores).

- Por ultimo, los consumidores cualificados son aquellos que pueden accederal mercado liberalizado, comprando a un comercializador (la practica totali-dad opta por esta posibilidad), acudiendo directamente al pool o acordando uncontrato bilateral fısico con un productor.

Page 360: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

352 Rafael de Benito

El modelo de organizacion del mercado de contado de electricidad se asienta sobre lossiguientes principios:

• Basado en sistema de ofertas de venta y adquisicion.

• El precio se fija por medio de un sistema de subasta en la que se aplica unprincipio de precio marginal.

• Perıodo de programacion: una hora.

• Horizonte de programacion: el dıa siguiente.

• Cierre recepcion de ofertas para D + 1: 10:00 h dıa D.

• Resultados para D + 1: 11:00 h dıa D.

Respecto al perıodo de programacion, esto significa que para cada dıa en que se realizauna sesion de mercado se calculan 24 precios, uno por cada una de las 24 horas deldıa.

Segun el artıculo 8 del R.D. 2019/1997,

“Los agentes del mercado podran presentar ofertas de venta de energıaelectrica para cada perıodo de programacion, en el horario que se establez-ca en las normas de funcionamiento del mercado. Estas ofertas tendrancaracter de compromiso en firme una vez superado el plazo de admisionestablecido. Las ofertas de venta de energıa electrica deberan incluir, almenos, el precio y cantidad ofertada, la identificacion del agente que lasrealiza y la unidad de produccion a que se refiere.”

Por otro lado, el artıculo 9 de ese mismo R.D. reza:

“Los agentes del mercado podran presentar ofertas de adquisicion deenergıa electrica para cada perıodo de programacion, en el horario quese establezca en las normas de funcionamiento del mercado. Estas ofertastendran caracter de compromiso en firme una vez superado el plazo de ad-mision establecido. Las ofertas de adquisicion de energıa electrica deberanincluir la cantidad de energıa demandada, la identificacion del agente yel perıodo de programacion a que se refiere la oferta. Estas ofertas deadquisicion podran incluir tambien precio de la energıa demandada. Eneste caso, si la oferta no resultara casada, de acuerdo con el procedimientoprevisto en el artıculo 10, no se producira suministro de energıa electrica.”

Page 361: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Analisis crıtico del mercado electrico espanol 353

En la Figura 1 se ilustra el proceso inicial que se realiza en el mercado diario.

Figura 1: Proceso inicial que se realiza en el mercado diario

En esta primera fase, cuya responsabilidad en la gestion corresponde al operadordel mercado, deben ser tenidos en cuenta los contratos bilaterales fısicos.

Los contratos bilaterales fısicos vienen regulados por los artıculos 19 y 20 del citadoR.D.. Segun el artıculo 19,

“Los consumidores cualificados o los agentes externos podran forma-lizar con productores o agentes externos contratos bilaterales fısicos desuministro de energıa electrica. [. . . ] Las unidades de produccion que es-tuvieran afectas al cumplimiento de estos contratos quedaran exceptuadasde la obligacion de presentar ofertas en el Mercado de Produccion, por laparte de su energıa generada vinculada al cumplimiento del contrato.”.

Es decir, la energıa electrica se puede negociar en el ambito mayorista entre los agentesindicados, por lo que la obligacion de ofertar la energıa al pool lo es para aquellaenergıa no afecta al cumplimiento de contratos bilaterales fısicos. La cuestion de loscontratos bilaterales fısicos sera de nuevo abordada mas adelante.

Una vez son conocidas por el operador del mercado las unidades y cantidad deenergıa comprometidas en los contratos bilaterales fısicos, y habiendo realizado pre-viamente la casacion de oferta y demanda al pool, se publica el programa base defuncionamiento.

El siguiente paso consiste en la resolucion de las denominadas restricciones tecnicaspor parte del operador del sistema, tal y como aparece en la figura 2.

Page 362: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

354 Rafael de Benito

Figura 2: Incorporacion de las restricciones tecnicas al mercado de contado

Segun el artıculo 12 del R.D 2019/97,

“El Programa Diario Base sera comunicado por el operador del mer-cado a los agentes del mercado y al operador del sistema, quien a la vistadel mismo, determinara las restricciones tecnicas que pudieran afectar asu ejecucion, ası como las necesidades de servicios complementarios a quediera lugar. A los efectos del presente Real Decreto, se entendera por res-triccion tecnica cualquier limitacion derivada de la situacion de la red detransporte o del sistema para que el suministro de energıa electrica puedarealizarse en las condiciones de seguridad, calidad y fiabilidad que se deter-minen reglamentariamente y a traves de los procedimientos de operacion.Para solventar las restricciones tecnicas, el operador del sistema acordaracon el operador del mercado la retirada de la casacion de las ofertas deventa que sean precisas y la entrada de otras ofertas presentadas en dichasesion, respetando el orden de precedencia economica. Las unidades deproduccion que hubieran de entrar en funcionamiento como consecuenciade las citadas restricciones tecnicas, percibiran por su energıa la retribu-cion que corresponda por la oferta que hubieran presentado para aquellosperıodos de programacion en que funcionen. El programa resultante de laincorporacion de estas nuevas transacciones y del resultado del Mercadode servicios complementarios a que se refiere el artıculo 14 se denominaraPrograma Diario Viable y sera comunicado por el operador del sistema aloperador del mercado y a los agentes del mercado. . . ”

Respecto de los servicios complementarios, el artıculo 13 del R.D. mencionado,

“Se entiende por servicios complementarios aquellos que resultan ne-cesarios para asegurar el suministro de energıa electrica en las condicionesde calidad, fiabilidad y seguridad necesarias”.

La asignacion de servicios complementarios no obligatorios se rige tambien por unosprincipios de mercado, pero no son objeto de analisis en este artıculo (ver figura 3).

Page 363: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Analisis crıtico del mercado electrico espanol 355

En cualquier caso, los servicios complementarios representan un componente mas enla composicion del precio final de la electricidad.

Figura 3: Incorporacion de los servicios complementarios al mercado de contado

Asimismo, existe un mercado denominado intradiario, del cual se celebran seissesiones al dıa con diferentes horizontes de programacion. Segun el artıculo 15 delR.D. 2019/97,

“El Mercado intradiario tiene por objeto atender los ajustes que enla oferta y demanda de energıa se puedan producir con posterioridad ahaberse fijado el Programa Diario Viable”.

La tabla 1 muestra la distribucion de horarios de las diferentes sesiones de mercadointradiario, ası como sus diferentes horizontes de programacion.

Sesion 1a Sesion 2a Sesion 3a Sesion 4a Sesion 5a Sesion 6aApertura de sesion 16:00 21:00 01:00 04:00 08:00 12:00Cierre de sesion 17:45 21:45 01:45 04:45 08:45 12:45Casacion 18:30 22:30 02:30 05:30 09:30 13:30Recepcion de desglo-ses

18:45 22:45 02:45 05:45 09:45 13:45

Analisis de restriccio-nes

19:20 23:10 03:10 0:10 10:10 14:10

Recuadre por restric-ciones. PublicacionPHF

19:35 23:20 03:20 06:20 10:20 14:20

Horizonte de progra-macion (periodos ho-rarios)

28 horas(21-24)

24 horas(1-24)

17 horas(8-24)

17 horas(9-24)

13 horas(12-24)

9 horas(16-24)

Tabla 1: Los mercados intradiarios

Page 364: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

356 Rafael de Benito

3 Funcionamiento del mercado diario

De los diferentes mercados que componen el mercado de produccion, sin duda, el masrelevante de todos ellos es el mercado diario, pues representa el porcentaje mayori-tario del precio final de la electricidad. En ella intervienen los agentes que han sidomencionados en los primeros apartados.

Las ofertas economicas de venta de energıa electrica que los vendedores presentenal operador del mercado pueden ser simples o incorporar condiciones complejas enrazon de su contenido. Las ofertas simples son ofertas economicas de venta de energıaque los vendedores presentan para cada periodo horario y unidad de produccion dela que sean titulares con expresion de un precio y de una cantidad de energıa.

Las ofertas que incorporan condiciones complejas de venta son aquellas que, cum-pliendo con los requisitos exigidos para las ofertas simples, incorporan ademas todas,algunas o alguna de las condiciones tecnicas o economicas siguientes:

- Condicion de indivisibilidad.

- Gradiente de carga.

- Ingresos mınimos.

- Parada programada.

La condicion de indivisibilidad permite fijar en el primer tramo de cada hora un valormınimo de funcionamiento. Este valor solo puede ser dividido por la aplicacion delos gradientes de carga declarados por el mismo agente, o por aplicacion de reglas dereparto en caso de ser el precio distinto de cero.

El gradiente de carga permite establecer la diferencia maxima entre la potenciainicio de hora y la potencia final de hora de la unidad de produccion, lo que limita laenergıa maxima a casar en funcion de la casacion de la hora anterior y la siguiente, paraevitar cambios bruscos en las unidades de produccion que no pueden, tecnicamente,seguir las mismas.

La condicion de ingresos mınimos permite la realizacion de ofertas en todas lashoras, pero respetando que la unidad de produccion no participe en el resultado de lacasacion del dıa si no obtiene para el conjunto de su produccion en el dıa un ingresosuperior a una cantidad fija, establecida en pesetas o euros, mas una remuneracionvariable establecida en pesetas o centimos de euro por cada kWh casado.

La condicion de parada programada permite que si la unidad de produccion hasido retirada de la casacion por no cumplir la condicion de ingresos mınimos solicitada,realice una parada programada en un tiempo maximo de tres horas, evitando parardesde su programa en la ultima hora del dıa anterior a cero en la primera hora deldıa siguiente, mediante la aceptacion del primer tramo de las tres primeras horas desu oferta como ofertas simples, con la unica condicion de que la energıa ofertada seadecreciente en cada hora.

Page 365: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Analisis crıtico del mercado electrico espanol 357

El operador del mercado realizara la casacion de las ofertas economicas de compray venta de energıa electrica (recibidas antes de las 10:00 horas del dıa) por medio delmetodo de casacion simple o compleja, segun concurran ofertas simples o que existanofertas que incorporen condiciones complejas.

El metodo de casacion simple es aquel que obtiene de manera independiente elprecio marginal, ası como el volumen de energıa electrica que se acepta para cadaunidad de produccion y adquisicion en cada periodo horario de programacion.

El metodo de casacion compleja obtiene el resultado de la casacion a partir delmetodo de casacion simple, al que se anaden las condiciones de indivisibilidad y gra-diente de carga, obteniendose la casacion simple condicionada. Mediante un procesoiterativo se ejecutan varias casaciones simples condicionadas hasta que todas las uni-dades de oferta casadas cumplen la condicion de ingresos mınimos ası como de paradaprogramada, siendo esta solucion la primera solucion final provisional, obtenida consi-derando una capacidad ilimitada en las interconexiones internacionales. Mediante unproceso iterativo se obtiene la primera solucion final definitiva que respeta la capaci-dad maxima de interconexion internacional, considerando tanto las ofertas realizadasal mercado diario, como las ejecuciones de contratos bilaterales fısicos con afectacionexpresa a dichas interconexiones.

El precio en cada periodo horario sera igual al precio del ultimo tramo de la ofertade venta de la ultima unidad de produccion cuya aceptacion haya sido necesaria paraatender la demanda que haya resultado casada.

Como resultado de la casacion, el operador del mercado obtiene el Resultado de laCasacion, entendiendo por el mismo la programacion de entrada en la red establecidapor el operador del mercado a partir de la casacion de las ofertas de venta y adquisicionde energıa electrica y en el que se determina, para cada periodo horario de un mismohorizonte diario, el volumen de energıa electrica que se requiere que se produzca paracubrir la demanda de dicha energıa electrica.

Desde el punto de vista de la formacion del precio, debe incidirse en el hecho deque se basa en un sistema marginalista y que es la ultima unidad de produccion queentra en la casacion la que determina el precio, es decir, la mas ineficiente de todaslas que son casadas. Asimismo, el volumen con el que se “marca” el precio marginalpara cada perıodo de programacion puede ser mınimo, no siendo representativo dela oferta en terminos generales, si bien todos los oferentes se ven beneficiados de unprecio mas elevados, pues todos cobran el mismo precio. En la figura 4 se muestra elresultado de la casacion correspondiente al 22 de junio de 2000.

Page 366: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

358 Rafael de Benito

Figura 4: 22 de junio de 2000

4 La Garantıa de Potencia

La garantıa de potencia es otro de los componentes del precio final de la electricidad.Segun el artıculo 24 del R.D. 2019/97,

“La retribucion por garantıa de potencia tiene por objeto proporcionaruna senal economica para la permanencia e instalacion de capacidad degeneracion en el sistema electrico, con el objeto de conseguir un nivel degarantıa de suministro adecuado”.

Las unidades de produccion obligadas a presentar ofertas economicas de venta (segunel artıculo 23 del R.D. 6/2000) tendran derecho a obtener la retribucion por garantıade potencia, siempre que hayan acreditado un funcionamiento de 480 horas equivalen-tes a plena carga durante el ultimo ano. Por el contrario, los agentes externos en susimportaciones, los generadores en regimen especial y los vendedores en los contratosbilaterales fısicos no tienen derecho de cobro por este concepto.

La cuantıa mensual por garantıa de potencia asciende a 1,15 Pta/KWh por lademanda anual en barras de central de los clientes finales nacionales. La demanda enbarras de central significa que no tienen en cuanta las perdidas que se producen debidoa la transmision de la electricidad por las diversas redes de transporte y distribucion.

Los comercializadores, consumidores cualificados y agentes externos efectuaran unpago por garantıa de potencia producto de la energıa adquirida en cada hora por elprecio correspondiente a la misma.

Los precios horarios para cada uno de los periodos aparecen en la tabla 2.

Page 367: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Analisis crıtico del mercado electrico espanol 359

Tabla 2: Garantıa de potencia

5 Componentes del precio final de la Electricidad

A efectos de liquidacion, el precio de la energıa electrica a pagar por el comprador ya percibir por el vendedor incorporara:

- Precio de casacion del mercado diario.

- Coste resultante del proceso de solucion de restricciones tecnicas.

- Coste del mercado de servicios complementarios.

- Precio de casacion del mercado intradiario.

- Coste de la garantıa de potencia.

- Coste de los procesos de operacion tecnica del sistema.

- Exceso/deficit de los contratos internacionales a largo plazo.

Debe senalarse que, con relacion a los servicios complementarios, estos seran abonadospor aquellos vendedores y compradores de electricidad que hayan provocado la nece-sidad de su utilizacion. Por otro lado, el precio de casacion del mercado intradiariosera unicamente relevante para quienes hayan intervenido en el mismo.

Page 368: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

360 Rafael de Benito

6 Los Costes de Transicion a la Competencia (CTC)

La regulacion inicial de los CTCs aparecıa en la disposicion transitoria sexta de laLey 54/97 del Sector Electrico. En dicha disposicion transitoria se establece:

“Se reconoce la existencia de unos costes de transicion al regimen demercado competitivo, previsto en la presente Ley, de las sociedades ti-tulares de instalaciones de produccion de energıa electrica, que a 31 dediciembre de 1997 estuvieran incluidas en el ambito de aplicacion del RealDecreto 1538/1987, de 11 de diciembre. . . Durante un plazo maximo dediez anos desde la entrada en vigor de la presente Ley, el Gobierno podraestablecer anualmente el importe maximo de esta retribucion fija con ladistribucion que corresponda. . . Los costes que se deriven de esta retribu-cion seran repercutidos a todos los consumidores de energıa electrica comocostes permanentes del sistema, en los terminos que reglamentariamentese establezcan y su importe base global, en valor a 31 de diciembre de 1997,nunca podra superar 1.988.561 millones de pesetas. . . Si el coste medio degeneracion a que se refiere el artıculo 16.1 de la presente Ley a lo largodel perıodo transitorio, resultara en media anual superior a 6 pesetas porkWh, este exceso se deducira del citado valor actual”.

El coste medio de generacion definido en el artıculo 16.1 comprende los siguientesconceptos: precio marginal, coste de las perdidas en el transporte, garantıa de potenciay servicios complementarios.

Los controvertidos CTCs representan un factor que afecta de diversos modos almercado de electricidad. Por un lado, actuan como un instrumento de coberturanatural en un entorno de precios bajos y, por otro, dicha cobertura actua como unabarrera de entrada en el mercado, puesto que las empresas propietarias de centralesde nueva construccion no seran acreedoras del cobro por este concepto. La resolucionde la polemica generada por la posible titulizacion de los CTCs y su aprobacion finalpor parte del Comisario de la Competencia, Mario Monti, implicara el esclarecimientode un escenario de mercado que hasta ahora se ve distorsionado por este factor.

7 Los Contratos Bilaterales Fısicos

Como ya ha sido indicado, los artıculos 19 y 20 del R.D. 2019/97 regulan este tipo decontratos, siendo los consumidores cualificados o los agentes externos quienes puedenformalizar con productores o agentes externos este tipo de contratos de suministro deenergıa electrica.

Lo primero que llama la atencion es que los comercializadores no pueden rubricaresta modalidad de contratos. Esta circunstancia es especialmente relevante para loscomercializadores independientes, quienes se ven abocados a acudir al pool –comotambien han de hacerlo los comercializadores que pertenecen a las companıas electricasque poseen activos de generacion– para adquirir la energıa electrica que posteriormentevenderan a los consumidores finales.

Page 369: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Analisis crıtico del mercado electrico espanol 361

8 Impacto de las medidas liberalizadoras del RealDecreto Ley 6/2000 de 23 de junio

Con el objetivo de incrementar el nivel de competencia en diferentes sectores de laeconomıa espanola, el Gobierno aprobo el 23 de junio de 2000 un paquete de medidasque, entre otros, afectan al sector electrico (artıculos 16 a 28, ambos inclusive). Cabedestacar los siguientes aspectos de la nueva norma:

• Establecimiento de unos lımites para el crecimiento de las empresas con mayorcuota de mercado, que afecta principalmente a Endesa e Iberdrola, si bien nose obliga a desinvertir en activos de generacion.

• Reduccion de la cuantıa por garantıa de potencia a 0,80 Ptas./kWh.

• Adelanto de la apertura total del mercado al ano 2003.

• Reduccion de requisitos para el ejercicio de la condicion de cliente cualificado.

• Incorpora nuevas posibilidades de actuacion a los comercializadores.

A continuacion se realiza una explicacion mas detallada con relacion a los tres ultimospuntos.

8.1 Apertura total del mercado el 1 de enero de 2003

Todos los consumidores de electricidad tendran la posibilidad de elegir suministrador,por lo que se espera un incremento en el nivel de competencia. Las experiencias delReino Unido y de Alemania hacen prever que los precios puedan bajar si bien, dadala reduccion de la tarifa regulada desde el inicio del proceso liberalizador (en el RD6/2000 se determina que en los proximos tres anos la tarifa debe bajar un 9% ), elmargen para bajadas ulteriores se reduce significativamente.

Un problema que se ha presentado en el Reino Unido a los clientes domesticosha sido el de la doble facturacion, tras haber cambiado de suministrador. Este tipode problemas burocraticos y administrativos, junto con el polemico asunto de loscontadores, podrıa surgir una vez se liberalice en su plenitud el mercado.

En cualquier caso, la integracion de servicios a traves de un unico proveedor (elec-tricidad, gas, incluso agua y telefono) suele ser uno de los rasgos fundamentales demercados liberalizados y con un cierto grado de madurez, por lo que no sera raroobservarlo en Espana dentro de unos anos.

8.2 Ejercicio de la condicion de cliente cualificado

El artıculo 20 de RD 6/2000 anade un nuevo artıculo, el 21 bis, al RD 2019/1997,por el que se regula el mercado de produccion de energıa electrica. Hasta ahora, losconsumidores que deseasen ejercer su condicion de cualificados debıan inscribirse en el

Page 370: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

362 Rafael de Benito

Registro Administrativo de Distribuidores, Comercializadores y Clientes Cualificados.Tras la aprobacion de este RD, ya no es necesario, “bastando para acreditar su derechoa ser consumidor cualificado la certificacion sobre la caracterıstica de su consumo onivel de tension de suministro expedido por la empresa o empresas distribuidoras conlas que este conectado”, tal y como reza el artıculo arriba indicado.

Por el contrario, aquellos consumidores cualificados que quieran intervenir directa-mente en el mercado (comprando en OMEL), sı deberan registrarse en el mencionadoRegistro.

Los distribuidores deberan remitir gratuitamente a todos aquellos de sus clientes, silo solicitan, que vayan a adquirir la condicion de cualificados en 15 dıas (de momentono se preve la adquisicion de dicha categorıa a nuevos clientes hasta 2003) de uncertificado en el que haran constar su nivel de tension de suministro, identificacion dela tarifa correspondiente, potencia o potencias contratadas, el consumo mensual delos dos anos anteriores y el detalle de su facturacion de dicho perıodo.

Con estas medidas, se pretende facilitar y agilizar el que, principalmente, las pymespuedan recibir ofertas de los diferentes comercializadores, pudiendo estos acceder acierta informacion tecnica e historica del cliente en cuestion, y posibilitando ası laformulacion de una oferta mas adecuada.

8.3 Nuevas posibilidades para los comercializadores

De acuerdo con el artıculo 21 del RD 6/2000, los comercializadores ven ampliadosu campo de actuacion, poniendo a su alcance nuevas formulas contractuales que lespermitiran tener un mayor papel en el mercado, sobre todo en lo que se refiere a loscomercializadores independientes que no poseen capacidad de generacion.

Hasta ahora, los comercilizadores solo podıan adquirir energıa electrica acudiendoa OMEL. A partir de ahora, tienen otras opciones. En primer lugar, “los comer-cializadores de energıa electrica podran realizar contratos de adquisicion de energıaelectrica con empresas autorizadas a la venta de energıa electrica en paıses de laUnion Europea o terceros paıses, ası como con productores nacionales de electricidaden regimen especial y a partir del 1 de enero de 2003 o cuando todos los consumidorestengan la condicion de cualificados, tambien con productores nacionales en regimenordinario. Dicha energıa podra venderse a los consumidores cualificados o integrarseen los mercados diarios o intradiarios existentes”.

Si bien es un paso adelante respecto a la actual regulacion, como bien se senalaen la Nota Tecnica no 67 de Analistas Financieros Internacionales,

“los contratos de suministro con entidades de fuera de Espana estancondicionadas por las limitaciones en la capacidad de interconexion electricacon Francia”. Dicha capacidad de interconexion es de 1.100 MW de en-trada y 1.000 MW de salida. Por otro lado, “los productores en RegimenEspecial perciben en media una prima de tres pesetas sobre los precios

Page 371: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Analisis crıtico del mercado electrico espanol 363

del pool y su potencia esta limitada a 50 MW. En estas condiciones esdudoso que estos productores vayan a actuar de manera significativa en lacobertura de las necesidades de energıa de los comercializadores”.

En el supuesto de que comercializadores independientes puedan adquirir algunas can-tidades de energıa electrica por alguna de las vıas que se les abren ahora, no solopodran revenderla a clientes finales, sino que tienen la posibilidad de venderla en elpool, bien tanto en el mercado diario como en el intradiario, con lo que pueden generarun efecto modulador que sera tanto mayor cuanta mayor sea la energıa electrica quepuedan negociar.

Mucho mas importante, pero sin consecuencias hasta el ano 2003, es el hechode que los comercializadores podran comprar directamente la energıa electrica a losproductores espanoles en regimen ordinario. Esta circunstancia posibiltara que lospropietarios de las centrales, cuya construccion esta prevista que finalice aproxima-damente para la primera mitad de ese ano, puedan negociar acuerdos de venta concomercializadores por la totalidad o parte de la energıa que produzcan. En Espanaesta proyectada la construccion de mas de 4.000 MW de potencia correspondientesa merchant plants, es decir, empresas que poseen capacidad de generacion pero noposeen comercializacion (ver figura 5). Este escenario, propicio para la realizacion decontratos estructurados vinculando el precio de la electricidad con el precio de sumi-nistro del gas (combustible de todas estas nuevas centrales y materia prima esencialen la liberalizacion de los sectores electricos de toda Europa), aportara un alto gradode dinamismo al mercado electrico espanol.

Figura 5: Merchant Plants proyectadas

Page 372: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

364 Rafael de Benito

9 Los Mercados de derivados sobre la Electricidad

Con la liberalizacion de los mercados electricos en muchos paıses del hemisferio occi-dental, la electricidad se ha convertido en una commodity mas, y como tal, ha sidonegociada a traves de distintos tipos de contratos derivados.

La electricidad registra una caracterıstica que le dota de una singularidad especial:no es almacenable. Este rasgo de la energıa electrica condiciona la manera en que estoscontratos deben ser liquidados una vez se alcanza su vencimiento, con independenciade que dicha liquidacion tenga lugar mediante una entrega fısica o tenga lugar pordiferencias contra un precio o ındice de referencia.

Tomese como ejemplo los contratos de futuros de electricidad negociados en elNord Pool noruego. Los diferentes contratos cotizados lo son sobre la base del perıodode entrega definido. Cuanto mas lejano en el tiempo, el perıodo de entrega es mayor.Cuanto mas cercano en el tiempo, dicho perıodo es menor, pero no se puede concebirun contrato de electricidad sin vincularlo con el perıodo de entrega.

Figura 6: Cotizacion de contratos de futuros en el Nord Pool

La figura 6 muestra la forma en que se cotizan los contratos de futuros de electricidaden el Nord Pool. A como mınimo un ano antes del vencimiento, se negocian lasestaciones2. Una vez el plazo al vencimiento se situa por debajo del ano, la estacionse divide en varios bloques de cuatro semanas que previamente componıan la estacion.Al situarse a cuatro semanas al vencimiento, el bloque se divide en cuatro semanas

2Debe significarse que los contratos de estacion fueron deslistados en octubre de 1999 en el mercadode futuros, permaneciendo en el mercado de forwards, mucho mas lıquido para este tipo de contratos.En cualquier caso, se entiende procedente incluir en la explicacion esta figura pues ha estado vigentevarios anos (sigue estandolo en el mercado de forwards), y facilita la comprension del mecanismo defuncionamiento de los contratos de futuros que nos atanen.

Page 373: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Analisis crıtico del mercado electrico espanol 365

individuales. Cuando un perıodo se divide en otros mas pequenos, estos ultimospueden negociarse de forma individual y separadamente.

Cabe la posibilidad de negociar los dıas de forma individual, si bien el perıodode liquidacion es la semana. ¿De que forma se liquida? Nord Pool gestiona tanto elmercado spot como el mercado de futuros. El precio del mercado spot es publico ytransparente. Conocido el precio de cierre del futuro para una semana en cuestion(precio que se conoce al concluir la sesion de mercado correspondiente al viernes previoal inicio de dicha semana), se liquida contra el precio medio diario del mercado spot.Al ser el mercado spot del Nord Pool un mercado horario, como en el caso espanol, elprecio medio se calcula como la media aritmetica de los 24 precios horarios publicadospor Nord Pool. La citada liquidacion del precio de futuro contra el precio medio delmercado de contado tiene lugar de forma diaria durante la “semana de entrega”. Siel precio medio spot de un dıa de la semana de entrega se situa por encima del preciode futuros, la liquidacion es favorable al comprador dicho dıa, y sera favorable alvendedor en el supuesto contrario, tal y como se ilustra en la figura 7.

Figura 7: Liquidacion del precio del futuro

Carece de todo sentido el cotizar la electricidad a plazo para ser entregada (fısica onocionalemente) en un momento concreto, dada la imposibilidad material de alma-cenarla. Por ello, la entrega (o si se quiere, la liquidacion a vencimiento) debe deir vinculada, inevitablemente, a un perıodo de entrega. Cuestion diferente resultael hecho de si la liquidacion a vencimiento del instrumento derivado en cuestion seliquida por diferencias o por entrega fısica. La existencia de un mercado centralizadosuficientemente representativo o la existencia de ındices de precios aceptados por losagentes que participan en el mercado, posibilita la liquidacion por diferencias. Laausencia de estos factores determinara una liquidacion por entrega.

De aquellos paıses donde en la actualidad estan abiertos a negociacion contratos defuturos sobre energıa electrica (Noruega, Estados Unidos, Australia y Nueva Zelanda),

Page 374: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

366 Rafael de Benito

tan solo el paıs norteamericano liquida sus contratos a vencimiento por entrega. Elloes ası por la inexistencia de un precio de referencia contra el que liquidar el precio defuturo. En cualquier caso, el procedimiento de entrega correspondiente a los contratosnorteamericanos tiene una duracion de un mes.

La tendencia actual en paıses como Inglaterra o Alemania en cuanto a la estructuradel mercado es la de separarse del formato del mercado de subasta (a modo de pool) yadoptar la negociacion continua en bloques, siendo los mercados horarios de subastauna parte marginal o meramente inexistente. Este hecho provocara que, si se deseanegociar contratos de derivados que se liquiden a vencimiento por diferencias, habrade disenarse unos ındices bajo unos principios diferentes aplicados a los mercados desubasta. En tanto en cuanto estos ındices no sean conformados, los contratos tendranque ser liquidados a vencimiento por entrega.

10 Desarrollo de contratos derivados sobre Electri-

cidad en el mercado espanol

El mercado electrico espanol —en lo que se refiere a contratos derivados OTC— haregistrado un crecimiento lento, con ciertos altibajos en su camino, pero que parecehaber encontrado unas bases solidas que auguran un futuro con un grado de liquidezmas que aceptable.

Tras dar sus primeros pasos serios a principios a principios de 1999, a finales delano 2000 se puede afirmar que es un mercado que posee unos cimientos firmes peroque necesita elevar su liquidez, profundidad y volumen negociado.

En un principio, el mercado OTC se desarrollo a partir de la actividad de cuatrooperadores: SKS, Synergia, Enron y Electrabel. La liquidez de este mercado era cier-tamente escasa, pero aun ası los mismos agentes entendieron necesaria la presencia deagentes intermediarios (brokers). La aparicion de un broker (HOB) agilizo levementela negociacion.

A lo largo del ultimo trimestre de 1999 fueron entrando nuevos agentes (Sempra,Union Fenosa, etc.), haciendo mas atractivo el mercado. El erratico comportamientode los precios en el mercado spot a lo largo del primer trimestre de 2000 llego aprovocar una ralentizacion de la negociacion en el mercado OTC que lo dejo conuna nula actividad durante unos dıas. Este drastico descenso en la actividad vinoprovocado por una falta de confianza en el mercado de contado por parte de losagentes mas activos en el mercado de derivados.

Los contratos OTC negociados en Espana cubren diferentes perıodos: semanas,meses, restos de meses, trimestres, semestres, ano y otros. La negociacion se havenido centrando en perıodos mas largos o mas cortos en funcion del perıodo del ano,habiendo habido momentos donde la practica totalidad de operaciones se centraba enla semana siguiente o como mucho la posterior a la siguiente, mientras que en otrosperıodos los traders se han centrado casi con exclusividad en la negociacion de meses.

Page 375: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Analisis crıtico del mercado electrico espanol 367

Por otro lado, el perfil de los contratos (es decir, que horas quedan englobadas porestos) se centra en la actualidad en carga base (las 24 horas del dıa) y picos (desde lahora 9 a la hora 24, ambas inclusive). Otros perfiles, tales como las noches, los valleso los fines de semana han ido perdiendo interes.

El nominal de los contratos, aparte del perıodo y del perfil, depende de la potenciapactada. En el mercado espanol, no se suele pactar mas alla de una potencia de 20MW, siendo 10 MW la cantidad mas habitual.

El tipo de contrato que mayoritariamente se he negociado ha sido el contrato pordiferencias (CPD). En dicho contrato se fija un precio para un determinado perıodo ycon un determinado perfil. Si el precio medio del mercado spot durante dicho perıodo ycon el perfil especificado es superior al precio acordado a traves del contrato, la partevendedora abona la diferencia a la compradora. El montante economico depende,asimismo, de la potencia contratada. A continuacion se ilustra con un ejemplo comose calcula la liquidacion de una operacion.

El trader A (comprador) pacta con el trader B (vendedor) un contrato de horaspico, 20 MW para la semana numero 47 del ano 2000 a un precio de 6,500 Pta/kWh.El nominal del contrato asciende a 20 MW x 80 horas = 1.600 MWh. Ello significaque a cada uno de los cinco dıas comprendidos en el contrato le corresponden 320MWh (320.000 kWh).

Los precios medios de las horas pico (de lunes a viernes, siempre que sean la-borables, y de las 8:00:01 de la manana hasta las 12:00 de la noche) para los dıascomprendidos en el contrato son los siguientes (en Pta/kWh):

• Lunes: 6,564

• Martes: 6,140

• Miercoles: 6,987

• Jueves: 7,215

• Viernes: 6,841

Dıa Precio medio spot Precio pactado Diferencia Liquidacion

Lunes: 6,564 6,500 0,064 20.480

Martes: 6,14 6,500 -0,36 -115.200

Miercoles: 6,987 6,500 0,487 155.840

Jueves: 7,215 6,500 0,715 228.800

Viernes: 6,841 6,500 0,341 109.120

Total 399.040

En este ejemplo, la liquidacion ha favorecido al comprador, puesto que el preciomedio del mercado spot correspondiente a las horas comprendidas en el contrato hasido superior en su conjunto al precio pactado.

Page 376: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

368 Rafael de Benito

A lo largo de los meses en que el mercado OTC ha estado en funcionamiento,se han realizado otro tipo de operaciones, tales como opciones o spreads, si bien lamayorıa de las transacciones han sido CPD.

Como ejemplo real de la situacion del mercado OTC, a continuacion se muestrala tabla que a este respecto la empresa Platts publica diariamente en su publicacionespecializada “European Power Daily” (figura 8).

Figura 8: Datos de Platts sobre el mercado OTC en Espana

11 La evolucion del mercado spot en graficos

Figura 9: Evolucion del precio medio diario spot en 1998

Page 377: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Analisis crıtico del mercado electrico espanol 369

Figura 10: Evolucion del precio medio diario spot en 1999

Figura 11: Evolucion del precio medio diario spot en 2000 (hasta agosto)

Page 378: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

370 Rafael de Benito

12 Diferentes analisis del comportamiento de losprecios en los Mercados de Electricidad

Existen diversas opiniones al respecto de como explicar el comportamiento de losprecios en los mercados electricos y de como calcular la volatilidad de aquellos. Porello, parece adecuado citar dos autores que han tratado estos temas, como son DraganaPilipovic y David Shimko.

La primera es la maxima responsable de Sava Risk Management, empresa consul-tora para cuestiones de gestion de riesgo enfocada al sector energetico. Es autora dellibro “Energy Risk”. Pilipovic ha centrado parte de su trabajo en elaborar un modelode estimacion de precios que recogen el fenomeno de reversion a la media.

El efecto de la reversion a la media es analogo a lo que sucede cuando hacemossonar una cuerda de guitarra o pegamos un empujon a un columpio: tanto la cuerdacomo el columpio tienden a un punto de central de equilibrio, si bien cada uno lo hacea una velocidad diferente. Con la reversion a la media tiene lugar algo paradojico, yes que no puede determinarse la velocidad de esta reversion si la variable en cuestion(precio, tipo de interes), no se aparta de su punto de equilibrio por cualquier motivoy retorna de nuevo al mismo.

En los mercados energeticos, la reversion a la media responde a razones de diferenteındole: viene principalmente determinado por la presencia de acontecimientos y decomo la oferta reacciona ante los mismos o de con que velocidad estos acontecimientosdesaparecen. Hay ejemplos muy claros al respecto: el verano pasado, en el mediooeste americano, el precio del MWh llego a alcanzar la increıble cifra de $ 7.500,cuando los niveles normales se situan en torno a los $ 35-40/MWh. Esta subida vinomotivada por varias razones: elevadas temperaturas —provocando un uso masivo deaparatos de aire acondicionado—, paradas de algunas centrales y problemas en lared de transporte. En cuanto estas circunstancias desaparecieron, o se corrigieronsignificativamente, los precios volvieron rapidamente a sus niveles habituales.

Pilipovic (1998) realiza una aportacion muy interesante en consonancia con lostrabajos posteriores de Smith & Schwartz (1999). En este modelo de dos factores,el primero coincide con el precio spot y el segundo factor es el precio de equilibrio alargo plazo. Se asume que el precio spot revierte hacia el precio de equilibrio. Estees un modelo muy utilizado en los mercados energeticos. El modelo Pilipovic es elsiguiente:

dSt = α (Lt − St) dt + St σ dzt ,

dLt = µLt dt + Lt ξ dwt .

Por un lado, este modelo representa una variacion algebraica del modelo de Gibson

Page 379: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Analisis crıtico del mercado electrico espanol 371

& Schwartz (1990) del precio spot y convenience yield :

dSt

St= (µ − yt) dt + σ1 dwt ,

dyt = k (θ − yt) dt + σ2 dut ,

siendo µ una constante, e yt el convenience yield, siendo este componente el querevierte hacia un nivel de equilibrio, capturando este modelo un comportamientoaleatorio de la forma de la curva forward (contango o backwardation), pero siguecontemplando a la commodity subyacente en cuestion como activo de inversion y alconvenience yield como si fuesen dividendos.

El segundo factor, el precio a largo plazo Lt, es lognormal. A partir de este puntode partida, Pilipovic propone su modelo para el calculo del precio futuro:

corto plazo largo plazo

↓ ↓F subyacente

t,T = (S − L) e−α(T−t)/365+ L e−µ (T−t)/365 ,

F estacionalt,T = F subyacente

t,T + contribucion estacionalidad.

Por ultimo, para acometer el factor de la estacionalidad, Pilipovic propone 3 modelosdiferentes que puedan capturarla.

• Modelo del coseno:

F estacioanlidadt,T = F subyacente

t,T + βa cos (2π (T − ta)) + βsa cos (4π (T − tsa)) .

• Modelo exponencial:

F estacioanlidadt,T = F subyacente

t,T + βa eλa (T−ta)2 + βsa eλsa (T−tsa)2 .

• Modelo potencia de N :

F estacioanlidadt,T = F subyacente

t,T +βa

1 + λa (T − ta)N+

βsa

1 + λsa (T − tsa)N.

Respecto a los grados de libertad, el modelo del coseno permite una correcta cali-bracion de la altura (del pico debido a la estacionalidad) y de la fecha central. Losmodelos exponencial y de la potencia enesima permiten, a su vez, calibrar no solo al-tura y fecha central sino tambien la anchura (la duracion del perıodo donde se registrala desviacion respecto del precio de equilibrio debido a la estacionalidad). Respectoa la representacion grafica de los picos, el modelo de la potencia enesima da lugar afiguras planas. El modelo exponencial es el que permite un mejor ajuste.

En definitiva, la naturaleza de los mercados energeticos y su implicacion en elcomportamiento de los precios provoca la necesidad de unos modelos matematicos

Page 380: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

372 Rafael de Benito

que expliquen dichos comportamientos. El ejemplo extremo es la electricidad, dondela velocidad de reversion a la media puede llegar a ser muy elevada dando lugar aelevadas tasas de volatilidad, si bien hay quien afirma que esta magnitud no es tanalta como pueda parecer, aportando criterios alternativos para su calculo. Este es elcaso de David Shimko, de Bankerstrust.

David C. Shimko, maximo responsable de la empresa perteneciente al grupoBankerstrust-Deutsche Bank, Covar, plantea junto a Jean-Paul St.Germain en suartıculo “Substandard deviation”, una metodologıa de calculo de la volatilidad dis-tinta a la tradicional y generalmente aceptada.

Segun Shimko, cuando se calcula la volatilidad de la manera enunciada arriba, seesta asumiendo que:

1. Los rendimientos de los precios presentan una media y volatilidad constantes;

2. Los cambios en los precios son independientes de los cambios anteriores.

Esto ultimo significa que los precios siguen un random walk o paseo aleatorio (el loga-ritmo de los cambios en los precios no hace otra cosa que convertir unos rendimientosperiodicos en un rendimiento compuesto continuo, evitando ası la posibilidad de losprecios negativos). Estos puntos de partida asumidos como ciertos se aproximan a larealidad cuando se trata de la renta variable, aunque ciertamente hay innumerablesexcepciones. No es tan fiable en el mercado de bonos, en el cual la volatilidad sereduce conforme el instrumento de deuda se aproxima al vencimiento. Y desde luego,la segunda de las afirmaciones es la que menos se cumple, especialmente en lo que serefiere a tipos de interes, divisas y mercaderıas.

¿Por que los precios no describen un random walk? Si el precio de la electricidadse dispara a $ 100, ciertamente no va a mantenerse en esos niveles mucho tiempo; esobvio para todos que el precio revertira rapidamente a niveles mas “razonables”. Enestadıstica, este comportamiento es conocido como reversion a la media. Segun lopresenta Shimko en su artıculo, la media de los cambios en los precios o la esperanzade los cambios en los precios sera negativa cuando los estos registren valores elevados,y positiva cuando sean bajos.

A traves de una ecuacion, puede ser expresado de la siguiente forma

Pt+1 − Pt = k (m − Pt) + s et ,

que puede parecer complicada al principio. Tan solo establece que el cambio deprecio proyectado (Pt+1 − Pt) es proporcional en promedio a la diferencia entre elprecio actual y el precio medio a largo plazo m. El termino k indica la rapidez de lareversion a la media, ya que, cuanto mayor sea dicho termino, mas rapido retornarael precio hacia su valor medio a largo plazo.

No resulta difıcil aplicar esta ecuacion. Para ello, los autores sugieren una pequenaayuda:

Page 381: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Analisis crıtico del mercado electrico espanol 373

- Proceder a realizar una regresion entre los rendimientos de los precios y el precioanterior correspondiente.

- La velocidad de la reversion a la media corresponde a la pendiente estimada,con el signo contrario.

- La constante estimada, al dividirlo por la velocidad de la reversion a la mediada como resultado la media a largo plazo.

- La desviacion estandar de los residuos es la volatilidad de los cambios de losprecios (en dolares) despues de ajustar a una media variable.

La aportacion de Pilipovoc y Shimko resulta muy interesante. Conforme los merca-dos liberalizados adquieran un mayor grado de madurez, la actividad de trading deelectricidad va a adquirir una posicion preponderante dentro de las empresas involu-cradas en la generacion, compra y venta de electricidad. Esa mayor madurez puedeperfectamente implicar que los modelos que son aplicables ahora no lo sean dentro deun tiempo, puesto que la evolucion de los precios responda mas a factores que ahoratienen poca importancia. Por ello, en los anos venideros, no sera extrano observarla publicacion de nuevos modelos que intenten modelizar el comportamiento de losprecios bajo otros principios.

Referencias

[1] Pagina web de OMEL, www.omel.com.

[2] Notas tecnicas de AFI sobre el mercado electrico.

[3] Pilipovic, Dragana, “European Power Daily Managing Energy Risk”, 1998.

Rafael de BenitoDivision de Energıa

FC&MLibreros, 2–4

46002-Valencia (Spain)e-mail: [email protected]

Page 382: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM
Page 383: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Uso de las martingalas en la

valoracion de activos derivados

Eloy Fontecha1

Resumen

En el presente artıculo se muestra como la tecnica de cambio de numerariopuede ser empleada en la valoracion de un numero considerable de activos de-rivados. Dado un activo derivado cualquiera, su valoracion se podrıa llevar acabo utilizando como numerario el precio de cualquier activo con pagos positi-vos. Sin embargo, teniendo en cuenta caracterısticas propias del derivado comola expresion de sus pagos en terminos de su activo subyacente y la evolucionestocastica de este, podemos encontrar un numerario cuya eleccion como talfacilita enormemente la valoracion. En el presente artıculo se explica la tecnicade valoracion de activos derivados relacionandola con la eleccion de un numera-rio. Posteriormente y para distintos activos derivados se muestra la eleccion delnumerario adecuado y se procede a su valoracion.

1 Introduccion

En el presente documento se va a explicar la metodologıa empleada en la valoracionde activos derivados.

En general un activo derivado es aquel cuyo pay-off depende del precio de otro“activo subyacente” sobre el que esta “emitido”.

La tecnica de valoracion trivial consistirıa en asumir una cierta medida de pro-babilidad y, bajo la misma, un proceso estocastico para la evolucion del precio delactivo subyacente. Despues, descontar el valor esperado bajo esa medida del preciofuturo del activo derivado a un tipo de interes que incorpore una prima de riesgo. Elproblema de esta tecnica reside en la discrecionalidad de la medida y de la prima deriesgo que podrıamos emplear para descontar.

Para eliminar esa discrecionalidad lo que se hace es elegir una medida para la queel descuento se pueda hacer a traves del precio conocido objetivamente de un activoque elegiremos como “numerario”. Dicho de otra manera, elegiremos una medidapara la que el precio de cualquier activo expresado en unidades del numerario tengamedia cero.

1Eloy Fontecha es Responsable del Departamento de Nuevos Productos en el Area de Mercadosde BBVA. Esta charla se impartio en la sesion del Seminario MEFF-UAM de noviembre de 1999.

Page 384: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

376 Eloy Fontecha

En los apartados que siguen vamos a ver que esa medida existe para cualquiernumerario que pudieramos elegir, y dicha existencia la mostraremos tanto en tiempodiscreto como en tiempo continuo. Finalmente mostraremos unos ejemplos en los quevemos como emplear esta tecnica y como llevar a cabo valoraciones mediante cambiosde una medida a otra.

2 Busqueda de martingalas en la valoracion de ac-tivos. Eleccion de numerario. Tiempo discreto

Denotemos por j el ındice de estado correspondiente al instante T , j = 1, . . . , J .Supongamos que un activo A paga flujos en T y denotemos por

A0 su precio en t = 0,Aj el flujo que paga en T si ocurre el estado j.

Sea P j un activo que paga 1 en T si ocurre j y 0 en caso contrario. Esto es,

P j0 es el precio Arrow Debreu del estado j del momento T ,

P jj′ = 1 si j = j′ y 0 en caso contrario.

La ausencia de arbitraje implica que

A0 =J∑

j=1

Aj P j0 .

Sea N otro activo que elegimos como numerario; entonces,

A0

N0=

J∑j=1

Aj

N0P j

0 =J∑

j=1

Aj

NjPj

Nj

N0=

J∑j=1

Aj

NjwN

j ,

dondewN

j = PjNj

N0para cada j = 1, . . . , J .

Se tiene que ∑j

wNj =

∑j

PjNj

N0= 1 ,

de manera queA0

N0= E

N

(A

N

).

Esto es, existe una medida wN bajo la que A/N es una martingala y esa medida esindependiente del activo A: depende solo del numerario.

Restriccion para que N se pueda considerar numerario: ha de ser Nj > 0 paratodo j.

Page 385: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Uso de martingalas en la valoracion de activos derivados 377

3 Cambio de numerario. Cambio de medida. Deri-vada de Randon-Nikodym. Tiempo discreto

Sea otro numerario M con Mj > 0 para todo j. Igualmente,

A0

M0= E

M

(A

M

).

Ahora:

wMj = Pj

Mj

M0= wN

j

N0

Nj

Mj

M0,

∂wM

∂wN=

N0

N

M

M0.

δwM/δwN es la derivada de Radon Nikodym entre las dos medidas, que permite pasardel valor esperado calculado a partir de una de ellas al calculado a partir de la otra:en general,

EM (X) = E

N

(X

∂wM

∂wN

).

En particular, podemos emplear esto en la valoracion de activos para pasar de unnumerario a otro:

A0 = M0 EM

(A

M

)= M0 E

N

(A

M

∂wM

∂wN

)= N0 E

N

(A

N

).

4 Valoracion de activos

Sea un activo A y sea F un activo derivado tal que FT = f(AT ) y cuyo precio en 0queremos calcular.

Elegimos un numerario N y la medida wN bajo la que A/N es martingala. Por loya visto, tambien F/N es martingala:

F0 = N0 EN

(f(AT )NT

). (1)

5 Calculo del hedge: teorema de representacion demartingalas. Cartera replica

Teorema 1 (de representacion de martingalas) Si suponemos el intervalo tem-poral dividido mediante una particion de ındice i, dada una cierta medida y dos mar-tingalas X e Y , existe un proceso Φi previsible (el valor que toma en i lo conocemosen i − 1) tal que

YT − Y0 =∑

i

Φi+1 ∆Xi .

Page 386: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

378 Eloy Fontecha

Tenemos que Z = A/N es martingala, y queremos replicar FT , que no tiene por queser martingala. Pero

Et = EN

(FT

NT

∣∣∣ t

)

sı lo es, por las esperanzas condicionadas sucesivas. Por lo tanto existe Φi previsibletal que:

ET − E0 =∑

i

Φi+1 ∆Zi ,

∆Ei = Φi+1 ∆Zi .

Construyamos una cartera formada en i por

Φi+1 unidades de A,Ψi+1 = Ei − Φi+1 Zi unidades de N .

En i, el valor de la cartera es Φi+1 Ai +Ψi+1 Ni = Ei Ni. En vencimiento (T ), el valorde la cartera es FT .

Para que sea una replica exacta de F bastara que sea autofinanciada. Pero

Φi+1 Ai+1 + Ψi+1 Ni+1 = Φi+1 Zi+1 Ni+1 + Ni+1 Ei − Φi+1 Zi Ni+1

= Ni+1 Φi+1 (Zi+1 − Zi) + Ni+1 Ei

= Ni+1 (Ei+1 − Ei) + Ni+1 Ei = Ni+1 Ei+1

= Φi+2 Ai+1 + Ψi+2 Ni+1 .

De aquı extraemos varias conclusiones:

• Tenemos una cartera que replica el activo derivado construida con A y N (elsubyacente y el numerario).

• El valor en cualquier momento del derivado ha de ser el de la cartera:

Ft = Et Nt = Nt EN

(FT

NT

∣∣∣ t

).

En particular,

F0 = EN

(FT

NT

).

• Necesariamente ha de ser Ft/Nt = Et una martingala.

Tambien podemos escribir que la variacion de la cartera y por tanto del derivado es

∆(Ei Ni) = ∆Fi = Φi+1 ∆Ai + Ψi+1 ∆Ni .

Page 387: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Uso de martingalas en la valoracion de activos derivados 379

6 Tiempo continuo

En general asumiremos que el proceso estocastico seguido por el precio de un activoS(t) es lognormal y viene dado por la ecuacion diferencial estocastica

dS

S= µS dt + σS dw ,

con w(t) un proceso de Wiener bajo la medida bajo la que se da esa representacion.Primero necesitamos ser capaces de construir matingalas:

Teorema 2 (Girsanov) Si w(t) es un proceso de Wiener bajo una cierta medida deprobabilidad P y γ(t) es un proceso previsible, entonces existe una medida Q equiva-lente a P tal que:

(i) El proceso w′(t) dado pordw′ = dw + γ(t) dt

es de Wiener bajo Q.

(ii) La derivada de Randon-Nikodym entre ambas medidas en T , con la informaciondisponible en 0, viene dada por

dQ

dP(T ) = exp

(−

∫ T

0

γ(t) dw(t) − 12

∫ T

0

γ2(t) dt

).

Construccion de martingalas. Elijamos un activo N como numerario y considere-mos un activo generico S. Supongamos que ambos siguen procesos lognormales dadospor

dS

S= µS dt + σS dwS ,

dN

N= µN dt + σN dwN .

Sea Z el proceso dado por Z = S/N . Por el lema de Ito tenemos que

dZ

Z= µZ dt + σZ dwZ =

dS

S− dN

N+

(dN)2

N2− dS

S

dN

N

=(µS − µN + σ2

N − σN σS ρSN

)dt + σS dwS − σN dwN .

Si suponemos que hay un unico factor de riesgo, esto es, un unico proceso de Wienerdw(t) comun para todos los activos, entonces ρSN = 1 y podemos escribir:

dZ

Z=

(µS − µN + σ2

N − σN σS ρSN

)dt + (σS − σN ) dw

= (σS − σN )[(

µS − µN

σS − σN− σN

)dt + dw

]= (σS − σN ) (γ(t) dt + dw) = (σS − σN ) dw′ .

Page 388: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

380 Eloy Fontecha

Observese que, eligiendo γ(t) de esa manera y aplicando el teorema de Girsanov, yahemos encontrado una medida Q tal que S/N sea martingala para cualquier activoS. Solo falta probar que la medida Q, o equivalentemente γ(t), es independiente deS.

Si eligieramos como numerario el activo B(t), la cuenta corriente, definido por

B(0) = 1 ,dB

B= r(t) dt ,

el proceso seguido por Z = S/B serıa

dZ

Z= (µS − r) dt + σS dw = σS

(µS − r

σSdt + dw

)

= σS (γ′(t) dt + dw) = σS dw′ .

Observese que cuando el numerario es B, la independencia de Q respecto del activo Sconsiderado es equivalente a que el precio de mercado del riesgo , γ′(t), sea el mismopara todos los activos.

Ademas, esta condicion es suficiente para que cuando el numerario es un activo Ncualquiera la medida Q sea independiente del activo S, pues

µS − r

σS=

µN − r

σN=⇒ γ(t) =

µS − µN

σS − σN− σN =

µN − r

σN− σN .

De esta manera, tenemos la herramienta para, dado un numerario cualquiera N ,encontrar una medida bajo la que S/N es martingala para cualquier S. Solo hacefalta que el precio de mercado del riesgo sea el mismo para cualquier activo S.

Valoracion de activos. Elegido el numerario, ya podemos aplicar la formula devaloracion de cualquier derivado F cuyo pay-off final viene dado por una funcion fdel precio final de un activo S:

FT = f(ST ) ,

Ft = Nt EN

(FT

NT

∣∣∣ t

)= N0 E

N

(f(ST )NT

∣∣∣ t

).

Si tuvieramos dos posibles numerario N y M , podrıamos cambiar de medida entreambos de la siguiente manera:

Ft = Nt EN

(FT

NT

∣∣∣ t

)= Mt E

M

(FT

MT

∣∣∣ t

),

EN

(XT

∣∣∣ t) =Mt

NtE

M

(XT NT

MT

∣∣∣ t)

Para construir el hedge usaremos la version en tiempo continuo del teorema de repre-sentacion martingalas:

Page 389: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Uso de martingalas en la valoracion de activos derivados 381

Teorema 3 (de representacion de martingalas) Dada una cierta medida Q ydos martingalas X e Y , existe un proceso Φ(t) previsible tal que

dY (t) = Φ(t) dX(t) .

Tenemos que Z = S/N es martingala, y queremos replicar FT , que no tiene por queser martingala. Pero Et = E

N (FT /NT | t) sı lo es, por las esperanzas condicionadassucesivas. Por lo tanto existe Φ(t) previsible tal que

dE(t) = Φ(t) dZ(t) .

Construyamos una cartera formada en t por:

Φ(t) unidades de S,Ψ(t) = E(t) − Φ(t)Z(t) unidades de N .

En t el valor de la cartera es V (t) = Φ(t)S(t)+Ψ(t)N(t) = E(t)N(t). En vencimiento(T ), el valor de la cartera es FT . Para que sea una replica exacta de F bastara quesea autofinanciada. Pero por el lema de Ito tenemos que

dV (t) = dE(t)N(t) + E(t) dN(t) + dE(t) dN(t) .

Por el teorema de representacion,

dV (t) = Φ(t) dZ(t)N(t) + (Ψ(t) + Φ(t)Z(t)) dN(t) + Φ(t) dZ(t) dN(t)= Φ(t) (dZ(t)N(t) + Z(t) dN(t) + dZ(t) dN(t)) + Ψ(t) dN(t) .

Y por el lema de Ito de nuevo,

dV (t) = Φ(t) d(Z(t)N(t)) + Ψ(t) dN(t) = Φ(t) dS(t) + Ψ(t) dN(t) ,

luego la cartera es autofinanciada.

De aquı extraemos varias conclusiones:

• Tenemos una cartera autofinanciada que replica el activo derivado construidacon A y N (el subyacente y el numerario).

• El valor en cualquier momento del derivado ha de ser el de la cartera

Ft = Et Nt = Nt EN

(FT

NT

∣∣∣ t

).

En particular,

F0 = N0 EN

(FT

NT

).

• Necesariamente ha de ser Ft/Nt = Et una martingala.

Page 390: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

382 Eloy Fontecha

Tambien podemos escribir la ecuacion diferencial estocastica seguida por la cartera,y por tanto por el activo derivado, de la siguiente manera:

d(E(t)N(t)) = dF (t) = Φ(t) dS(t) + Ψ(t) dN(t) .

Si tenemos en cuenta los procesos seguidos por S y N y aplicamos el lema de Ito aF (t) = F (S(t), t), tendremos:

dF (S(t), t) =∂F

∂SdS +

∂F

∂tdt +

12

∂2F

∂S2(dS)2

=(

µS S∂F

∂S+

12

σ2S S2 ∂2F

∂S2+

∂F

∂t

)dt + σS S

∂F

∂Sdw = µF dt + σF dw

Por otro lado,

dF (S(t), t) = Φ(t) dS(t) + Ψ(t) dN(t)= (µS S Φ(t) + µN N Ψ(t)) dt + (σS S Φ(t) + σN N Ψ(t)) dw .

Por tanto,

µS S Φ(t) + µN N Ψ(t) = µF ,

σS S Φ(t) + σN N Ψ(t) = σF ,

esto es,

Φ(t) =µF σN − σF µN

µS S σN − σS S µN,

Ψ(t) =σF − σS S Φ(t)

σN N.

De esta manera, usando la formula de valoracion obtenemos F (S(t), t). De aquıdeducimos µF y σF . Hecho esto, podemos usar esas formulas para construir la carteraque exactamente replica el derivado que estamos valorando.

Observese que si tomamos como numerario el activo cuenta corriente B, tendre-mos:

µS S Φ(t) + µN N Ψ(t) = µF

σS S Φ(t) = σF

=⇒

Φ(t) =σF

σS S=

∂F

∂S,

Ψ(t) =µF − µS S Φ(t)

rB.

F = Φ(t)S + Ψ(t)B =⇒ F r = Φ(t)S r + µF − µS S Φ(t)

= r S∂F

∂S+

12

σ2S S2 ∂2F

∂S2+

∂F

∂t.

Page 391: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Uso de martingalas en la valoracion de activos derivados 383

Esto es,

r S∂F

∂S+

12

σ2S S2 ∂2F

∂S2+

∂F

∂t− F r = 0 ,

que es la ecuacion diferencial en derivadas parciales que define el precio del activoderivado en funcion del del activo subyacente.

7 Perdida y recuperacion de martingalas. Recupe-racion del drift. Ejemplos

Ejemplo 1. Modelo binomial. Cambio de medida

Sean dos activos S y T y un activo derivado F cuyos precios en t = 0 son S(0) y T (0).

Supongamos que solo hay un momento futuro t = 1, en el que se pueden dar solodos estados U y D; en ellos, los respectivos activos toman valores

S(U) = uS S(0)S(D) = dS S(0)

T (U) = uS T (0)T (D) = dS T (0)

F (U)F (D)

Para replicar el valor de F en t = 1, construimos una cartera V formada por Φunidades de S y Ψ unidades de T . Si esta cartera es replica de F , debera cumplir que

F (U) = ΦuS S(0) + ΨuT T (0) ,

F (D) = ΦdS S(0) + Ψ dT T (0) ,

F (0) = ΦS(0) + ΨT (0) .

Operando ahı obtenemos:

Φ =F (U) dT − F (D)uT

S(0) (uS dT − dS uT ),

Ψ =F (D)uS − F (U) dS

T (0) (uS dT − dS uT ),

F (0) = F (U)dT − dS

uS dT − dS uT+ F (D)

uS − uT

uS dT − dS uT.

Esa misma expresion se puede escribir de dos maneras:

Manera 1 Asumimos S como numerario.

F (0)S(0)

=F (U)S(U)

uS dT − uS dS

uS dT − dS uT+

F (D)S(D)

dS uS − dS uT

uS dT − dS uT

=F (U)S(U)

pS +F (D)S(D)

(1 − pS) .

Page 392: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

384 Eloy Fontecha

Se demuestra que, bajo ausencia de arbitraje, se ha de tener que 0 ≤ pS ≤ 1, y portanto se puede considerar como una probabilidad bajo la cual se cumple que

F (0)S(0)

= ES

(F

S

).

Ademas, dicha probabilidad la podrıamos haber obtenido sin mas que exigir que T/Sfuera martingala.

T (0)S(0)

= ES

(T

S

)= pS

uT T (0)uS S(0)

+ (1 − pS)dT T (0)dS S(0)

=⇒ pS =uS dT − uS dS

uS dT − dS uT.

Manera 2 Asumimos T como numerario.

F (0)T (0)

=F (U)T (U)

uT dT − uT dS

uS dT − dS uT+

F (D)T (D)

dT uS − dT uT

uS dT − dS uT

=F (U)T (U)

pT +F (D)T (D)

(1 − pT ) .

Se demuestra que, bajo ausencia de arbitraje, se ha de tener que 0 ≤ pT ≤ 1 y portanto se puede considerar como una probabilidad bajo la cual se cumple que

F (0)T (0)

= ET

(F

T

).

Ademas, dicha probabilidad la podrıamos haber obtenido sin mas que exigir que S/Tfuera martingala.

S(0)T (0)

= ET

(S

T

)= pT

uS S(0)uT T (0)

+ (1 − pT )dS S(0)dT T (0)

=⇒ pT =uT dT − uT dS

uS dT − dS uT.

Ejemplo 2. Pre-formula de Black y Scholes

Supongamos que tenemos un activo F cuyo precio es una martingala bajo una ciertamedida P y viene dado por la siguiente ecuacion:

dF

F= σF dw ,

donde w(t) es un proceso Weiner bajo P .

Vamos a calcular unos valores esperados que apareceran regularmente al valoraropciones de compra o venta. Dado un momento futuro T , queremos calcular, con lainformacion en t = 0,

EP

((F (T ) − K)+

)y E

P((K − F (T ))+

).

Page 393: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Uso de martingalas en la valoracion de activos derivados 385

Por el lema de Ito, es facil ver que

F (T ) = F (0) e−0.5 σ2F +σF w(T ) ,

siguiendo w(T ) una distribucion N(0, T ) bajo P .

Esos valores esperados se podrıan calcular evaluando una integral. Sin embargo,nosotros los vamos a calcular usando el Teorema de Girsanov:

EP

((F (T ) − K)+

)= E

P(1F (T )>K (F (T ) − K)

)= E

P(1F (T )>K F (T )

) − K EP

(1F (T )>K

)= E

P(1F (T )>K F (T )

) − K P (F (T ) > K) .

Pero

EP

(1F (T )>K F (T )

)= E

P(1F (T )>K F (0) e−σ2

F /2+σF w(T ))

= EQ

(1F (T )>K F (0) e−σ2

F /2+σF w(T ) ∂P

∂Q

),

donde Q es otra medida cualquiera. Si la elegimos de forma que

∂Q

∂P= e−σ2

F /2+σF w(T ) ,

tendremos

EP

(1F (T )>K F (T )

)= E

Q(1F (T )>K F (0)

)= F (0)Q(F (T ) > K) .

Por el teorema de Girsanov, eligiendo γ(t) = −σF , tendremos que w′(t) = w(t)−σF tes un proceso de Wiener bajo la medida Q, esto es, w′(t) es N(0, t) bajo Q. Por lotanto,

EP

((F (T ) − K)+

)= F (0)Q (F (T ) > K) − K P (F (T ) > K) .

Si llamamos

d1 =ln

(F (0)K

)+

σ2F

2T

σF

√T

y d2 =ln

(F (0)K

)− σ2

F

2T

σF

√T

,

tenemos:

P (F (T ) > K) = P (F (0) e−σ2F /2 T+σF w(T ) > K)

= P (F (0) e−σ2F /2 T+σF

√T ε > K) = P (ε > −d2) = N(d2) ,

Q (F (T ) > K) = Q(F (0) e−σ2F /2 T+σF (w′(T )+σF T ) > K)

= Q(F (0) eσ2F /2 T+σF

√T ε > K) = Q(ε > −d1) = N(d1) .

Page 394: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

386 Eloy Fontecha

Finalmente,

EP

((F (T ) − K)+

)= F (0)Q (F (T ) > K) − K P (F (T ) > K)= F (0)N(d1) − K N(d2)= BScall(F (0), K, T, σF , r = 0, q = 0) .

Analogamente,

EP

((K − F (T ))+

)= K P (F (T ) < K) − F (0)Q (F (T ) < K)= K N(−d2) − F (0)N(−d1)= BSput(F (0), K, T, σF , r = 0, q = 0) .

Ejemplo 3. Activo subyacente: tipo de interes de corto plazo

Sea t = 0 el momento de valoracion y sean T1 y T2 dos momentos futuros, siendoT1 < T2.

Denotemos por R(t, T1) el tipo de interes de deposito que se fija en t para undeposito que va de t a T1. Denotemos por F (t, T1, T2) el tipo FRA que se fija en tpara el perıodo que va de T1 a T2. Y llamemos P (t, T1) al tipo de descuento que sefija en t para T1.

Es claro que

F (t, T1, T2) =1

T2 − T1

(P (t, T1)P (t, T2)

− 1)

=1

T2 − T1

(P (t, T1) − P (t, T2)

P (t, T2)

).

Eligiendo P (t, T2) como numerario, existe una medida P bajo la cual F (t, T1, T2)(alguna vez lo denotaremos por F sin mas) es martingala. Si asumimos lognormalidadpara el proceso seguido por F ,

dF

F= σF dw ,

tendremos que

F (T, T1, T2) = F (0, T1, T2) e−σ2F /2 T+σF

√T ε ,

F (0, T1, T2) = EP (F (T, T1, T2)) = E

P (F (T1, T1, T2)) = EP (R(T1, T2)) ,

con w(T ) siguiendo una distribucion N(0, T ) bajo P .

Valoremos una serie de activos V (t):

• Deposito a tipo variable, que paga en T2 una cantidad igual a R(T1, T2).Elegimos como numerario P (t, T2):

V (0) = P (0, T2) EP

(V (T2)

P (T2, T2)

)= P (0, T2) E

P (R(T1, T2)) = P (0, T2)F (0, T1, T2) .

Page 395: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Uso de martingalas en la valoracion de activos derivados 387

• Cap, que paga en T2 una cantidad igual a (R(T1, T2) − K)+. Elegimos comonumerario P (t, T2):

V (0) = P (0, T2) EP

(V (T2)

P (T2, T2)

)

= P (0, T2) EP

((F (T1, T1, T2) − K)+

)= P (0, T2)BScall (F (0, T1, T2),K, T1, σF , r = 0, q = 0) .

• Cualquier pay-off pagadero en T2, que paga en T2 una cantidad igual af(R(T1, T2)). Elegimos como numerario P (t, T2):

V (0) = P (0, T2)EP

(V (T2)

P (T2, T2)

)= P (0, T2) E

P (f(F (T1, T1, T2)))

= P (0, T2) EP

(f

(F (0, T1, T2) e−σ2

F /2 T1+σF

√T1 ε

))= P (0, T2)

∫ +∞

−∞f

(F (0, T1, T2) e−σ2

F /2 T1+σF

√T1 ε

) 1√2π

e−ε2/2 dε .

Ejemplo 4. Activo subyacente: tipo de interes de corto plazo“distorsionado”

Supongamos ahora que el activo subyacente es el mismo que antes, solo que no generaun flujo en T2 sino en T1 (In Arrears).

Observese que bajo el numerario P (t, T1), F (t, T1, T2) ya no es martingala. Engeneral, vamos a tener dos opciones para resolver estos problemas de “perdida de lasmartingalas”:

• Solucion 1: mantener como numerario P (t, T2), de tal manera que F (t, T1, T2)siga siendo martingala. De esta manera apareceran mas activos cuya volatilidady correlacion con F deberemos conocer.

• Solucion 2: cambiar de numerario P (t, T2), de tal manera que no aparezcanmas activos cuya volatilidad y correlacion con F debamos conocer. En este caso,F (t, T1, T2) ya no sera martingala y por lo tanto deberemos calcular su drift.

Veamoslo con los ejemplos anteriores: sea el activo derivado V (t) que paga en T1 unacantidad dada por f(R(T1, T2)).

Page 396: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

388 Eloy Fontecha

Solucion 1 Elegimos como numerario P (t, T2):

V (0) = P (0, T2) EP

(V (T2)

P (T2, T2)

)

= P (0, T2) EP (f (F (T1, T1, T2)) (1 + F (T1, T1, T2) (T2 − T1)))

= P (0, T2) EP (g (F (T1, T1, T2)))

= P (0, T2) EP

(g

(F (0, T1, T2) e−σ2

F /2 T1+σF

√T1 ε

))

= P (0, T2)∫ +∞

−∞g

(F (0, T1, T2) e−σ2

F /2 T1+σF

√T1 ε

) 1√2π

, e−ε2/2 dε .

Solucion 2 Elegimos como numerario P (t, T1). Sea Q la medida bajo la que losprecios de los activos relativos al numerario son martingalas.

V (0) = P (0, T1) EQ

(V (T1)

P (T1, T1)

)= P (0, T1) E

Q (f (F (T1, T1, T2))) .

Ahora tenemos que calcular el drift de F bajo esa medida. Para ello elegimos otroactivo derivado dependiente de F (T1, T1, T2) cuyo valor sı sepamos calcular. Elijamosun contrato forward con expiracion en T1 de un bono cupon cero que expira en T2.Su precio spot es P (t, T2). Su precio forward en T1 sera

P (t, T1, T2) =P (t, T2)P (t, T1)

=1

1 + F (t, T1, T2) (T2 − T1).

Dadas esas expresiones, es claro que P (t, T1, T2) es martingala bajo Q. Supongamosque el proceso seguido por F (t, T1, T2) bajo Q es

dF

F= µF dt + σF dw ,

F (T, T1, T2) = F (0, T1, T2) eµF T e−σ2F /2 T+σF

√T ε ,

con w(T ) siguiendo una distribucion N(0, T ) bajo Q.

Observese que, conocido µF , podemos proceder igual que en el caso estandar sinmas que sustituir F (0, T1, T2) por el tipo forward ajustado de convexidad,

F (0, T1, T2) eµF T1 .

Ahora bien,

P (t, T1, T2) = EQ(P (T1, T2)) = E

Q

(1

1 + F (T1, T1, T2) (T2 − T1)

)

= EQ

(1

1 + F (0, T1, T2) eµF T1 e−σ2F /2 T1+σF

√T1 ε (T2 − T1)

).

Page 397: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Uso de martingalas en la valoracion de activos derivados 389

Solo resta calcular el valor de µF que hace cierta esa igualdad.

Otra forma de calcular el drift de F serıa:

F (0, T1, T2) eµF T1 = EQ (F (T1, T1, T2))

=P (0, T2)P (0, T1)

EP

(F (T1, T1, T2)

P (T1, T1)P (T1, T2)

)

=P (0, T2)P (0, T1)

EP (F (T1, T1, T2) (1 + F (T1, T1, T2) (T2 − T1))) ,

expresion que se puede calcular, puesto que F (t;T1, T2) es martingala bajo P .

Ejemplo 5. Activo subyacente: tipo de interes de corto plazo“distorsionado”

Supongamos ahora que el activo subyacente es el mismo que antes, solo que no generaun flujo ni en T2 ni en T1, sino en T3 > T2.

Observese que, bajo el numerario P (t, T3), F (t, T1, T2) ya no es martingala.

Solucion 1 Elegimos como numerario P (t, T2) y la medida por tanto P .

V (0) = P (0, T2) EP

(V (T2)

P (T2, T2)

)= P (0, T2) E

P

(f (F (T1, T1, T2))

(1 + F (T2, T2, T3) (T3 − T2))

).

Bajo P sabemos que F (t, T1, T2) es martingala, pero no lo es F (t, T2, T3). Sin embargo,ya sabemos calcular el ajuste de convexidad que deberıamos aplicar a F (t, T2, T3) bajoesa medida.. Esto es, bajo la medida P podemos calcular esa integral asumiendo losprocesos:

dF (t, T1, T2)F (t, T1, T2)

= σF (t,T1,T2) dwF (t,T1,T2) ,

dF (t, T2, T3)F (t, T2, T3)

= µF (t,T2,T3) dt + σF (t,T2,T3) dwF (t,T2,T3) ,

con (wF (t,T1,T2), wF (t,T2,T3)) un proceso de Wiener bivariante con dos volatilidades yuna correlacion.

Solucion 2 Elegimos como numerario P (t, T3) y Q la medida asociada:

V (0) = P (0, T3) EQ

(V (T3)

P (T3, T3)

)= P (0, T3) E

Q (f (F (T1, T1, T2))) .

Ahora tenemos que calcular el drift de F bajo esa medida. Para ello elegimos otroactivo derivado dependiente de F (T1, T1, T2) cuyo valor sı sepamos calcular.

Page 398: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

390 Eloy Fontecha

Elijamos un contrato consistente en invertir una unidad en T1 en un bono cuponcero hasta T2 y desde T2 reinvertirlo todo hasta T3. El valor de este activo en t = 0es P (0, T1) y su valor en T3 sera

(1 + F (T1, T1, T2)(T2 − T1)) (1 + F (T2, T2, T3)(T3 − T2)) .

Por lo tanto,

P (0, T1)P (0, T3)

= EQ

((1 + F (T1, T1, T2) (T2 − T1)) (1 + F (T2, T2, T3) (T3 − T2))

P (T3, T3)

)

= EQ ((1 + F (T1, T1, T2) (T2 − T1)) (1 + F (T2, T2, T3) (T3 − T2))) ,

asumiendo

dF (t, T1, T2)F (t, T1, T2)

= µF (t,T1,T2) dt + σF (t,T1,T2) dwF (t,T1,T2) ,

dF (t, T2, T3)F (t, T2, T3)

= σF (t,T2,T3) dwF (t,T2,T3) ,

dado que F (t, T2, T3) es martingala bajo Q y siendo (wF (t,T1,T2), wF (t,T2,T3)) un pro-ceso de Wiener bivariante con dos volatilidades y una correlacion. Ahora deberıamoscalcular el valor del drift de F (t, T1, T2) que hace cierta esa igualdad dadas las vola-tilidades y correlacion cotizadas.

Otra forma de calcular el drift de F serıa:

F (0, T1, T2) eµF T1 = EQ (F (T1, T1, T2)) =

P (0, T2)P (0, T3)

EP

(F (T1, T1, T2)

P (T1, T3)P (T1, T2)

)

=P (0, T2)P (0, T3)

EP

(F (T1, T1, T2)

(1 + F (T1, T1, T2) (T2 − T1))(1 + F (T1, T1, T3) (T3 − T1))

),

expresion que se puede calcular puesto que F (t, T1, T2) es martingala bajo P y el driftde F (t, T1, T3) bajo P ya lo sabemos calcular del ejemplo anterior.

Ejemplo 6. Activo subyacente: activo cualquiera

Sea t = 0 el momento de valoracion, y sea T un momento futuro. Denotemos porS(t) el precio spot que vemos en t, por F (t, T ) el precio forward que se fija en t paraentrega en T y por P (t, T ) al tipo de descuento que se fija en t para T . Es claro que

F (t, T ) =S(t)

P (t, T ).

Eligiendo P (t, T ) como numerario, existe una medida P bajo la cual F (t, T ) (algunavez lo denotaremos por F sin mas) es martingala. Si asumimos lognormalidad parael proceso seguido por F ,

dF

F= σF dw ,

Page 399: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Uso de martingalas en la valoracion de activos derivados 391

tendremos que

F (t, T ) = F (0, T ) e−σ2F /2 T+σF

√T ε ,

F (0, T ) = EP (F (T, T )) = E

P (S(T )) ,

con w(T ) siguiendo una distribucion N(0, T ) bajo P .

De la misma manera que en el ejemplo 3, ya sabrıamos valorar cualquier activoderivado consistente en un flujo dependiente de S(T ) y que se paga en T .

Supongamos que el derivado paga en T una cantidad igual a f(S(T )). Elegimoscomo numerario P (t, T ):

V (0) = P (0, T ) EP

(V (T )

P (T, T )

)= P (0, T ) E

P (f(F (T, T )))

= P (0, T ) EP

(f(F (0, T ) e−σ2

F /2 T+σF

√T ε

)= P (0, T )

∫ +∞

−∞f

(F (0, T ) e−σ2

F /2 T+σF

√T ε

) 1√2π

e−ε2/2 dε .

En el supuesto de que el pay-off fuera el de una call o una put, esa integral lareducirıamos a las expresiones ya conocidas.

Ejemplo 7. Activo subyacente: activo cualquiera “distorsiona-do”

Supongamos ahora que el activo subyacente es el mismo que antes, solo que no generaun flujo en T sino en T1 > T . Observese que, bajo el numerario P (t, T1), F (t, T ) yano es martingala.

Solucion 1 Elegimos como numerario P (t, T ) y la medida por tanto P :

V (0) = P (0, T ) EP

(V (T )

P (T, T )

)= P (0, T ) E

P

(f (F (T, T ))

(1 + F (T, T, T1) (T1 − T ))

).

Bajo P sabemos que F (t, T ) es martingala, pero no lo es F (t, T, T1). Sin embargo yasabemos calcular el ajuste de convexidad que deberıamos aplicar a F (t, T, T1) bajoesa medida. Esto es, bajo la medida P podemos calcular esa integral asumiendo losprocesos:

dF (t, T )F (t, T )

= σF (t,T ) dwF (t,T ) ,

dF (t, T, T1)F (t, T, T1)

= µF (t,T,T1) dt + σF (t,T,T1) dwF (t,T,T1) ,

con (wF (t,T ), wF (t,T,T1)) proceso de Wiener bivariante con dos volatilidades y unacorrelacion.

Page 400: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

392 Eloy Fontecha

Solucion 2 Elegimos como numerario P (t, T1) y Q la medida asociada:

V (0) = P (0, T1) EQ

(V (T1)

P (T1, T1)

)= P (0, T1) E

Q (f (F (T, T ))) .

Ahora tenemos que calcular el drift de F bajo esa medida. Para ello elegimos otroactivo derivado dependiente de F (T, T ) cuyo valor sı sepamos calcular.

Elijamos un contrato consistente en comprar forward con expiracion en T unaunidad de activo y el beneficio o perdida experimentado en T reinvertirlo o financiarlohasta T1. El valor de este contrato en t es 0 y su valor en T1 sera

(F (T, T ) − F (t, T )) (1 + F (T, T, T1)(T1 − T )) .

Por lo tanto,

0 = EQ

((F (T, T ) − F (t, T )) (1 + F (T, T, T1) (T1 − T ))

P (T1, T1)

)= E

Q ((F (T, T ) − F (t, T )) (1 + F (T, T, T1) (T1 − T ))) ,

asumiendo

dF (t, T )F (t, T )

= µF (t,T ) dt + σF (t,T ) dwF (t,T ) ,

dF (t, T, T1)F (t, T, T1)

= σF (t,T,T1) dwF (t,T,T1) ,

dado que F (t, T, T1) es martingala bajo Q y siendo (wF (t,T ), wF (t,T,T1)) proceso deWiener bivariante con dos volatilidades y una correlacion. Ahora deberıamos calcularel valor del drift de F (t, T ) que hace cierta esa igualdad dadas las volatilidades ycorrelacion cotizadas.

Para calcular el drift de F tambien podrıamos haber hecho lo siguiente:

EQ (F (T, T )) = F (0, T ) eµF T =

P (0, T )P (0, T1)

EP

(P (T, T1)P (T, T )

F (T, T ))

=P (0, T )P (0, T1)

EP (P (T, T1)F (T, T )) ,

expresion que se puede calcular en terminos de las volatilidades y correlacion entreP (t, T, T1) y F (t, T ) ambos martingalas bajo la medida P .

Ejemplo 8. Activo subyacente: swap

Sea t = 0 el momento de valoracion, y sea T un momento futuro.

Denotemos por S(t) el tipo que vemos en t para un swap que comienza en t0 > Ty paga cupones en fechas t1, t2, . . . , tn con sendas bases entre fechas: b1, b2, . . . , bn;

Page 401: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Uso de martingalas en la valoracion de activos derivados 393

por P (t, ti) al tipo de descuento que se fija en t para ti, y por 01(t) el precio de unactivo formado por tantas unidades del bono cupon cero de expiracion ti como indicala base bi, y esto para cada i desde 1 a n. Esto es,

01(t) =n∑

i=1

P (t, ti) bi .

Es claro que

S(t) =P (t, t0) − P (t, tn)

01(t).

Eligiendo 01(t) como numerario, existe una medida P bajo la cual S(t) (alguna vezlo denotaremos por S sin mas) es martingala. Si asumimos lognormalidad para elproceso seguido por S,

dS

S= σS dw ,

tendremos que

S(T ) = S(0) e−σ2S/2 T+σS

√T ε ,

S(0) = EP (S(T )) ,

con w(T ) siguiendo una distribucion N(0, T ) bajo P .

De la misma manera que en el ejemplo 3, ya sabrıamos valorar cualquier activo de-rivado consistente en un conjunto de flujos que se pagan en las mismas fechas t1, . . . , tny que se obtienen multiplicando una cierta funcion de S(T ) por las correspondientesbases.

Esto es, supongamos que el derivado paga en ti una cantidad igual a f(S(T )) bi.Elegimos como numerario 01(t):

V (0) = 01(0) EP

(V (T )01(T )

)= 01(0) E

P

(f(S(T )) 01(T )

01(T )

)

= 01(0) EP (f(S(T ))) = 01(0) E

P(f(S(0) e−σ2

S/2 T+σS

√T ε)

)= 01(0)

∫ +∞

−∞f(S(0) e−σ2

S/2 T+σS

√T ε)

1√2π

e−ε2/2 dε .

En el supuesto de que el pay-off fuera el de una call o una put, esa integral lareducirıamos a las expresiones ya conocidas. Si por ejemplo es un payers swaption defecha de expiracion T , tendrıamos

V (0) = 01(0) EP

(V (T )01(T )

)= 01(0) E

P

((S(T ) − K)+ 01(T )

01(T )

)= 01(0) E

P((S(T ) − K)+

).

Page 402: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

394 Eloy Fontecha

Ejemplo 9. Activo subyacente: swap “distorsionado”. CMS

Supongamos ahora que el activo subyacente es el mismo que antes, solo que no generauna serie de flujos en t1, . . . , tn de la forma mencionada en el ejemplo anterior, sinoque genera un flujo unico S(T ) en T . Observese que bajo el numerario P (t, T ), S(t)ya no es martingala.

Elegimos como numerario P (t, T ). Sea Q la medida asociada:

V (0) = P (0, T ) EQ

(V (T )

P (T, T )

)= P (0, T ) E

Q (f (S(T ))) .

Ahora tenemos que calcular el drift de S(t) bajo esa medida. Para ello consideramoscomo activo un bono que paga en las mismas fechas que el swap a un tipo igual al quese fija para el swap en t = 0, esto es S(0). El precio de este contrato es obviamenteigual a cero. Por tanto,

0 = P (0, T ) EQ

(V (T )

P (T, T )

)= P (0, T ) E

Q (01(T ) (S(t) − S(T )) .

Bajo esa medida, S(t) tendra un drift que es lo que queremos calcular.

Por otra parte, 01(t) tampoco es martingala bajo esa medida. De hecho es unasuma de tipos de descuento, que tendran una matriz de varianzas y covarianzas ycuyo drift se debe obtener mediante tecnicas similares a las ya vistas para activos.

Ejemplo 10. Activo subyacente: tipo cupon cero compuesto

Supongamos que queremos valorar en t = 0 un derivado que paga en T1 un flujo quees funcion del tipo implıcito, R(T, T1), en el precio en T , P (T, T1), de un bono cuponcero de vencimiento T1. Asumimos que el tipo implıcito es cupon cero, esto es,

P (T, T1) =1

(1 + R(T, T1))(T1−T ).

Si consideramos el precio forward en t con entrega en T que vemos para ese bono:

P (t, T, T1) =1

(1 + F (t, T, T1))(T1−T ).

Para calcular el precio del derivado tomamos como numerario P (t, T ) y la medidaasociada P :

V (0) = P (0, T ) EP

(f(F (T, T, T1))P (T, T1)

P (T, T )

)= P (0, T ) E

P (f(F (T, T, T1))P (T, T1)) .

Page 403: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Uso de martingalas en la valoracion de activos derivados 395

Pero F (t, T, T1) no es martingala bajo P . Sin embargo P (t, T, T1) sı lo es:

P (t, T, T1) = EP (P (T, T, T1)) = E

P

(1

(1 + F (T, T, T1))(T1−T )

).

De esa expresion deducimos el drift de F (t, T, T1) bajo la medida P .

Referencias

[1] Baxter, M., Rennie A. (1996), “Financial Calculus. An Introduction to DerivativePricing”. Cambridge University Press, Cambridge.

[2] Musiela, M., Rutkowski, M. (1997), “Martingale Methods in Financial Mode-lling”. Springer-Verlag.

Eloy Fontecha FernandezBBVA

Vıa de los Poblados, s/n28036-Madrid

e-mail: [email protected]

Page 404: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM
Page 405: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Modelos multivariantes de

valoracion de bonos convertibles

con riesgo de credito

Jesus Perez Colino1

Resumen

El bono convertible es la estructura financiera mas compleja, versatil ylıquida, de cuantos se conocen en los mercados en la actualidad. Este tipode bonos agrupa subyacentes de diferente naturaleza: por un lado la evolucionde la accion, la evolucion de los tipos de interes libre de riesgo, el spread decredito del propio emisor y una prima de liquidez. El trabajo que se presentaes tanto una descripcion de los conceptos basicos y componentes de un bonoconvertible, como de los diferentes modelos publicados, desde los mas sencillosmodelos univariantes, hasta los modelos multivariantes que intentan introducirla prima de riesgo de credito del emisor, que es realmente, el centro de estetrabajo2.

1 Introduccion a los bonos convertibles

1.1 Definicion

El bono convertible es cualquier activo de renta fija (bonos, acciones preferenciales,etc.) que sea o pueda ser, en cualquier momento o en un determinado momento,transformados o convertidos en un numero de acciones determinadas, o en su valormonetario, o en opciones sobre dichas acciones que permitan al tenedor del bono lacompra de un numero de tıtulos a un determinado precio, en un determinado momentoo durante un periodo de tiempo (continuo o discreto).

Pero esta definicion de convertible tambien incluye la posibilidad de “convertiblessinteticos”, los cuales pueden ser creados como una combinacion de activos, cuya cestada lugar a otro activo con las dos principales caracterısticas de un convertible: unflujo de renta fija, y un derecho de compra sobre un titulo de renta variable o derechode rentabilidad.

1Jesus Perez Colino era, en el momento de realizar este trabajo, el Director del Departamento deProduct Research del Area de Mercado de Capitales de Caja Madrid. En la actualidad es gerentede Accenture en el Area de Financial Services. Esta charla se impartio en la sesion del SeminarioMEFF-UAM de diciembre de 1999.

2El autor desea agradecer expresamente el apoyo y soporte prestado por Carlos Contreras Gomez,entonces Director de Mercado de Capitales de Caja Madrid, sin el cual este trabajo, y muchos otrosde mi carrera, no hubiesen sido posibles.

Page 406: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

398 Jesus Perez Colino

1.2 Conceptos basicos

Los diferentes conceptos que se deberan manejar para poder valorar dichos activosson los siguientes:

• Par Value: valor nominal del bono.

• Issue Value: valor al cual el bono es emitido (normalmente a la par).

• Redemption Price: valor al que el bono no convertido a vencimiento sera amor-tizado.

• Conversion ratio: numero de acciones que recibirıa el inversor en caso de con-version, por cada bono.

Page 407: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Modelos multivariantes de valoracion 399

• Parity or Conversion Value: ratio de conversion por el valor de la accion.

• Conversion Price: precio al cual la accion debe cotizar para que tenga lugar laconversion.

• Conversion Premium: porcentaje de diferencia entre la paridad y el ConversionPrice.

• Dividend yield : tasa de dividendos.

• Current yield : tasa de rentabilidad anual del bono convertible (cupon/preciobono convertible).

• Yield advantage: diferencia entre el Current yield y el Dividend yield.

Especialmente interesantes son las siguientes caracterısticas:

• Conversion Privilege . El privilegio de conversion se describe normalmenteen terminos de precio o ratio de conversion, es decir, como el numero de accionesque se obtienen de la conversion de un bono de nominal 1000$. Habitualmente,en el momento de emision el precio de conversion suele situarse entre un 15 yun 30% del precio de mercado de la accion.

• Coupon . Es logico que el cupon que se paga en este tipo de emisiones esteentre 300–400 bps por debajo del bono corporativo de identico riesgo (en media,dependiendo del plazo y estructura).

• Maturity . Inicialmente, los bonos convertibles se emitıan con vencimientos deveinte anos o mas, pero, tras los fuertes crecimientos bursatiles de la decada delos 80, el vencimiento medio se ha reducido por debajo de los diez anos. Sinembargo, todavıa es posible ver Convertible preferreds bonds perpetuos (con cally/o put).

• Call Protection . Opciones de amortizacion anticipada por parte del emisor noaparecieron en los bonos convertible hasta inicios de los 80, cuando numerosasemisiones se estaban amortizando anticipadamente en periodos menores al anoe incluso los seis meses, con el resultado de que el inversor se veıa forzado a laconversion, perdiendo el cupon corrido hasta el momento de la conversion.

Actualmente, existen dos tipos de protecciones contra las amortizaciones anti-cipadas, hard call protection, que prohıbe las amortizaciones anticipadas bajodeterminadas circunstancias, y las Provisional or soft call protection, que limitalas posibilidades de amortizacion a que se den determinadas circunstancias enel precio del subyacente.

Page 408: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

400 Jesus Perez Colino

1.3 ¿Que da valor a un bono convertible?

A un bono convertible le dan valor las siguientes caracterısticas:

+ Cupon alto, emision bajo par, baja prima de conversion.

+ Largo periodo hasta la primera call del principal por parte del emisor.

+ Proteccion contra el efecto dilucion que genera la propia conversion sobre elvalor de las acciones.

+ Compensacion ante sucesos extraordinarios como el reparto de dividendos es-peciales.

+ Clausula del “Inversor despistado”, que permite amortizaciones al precio maxi-mo de la accion.

+ Inmediatamente convertible y de forma continua.

+ Deuda senior.

+ Proteccion ante cambio en el control de la companıa.

+ Proteccion ante posibilidad de quiebra o default.

+ Proteccion ante el impago de dividendos/cupones.

De igual forma, le quitarıa valor a una estructura convertible,

− Cupon bajo o cero, emision a la par (o sobre par), alta prima de conversion.

− “Callability” inmediatamente posterior al momento de la emision.

− Proteccion basica, como a stocks splits.

− No existencia de compensaciones a los inversores por bonus o excesos de divi-dendos.

− El inversor debera recordar en todo momento la opcion de conversion.

− Convertibilidad limitada en tiempo o valor del subyacente, incluyendo la alter-nativa del cash.

− Subordinada.

− Sin referencias al cambio de control en la companıa.

− Sin proteccion ante quiebra.

− Sin primas de pago en siguientes cupones por impago del anterior.

Page 409: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Modelos multivariantes de valoracion 401

1.4 Tipologıa de bonos convertibles

LYONs (Liquid Yield Option Notes). Bonos convertibles introducidos por MLen 1985, como bonos cupon cero convertibles en cualquier momento de la vida delbono, valorados normalmente entre el 20 y el 40% de la par para dar una YTM 4–7%(largo plazo), normalmente con hard/soft put options, y cinco anos de call protection,e interesantes ventajas fiscales para el emisor (deduce el cupon corrido).

TOPrS (Trust Originted Preferred Securities). Bono convertible de preferentesque paga trimestralmente dividendos (in arrears), de vencimiento a largo plazo, concall protection de 3–5 anos, y emitido por una sociedad intermediadora (Trust) quecompra deuda subordinada del mismo plazo e identico riesgo y coletariza la emisiondel bono convertible. Esta estructura aparecio fundamentalmente para aprovechar lasventajas fiscales que ofrecen determinados estados americanos a las trust.

Convertible MIPS (Monthly Income Preferred Securities). Son introducidospor primera vez en 1994, y emitidos especialmente por una SPS (Special PurposeSubsidiary), la cual no es mas que una sociedad (normalmente limitada) que emitey vende el MIPS, comprando deuda de identico vencimiento al emisor. Vencimiento30 anos con cinco anos de call protection, prima de conversion del 20–25% y pagadividendos in arrears. Excelentes ventajas fiscales y crediticias.

PERCS (Preferred Equity Redemption Cumulative Stock). Bonos converti-bles emitidos a tres anos, con un cap de apreciacion del subyacente al 30–35%, emitido

Page 410: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

402 Jesus Perez Colino

normalmente a la par, sin proteccion a la baja, paga cupones por encima de mercado,con hard call, y solo convertible a vencimiento (lo que genera problemas de coberturaserios segun nos aproximamos al vencimiento). Otras estructuras similares son losMCPDPS, TARGETS, YES, CHIPS, ELKS, EYES, PERQS, o YEELDS.

PRIDES (Prederred Redeemable Increased Dividend Equity Securities).Bono convertible introducido por primera vez en 1993, normalmente construido comoaccion preferente con opcion a intercambio por un numero de acciones “normales”a un ratio de conversion variable en funcion del valor del subyacente, a cambio deun dividendo por encima del de mercado, y con vencimiento de aproximadamente3 - 4 anos, tres anos de call protection, prima de conversion entre 20 y 30%, quepaga dividendos trimestralmente (normalmente in advance). Este tipo de estructurasno ofrece proteccion ante caıdas, y sin embargo tampoco ofrecen todo el valor de lasubida del activo. Otras estructuras similares son los ACES, DECS, MARCS, PEPS,o SAILS.

Reset PRIDES. Accion preferente con opcion de conversion a acciones normales,con ratios de conversion inversamente proporcionales al valor del subyacente, propor-cionando ante subidas del subyacente revalorizaciones por debajo de mercado, y sicae, perdidas inferiores. Normalmente emitido a tres anos a la par frente al subya-cente, paga dividendos trimestrales con rentabilidades entre 3 - 4 p.p. por encima delrendimiento de la accion normal.

Feline PRIDES. Fundamentalmente consiste en la compra a futuro de acciones (aunas determinados ratios de conversion) con un colateral, que normalmente puedeintercambiarse entre Corporate Debt o Treasury (verdaderamente se convierte en unaunidad mas basica denominada Income PRIDE, que a su vez se puede separar en elsecundario en un Growth PRIDES (contrato forward combinado con Treasury) y unTOPrS). Es una estructura compleja pero que permite ser personalizada a traves decombinaciones de sus partes basicas (lıquidas) en el secundario.

Enhanced PRIDES. Consisten en bonos libres de riesgo que pagan el cupon delTreasury mas un cupon de un “Yield enhanced payments” con un contrato forwardde compra de stock a ratios entre 0.83 y 1 dependiendo del precio de mercado. Conesta estructura se elimina en parte el riesgo de credito del emisor.

Flex Caps. Accion preferente con opcion de conversion a “common stock” queparticipa del 100% de la revalorizacion de la accion hasta un determinado nivel o cap(al 50%) 3 anos de vida, callable, y ofrece normalmente entre 3 y 4 p.p. por encimadel rendimiento de la accion normal.

STRYPES (STRuctured Yield Products Exchangeable for Stock). Estructu-ra (convertible sintetico) emitida por un broker o trust, que compra a futuro accionescomunes de una companıa y los emite en un estructurado. El inversor acepta el riesgobroker o utiliza bonos Treasury como colateral, y el vendedor del futuro suele tenerla opcion de pagar a vencimiento con cash o equity.

Page 411: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Modelos multivariantes de valoracion 403

1.5 Historia

Este tipo de activos tuvo su origen en el “mandatory convertibles” emitido por primeravez en abril de 1982 por la companıa norteamericana Manufactures Hannover, comobono a 10 anos que a su vencimiento pagaba principal en forma de acciones de la propiacompanıa. Este tipo de emision rapidamente se hizo popular en Estados Unidos, yya en 1984 el 40% del total de emisiones lanzadas por las 50 mayores companıasnorteamericanas tenıan la forma de mandatory convertibles.

Despues de una rapida expansion en el mercado americano, este producto se fuetransformando y desarrollando (como las Equity Commiment Note de JPMorgan),hasta que en enero de 1986 llega al Euromercado, con una emision de Thomson-BrantInternational, garantizada por Thomson SA., de 50 millones de dolares en equitycontract notes con un cupon del 8%, y opcion de vencimiento anticipado para eltenedor del bono (puttable americano) desde septiembre de 1986, de 6,194 accionespor cada 1.000$ del principal.

Variantes europeas de los mandatory convertible fueron los bonos Balladur, emiti-dos por el Gobierno frances en 1991, que daban derecho preferencial en la participacionde los procesos de privatizacion de companıas francesas; o los emitidos por SwedishSteel en 1992, bonos cupon cero con un warrant sobre acciones de su propia companıa.

Desarrollos posteriores de convertibles en el mercado americano fue el Debt Ex-changeable for Common Stock (DECS), emitido por primera vez por American Ex-press en Octubre de 1993, como bonos a tres anos con cupon fijo del 6,25%, que avencimiento devuelve el principal en acciones (o su valor) de Frist Data Corporation,del siguiente modo: si el precio de la accion se situaba por debajo de 36,75$ (precio al

Page 412: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

404 Jesus Perez Colino

que cotizaban las acciones en el momento de la emision del bono) el emisor recibirıa1 accion, mientras que si cotizara por encima de 44,875$ obtendrıa el 0.82 de unaaccion, ajustandose dicho ratio en el tramo intermedio en el break even del inversor(cap sobre el precio de la accion), por lo que dicha estructura solo permite recogerun 22% de la revalorizacion de la accion, mientras asume todo el riesgo de caıda deprecio del stock.

En la estructura del DECS el activo es un bono, mientras que en un PECS (Pre-ferred Exchangeable for Common Stocks) el activo es una accion preferente solo deli-mitada, generalmente, por un cap.

Otro ejemplo interesante fue la emision, en abril de 1995, de 75 millones de dolaresen “DECS sinteticos” llamados STEP (Securities Tied to Equity Performance) emi-tidos por JP Morgan con el objeto de liberarse de una posicion excesivamente largaen acciones de la companıa americana America Online.

Existen numerosas variaciones sobre las estructuras DECS. En julio de 1995 MerrillLynch construyo un Structured Yield Product Exchangeable for Stocks (STRYPES)que transcurridos 3 anos se convertıan en el 10% de MGIC Investment Corporation,lo que permitio al cliente de Merrill Lynch deshacerse de la mitad de la cartera sobredicha companıa. Una emision de similares caracterısticas fue la de Houghton Mifflinusando una estructura Stock Appreciation Income Linked Securities (SAILS) para laventa de 119 millones de dolares de acciones de Inso Corporation.

Otra interesante estructura de STRYPES fue la emision de la companıa Brow-ning Ferris International, en junio de 1995. En este caso, el emisor recibıa U.S. Trea-sury Bonds, con un valor identico al precio de la oferta, mas la obligacion de comprapor parte del inversor de acciones de BFI al vencimiento del bono, donde principalmas cupon sera reinvertidos en acciones de BFI. Luego, lo que hace en realidad BFI esuna venta forward de acciones, aunque el numero de acciones emitidas puede variar,como en la estructura de los DECS, es decir, y para este caso concreto, si en tres anosel precio del stock esta por debajo del precio de oferta, entonces el inversor recibe 1accion, y si esta por encima recibe el 0.8% de la accion.

Un nuevo tipo de bono convertible aparece en noviembre de 1993, denominandoseConvertible Exchangeable y permitıa al inversor sustituir el bono bien por accionespreferentes o bien por otro bono que pagara el mismo tipo que dichas acciones prefe-rentes. Un caso interesante de un tipo similar de activos fue la emision de BarclaysBank en ese mismo ano de 300 millones de dolares de lo que se llamo ConvertibleCapital Notes. La estructura disenada permitıa a Barclays emitir deuda perpetua al8%, libre de retenciones impositivas en Estados Unidos, las cuales podıan convertirseen cualquier momento en acciones preferentes.

Una tecnica similar fue utilizada en la emision de 1993 de Bankers Trust, de 150millones de dolares en Prefered Purchase Units. Esta emision consistio en la emisionde deuda subordinada a 40 anos que paga cupon al 7,625% y callable al quinto ano. Elinversor disponıa del derecho de convertir el bono en una accion preferente al mismo

Page 413: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Modelos multivariantes de valoracion 405

tipo, Bankers Trust, sin embargo, disponıa de la opcion de previa comunicacion 60 dıasantes reducir el cupon un 1,5% en cualquier momento, lo cual forzarıa la conversiona acciones preferentes.

Una nueva estructura interesante, Fixed/Floating Convertibles, aparece en 1993,cuando BOT Cayman Finance Ltd., entidad subsidiaria del Bank of Tokyo, emitio cin-cuenta mil millones de yenes en bonos subordinados perpetuos que pagaban un cupondel 4,25% hasta marzo del 2003, y despues Libor yen + 1,8, un tipo lo suficientementebajo como para forzar al inversor a convertir el bono en acciones.

Los bonos de cupon cero convertibles aparecen por primera vez en abril de 1985,como LYONS (Liquid Yield Options Notes), caracterizados por ser bonos de largoplazo (de 15 a 20 anos) emitidos al descuento y con opcion para el inversor de con-vertibilidad cada cinco anos de acuerdo con unos ratios de convertibilidad similaresa los de un DECS. Sin embargo, Merrill Lynch en noviembre de 1994 se sale de lanorma, creando lo que luego se denomino Exchangeable LYONS en una emision paraMicrosoft de bonos cupon cero con vencimiento en 4,6 anos, precio de emision cerca-na a la par y pago de prima al vencimiento, con convertibilidad. Este tipo de bonoconvertible ha recibido un especial tratamiento teorico, por McConnell y Schwartz(1986), ofreciendo una solucion analıtica como ecuacion diferencial estocastica conunas determinadas condiciones de contorno.

En 1994 aparecen bonos convertibles, con ajuste anual del precio o ratio de conver-sion, emitidos por Royce Value Trust con el nombre de ICONS (Investment CompanyConvertible Notes). Fueron emitidos 60 millones de dolares en bonos a 10 anos con-vertibles en acciones de Royce.

En julio de 1996 aparece emitido en el mercado de convertibles el primer PARCKS(Puttable and Redeemable Convertible Knockout Securities) en una emision del Bancode Bangkok, con valor de 350 millones de dolares. Estos son bonos convertibles enacciones subyacentes del emisor, pero que a los cinco anos pueden ser amortizadosanticipadamente a peticion del inversor a un precio entre el 123,5 y el 127,5 por ciento,si el precio de la accion es menor que un predeterminado nivel, situado un 7% porencima del nivel que nos darıa un precio del bono del 130%. Lo que obtenemos es unbono convertible puttable con opcion knockout.

Otra sorprendente variacion de bono convertible, sobre todo por su exito, aparecioa principios de 1997, emitido por Indian Petrochemicals Corporations por una cuantıade 150 millones de dolares de Credit Enhanced Debt Indexed to Stock (CREDITS), unbono convertible cuyo principal fue garantizado por una carta de credito del Bank ofAmerica, lo que le permitio financiarse hasta 155 p.b. por debajo del tesoro americano.

Se conocen como “Convertibles sinteticos” aquellos bonos que a fecha de venci-miento devuelven el principal en dinero (no activo), pero con una rentabilidad ligadaal valor de las acciones de determinada companıa. La primera emision de este tipode bono aparecio en junio de 1991, emitido por la companıa francesa Lafarge Coppe,a la que le sigieron otras empresas francesas como Carrefour, Louis Vuitton, Moet

Page 414: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

406 Jesus Perez Colino

Hennessy, y Pernod Ricard. El emisor consigue financiarse por debajo del PIBORsin sufrir el efecto dilucion que sufren el valor de las acciones de la companıa en elmomento de la convertibilidad del bono por acciones.

Por ultimo, como curiosidad, destacar el Risk Insurance Convertible, una estruc-tura de bono convertible realmente extrana, emitida por la companıa de seguros Win-terthur a finales de 1997, como un bono a 3 anos en francos suizos convertible en5 acciones de Winterthur. La caracterıstica llamativa de esta emision es que pagaun cupon anual del 2,25% siempre y cuando no ocurra una catastrofe atmosferica,tormentas de granizo, que dane en un solo dıa mas de 6.000 vehıculos, en cuyo caso,no pagarıa cupon.

1.6 En definitiva, ¿por que existen los bonos convertibles?

Razones por el lado del emisor:

• Una ampliacion de capital implica como media una reduccion de entre un 3 yun 8% en la cotizacion de la accion (Mikkelson y Parch 1986, y Smith 1986)frente al 2% de media como efecto a la emision de un convertible, y ademas elefecto de dilucion es postergado en el tiempo hasta la conversion.

• Un bono convertible se emite con cupones inferiores a los de la deuda corporativade mismo riesgo.

• Los bonos convertible ofrecen ventajas fiscales a los emisores frente a la simpleampliacion de capital.

• La progresiva conversion de una emision de bono convertible mejora los ratiosde endeudamiento de la companıa.

Y razones por el lado del inversor:

• Ratios de rentabilidad/riesgo historicos muy superiores a los ratios de la deuday renta variable.

• Los bonos convertible permiten participar de los mercados de renta fija y derenta variable, diversificando el riesgo.

• Los inversores en bono convertible experimentan en una gran parte toda lasubida de valor de la renta variable, aunque normalmente los bonos convertiblese emitan a una paridad mayor que la de valor del mercado.

Page 415: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Modelos multivariantes de valoracion 407

2 Evolucion de las diferentes estructuras de bonosconvertibles y modelos de valoracion

2.1 Valoracion de bonos convertibles con tipos deterministas:modelo de un factor

Para introducir las ideas que se utilizan en la valoracion de los bonos convertibles,empezamos con el modelo mas sencillo, el que asume que los tipos de interes sondeterministas y deja el valor de un bono convertible de vencimiento T , dependiendosolo del subyacente y del tiempo a vencimiento. En estas condiciones, el valor delbono convertible sera:

V = V (S, t) .

Si construimos una cartera o portfolio compuesta por un bono convertible y −∆S,repitiendo el analisis de Black-Scholes, nos encontramos que la variacion en el valorde la cartera es:

dΠ =∂V

∂tdt +

∂V

∂SdS +

12

σ2 S2 ∂2V

∂S2dt − ∆ dS ,

donde, si tomamos el valor de la delta como

∆ =∂V

∂S,

nos queda una cartera libre de riesgo cuya rentabilidad debera ser la del tipo de intereslibre de riesgo (condicion de no-arbitraje), que es expresada a traves de la desigualdadde Black-Scholes,

∂V

∂tdt +

∂V

∂S(rS − D(S, t)) dS +

12

σ2 S2 ∂2V

∂S2dt − r V ≤ 0 ,

y unas ciertas condiciones, finales y de contorno, que se describen a continuacion:

V (S, T ) = 1 , (1)

V(S, t−c

)= V

(S, t+c

)+ K , (2)

V ≥ nS , (3)

V (S, t) S→∞−−−−→ nS , (4)

V (0, t) = e− r(T−t) +∑

K e−r (tc−t) , (5)

donde

• (1) implica que a vencimiento el valor del bono sera 1, y justo antes del venci-miento serıa max(nS, 1).

Page 416: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

408 Jesus Perez Colino

• (2) es el salto del valor en fecha de pago del cupon K.

• (3) implica que el valor del bono convertible sera siempre mayor o igual al valorde la conversion (por no-arbitraje).

• (4), donde el valor del bono convertible tiende al valor de conversion a me-dida que crece el valor del stock, y si este es suficientemente grande, el bonoconvertible se convierte en us sustituto perfecto del stock.

• (5): y si el subyacente vale cero, el bono convertible pasa a ser valorado comoun bono.

Algunas complejidades anadidas podrıan ser:

• El ratio de conversion puede variar con el tiempo y/o con el valor del subyacente:n = n(S, t).

• Pueden restringirse los periodos de conversion, o hacerlos intermitentes, o in-cluso establecer convertibilidad europea.

• Pueden introducirse opciones de amortizacion anticipada (call/put).

2.2 Brennan - Schwartz (1977)

Siguiendo la misma notacion que la del artıculo de M. J. Brennan y E. S. Schwartz(1977), definimos:

S(t) : valor de mercado de la accion del emisor,V (V, t) : valor de mercado del bono convertible, con valor a la par 1000,CP (t) : valor de la opcion de vencimiento anticipado en el momento t,B(V, t) : valor del bono de la misma companıa no convertible,

D(t) : pago de dividendo de la accion del emisor,q(t) : numero de acciones por los cuales se convierte el bono convertible,Nc : numero de bonos convertibles,N0 : numero de acciones antes de la conversion,

I : pago de cupon en cada fecha de pago,C(V, T ) : valor de conversion, donde

C(V, T ) =q(t)S(t)

N0 + Nc q(t)= z(t)S(t) ,

z(t) =q(t)

N0 + Nc q(t).

Page 417: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Modelos multivariantes de valoracion 409

Durante la vida del propio bono de convertible, la condicion de arbitraje que debe decumplirse es:

V (V, t) C(V, t) .

El valor de mercado del bono convertible ha de ser mayor que el valor de conversion,dado que en el momento que el valor de convertir fuese mayor que el propio bono, laconversion en acciones serıa masiva.

Por otro lado, la caracterıstica de amortizacion anticipada introduce una nuevacondicion sobre el valor del bono convertible, dado que el valor del bono si se amor-tizara serıa:

V IC (S, t) = max [CP (t), C(t)] .

El valor del bono convertible en caso de amortizacion anticipada serıa el mayor entre elvalor al que se amortizarıa o el propio valor de mercado de la conversion en ese mismomomento. Evidentemente, el emisor amortizara anticipadamente cuando el precio deamortizacion sea menor que el del propio mercado, y todavıa no haya entrado en elbreakeven de conversion.

Ademas, si llamamos t = t∗ al momento en el que se produce la amortizacionanticipada, ocurre que

V (S, t∗) = C(S, t∗)

si C(S, t∗) ≥ CP (t∗).

Brennan y Schwartz proponen un modelo de un solo factor donde el valor demercado el bono convertible (W = W (V, t)) depende tan solo del tiempo (t) y de laevolucion de la accion (S = S(t, z)), la cual sigue la siguiente evolucion estocastica:

dS

S= µdt + σ dz ,

donde dz es un proceso de Gauss-Wiener.

Repitiendo el analisis de Black y Scholes, el valor del bono convertible debe satis-facer la siguiente ecuacion diferencial (ecuacion diferencial de Black y Scholes),

12

σ2 V 2

(∂2W

∂V 2

)+ r V

(∂W

∂V

)− r V = 0 ,

Page 418: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

410 Jesus Perez Colino

acompanada de las consiguientes ecuaciones de contorno:

Nc V (S, T ) ≤ S , (6)

V (Smin, t) = 0 , (7)

V (S, t) ≤ B(S, t) + z∗(t)S , (8)

V (S, t) > C(S, t) = z(t)S , (9)

V (S, t) =

z(T )S , z(T )S ≥ 1000 ,

1000 , 1000Nc ≤ S ≤ 1000/z(T ) ,

S/Nc , S ≤ 1000Nc,

(10)

V (S, t) ≤ CP (t) , (11)

limS→∞

∂V (S, t)∂S

= z(t) , (12)

V (S, t−) = max[V (S − D, t+), z(t−)S

], (13)

V (S, t−) = V (S − I, t+) + i , (14)

V (S, t−) = min[V (S − I, t+) + i, CP (t−)

], (15)

• (6): el valor total de los bonos ha de ser inferior al valor de la companıa.

• (7): el bono convertible no tiene valor en el caso de que el valor de la accioncaiga a partir de determinado nivel (Merton).

• (8), siendo z∗(t) el valor maximo de z(h), para h = (t, T ), por lo que el valordel bono convertible es menor que un bono mas el valor del maximo numero deacciones en que se puede convertir.

• (9): el valor del bono convertible sera siempre mayor que el valor de la conver-sion.

• (10). Condicion del valor a vencimiento: a vencimiento el bono convertible dael valor en acciones si este es mayor que su nominal,

• (11). Opcion de amortizacion anticipada que tiene el emisor, que amortiza siem-pre en el caso que el valor del bono convertible supere al valor de amortizaciono call price.

• (12). Condicion para un valor suficientemente grande de la accion.

• (13). Condicion que se cumple en cada fecha de pago de dividendos y pago decupones en el instante anterior t− y en el instante inmediatamente posterior t+.

• (14). La ultima condicion es para el pago de cupones cuando coincida con elmomento de la amortizacion anticipada.

Page 419: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Modelos multivariantes de valoracion 411

2.3 Valoracion de los bonos convertibles con tipos estocasticos:modelo de dos factores

Dado que la vida de un bono convertible es normalmente mayor que la vida de unaopcion sobre el stock, es mucho mas precisa la valoracion bajo el supuesto de tiposestocasticos, por lo que el valor del bono convertible V = V (S, r, t) queda como

dS = µS dt + σ S dX1 ,

dr = u(r, t) dt + w(r, t) dX2 ,

E [dX1 dX2] = ρ dt .

Desarrollando por Taylor, con los cambios propios del calculo estocastico, obtenemos

dX21 = dt , dX2

2 = dt , dX1 dX2 = ρ dt

dV =∂V

∂tdt +

∂V

∂SdS +

∂V

∂rdr +

12

(σ2 S2 ∂2V

∂S2+ 2 ρ σ S w

∂2V

∂S∂r+ w2 ∂2V

∂r2

)dt .

Y si construimos una cartera de valores compuesta por el bono convertible de ven-cimiento T1, con −∆2 bonos de cupon cero con vencimiento T2 y −∆1 de acciones,obtenemos una cartera

Π = V − ∆2 Z − ∆1 S

∆2 = ∂V

∂r

/∂Z∂r ,

∆1 = ∂V∂S .

Y como en anteriores casos, tomando para ∆1 y ∆2 los valores adecuados, eliminamosla parte estocastica de la cartera y obtenemos

∂V

∂t+

12

σ2 S2 ∂2V

∂S2+ ρ σ S w

∂2V

∂S ∂r+

12w2 ∂2V

∂r2+ r S

∂V

∂S+ (u − λw)

∂V

∂r− r V = 0 ,

donde λ(r, S, t) es nuevamente la prima de riesgo que asigna el mercado al tipo deinteres, la misma que para cualquier bono que no dependa de otro activo.

3 Modelos de bonos convertibles con riesgo decredito

3.1 Modelos de valoracion del riesgo de credito

Aunque la valoracion de activos con riesgo de credito a traves de metodologıa entiempo continuo tuvo unos inicios prometedores con las propuestas iniciales de Blacky Scholes (1973) y Merton (1974), ha sido un area que ha tenido que esperar a losultimos desarrollos de modelizacion de la curva de tipos por Vasicek (1977) o Heath,Jarrow y Morton (1987), entre otros, para comenzar a tener una base matematica ycientıfica mas consistente. Solo recientemente la modelizacion del riesgo de credito

Page 420: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

412 Jesus Perez Colino

ha recibido una renovada atencion por parte tanto de los academicos como de losprofesionales de los mercados financieros.

En la actualidad existen dos enfoques en los modelos de medicion de riesgo decredito. El primer enfoque parte de los primeros trabajos de Black y Scholes (1973),donde un activo con riesgo de credito llevaba incorporado un derivado sobre el valorde la companıa o firma emisora del bono, de forma que podıa ser valorado de acuerdocon la teorıa del precio de las opciones. En estos modelos el valor de la companıa ofirma sigue un proceso de difusion y la quiebra o default es valorado como un tiempode parada que se produce cuando el valor de la firma alcanza un determinado punto ofrontera. Gracias a la continuidad de los procesos modelados, el momento de paradaque define el default es predecible. El payoff en caso de default es normalmenteuna tasa de recuperacion del principal que depende del proceso de liquidacion de lacompanıa.

Referencia Definicion de default

Merton (1977) V ≤ F al vencimiento T

Shimko et al. (1993) V F en T , con tipos estocasticos, correlacionada con V

Leland (1994) V K con K endogena o exogenamente determinado

Longstaff y Schwartz(1995)

V F entre 0 y T con tipos de interes estocasticos, y cuyadinamica se correlaciona con V

Das (1995) V F entre 0 y T valoracion como compound option, y Hoy Lee como modelo de tipos de interes

Anderson et al. (1996) El proceso de default no es solo un proceso exogeno sino quetambien intervienen “comportamientos” de las partes

Saa–Requejo y SantaClara (1997)

V K entre 0 y T donde K sigue un proceso de difusioncorrelacionado con los procesos del short rate y V

Briys y de Varenne(1997)

V ≤ α F P (t, T ) entre 0 y T con tipos estocasticos correlacio-nados con V

Zhou (1997) V F entre 0 y T donde dV/V sigue un proceso de jump-diffusion

Tabla 1. Enfoque estructural: especificaciones teoricas.

En la tabla anterior, seguimos la siguiente notacion: V , valor de la firma o companıa.T , vencimiento de la deuda. F , valor de mercado de la deuda de la companıa. P (t, T ),precio en t de 1 u.m. libre de riesgo en el momento T (bono cupon cero).

Un segundo enfoque es aquel en que el momento de default es modelizadodirectamente como un momento de parada de una determinada intensidad. Este esel enfoque seguido por Artzner y Delbaen (1992, 1994) Jarrow y Turnbull (1995)Lando(1994, 1998) Jarrow, Lando y Turnbull (1997), Madan y Unal (1998), Flesakeret al. (1994), Duffie y Singleton (1997, 1999), Duffie, Schroder y Skiadas (1994) Duffiey Huang (1996), y Duffie (1994). La principal diferencia entre los diferentes modelosesta en la forma en que obtienen la tasa de recuperacion.

Page 421: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Modelos multivariantes de valoracion 413

Referencia Definicion de default

Jarrow y Turnbull (1991, 1995) De forma discreta, existe una probabilidad de default(martingala) para cada intervalo discreto de tiempo.En continuo, la estructura a termino de las probabili-dades de default vienen exponencialmente distribuidascon un parametro de intensidad resultante de un pro-ceso de salto.

Madan y Unal (1993, 1998) Modeliza tanto la probabilidad de default como la ta-sa de recuperacion o severidad de la perdida, bajo elsupuesto que ambas variables estan explıcitamente va-loradas en los mercados financieros.

Longstaff y Schwartz (1995) Modelo de reversion a la media de para los spreads decredito

Das y Tufano (1996) Modelo similar a Jarrow et al. (1995) pero con tasasde recuperacion estocasticas

Jarrow et al. (1997) Primer modelo que explıcitamente incorpora la infor-macion de las matrices de transicion entre rating en elmetodo de valoracion

Duffie y Lando (1997) El proceso de default esta condicionado a determina-dos datos internos de la propia companıa

Duffie y Singleton (1999) El activo con riesgo es valorado con una curva de des-cuento, modelizada sobre el short–rate, con riesgo.

Tabla 2: Enfoque de probabilista o de intensidad: especificaciones teoricas

3.2 Modelo de Brennan y Schwartz (1980)

El segundo modelo de Brennan y Schwartz es un modelo de valoracion de bonosconvertibles con dos subyacentes (tipos de interes y valor de la accion) de tipo estruc-turalista en cuanto a la forma de introducir el riesgo de credito en la valoracion delconvertible.

Definimos como valor de la companıa o firma (V ) a la suma de los valores demercado de los tres activos emitidos por esta: bono convertible, acciones y deuda.Valor de la firma, antes (T−) y despues (T+) del momento de la conversion:

FVT− = NB BT− + NCB C BT− + NS ST− ,

FVT+ = NB BT+ + (NS + ∆N)ST+ .

Modelizamos la evolucion de los tipos a traves de la SDE de Vasicek (1977) sobre elshort rate, y por otro lado las variaciones del valor de la firma:

drt = a (b − rt) dt + σ dX1 ,

dFVt = [FV µFV − Q(FV, t)] dt + FVt σFV dX2 ,

E [dX1 dX2] = ρ dt ,

Page 422: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

414 Jesus Perez Colino

donde los parametros tradicionales de Vasicek son conocidos, y donde µFV es larentabilidad de la companıa, y Q(FV, t) es la suma de retribuciones de capital de lafirma, es decir cupones de deuda, del bono convertible y dividendos, de forma que

Q (FVt, t) = IB + ICB + D(FV, t) .

Bajo los citados supuestos, Brennan y Schwartz demuestran que el valor del bonoconvertible satisface la PDE:

∂V

∂t+

12

σ2FV FV 2 ∂2V

∂FV 2+ ρ σFV FV σ

∂2V

∂FV ∂r+

12

r2 σ2 ∂2V

∂r2+

(r FV − Q(FV, r))∂V

∂FV+ (a (b − r) − λ r σ)

∂V

∂r− r V + c F = 0 .

Y las siguientes condiciones:

V (FVt, rt, t) q

(N0 + ∆N)(FVt − NB B(FV, r, t)) ,

V (FVt, rt, t) CP (t) ,

V (FVt, rt, t) = kF si FV = NB B(: 0) + k FVCB.

Ademas, V (FVT , rT , T ) es

q (FVt − NB B(FV, r, t))N0 + ∆N

siq (FVt − NB B(FV, r, t))

N0 + ∆N≥ FV

F siq (FVt − NB B(FV, r, t))

N0 + ∆N≤ FV ≤ FV − NB B(: 0)

Nc

FV − NB B(: 0)Nc

si FV ≥ FV − NB B(: 0)Nc

≥ 0

0 si FV < NB B(: 0)

Condiciones que pese a su complejidad, son muy similares a las descritas en su anteriortrabajo, descritas en la subseccion 2.2 del presente estudio.

3.3 Modelo multivariante con jump diffusion

El presente modelo parte de la modelizacion del valor del bono convertible que dependedel tiempo, subyacente y del grado o status de default, con Y = 0 si no se ha producidodefault e Y = 1 en el momento de default, de forma que ahora es V (S, t, Y ), donde Ysigue un proceso de Poisson de la forma:

P(Y = 1 en (t + dt)

∣∣ Y = 0 en t)

= λdt ,

P(Y = 0 en (t + dt)

∣∣ Y = 0 en t)

= 1 − λdt ,

P(Y = 1 en (t + dt)

∣∣ Y = 1 en t)

= 1 .

Page 423: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Modelos multivariantes de valoracion 415

Suponiendo la evolucion del subyacente

dS = µS dt + σ S dX1 + (J − 1)S dY ,

y el valor de la cartera

Π = V (S, r, Y, t) − ∆1 S(r, Y, t) ,

aplicando Ito, y la cobertura por delta, obtenemos la ecuacion diferencial de la carteracubierta solo con respecto al proceso browniano, y no al de Poisson Y :

dΠ = dt

(K − D

∂V

∂S+

∂V

∂t+

σ2

2S2 ∂2V

∂S2

)+dY [V (S, t + dt, Y + dy) − V (S, t, Y )] ,

donde K es cupon del bono convertible y D el dividendo del subyacente.

Por tanto, la contribucion de los procesos de Poisson no puede ser eliminada atraves de la tradicional cobertura delta (deberıamos elegir entre cubrir unicamente ladifusion “pequena” o minimizar las variaciones del valor de la cartera con la difusioncompleta), y entramos en mercados incompletos; pero, sin embargo, podemos suponerque nos encontramos en probabilidad de riesgo-neutro si se cumple como media que

E [dΠ] = r E [Π] dt .

Es decir, que a pesar de los saltos, el mercado descuenta implıcitamente, y seguimosencontrandonos en la probabilidad riesgo–neutral.

Ademas, suponiendo que el valor del bono convertible en el caso de default es unafraccion φV (S, t, 0), obtendrıamos que el valor esperado de la parte estocastica nocubierta de la cartera serıa

E [dY (V (S, t + dt, Y + dY ) − V (S, t, Y ))] −→ λdt V (S, t) (φ − 1) ,

E [dY ] = λdt

V (S, t, 1) = φV (S, t, 0) .

La evolucion de la cartera de convertible y accion, en aplicacion de la condicion deno arbitraje, nos quedarıa como:

r E [Π] dt = r

(V − S

∂V

∂S

)dt .

Poniendo todo esto en conjunto, nos queda una version riesgo–ajustada de Black–Scholes:

K + (rS − D)∂V

∂S+

∂V

∂t+

12

σ2 S2 ∂2V

∂S2− (r + λ (1 − φ)) V = 0 .

Page 424: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

416 Jesus Perez Colino

De igual forma, si consideramos un modelo de evolucion sobre tipos de interes, elresultado es similar:

dS = µS dt + σ S dX1 + (J − 1)S dY ,

dr = u(r, t) dt + w(r, t) dX2 ,

E [dX1 dX2] = ρ dt .

La cartera autofinanciada del bono convertible contra sus subyacentes:

Π = V (S, r, Y, t) − ∆2 Z(r, t) − ∆1 S(r, Y, t) ,

∂V

∂t+

12

σ2 S2 ∂2V

∂S2+ ρ σ S w

∂2V

∂S ∂r+

12

w2 ∂2V

∂r2+

r S∂V

∂S+ (u − λw)

∂V

∂r− (r + λ(1 − φ))V = 0 .

3.4 Modelo multivariante de Goldman Sachs

Goldman Sachs (1993) incorpora el riesgo de credito incrementando los spread enfuncion de lo out-of-the-money en que se encuentre el bono sobre la accion. Es decir,utiliza un tipo de descuento que esta en funcion de la probabilidad de conversion.

El modelo evoluciona el stock con un arbol binomial de CRR, y en cada nodofinal se valora el bono convertible, que sera igual al valor maximo entre la conversiondel bono, o el propio valor nominal + ultimo cupon del propio bono; y utilizando lainduccion backward tıpico del arbol:

Vn,i = max[mSi, p Vn+1,i+1 e−rn+1,i+1 ∆t + (1 − p) Vn+1,i e−rn+1,i ∆t

],

donde m es el ratio de conversion y p es la probabilidad de evolucion del precio de laaccion, n el estado e i el momento del tiempo medido en ∆t.

G-S introduce el citado efecto modelizando la evolucion de los tipos de descuentoen funcion de la probabilidad de conversion qn,i de cada nodo, de forma que si en T elcomportamiento optimo es la conversion por parte del inversor, dicha probabilidad esigual a uno, y cero si no lo es; por lo que partiendo desde el vencimiento, obtenemos

qn,i = p qn+1,i+1 + (1 − p) qn+1,i ,

estimacion backward de las probabilidades de conversion, en funcion de las probabili-dades de evolucion del stock.

El ajuste del riesgo de credito en la funcion de descuento se calcula por la mixturade tipos entre tipo libre de riesgo y el tipo con riesgo corporativo, ponderada por lasprobabilidades de conversion, de forma que:

rn,i = qn,i r + (1 − qn,i) (r + k) .

Page 425: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Modelos multivariantes de valoracion 417

Luego si la probabilidad de conversion es igual a 1, la tasa de descuento es la tasalibre de riesgo, y si la probabilidad de conversion es 0, la tasa de descuento es la tasalibre de riesgo mas un spread de credito.

3.5 Modelo propuesto

Es evidente que necesitamos una nueva metodologıa que permita estimar el valor delbono convertible de acuerdo con una vision mas integral del riesgo de credito, deacuerdo con las tasas de recuperacion y las probabilidades o pseudo-probabilidadesde default que cotizan implıcitamente los dos activos en los que se basa el bonoconvertible: los precios de la accion y la deuda corporativa.

Asimismo, consideramos necesario que cualquier metodologıa de valoracion debetener en cuenta dos factores importantes: la posibilidad de que aparezcan “burbujasespeculativas” que distorsionen la percepcion del riesgo de credito, y la prima de“iliquidez” de la deuda corporativa.

Desde el punto de vista tradicional de B-S, una cobertura delta del bono con-vertible con accion y bono corporativo y/o bono libre de riesgo no es posible, dadala distorsion en el market price of risk que ocasiona el riesgo de credito. Lo quebuscamos es, al menos, dar una valoracion de riesgo de credito al bono convertibleconsistente con sus dos subyacentes.

Necesitamos una nueva modelizacion de los diferentes activos tradeables que in-tervienen en la replicacion del bono convertible, teniendo especialmente en cuenta elriesgo de credito y su prima:

1. Bono cupon cero libre de riesgo: sea p(t, T ) el precio de 1 euro en t, apagar en T , y que matematicamente podemos expresarlo a traves de los tipos forwardinstantaneos implıcitos en la curva de tipos cupon cero hoy, y la cuenta bancaria,expresada en terminos de short rate:

p(t, T ) = exp

∫ T

t

f(t, u) du

, B(t) = exp

∫ t

0

r(u) du

.

2. Bono cupon cero de riesgo corporativo: sea v(t, T : i) el precio de X euros ent que debera pagar en T el emisor xxx del bono convertible, con un grado de seniorityi, y que matematicamente podemos expresarlo a traves de los tipos cupon cero R deun determinado riesgo de credito:

v(t, T : i) = EQt

[exp

(−

∫ T

t

Ru du

)X

], Rt = rt + ht L:i

t + lt ,

con ht la probabilidad condicional en t de default en el momento [t, t + 1] suponiendoque en t todavıa no se ha dado, Lt la fraccion de perdida si se produce default (1-tasade recuperacion) y lt la prima de liquidez en el momento t.

Page 426: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

418 Jesus Perez Colino

Donde ademas podemos aplicar el teorema de Singleton y Duffie (1999) por el que

v(t, T : i) = EQt

[exp

(−

∫ T

t

Ru du

)X

]= EQ

t

[exp

(−

∫ T

t

ru du

)Z

],

Z = X1T<T ′ + X ′1T≥T ′ , X ′ = (1 − Lt) v(t−, T : i) .

3. Accion subyacente: supongamos que tratamos el equity o accion como el tıtulode deuda con peor seniority, que paga cupones “deterministas” llamados dividendosen los momentos 1, 2, . . . , hasta T ∗, fecha de liquidacion de la companıa, a menos quehaga default antes de T ∗, de forma que S(t)

ξ(t) =

S(t) +∫ T∗

t

Dj v(t, j : e) dj si t < τ ,

δe

[S(τ) +

∫ T∗

t

Dj v(τ−, j : e) dj

]si t = τ .

El valor actual de liquidacion de la accion, bajo probabilidad riesgo neutra y enfuncion del propio riesgo de credito, por el teorema de Singelton y Duffie, sera

S(t) = EQt [S (T ∗)] EQ

t

[exp

(−

∫ T∗

t

[ru + hu L:eu ] du

)]= EQ

t [S (T ∗)] v (t, T ∗ : e)

= EQt

[exp

(−

∫ T∗

t

[ru + hu L:eu ] du

)S (T ∗)

],

donde Et es la esperanza, bajo probabilidad riesgo neutral, condicionada a que eldefault no se haya producido antes o en el momento t, y ht es la seudoprobabilidadde default bajo probabilidad riesgo neutra.

Si le aplicamos una hipotesis de independencia en t, entre las distribuciones de losprocesos de S(T ∗), el short rate ru y la seudoprobabilidad de default hu para u en[t, T∗], obtenemos

S(t) = EQt [S (T ∗)] EQ

t

[exp

(− ∈T∗

t [ru + hu L:eu ] du

)]= EQ

t [S (T ∗)] v (t, T ∗ : e) .

Para el desarrollo empırico, T ∗ es 1 ano, y suponemos que la tasa de dividendoscontinua de t + 1 es la de t; asimismo a la esperanza del valor de liquidacion leimponemos que

EQt [S (T ∗)] = exp π (t, T )

= ξ (t−∆) exp β0 + β1 r(t) + β2 [log(ξ(t)) − log (ξ (t − ∆))] +β3 M(t)El riesgo de liquidez es un factor importante que afecta a la valoracion y dificultala replicacion, si deseamos cubrir el bono convertible. El introducir el riesgo de

Page 427: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Modelos multivariantes de valoracion 419

liquidez de los activos es consistente con la condicion de no arbitraje, pero introduceincompletitud en los mercados.

El factor de liquidez, al igual que en la teorıa de la valoracion de derivados sobrecommodities, la introducimos a traves del llamado convenience yield, de forma que elbono corporativo con riesgo de liquidez queda definido como

vL(t, T : i) = e−γi (t,T ) v(t, T : i) ,

Si existen excesos de demanda, perjudica deshacer posiciones cortas. Si se dan excesosde oferta, perjudicando posiciones largas,

γ(t, T ) = γ0 + γ1 vol0 + γ2voltvol0

,

donde vol es el volumen negociado en el momento t, y γ0, γ1 y γ2 son constantes.

Por tanto, deberemos estimar la probabilidad de default y la tasa de recuperacion,que a su vez dependen de t, y del vector de las variables de estado observables X(t)(tipo spot y/o ındices de mercado) tal que

h(t) = h (t,X(t)) ,

δi = δi (t,X(t)) .

Y debemos estimar, para cada t, usando regresiones seccion cruzada y series de tiempo

γi (t, T ) = γi (t, T,X(t)) ,

π (t, T ∗) = π (t, T ∗, X(t)) .

Inputs:

1. Serie de bonos cupon cero corporativos vL(t, T : i) para diferentes t, T y dife-rentes : i, y bonos libre de riesgo P (t, T ).

2. Precios observados de la accion, a fecha T ∗ y los dividendos D1, . . . , DT .

3. Y las variables observables de estado X(t).

Con estas observaciones estimamos el siguiente sistemas de ecuaciones:

vL(t, T : i) = vL (t, T : i, r(t), λ(t,X(t)), δi(t,X(t)), γi(t, T,X(t)))

ξ(t) = exp π (t, T ∗, X(t)) v (t, T ∗ : e, λ (t,X(t))) +T∗∑t

Dj v(t, j : e) dj

Page 428: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

420 Jesus Perez Colino

Referencias

[1] Black, F. y Scholes, M., The pricing of options and corporate liabilities. Journalof Political Economy 81 (1973), 637–54.

[2] Brennan, M.J. y Schwartz, E.S., Convertible bonds: valuation and optimal stra-tegies for call and conversion. Journal of Finance 32 (1977).

[3] Brennan,M.J. y Schwartz, E.S., Analyzing convertible bonds. Journal of Finan-cial and Quantitative Analysis 15 (1980), 907-929.

[4] Briys, E. y de Varenne, F., Valuing risky fixed rate debt: An extension. Journalof Financial and Quantitative Analysis 32 (junio 1997), 239-248.

[5] Clewlow y Strickland, Implementing derivatives models. Wiley Series in FinancialEngineering (1998).

[6] Das, S.R. y Sundaram, R. K., A direct approach to arbitrage-free pricing of creditderivatives. Working Paper 6635, National Bureau of Economic Research, Julio1998.

[7] Duffie, D. and Lando, D., Term structures of credit spreads with incompleteaccounting information. Working paper, Graduate School of Business, StanfordUniversity, Junio 1997.

[8] Duffie, D., Forward rate curves with default risk. Working paper, GraduateSchool of Business, Stanford University, Diciembre 1994.

[9] Duffie, D. y Kan, R., A yield-factor model of interest rates.Mathematical Finance6 (1996), 379–406.

[10] Duffie, D. y Singleton, K. J., An econometric model of the term structure ofinterest rate swap yields. The Journal of Finance 52 (1997), 1287–1322.

[11] Darrell Duffie, D. y Singleton, K. J., Modeling term structures of defaultablebonds. The Review of Financial Studies 12 (1999), 687–720.

[12] Geske, R., The valuation of corporate liabilities as compound options. Journalof Financial and Quantitative Analysis 12 (1977), 541–552.

[13] Goldman Sachs, Valuing Convertible Bonds as Derivatives. Quantitative Strate-gies Research Notes, Nov. 94.

[14] Heath, D., Jarrow, R., Morton, A., Bond pricing and the term structure ofinterest rates: A new methodology for contingent claims valuation. Econometrica60 (1992), 77–105.

[15] Jarrow, R., Madan, D., Option pricing using the term structure of interest ratesto hedge systematic discontinuities in asset returns. Mathematical Finance 5(1995), 311–336.

Page 429: Seminario de Matem´atica Financiera MEFF-UAM - risklab.esrisklab.es/es/seminarios/bme-uam/volumen02.pdf · Este segundo volumen del Seminario de Matem´atica Financiera MEFF-UAM

Modelos multivariantes de valoracion 421

[16] Jarrow, R., Lando, D., Turnbull, S.M., A markov model for the term structureof credit risk spreads. The Review of Financial Studies, 10 (1997), 481–523.

[17] Jarrow, R. A., Turnbull, S. M., Pricing derivatives on financial securities subjectto credit risk. Journal of Finance 50 (1995), 53–85.

[18] Johnson, N. L., Kotz, S., Continuous Univariate Distributions, volume 2. Hough-ton Mifflin Co., New York, 1970.

[19] Lando, D., Three Essays on Contingent Claims Pricing. PhD thesis, GraduateSchool of Management, Cornell University, 1994.

[20] Smith, G. D., Numerical Solution of Partial Differential Equations: Finite Dif-ference Methods. Oxford Applied Mathematics and Computing Science Series1985.

[21] Longstaff y Schwartz, Interest rate volatility and the term structure: A two factorgeneral equilibrium model. The Journal of Finance 47 (1992), 1259–82.

[22] Longstaff, F. A., Schwartz, E. S., The pricing of credit risk derivatives. Journalof Fixed Income 5 (1995), 6–14.

[23] Longstaff, F. A., Schwartz, E. S., A simple approach to valuing risky fixed andfloating rate debt Journal of Finance 50 (1995), 789 - 819.

[24] Longstaff, F. A., Schwartz, E. S., A simple approach to valuing risky fixed andfloating rate debt. Working Paper 22–93, Anderson Graduate School of Manage-ment, Univ. of California, Los Angeles, octubre 1993. revisado noviembre 1994.

[25] Madan, D., Unal, H., Pricing the risks of default. Review of Derivatives Research2 (1998), 121–160.

[26] Merton, R. C., On the pricing of corporate debt: The risk structure of interestrates. Journal of Finance 29 (1974), 449–470.

[27] Merton, R. C., Option pricing when underlying stock returns are discontinuous.Journal of Financial Economics 3 (1976), 125–144.

[28] Merton, R. C., On the pricing of contingent claims and the Modigliani-Millertheorem. Journal of Financial Economics 5 (1977), 241–249.

[29] Zhou, Ch., A jump-diffusion approach to modeling credit risk and valuing de-faultable securities. Finance and Economics Discussion Paper Series 1997/15,Board of Governors of the Federal Reserve System, Marzo 1997.

Jesus Perez ColinoAccenture

Torre Picasso28020-Madrid, Spain

e-mail: [email protected]