Aplicaciones en meterereolog a de modelos funcionales de ...

72
aster en Estad´ ıstica Aplicada Departamento de Estad´ ıstica e I.O. Universidad de Granada Aplicaciones en meterereolog´ ıa de modelos funcionales de predicci´on en componentes principales Sheila Carre˜ no Madinabeitia Julio de 2013

Transcript of Aplicaciones en meterereolog a de modelos funcionales de ...

Page 1: Aplicaciones en meterereolog a de modelos funcionales de ...

Master en Estadıstica AplicadaDepartamento de Estadıstica e I.O.

Universidad de Granada

Aplicaciones en meterereologıa de modelos

funcionales de prediccion en componentes

principales

Sheila Carreno Madinabeitia

Julio de 2013

Page 2: Aplicaciones en meterereolog a de modelos funcionales de ...

Master en Estadıstica Aplicada

Departamento de Estadıstica e I.O.

Universidad de Granada

Aplicaciones en meterereologıa de modelos funcionales deprediccion en componentes principales

Trabajo Fin de Master presentado por

Da Sheila Carreno Madinabeitia

y dirigido por los Profesores

Dr. Da Ana Marıa Aguilera del Pino

Dr. D Mariano Valderrama Bonnet

Page 3: Aplicaciones en meterereolog a de modelos funcionales de ...

Prologo

Las predicciones meteorologicas de calidad son muy importantes en lasociedad de hoy en dıa y mejorar los metodos utilizados habitualmente pararealizar predicciones meteorologicas o encontrar nuevos metodos es el ob-jetivo de muchos investigadores en la actualidad. Dentro de la prediccionmeteorologica existe un campo dedicado a prediccion estadıstica, que es don-de tiene cabida este trabajo. Por lo tanto, cobra sentido que este estudio sehaya desarrollado dentro de la lınea de investigacion de Analisis de DatosFuncionales (ADF) del master oficial en Estadıstica Aplicada, dirigida porlos profesores Ana Marıa Aguilera del Pino y Mariano Valderrama Bonnet,expertos en esta materia. Un gran numero de variables meteorologicas, comopor ejemplo la temperatura y la presion a nivel del mar, imprescindibles parapredecir el tiempo de los proximos dıas, son muy adecuadas para trabajar apartir de su forma funcional. Dentro de la prediccion estadıstica nos hemosinteresado por la tecnica de downscaling. Esta tecnica se basa en realizar pre-dicciones meteorologicas locales a partir de las predicciones realizadas por unmodelo a escala global. Por lo tanto, el objetivo general que se persigue coneste trabajo es el de dar el primer paso en la aplicacion de los modelos deADF de prediccion en componentes principales en el campo de la meteoro-logıa. Para ello, se han estudiado los modelos de prediccion en componentesprincipales funcionales y se han adecuado a la tecnica MOS de downscaling.

El trabajo esta organizado en tres capıtulos. El primero, esta dedicadoa los metodos estadısticos que se utilizan en meteorologıa. En este capıtulose comenta como las tecnicas de prediccion estadıstica tienen cabida en di-ferentes centros meteorologicos operacionales. Asimismo, se explica en queconsiste la tecnica de downscaling y el metodo MOS. Este metodo relacionadatos observados con datos de un modelo numerico global, en este caso, elmodelo Global Forecast Sistem (GFS). Las predicciones de este modelo se

i

Page 4: Aplicaciones en meterereolog a de modelos funcionales de ...

ii

utilizan como variables predictoras en la tecnica MOS. En este trabajo sehan unido el metodo MOS y el analisis de datos funcionales para realizarpredicciones en el campo de la meteorologıa.

El capıtulo 2 contiene una introduccion al ADF que se caracteriza porquelos datos observados son curvas. Igualmente, se describen diferentes tecni-cas y metodos para reconstruir la forma funcional de las curvas muestralesmediante representaciones basicas. A lo largo de este capıtulo, se presentandiferentes bases poniendo especial interes en las bases B-spline, que se uti-lizaran en este trabajo porque las curvas analizadas son suaves. Tambien sehace un repaso por los metodos mas usuales de aproximacion de coeficientesbasicos a partir de observaciones discretas de las funciones muestrales, comoson el metodo de aproximacion por mınimos cuadrados, proyeccion ortogonale interpolacion spline cubica con bases de B-splines. Por ultimo, se incluyenlos aspectos teoricos del modelo de Prediccion en Componentes Principalesfuncionales (PCP) que esta basado en regresion lineal de las componentesprincipales de una variable de respuesta funcional sobre un conjunto optimode componentes principales de un predictor funcional relacionado.

En el ultimo capıtulo, se realiza un ejercicio practico que emplea la me-todologıa estudiada. El ejercicio consiste en realizar prediccion de la tem-peratura cada 6 horas para un punto local representativo de la capital delPaıs Vasco, Vitoria- Gasteiz. La prediccion se realiza para un horizonte decuatro dıas, teniendo en cuenta el dıa en curso, a partir de las prediccionesde temperatura del modelo de circulacion global GFS. Para poder compararlos resultados, se ha incluido otro ejemplo que predice la temperatura de cua-tro dıas a partir las temperaturas observadas de los cuatro dıas anteriores.Los desarrollos de estos ejemplos se han implementado con el programa es-tadıstico R, por lo que se incluye un anexo con las sentencias de R utilizadas,explicando el objetivo y el resultado obtenido con cada una de ellas. Tam-bien se han incluido las referencias biblioigraficas revisadas en el desarrollodel mismo.

Page 5: Aplicaciones en meterereolog a de modelos funcionales de ...

Agradecimientos

En primer lugar deseo expresar mi mas sincero agradecimiento a mistutores, Ana Ma Aguilera del Pino y Mariano Valderrama Bonnet por suatencion, paciencia y por todo lo que he aprendido de ellos. Y a todas laspersonas de su departamento que cada vez que he ido a Granada me hanacogido estupendamente.

Agradezco a la empresa donde trabajo, Tecnalia, que me ha permitidodedicarle horas a este proyecto. Especial gratitud a mis companeros del areade Meteo que me han ayudado en todo lo que he necesitado de manera de-sinteresada.

Tambien a Euskalmet, por facilitarme los datos observados de la red deestaciones meteorologicas de CAPV.

Por ultimo, en el apartado personal, a mi familia, Carlos, Lourdes, Goiza-ne, Zurine y Aritz, a mis amigas de la cuadrilla y a las Cuquis. Por animarmeincondicionalmente y escuchar mis charlas sobre prediccion estadıstica contotal interes. Y a todas las personas que no he citado expresamente pero quehan estado animandome.

Mila esker.

Page 6: Aplicaciones en meterereolog a de modelos funcionales de ...
Page 7: Aplicaciones en meterereolog a de modelos funcionales de ...

Indice general

1. Meteorologıa y metodos estadısticos 1

2. Aspectos metodologicos 92.1. Introducccion al ADF . . . . . . . . . . . . . . . . . . . . . . . 92.2. Representaciones basicas de datos funcionales . . . . . . . . . 112.3. Analisis Funcional en Componentes Principales . . . . . . . . 212.4. Modelos de Prediccion en Componentes Principales . . . . . . 25

3. Aplicacion practica 293.1. Descripcion de los datos . . . . . . . . . . . . . . . . . . . . . 293.2. Tratamiendo de datos funcionales . . . . . . . . . . . . . . . . 313.3. Ajuste de modelos PCP . . . . . . . . . . . . . . . . . . . . . 353.4. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

4. Lıneas de trabajo abiertas 53

Anexo: Aspectos computacionales con R 55

Bibliografıa 61

Page 8: Aplicaciones en meterereolog a de modelos funcionales de ...
Page 9: Aplicaciones en meterereolog a de modelos funcionales de ...

Capıtulo 1

Meteorologıa y metodosestadısticos

La prediccion meteorologica es esencial para la sociedad de hoy en dıa.Es especialmente importante predecir y vigilar adecuadamente los episodiosde meteorologıa adversa donde en ocasiones la seguridad de la ciudadanıa sepone en peligro. Las predicciones meteorologicas tambien se utilizan en otrosmuchos sectores como las aerolıneas, edificios inteligentes, medio ambiente,energıa, agro-meteorologıa, sanidad, turismo, etc. Por todo esto la demandade informacion meteorologica fiable y de calidad es cada vez mas alta.

En muchos centros meteorologicos operacionales a lo largo del mundo seemplean tecnicas de prediccion estadıstica. Destaca la Agencia Cientıfica delDepartamento de Comercio de los Estados Unidos ’Meteorological Develop-ment Lab’ del National Weather Service de la NOAA- National Oceanic andAtmospheric Administration . En un entorno mas cercano, por ejemplo, elCentro Nacional de Energıas Renovables CENER y la Agencia Estatal deMeteorologıa AEMET disponen de predicciones realizadas con procesos es-tadısticos. En esta lınea, se esta haciendo un gran esfuerzo por parte de laAgencia Vasca de Meteorologıa (Euskalmet), por lo que los resultados obte-nidos en este trabajo se trasladaran a la misma.

Para entender mejor los modelos de prediccion estadıstica o downsca-ling estadıstico, se van a describir los diferentes modelos de prediccion quese utilizan en meteorologıa. La clasificacion de los modelos meteorologicosse realiza por escalas. Las escalas mas habituales son la planetaria, sinopti-

1

Page 10: Aplicaciones en meterereolog a de modelos funcionales de ...

2 CAPITULO 1. METEOROLOGIA Y METODOS ESTADISTICOS

ca, meso-escala y micro-escala. Los modelos estadısticos se encuentran en lameso-escala y se alimentan de los modelos a escala sinoptica por lo que estecapıtulo se centra en estas dos escalas.

Los modelos de prediccion a escala sinoptica se obtienen solucionando lasecuaciones hidrodinamicas que rigen los movimientos atmosfericos. Se tratade ecuaciones no lineales que se solucionan mediante metodos numericos. Lassalidas de los modelos sinopticos se representan en diferentes graficas y ma-pas con los que los meteorologos analizan diferentes variables y parametros.Con esta informacion se elaboran pronosticos a gran escala de corto y medioplazo. Estos resultados representan bastante bien situaciones sinopticas. Unejemplo de una situacion sinoptica son las ciclogenesis. Pero los modelos aescala sinoptica no pueden representar los procesos o fenomenos que ocurrenen otra escala espacio temporal. Por ejemplo, la brisa o celulas convectivas(tormentas) ocurren en la meso-escala, por lo que tienen dificultades pa-ra capturarlos. En general, tienen dificultades para capturar fenomenos queocurren en pequenas regiones como la Peninsula Iberica (Christensen et al.1997; Osborn and Hulme, 1999; Gonzalez-Rouco et al 2000; Harvey and Wi-gley, 2003; Nieto et al. 2004). Por no hablar, de la pequena area de estudio enla cual estamos interesados, la Comunidad Autonoma Vasca, que aun ocupauna superficie menor. Ademas, la complejidad orografica de la CAPV y suubicacion hacen que la variabilidad atmosferica que presenta esta zona seaalta, lo que dificulta una prediccion precisa y detallada (Figura 1.1).

Figura 1.1: Comunidad Autonoma Vasca

Page 11: Aplicaciones en meterereolog a de modelos funcionales de ...

3

En cada escala existen diferentes modelo de prediccion. Lo habitual pararealizar una buena prediccion es tener en cuenta el mayor numero de salidasde los modelos posible. En la escala sinoptica existen los modelos UKMO (setrata del modelo del servicio Britanico de meteorologıa), GFS (modelo Ame-ricano), ECMWF (es el modelo del Centro Europeo de prediccion a medioplazo), DWD (modelo de prediccion del servicio Aleman de meteorologıa),GEM (modelo meteorologico global Canadiense), etc. Destacar que los mo-delos que mejores resultados presentan para la zona de interes son los tresprimeros.

Podrıamos decir que los modelos numericos estan todavıa lejos de repre-sentar la realidad al detalle. Evidentemente cada vez se realizan mas inves-tigaciones en esta lınea y los modelos son mejores, incluyendo informacionorografica o de vegetacion.

El modelo sinopticos del cual se han tomado los datos para realizar estetrabajo es el GFS (Global Forecast System )(Sela 1980, 1982). Este modeloes un modelo espectral con un horizonte espectral de resolucion triangular de254 (T254), una malla de 768x384 puntos, que aproximadamente es de 0.5o

x 0.5o, (55 km). En vertical tiene 64 niveles sigma desigualmente espaciados,con mejor resolucion cerca de la parte inferior y de la parte superior. Parahacernos una idea dispone de 15 niveles por debajo de los 800 hPa y 24 ni-veles por en cima de 100 hPa. La malla que se ha utilizado en este trabajoes la de un 1o x 1o. Esta malla se representa tanto en la Figura 1.2 como enla Figura 1.3.

Este modelo se ejecuta cuatro veces al dıa (00h, 06h, 12h y a las 18h) ypredice hasta 16 dıas. En cada ejecucion el modelo se corre en dos bloques. Elprimer bloque tiene una resolucion mayor y llega hasta las 180 horas (7 dıas)con datos disponibles cada 3 horas, en cambio el segundo corre desde 180 a384 horas (16 dıas) a una resolucion mas baja y tiene informacion disponiblecada 12 horas.

Los modelos sinopticos como se ha comentado anteriormente tienen bajaresolucion en los limites horizontales y una ruda representacion de la oro-grafıa (Wigley et al. 1990; con Storch eta al. 1993). Todo esto hace que seanecesario utilizar tecnicas especıficas de regionalizacion o downscaling paraobtener resultados apropiados a meso-escala.

Page 12: Aplicaciones en meterereolog a de modelos funcionales de ...

4 CAPITULO 1. METEOROLOGIA Y METODOS ESTADISTICOS

Figura 1.2: GFS (Global Forecast System)

Figura 1.3: GFS Penınsula Iberica

Page 13: Aplicaciones en meterereolog a de modelos funcionales de ...

5

El downscaling se conoce generalmente como la tecnica para la obtencionde informacion a escala local a traves de la integracion de la informacion abaja resolucion en el modelo sinoptico (Zorita and Storch, 1999). Sin embar-go, una forma mas general de definir el downscaling, es la de obtener unaprevision con una resolucion temporal o espacial mas alta que la de la previ-sion inicial. A partir de ahora, y para entender mejor a lo que nos referimos,la escala sinoptica sera gran escala y la meso-escala, escala local.

Las variables que se predicen mas habitualmente con los metodos dedownscaling estadıstico son: viento en superficie, probabilidad de precipi-tacion, precipitacion acumulada, temperatura maxima y mınima, nubosidad,y visibilidad.

Existen diferentes tecnicas de downscaling que han sido desarrolladas co-mo herramientas de interpolacion de la informacion a gran escala en el ambitolocal (Wilby and Wigley, 1997; Zorita and von Storch, 1997; Murphy, 1999;Benestad, 2001). Las tecnicas de downscaling siguen dos grandes lıneas, porun lado esta el downscaling dinamico o numerico y por otro el estadıstico.

El downscaling dinamico consiste en utilizar las salidas de un modeloglobal como condiciones iniciales y de contorno para un modelo de mayorresolucion (modelo regional o de meso-escala) (Giorgi, 1990; Giorgi et al.,1994). Por otro lado, se encuentran las tecnicas de downscaling estadıstico,estas tecnicas tienen en cuenta la relacion empırica entre las variables a granescala y a escala local. Es decir, se construye un modelo estadıstico a partirde observaciones historicas que relacionen la informacion a gran escala simu-lada por el modelo sinoptico, con la informacion a escala local.

El downscaling estadıstico tiene su origen en el post proceso de las salidasde los modelos sinopticos. En un principio se utilizaban como una herramien-ta para eliminar los errores del modelo de prediccion (Wilks, 1995). ModelOutput Statistics (MOS) (Glahn and Lowry, 1972) y Perfect Prog (Klein etal. 1974) son dos de los metodos mas populares. Ambos metodos se basan enla idea de corregir la prediccion del modelo con las observaciones a traves deecuaciones estadısticas.

El metodo Perfect Prog busca una relacion estadıstica latente entre la

Page 14: Aplicaciones en meterereolog a de modelos funcionales de ...

6 CAPITULO 1. METEOROLOGIA Y METODOS ESTADISTICOS

variable a estimar y las variables que puedan ser pronosticadas por el mo-delo dinamico. En el proceso de entrenamiento del modelo tanto la variablerespuesta, como las variables predictoras son datos observados. El resultadoobtenido al relacionar las variables con datos observados se aplica a la salidadel modelo a gran escala. Una de las ventajas del metodo Perfect Prog esque solo se alimenta de valores observados y no necesita datos del modelo deun periodo pasado.

El metodo MOS relaciona los datos observados con los datos del modelonumerico global directamente. De esta forma este metodo mejora los resul-tados eliminando sesgos y realizando correcciones estadısticas. Por ejemplo,reduce el error medio del pronostico del modelo a gran escala. Las ecuacio-nes MOS se calculan dependiendo de las relaciones fısicas entre las variables,por lo que a medida que el horizonte de prediccion aumenta las relaciones sedebilitan y con ello aumenta el error de la varianza del modelo.

En general, las ventajas principales de los modelos de downscaling es-tadıstico, ademas de las mencionadas anteriormente, son su bajo coste compu-tacional, que incluyen informacion a la prediccion que no puede ser predichapor el modelo a gran escala de manera explicita, que disponen de una buenacalibracion para horizontes cortos en el tiempo y que proporcionan predic-ciones adaptadas a lugares especıficos. El mayor inconveniente se encuentraa la hora de obtener una serie de datos de calidad para realizar una buenacalibracion del modelo y ası determinar una relacion fuerte entre el predictoro los predictores y la variable respuesta. Obtener un intervalo de datos en eltiempo de un modelo a gran escala que no haya sufrido modificanciones nosiempre es facil. Diversos estudios demuestran que al menos son necesariosdos estaciones de datos homogeneas para desarrollar una relacion estadısticaestable, es decir, unos 300 casos (Carter, 1986). Otro de los puntos debilesdel downscaling estadıstico es que se basa en datos historicos y por lo tantono existe ninguna garantıa, que la relacion estadıstica en el pasado de losdiferentes conjuntos de datos se mantenga en el futuro.

Para realizar este trabajo nos hemos decantado por el metodo MOS. Lasecuaciones de regresion MOS se calculan para manana utilizando los valo-res predichos para manana de los predictores del modelo a gran escala. Esevidente que los predictores para manana no se conocen hoy, pero si las pre-dicciones de estos predictores que da el modelo a gran escala.

Page 15: Aplicaciones en meterereolog a de modelos funcionales de ...

7

En el metodo MOS la tecnica estadıstica mas utilizada es regresion linealmultiple, aunque tambien han sido utilizadas muchas otras tecnicas como porejemplo la regresion logıstica para predecir fenomenos discretos (Glahn et al,1991). La regresion lineal multiple, es una tecnica muy utilizada y comun

Y = b0 + b1x1 + b2x2 + ...+ bkxk

donde la variable respuesta es Y y k el numero de las variables predictoras,x1, x2, ..., xk.

La variable respuesta suele ser observada, por ejemplo temperatura, hu-medad o viento y los predictores son variables simuladas por el modelo agran escala en algun punto de la malla, bien cerca de la superficie o en capassuperiores. Los datos de todas las variables se toman en el mismo intervalode tiempo.

Existen diferentes variantes del metodo MOS pero la mayorıa se basan enla regresion multiple y la correlacion entre la variable respuesta y predictoras.La variable respuesta predicha en algun momento t en el futuro, se expresaen la funcion de regresion fc utilizando un vector x de variables predictoras,

Y (t) = fc(x)

Se definen dos periodos de tiempo en este estudio (periodo de entrena-miento y de testeo). El primer periodo se utiliza para entrenar o calibrar elmodelo estadıstico, que toma en cuenta las relaciones entre las escalas gran-des y regionales. Por otra parte, el segundo periodo, que se considera futuro,se utiliza para validar el modelo estadıstico, considerando que la informacionretenida en el primer paso es valida tambien en este segundo.

En este trabajo, se han unido el metodo MOS y el analisis de datos fun-cional, con el objetivo de realizar predicciones de la variable temperatura deuna forma novedosa para este campo. Se ha seleccionado esta variable, por-que desde el punto de vista de la prediccion meteorologica, es una variable dela cual es esencial disponer de buenas predicciones y da mucha informacion

Page 16: Aplicaciones en meterereolog a de modelos funcionales de ...

8 CAPITULO 1. METEOROLOGIA Y METODOS ESTADISTICOS

sobre el tiempo que va hacer en el futuro. Desde el punto de vista funcionales una variable continua de la cual se dispone de muchos datos, por lo tanto,ideal para realizar predicciones con esta tecnica. La ventaja de los metodosbasados en analisis de datos funcionales es que dispones de una prediccioncontinua para el instante de tiempo que desees, para temperatura lo habituales hacer predicciones para cada 3 o 6 horas. El objetivo planteado es predecirla curva de temperatura a escala local durante cuatro dıas de forma continuaa partir de la curva de temperatura predicha a escala global (GFS) en el mis-mo periodo de tiempo. En concreto se ha utilizado el metodo de interpolacionspline cubica con bases de B-splines para reconstruir las curvas muestralesde temperatura a partir de observaciones discretas cada seis horas. Ademas,se ha utilizado la tecnica de Analisis en Componentes Principales Funcional(ACPF) para aplicar por ultimo los modelos de Prediccion en ComponentesPrincipales (PCP). A continuacion se describen las tecnicas y los modelosmencionados.

Page 17: Aplicaciones en meterereolog a de modelos funcionales de ...

Capıtulo 2

Aspectos metodologicos

2.1. Introducccion al ADF

El Analisis de Datos Funcionales (ADF), es una especialidad estadısticarelativamente nueva de modelizacion y prediccion. Esta especialidad se ca-racteriza porque los datos observados son curvas que proceden en la mayorıade los casos de la observacion de procesos estocasticos en tiempo continuo.En la practica se dispone de observaciones discretas de las curvas muestra-les a partir de las cuales se recosnstruye la forma funcional. De este modose mantienen las propiedades de las variables continuas y se pierde menosinformacion. Una de las ventajas mas importantes del ADF, y por la quesu puesta en practica es muy atractiva, es que las hipotesis de partida sonmucho menos exigentes que las de las tecnicas clasicas de analisis de seriestemporales que imponen, entre otras hipotesis, que el proceso sea estaciona-rio, las observaciones igualmente espaciadas y la pertenencia del proceso auna clase especıfica.

En general, cualquier observacion que varıe sobre un continuo se puedetomar por un dato funcional, pero la definicion formal de una variable aleato-ria funcional la encontramos en Ferraty y Vieu (2006). Una variable aleatoriaX definida sobre un espacio de probabilidad (Ω,A, P ) se dice que es funcio-nal si toma valores en un espacio funcional, es decir, un espacio normado oseminormado completo. El espacio mas utilizado en datos funcionales, que esel que vamos a considerar en este trabajo, es el espacio L2[T ] de las funciones

9

Page 18: Aplicaciones en meterereolog a de modelos funcionales de ...

10 CAPITULO 2. ASPECTOS METODOLOGICOS

de cuadrado integrables en en el intervalo real T definido por

L2 (T ) =

f : T −→ R :

∫T

f 2 (t) dt <∞,

con el producto escalar usual dado por

〈f, g〉 =

∫T

f (t) g (t) dt, ∀f, g ∈ L2 (T ) .

Tenemos que L2(T ) con este producto escalar es un espacio de Hilbert.

Una vez definido el espacio funcional, es momento de definir la variablefuncional X que en nuestro caso es un proceso estocastico en tiempo continuoX(t) : t ∈ T. Teniendo en cuenta que todas las trayectorias pertenecen alespacio L2(T ), el proceso estocastico es de cuadrado integrable. Con objetode que los modelos que se utilizan en este trabajo esten bien definidos desdeun punto de vista teorico, se considerara, ademas, que el proceso es de desegundo orden y continuo en media cuadratica. Un proceso es de segundoorden si ∀t ∈ T la variable aleatoria X(t) ∈ L2(Ω), donde L2(Ω) es el espaciode las variables aleatorias con momentos de segundo orden finitos. Por otrolado, un proceso es continuo en media cuadratica si verifica que

lımh→0

E[(X (t+ h)−X (t))2

]= 0, ∀t ∈ T.

Los objetivos generales del analisis son los mismos que los de cualquierotra rama de la estadıstica. Es decir, representacion grafica de los datos pa-ra su posterior analisis, reduccion de dimension para detectar las diferentescaracterısticas, el estudio de patrones importantes y la variabilidad de losdatos, modelizacion y prediccion, etc.

El analisis de datos funcionales se puede aplicar en muchas disciplinascomo son la economıa, la medicina o la meteorologıa. Podemos encontrarmultitud de ejemplos donde se aplica el analisis de datos funcionales, porejemplo en Aguilera et al. (1999c) donde se realizan predicciones de las coti-zaciones de la bolsa en Madrid. Muchos mas ejemplos como estos se puedenencontrar en el libro de Ramsay y Silverman (2002). En cambio, no es tanhabitual encontrar estas tecnicas aplicadas en meteorologıa, en este campolas tecnicas estadısticas utilizadas mas habitualmente para realizar prediccio-nes no tienen un enfoque funcional aunque algunas variables meteorologicas

Page 19: Aplicaciones en meterereolog a de modelos funcionales de ...

2.2. REPRESENTACIONES BASICAS DE DATOS FUNCIONALES 11

como la temperatura, la presion a nivel del mar, velocidad de viento, etc,son por su propia naturaleza funcionales. En realidad, es difıcil ver este tipode tecnicas aplicadas para obtener la prediccion diaria en un servicio meteo-rologico, aunque es verdad que en la bibliografıa si que encontramos diferentesejemplos en este area como es el artıculo de Valderrama (2009), en el que apartir de la variable de temperatura se predice la concentracion de polen, ocomo en uno de los ejemplos del libro de Ramsay y Silverman (2005), que seutiliza habitualmente para describir el analisis de datos funcionales. En esteejemplo el proceso en tiempo continuo es la media de temperatura mensualmedida en diferentes estaciones meteorologicas de Canada con variabilidadclimatica, en concreto en Montreal, Edmon, Prince Rupert y Resolute. Lastrayectorias muestrales son los datos de observacion registrados por las esta-ciones meteorologicas en esos lugares durante un ano y se usan para predecirla precipitacion total anual haciendo uso de modelos de regresion funcional.

No todos los datos funcionales implican repeticiones independientes, co-mo es el ejemplo de las series de temperatura en diferentes estaciones me-teorologicas. Es posible trabajar con una unica trayectoria larga de la que seextraen diferentes periodos, como se vera en la parte practica de este traba-jo. Un estudio detallado de la adaptacion de los modelos PCP para predecirseries de tiempo a partir de diferentes tipos de estimacion ponderada de lacovarianza muestral se puede ver en Aguilera et al. (1999b).

2.2. Representaciones basicas de datos fun-

cionales

Puesto que en la practica las curvas muestrales se observan en un numerofinito de puntos, el primer paso es reconstruir las trayectorias muestrales apartir de las observaciones discretas. Como es imposible medir o observarun conjunto de funciones continuas en el tiempo, es decir, no disponemos dela funcion original, el objetivo es obtener el mejor ajuste de ella a partir delos datos discretos. Senalar que, aunque en este trabajo supondremos quelas observaciones son igualmente espaciadas, en realidad no es necesario nisiquiera que las trayectorias tengan registros en los mismos puntos.

Page 20: Aplicaciones en meterereolog a de modelos funcionales de ...

12 CAPITULO 2. ASPECTOS METODOLOGICOS

Supongamos que disponemos de una muestra de trayectorias muestralesdel proceso estocastico X = X(t) : t ∈ T denotadas por

x1(t), x2(t), ..., xN(t) : t ∈ T.

En la practica, la forma funcional de las trayectorias muestrales se cons-truye a partir de datos discretos. La informacion muestral, es decir, losdatos discretos que se utilizan para aproximar las trayectorias muestralesse representan mediante vectores x1, x2, ..., xN donde cada vector es xi =(xi0, xi1, . . . , xiKi

)′, i = 1, ..., N, donde xik es el valor observado de la i-esimatrayectoria muestral en el instante tik. Es decir,

xik = xi(tik) k = 0, ..., Ki, i = 1, ..., N.

En este caso el conjunto de puntos de observacion en el tiempo es dife-rente para cada trayectoria, pero no necesariamente tiene que ser ası. Enel caso de los datos de metereologıa analizados en este trabajo se dispo-ne de observaciones igualmente espaciadas en los mismos puntos para to-das las curvas de temperatura. Por ello, a partir de ahora se consideraranlos mismos tiempos de observacion para todas las trayectorias muestralestK ∈ T : k = 0, 1 . . . , K(Ki = K ∀i).

Para hallar las trayectorias funcionales existen principalmente dos vıas.Una de ellas corresponde al uso de tecnicas no-parametricas de estimacion decurvas (ver Ferray and View (2006). Este trabajo se basa en su totalidad enotra vıa mas usual que es la de las tecnicas parametricas. Para reconstruir lastrayectorias funcionales se consideraran representaciones de las curvas mues-trales en terminos de base de funciones. Para ello es necesario seleccionar eltipo de bases, ası como el metodo de estimacion de los coeficientes basicos.

Las bases de funciones son muy utiles en el proceso de obtener las trayec-torias funcionales porque conservan muy bien la informacion de los datos, sonflexibles y ademas optimizan el tiempo computacional necesario para realizarlos procesos. Para lograr un resultado satisfactorio es necesario que las fun-ciones basicas compartan caracterısticas con las funciones que van a estimar.Es decir, no existen bases universales, dependiendo de los datos elegiremosuna base u otra.

Page 21: Aplicaciones en meterereolog a de modelos funcionales de ...

2.2. REPRESENTACIONES BASICAS DE DATOS FUNCIONALES 13

Un sistema de funciones basicas es un grupo de funciones conocidas queson matematicamente independientes unas de otras. El sistema resultantepuede aproximar de forma arbitraria cualquier funcion tomando una sumaponderada o una combinacion lineal de P de esas funciones, siendo P unnumero suficientemente grande.

Se asume que las trayectorias de la muestra pertenecen a un espaciofinito dimensional generado por una base ø1(t), ø2(t), ..., øP (t), por lo quese pueden expresar como sigue:

xi(t) =P∑p=1

aipøp(t) i = 1, ..., N.

En la practica se dispone de un gran numero de bases a utilizar, la elec-cion de la misma dependera de las caracterısticas de las curvas y de los datosdisponibles. A continuacion se van a mencionar algunos de los sistemas debases mas conocidos. En el caso practico de este trabajo se ha seleccionadola base de B-splines, por lo que se ha puesto mas enfasis en su descripcion.

Las bases clasicas por excelencia son las compuestas por monomios quese utilizan para construir series de potencias

1, t, t2, . . . , tk, . . .

Otra base muy conocida es la base de Fourier

1, sin(wt), cos(wt), sin(2wt), cos(2wt), . . . , sin(kwt), cos(kwt), . . . .

Esta base es muy utilizada en la practica cuando se estiman trayectoriasregulares y periodicas. Estas funciones son muy utiles para aproximar tra-yectorias muy estables en las que no hay un comportamiento local fuerte ycuya curvatura es la misma aproximadamente en todo el intervalo. En cam-bio, son inadecuadas si se sospecha que existe algun grado de discontinuidaden las trayectorias a aproximar.

Las bases de wavelets tambien son muy utilizadas como funciones basicasa la hora de representar los datos funcionales. Una base de wavelets se obtienemediante dilataciones y traslaciones de una wavelet madre apropiada φ

φkj (t) = 2k/2φ(2kt− j

),

Page 22: Aplicaciones en meterereolog a de modelos funcionales de ...

14 CAPITULO 2. ASPECTOS METODOLOGICOS

con h j y k enteros. A diferencia de las bases de Fourier, las bases Wavelestsno asumen que los datos sean periodicos. Se utilizan sobre todo para repre-sentar curvas muestrales con un caracter local muy fuerte.

Las funciones basicas mas utilizadas para datos suaves no periodicos sonlos B-splines. Como se ha mencionado anteriormente estas bases son las quese han elegido para este trabajo, ya que, su comportamiento local es muybueno para aproximar curvas suaves como las de temperatura. En concretolos B-spline seleccionados son los de grado tres que son los mas adecuados enel caso de trayectorias regulares. A continuacion se definen mas ampliamentelas bases de B-splines.

Los splines son curvas polinomicas a trozos unidas de forma suave y con-tinuamente diferenciables hasta un orden prescrito. Es decir, dada una par-ticion de nodos del intervalo donde queremos aproximar las trayectorias, unspline de grado r (orden r+1) no es mas que una funcion que en cada interva-lo es un polinomio de grado r y que tiene derivadas continuas hasta el ordenr-1 en los extremos de dichos intervalos.

Cada funcion spline de un determinado grado, suavidad y particion deldominio, se puede representar como una combinacion lineal de B-splines delmismo grado, suavidad y sobre la misma particion. La dimension de la basede los B-splines de grado r es igual al orden de los polinomios mas el numerode nodos de definicion interiores.

Los B-spline pueden ser evaluados de una manera numericamente esta-ble por el algoritmo De Boor. Las referencias basicas son De Boor (1997) yRamsay y Silverman (1997, 2005). Existen variantes mas simples y rapidasque el algoritmo De Boor, pero su estabilidad es menor.

En este caso se ha obtenido la formula recursiva del algoritmo De Boor. Seconsidera t0 < ... < tk una particion de nodos del intervalo T. Si extendemosla particion 6 nodos mas t−3 < t−2 < t−1 < t0 < ... < tk < tk+1 < tk+2 < tk+3,la base de B-splines de grado r define de la siguiente manera:

Page 23: Aplicaciones en meterereolog a de modelos funcionales de ...

2.2. REPRESENTACIONES BASICAS DE DATOS FUNCIONALES 15

B1i (t) =

1 si t ∈ [ti − 2, ti+1]

0 otras

j = −1, 0, 1, ..., K + 4

Br+1i (t) =

(t− ti−2)Bri (t)

tj+r−2 − ti−1+

(ti+r−1 − t)Bri+1(t)

ti+r−1 − ti−1(2.1)

r ≥ 1; i = −1, 0, ..., K − r + 4

En el caso de funciones B-spline de grado tres con nodos igualmenteespaciados tambien se dispone de una expresion cerrada (ver Valderrama et.al (2000)). Por simplicidad se consideran nodos igualmente espaciados dentrodel intervalo T, es decir, ti = h × j, siendo h = T/K, si bien esta condicion deequidistancia entre los nodos no es necesaria. Insertando 6 nodos adicionalesa la particion de nodos definida anteriormente t−3 < t−2 < t−1 < t0 < ... <tK < tK+1 < tK+2 < tK+3 la definicion no recursiva de los B-splines es lasiguiente:

B3i (t) =

1

h3

(t− ti−2)3 si t ∈ [ti−2, ti−1)

1 + 3h2(t− ti−1) + 3h(t− ti−2)2 − 3(t− ti−1)3 si t ∈ [ti−1, ti)

1 + 3h(ti+1 − t) + 3h(ti+1 − t)2 − 3(ti+1 − t) si t ∈ [ti, ti+1)

(ti+2 − t)3 si t ∈ [ti+1, ti+2)

0 otras

donde i = −1, ..., k + 1.

Para elegir la forma de aproximar los coeficientes basicos es necesario sa-ber si las curvas de la muestra se han observado con error o sin el, cual es elorigen de las observaciones y tambien cual es la forma de las trayectorias fun-cionales esperada. Una vez elegida la base adecuada, si el predictor funcionales observado con error

xik = xi(tk) + εik k = 0, 1, ..., K; i = 1, ..., N, (2.2)

Page 24: Aplicaciones en meterereolog a de modelos funcionales de ...

16 CAPITULO 2. ASPECTOS METODOLOGICOS

los metodos a utilizar son por ejemplo aproximacion de mınimos cuadrados oproyeccion ortogonal. Si en cambio, consideramos que las curvas muestralesson observadas sin error

xik = xi(tk) k = 0, ..., K; i = 1, ..., N, (2.3)

utilizarıamos algun metodo de interpolacion, como por ejemplo la interpola-cion spline cubica. En ambos casos tomando la base φ1(t), φ2(t), ..., φP (t)el resultado consiste en la obtencion de los coeficientes aip que definen latrayectoria funcional dada por

xi(t) =P∑p=1

aipøp(t) i = 1, ..., N.

A continuacion se resumen los metodos mencionados.

Aproximacion por mınimos cuadrados

El objetivo de la aproximacion de mınimos cuadrados es ajustar una curvaa los datos discretos xik, con k = 0, ..., K; i = 1, ..., N, usando el modelo 2.2.Asumiendo que los errores son independientes e identicamente distribuidos,se va a describir la aproximacion de mınimos cuadrados ordinaria. En primerlugar expresamos en terminos de funciones basicas xi(tk):

xi(tk) =P∑p=1

aipøp(tk) k = 0, ..., K i = 1, ..., N.

En forma matricial

xi = Φiai

donde ai = (ai1, ..., aiP )′ y Φi = (φp(tk))K×P y xi el vector que representa alos vectores con los datos discretos observados como xi = (xi1, ..., xiK)′.

Los coeficientes de la expansion basica, aip, se aproximan mediante elcriterio de mınimos cuadrados. En forma matricial viene dado por

ECM(xi|ai) = (xi − Φiai)′(xi − Φiai).

Derivando respecto a ai e igualando a cero se obtiene

Page 25: Aplicaciones en meterereolog a de modelos funcionales de ...

2.2. REPRESENTACIONES BASICAS DE DATOS FUNCIONALES 17

2ΦiΦ′iai − 2Φ′ixi = 0.

Resolviendo esta ecuacion para ai, tenemos el estimador mınimo cuadrati-co del vector de coeficientes basicos ai dado por

ai = (Φ′iΦi)−1Φ′ixi.

Por ultimo se ha calculado el vector xi con los valores aproximados y la curvaajustada dado por

xi = Φiai = Φi(Φ′iΦi)

−1Φ′ixi,de modo que cada curva muestral es aproximada por xi(t) = a′iφ(t).

Esta aproximacion es adecuada cuando asumimos que los residuos sobre laverdadera curva son independientes e igualmente distribuidos con media ceroy varianza constante. En el caso de aproximacion con B-splines no es nece-sario que el numero de nodos de definicion coincida con el numero de lasobservaciones discretas, es un parametro que se elige de acuerdo a las carac-terısticas de los datos. Se recomienda incluir un numero de nodos mayor enla parte en la que la funcion muestral tenga mas complejidad. Sin embargo,debe haber al menos un valor observado en cada subintervalo. Tambien exis-ten metodos objetivos basados en datos para la posicion de los nodos, porejemplo, Friedman and Silverman (1989).

Otro punto a tener en cuenta es la eleccion del numero de funcionesbasicas. Si el numero seleccionado es pequeno el resultado sera una funciondemasiado suavizada, en cambio, si el numero es grande la trayectoria fun-cional resultante no se suavizara practicamente nada y estara afectada demucha variabilidad. Se puede dar el caso que un incremento en el numero debases no mejore el ajuste de la funcion o incluso lo empeore.

Dentro de los ajustes por mınimos cuadrados existen diferentes varian-tes. La que se ha descrito anteriormente es la mas simple con los pesos delas bases uniformes. Tambien esta el ajuste por mınimos cuadrados ponde-rados. Este ajuste se utiliza mayoritariamente cuando tratamos con erroresno estacionarios y/o autocorrelados, en este caso se deberıa aportar un pesodiferente a los distintos residuos. En la aproximacion de mınimos cuadradoslocalizados, en cambio, se tiene en cuenta que en un punto concreto el valor

Page 26: Aplicaciones en meterereolog a de modelos funcionales de ...

18 CAPITULO 2. ASPECTOS METODOLOGICOS

de la funcion estimada puede estar influenciado por las observaciones proxi-mas a ese punto. Por otro lado se puede incluir una penalizacion de la falta desuavidad de la curva para mejorar el ajuste. En los trabajos Aguilera (2013a,2013b) podemos consultar los ultimos avances realizados en este sentido.

Proyeccion ortogonal

Una aproximacion diferente de suavizamiento para estimar los coeficientesde las bases consiste en aproximar cada curva de la muestra por su proyec-cion ortogonal en el subespacio L2(T ) generado por una base ortonormalø1(t), ø2(t)..., øP (t). La proyeccion ortogonal de cada curva de la muestraxi(t) en este subespacio P-dimensional viene dada por

P (xi(t)) =P∑p=1

[∫Txi(t)øp(t)dt]øp(t) i = 0, ..., N.

El problema es estimar los coeficientes basicos a partir de las observacio-nes discretas en el tiempo de las curvas muestrales

aip =∫xi(t)øp(t)dt.

Una posible solucion para calcular de forma aproximada esta integralconsiste en aplicar metodos de cuadratura compuesta, como el metodo deintegracion de Romberg.

En la parte practica de este trabajo se ha seleccionado el metodo de in-terpolacion, ya que se considera que los datos de temperatura analizados notienen error. La descripcion de los datos se realiza en el Capıtulo 3.

Interpolacion spline cubica con bases de B-splines

Las bases de B-splines son muy usadas en la practica para aproximarcurvas muestrales suaves con buen comportamiento local. Consideramos losmismos tiempos de observacion t0 < t1 < ... < tK para todas las trayectoriasmuestrales (Ki = K, ∀i). Cuando se realiza interpolacion spline cubica lacurva ajustada pasa por todos los puntos y la dimension de la base coincidecon el numero de las observaciones de cada curva mas dos.

Page 27: Aplicaciones en meterereolog a de modelos funcionales de ...

2.2. REPRESENTACIONES BASICAS DE DATOS FUNCIONALES 19

La funcion spline cubica que interpola a cada una de las trayectoriasmuestrales xi(t) sobre los nodos de observacion, se puede expresar en terminosde la base de B-spline cubicos B−1(t), B0(t), B1(t), ..., BK+1(t) en la forma

xi(t) =K+1∑p=−1

aipBp(t)

Los coeficientes basicos se obtienen resolviendo el siguiente sistema deecuaciones lineales:

xik = xi(tk) =K+1∑p=−1

aipBp(tk) k = 0, ..., K. (2.4)

El sistema consta de K+ 1 ecuaciones y K+ 3 incognitas. En el siguienteparrafo se explica detalladamente esta afirmacion.

Es evidente que si se desea calcular un polinomio cubico conociendo suvalor en dos puntos, por ejemplo en t0 y t1 y si se conoce el valor de susdos primeras derivadas en el punto t1, el problema solo tiene una solucion.Si queremos utilizar un B-spline cubico para interpolar datos, en el siguientesubintervalo el polinomio cubico tendrıa que volver a interpolar el valor enel nodo t1 y t2. Se puede interpolar un nuevo valor de funcion en t2, pero nopodemos interpolar ninguna de las derivadas de forma arbitraria en uno deesos extremos, pues, para que ambos polinomios enlacen de forma continuase necesita que el nuevo polinomio tenga en t1 el mismo valor y las mismasderivadas que el polinomio construido en [t0, t1]. Es decir, para el segundo in-tervalo no necesitamos el valor de las derivadas porque ya es conocido el valorde las derivadas en t1. Continuando con la construccion hasta el ultimo in-tervalo, observamos que se puede resolver este problema de interpolacion conK + 3 datos (K + 1 nodos mas el valor de las dos primeras derivadas en unode ellos). Es decir, el espacio generado por la base de B-splines cubicos tienedimension K+ 3. Por otra parte, sabemos que K es el numero de polinomiosa construir. Cada polinomio consta de cuatro parametros desconocidos porlo que el total de parametros es de 4K. Disponemos de K − 1 restriccionesporque exigimos continuidad en los K − 1 nodos interiores, ademas tambienes conocido el valor de las dos derivadas en cada nodo. Esto quiere decir queen total el numero de restricciones es de 3(K − 1). Si realizamos una resta

Page 28: Aplicaciones en meterereolog a de modelos funcionales de ...

20 CAPITULO 2. ASPECTOS METODOLOGICOS

entre el numero de parametros y el numero de restricciones obtenemos que4K − 3(K − 1) = K + 3. Luego podemos interpolar valores en los K + 1nodos y 2 datos mas.

Los 2 datos restantes se pueden obtener de diferentes formas. Las doscondiciones adicionales requeridas pueden ser cualquiera de las siguientes:

Cubico natural

x′′i (t0) = 0x′′i (tk) = 0

Cubico periodico

x′i(t1) = x

′i(tk)

x′′i (t1) = x

′′i (tk)

Cuasi-natural

Este tipo de interpolacion utiliza valores generados uniformemente (proxi-mos a cero) como condiciones lımite. Fue introducida por Escabias et al.(2005) y se utiliza para la estimacion de modelos de regresion logıstica fun-cional.

La interpolacion spline cubica natural es la mas usada en la practica y esla que se ha utilizado para resolver el caso practico de este trabajo. Por estarazon se dan mas detalles de este tipo de interpolacion.

En el caso de la interpolacion spline cubico natural consideramos todaslas trayectorias muestrales x1(t), ..., xN(t) observadas en los nodos t0, ..., tKy el sistema lineal dado por la ecuacion 2.4 con las condiciones x

′′i (t0) = 0 y

x′′i (tn) = 0.

En consecuencia el sistema lineal se convierte en X = AB′

donde A es lamatriz que tiene como columnas los coeficientes de las bases de cada curvamuestral interpolada xi(t), X es la matriz que contiene las observaciones delas trayectorias muestrales en los nodos de observacion y de sus derivadasen los extremos. Como la interpolacion seleccionada ha sido spline cubica

Page 29: Aplicaciones en meterereolog a de modelos funcionales de ...

2.3. ANALISIS FUNCIONAL EN COMPONENTES PRINCIPALES 21

natural X es X = (0|χ|0) con 0 = (0, ..., 0)′ y (χ)Nx(K+1) = (xik) i = 1, ..., Ny k = 0, 1, ..., K. Por otro lado, B esta definida en terminos de los valores delas bases de los B-splines en los nodos de observacion

B =

B−12)(t0) B0

2)(t0) ... BK+12)(t0)

B−1(t0) B0(t0) ... BK+1(t0)...

B−1(tK) B0(tK) ... BK+1(tK)

B−12)(tK) B0

2)(tK) ... BK+12)(tK)

siendo Bi

2)(t) la segunda derivada del i-esimo B-spline en el tiempo t. Resol-viendo esta ecuacion matricial obtenemos la matriz A con el resultado de laaproximacion de los coeficientes basicos de todas las trayectorias muestrales,dada por A = X(B

′)−1.

En este punto, tenemos seleccionados tanto el tipo de base, B-spline, comoel metodo de ajuste de los coeficientes basicos, interpolacion cubica natural.Por lo tanto, ya es posible expresar cada trayectoria como combinacion linealde las bases seleccionadas.

2.3. Analisis Funcional en Componentes Prin-

cipales

En este apartado se explica la tecnica de Analisis Funcional en Com-ponentes Principales (AFCP). Esta tecnica es la extension del Analisis deComponentes principales (ACP) para el caso funcional. El objetivo del ACPes reducir la dimension del problema para trabajar con un numero menorde variables artificiales. Hotelling extrajo estas nuevas variables artificialesrealizando combinaciones lineales con varianza maxima de las variables deestudio. El objetivo del AFCP tambien es reducir la dimension de las varia-bles del proceso en terminos de un reducido grupo de variables incorreladasa las que llamamos componentes principales funcionales.

Recordemos que el proceso estocastico con el que estamos trabajandoX(t) : t ∈ T es de segundo orden, continuo en media cuadratica y cuyastrayectorias pertenecen al espacio de Hilbert L2(T ) de funciones cuadradointegrable.

Page 30: Aplicaciones en meterereolog a de modelos funcionales de ...

22 CAPITULO 2. ASPECTOS METODOLOGICOS

El ACP multivariante se extendio al caso funcional para reducir la di-mension infinita de las variables funcionales y para explicar su estructura dedependencia mediante un reducido grupo de variables incorreladas.

Comenzamos definiendo la funcion media del proceso µ(t) = E[X(t)],la funcion de varianza V (t) = E[(X(t) − µ(t))2] y la funcion de covarianzaC(t, s) = E[(X(t)− µ(t))(X(s)− µ(s))]. Para facilitar los desarrollos asumi-mos sin perdida de generalidad que la funcion media del proceso es constantee igual a cero, µ(t) = 0 ∀t ∈ T.

Asociado a la funcion de covarianza del proceso, C(t, s), se define el ope-rador de covarianza R : L2(T )→ L2(T ) dado por

R(f(t)) =∫TC(t, s)f(s)ds ∀f ∈ L2(T ).

Como consecuencia de las propiedades del operador de covarianza R existeuna sucesion λj de numeros reales positivos no nulos y una base ortonormalde funciones fj(t) en L2(T ), que corresponden respectivamente con losvalores propios y funciones propias de R, obtenidos como soluciones de laecuacion integral:

R(fj(t)) =

∫T

C(t, s)fj(s)ds = λjfj(t). (2.5)

Los componentes principales ξj se definen como combinaciones linealesgeneralizadas de la variable funcional dadas por

ξ =∫TX(t)f(t)dt,

que sean incorreladas y tengan varianza maxima.

Ası, la funcion peso f1 asociada a la primera componente principal seobtiene buscando la combinacion lineal generalizada de varianza maxima.La siguiente componente principal debe tener, de la variabilidad restante lamaxima posible, ademas de estar incorrelada con los anteriores. Es decir,para calcular la j-esima componente principal se ha de resolver el siguien-te problema de MaxV ar[ξ] sujeto a la restriccion de que ||f(t)||2 = 1 y∫Tf(t)fi(t)dt = 0 ∀i = 1, . . . , j − 1. Resolviendo este problema de maxi-

mizacion se obtiene que las funciones peso que definen a las componentes

Page 31: Aplicaciones en meterereolog a de modelos funcionales de ...

2.3. ANALISIS FUNCIONAL EN COMPONENTES PRINCIPALES 23

principales son las autofunciones obtenidas como solucion de la ecuacion in-tegral de segundo orden 2.5. Por lo tanto, la j-esima componente principalviene dada por

ξj =

∫T

X(t)fj(t),

siendo el autovalor asociado la varianza de la componente principal

λj = V ar[ξj].

A continuacion se presenta una propiedad de descomposicion del pro-ceso estocastico en funcion de las componentes principales. Este resultadoconocido como desarrollo de Karhunen- Loeve fue utilizado por primera vezpor Deville (1974) en el contexto del AFCP que fue llamado en este trabajoAnalisis Harmonico Estocastico. Esta propiedad consiste en que el procesoadmite la siguiente representacion:

X(t) =∞∑i=1

fi(t)ξi.

El desarrollo de Karhunen- Loeve truncado en el q-esimo termino es lamejor aproximacion en media cuadratica de X(t) dada por (Fukunaga, 1990)

Xq(t) =q∑i=1

fi(t)ξi,

y proporciona una representacion ortogonal de la variable funcional en termi-nos de las q primeras componentes principales.

La varianza total del proceso X(t) : t ∈ T viene dada por

VT =

∫T

C(t, s)dt =∞∑j=1

λj.

En la practica se seleccionan las q-primeras componentes principales cuyaproporcion de varianza explicada acumulada dada por,

V q =

∑qi=1 λiVT

,

sea tan proxima a uno como sea posible.

Page 32: Aplicaciones en meterereolog a de modelos funcionales de ...

24 CAPITULO 2. ASPECTOS METODOLOGICOS

A continuacion se resume el procedimiento de estimacion de las compon-nentes principales funcionales a partir de representaciones basicas de unamuestra de curvas muestrales obtenidas como realizaciones independientesx1(t), x2(t), ..., xN(t) del proceso estocastico X(t) : t ∈ T.

En este caso tambien asumimos sin perdida de generalidad que las curvasobservadas estan centradas por lo que la funcion media muestral es cero

x(t) =1

N

N∑i=1

xi(t) = 0.

Entonces, la j-esima componente principal muestral es un vector de di-mension N cuyas componentes vienen dadas por

ξij =

∫T

xi(t)fj(t)dt, i = 1, ..., N,

donde la funcion peso asociada fj es la j-esima funcion propia del operador decovarianza muestral obtenida como solucion de la siguiente ecuacion integralde segundo orden

R(fj(t)) =

∫T

C(t, s)fj(s)ds = λj fj(t),

donde C(t, s) es la funcion de covarianza muestral dada por

C(t, s) =1

N − 1

N∑i1

(xi(t)− x(t))(xi(s)− x(s)),

y λj es la varianza muestral de ξj.

De nuevo, cada una de las curvas muestrales se puede expresar en terminosde componentes principales funcionales muestrales como sigue:

xi(t) =N−1∑j=1

ξij fj(t),

de modo que truncando esta expresion se obtiene la representacion de lascurvas muestrales en terminos de las q primeras componentes principales

xqi (t) =

q∑j=1

ξij fj(t),

Page 33: Aplicaciones en meterereolog a de modelos funcionales de ...

2.4. MODELOS DE PREDICCION EN COMPONENTES PRINCIPALES25

cuya varianza explicada es∑q

j=1 λj.

Una vez descrito la estimacion del AFCP para las trayectorias muestrales,veamos como se calculan las componentes principales funcionales a partir delas representaciones basicas de las curvas muestrales

xi(t) =P∑p=1

aipφp(t) i = 1, ..., N.

En este caso, en Aguilera et al. (2007) se demostro que el problema de AFCPse reduce a calcular el ACP multivariante de la matriz AΨ1/2, donde A =(aij)N×P es la matriz que contiene por filas los coeficientes basicos de lastrayectorias muestrales y Ψ=(Ψjk)P×P es la matriz cuyos elementos son losproductos escalares entre las funciones basicas dados por

Ψjk =

∫T

φjφkdt j, k = 1, ..., P.

Suponiendo que Γ = (ξij)N×P es la matriz cuyas columnas son los compo-nentes principales de AΨ1/2 y G es la matriz cuyas columnas son las funcionespropias asociadas, tenemos que Γ = (AΨ1/2)G.

Las funciones propias del operador de covarianza muestral admiten en-tonces la siguiente expansion basica:

fi(t) =P∑l=1

fliφl(t) i = 1, ..., P,

donde los coeficientes son los elementos de la matriz F = (fli)P×P dada por

F = Ψ−1/2G.

2.4. Modelos de Prediccion en Componentes

Principales

Uno de los errores mas comunes que se realiza en la practica es el de crearel modelo de prediccion con el estimador clasico de mınimos cuadrados sinrespetar la condicion de no multicolinealidad entre los predictores. Aunque

Page 34: Aplicaciones en meterereolog a de modelos funcionales de ...

26 CAPITULO 2. ASPECTOS METODOLOGICOS

existen diferentes metodos para solucionar este problema, en este trabajo sehan utilizado los modelos de Prediccion en Componentes Principales (PCP).

Aguilera et al (1997, 1999a, 1999b) introdujeron los modelos PCP pa-ra procesos estocasticos en tiempo continuo. El objetivo de estos modeloses predecir un proceso en un intervalo de tiempo futuro [T3, T4] a partirde su evolucion en un intervalo pasado [T1, T2], siendo T2 < T3. En estetrabajo se han adaptado estos modelos para predecir una respuesta funcio-nal Y = Y (t) : t ∈ T a partir de un predictor funcional relacionadoX = X(t) : t ∈ T en el mismo intervalo de observacion. Es decir, ambosprocesos (respuesta y predictor) ocurren en el mismo intervalo de tiempo. Ennuestro caso, los conjuntos de variables de respuesta son los datos a escalalocal y las predictoras a escala global. Ası se va a predecir la variable tem-peratura a escala local a partir de los datos de prediccion de temperatura agran escala o escala global. Es decir, el objetivo es el de adecuar la prediccionglobal a escala local. A partir de ahora el intervalo de tiempo en el que seobservan ambos procesos sera denotado por [T1, T2].

La caracterıstica principal de los modelos PCP es que se realiza un dobleAFCP, uno en el proceso a escala global y otro en el proceso a escala local,estos modelos se definen a continuacion. El proceso estocastico a escala glo-bal se denota por X(t) : t ∈ [T1, T2], en cambio, el correspondiente a escalalocal es Y (s) : s ∈ [T1, T2].

Las funciones propias y componentes principales del proceso a escala glo-bal X se denotan por fi(t) y ξi, y como ya se ha visto el proceso admite lasiguiente descomposicion en componentes principales:

X(t) =∞∑i=1

ξifi(t).

De forma similar se denotan por gj(s) y ηj a las funciones propias y lascomponentes principales del proceso a escala local obteniendo la siguienterepresentacion en componentes principales:

Y (t) =∞∑j=1

ηjgj(t).

Page 35: Aplicaciones en meterereolog a de modelos funcionales de ...

2.4. MODELOS DE PREDICCION EN COMPONENTES PRINCIPALES27

Un punto delicado es la determinacion del numero de componentes prin-cipales (q) necesarias para obtener una buena prediccion de la respuestafuncional. En este caso los resultados obtenidos para el ACP de un vectoraleatorio son totalmente validos para los procesos estocasticos. En la partepractica de este trabajo se han retenido los componentes principales cuyosporcentajes acumulados de varianza sean mayores o iguales a un punto decorte entre el 80 % y el 99 %.

Mediante proyeccion ortogonal de la respuesta funcional Y (t) sobre elespacio engendrado por las componentes principales del predictor funcionaly truncando adecuadamente en terminos de un conjunto optimo de compo-nentes principales del predictor se obtiene que el modelo PCP viene dadopor

Y q(s) =

q∑j=1

ηpjj gj(s), (2.6)

donde ηpjj es el estimador lineal mınimo cuadratico de la j-esima componente

principal de la respuesta funcional en funcion de las pj primeras componentesprincipales del predictor funcional dado por

ηpjj =

pj∑i=1

βji ξi,

con βji = E[ηjξiλi

].

El modelo de prediccion en componentes principales dado por la ecuacion2.6 se denotara por PCP (q; p1, p2, ..., pq).

Un problema importante en la seleccion del modelo PCP optimo es laseleccion de las mejores componentes principales ξi del predictor funcionalpara estimar cada una de las componentes principales ηj de la respuesta.

En la practica lo mas comun es seleccionar automaticamente los compo-nentes principales a escala global ξi con mayores valores propios. Pero algunosautores como Jackson (1991) senalan que para el caso multivariante no existeninguna razon para que sean los mejores predictores las componentes prin-cipales con maxima varianza. Se puede dar el caso de que algunas de las

Page 36: Aplicaciones en meterereolog a de modelos funcionales de ...

28 CAPITULO 2. ASPECTOS METODOLOGICOS

componentes con menor varianza presente una alta correlacion con la varia-ble respuesta. Por esta razon en el problema practico de este trabajo se haaplicado un metodo alternativo basado en la correlacion entre componentesprincipales.

Para terminar se define el error cuadratico medio de la prediccion linealpara cada t ∈ [T1, T2] del proceso a escala local como sigue:

ε2 = E

[∫ T2

T1

(Y (s)− Y q(s)

)2]=

q∑j=1

αj −q∑j=1

pi∑i=1

αjρ2(ηj, ξi).

Page 37: Aplicaciones en meterereolog a de modelos funcionales de ...

Capıtulo 3

Aplicacion practica

El objetivo de este capıtulo y uno de los objetivos de este trabajo es poneren practica toda la metodologıa estudiada en los capıtulos anteriores. Coneste ejemplo practico aplicado al campo de la meteorologıa se quiere observarsi el modelo PCP con un tratamiento funcional de los datos y adecuado con latecnica de prediccion meteorologica MOS es valido para realizar buenas pre-dicciones de temperatura. Y por lo tanto, decidir si merece la pena investigarde forma mas profunda esta lınea. En este ejemplo se va a realizar prediccionde temperatura para el dıa en curso y tres dıas mas en un punto local, apartir de las predicciones de temperatura de un modelo de circulacion globalen el mismo periodo. Para comparar los resultados de este modelo, dejando aun lado las predicciones del modelo GFS, se ha incluido otro ejemplos en estetrabajo. En este ejemplo se predice la temperatura de cuatro dıas a partir delas temperaturas observadas de los cuatro dıas anteriores.

3.1. Descripcion de los datos

Los datos seleccionados para realizar este trabajo son temperatura ensuperficie (medida a dos metros de altura) cada 6 horas. La estacion me-teorologica seleccionada en la cual se han medido los datos de temperaturaes la de Abetxuko que se puede considerar representativa de la ciudad deVitoria- Gasteiz. La estacion de Abetxuko se instalo el 4 de abril de 2001y lleva funcionando de forma operativa desde entonces. Aunque el periodo

29

Page 38: Aplicaciones en meterereolog a de modelos funcionales de ...

30 CAPITULO 3. APLICACION PRACTICA

de datos disponible es mayor, para realizar el ejercicio se ha seleccionado unano de datos, el 2010. Estos datos han sido medidos por la red de estacio-nes automaticas en superficie que pertenece al Gobierno Vasco y han sidogestionados y tratados por Euskalmet.

Figura 3.1: Las ubicaciones exactas de donde se toman los datos del modeloGFS y los datos observados de la estacion de Abetxuko

Ademas de los datos de temperatura observados tambien disponemos delos datos de temperatura en superficie del modelo de circulacion global Glo-bal Forecast System (GFS). El GFS realiza predicciones para todo el globocuatro veces al dıa, en concreto a las 00h, a las 06h, a las 12h y a las 18h.Para este trabajo se han obtenido los datos de la ejecucion de las 00h deun punto en concreto cuyas coordenadas son (−3, 43). La variable seleccio-nada tambien es temperatura cada 6 horas desde el dıa en curso y hasta unhorizonte de prediccion de tres dıas, aunque como se ha descrito en la par-te teorica este modelo dispone de un horizonte de prediccion mucho mayor.Se ha tomado hasta tres dıas de horizonte de prediccion porque este es elpunto donde se considera que las predicciones son mas fiables. El periodo dedatos seleccionado es el mismo que el de los datos medidos en la estacionde Abetxuko, es decir, el ano 2010. En este caso no disponemos de la serie

Page 39: Aplicaciones en meterereolog a de modelos funcionales de ...

3.2. TRATAMIENDO DE DATOS FUNCIONALES 31

completa de datos, ya que, no se dispone de datos del modelo GFS de 8 dıas.En realidad esto no es un gran problema a la hora de realizar el ejercicio,solo que disponemos de 8 trayectorias menos para entrenar el modelo.

3.2. Tratamiendo de datos funcionales

Como se ha comentado disponemos de predicciones cada 6 horas de tem-peratura que nos las proporciona el modelo GFS. Como el objetivo de estaaplicacion es modelizar y predecir una funcion de temperatura con horizontepara el dıa en curso (D) y tres dıas mas (D+3), disponemos de una aproxi-macion del resultado antes de comenzar. Como se ha explicado en la partede teorıa las trayectorias no se definen en dos periodos disjunto de futuro ypasado, ambos intervalos pertenecen al futuro.

A continuacion se describe como se han tomado los vectores de datosdiscretos tanto de las observaciones como de las predicciones globales, conlos cuales se calcularan las trayectorias muestrales. Como cada dıa del anode 2010 el modelo global GFS obtuvo predicciones para el dıa en curso conun horizonte de prediccion de 3 dıas y cada nuevo dıa podemos disponer deesa informacion, se van a calcular 357 trayectorias muestrales. Por ejemplo,para el primer dıa del ano, 1 de enero, se dispone de los datos del GFS cada6 horas para ese dıa y 3 dıas mas:

01/01/2010 02/01/2010 03/01/2010 04/01/201000h,06h,12,18h 24h,30h,36h,42h 48h,54h,60h,66h 72h,78h,84h,90h

Y para entrenar el modelo necesitamos tambien las observaciones de laestacion de Abetxuko para esos dıas de prediccion:

01/01/2010 02/01/2010 03/01/2010 04/01/201000h,06h,12,18h 00h,06h,12,18h 00h,06h,12,18h 00h,06h,12,18h

Page 40: Aplicaciones en meterereolog a de modelos funcionales de ...

32 CAPITULO 3. APLICACION PRACTICA

Para el dıa 2 tenemos que la prediccion que recibimos del GFS es nuevay por lo tanto diferente a la del dıa anterior, aunque algunos dıas coincidancon los del dıa 1:

02/01/2010 03/01/2010 04/01/2010 05/01/201000h,06h,12,18h 24h,30h,36h,42h 48h,54h,60h,66h 72h,78h,84h,90h

En cambio, los datos observados de la estacion de Abetxuko si que coinci-den en parte con los anteriores, ya que, solo disponemos de una observacionreal para cada instante de tiempo. Esto no ocurre en el caso las predicciones,que para el mismo instante de tiempo podemos disponer de varios valores:

02/01/2010 03/01/2010 04/01/2010 05/01/201000h,06h,12,18h 00h,06h,12,18h 00h,06h,12,18h 00h,06h,12,18h

De forma general lo podemos describir para el dıa D, las predicciones delmodelo GFS son:

D D+1 D+2 D+300h,06h,12,18h 24h,30h,36h,42h 48h,54h,60h,66h 72h,78h,84h,90h

Y las observaciones reales para esos dıas en la estacion de Abetxuko son:

D D+1 D+2 D+300h,06h,12,18h 00h,06h,12,18h 00h,06h,12,18h 00h,06h,12,18h

Para reconstruir las trayectorias funcionales se ha seleccionado el metodode interpolacion, ya que, se considera que los datos no tienen error. Los da-tos de las estaciones estan tratados y gestionados por Euskalmet por lo quese considera que han sido supervisados. Tampoco se considera que tenganerror los datos de prediccion, porque al ser de prediccion y no medidos por

Page 41: Aplicaciones en meterereolog a de modelos funcionales de ...

3.2. TRATAMIENDO DE DATOS FUNCIONALES 33

ningun instrumento el concepto de error se vuelve un concepto abstracto.La reconstruccion de las trayectorias funcionales se ha llevado a cabo me-diante interpolacion cubica natural. La resconstruccion de estas curvas se haexpresado en terminos de la base de funciones B-spline cubicos definidos en16 nodos 00, 06, 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 72, 78, 84, 90 tanto parala variable respuesta como para la variable predictor y se muestra en la Fi-gura 3.2.

Figura 3.2: Bases de B-spline con nodos 0, 6, ..., 90

Las trayectorias funcionales de los datos observados y de las prediccionesdel GFS, ajustadas con la tecnica mencionada se pueden observar en las Fi-guras 3.3 y 3.4.

De estos graficos se puede deducir que los datos de temperatura predi-chos por el GFS correlacionan bien con los datos observados en la estacion.Es decir, que la variable respuesta y la variable predictora parecen adecuadaspara realizar la prediccion. En general se puede concluir segun este graficoque la prediccion de dichos datos es buena para las temperaturas mas altas,pero que no pasa lo mismo con las temperaturas mas bajas.

En las Figura 3.5 vemos las curvas ajustadas con la tecnica de interpo-lacion de spline cubica natural de las trayectorias funcionales tanto de los

Page 42: Aplicaciones en meterereolog a de modelos funcionales de ...

34 CAPITULO 3. APLICACION PRACTICA

Figura 3.3: Trayectorias funcionales de los datos observados

Figura 3.4: Trayectorias funcionales de las predicciones del modelo GFS

Page 43: Aplicaciones en meterereolog a de modelos funcionales de ...

3.3. AJUSTE DE MODELOS PCP 35

datos observados de la estacion de Abetxuko como de las predicciones delmodelo global GFS. En concreto, se trata de los 6 primeros dıas del ano de2010. A la derecha vemos las curvas obtendidas con los datos observados y ala izquierda las obtenidas con los datos del GFS.

3.3. Ajuste de modelos PCP

Para ajustar el modelo PCP y disponer de mejores predicciones que lasrealizadas por el modelo global GFS, el primer paso es repartir las 357 tra-yectorias disponibles del ano 2010 en dos grupos. El primer grupo (muestrade entrenamiento) lo utilizaremos para realizar el ajuste del modelo. La pri-mera trayectoria de este grupo comienza el dıa 01/01/2010 y la ultima es ladel dıa 24/12/2010. El segundo grupo, el de testeo, el cual se ha utilizadopara comprobar si las funciones de temperatura se han ajustado de formaadecuada y va desde la trayectoria que comienza el dıa 25/12/2010 hasta laque comienza el dıa 31/12/2010. Como consta en la parte de teorıa ambosprocesos ocurren en los mismos instantes de tiempo [T1, T2] = [00, 90].

El proceso estocastico a escala global se denota por X(t) : t ∈ [00, 90],en cambio, el correspondiente a escala local es Y (s) : s ∈ [00, 90].

Las trayectorias funcionales de estos procesos estocasticos se han aproxi-mado en el apartado anterior, x1(t), ..., x350(t) tanto las correspondientes alproceso a escala global como las del proceso a escala local y1(t), ..., y350(t).

Para construir el modelo PCP es necesario calcular las componentes prin-cipales de la forma que se indica en el apartado 2.2. Los valores propios y losporcentajes de varianza explicada y acumulada por los componentes apare-cen en la Tabla 3.1. En esta tabla se observa que solo tomando la primeracomponente principal de cada proceso estamos trabajando con el 84 % dela variabilidad total del proceso X(t) : t ∈ [00, 90] y el 87 % del procesoY (s) : s ∈ [00, 90]. Es decir, en realidad con una sola componente des-de el punto de vista de varianza serıa suficiente pero se han implementadotres modelos diferentes. El primero tiene en cuenta la primera componenteprincipal con los porcentajes mencionados, el segundo se ha calculado condos componentes principales ( 90 % y 93 %) y el tercero con las tres prime-

Page 44: Aplicaciones en meterereolog a de modelos funcionales de ...

36 CAPITULO 3. APLICACION PRACTICA

Page 45: Aplicaciones en meterereolog a de modelos funcionales de ...

3.3. AJUSTE DE MODELOS PCP 37

Figura 3.5: Se muestran las trayectorias funcionales ajustadas con interpola-cion spline cubica natural. A la derecha con datos observados de temperaturay a la izquierda para el mismo intervalo con datos del modelo GFS.

Page 46: Aplicaciones en meterereolog a de modelos funcionales de ...

38 CAPITULO 3. APLICACION PRACTICA

ras componentes que explican el 93 % y el 96 % de la variabilidad total delos procesos predictor y respuesta, respectivamente. Esto implica que es masque suficiente construir el modelo PCP con las primeras tres componentesprincipales.

X YCPF Valores Var.Exp. Var.Acum. Valores Var.Exp. Var.Acum.

Propios ( %) ( %) Propios ( %) ( %)1 596.38 84 84 534.37 87 872 39.9 6 90 40.04 6 933 21.49 3 93 16.46 3 964 14.81 2 95 7.95 1 975 9.88 1 96 5.45 1 986 8.39 1 97 3.62 1 997 5.67 1 98 2.32 0 998 4.30 1 99 2.30 0 999 1.96 0 99 1.19 0 9910 1.76 0 99 1.01 0 100TOTAL 709.73 617.16

Tabla 3.1: Valores propios y porcentajes de varianza explicada y acumuladade los primeros 10 componentes principales de los procesos X(t) e Y(s).

A continuacion, para encontrar los mejores predictores de las componen-tes principales, se han calculado los coeficientes de correlacion al cuadradoentre las componentes principales de ambos procesos. El resultado se recogeen la Tabla 3.2. En esta tabla se observa como las tres primeras componentesprincipales del proceso a escala global estan altamente correladas con las tresprimeras componentes del proceso a escala local. Esto puede deberse a queambas variables son temperatura. Como estan altamente relacionadas, concorrelaciones de 0.96, 0.7 y 0.5, a priori parece que el mejor modelo sera elque tiene en cuenta las tres primeros componentes.

Page 47: Aplicaciones en meterereolog a de modelos funcionales de ...

3.3. AJUSTE DE MODELOS PCP 39

ξ1 ξ2 ξ3 ξ4 ξ5 ξ6 ξ7 ξ8η1 0.96 0.00 0.00 0.00 0.00 0.00 0.00 0.00η2 0.00 0.70 0.02 0.02 0.02 0.00 0.00 0.00η3 0.00 0.02 0.50 0.01 0.02 0.03 0.04 0.01η4 0.00 0.03 0.00 0.27 0.15 0.02 0.00 0.00η5 0.00 0.00 0.06 0.06 0.00 0.26 0.01 0.03η6 0.00 0.01 0.02 0.03 0.23 0.02 0.00 0.02η7 0.00 0.00 0.04 0.01 0.00 0.00 0.07 0.06η8 0.00 0.00 0.01 0.08 0.06 0.00 0.01 0.05

Tabla 3.2: Coeficientes de correlacion al cuadrado entre los componentes prin-cipales de los proceses a escala global y a escala local.

Es el momento de calcular los tres modelos PCP (q; p1, p2, . . . , pq) men-cionados

Y q(s) =

q∑j=1

ηpjj gj(s)

1. PCP (q = 1; p1 = 1) :η11 = β1

1ξ1

2. PCP (q = 2; p1 = 1, p2 = 1) :

η12 = β22ξ2

3. PCP (q = 3; p1 = 1, p2 = 1, p3 = 1) :

η13 = β33ξ3

Para ello se han aproximado β11 , β2

1 y β31 mediante regresion lineal obteniendo

β11 = 1,04, β2

2 = −0,84 y β33 = 0,81.

El resultado de la estimacion de las 7 ultimas trayectorias se puede ob-servar en la Figura 3.6. En estas figuras se puede ver como se comportanlos tres modelos PCP ajustados y ademas se pueden comparar tanto con losdatos observados de la estacion meteorologica como con los datos del modelo

Page 48: Aplicaciones en meterereolog a de modelos funcionales de ...

40 CAPITULO 3. APLICACION PRACTICA

global GFS. Se observar como el error mas alto lo cometen los datos del mo-delo global, seguido del PCP(1) y que el que mejor se ajusta es el PCP(3).Para poder realizar una justificacion subjetiva se han calculado los siguientesındices.

Formula del error de predicion para cada trayectoria con cada uno de losmodelos PCP

ECMPCP (q)(w) =

√√√√ 1

16

16∑i=1

(Y qw(ti)− Yw(ti))

2 w = 351, . . . , 357,

Formula del error de prediccion para cada trayectoria con el modelo global

ECMGFS(w) =

√√√√ 1

16

16∑i=1

(Xw(ti)− Yw(ti))2 w = 351, . . . , 357,

w ECMGFS(w) ECMPCP (1)(w) ECMPCP (2)(w) ECMPCP (3)(w)1 31.30 15.54 9.98 7.922 41.62 31.80 15.2 14.193 29.57 20.88 14.38 10.594 19.03 4.40 4.04 3.815 25.84 5.83 6.08 6.316 23.54 6.92 7.03 6.757 19.89 7.01 6.02 4.3

Error Medio 27.26 13.2 8.96 7.7

Tabla 3.3: Error de prediccion para cada trayectoria con cada uno de losmodelos y con el modelo global

En la Tabla 3.3 observamos como se confirma que el modelo PCP(3) esel mejor de todos. En las 7 trayectorias el tercer modelo es el que cometeel menor error ECM. Otra observacion que concluimos de esta tabla es quetodos los modelos PCP mejoran el modelo global.

Page 49: Aplicaciones en meterereolog a de modelos funcionales de ...

3.3. AJUSTE DE MODELOS PCP 41

Figura 3.6: Resultado de prediccion de las trayectorias 351,..,357 con los mo-delos PCP(1), PCP(2) y PCP(3), acompanados de las trayectorias observadasy del GFS

Page 50: Aplicaciones en meterereolog a de modelos funcionales de ...

42 CAPITULO 3. APLICACION PRACTICA

Formula del error para cada instante con cada uno de los modelos PCP

ECMPCP (q)(ti) =

√√√√1

7

357∑w=351

(Y qw(ti)− Yw(ti))2) ti = 0, 6, 12, . . . , 90

Formula del error para cada instante con el modelo global

ECMGFS(ti) =

√√√√1

7

357∑w=351

(Xw(ti)− Yw(ti))2) ti = 0, 6, 12, . . . , 90

ti ECMGFS(ti) ECMPCP (1)(ti) ECMPCP (2)(ti) ECMPCP (3)(ti)00 38.55 34.69 21.48 15.6406 20.68 27.61 16.80 10.6612 14.54 14.31 5.11 4.5818 46.47 19.59 10.35 10.7924 47.32 25.60 15.34 14.5430 23.78 17.74 6.31 5.8236 19.44 4.26 4.22 4.4742 28.37 8.45 10.91 11.9948 48.35 16.03 12.45 11.7254 23.62 8.65 5.98 3.9660 19.94 2.04 2.83 2.8066 24.41 2.62 7.87 7.6872 27.3 6.66 6.66 7.8178 14.75 3.51 2.30 1.5884 14.56 9.92 5.80 3.5490 24.00 9.45 8.99 5.56

Error Medio 27.25 13.20 8.96 7.70

Tabla 3.4: Error para cada instante de tiempo con cada uno de los modelosy con el modelo global

Con el error ECM (Figura 3.4) se ha querido observar si a medida quenos alejamos en el horizonte de prediccion el resultado empeora. Pero no se

Page 51: Aplicaciones en meterereolog a de modelos funcionales de ...

3.3. AJUSTE DE MODELOS PCP 43

puede concluir algo ası porque, en este ejemplo en concreto segun avanzamosen los instantes de tiempo parece que los errores disminuyen.

En meteorologıa para la variable temperatura se considera que cuando secometen 2 grados de error, el error no es muy significativo. Por lo tanto, en laFigura 3.7 se han representado las 7 trayectorias de datos observados juntocon dos bandas de ±2 grados, ademas de la prediccion del modelo PCP(3).Se observa que las curvas de prediccion se mantienen dentro o bastante cercade la banda de los 2 grados. En general, se puede decir que los resultados sonbastante buenos, teniendo en cuenta que se realiza la prediccion solamentecon la informacion que obtenemos de la variable temperatura del modeloglobal y que el modelo se ajusta con menos de un ano de datos.

Prediccion de temperatura con temperatura

observada

En este apartado se va ha ajustar un modelo PCP que predice la tem-peratura con una cadencia de 6h con un horizonte de prediccion de 4 dıas(intervalo futuro), a partir de los datos observados de temperatura de losultimos 4 dıas tambien cada 6h (intervalo pasado). Todo este proceso seira comparando con los resultados obtenidos en el ejercicio central de estetrabajo.

El proceso estocastico X2(t) : t ∈ [00, 90] corresponde con el intervalopasado de las observaciones de temperatura y Y2(s) : s ∈ [96, 186] con elintervalo futuro.

En este caso, se han utilizado los datos de los 365 dıas de temperaturaobservada disponibles. Como el proceso X2(t) no tiene en cuenta las trayec-torias que corresponden a los 4 ultimos dıas del ano y el proceso Y2(s) las quecorresponden a los 4 primeros dıas, cada uno dispone de 361 trayectorias. Aligual que en el ejercicio anterior las ultimas 7 trayectorias se han utilizadopara realizar la validacion.

A partir de los datos observados del pasado y del futuro se han calcu-

Page 52: Aplicaciones en meterereolog a de modelos funcionales de ...

44 CAPITULO 3. APLICACION PRACTICA

Figura 3.7: Resultado de prediccion de las trayectorias 351,..,357 del modeloPCP(3) junto con las trayectorias observadas

Page 53: Aplicaciones en meterereolog a de modelos funcionales de ...

3.3. AJUSTE DE MODELOS PCP 45

X2 Y2CPF Valores Var.Exp. Var.Acum. Valores Var.Exp. Var.Acum.

Propios ( %) ( %) Propios ( %) ( %)1 599.17 84 84 590.3 84 842 40.54 6 90 39.77 6 903 21.27 3 93 21.21 3 934 15.02 2 95 14.99 2 955 10.17 1 96 10.14 1 966 8.45 1 97 8.42 1 977 5.61 1 98 5.65 1 988 4.38 1 99 4.34 1 999 1.95 0 99 1.96 0 9910 1.79 0 99 1.79 0 99TOTAL 713.55 703.76

Tabla 3.5: Valores propios y porcentajes de varianza explicada y acumuladade las primeras 10 componentes principales de los procesos X2(t) e Y2(t).

lado las trayectorias funcionales con la tecnica de interpolacion cubica na-tural. Los nodos utilizados para las trayectorias del intervalo pasado son00, 06, 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 72, 78, 84, 90 y las del intervalo fu-turo 96, 102, 108, 114, 120, 126, 132, 138, 144, 150, 156, 162, 168, 174, 180, 186.

En la Figura 3.8 se pueden observar las primeras 6 trayectorias. Con lastrayectorias de la izquierda se predicen las trayectorias de la derecha.

Una vez calculado el modelo PCP, tambien se presenta la Tabla 3.5 conlos valores principales, la varianza explicada y acumulada correspondiente alos componentes principales resultantes. En este caso los valores de los pro-cesos X2(t) y Y2(t) son practicamente iguales. Y a su vez muy parecidos a losdel proceso X(t). Esto es debido a que las trayectorias que toman parte en lostres procesos son las mismas a excepcion de las 4 primeras y la ultimas. Entodos los procesos la primera componente principal es la que contiene mayorinformacion, ya que, explican el 84 % del total de los procesos. Tomando lastres primeras componentes principales alcanzamos un porcentaje de varianzaexplicada de 93 %.

Page 54: Aplicaciones en meterereolog a de modelos funcionales de ...

46 CAPITULO 3. APLICACION PRACTICA

Page 55: Aplicaciones en meterereolog a de modelos funcionales de ...

3.3. AJUSTE DE MODELOS PCP 47

Figura 3.8: Se muestran las trayectorias funcionales ajustadas con interpo-lacion spline cubica natural. A la izquierda con datos observados se utilizanpara realizar la prediccion de las de la derecha tambien de datos observados.

Page 56: Aplicaciones en meterereolog a de modelos funcionales de ...

48 CAPITULO 3. APLICACION PRACTICA

ξ1 ξ2 ξ3 ξ4 ξ5 ξ6 ξ7 ξ8η1 0.73 0.03 0.03 0.00 0.01 0.00 0.01 0.00η2 0.03 0.03 0.00 0.01 0.01 0.00 0.01 0.00η3 0.02 0.01 0.00 0.01 0.01 0.00 0.00 0.00η4 0.00 0.00 0.00 0.04 0.00 0.01 0.00 0.00η5 0.01 0.01 0.01 0.01 0.00 0.01 0.00 0.00η6 0.00 0.00 0.01 0.01 0.00 0.01 0.00 0.00η7 0.01 0.00 0.00 0.01 0.00 0.00 0.00 0.00η8 0.00 0.00 0.01 0.00 0.01 0.00 0.01 0.00

Tabla 3.6: Coeficiente de correlacion al cuadrado entre las componentes prin-cipales de los proceses X2(t) y Y2(t).

Las correlaciones al cuadrado entre las componentes principales de uno yotro proceso se muestran en la Tabla 3.6. A diferencia del ejemplo anterior, eneste caso consideramos que solo la primera componente principal del procesoen el intervalo pasado esta correlada con la primera componente del procesoen el intervalo futuro, con unas correlaciones de 0.73. Las correlacion entrelas componentes principales en el segundo y el tercer lugar son muy bajas.

Por lo tanto solo se va a calcular el modelo PCP2(q = 1;P1 = 1).

Para ello se han aproximado β11;2 mediante regresion lineal este resultado,

β11;2 = 0,86.

En la Figura 3.9 se muestra el resultado de la estimacion del modeloPCP2(1) de las 7 ultimas trayectorias del ano 2010. Para poder realizar unacomparacion con el modelo PCP (3) del ejemplo anterior se van a analizarlas Tablas 3.7 y 3.8 que contienen los errores respecto a cada trayectoria y alos instantes de tiempo.

Si comparamos el modelo PCP2(1) con el modelo PCP (3), que recorda-mos tenia en cuenta las predicciones del modelo global GFS, no parece quese pueda deducir nada ni de los errores de las trayectorias ni de los erroresen los instantes de tiempo. Pero si del error medio, el error medio del modeloPCP (3) es de 7.7 y el del modelo PCP2(1) es de 16.2, por lo tanto, podemosconcluir que el modelo PCP (3) es mejor.

Page 57: Aplicaciones en meterereolog a de modelos funcionales de ...

3.3. AJUSTE DE MODELOS PCP 49

Figura 3.9: Resultado de prediccion de las ultimas 7 trayectorias con el mo-delo PCP2(1) y la trayectoria observada correspondiente

Page 58: Aplicaciones en meterereolog a de modelos funcionales de ...

50 CAPITULO 3. APLICACION PRACTICA

w ECMPCP2(1)(w)1 6.792 11.113 16.764 11.195 12.226 20.887 34.45

Error Medio 16.20

Tabla 3.7: Error de prediccion para cada trayectoria del modelo PCP2(1)

ti ECMPCP2(1)(ti)96 19.40102 23.97108 21.22114 22.29120 30.36126 25.64132 9.66138 11.71144 18.51150 15.55156 4.43162 7.87168 12.68174 9.05180 12.34186 14.5

Error Medio 16.20

Tabla 3.8: Error para cada instante de tiempo con el modelo PCP2(1)

Page 59: Aplicaciones en meterereolog a de modelos funcionales de ...

3.4. CONCLUSIONES 51

En este caso, en la Figura 3.10 tambien se ha utilizado la banda de dosgrados para que el grado de error se pueda observar facil visualmente.

3.4. Conclusiones

El objetivo principal de este trabajo es dar el primer paso en la aplicacionde modelos en componentes principales funcionales en el campo de la meteo-rologıa. Por ello, se ha seleccionado la variable temperatura y se ha realizadoun ejemplo practico. El ejercicio ha consistido en predecir la temperaturaen la localidad de Abetxuko con un horizonte de cuatro dıas, a partir de losdatos 6 horarios que nos proporciona el modelo global GFS para esos mismosdıas. El resultado de este estudio han sido los modelos PCP(1), PCP(2) yPCP(3) que se han construido de acuerdo a la teorıa expuesta en los pri-meros capıtulos de este trabajo. El mejor modelo ha sido el PCP(3) con unerror medio de 7.7 y las peores predicciones realizado con el modelo globalGFS con un error medio de 27.3. Para poder comparar el modelo PCP(3)con mas modelos se ha realizado un segundo ejemplo que consiste en predecirla variable temperatura con un horizonte de cuatro dıas, a partir de de losdatos 6 horarios registrados los ultimos cuatro dıas. En este caso tambien sehan aplicado los modelos PCP funcionales. El modelo resultante ha sido elmodelo PCP2(1) con un error medio de 16.2. Por lo tanto, se concluye querealizar las predicciones con la filosofıa de downscaling y la tecnica MOS, esdecir, utilizando como predictor predicciones del modelo GFS, es mejor queutilizar las ultimas observaciones registradas.

En general, se puede decir que los resultados son bastante buenos, tenien-do en cuenta que se realiza la prediccion solamente con la informacion queobtenemos de la variable temperatura del modelo global y se utiliza menosde un ano de datos para entrenar el modelo. Aunque, no son lo suficiente-mente buenos como para utilizarlos en un centro meteorologico operacional.Por ello, para mejorar los resultados se recomienda por un lado, aumentarel numero de casos de estudio, ası como estudiar la posibilidad de calcu-lar diferentes predicciones para la temporada calida y frıa. Por otro, incluirmultiples predictores, por ejemplo, ademas de la variable temperatura la va-riable viento. Tambien se aconseja aplicar una rotacion a los componentesprincipales funcionales obtenidos.

Page 60: Aplicaciones en meterereolog a de modelos funcionales de ...

52 CAPITULO 3. APLICACION PRACTICA

Figura 3.10: Resultado de prediccion de las 7 ultimas trayectorias del modeloPCP2(1) y junto con las trayectorias observadas

Page 61: Aplicaciones en meterereolog a de modelos funcionales de ...

Capıtulo 4

Lıneas de trabajo abiertas

La finalidad de este trabajo es dar el primer paso hacia el desarrollo deuna Tesis Doctoral en esta lınea de investigacion. El objetivo de la tesissera mejorar las predicciones en meteorologıa mediante el uso de los modelosdel ADF. Algunas de las lıneas de investigacion que se pretenden abordarson las siguientes:

Realizar predicciones de temperatura con modelos predictivos funciona-les multiples, en los que se incluyan otras variables funcionales relacio-nadas con temperatura, como por ejemplo, viento o humedad relativa.

Predecir la precipitacion, a partir de las variables probabilidad de preci-pitacion y precipitacion acumulada en 24h por categorıas, con modeloslogit funcionales.

Asi como analizar el comportamiento de los modelos predictivos fun-cionales en otras variables como viento o cota de nieve.

53

Page 62: Aplicaciones en meterereolog a de modelos funcionales de ...
Page 63: Aplicaciones en meterereolog a de modelos funcionales de ...

Anexo: Aspectoscomputacionales con R

El software utilizado para desarrollar los ejercicios ası como la mayorıade las graficas que se presentan ha sido con el software libre R, con la version2.11.1 de este programa. La razon por la que nos hemos decantado por utili-zar R es porque es comun tanto del campo de la meteorologıa como en de laestadıstica y tiene implementadas librerıas de ambos sectores. En la imple-mentacion de este trabajo no se han utilizado librerıas especıficas del ADFpero no se descarta en proximos trabajos. Utilizar, por ejemplo, la librerıa’fda’, que se utiliza para resolver problemas de analisis de datos funcionalescomo los que se presentan en este trabajo. Esta librerıa se desarrollo comoapoyo al libro de Ramsay y Silverman (2005) y incluye tanto funciones comoconjuntos de datos de ejemplo. El motivo por el cual el ejercicio no se haelaborado con este paquete es que no dispone de funciones para reconstruirlas trayectorias funcionales con el metodo de interpolacion ni tampoco paraimplementar los modelos PCP. En el libro Hooker (2009) tambien disponede ejemplos desarrollados en R.

El objetivo de este apartado es realizar un resumen de las funciones de Rmas relevantes utilizadas en la parte practica. Algunas de ellas son funcionesestandar del programa R y otras han sido programadas dentro del grupo deinvestigacion FQM-307.

En el anexo se muestra el codigo R utilizado para obtener los resultadosdel ejercicio practico. A continuacion se describen las funciones utilizadas enel anexo.

prcomp: esta funcion se utiliza para llevar a cabo el analisis en compo-

55

Page 64: Aplicaciones en meterereolog a de modelos funcionales de ...

56

nentes principales. La estructura que presenta es:

prcomp(x, data = NULL, subset, na.action, ...)

El unico argumento imprescindible en esta funcion es el primero, donde seincluyen los datos para realizar el calculo de los componentes principales. Enesta funcion existen mas parametros pero para la realizacion de este trabajono ha sido necesaria su utilizacion. El resultado que se obtiene al ejecutaresta funcion es un objeto que contiene varios elementos de los cuales se hanutilizado, $sdev, las desviaciones estandar de las componentes principales,$rotation, que son las funciones propias por columnas, $center, la media apli-cada a los datos para centrarlos y por ultimo $x, los componentes principales.

lm: esta funcion, que es generica del paquete estadıstico R se utiliza pararealizar el ajuste del modelo de regresion lineal.

lm(formula, data, subset, weights, na.action, ...)

Al igual que en la funcion anterior el unico parametro utilizado al aplicaresta funcion ha sido el primero. En este caso hay que introducir una formulaque contiene los datos de la variables predictora y la variable o variables res-puesta del modelo de regresion lineal. La solucion es un objeto que contienediferentes parametros de los cuales se ha utilizado el parametro $coefficientsque se trata de un vector que contiene los coeficientes de la recta de regresionestimados.

calcoefR(nodos, valores): esta funcion calcula los coeficientes basicosde las trayectorias funcionales siguiendo la tecnica de interpolacion B-splinecubica natural. Necesita un vector de nodos en los que se interpola la fun-cion y una matriz que tendra por filas las observaciones de cada curva en losnodos. El resultado es una matriz que tiene por filas los coefientes basicosde cada curva. Esta funcion hace llamadas internas a otras definidas paracalcular la evaluacion de las funciones B-spline en distintos instantes.

raizPSI(nodos): esta funcion calcula la raız de la matriz de los produc-tos escalares de las funciones B-spline cubicas definidas por un conjunto denodos. Esta funcion necestia como parametro un vector que contenga los no-dos que defienen las funciones B-spline cubicas. Devuelve la raız de la matriz

Page 65: Aplicaciones en meterereolog a de modelos funcionales de ...

57

cuadrada del producto escalar de dimension igual a la longitud de los nodosmas dos. Esta funcion tambien realiza llamadas internas a otras funcionesque han sido programadas por el grupo de investigacion mencionado. Enconcreto para la programacion de esta funcion se ha utilizado la formula decuadratura de Gauss con cuatro nodos propuesta por Ocana (1996).

En este capıtulo se muestra el script de R resumido utilizado para realizarel ejercicio practico.

En el primer paso se leen los datos tanto de las observaciones locales dela estacion de Abetxuko como los datos de prediccion del modelo global GFS.

datosL< −read.table()datosG< −read.table()

Para la expresion en bases de funciones se calculan los coeficentes basicosde las trayectorias muestrales de ambos conjuntos de datos

coefL< −calcoefR(c(0:15,datosL)coefL< −calcoefR(c(0:15),datosG)

Se separa el periodo de entrenamiento del periodo de testeo, dejando losultimos 7 dıas para ver los resultados obtenidos.

coefLE< −coefL[1:350,]coefLT< −coefL[351:357,]coefGE< −coefG[1:350,]coefGT< −coefG[351:357,]

Se realiza el ACP multivariante de la matriz AΨ1/2, para la cual se calculala matriz raizPSIL, para los datos del proceso local.

raizPSIL< −raizPSI(c(0:15))MatrizACPG< −coefLE*raizPSILACPL< −prcomp(MatrizACP,scores=TRUE)

Se actua de la misma manera para obtener el ACP multivariante para losdatos de prediccion del proceso global.

Page 66: Aplicaciones en meterereolog a de modelos funcionales de ...

58

raizPSIG< −raizPSI(c(0:15))MatrizACPG< −coefGE*raizPSIGACPG< −prcomp(MatrizACPG,scores=TRUE)

Se calcula el coeficiente de determinacion entre los componentes principa-les de las trayectorias del proceso local y de las trayectorias del proceso global.

round(cor(PCAL$x, PCAG$x)2,digits=2)

Por ultimo se calcula la prediccion de las trayectorias funcionales delperiodo de entrenamiento, para ello se han aproximado los primeros trescomponentes principales de las trayectorias del proceso local mediante losprimeros tres componentes principales de las trayectorias del proceso global.

Modelo1< −lm(PCAL $x[,1] PCAG $x[,1])

Modelo2< −lm(PCAL $x[,2] PCAG $x[,2])

Modelo3< −lm(PCAL $x[,3] PCAG $x[,3])

De cada trayectoria del proceso global del periodo de testeo se obtienenlos tres primeros componentes principales funcionales.

CPG< −(coefGT[i,]*raizPSIG-PCAG$center)*PCAG$rotation[,1]CPG2< −(coefGT[i,]*raizPSIG-PCAG$center)*PCAG$rotation[,2]CPG3< −(coefGT[i,]*raizPSIG-PCAG$center)*PCAClobal$rotation[,3]

Se estiman los tres primeros componentes principales y las tres primerasfunciones propias funcionales de las trayectorias del proceso local.

CPL< −Modelo$coefficients[1]+Modelo$coefficients[2]*CPGCPL2< −Modelo2 $coefficients[1]+Modelo2$coefficients[2]*CPG2

CPL3< −Modelo3 $coefficients[1]+Modelo3 $coefficients[2]*CPG3

F1L< −basesL2*raizNegPSIL*PCAL $rotation[,1]

F2L< −basesL2*raizNegPSIL*PCAL $rotation[,2]

F3L< −basesL2*raizNegPSIL*PCAL $rotation[,3]

Page 67: Aplicaciones en meterereolog a de modelos funcionales de ...

59

Y por ultimo se obtiene la prediccion para cada trayectoria.

Y< −CPL[1]*(F1L)+CPL2[1]*(F2L)+CPL3[1]*(F3L)+basesL2*raizNegPSIL*PCAL$center

Page 68: Aplicaciones en meterereolog a de modelos funcionales de ...
Page 69: Aplicaciones en meterereolog a de modelos funcionales de ...

Bibliografıa

Aguilera A.M., Ocana F.A. y Valderrama M.J. (1997) An aproximatedprincipal components prediction model for continuous-time stochastic pro-cesses. Appl. Stoch. Models Data Anal., 13(1), 61-72.

Aguilera A.M., Ocana F.A. y Valderrama (1999a) Forecasting with une-qually spaced data by a functional Principal Component approach. Test,8(1), 233-253.

Aguilera A.M., Ocana F.A. y Valderrama (1999b) Forecasting time seriesby functional PCA. Discussion of several weighted approaches.ComputationalStatistics, 14(3), 443-467.

Aguilera A.M., Ocana F.A. y Valderrama (1999c) Stochastic modellingfor evolution of stock prices by means of functional PCA. Applied StochasticModels in Business and Industry, 15(4), 227-234.

Aguilera A. M., Ocana F. A. y Escabias M. (2007) Computacional con-siderations in functional principal components analysis. Computacional Sta-tistics, 22, 449-446.

Aguilera A.M. y Aguilera-Morillo, M.C. (2013a) Comparative study ofdifferent B-spline approaches for functional data. Mathematical and Compu-ter Modelling, in press.

Aguilera A.M y Aguilera-Morillo, M.C (2013b) Penalized PCA approa-ches for B-spline expansions of smooth functional data. Applied Mathematicsand Computation, 219 (14), 705-719.

61

Page 70: Aplicaciones en meterereolog a de modelos funcionales de ...

62

Benestad R.E. (2001). A comparison between two empirical downscalingstrategies. Int J Climatol, 21,1645-1668.

Carter G.M. (1986) Moving towards a more responsive statistical gui-dance system. Preprint Eleventh Conference on Weather Forecasting andAnalisis, Kansas City, Amer. Meteor. Soc. 39-45.

Christensen J.H., Machenhauer B., Jones R.G., Schar C., Ruti P.M., Cas-tro M. y Visconti G. (1997). Validation of present-day regional climate simu-lations over Europe, LAM simulations with observed boundary conditions.Climate Dyn, 13, 489-506.

De Boor C. (1977) Package for calculating with B-splines. Journal of Nu-merical Analysis, 14, 441-472.

Deville J.C. (1974) Methodes statistiques et numeriques de lanalyse har-monique. Annales de lINSEE, 15, 3-101.

Escabias M., Aguilera A. M. y Valderrama M. J. (2005) Modeling envi-ronmental data by functional principal component logistic regression. Envi-ronmetrics, 16 (1), 95-107.

Ferraty F. y Vieu P. (2006) Nonparametric functional data analysis.Springer-Verlag.

Fukunaga k. (1990) Introduction to Statistical Pattern Recognition. Aca-demia Press, San Diego.

Giorgi F. (1990) Simulation of regional climate using a limited area modelnested in a general circulation model. J Climate, 3, 941-963.

Giorgi F., Brodeur C.S. y Bates G.T. (1994) Regional climate change sce-narios over the United States produced with a nested regional climate model.J Climate, 7, 375-399.

Glahn H.R. y Lowry D.A. (1972) The use of model output statistics(MOS) in objective weather forecasting. J Appl Meteor, 11, 1203-1211.

Page 71: Aplicaciones en meterereolog a de modelos funcionales de ...

63

Gonzalez-Rouco J.F., Heyen H., Zorita E. y Valero F. (2000) Agreementbetween observed rainfall trends and climate change simulations in the South-west of Europe. J Climate, 13, 3057-3065.

Harvey L.D.D. y Wigley T.M.L. (2003) Characterizing and comparingcontrol-run variability of eight coupled AOGCMs and of observations. Part1: Temperature. Climate Dyn, 21, 619-646.

Hooker G. y Graves S. (2009) Functional Data Analysis with R andMATLAB. Springer-Verlag.

Jackson J.E. (1991) An User´s Guide to Principal Components, WileyNew York.

Klein W.H. y Glahn H.R. (1974) Forecasting local weather by means ofmodel output statistics. Bull Amer Meteor Soc, 55, 1217-1227.

Murphy J. (1999) An evaluation of statistical and dynamical techniquesfor downscaling local climate. J Climate, 12, 2256-2284.

Nieto S, Frıas M.D. y Rodrıguez-Puebala C. (2004) Assessing two differentclimatic models and the NCEP-NCAR reanalysis data for the description ofwinter precipitation in the Iberian Peninsula. Int J Climatol, 24, 361-376.

Ocana F.A. (1996) Alternativas Geometricas en el ACP de una VariableAleatoria Hilbertiana. Tesis Doctoral, Universidad de Granada.

Osborn T.J., Briffa K.R., Tett S.F.B., Jones P.D. y Trigo R.M.(1999)Evaluation of the North Atlantic Oscillation as simulated by a climate mo-del. Climate Dyn, 15, 685-702.

Ramsay J.O. y Silverman B.W. (1997, 2005) Functional data analysis(First and Second editions). Springer-Verlag.

Ramsay J.O. y Silverman B.W. (2002). Applied Functional Data Analy-sis: Method and Case studies. Springer-Verlag.

Sela J. (1980). Spectral modeling at the National Meteorological Center,

Page 72: Aplicaciones en meterereolog a de modelos funcionales de ...

64

Mon. Wea. Rev., 108, 1279-1292.

Sela J.G. (1982). The NMC Spectral Model, NOAA Technical ReportNWS-30, 36.

Valderrama M.J. Aguilera, A.M. y Ocana F.A. (2000). Prediccion Dinami-ca Mediante Analisis de Datos Funcionales. Hesperides-La Muralla.

Valderrama M.J., Ocana, F.A. y Aguilera A.M. (2010) Forecasting Po-llen Concentration by a Two-Step Functional Model. Biometrics, 66, 578-585.

Von Storch H., Zorita E. y Cubasch U. (1993) Downscaling of global cli-mate change estimates to regional scales: An application to Iberian rainfallin wintertime. J Climate, 6, 1161-1171.

Wigley T.M.L., Jones P.D., Briffa K.R. y Smith G. (1990) Obtainingsub-grid scale information from coarse resolution general circulation modeloutput. J Geophys Res, 95, 1943-1953.

Wilby R.L. y Wigley T.M.L. (1997) Downscaling general circulation mo-del output: a review of methods and limitations. Progress in Physical Geo-graphy, 21(4), 530-548.

Wilks D.S. (1995) Statistical Methods in the Atmospheric Sciences. Aca-demic Press, San Diego.

Zorita E., Hughes J.P., Lettenmaier D.P. y Von Storch H. (1995) Sto-chastic characterization of regional circulation patterns for climate modeldiagnosis and estimation of local precipitation. J Climate, 8, 1023-1042.

Zorita E. y Von Storch H. (1997) A survey of statistical downscaling tech-niques. GKSS 97/E/20.