Análisis Estadístico de Datos...
Transcript of Análisis Estadístico de Datos...
Análisis Estadístico de
Datos Climáticos
Análisis Estadístico de
Datos Climáticos
2015
Análisis exploratorio de datos univariados
DATOS UNIVARIADOSRobustez y ResistenciaMedidas numéricas de localización, dispersión, asimetría ….Técnicas gráficasDistribucionesTransformaciones
DATOS APAREADOS (DESFASADOS)
DATOS MULTI-DIMENSIONALESMatriz de correlaciónMapas de CorrelaciónMapas de Teleconectividad….
✔ una estación con medidas de varias variables diferentes (temperatura, precipitación, presión, humedad, etc...)
✔ una variable medida en varias estaciones
✔ salida de un modelo con la variable en una grilla (lat. x lon. x altura).
La cantidad de variables físicas de un modelo atmosférico es como “mínimo” 6 y puede ser bastante mayor
Rápidamente crecemos en el número de variables simultáneas:10 variables físicas * 100 lat * 100 long * 10 alt = 10^6 variables !!!
¿Por qué DATOS MULTIVARIADOS?
0
5
10
15
-4
-2
0
2
4-10
-5
0
5
10
XY
Z
-4
-20
2
4
-4
-2
0
2
4-10
-5
0
5
10
waterfall
ribbon
-1
-0.5
0
0.5
1
-1
-0.5
0
0.5
1
-1
0
1
scatter3
Matriz de Correlación
Matriz de datos diarios enLas Brujas (INIA)
5 variables
Quiero hallar las correlaciones de cada variable con cada otra:
4+3+2+1 = 10
Matriz de Correlación = R | Propiedades
R=corrcoef(matriz_datos) …. Pearson
Diagonal de 1s
Simétrica respecto a la diagonal
5*(5-1)/2 valores
Corr(TMED,TMAX)
Matriz de Diagramas de Dispersión
rij=r ji
Volviendo a Matriz de Correlación, en general
N*(N-1)/2 elementos no idénticosSi N=10^6 => 10^12 !!!!
Y mayor aún si queremos considerar correlaciones desfasadas
Mapas de Correlación(one-point correlation maps)
Las matrices de correlación son útiles para mostrar la relación entre diferentes variables en una estación (número relativamente manejable).
Cuando se quiere explorar la variabilidad espacio-temporal (cómo varían en el tiempo una variable –eventualmente más de una- dentro de una región –por ejemplo el globo-) se requieren otras herramientas porque el número de variables/puntos explota.
En este caso es útil presentar las correlaciones gráficamente/espacialmente.
MAPA DE CORRELACIÓNNo se usa toda la información de la matriz,
solamente la de una fila que contiene la correlación de todos los puntos contra uno
en particular
200 puntos (correlaciones)Uno podría hacer 199 de estos mapas
Mapa de Correlación
¿Da igual la
elección del
punto?
Correlación de TS (56W,35S) con TS global en c/punto.Período: meses Ene1949-Ago2007
Ejemplo
Ejemplo
Correlación de Precip (56W,35S) con Precip global en c/punto.Período: meses Ene1979-Dic2006
Correlación de la TSM en la zona ecuatorial con el resto de los océanos
Mapas de CorrelaciónPosibles generalizaciones
Correlacionar con una variable distinta (que no pertenece al mapa).
Incluir desfasajes, de la misma variable o de otras.
En definitiva, cualquier mapa que muestre la variación espacial de la correlación de un campo con otra variable (que puede o no pertenecer al
campo, puede o no ser simultánea) es un mapa de correlación.
Ejemplo mapa de Correlación de Spearman
Mapas de Teleconección
Vimos que los mapas de correlación (que usan una fila de la matriz de correlación)
pueden mostrar patrones de teleconección.
En particular es de interés la aparición de correlaciones negativas “grandes y lejanas”.
Entonces definimos Mapa de Teleconección tal que:
A cada punto i se le adjudica un valor Ti que es el valor absoluto de la mínima correlación con dicho punto.
Mapas de Teleconección
Cita
Análisis multi-variado para intentar capturarpatrones de la variabilidad espacio-temporal
Análisis de Componentes Principales
Análisis de Máxima Covarianza
Análisis de Espectro Singular Multicanal
…………