Taller CORDOBA Presentacion

94
1 Taller sobre Estudios Hidrológicos en Areas Serranas de la Provincia de Córdoba Teoría de Valores Extremos Rafael Santiago Seoane Instituto Nacional del Agua FIUBA, CONICET Córdoba Octubre 2011

description

taller

Transcript of Taller CORDOBA Presentacion

Page 1: Taller CORDOBA Presentacion

1 Taller sobre Estudios Hidrológicos en Areas Serranas de la Provincia de

Córdoba

Teoría de Valores Extremos

Rafael Santiago SeoaneInstituto Nacional del Agua

FIUBA, CONICETCórdoba Octubre 2011

Page 2: Taller CORDOBA Presentacion

• Conceptos clásicosConceptos clásicos

• Nuevos temas de estudioNuevos temas de estudio

Page 3: Taller CORDOBA Presentacion

Aplicaciones e importancia de la teoría

Estimación de caudales máximos y mínimos y su frecuencia de ocurrencia.

Definir la relación caudal-periodo de retorno.Estimación de una función de densidad de

probabilidades.Numerosas obras hidráulicas se diseñan con

esta metodología.Algunos países trataron de definir este problema

con una legislación,

Page 4: Taller CORDOBA Presentacion

Nuevos temas

Procesos No estacionarios. Los procesos hidrológicos pueden presentar características que cambian con el tiempo. En el contexto hidrológico se definen: a) ocurren en ciertas épocas del año y b) asociados con la presencia de tendencias relacionadas a cambios climáticos de largo plazo (long term period).

Algunos orígenes de la No estacionariedad. Se asocian con cambios en el uso del suelo en la cuenca, presencia de nuevas obras (por ejemplo: embalses) y modificaciones en las propiedades de la precipitación.

Page 5: Taller CORDOBA Presentacion

Modelos y temas

Principales modelos de valores extremos: Gumbel, Log-Normal II y III, Pearson III, Log-Pearson III.

Problemas clásicos: selección del modelo y estimación de sus parámetros.

Principales hipótesis de la teoría clásica.Modelos en un contexto no estacionario.Detección de tendencias en máximos y mínimos. Modelos de función de densidad derivada de

caudales extremos.

Page 6: Taller CORDOBA Presentacion

Evolución de los temas

Selección de modelos.

Estimación de parámetros y verificación del modelo.

Máxima verosimilitudes irregulares.

No estacionariedad.Detección de

tendencias.Modelo Generalizado

de Valores Extremos. Máxima verosimilitud.Ecuaciones con la

variación temporal de los parámetros.

Page 7: Taller CORDOBA Presentacion

Temas a considerar

Existen numerosos métodos de estimación de los parámetros del modelo.

Orígenes de la incertidumbre de las estimaciones con los modelos de valores extremos.

Presentación de algunos criterios de selección del modelo.

Page 8: Taller CORDOBA Presentacion

Proceso de selección y estimación de un modelo

Seleccionar una función de densidad de probabilidades para representar una serie de caudales máximos o mínimos(*).

Estimar los parámetros de la función de densidad de probabilidades

Estimar los caudales máximos o mínimos asociados con distintos períodos de retorno.

(*) importancia de la autocorrelación entre los datos.

Page 9: Taller CORDOBA Presentacion

Métodos de estimación

Los parámetros desconocidos del modelo son inferidos a partir de datos históricos .

Existen numerosas técnicas para la estimación de los parámetros pero todas tienen ventajas y desventajas.

Los métodos de estimación no son independientes del problema de la selección del modelo.

La estimación de parámetros en modelos asimétricos es más complicada debido a la presencia de verosimilitudes irregulares.

Page 10: Taller CORDOBA Presentacion

Histograma Río Paraná

Page 11: Taller CORDOBA Presentacion

Función GEV en Posadas

Page 12: Taller CORDOBA Presentacion

Fuentes de incertidumbreIncertidumbre en los parámetros:

corresponde a la asociada con la estimación de los parámetros del proceso utilizando una cantidad limitada de datos.

Incertidumbre en el modelo: corresponde a la asociada con la idea de que el modelo probabilístico asumido del proceso estocástico sea el correcto.

Page 13: Taller CORDOBA Presentacion

Cuantificación de la incertidumbreLos análisis estadísticos definen estimaciones a

partir de datos históricos. Diferentes muestras igualmente representativas pueden definir otras y distintas estimaciones.

En el análisis de valores extremos resulta muy importante la cuantificación de la incertidumbre debido a que cambios pequeños en los parámetros pueden influir en las extrapolaciones de la variable.

Page 14: Taller CORDOBA Presentacion

Algunos conceptos sobre el modelo

Paradigma de valores extremos que implica: la independencia y la estacionaridad.

Existe una hipótesis implícita que consiste en suponer que el mecanismo estocástico subyacente del proceso es suave para permitir la extrapolación de los valores de la muestra.

Page 15: Taller CORDOBA Presentacion

Procesos aleatoriosUn proceso aleatorio es una secuencia de

variables aleatorias X1, X2, X3--- Xn. El ejemplo más simple consiste en las variables independientes e idénticamente distribuidas.

Estacionario: un proceso aleatorio es estacionario si dado un conjunto de variables (i1,i2,i3…in) si para cualquier entero m son idénticas las distribuciones conjuntas de (Xi,1,…, Xi,k) y (Xi,1+m,…, Xi,k+m).

Page 16: Taller CORDOBA Presentacion

Modelos matemáticos

Son expresiones matemáticas que representan las principales características de los procesos.

Algunos ejemplo son los modelos (PIC):

Probabilísticos: Gumbel y GEV. Probabilísticos-Dererminísticos: FDD.

Page 17: Taller CORDOBA Presentacion

Algunas hipótesis básicas

• Independencia temporal entre las observaciones.

• Las observaciones tienen las mismas propiedades estadísticas (Existe una única función de densidad de probabilidades).

Page 18: Taller CORDOBA Presentacion

Presencia de autocorrelación (Caudales mínimos)

Page 19: Taller CORDOBA Presentacion

Funciones de densidad de probabilidades en Hidrología

GumbelGeneralizada de Valores ExtremosPearson IIILog-Pearson IIILog-Normal II y III

Page 20: Taller CORDOBA Presentacion

Modelos de valores extremosModelo Función de densidad o

distribución

Log-Normal II

Pearson III

Log-Pearson III

Gumbel

GEV

2

)ln(

2

1exp

2

1)(

x

x

x

x

xxf

)(

)(exp)()(

1

xxxf

x

)(

))(ln(exp))(ln()( 1

xx

xxf x

xx

xfx

expexp1

)(

1

)(1exp)(

x

xFx

Page 21: Taller CORDOBA Presentacion

Métodos de estimación de parámetros

MomentosMáxima VerosimilitudMáxima Verosimilitud Corregido

Problema clave: la cantidad de combinaciones posibles entre distintos modelos y métodos de estimación.

Page 22: Taller CORDOBA Presentacion

Máxima verosimilitudEs un método flexible y general de estimación de los parámetros desconocidos θ0 de un modelo dentro de una familia F de

modelos.  Siendo x1,x2,x3,,,,,xn las ocurrencias

independientes de una variable aleatoria con una unción de densidad de probabilidades f(x; θ0).

Page 23: Taller CORDOBA Presentacion

Función de verosimilitud

),()(1

n

iixfL

),(log)(log)(1

n

iixfLl

Page 24: Taller CORDOBA Presentacion

Modelo de valores extremos /EV1-Gumbel)

Valores extremos: máximos o mínimos.

Caudal máximo o caudal mínimo.

Precipitaciones máximas.

Siendo el número de valores observado es grande la distribución converge a alguna de las tres formas denominadas I, II y III.

24

Page 25: Taller CORDOBA Presentacion

Modelo de Gumbel

Moda  α, 

Media α+γβ (where γ=0.5772156649... is Euler's constant),

and

Varianza  ⅙β2π2

Page 26: Taller CORDOBA Presentacion

Modelo Gumbel y Máxima Verosimilitud

)(exp)(exp),,( xxxf

N

ixxNNLogL

1)(explog

Page 27: Taller CORDOBA Presentacion

Modelo Gumbel

27

Distribution of annual maximum streamflow follows an EV1 distribution

Page 28: Taller CORDOBA Presentacion

Ecuaciones de MV del Modelo Pearson III

Ecuaciones no lineales

n

i

n

iii

nxxnL1 1

ln)log()1()(1

)(loglog

n

ii

nx

L12

0)(1log

n

i

ix

nL12

0)(

1)1(

log

n

ii

nxnL

10ln)log(

)(

)'(log

Page 29: Taller CORDOBA Presentacion

Función de Verosimilitud

Modelo Pearson III

Río Blackstone

Page 30: Taller CORDOBA Presentacion
Page 31: Taller CORDOBA Presentacion

Diferencias según el modelo Río Blackstone (USA) (MV)

Modelo 100 1000 5000 10000

Gumbel 430 578 681 726

Log-N II 747 1297 1795 2041

Log-N III 577 941 1261 1432

P III 560 802 974 1050

LP III 877 2520 5311 7343

Nota: Caudales en m3/s, Período de retorno en años.

Page 32: Taller CORDOBA Presentacion

Criterios de selección entre modelos

El Criterio de Información Bayesiano (BIC) contribuye a resolver el problema de la selección entre varios modelos alternativos.

El Criterio de Información de Akaike (AIC) permite analizar la bondad del ajuste e incluye una penalización por el número de parámetros estimados para el modelo.

Page 33: Taller CORDOBA Presentacion

Criterios de selección entre modelos (AIC y BIC)

Akaike Information Criterio (AIC, 1974)

k: número de parámetros y L: verosimilitud.

Bayesian Information Criterio (BIC, 1978)

n: cantidad de datos.

)ln(22 LkAIC

)ln(2)ln( LnkBIC

Page 34: Taller CORDOBA Presentacion

Diferencias por método deestimación y un período de retorno10000 años

Modelo Log-Normal II (M o MV)

Log-Normal III (M)

Log-Normal III MV

Blackstone 72117 80978 50082

Feather 660182 413930 983531

Limay (PL) 10483 7762 15366

Manawatu 8094 7207 8237

Page 35: Taller CORDOBA Presentacion

Type of project Return period (years) Examples

Urban drainage (low risk, up to 1 km2)

5 to 10 Small city

Urban drainage (mediun risk, more than to

1 km2)

25 to 50 Medium city

Urban drainage (high risk, more than to

10 km2)

50 to 100 Large city(Buenos Aires,

Rosario)

Principal spillways (dams)

20 to 100 Corpus y Yacireta

Emergency spillways (dams)

100 to 10000 Corpus y Yacireta

Bridges 100 to 500 Tancredo NevesY Túnel subfluvial

Page 36: Taller CORDOBA Presentacion
Page 37: Taller CORDOBA Presentacion

Prueba no paramétricade Mann - Kendall

La prueba tiene como objetivo detectar una tendencia al incremento o al decrecimiento en los datos más que la ocurrencia de un evento aislado.

H0) los datos son una muestra de n variables aleatorias independientes e idénticamente distribuidas.

H1) la distribución de xj y xk no son idénticas para todos k, j < n con k j.

(xj y xk son variables aleatorias independientes e idénticamente distribuidas)

Page 38: Taller CORDOBA Presentacion

Los estadísticos que intervienen en el análisis son S y Z, que se asocian con el estimador de pendiente B en el signo:

1n

1k

n

1kjkj )xsgn(xS

0 < θ si 1-

0 θ si 0

0 θ si 1

= ) (θ sgn

0SsiVar(S)

1S

0Ssi0

0SsiVar(S)

1S

Zj<kMediana

k-jk

xj

x = B

Page 39: Taller CORDOBA Presentacion

Prueba de Verosimilitud

),(),,(,2 0,01

22,11

l

nkk

l

njj

m

nii xLxLxL

 : log-verosimilitud estimada con las observaciones de la

primer parte de la serie para el modelo seleccionado; : log-verosimilitud estimada con las observaciones de la segunda parte de la serie para el modelo seleccionado;

: log-verosimilitud estimada con las observaciones de la serie completa para el modelo seleccionado.

ixL ,11 ,

),,( 22 jxL

),( 0,0 kxL

donde:

Page 40: Taller CORDOBA Presentacion

La estimación del estadístico de la prueba implica ajustar una función de densidad de probabilidades a la serie completa de las observaciones y a las dos series parciales correspondientes a la primera y segunda parte de la serie temporal.

Ho: las observaciones pueden ser representadas por un único modelo.

H1: las observaciones no pueden ser representadas por un único modelo.

Page 41: Taller CORDOBA Presentacion

Prueba de VerosimilitudPARANA - CORRIENTES

Series de Caudales Máximos Anuales - Prueba de Verosimilitud

0

2

4

6

8

10

12

14

16

18

19

04

-19

66

vs

19

67

-20

02

19

04

-19

67

vs

19

68

-20

02

19

04

-19

68

vs

19

69

-20

02

19

04

-19

69

vs

19

70

-20

02

19

04

-19

70

vs

19

71

-20

02

19

04

-19

71

vs

19

72

-20

02

19

04

-19

72

vs

19

73

-20

02

19

04

-19

73

vs

19

74

-20

02

19

04

-19

74

vs

19

75

-20

02

19

04

-19

75

vs

19

76

-20

02

19

04

-19

76

vs

19

77

-20

02

19

04

-19

77

vs

19

78

-20

02

19

04

-19

78

vs

19

79

-20

02

19

04

-19

79

vs

19

80

-20

02

19

04

-19

80

vs

19

81

-20

02

19

04

-19

81

vs

19

82

-20

02

19

04

-19

82

vs

19

83

-20

02

Co

efi

cie

nte

Pru

eb

a d

e V

ero

sim

ilit

ud

GUMBEL GEV

Page 42: Taller CORDOBA Presentacion

Pruebas para detección del punto de cambio

CUSUM

Prueba de Pettitt

Page 43: Taller CORDOBA Presentacion

Análisis de tendencias

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0

04

-05

08

-09

12

-13

16

-17

20

-21

24

-25

28

-29

32

-33

36

-37

40

-41

44

-45

48

-49

52

-53

56

-57

60

-61

64

-65

68

-69

72

-73

76

-77

80

-81

84

-85

88

-89

92

-93

96

-97

00

-01

Pro

ba

bilid

ad

-130000

-110000

-90000

-70000

-50000

-30000

-10000

10000

30000

50000

70000

Sm

Probabilidad de Punto de Cambio - PETTITT Sm (Cusum)

Page 44: Taller CORDOBA Presentacion

Caudales máximos ( Corrientes) AJUSTE MÁXIMOS RIO PARANÁ - Estación Corrientes

GEV - MMV

0

10000

20000

30000

40000

50000

60000

70000

80000

1 10 100 1000

Tr (año)

Q (

m3 /s

)

Serie Completa1976-77 a 2002-031904-05 a 1975-76

Page 45: Taller CORDOBA Presentacion

   

Gumbel:

M0 = modelo estacionarioM1 =Tendencia lineal

M3 = Tendencia lineal + SOI

M2 = SOI influence

No estacionario

Log-likelihood Gumbel:

Estimación de parámetros

Page 46: Taller CORDOBA Presentacion

Inferencia para distintos períodos de retorno

Resultados para Modelos No Estacionarios

TR Stationary Non-Stat (M3) Dif (%)

10 38337 40929 6.3

50 47322 51144 7.5

100 51121 56123 8.9

200 54905 62743 12.5500 59899 75273 20.4

Corrientes Flow (m3/s)

Page 47: Taller CORDOBA Presentacion

Modelo GEV

),),(( tGEVtz

tt 10

2210ttt

)(10

tSOIt

Page 48: Taller CORDOBA Presentacion

Expresiones de Verosimilitud

1

10(11

10(1log)11(log),,(

ttzm

t

ttzl

1

)(10(1

1

)(10(1log)11(log),,(

tSOItzm

t

tSOItzl

Page 49: Taller CORDOBA Presentacion

Problemas asociados para considerarAlguna distribuciones utilizadas en Hidrología

presentan tres parámetros y el método de máxima verosimilitud podría producir problemas de estimación.

Las pruebas usadas (Chi-cuadrado y Kolmogorov-Smirnov) fueron diseñadas para discriminar modelos en la región de los medios.

Los valores estimados de los caudales asociados con un período de retorno dado difieren según el modelo y el método de estimación de parámetros.

Page 50: Taller CORDOBA Presentacion

Modelos de función de Modelos de función de densidad derivada de densidad derivada de

caudales extremoscaudales extremos

Page 51: Taller CORDOBA Presentacion

El procedimiento para la evaluación de una distribución de

frecuencias de caudales máximos para cuencas con datos

escasos tiene las siguientes etapas:

1.-Definir la función de densidad de probabilidades conjunta de intensidad y duración de la precipitación.

2.-Seleccionar el modelo de infiltración.

3.-Obtener la función de densidad de probabilidades conjunta del exceso de precipitación.

4.-Definir el proceso de escurrimiento directo.

5.-Definir la función de distribución acumulada del caudal directo máximo.

6.-Modelar el flujo base.

7.-Estimar los caudales máximos asociados a distintas probabilidades de excedencia.

Page 52: Taller CORDOBA Presentacion

Qmáx = g(ie,te)

Obtención de la distribución de

Qmáx

Modelo de precipitación

Parámetros climáticos

Modelo de respuesta P - Q

Parámetros de la cuenca

f(ie,te)

Esquema de la función de densidad derivada de caudales (Eagleson, 1972)

FQmáx(Qmáx)

Page 53: Taller CORDOBA Presentacion

R

eeeeTe,IemáxQmáx dtdi)t,i(f)Q(F

Nueva función de densidad de probabilidades derivada de

caudales máximos que incluye el HUI de Nash como

modelo de respuesta de la cuenca.

Para estimar la probabilidad de excedencia del caudal

máximo es necesario determinar la función de distribución

acumulada de Qmáx que está dada por:

Región del plano ie, te donde la convolución de fie,te con el modelo de respuesta de la

cuenca produce caudales máximos menores o iguales a Qmáx

Función de densidad de probabilidades conjunta de la intensidad y duración

efectivas de la precipitación

Page 54: Taller CORDOBA Presentacion

La función de densidad de probabilidades conjunta de la

intensidad y duración efectivas está dada en dos partes,

(Raines y Valdés, 1993):

)()exp(t,i ee 110 0Prob

558390441610441610

441610441610441610

390471

1776420

.e

.e

.*

.e

.e

.e

*eeTe,Ie

itS.exp

itS)()texp(.)t,i(f

2120

S. *

: inversa del valor medio de la duración [1/L],

: inversa del valor medio de la intensidad puntual [T/L],

K*

A..exp.expK .. 003861011 11 1 250250

A: Area de la cuenca

CN: Número de curva 25425400

CNS

Page 55: Taller CORDOBA Presentacion

Aplicando la aproximación de Díaz Granados et al. (1984)

para obtener la función de distribución acumulada de

Qmáx, se llega a:

imáxQmáx HG)()exp()Q(F 11

*Te

.e

.*máx

.*e dttQS.texpG 390471 441610558390441610

*i

*i

iiTb

Tae

.e

d.

e

d*máxi

*.*

ei dtttQcT

S.texpH 390471 441610

558390

441610

A

QQ máx*

máx

)nexp()n()n(k

Tn

*

112

1

ii aaii bbii ccii ddii

1 0.0000 0.1024 0.5000 1.0000

2 0.1024 0.2890 0.6529 1.1081

3 0.2890 0.5722 0.8048 1.3640

4 0.5722 1.0000 1.0000 3.1358

Page 56: Taller CORDOBA Presentacion

Aplicación de la metodología en dos cuencas del centro de la provincia de Buenos Aires

Parámetros del modelo de precipitación

Estación: Aeropuerto de Olavarría. Servicio Meteorológico Nacional.

Período: 1988 – 1997.

Precipitación media anual: 900 mm.

Separación de eventos independientes: Córdova y Bras (1981).

SerieSerie Escala Escala temporaltemporal

ParámetrosParámetros

(h/cm)(h/cm) (1/h)(1/h)

Olavarría horaria 1.014 0.255

Page 57: Taller CORDOBA Presentacion

Cuenca arroyo Tapalqué

Comparación de las funciones de distribución acumuladas

0.6

0.7

0.8

0.9

1.0

100 150 200 250 300 350 400 450

Caudal (m3/ s)

Pro

babilid

ad d

e n

o e

xce

denci

a

Nuevo modelo (mediana momentos)

Nuevo modelo (Rosso v=0.18 m/s)

Raines y Valdés

Empírica F(x) = 1- m/(n+1)

Page 58: Taller CORDOBA Presentacion

0.6

0.7

0.8

0.9

1.0

100 150 200 250 300 350 400 450

Caudal (m3/ s)

Pro

babilid

ad d

e n

o e

xce

denci

a

Nuevo modelo (mediana momentos)

Nuevo modelo (Rosso v=0.08 m/s)

Raines y Valdés

Empírica F(x) = 1- m/(n+1)

Cuenca arroyo Azul

Page 59: Taller CORDOBA Presentacion

ModeloMétodo de estimación

Dn

QQmáxmáx > 50 m > 50 m33/s/s QQmáxmáx > 250 m > 250 m33/s/s

Raines y Valdés 0.212 0.063

Nuevo modelo

Media momentos 0.269 0.027

Mediana momentos 0.264 0.025

Rosso v=0.18 m/s 0.261 0.023

Rosso v=0.50 m/s 0.200 0.051

Rosso v=1.07 m/s 0.155 0.082

Distancias de Kolmogorov -Smirnov

1 jx

n

jn XFnj

máxD

Dn: distancia de Kolmogorov-Smirnov,

Xj: caudal máximo observado,

Fx(Xj): función de distribución acumulada de

Qmáx,j : número de orden,n: tamaño de la muestra.

Page 60: Taller CORDOBA Presentacion

Conclusiones La idea de un programa de investigación sobre

máximos, muy importante durante la mayor parte del siglo XX implica incluir algunos nuevos temas.

La hipótesis de no estacionariedad ha pasado a ser considerada importante de la modelación de valores extremos.

La relación caudal-periodo de retorno depende de la autocorrelación (mínimos).

El modelo de función derivada muestra la importancia de incluir las características de la cuenca y del clima en la representación de los extremos .

Page 61: Taller CORDOBA Presentacion
Page 62: Taller CORDOBA Presentacion

BibliografíaBras,R., 1990. Hydrology. An Introduction to

Hydrologic Science. Addison Wisley, 1990. Maidment,D.,1992. Handbook of Hydrology.

Mc Graw-Hill.Ven Te Chow, 1962. Handbook of Applied

Hydrology. Ven Te Chow, Maidment,D y L. Mays. 1994.

Hidrología Aplicada. Mc Graw-Hill.

Page 63: Taller CORDOBA Presentacion

BibliografíaTapley T. D. y P. R. Waylen, 1990. Spatial variability

of annual precipitation and ENSO events in Western Peru. Hydrol. Sci. J.35(4), 429-446.

World Meteorological Organization, 1989. Statistical distributions for flood frequency analysis. World Meterol. Organization, WMO-Nº 718, OH Rep. Nº 33.

Page 64: Taller CORDOBA Presentacion

Valores estimados del AIC y BIC

Modelo Número de parámetros

AIC BIC

Pearson III 3 671.80 676.71

Gumbel 2 674.38 677.66

Log-Normal II

3 674.13 679.05

Log-Normal III

3 674.72 679.64

GEV 3 675.66 680.58

Page 65: Taller CORDOBA Presentacion

Modelo Gumbel

Page 66: Taller CORDOBA Presentacion

Bondad de ajustePrueba de Prueba de

Kolmogorov-SmirnovKolmogorov-Smirnov : :

Page 67: Taller CORDOBA Presentacion

Función GEV Corrientes Density Plot for GEV Distribution for CORRIENTES

CORRIENTES

20

10

0

6000050000

25

5

15

400003000020000

Den

sity

Page 68: Taller CORDOBA Presentacion

Función de verosimilitud GEV

Page 69: Taller CORDOBA Presentacion

Función GEVEstimates of GEV parameters estimate "s.e." Mu 25923 832.5 Sigma 5334 610.7 Eta 0.05845 0.09646 Maximum Log-Likelihood = -1039.633

Page 70: Taller CORDOBA Presentacion

Análisis del ajuste Q-Q Plot

Page 71: Taller CORDOBA Presentacion

• Type of projects (several return period)

•Selection of projects at Paraná river

•Non stationary processes (flood analysis and Gumbel models)

•Precipitation analysis and largest cities at Paraná basin

Page 72: Taller CORDOBA Presentacion

72

Return PeriodRandom variable:Threshold level:Extreme event occurs if: Recurrence interval: Return Period:

Average recurrence interval between events equaling or exceeding a threshold

If p is the probability of occurrence of an extreme event, then

or

TxX Tx

X

TxX of ocurrencesbetween Time

)(E

pTE

1)(

TxXP T

1)(

Page 73: Taller CORDOBA Presentacion

73

Hydrologic extremes Extreme events

Floods Droughts

Magnitude of extreme events is related to their frequency of occurrence

The objective of frequency analysis is to relate the magnitude of events to their frequency of occurrence through probability distribution

It is assumed the events (data) are independent and come from identical distribution

occurence ofFrequency

1Magnitude

Page 74: Taller CORDOBA Presentacion

Flood •High stage in river when the river overflows and inundates the adjoining area

•Flood peak and frequency of the peak is an important consideration in hydraulic design

•Magnitude and time of the flood varies with change in watershed characteristics

•Peak flood depends on rainfall, discharge and watershed area and type

Page 75: Taller CORDOBA Presentacion

Flood •Magnitude of flood can be estimated by

•Rational method

•Empirical method

•Unit hydrograph technique

•Flood frequency studies

Page 76: Taller CORDOBA Presentacion

La modelación como población mezcla (Tapley y Waylen, 1990) que expresa que cuando una variable aleatoria, x, resulta de una gran cantidad de posibles procesos generados, su distribución de probabilidad, Fx, puede asumirse como la suma de m distribuciones de cada uno de los procesos generados Fk, donde k = 1, ..., m, ponderándolos de acuerdo a su frecuencia de ocurrencia, gk,

Análisis de extremos y ENSO

Page 77: Taller CORDOBA Presentacion

Análisis de extremos y ENSOModelo de población mixta

22

1

22

22

1

11

11 )(1exp)(1exp)(

kk

x xk

gxk

gXxF

)()(1

XxFgXxFk

m

kkx

Page 78: Taller CORDOBA Presentacion

Modelación de extremos ENSO

Ajuste Población Mezcla

10

100

1000

-2 -1 0 1 2 3 4 5 6

Variable reducida Gumbel

Caudal M

ax .In

st. (

m3/s

)

No Niño Niño GVE Mezcla GEV

Page 79: Taller CORDOBA Presentacion

Series de extremos

Page 80: Taller CORDOBA Presentacion

Series de extremos

Río Blackstone Río Feather

Page 81: Taller CORDOBA Presentacion

Diferencias por la presencia de Autocorrelación

Curvas Qmin - Período de retornoRío Bermejo - Estación Pozo Sarmiento

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

0 10 20 30 40 50 60 70 80 90 100 110

Tr (Años)

Q (

m3

/se

g)

METODOLOGIA CLASICA

CORRECCION POR AUTOCORRELACION r1=0.366

Page 82: Taller CORDOBA Presentacion

•"Type of project Return period (years) Examples

Urban drainage (low risk, up to 1 km2)

5 to 10 Small city

Urban drainage (mediun risk, more than to

1 km2)

25 to 50 Medium city

Urban drainage (high risk, more than to

10 km2)

50 to 100 Large city(Buenos Aires,

Rosario)

Principal spillways (dams)

20 to 100 Corpus y Yacireta

Emergency spillways (dams)

100 to 10000 Corpus y Yacireta

Bridges 100 to 500 Tancredo NevesY Túnel subfluvial

Page 83: Taller CORDOBA Presentacion

•"Selection of project Name River

Dam Yacyreta Paraná

Dam Corpus Paraná

Bridge Tancredo Neves Paraná

Bridge Rosario-Victoria Paraná

Bridge Tunel Subfluvial Paraná

Bridge Zarate Brazo Largo Paraná

Page 84: Taller CORDOBA Presentacion

Empirical FormulaCharacteristics of Empirical Formulae are :

Regional formulaBased on correlationBetween flow(Qp) and catchment propertiesAlmost all the formula represent discharge as a

function of AreaNeglects flood frequencyThe reason why empirical formulas are all regional

and gives approximate results when applied to other regions

Page 85: Taller CORDOBA Presentacion

1 8 5 0 1 9 0 0 1 9 5 0 2 0 0 00

1 0 0 0

2 0 0 0

3 0 0 0

4 0 0 0

5 0 0 0R u n o f f( m 3

s – 1 )

Gardenier & Gardenier (1988) In: Encyclopedia of statistical sciences 8:141, WileyMudelsee (2006) DKKV/ARL Workshop

Dresden, river Elbe

mean and variability risk

and extremes

Climate Risk

P D F

0 2000 4000

R u n o f f ( m 3 s – 1 )

2 %

Page 86: Taller CORDOBA Presentacion

1 8 5 0 1 9 0 0 1 9 5 0 2 0 0 00

1 0 0 0

2 0 0 0

3 0 0 0

4 0 0 0

5 0 0 0R u n o f f( m 3

s – 1 )

Dresden, river Elbe

climate risk change?

Solomon et al. (Eds.) (2007) Climate Change 2007: The Physical Science Basis. Cambridge Univ. Press

Climate Change

P D F

0 2000 4000

R u n o f f ( m 3 s – 1 )

2 %

P D F

5 %

0 2000 4000

R u n o f f ( m 3 s – 1 )

Page 87: Taller CORDOBA Presentacion

87

Hydrologic extremes Extreme events

Floods Droughts

Magnitude of extreme events is related to their frequency of occurrence

The objective of frequency analysis is to relate the magnitude of events to their frequency of occurrence through probability distribution

It is assumed the events (data) are independent and come from identical distribution

occurence ofFrequency

1Magnitude

Page 88: Taller CORDOBA Presentacion

88

Return PeriodRandom variable:Threshold level:Extreme event occurs if: Recurrence interval: Return Period:

Average recurrence interval between events equaling or exceeding a threshold

If p is the probability of occurrence of an extreme event, then

or

TxX

Tx

X

TxX of ocurrencesbetween Time

)(E

pTE

1)(

TxXP T

1)(

Page 89: Taller CORDOBA Presentacion

89

More on return periodIf p is probability of success, then (1-p) is the

probability of failureFind probability that (X ≥ xT) at least once in N

years.

NN

T

TT

T

T

TpyearsNinonceleastatxXP

yearsNallxXPyearsNinonceleastatxXP

pxXP

xXPp

111)1(1)(

)(1)(

)1()(

)(

Page 90: Taller CORDOBA Presentacion

90

Frequency FactorsPrevious example only works if distribution is

invertible, many are not.Once a distribution has been selected and its

parameters estimated, then how do we use it?Chow proposed using:

where

sKxx TT

deviationstandardSample

meanSample

periodReturn

factorFrequency

magnitudeeventEstimated

s

x

T

K

x

T

T

x

fX(x)

sKT

x

Page 91: Taller CORDOBA Presentacion

91

Return period exampleDataset – annual maximum discharge for 106 years

on Colorado River near Austin

0

100

200

300

400

500

600

1905 1908 1918 1927 1938 1948 1958 1968 1978 1988 1998

Year

An

nu

al M

ax F

low

(10

3 c

fs)

xT = 200,000 cfs

No. of occurrences = 3

2 recurrence intervals in 106 years

T = 106/2 = 53 years

If xT = 100, 000 cfs

7 recurrence intervals

T = 106/7 = 15.2 yrsP( X ≥ 100,000 cfs at least once in the next 5 years) = 1- (1-1/15.2)5 = 0.29

Page 92: Taller CORDOBA Presentacion

92

Data series

0

100

200

300

400

500

600

1905 1908 1918 1927 1938 1948 1958 1968 1978 1988 1998

Year

An

nu

al M

ax F

low

(10

3 c

fs)

Considering annual maximum series, T for 200,000 cfs = 53 years.

The annual maximum flow for 1935 is 481 cfs. The annual maximum data series probably excluded some flows that are greater than 200 cfs and less than 481 cfs

Will the T change if we consider monthly maximum series or weekly maximum series?

Page 93: Taller CORDOBA Presentacion

93

Hydrologic data series

• Complete duration series– All the data available

• Partial duration series– Magnitude greater than base value

• Annual exceedance series– Partial duration series with # of

values = # years• Extreme value series

– Includes largest or smallest values in equal intervals• Annual series: interval = 1 year• Annual maximum series: largest

values• Annual minimum series : smallest

values

Page 94: Taller CORDOBA Presentacion

Clima y estimación de valores extremos