Taller CORDOBA Presentacion

Post on 12-Dec-2015

212 views 0 download

description

taller

Transcript of Taller CORDOBA Presentacion

1 Taller sobre Estudios Hidrológicos en Areas Serranas de la Provincia de

Córdoba

Teoría de Valores Extremos

Rafael Santiago SeoaneInstituto Nacional del Agua

FIUBA, CONICETCórdoba Octubre 2011

• Conceptos clásicosConceptos clásicos

• Nuevos temas de estudioNuevos temas de estudio

Aplicaciones e importancia de la teoría

Estimación de caudales máximos y mínimos y su frecuencia de ocurrencia.

Definir la relación caudal-periodo de retorno.Estimación de una función de densidad de

probabilidades.Numerosas obras hidráulicas se diseñan con

esta metodología.Algunos países trataron de definir este problema

con una legislación,

Nuevos temas

Procesos No estacionarios. Los procesos hidrológicos pueden presentar características que cambian con el tiempo. En el contexto hidrológico se definen: a) ocurren en ciertas épocas del año y b) asociados con la presencia de tendencias relacionadas a cambios climáticos de largo plazo (long term period).

Algunos orígenes de la No estacionariedad. Se asocian con cambios en el uso del suelo en la cuenca, presencia de nuevas obras (por ejemplo: embalses) y modificaciones en las propiedades de la precipitación.

Modelos y temas

Principales modelos de valores extremos: Gumbel, Log-Normal II y III, Pearson III, Log-Pearson III.

Problemas clásicos: selección del modelo y estimación de sus parámetros.

Principales hipótesis de la teoría clásica.Modelos en un contexto no estacionario.Detección de tendencias en máximos y mínimos. Modelos de función de densidad derivada de

caudales extremos.

Evolución de los temas

Selección de modelos.

Estimación de parámetros y verificación del modelo.

Máxima verosimilitudes irregulares.

No estacionariedad.Detección de

tendencias.Modelo Generalizado

de Valores Extremos. Máxima verosimilitud.Ecuaciones con la

variación temporal de los parámetros.

Temas a considerar

Existen numerosos métodos de estimación de los parámetros del modelo.

Orígenes de la incertidumbre de las estimaciones con los modelos de valores extremos.

Presentación de algunos criterios de selección del modelo.

Proceso de selección y estimación de un modelo

Seleccionar una función de densidad de probabilidades para representar una serie de caudales máximos o mínimos(*).

Estimar los parámetros de la función de densidad de probabilidades

Estimar los caudales máximos o mínimos asociados con distintos períodos de retorno.

(*) importancia de la autocorrelación entre los datos.

Métodos de estimación

Los parámetros desconocidos del modelo son inferidos a partir de datos históricos .

Existen numerosas técnicas para la estimación de los parámetros pero todas tienen ventajas y desventajas.

Los métodos de estimación no son independientes del problema de la selección del modelo.

La estimación de parámetros en modelos asimétricos es más complicada debido a la presencia de verosimilitudes irregulares.

Histograma Río Paraná

Función GEV en Posadas

Fuentes de incertidumbreIncertidumbre en los parámetros:

corresponde a la asociada con la estimación de los parámetros del proceso utilizando una cantidad limitada de datos.

Incertidumbre en el modelo: corresponde a la asociada con la idea de que el modelo probabilístico asumido del proceso estocástico sea el correcto.

Cuantificación de la incertidumbreLos análisis estadísticos definen estimaciones a

partir de datos históricos. Diferentes muestras igualmente representativas pueden definir otras y distintas estimaciones.

En el análisis de valores extremos resulta muy importante la cuantificación de la incertidumbre debido a que cambios pequeños en los parámetros pueden influir en las extrapolaciones de la variable.

Algunos conceptos sobre el modelo

Paradigma de valores extremos que implica: la independencia y la estacionaridad.

Existe una hipótesis implícita que consiste en suponer que el mecanismo estocástico subyacente del proceso es suave para permitir la extrapolación de los valores de la muestra.

Procesos aleatoriosUn proceso aleatorio es una secuencia de

variables aleatorias X1, X2, X3--- Xn. El ejemplo más simple consiste en las variables independientes e idénticamente distribuidas.

Estacionario: un proceso aleatorio es estacionario si dado un conjunto de variables (i1,i2,i3…in) si para cualquier entero m son idénticas las distribuciones conjuntas de (Xi,1,…, Xi,k) y (Xi,1+m,…, Xi,k+m).

Modelos matemáticos

Son expresiones matemáticas que representan las principales características de los procesos.

Algunos ejemplo son los modelos (PIC):

Probabilísticos: Gumbel y GEV. Probabilísticos-Dererminísticos: FDD.

Algunas hipótesis básicas

• Independencia temporal entre las observaciones.

• Las observaciones tienen las mismas propiedades estadísticas (Existe una única función de densidad de probabilidades).

Presencia de autocorrelación (Caudales mínimos)

Funciones de densidad de probabilidades en Hidrología

GumbelGeneralizada de Valores ExtremosPearson IIILog-Pearson IIILog-Normal II y III

Modelos de valores extremosModelo Función de densidad o

distribución

Log-Normal II

Pearson III

Log-Pearson III

Gumbel

GEV

2

)ln(

2

1exp

2

1)(

x

x

x

x

xxf

)(

)(exp)()(

1

xxxf

x

)(

))(ln(exp))(ln()( 1

xx

xxf x

xx

xfx

expexp1

)(

1

)(1exp)(

x

xFx

Métodos de estimación de parámetros

MomentosMáxima VerosimilitudMáxima Verosimilitud Corregido

Problema clave: la cantidad de combinaciones posibles entre distintos modelos y métodos de estimación.

Máxima verosimilitudEs un método flexible y general de estimación de los parámetros desconocidos θ0 de un modelo dentro de una familia F de

modelos.  Siendo x1,x2,x3,,,,,xn las ocurrencias

independientes de una variable aleatoria con una unción de densidad de probabilidades f(x; θ0).

Función de verosimilitud

),()(1

n

iixfL

),(log)(log)(1

n

iixfLl

Modelo de valores extremos /EV1-Gumbel)

Valores extremos: máximos o mínimos.

Caudal máximo o caudal mínimo.

Precipitaciones máximas.

Siendo el número de valores observado es grande la distribución converge a alguna de las tres formas denominadas I, II y III.

24

Modelo de Gumbel

Moda  α, 

Media α+γβ (where γ=0.5772156649... is Euler's constant),

and

Varianza  ⅙β2π2

Modelo Gumbel y Máxima Verosimilitud

)(exp)(exp),,( xxxf

N

ixxNNLogL

1)(explog

Modelo Gumbel

27

Distribution of annual maximum streamflow follows an EV1 distribution

Ecuaciones de MV del Modelo Pearson III

Ecuaciones no lineales

n

i

n

iii

nxxnL1 1

ln)log()1()(1

)(loglog

n

ii

nx

L12

0)(1log

n

i

ix

nL12

0)(

1)1(

log

n

ii

nxnL

10ln)log(

)(

)'(log

Función de Verosimilitud

Modelo Pearson III

Río Blackstone

Diferencias según el modelo Río Blackstone (USA) (MV)

Modelo 100 1000 5000 10000

Gumbel 430 578 681 726

Log-N II 747 1297 1795 2041

Log-N III 577 941 1261 1432

P III 560 802 974 1050

LP III 877 2520 5311 7343

Nota: Caudales en m3/s, Período de retorno en años.

Criterios de selección entre modelos

El Criterio de Información Bayesiano (BIC) contribuye a resolver el problema de la selección entre varios modelos alternativos.

El Criterio de Información de Akaike (AIC) permite analizar la bondad del ajuste e incluye una penalización por el número de parámetros estimados para el modelo.

Criterios de selección entre modelos (AIC y BIC)

Akaike Information Criterio (AIC, 1974)

k: número de parámetros y L: verosimilitud.

Bayesian Information Criterio (BIC, 1978)

n: cantidad de datos.

)ln(22 LkAIC

)ln(2)ln( LnkBIC

Diferencias por método deestimación y un período de retorno10000 años

Modelo Log-Normal II (M o MV)

Log-Normal III (M)

Log-Normal III MV

Blackstone 72117 80978 50082

Feather 660182 413930 983531

Limay (PL) 10483 7762 15366

Manawatu 8094 7207 8237

Type of project Return period (years) Examples

Urban drainage (low risk, up to 1 km2)

5 to 10 Small city

Urban drainage (mediun risk, more than to

1 km2)

25 to 50 Medium city

Urban drainage (high risk, more than to

10 km2)

50 to 100 Large city(Buenos Aires,

Rosario)

Principal spillways (dams)

20 to 100 Corpus y Yacireta

Emergency spillways (dams)

100 to 10000 Corpus y Yacireta

Bridges 100 to 500 Tancredo NevesY Túnel subfluvial

Prueba no paramétricade Mann - Kendall

La prueba tiene como objetivo detectar una tendencia al incremento o al decrecimiento en los datos más que la ocurrencia de un evento aislado.

H0) los datos son una muestra de n variables aleatorias independientes e idénticamente distribuidas.

H1) la distribución de xj y xk no son idénticas para todos k, j < n con k j.

(xj y xk son variables aleatorias independientes e idénticamente distribuidas)

Los estadísticos que intervienen en el análisis son S y Z, que se asocian con el estimador de pendiente B en el signo:

1n

1k

n

1kjkj )xsgn(xS

0 < θ si 1-

0 θ si 0

0 θ si 1

= ) (θ sgn

0SsiVar(S)

1S

0Ssi0

0SsiVar(S)

1S

Zj<kMediana

k-jk

xj

x = B

Prueba de Verosimilitud

),(),,(,2 0,01

22,11

l

nkk

l

njj

m

nii xLxLxL

 : log-verosimilitud estimada con las observaciones de la

primer parte de la serie para el modelo seleccionado; : log-verosimilitud estimada con las observaciones de la segunda parte de la serie para el modelo seleccionado;

: log-verosimilitud estimada con las observaciones de la serie completa para el modelo seleccionado.

ixL ,11 ,

),,( 22 jxL

),( 0,0 kxL

donde:

La estimación del estadístico de la prueba implica ajustar una función de densidad de probabilidades a la serie completa de las observaciones y a las dos series parciales correspondientes a la primera y segunda parte de la serie temporal.

Ho: las observaciones pueden ser representadas por un único modelo.

H1: las observaciones no pueden ser representadas por un único modelo.

Prueba de VerosimilitudPARANA - CORRIENTES

Series de Caudales Máximos Anuales - Prueba de Verosimilitud

0

2

4

6

8

10

12

14

16

18

19

04

-19

66

vs

19

67

-20

02

19

04

-19

67

vs

19

68

-20

02

19

04

-19

68

vs

19

69

-20

02

19

04

-19

69

vs

19

70

-20

02

19

04

-19

70

vs

19

71

-20

02

19

04

-19

71

vs

19

72

-20

02

19

04

-19

72

vs

19

73

-20

02

19

04

-19

73

vs

19

74

-20

02

19

04

-19

74

vs

19

75

-20

02

19

04

-19

75

vs

19

76

-20

02

19

04

-19

76

vs

19

77

-20

02

19

04

-19

77

vs

19

78

-20

02

19

04

-19

78

vs

19

79

-20

02

19

04

-19

79

vs

19

80

-20

02

19

04

-19

80

vs

19

81

-20

02

19

04

-19

81

vs

19

82

-20

02

19

04

-19

82

vs

19

83

-20

02

Co

efi

cie

nte

Pru

eb

a d

e V

ero

sim

ilit

ud

GUMBEL GEV

Pruebas para detección del punto de cambio

CUSUM

Prueba de Pettitt

Análisis de tendencias

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0

04

-05

08

-09

12

-13

16

-17

20

-21

24

-25

28

-29

32

-33

36

-37

40

-41

44

-45

48

-49

52

-53

56

-57

60

-61

64

-65

68

-69

72

-73

76

-77

80

-81

84

-85

88

-89

92

-93

96

-97

00

-01

Pro

ba

bilid

ad

-130000

-110000

-90000

-70000

-50000

-30000

-10000

10000

30000

50000

70000

Sm

Probabilidad de Punto de Cambio - PETTITT Sm (Cusum)

Caudales máximos ( Corrientes) AJUSTE MÁXIMOS RIO PARANÁ - Estación Corrientes

GEV - MMV

0

10000

20000

30000

40000

50000

60000

70000

80000

1 10 100 1000

Tr (año)

Q (

m3 /s

)

Serie Completa1976-77 a 2002-031904-05 a 1975-76

   

Gumbel:

M0 = modelo estacionarioM1 =Tendencia lineal

M3 = Tendencia lineal + SOI

M2 = SOI influence

No estacionario

Log-likelihood Gumbel:

Estimación de parámetros

Inferencia para distintos períodos de retorno

Resultados para Modelos No Estacionarios

TR Stationary Non-Stat (M3) Dif (%)

10 38337 40929 6.3

50 47322 51144 7.5

100 51121 56123 8.9

200 54905 62743 12.5500 59899 75273 20.4

Corrientes Flow (m3/s)

Modelo GEV

),),(( tGEVtz

tt 10

2210ttt

)(10

tSOIt

Expresiones de Verosimilitud

1

10(11

10(1log)11(log),,(

ttzm

t

ttzl

1

)(10(1

1

)(10(1log)11(log),,(

tSOItzm

t

tSOItzl

Problemas asociados para considerarAlguna distribuciones utilizadas en Hidrología

presentan tres parámetros y el método de máxima verosimilitud podría producir problemas de estimación.

Las pruebas usadas (Chi-cuadrado y Kolmogorov-Smirnov) fueron diseñadas para discriminar modelos en la región de los medios.

Los valores estimados de los caudales asociados con un período de retorno dado difieren según el modelo y el método de estimación de parámetros.

Modelos de función de Modelos de función de densidad derivada de densidad derivada de

caudales extremoscaudales extremos

El procedimiento para la evaluación de una distribución de

frecuencias de caudales máximos para cuencas con datos

escasos tiene las siguientes etapas:

1.-Definir la función de densidad de probabilidades conjunta de intensidad y duración de la precipitación.

2.-Seleccionar el modelo de infiltración.

3.-Obtener la función de densidad de probabilidades conjunta del exceso de precipitación.

4.-Definir el proceso de escurrimiento directo.

5.-Definir la función de distribución acumulada del caudal directo máximo.

6.-Modelar el flujo base.

7.-Estimar los caudales máximos asociados a distintas probabilidades de excedencia.

Qmáx = g(ie,te)

Obtención de la distribución de

Qmáx

Modelo de precipitación

Parámetros climáticos

Modelo de respuesta P - Q

Parámetros de la cuenca

f(ie,te)

Esquema de la función de densidad derivada de caudales (Eagleson, 1972)

FQmáx(Qmáx)

R

eeeeTe,IemáxQmáx dtdi)t,i(f)Q(F

Nueva función de densidad de probabilidades derivada de

caudales máximos que incluye el HUI de Nash como

modelo de respuesta de la cuenca.

Para estimar la probabilidad de excedencia del caudal

máximo es necesario determinar la función de distribución

acumulada de Qmáx que está dada por:

Región del plano ie, te donde la convolución de fie,te con el modelo de respuesta de la

cuenca produce caudales máximos menores o iguales a Qmáx

Función de densidad de probabilidades conjunta de la intensidad y duración

efectivas de la precipitación

La función de densidad de probabilidades conjunta de la

intensidad y duración efectivas está dada en dos partes,

(Raines y Valdés, 1993):

)()exp(t,i ee 110 0Prob

558390441610441610

441610441610441610

390471

1776420

.e

.e

.*

.e

.e

.e

*eeTe,Ie

itS.exp

itS)()texp(.)t,i(f

2120

S. *

: inversa del valor medio de la duración [1/L],

: inversa del valor medio de la intensidad puntual [T/L],

K*

A..exp.expK .. 003861011 11 1 250250

A: Area de la cuenca

CN: Número de curva 25425400

CNS

Aplicando la aproximación de Díaz Granados et al. (1984)

para obtener la función de distribución acumulada de

Qmáx, se llega a:

imáxQmáx HG)()exp()Q(F 11

*Te

.e

.*máx

.*e dttQS.texpG 390471 441610558390441610

*i

*i

iiTb

Tae

.e

d.

e

d*máxi

*.*

ei dtttQcT

S.texpH 390471 441610

558390

441610

A

QQ máx*

máx

)nexp()n()n(k

Tn

*

112

1

ii aaii bbii ccii ddii

1 0.0000 0.1024 0.5000 1.0000

2 0.1024 0.2890 0.6529 1.1081

3 0.2890 0.5722 0.8048 1.3640

4 0.5722 1.0000 1.0000 3.1358

Aplicación de la metodología en dos cuencas del centro de la provincia de Buenos Aires

Parámetros del modelo de precipitación

Estación: Aeropuerto de Olavarría. Servicio Meteorológico Nacional.

Período: 1988 – 1997.

Precipitación media anual: 900 mm.

Separación de eventos independientes: Córdova y Bras (1981).

SerieSerie Escala Escala temporaltemporal

ParámetrosParámetros

(h/cm)(h/cm) (1/h)(1/h)

Olavarría horaria 1.014 0.255

Cuenca arroyo Tapalqué

Comparación de las funciones de distribución acumuladas

0.6

0.7

0.8

0.9

1.0

100 150 200 250 300 350 400 450

Caudal (m3/ s)

Pro

babilid

ad d

e n

o e

xce

denci

a

Nuevo modelo (mediana momentos)

Nuevo modelo (Rosso v=0.18 m/s)

Raines y Valdés

Empírica F(x) = 1- m/(n+1)

0.6

0.7

0.8

0.9

1.0

100 150 200 250 300 350 400 450

Caudal (m3/ s)

Pro

babilid

ad d

e n

o e

xce

denci

a

Nuevo modelo (mediana momentos)

Nuevo modelo (Rosso v=0.08 m/s)

Raines y Valdés

Empírica F(x) = 1- m/(n+1)

Cuenca arroyo Azul

ModeloMétodo de estimación

Dn

QQmáxmáx > 50 m > 50 m33/s/s QQmáxmáx > 250 m > 250 m33/s/s

Raines y Valdés 0.212 0.063

Nuevo modelo

Media momentos 0.269 0.027

Mediana momentos 0.264 0.025

Rosso v=0.18 m/s 0.261 0.023

Rosso v=0.50 m/s 0.200 0.051

Rosso v=1.07 m/s 0.155 0.082

Distancias de Kolmogorov -Smirnov

1 jx

n

jn XFnj

máxD

Dn: distancia de Kolmogorov-Smirnov,

Xj: caudal máximo observado,

Fx(Xj): función de distribución acumulada de

Qmáx,j : número de orden,n: tamaño de la muestra.

Conclusiones La idea de un programa de investigación sobre

máximos, muy importante durante la mayor parte del siglo XX implica incluir algunos nuevos temas.

La hipótesis de no estacionariedad ha pasado a ser considerada importante de la modelación de valores extremos.

La relación caudal-periodo de retorno depende de la autocorrelación (mínimos).

El modelo de función derivada muestra la importancia de incluir las características de la cuenca y del clima en la representación de los extremos .

BibliografíaBras,R., 1990. Hydrology. An Introduction to

Hydrologic Science. Addison Wisley, 1990. Maidment,D.,1992. Handbook of Hydrology.

Mc Graw-Hill.Ven Te Chow, 1962. Handbook of Applied

Hydrology. Ven Te Chow, Maidment,D y L. Mays. 1994.

Hidrología Aplicada. Mc Graw-Hill.

BibliografíaTapley T. D. y P. R. Waylen, 1990. Spatial variability

of annual precipitation and ENSO events in Western Peru. Hydrol. Sci. J.35(4), 429-446.

World Meteorological Organization, 1989. Statistical distributions for flood frequency analysis. World Meterol. Organization, WMO-Nº 718, OH Rep. Nº 33.

Valores estimados del AIC y BIC

Modelo Número de parámetros

AIC BIC

Pearson III 3 671.80 676.71

Gumbel 2 674.38 677.66

Log-Normal II

3 674.13 679.05

Log-Normal III

3 674.72 679.64

GEV 3 675.66 680.58

Modelo Gumbel

Bondad de ajustePrueba de Prueba de

Kolmogorov-SmirnovKolmogorov-Smirnov : :

Función GEV Corrientes Density Plot for GEV Distribution for CORRIENTES

CORRIENTES

20

10

0

6000050000

25

5

15

400003000020000

Den

sity

Función de verosimilitud GEV

Función GEVEstimates of GEV parameters estimate "s.e." Mu 25923 832.5 Sigma 5334 610.7 Eta 0.05845 0.09646 Maximum Log-Likelihood = -1039.633

Análisis del ajuste Q-Q Plot

• Type of projects (several return period)

•Selection of projects at Paraná river

•Non stationary processes (flood analysis and Gumbel models)

•Precipitation analysis and largest cities at Paraná basin

72

Return PeriodRandom variable:Threshold level:Extreme event occurs if: Recurrence interval: Return Period:

Average recurrence interval between events equaling or exceeding a threshold

If p is the probability of occurrence of an extreme event, then

or

TxX Tx

X

TxX of ocurrencesbetween Time

)(E

pTE

1)(

TxXP T

1)(

73

Hydrologic extremes Extreme events

Floods Droughts

Magnitude of extreme events is related to their frequency of occurrence

The objective of frequency analysis is to relate the magnitude of events to their frequency of occurrence through probability distribution

It is assumed the events (data) are independent and come from identical distribution

occurence ofFrequency

1Magnitude

Flood •High stage in river when the river overflows and inundates the adjoining area

•Flood peak and frequency of the peak is an important consideration in hydraulic design

•Magnitude and time of the flood varies with change in watershed characteristics

•Peak flood depends on rainfall, discharge and watershed area and type

Flood •Magnitude of flood can be estimated by

•Rational method

•Empirical method

•Unit hydrograph technique

•Flood frequency studies

La modelación como población mezcla (Tapley y Waylen, 1990) que expresa que cuando una variable aleatoria, x, resulta de una gran cantidad de posibles procesos generados, su distribución de probabilidad, Fx, puede asumirse como la suma de m distribuciones de cada uno de los procesos generados Fk, donde k = 1, ..., m, ponderándolos de acuerdo a su frecuencia de ocurrencia, gk,

Análisis de extremos y ENSO

Análisis de extremos y ENSOModelo de población mixta

22

1

22

22

1

11

11 )(1exp)(1exp)(

kk

x xk

gxk

gXxF

)()(1

XxFgXxFk

m

kkx

Modelación de extremos ENSO

Ajuste Población Mezcla

10

100

1000

-2 -1 0 1 2 3 4 5 6

Variable reducida Gumbel

Caudal M

ax .In

st. (

m3/s

)

No Niño Niño GVE Mezcla GEV

Series de extremos

Series de extremos

Río Blackstone Río Feather

Diferencias por la presencia de Autocorrelación

Curvas Qmin - Período de retornoRío Bermejo - Estación Pozo Sarmiento

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

0 10 20 30 40 50 60 70 80 90 100 110

Tr (Años)

Q (

m3

/se

g)

METODOLOGIA CLASICA

CORRECCION POR AUTOCORRELACION r1=0.366

•"Type of project Return period (years) Examples

Urban drainage (low risk, up to 1 km2)

5 to 10 Small city

Urban drainage (mediun risk, more than to

1 km2)

25 to 50 Medium city

Urban drainage (high risk, more than to

10 km2)

50 to 100 Large city(Buenos Aires,

Rosario)

Principal spillways (dams)

20 to 100 Corpus y Yacireta

Emergency spillways (dams)

100 to 10000 Corpus y Yacireta

Bridges 100 to 500 Tancredo NevesY Túnel subfluvial

•"Selection of project Name River

Dam Yacyreta Paraná

Dam Corpus Paraná

Bridge Tancredo Neves Paraná

Bridge Rosario-Victoria Paraná

Bridge Tunel Subfluvial Paraná

Bridge Zarate Brazo Largo Paraná

Empirical FormulaCharacteristics of Empirical Formulae are :

Regional formulaBased on correlationBetween flow(Qp) and catchment propertiesAlmost all the formula represent discharge as a

function of AreaNeglects flood frequencyThe reason why empirical formulas are all regional

and gives approximate results when applied to other regions

1 8 5 0 1 9 0 0 1 9 5 0 2 0 0 00

1 0 0 0

2 0 0 0

3 0 0 0

4 0 0 0

5 0 0 0R u n o f f( m 3

s – 1 )

Gardenier & Gardenier (1988) In: Encyclopedia of statistical sciences 8:141, WileyMudelsee (2006) DKKV/ARL Workshop

Dresden, river Elbe

mean and variability risk

and extremes

Climate Risk

P D F

0 2000 4000

R u n o f f ( m 3 s – 1 )

2 %

1 8 5 0 1 9 0 0 1 9 5 0 2 0 0 00

1 0 0 0

2 0 0 0

3 0 0 0

4 0 0 0

5 0 0 0R u n o f f( m 3

s – 1 )

Dresden, river Elbe

climate risk change?

Solomon et al. (Eds.) (2007) Climate Change 2007: The Physical Science Basis. Cambridge Univ. Press

Climate Change

P D F

0 2000 4000

R u n o f f ( m 3 s – 1 )

2 %

P D F

5 %

0 2000 4000

R u n o f f ( m 3 s – 1 )

87

Hydrologic extremes Extreme events

Floods Droughts

Magnitude of extreme events is related to their frequency of occurrence

The objective of frequency analysis is to relate the magnitude of events to their frequency of occurrence through probability distribution

It is assumed the events (data) are independent and come from identical distribution

occurence ofFrequency

1Magnitude

88

Return PeriodRandom variable:Threshold level:Extreme event occurs if: Recurrence interval: Return Period:

Average recurrence interval between events equaling or exceeding a threshold

If p is the probability of occurrence of an extreme event, then

or

TxX

Tx

X

TxX of ocurrencesbetween Time

)(E

pTE

1)(

TxXP T

1)(

89

More on return periodIf p is probability of success, then (1-p) is the

probability of failureFind probability that (X ≥ xT) at least once in N

years.

NN

T

TT

T

T

TpyearsNinonceleastatxXP

yearsNallxXPyearsNinonceleastatxXP

pxXP

xXPp

111)1(1)(

)(1)(

)1()(

)(

90

Frequency FactorsPrevious example only works if distribution is

invertible, many are not.Once a distribution has been selected and its

parameters estimated, then how do we use it?Chow proposed using:

where

sKxx TT

deviationstandardSample

meanSample

periodReturn

factorFrequency

magnitudeeventEstimated

s

x

T

K

x

T

T

x

fX(x)

sKT

x

91

Return period exampleDataset – annual maximum discharge for 106 years

on Colorado River near Austin

0

100

200

300

400

500

600

1905 1908 1918 1927 1938 1948 1958 1968 1978 1988 1998

Year

An

nu

al M

ax F

low

(10

3 c

fs)

xT = 200,000 cfs

No. of occurrences = 3

2 recurrence intervals in 106 years

T = 106/2 = 53 years

If xT = 100, 000 cfs

7 recurrence intervals

T = 106/7 = 15.2 yrsP( X ≥ 100,000 cfs at least once in the next 5 years) = 1- (1-1/15.2)5 = 0.29

92

Data series

0

100

200

300

400

500

600

1905 1908 1918 1927 1938 1948 1958 1968 1978 1988 1998

Year

An

nu

al M

ax F

low

(10

3 c

fs)

Considering annual maximum series, T for 200,000 cfs = 53 years.

The annual maximum flow for 1935 is 481 cfs. The annual maximum data series probably excluded some flows that are greater than 200 cfs and less than 481 cfs

Will the T change if we consider monthly maximum series or weekly maximum series?

93

Hydrologic data series

• Complete duration series– All the data available

• Partial duration series– Magnitude greater than base value

• Annual exceedance series– Partial duration series with # of

values = # years• Extreme value series

– Includes largest or smallest values in equal intervals• Annual series: interval = 1 year• Annual maximum series: largest

values• Annual minimum series : smallest

values

Clima y estimación de valores extremos