Analisis de Consistencia II Capitulo

64
ANÁLISIS DE CONSISTENCIA(DATA-HIDROMETEROLOGICA) El hidrólogo o especialista que desea desarrollar un estudio hidrológico, debe buscar la información de la cuenca en estudio, en las instituciones encargadas de su recopilación (Senamhi), pero una vez que ésta se ha obtenido, una de las interrogantes que se debe hacer es: ¿Es confiable la información disponible? La respuesta a esta pregunta, se obtiene realizando un análisis de consistencia de la información disponible, mediante criterios físicos y métodos estadísticos que permitan identificar, evaluar y eliminar los posibles errores sistemáticos que han podido ocurrir, sea por causas naturales u ocasionados por la intervención de la mano del hombre. La no homogeneidad e inconsistencia, son los causales del cambio a que están expuestas las informaciones hidrológicas, por lo cual su estudio, es de mucha importancia para determinar los errores sistemáticos que puedan afectarlas. Inconsistencia es sinónimo de error sistemático y se presenta como saltos y tendencias, y no homogeneidad es definido como los cambios de datos vírgenes con el tiempo. La no homogeneidad en una serie de tiempo hidrológica, se debe a factores humanos (tala indiscriminada de una cuenca, construcción de estructuras hidráulicas, etc.) o a factores naturales de gran significancia, como los desastres naturales (inundaciones, derrumbes, terremotos, huracanes, etc.)

Transcript of Analisis de Consistencia II Capitulo

Page 1: Analisis de Consistencia II Capitulo

ANÁLISIS DE CONSISTENCIA(DATA-HIDROMETEROLOGICA)

El hidrólogo o especialista que desea desarrollar un estudio hidrológico, debe

buscar la información de la cuenca en estudio, en las instituciones encargadas de su recopilación

(Senamhi), pero una vez que ésta se ha obtenido, una de las interrogantes que se debe hacer es:

¿Es confiable la información disponible?

La respuesta a esta pregunta, se obtiene realizando un análisis de consistencia de la

información disponible, mediante criterios físicos y métodos estadísticos que permitan identificar,

evaluar y eliminar los posibles errores sistemáticos que han podido ocurrir, sea por causas

naturales u ocasionados por la intervención de la mano del hombre.

La no homogeneidad e inconsistencia, son los causales del cambio a que están expuestas

las informaciones hidrológicas, por lo cual su estudio, es de mucha importancia para determinar

los errores sistemáticos que puedan afectarlas.

Inconsistencia es sinónimo de error sistemático y se presenta como saltos y

tendencias, y no homogeneidad es definido como los cambios de datos vírgenes

con el tiempo.

La no homogeneidad en una serie de tiempo hidrológica, se debe a factores humanos (tala

indiscriminada de una cuenca, construcción de estructuras hidráulicas, etc.) o a factores

naturales de gran significancia, como los desastres naturales (inundaciones, derrumbes,

terremotos, huracanes, etc.)

Page 2: Analisis de Consistencia II Capitulo

Esta inconsistencia y no homogeneidad se pone de manifiesto con la presencia de saltos y/o tendencias

en las series hidrológicas (las cuales se muestran en las figuras 8.1 y 8.2 ), afectando las características

estadísticas de dichas series, tales como la media, desviación estándar y correlación serial.

PRIMER PASO ES HACER UNA GRAFICA. SE CALCULA LA MEDIA Y LA DESVIACION ESTANDAR

Es corregir los

datos que no son

inexistentes o que

no existen.

Page 3: Analisis de Consistencia II Capitulo

El análisis de consistencia de la información hidrológica, se realiza mediante los siguientes

procesos: 1) Análisis visual gráfico 2) Análisis doble masa y 3) Análisis estadístico

ANÁLISIS VISUAL GRAFICO

En coordenadas cartesianas se plotea la información hidrológica histórica, ubicándose en las

ordenadas, los valores de la serie y en las abscisas el tiempo (años , meses , días , etc.).

Un ejemplo de una serie de caudales promedio anuales se muestra en la figura 8.3. Este gráfico

sirve para analizar la consistencia información hidrológica en forma visual, e indicar el período o

períodos en los cuales la información es dudosa, lo cual se puede reflejar como “picos” muy altos

o valores muy bajos, saltos y/o tendencias, los mismos que deberán comprobarse, si son

fenómenos naturales que efectivamente han ocurrido, o si son producto errores

sistemáticos.

Figura 8.3 Serie

histórica de caudales

máximas extremas

anuales (Río Piura)

En 1998 se presentó el

fenómeno del niño, por

ello se ve un salto. Los

nuevos puentes de

Piura son diseñados

con esta caudal de 4500

mm3

Page 4: Analisis de Consistencia II Capitulo

Para conocer la causa del fenómeno detectado, se puede analizar de diversas

formas:

1. Cuando se tienen estaciones vecinas, se comparan los gráficos de las series

históricas, y se observa cuál período varía notoriamente uno con respecto al

otro.

2. Cuando se tiene una sola estación, ésta se divide en varios periodos y se

compara con la información de campo obtenida.

Cuando no se

tiene datos en

un determinado

lugar, se lleva

información de

otro lugar por el

parámetro

altitud media

Page 5: Analisis de Consistencia II Capitulo

Estacion Chamis: precipitacion (mm)

Aforador Ronquillo: nivel del agua (m)13:45

11:00

3. Cuando se tienen datos de precipitación y escorrentía (caudal), se comparan los

diagramas, los cuales deben ser similares en su comportamiento.

La interpretación de estas comparaciones, se efectúa conjuntamente con el análisis doble masa. C

Page 6: Analisis de Consistencia II Capitulo

Ejemplo Nº 1:

Dada la serie de caudales promedios de la estación del río Bebedero, que se muestra en la tabla 8.1, elaborar

el hidrograma.

Caudales promedios anuales en m3/s del río Bebedero, período 1954-1993.

Page 7: Analisis de Consistencia II Capitulo

Solución:Graficando los pares de valores se obtiene la figura 8.4, en la cual, en el eje de la abscisas se coloca el tiempo en años, y en el

eje de ordenadas el caudal en m3/s.

Realizando el análisis visual de la serie histórica, se observa que partir del año 1979 se produce un

salto, esto se explica físicamente ya que en ese año existe un trasvase al río Bebedero, al entrar operar

el proyecto hidroeléctrico Arenal-Tempisque.

S

A

L

T

O

Page 8: Analisis de Consistencia II Capitulo

ANÁLISIS DOBLE MASA

Este análisis se utiliza para tener una cierta confiabilidad en la información, así como también, para analizar la consistencia en

relacionado a errores, que pueden producirse durante la obtención de los mismos, y no para una corrección a partir de la recta

doble masa

El diagrama doble masa se obtiene ploteando en el eje de las abscisas los acumulados, por ejemplo, de los promedios de los

volúmenes anuales en millones de m3(MM), de todas las estaciones de la cuenca y, en el eje de las ordenadas los acumulados

de los volúmenes anuales, en millones de m3, de cada una de las estaciones en estudio, como se muestra en la figura 8.5.

Figura 8.5 Análisis doble masa para determinar la estación base

En otro lugar identifico las

estaciones y luego grafico en

el eje x los acumulados de

los promedios de las tres

datas, y en el eje y grafico el

acumulado de las tres

estaciones. La estación más

confiable, es la que tiene

menos quiebres. En base a

esta estación se corrige las

otras, en eje x grafico los

datos de la estación madre y

en eje y grafico los datos de

la estación a corregir.

Page 9: Analisis de Consistencia II Capitulo

De estos doble masas se selecciona como la estación más confiable, la que presenta el menor número de

quiebres, en el ejemplo de la figura 8.5, corresponde a la estación C, la cual se usa como estación base

para el nuevo diagrama doble masa, es decir, se vuelve a construir el diagrama de doble masa colocando

en el eje de las abscisas la estación base y en el de las ordenadas la estación en estudio, como se muestra en

la figura 8.6.

Figura 8.6 Análisis doble masa para obtener los períodos de estudio (en este caso n1,

n2, n3)

Page 10: Analisis de Consistencia II Capitulo

El análisis doble masa propiamente dicho, consiste en conocer mediante los “quiebres” que se presentan

en los diagramas, las causas de los fenómenos naturales, o si estos han sido ocasionados por errores

sistemáticos.

En este último caso, permite determinar el rango de los periodos dudosos y confiables para cada estación en

estudio, la cual se deberá corregir utilizando ciertos criterios estadísticos. Para el caso de la figura 8.6, el

análisis de doble masa, permite obtener los períodos, n1, n2, n3, que deben estudiarse, con el análisis

estadístico.

ANÁLISIS ESTADÍSTICO. En este tipo de análisis, el análisis de doble masa no

siempre se cumple

Después de obtener de los gráficos construidos para el análisis visual y de los de doble masa, los períodos de

posible corrección, y los períodos de datos que se mantendrán con sus valores originales, se procede al

análisis estadístico de saltos, tanto en la media como en la desviación estándar.

Del grupo 1 calculo su media y su desviación estándar, igual del grupo 2

Page 11: Analisis de Consistencia II Capitulo

Análisis de Saltos

1. Consistencia de la MediaEl análisis estadístico consiste en probar, mediante la prueba t (prueba de hipótesis), si los valores medios

de las submuestras, son estadísticamente iguales o diferentes con una probabilidad del 95% o

con 5% de nivel de significación, de la siguiente manera:

a) Cálculo de la media y de la desviación estándar para las submuestras, según:

Page 12: Analisis de Consistencia II Capitulo

b) Cálculo del (tc) calculado según:

Page 13: Analisis de Consistencia II Capitulo

c) Cálculo del t tabular tt:

El valor crítico de t se obtiene de la tabla t de Student (tabla A.5 del apéndice), con una

probabilidad al 95%, ó con un nivel de significación del 5%, es decir con α/2 = 0.025 y con

grados de libertad y = n1 + n2 - 2.

Se trabaja con el 95% de

ocurrencia y el 5% de nivel

de significación

Page 14: Analisis de Consistencia II Capitulo

2. Consistencia de la Desviación Estándar

El análisis estadístico consiste en probar, mediante la prueba F, si los valores de las desviaciones estándar de

las submuestras son estadísticamente iguales o diferentes, con un 95% de probabilidad o con un 5% de nivel

de significación, de la siguiente forma:

a) Cálculo de las varianzas de ambos períodos:

Page 15: Analisis de Consistencia II Capitulo

c) Cálculo del F tabular (valor crítico de F ó Ft), se obtiene de las tablas F (tabla A.4) para una

probabilidad del 95%, es decir, con un nivel de significación = 0.05 y grados de libertad:

donde:

G.L.N = granos de libertad del numerador

G.L.D = grados de libertad del denominador

Page 16: Analisis de Consistencia II Capitulo

Corrección de los datos

En los casos en que los parámetros media y desviación estándar de las submuestras de las series de tiempo,

resultan estadísticamente iguales, la información original no se corrige, por ser consistente con 95% de

probabilidad, aun cuando en el doble masa se observe pequeños quiebres. En caso contrario, se corrigen los

valores de las submuestras mediante las siguientes ecuaciones:

La ecuación (8.7), se utiliza cuando se deben corregir los valores de la submuestra de tamaño

n1, y la ecuación (8.8), si se deben corregir la submuestra de tamaño n2.

Page 17: Analisis de Consistencia II Capitulo

Análisis de Tendencias

Antes de realizar el análisis de tendencias, se realiza el análisis de saltos y con la serie libre de saltos,

se procede a analizar las tendencias en la media y en la desviación estándar.

1. Tendencia en la Media

La tendencia en la media Tm, puede ser expresada en forma general por la ecuación polinomial:

Page 18: Analisis de Consistencia II Capitulo

Los parámetros de regresión de estas ecuaciones, pueden ser estimados por el método de

mínimos cuadrados, o por el método de regresión lineal múltiple.

El cálculo de la tendencia en la media, haciendo uso de la ecuación (8.10), se realiza

mediante el siguiente proceso:

a. Cálculo de los parámetros de la ecuación de simple regresión lineal.

Page 19: Analisis de Consistencia II Capitulo
Page 20: Analisis de Consistencia II Capitulo

b. Evaluación de la tendencia Tm

Para averiguar si la tendencia es significativa, se analiza el coeficiente de regresión Bm o también el

coeficiente de correlación R.

El análisis de R según el estadístico 1, es como sigue:

1. Cálculo del estadístico t según:

donde:

tc= valor del estadístico t calculado.

n = número total de datos

R = coeficiente de correlación

2. Cálculo de tEl valor crítico de t, se obtiene de la tabla de t de Student (tabla A.5 del apéndice), con 95% de

probabilidad o con un nivel de significación del 5 %, es decir:

Page 21: Analisis de Consistencia II Capitulo

c. Corrección de la información:

La tendencia en la media se elimina haciendo uso de la ecuación:

Page 22: Analisis de Consistencia II Capitulo

donde Tm es el promedio de la tendencia en la media o promedio de los valores corregidos

de saltos.

2. Tendencia en la desviación estándar

“La tendencia en la desviación estándar, generalmente se presenta en los datos semanales o

mensuales, no así en datos anuales”. Por lo que, cuando se trabajan con datos anuales, no hay

necesidad de realizar el análisis de la tendencia en la desviación estándar.

La tendencia en la desviación estándar Ts, se expresa en forma general por la ecuación polinomial.

Para calcular y probar si la tendencia en la desviación estándar es significativa, se sigue el siguiente proceso:

Page 23: Analisis de Consistencia II Capitulo

a. La información ya sin tendencia en la media Yt, se divide en períodos de datos anuales.

b. Se calcula las desviaciones estándar para cada período de toda la información:

c. Se calculan los parámetros de la ecuación (8.19), a partir de las desviaciones

estándar anuales y el tiempo t (en años), utilizando las ecuaciones de la (8.11) a

la (8.14), dadas para la tendencia en la media.

d. Se realiza la evaluación de Ts siguiendo el mismo proceso descrito para Tm.

Si en la prueba R resulta significativo, la tendencia en la desviación estándar es

significativa, por lo que se debe eliminar de la serie, aplicando la siguiente ecuación:

Page 24: Analisis de Consistencia II Capitulo

donde: Zt = serie sin tendencia en la media ni en la desviación estándar. Las demás variables han sido

definidas en párrafos anteriores.

Para que el proceso preserve la media y la desviación estándar constante. la ecuación toma la forma:

La serie Z es una serie homogénea y consistente al 95% de probabilidad.

Page 25: Analisis de Consistencia II Capitulo

Ejemplo 1:

Con el registro de volúmenes anuales de caudales en MM3, que se muestra en la tabla 8.2, se realizó el

análisis de doble masa, y se obtuvo un quiebre que permitió separar los datos en los períodos 1964-1985 y

1986-1999.

Realizar el análisis estadístico de saltos en la media y desviación estándar para ambos períodos. Si obtiene

diferencia significativa (al 95 % de probabilidad), realizar la corrección del primer período.

Tabla 8.2 Volúmenes anuales de caudales en MM3

Page 26: Analisis de Consistencia II Capitulo

Solución:

Page 27: Analisis de Consistencia II Capitulo
Page 28: Analisis de Consistencia II Capitulo

2. Cálculo del t tabular t:

El valor crítico de t se obtiene de la tabla A.5 del apéndice, con una probabilidad al ó con un nivel de significación del

5%, es decir con α/2 = 0.025 y con grados de libertad y = 22 + 14-2 = 34. Para estos valores, se tiene: tt= 1.960

3. Criterio de decisión

• Evaluación de la consistencia en la desviación estándar

1. Cálculo de Fc

De la ecuación (8.6), se tiene:

Sustituyendo valores, resulta:

Page 29: Analisis de Consistencia II Capitulo
Page 30: Analisis de Consistencia II Capitulo
Page 31: Analisis de Consistencia II Capitulo

PRACTICA DIRIGIDA (PRESENTACION 17 DE MAYO)

Análisis de saltos

Dada la información de las tablas 8.4 y 8.5, serie de caudales anuales.

1. Completar el dato faltante para el año 1955 de la tabla 8.4, haciendo la correlación de los

datos de la tabla 8.4 y 8.5 para los años comunes.

2. Graficar la serie histórica de la tabla 8.4, hacer un análisis visual e indicar si se presenta un

salto.

3. Para estar seguro de que se presenta salto, con los datos de las tablas 8.4 y 8.5 realizar el análisis

de doble masa, considerando como estación base los datos de la tabla 8.5.

Page 32: Analisis de Consistencia II Capitulo

Tabla 8.4 Serie histórica de caudales medios anuales, en m3/s, del río Chancay-

Huaral, estación Santo Domingo, Perú (1939 - 1981)

Page 33: Analisis de Consistencia II Capitulo

Proceso:

• Acumular los valores de los caudales.

• Graficar el diagrama de doble masa.

Page 34: Analisis de Consistencia II Capitulo

Tabla 8.5 Serie histórica de caudales medios anuales, en m3/s, del río

Jequetepeque, estación Ventanilla, Perú (1939 - 1980)

• Observar los quiebres que se presentan.

• Con base en los quiebres que se presentan, separar los períodos de los años donde posiblemente

se presentan los saltos.

Page 35: Analisis de Consistencia II Capitulo

4. Realizar el análisis estadístico de saltos y las correcciones de los datos si fuera el caso, para períodos

obtenidos del análisis de doble masa.

Para este análisis de saltos debe realizar:

• Consistencia de la media

• Consistencia en las desviación estándar

• Corrección de los datos

5. Graficar nuevamente la serie una vez corregida, con líneas punteadas.

Notas:

Si del análisis de doble masa obtiene:

• Solo dos períodos, siga la metodología indicada

• Tres ó más períodos, tomar los dos primeros períodos y aplicar la metodología indicada, luego

considerando éstos 2 períodos como uno solo y el 3er período, aplicar la metodología indicada, y así

sucesivamente.

Page 36: Analisis de Consistencia II Capitulo

2. Análisis de tendencias

Dada la información de la tabla 8.6, serie de caudales anuales.

1. Graficar los datos de esta serie, observe visualmente e indique si se presenta tendencia.

2. Realizar el análisis estadístico de tendencias y las correcciones de los datos si fuera el caso.

Debe realizar solo el análisis de tendencia en la media (para datos anuales no se presenta

tendencia en la desviación estándar).

3. Graficar la serie corregida.

Page 37: Analisis de Consistencia II Capitulo

Tabla 8.6 Serie histórica de caudales medios anuales, en m3/s, del río

Chicama, estación Salmar, Perú (1911 - 1980)

Page 38: Analisis de Consistencia II Capitulo

COMPLETACIÓN Y EXTENSIÓN DE DATOS

HIDROMETEREOLÓGICOS

La completación y extensión de series es uno de los problemas más comunes de

la hidrología. El uso de una estación cercana puede ser ventajoso para estos fines.

La extensión de series cortas es uno de los aspectos más importantes, puesto que

se modifican sustancialmente los estadísticos muestrales, acercándose a sus

equivalentes poblacionales. A sí por ejemplo, la media de una serie corta es

totalmente diferente a la media de la serie larga y de la misma manera se

pueden comparar todos los otros estadísticos de la serie histórica.

METODOLOGÍAS

Existen varios procedimientos para efectuar la completación y extensión de datos

hidrometereológicos mediante la aplicación de técnicas estadísticas y

matemáticas. En todos los casos, debe analizarse profundamente la

confiabilidad de la técnica o metodología utilizada por las siguientes razones:

Page 39: Analisis de Consistencia II Capitulo

a). El aumentar la longitud de un registro implica disminuir el error estándar

en la estimación de parámetros ya que si la serie tiende al infinito el

estimador se aproxima más al parámetro poblacional.

b). Si la técnica es inadecuada, lejos de mejorar los estadísticos los empeora.

En este caso es preferible quedarse con los registros cortos.

Los modelos de regresión simple y múltiple son muy usados en

hidrología para transferir información desde uno o varios puntos a otra

estación de registro con datos faltantes y/o de serie corta.

La completación y la extensión de series históricas se realiza con datos

consistentes es decir, después de haber analizado la confiabilidad de las muestras.

Dicho en otras palabras, para esta etapa de completación y/o extensión, la

muestra debe estar libre de saltos y de tendencias

Page 40: Analisis de Consistencia II Capitulo

TIPOS DE CORRELACIÓN

Las técnicas que se utilizan para la completación, en orden de prioridad son:

Regresión lineal simple, entre éstas:

Correlación cruzada entre dos o más estaciones situación (1) sin desfase ver figura

Autocorrección situación ( 2) ver figura

Relleno con criterios prácticos.

Para la extensión se usan modelos de:

Regresión lineal simple y la regresión lineal múltiple

Page 41: Analisis de Consistencia II Capitulo

(1) Correlación cruzada sin desfase (correlación espacial)

(2) Correlación serial con desfase (correlación temporal o autocorrelación)

(3) Correlación cruzada con desfase (correlación espacial y temporal)

SERIE HISTÓRICA DE CAUDALES DE LAS CUENCAS A Y B

Page 42: Analisis de Consistencia II Capitulo

a) La correlación cruzada o simplemente correlación, es la relación entre variables

correspondientes a dos estaciones vecinas. Puede ser correlación en el espacio, sin

desfase en el tiempo.

Est. A: Y1, Y2, Y3,…., Yn

Est. B: X1, X2, X3,…., Xn

En este caso se correlacionan datos de diferentes estaciones, resultando “n”

pares correlacionados.

La correlación cruzada también se establece con desface en el tiempo.

Est. A: Y1, Y2, Y3,…., Yn

Est. B: X1, X2, X3,…., Xn

En general, en ese caso resultan “n-k” pares correlacionados: donde k es el

desfase en el tiempo. Esta correlación implica una pérdida de la información

disponible en “k” datos.

Page 43: Analisis de Consistencia II Capitulo

b) Auto correlación: Llamada también correlación seriada o serial, consiste en

correlacionar datos correspondientes al registro de una misma muestra

hidrometereológica, considerando un desfase “k” en el tiempo.

Est. A: Y1, Y2, Y3,…., Yn

Est. B: Y1, Y2, Y3,…., Yn (para k=1)

En esta relación resulta “n-k” pares correlacionados, perdiéndose también parte de la

información equivalente a “k” datos de la serie.

K=1 el coeficiente de auto correlación es de 1º orden.

K=2 El coeficiente de auto correlación es de 2º orden.

En ingeniería hidrológica sólo se puede encontrar autocorrelaciones hasta de

segundo orden

Page 44: Analisis de Consistencia II Capitulo

ANÁLISIS DE REGRESIÓN Y CORRELACIÓN

Frecuentemente es necesario investigar posibles relaciones (de

causalidad o de interdependencía) entre dos o más variables, tal relación,

en caso de existir deberá ser estudiada a través de los análisis

estadísticos de regresión y correlación

Estos análisis constituyen una de las herramientas estadísticas más

antiguas usadas en hidrología. Primeramente fueron utilizadas para

estimar datos faltantes y ampliar el registro de corta extensión, de

una cierta estación climatológica o hidrométrica, en base a la

información disponible en las estaciones cercanas.

Hoy en día, sus aplicaciones incluyen además, el estudio de las

relaciones entre dos o más variables hidrológicas y la investigación

de la dependencia entre los eventos sucesivos de una serie

cronológica de datos hidrológicos.

Page 45: Analisis de Consistencia II Capitulo

La diferencia entre regresión y correlación es bastante clara. La

regresión permite obtener la ecuación matemática que expresa la

variable dependiente (y), cuando otra u otras variables, llamadas

independientes (x), se suponen conocidas y por lo tanto, permite

calcular valores de 'y' a partir de los de 'x'.

En cambio, por medio de la correlación, se calcula el grado de

dependencia o asociación entre dos o más variables, representado

numéricamente por el llamado Coeficiente de Correlación.

Una gráfica en la que se indican los valores muestrales dibujados sobre

un plano xy, se denomina: Diagrama de Dispersión.

En base a tal diagrama se podrá detectar si los valores siguen un modelo

LINEAL o no NO LINEAL, es decir; si los puntos se aproximan a una

línea recta o a una curva, como se ilustra en la figura siguiente.

Page 46: Analisis de Consistencia II Capitulo

La ecuación matemática (regresión) de la relación o modelo lineal entre

dos series de valores, se representa por medio de un polinomio de grado

uno, en cambio, una relación no lineal se reproduce matemáticamente

mediante un polinomio de grado superior.

Page 47: Analisis de Consistencia II Capitulo

regresión lineal de dos variables: y = a0 + a1 x

regresión lineal múltiple: y = a0 + a1 x1 +… + an xn

El diagrama de dispersión, además de ayudar a definir el modelo a

utilizar (lineal o no lineal), permite detectar los valores (parejas de datos)

que se apartan de la NUBE DE PUNTOS y que al ser eliminados del

análisis de regresión, mejoran el ajuste de la recta o curva, de manera que

se eleva la correlación entre las dos variables.

El número de puntos que se considera permisible eliminar, depende de

muchos factores como son: forma de la nube de puntos, número de

puntos o parejas, naturaleza de los datos, etc. sin embargo, se puede

aceptar en una primera aproximación que el 10% del número total de

puntos se pueden eliminar para mejorar el ajuste.

Page 48: Analisis de Consistencia II Capitulo

Para evitar el juicio o criterio particular en el ajuste de un

modelo de regresión a unos datos, es necesario obtener una

definición rígida de la “recta o curva de mejor ajuste”.

Al obtener la ecuación de la recta de regresión por la técnica

de los mínimos cuadrados, se presentan tres casos, según como

se mida la distancia de cada punto a la recta.

Esto se logra a través de la técnica de los Mínimos Cuadrados, la

cual indica que de todas las rectas o curvas que representan a

una nube de puntos, la que tiene una suma mínima de los

cuadrados de las distancias de cada punto a tal recta o curva,

es la del mejor ajuste.

Page 49: Analisis de Consistencia II Capitulo

•Perpendicular a la recta, se llama ortogonal.

•Paralelamente al eje de las ordenadas, se llama de y sobre x.

•Paralelamente al eje de las abscisas, se llama de x sobre y.

Page 50: Analisis de Consistencia II Capitulo

CORRELACIÓN Y COEFICIENTE DE CORRELACIÓN LINEAL

Se llama correlación PERFECTA de dos variables x e y, cuando

todos los puntos que representan las parejas de datos caen sobre la

recta de regresión.

Si por el contrario, los puntos no están alineados sino dispersos, la

correlación es NULA.

Por otra parte, si la variable y aumenta a medida que x aumenta, x e

y presentan correlación POSITIVA o DIRECTA. Si y disminuye a

medida que x aumenta, x e y tienen correlación NEGATIVA o

INVERSA. Los tipos de correlación se ilustran en la figura siguiente.

Page 51: Analisis de Consistencia II Capitulo
Page 52: Analisis de Consistencia II Capitulo

ECUACIÓN DE REGRESIÓN LINEAL SIMPLE (RLS): La ecuación de RLS se

expresa de la siguiente manera:

Yi=a+bXi modelo matemático.

Yi=a+bXi+Ei modelo estadístico.

Yi= variable aleatoria dependiente.

Xi= Variable aleatoria independiente.

Ei= Residuo que queda de la variable “y” que no ha sido considerado en “x”.

Su existencia se debe a que las muestras son el azar y a efectos de otras

variables.

a,b, son los parámetros de la ecuación que se calculan a partir de la muestra.

Estimación de Parámetros del Modelo: Utilizando el método de mínimos cuadrados

para la estimación de los parámetros de la ecuación de RLS, se llega a las siguientes

expresiones:

Page 53: Analisis de Consistencia II Capitulo

XbYa

2)(

))((

XXi

XXiYYib

SySx

yXXY

Sy

SxbR

*

**

2/1

2)

1

2(

R

nRTc

El estadístico Tc está dado por:

Ecuación Nº 09

Ecuación Nº 10

Ecuación Nº 11

Prueba de grado de Asociación de las variables

Ecuación Nº 12

Page 54: Analisis de Consistencia II Capitulo

%)5(0:

%)5(0:

RHA

RHP

El Tt tabular se determina con (n-2) grados de libertad y α =0.05

Las hipótesis de prueba son:

Los criterios de decisión son.

HAAceptarTcTc

HPAceptarTtTc

%)95(

%)95(

(Las variables no están asociadas)

(Las variables están asociadas)

En la primera condición, las variables no están correlacionadas estadísticamente por

tanto tal función no puede emplearse para completar o extender la serie de la variable

dependiente estudiada.

La segunda condición en cambio, mucho más si se trata de una prueba altamente

significativa, implica que las variables analizadas están correlacionadas y entonces

dicha función puede emplearse para completar y extender la serie de la variable

dependiente.

Page 55: Analisis de Consistencia II Capitulo

SEGUNDO TRABAJO ESCALONADO

Realizar el análisis de consistencia (Visual grafico, análisis de doble masa y

el análisis estadístico), considerando como estación base a la estación

Weberbauer (precipitaciones anuales en mm. desde 1964 al 1991)

Corregir y completar los datos faltantes de la estación denominada Chetilla,

(precipitaciones anuales en mm. desde 1964 al 1991)

Procesar, analizar e interpretar los datos obtenidos.

FECHA DE PRESENTACIÓN:

ANÁLISIS DE CONSISTENCIA, Y COMPLETACIÓN DE DATOS

Page 56: Analisis de Consistencia II Capitulo

ESTACION CONFIABLE WEBERBAWER

AÑO ENERO FEBRERO MARZO ABRIL MAYO JUNIO JULIO AGOSTO SEPTIEMBRE OCTUBRE NOVIEMBRE DICIEMBRE

1964 30.30 50.40 357.30 56.20 12.30 6.60 1.60 23.80 12.60 52.60 58.80 115.20

1965 121.10 81.40 121.10 41.70 12.10 11.10 2.90 28.00 13.40 98.00 40.70 34.40

1966 62.70 45.90 54.50 41.90 44.00 0.00 7.50 0.70 13.10 76.80 62.70 18.70

1967 120.90 139.50 109.10 32.30 44.10 3.90 28.40 5.80 24.90 101.00 17.80 36.70

1968 58.00 81.00 67.70 26.20 14.90 1.60 1.60 16.20 50.00 66.40 54.60 70.80

1969 42.00 73.70 83.50 85.70 1.50 19.60 0.30 7.80 18.40 73.80 106.40 162.00

1970 71.00 41.80 79.90 54.50 33.80 19.90 3.20 2.50 18.20 103.00 51.50 54.10

1971 58.40 97.80 275.70 54.70 8.00 12.20 17.60 17.20 28.10 89.80 45.80 66.50

1972 55.50 67.60 11.80 76.20 18.10 4.40 3.40 20.60 31.90 31.40 66.50 50.20

1973 95.30 70.70 91.60 98.40 27.90 28.70 8.40 19.30 87.20 5.50 68.20 72.30

1974 76.80 128.20 95.20 58.50 4.60 17.30 6.50 26.40 39.70 71.00 55.10 84.60

1975 137.60 181.80 238.50 70.70 66.80 10.00 7.20 19.30 45.10 80.20 65.10 0.90

1976 130.40 62.90 81.30 55.20 43.00 23.00 0.10 4.40 12.30 32.20 71.60 44.40

1977 129.90 146.40 141.90 42.60 25.50 8.00 7.50 0.10 16.10 53.40 54.80 68.20

1978 12.70 34.40 48.80 37.00 65.60 3.90 4.40 3.80 25.00 24.40 54.00 44.80

1979 84.10 81.60 159.70 37.10 16.30 1.80 7.50 15.70 33.60 24.40 26.30 46.60

1980 34.90 42.40 65.00 29.30 6.90 15.10 3.20 6.70 2.30 130.40 111.00 106.70

1981 78.20 186.50 105.70 33.70 14.70 6.60 7.20 12.70 22.00 111.90 45.60 111.30

1982 71.80 102.90 75.70 88.70 38.20 7.80 2.10 6.60 43.90 124.80 67.30 87.40

1983 116.60 75.70 152.80 105.70 31.10 10.10 9.60 2.70 19.20 86.90 28.10 118.40

1984 24.70 233.60 123.80 80.00 69.50 25.10 23.40 18.70 36.70 68.60 97.60 104.10

1985 24.60 42.40 37.20 41.90 53.00 0.40 4.80 18.30 37.30 50.00 23.90 40.30

1986 84.40 47.70 96.80 120.20 16.00 0.60 1.20 14.60 1.30 43.60 66.20 51.80

1987 98.00 95.20 39.20 52.20 11.20 4.00 10.80 12.30 39.50 37.20 74.30 61.50

1988 109.70 105.50 44.80 95.60 10.60 5.40 0.00 0.40 32.90 69.40 65.20 63.40

1989 87.00 158.80 113.50 85.40 18.80 16.70 3.20 5.90 53.50 106.60 47.10 2.70

1990 101.00 95.30 101.80 62.00 28.00 10.70 6.80 10.30 28.70 73.30 61.20 64.20

1991 43.80 90.00 133.70 55.20 17.90 0.70 0.40 0.30 10.20 28.20 55.10 71.90

Page 57: Analisis de Consistencia II Capitulo

ESTACIÓN CHETILLA CON DATOS FALTANTES Y SIN CORREGIRLOS

AÑOS ENERO FEBRERO MARZO ABRIL MAYO JUNIO JULIO AGOSTO SEPTIEMBRE OCTUBRE NOVIEMBRE DICIEMBRE

1964 101.20 134.30 115.30 84.00 31.50 15.40 10.20 8.70 36.90 35.30 71.70 67.20

1965 65.70 99.30 102.80 58.00 16.50 14.90 10.50 7.20 23.10 105.50 56.00 77.30

1966 98.50 102.90 82.80 59.80 21.50 4.00 2.90 5.80 29.40 80.20 85.60 76.80

1967

1968

1969

1970

1971 84.10 69.40 146.90 91.20 48.60 7.20 3.70 13.10 37.10 97.20 52.40 83.20

1972 65.90 42.00 94.80 40.20 19.40 8.40 4.70 16.70 20.90 50.00 71.00 60.80

1973 114.50 75.50 87.90 73.00 37.40 15.00 12.20 14.30 25.30 55.80 56.50 54.70

1974 110.40 113.40 84.60 71.90 33.20 10.80 10.60 16.30 26.50 41.80 55.60 53.10

1975 77.20 118.00 63.30 54.30 37.90 11.70 8.30 7.40 24.70 88.70 55.70 69.50

1976 74.20 81.40 68.00 50.50 13.30 6.70 10.80 2.20 19.80 34.70 22.20 57.30

1977 16.80 49.80 60.00 34.70 67.30 5.20 15.40 6.00 24.30 29.90 35.90 59.60

1978 50.00 108.80 145.50 41.20 24.80 1.60 12.50 18.90 35.20 6.40 29.70 41.80

1979 37.00 24.90 74.40 20.20 8.00 8.30 3.50 4.90 1.80 126.50 91.70 130.60

1980 69.20 206.20 109.70 46.30 25.00 8.40 8.90 15.80 22.70 95.80 29.90 97.10

1981 59.60 97.10 75.60 84.50 31.90 7.8 9.40 2.20 44.50 104.60 86.10 86.10

1982 93.00 69.40 181.90 91.70 39.40 10.70 11.10 8.90 16.90 77.30 49.20 89.30

1983 45.50 257.90 125.80 61.50 65.70 19.10 11.10 22.20 38.30 86.30 68.70 85.40

1984 15.80 50.30 37.80 49.90 56.90 1.80 1.10 13.00 45.60 33.30 16.50 41.70

1985 108.10 34.20 92.40 106.60 15.30 0.30 9.20 19.50 1.30 27.00 50.10 78.90

1986 145.00 82.20 38.70 58.30 9.40 9.10 17.20 14.90 38.60 36.90 58.70 60.60

1987 124.10 127.50 51.50 109.10 16.60 8.60 0.00 1.20 24.80 63.60 83.10 75.80

1988 62.40 176.50 156.20 114.20 27.60 26.40 0.50 3.80 53.50 110.90 28.00 84.50

1989 99.40 64.50 79.10 62.10 53.20 25.30 2.00 12.00 11.00 129.70 110.20 70.80

1990 65.60 88.00 189.70 99.40 3.60 1.60 0.40 1.30 41.50 22.20 55.00 64.20

1991 73.60 37.10 61.20 69.10 18.60 11.40 3.40 6.00 36.10 31.20 66.40 63.90

Page 58: Analisis de Consistencia II Capitulo
Page 59: Analisis de Consistencia II Capitulo
Page 60: Analisis de Consistencia II Capitulo
Page 61: Analisis de Consistencia II Capitulo
Page 62: Analisis de Consistencia II Capitulo
Page 63: Analisis de Consistencia II Capitulo

CONSISTENCIA EN LA MEDIA

Primero se escoge el tramo mayor y corrijo mediante análisis estadístico(media y desviación

estándar) Grupo de datos N1 , N2.

Con la prueba t-stundetns. Se calcula el t calculado mediante fórmulas y mediante tablas el t

tabular.

CONSISTENCIA EN LA DESVIACION ESTANDAR

Se calcula la prueba de Fisher.

ANALISIS DE TENDENCIA

Primero hacer análisis de saltos y luego utilizar la ecuación lineal. Luego calcular el t students.

Con el coeficiente de corrección, pero el t calculado se calcula con grados libertad n-2

TENDENCIA EN LA DESVIACION ESTANDAR.

Se hace cuando mi información es semanal o mensual, mas no anuales. Es parecida al anterior

con el método de mínimos cuadrados. El t calculado con media y desviación estándar. Si sale

negativo aplico valor absoluto. Con grados libertad entro a la tabla n numero de grados liberta y

busco la probabilidad en la campana de GAUS. Luego hago la prueba de Fisher y corrijo con la

ecuación lineal.

Libro de hidrología de máximo Villón.

Si en análisis de doble masa sale con tres quiebres o dos quiebres. Si sale el segundo seguimos con

la metodología. Si sale tres tomar los dos periodos como si fuera uno.

ANALISIS DE TENDENCIA

COMPLETACION Y EXTENCION DE DATOS

Page 64: Analisis de Consistencia II Capitulo

COMPLETACION Y EXTENCION DE DATOS

Hacer análisis de saltos y análisis de tendencias. Con datos del pasado hago la regresión lineal

En hidrología trabajamos con muestra(universo)