Modelación de la superficie piezometríca de un acuifero

33
RESUMEN La geoestadística provee herramientas que permiten al investigador recrear escenarios de interés a partir de predicciones soportadas en la obtención de parámetros extraídos de una muestra, en donde la variable es aleatoria, regionalizada y de naturaleza continua, aunque los fenómenos naturales son heterogéneos y anisotrópicos, la geoestadística aporta herramientas que corrigen esto efectos y hacen posible el manejo de los datos, en este sentido el modelado de fenómenos acapara la atención tanto de investigadores como de tomadores de decisiones, con el objetivo de obtener una representación tan real como sea posible de las variables en observación, es así como en el campo de la hidrogeología se requiere de técnica de este tipo, que permitan acceder a predicciones de eventos cuyo único soporte son algunos datos reales, y en consecuencia tener un dato estimativo con el cual sea posible identificar directrices para nuevas exploraciones. Artículo de MODELAMIENTO ESPACIAL DE LA SUPERCIE PIEZOMÉTRICA DE UN ACUÍFERO SOMERO DEL PIEDEMONTE, CASANARE-COLOMBIA SPATIAL MODELING OF SHALLOW AQUIFER PIEZOMETRIC SURFACE OF FOOTHILLS, CASANARE-COLOMBIA Janneth Eulalia Calderón Peña, Iván Fernando Cañón Celis, Cynthia Giselle López Parra Universidad Distrital Francisco José de Caldas, Bogotá- Colombia

description

Análisis geoestadístico de la superficie piezometríca de un acuifero en el departamento del Meta, Colombia

Transcript of Modelación de la superficie piezometríca de un acuifero

RESUMEN

La geoestadística provee herramientas que permiten al investigador recrear escenarios de interés a partir de predicciones soportadas en la obtención de parámetros extraídos de una muestra, en donde la variable es aleatoria, regionalizada y de naturaleza continua, aunque los fenómenos naturales son heterogéneos y anisotrópicos, la geoestadística aporta herramientas que corrigen esto efectos y hacen posible el manejo de los datos, en este sentido el modelado de fenómenos acapara la atención tanto de investigadores como de tomadores de decisiones, con el objetivo de obtener una representación tan real como sea posible de las variables en observación, es así como en el campo de la hidrogeología se requiere de técnica de este tipo, que permitan acceder a predicciones de eventos cuyo único soporte son algunos datos reales, y en consecuencia tener un dato estimativo con el cual sea posible identificar directrices para nuevas exploraciones.

Artículo de Investigación

MODELAMIENTO ESPACIAL DE LA SUPERCIE PIEZOMÉTRICA DE UN ACUÍFERO SOMERO DEL

PIEDEMONTE, CASANARE-COLOMBIASPATIAL MODELING OF SHALLOW AQUIFER PIEZOMETRIC

SURFACE OF FOOTHILLS, CASANARE-COLOMBIA

Janneth Eulalia Calderón Peña, Iván Fernando Cañón Celis, Cynthia Giselle López Parra

Universidad Distrital Francisco José de Caldas, Bogotá[email protected], [email protected], [email protected]

INTRODUCCIÓN

En la actualidad el agua subterránea aunque es un recurso poco explorado retoma cada vez mayor importancia debido a la variabilidad de las condiciones climáticas que afectan el balance hídrico, donde los periodos secos y húmedos han variado en intensidad y duración, repercutiendo directamente en la disponibilidad del recurso hídrico superficial. Adicionalmente, la continua contaminación a la que están sometidas las corrientes hídricas superficiales tiende a repercutir en la posibilidad de acceder a agua potable.

Es importante reconocer la participación del agua subterránea dentro del volumen de agua global; 94% del agua en el planeta es salada; 2% se encuentra en nieves perennes; menos del 0.1% es agua superficial distribuida en ríos, lagos, atmosfera, suelo y biosfera; y aproximadamente el 4% del agua dulce es subterránea (Carrillo, 2014)

Aunque Colombia es reconocida por su riqueza en fuentes hídricas, existen regiones como la Guajira y Los Llanos Orientales, cuyo acceso al recurso hídrico se fundamenta en fuentes subterráneas. Debido a que el conocimiento del sistema subterráneo es restringido y manejado de manera mayormente conceptual, el desarrollo del presente articulo pretende realizar la caracterización de los niveles piezométricos alrededor de un corredor en el piedemonte del departamento de Casanare en la cuenca de los Llanos

Orientales con el uso de técnicas de geoestadìstica para generar un modelo de predicción de las profundidades de los niveles de agua subterránea, que provea de criterios que posibiliten la selección de unidades de captación y que permitan realizar un diagnóstico del potencial de explotación del recurso hídrico para la zona.

La metodología utilizada para el desarrollo del estudio propuesto, consistió en el desarrollo de dos etapas: una etapa inicial de documentación sobre la teoría concerniente a la caracterización del comportamiento del agua subterránea, y una segunda etapa fundamentada por el análisis estadístico, para lo cual inicialmente se evaluaron los siguientes lineamientos:

Tipo de muestreo espacial Determinación de la naturaleza

de la variable Tipo de estacionariedad

Posteriormente se realizó el análisis geoestadístico, para lo cual se siguieron los procesos de análisis descriptivo y exploratorio de datos, el examen y comprobación de tendencias; y un análisis estructural que determinó la dependencia espacial de la variable descrito en el variograma empírico, que permitió la comparación con los modelos teóricos y su ajuste por medio de modelos de regresión y en análisis de sus residuales, a partir del modelo obtenido se busca realizar un mapa de predicción de los procesos espaciales en

los lugares donde no se tiene medición (Calder & Cressie, 2009).

AGUA SUBTERRÁNEA Y SISTEMA ACUÍFERO

SUBTERRÁNEO.

Se define como agua subterránea toda aquella que se encuentra almacenada en unidades denominadas acuíferos, entendidas como unidades de roca o sedimento que tienen la capacidad de almacenar agua en sus poros y/o fracturas y de trasmitirla (desde el punto vista de sus posibilidades de su utilización); el sistema subterráneo comprende además de los acuíferos, los acuitardos conformados por rocas o sedimentos que aunque presentan alta porosidad, la transferencia de agua se hace a velocidades muy inferiores con respecto a los acuíferos, lo que los hace incapaces de ser susceptibles a una utilización económica o ecológica concreta, (Iglesias López & Rodríguez,2013).

De acuerdo a la conformación del sistema subterráneo los acuíferos se clasifican en:

Libres: se trata de acuíferos en los que el nivel de agua se encentra por debajo del límite superior de la roca contenedora y su presión es igual a la presión atmosférica, y la cesión de agua se lleva a cabo por desaturación.

Confinado: son aquellos acuíferos que se encuentra cautivos entre capas impermeables, están saturados,

la presión que soportan es mayor que la atmosférica y por consiguiente el nivel de agua se encuentra por encima del límite superior de la unidad acuífera, la cesión de agua se lleva a cabo por descompresión.

Semi-confinados: son unidades que se encuentran rodeadas por unidades semipermeables que permiten el paso del agua de otros acuíferos.

El movimiento del agua en las formaciones está condicionado por la capacidad de realizar trabajo por sus partículas, en otras palabras depende de la energía. En condiciones naturales las clases de energía que inciden en el movimiento del agua son: la energía potencial (ecuación 1), energía cinética (ecuación 2), y energía de presión (ecuación 3):

Eh=m . g . Z (1)

Ec=12

m. v2 (2)

Ep=p . V (3)

Donde g es la intensidad del campo gravitatorio, m es la masa, Z altura con respecto a una referencia, v velocidad del agua, y p presión a la cual está sometido el fluido.

De acuerdo al principio de la conservación de la energía se tiene (ecuación 4):

E=m. g . Z+12

rm .v2+ pV =Cte (4)

La ecuación 4 bajo consideraciones como masa y gravedad constantes, se transforma en el teorema de Bernoiulli (ecuación 5):

Z+ v2

2g+ p

ρg=Cte. (5)

Donde ρ es la densidad del fluido. Teniendo en cuenta que el término de velocidad en el medio subterráneo puede ser despreciable comparado con las magnitudes de los términos de posición y presión, y que los términos tienen dimensiones de longitud; se tiene que la capacidad para realizar trabajo por parte del agua en un punto A se relaciona en la ecuación 6:

h=z+ pρg

(6)

En donde h es conocida como nivel piezométrico o carga hidráulica, y es constante en la vertical de un almacenamiento de agua libre o en la vertical de un medio permeable saturado cuando este es homogéneo e isotrópico. En palabras sencillas el nivel piezométrico en un punto de un acuífero, es la altura que alcanza el agua sobre una horizontal de referencia cuando el punto se libera a presión atmosférica.

La superficie piezométrica es el lugar geométrico de los puntos de igual nivel piezométrico dentro de la formación, el agua en la zona saturada se mueve de mayor a menor nivel, es decir, de mayor a menor energía.

La superficie piezométrica se define mediante líneas denominadas isopiezas, y son perpendiculares a las líneas de flujo que indican la dirección del movimiento, de esta manera el estudio de las superificies piezométricas permite obtener datos básicos sobre el movimiento del agua subterránea. Figura 1.

Figura 1. Tipos de acuíferos y forma de la superficie piezométrica, fuente Environment Canada, 2001

GEOESTADÍSTICA

Es una técnica desarrollada a partir de la necesidad de estudiar los fenómenos con correlación espacial, su principal interés es la estimación, predicción y simulación de dichos fenómenos (Myers, 1987), dentro de los precursores se encuentra los trabajos de Sichel (1947; 1949) y Krige (1951), posteriormente Matheron en 1962 formalizaría el estudio de estos métodos por profesionales El análisis geoestadístico tiene como pilares la determinación de la estructura de autocorrelación entre los datos y su uso en la predicción a través de técnicas como Kriging y Cokriging.

Aunque la geoestadística trabaja con datos espaciales, no todos los datos

espaciales son susceptibles de ser trabajados por esta área, por lo que se convierte en una tarea fundamental determinar la naturaleza de la variable y el comportamiento de la misma regionalizada, para lo cual se lleva a cabo un análisis exploratorio de datos donde se identifica la localización y se determina la variabilidad, forma y observaciones extremas.

Conceptos Básicos

1. Para la geoestadística las ubicaciones s provienen de un conjunto D continuo, son resultado de procesos estocásticos y son seleccionados de acuerdo a la necesidad del investigador. Un proceso estocástico se define como un conjunto de variables aleatorias.

2. Variable regionalizada es una variable medida en el espacio de forma que presente una estructura de correlación, es decir, es un proceso estocaśtico con dominio contenido en un espacio euclidiano d-dimensional.

3. Momentos de una variable regionalizada

Para cualquier n puntos x1 , x2 ,…, xn, el

vector aleatorio Z (x) =

[ Z ( x1 ) , Z ( x2 ) ,…, Z (xn)T ] está definido

por su función de distribución conjunta (ecuación 7):

F [ z1 , z2 , …, zn ]=P [ Z (x1)≤ x1 , Z (x2)≤ x2 ,…,Z (xn)≤ zn ] (7)

Los momentos univariados y bivariados se presentan en las ecuaciones 8 - 12.

Función Esperanza: E (Z ( x1 ))=m(x i) (8)

Varianza:

V (Z ( x i ))=E [ Z ( x i )−m ( x i ) ]2=σ i2 (9)

Función Autocovarianza:C ¿(10):

Función Semivarianza:γ ¿(11)

2 γ ¿ (12)

4. Estacionariedad: la variable regionalizada es estrictamente estacionaria si su función de distribución conjunta es invariante respecto a cualquier translación del vector h, es decir:

Z ( x1 ) , Z ( x2) , …, Z ( xn )=Z ( x1+h ) , Z ( x2+h ), …, Z ( xn+h ) (13)

5. Estacionariedad de segundo orden: Una variable regionalizada tiene estacionariedad de segundo orden o es débilmente estacionaria si posee momentos de segundo orden finitos:

i) Sea {Z ( x ) : xϵDϲ Rd } entonces:

E [ Z( xi)]=m∀ x i(13)

ii) La varianza de la diferencia de dos variables aleatorias para dos localizaciones cualquiera depende únicamente de la distancia entre las localizaciones involucradas (Melo,2012):

Var=¿ (14)

O lo que significa lo mismo:

cov (Z ( si ) , Z ( s j ))=cov (Z ( si+h ) , Z (s j+h ))

(15)

La existencia de la Covarianza implica la que la varianza existe, es finita y no depende de h (Giraldo, 2002), en otras palabras:

V (Z ( x i ))=C (0 )=σ2 (16)

También implica:

γ ¿(17)

En el caso espacial existen múltiples direcciones y por lo tanto se debe asumir que en todas, el fenómeno es estacionario, cuando la esperanza de la variable no es igual en todas las direcciones o cuando la covarianza o correlación dependen del sentido en que se determinan no existe estacionariedad, si la correlación no depende de la dirección en la se calcule se dice que el fenómeno es isotrópico, si por el contrario existe dependencia de esta dirección, el fenómeno se cataloga como anisotrópico (Giraldo, 2002).

La identificación de la estacionariedad se lleva a cabo por medio de gráficos de dispersión de la variable respecto las coordenadas (espacio), con el fin de identificar posibles tendencias de la variable en la región de estudio. Por otro lado el estudio de la dependencia espacial o isotropía se realiza a través del cálculo de funciones de autocovarianza o de semivarianza muestrales en varias direcciones

(Giraldo, 2002), con lo que es posible observar una dirección privilegiada en caso que se presente anisotropía, (Guedes et al, 2008) esto enmarcado en el análisis estructural que consiste en estimar y modelar una función que refleje la correlación espacial de la variable regionalizada a partir de asunción de hipótesis adecuadas acerca de su variabilidad (Díaz Viera, 2002).

Las funciones utilizadas para determinar la dependencia espacial de una variable son el semivariograma, el covariograma y el correlograma.

6. Semivariograma: teniendo en cuenta que en la estacionariedad débil se asume que la varianza de los incrementos de la variable regionalizada es finita se define

la función semivarianza 2 γ (h) en la

ecuación 12. Trabajar con la función

semivarianza o varianza γ (h )es

homologo y como define Riaño et al (2005), es la piedra angular de la geostadística.

El semivariograma es una función que relaciona la semivarianza con el vector h (distancia de separación y dirección

de cualquier par de puntos Z (xi) y

Z (xi+h) (Díaz Viera, 2002).

La estimación del semivariograma se puede realizar de dos formas, una clásica desarrollada por (Matheron,1963), ecuación (18), y una forma robusta propuesta por (Cressie &Hawkins, 1980), ecuación (19).

2 γ̂ (h)= 1|N (h)|∑N (h)

(z (i)−z j)2 (18)

Donde N (h) es el número de parejas

armadas con distancia h.

2 γ̂ (h)Cressie−Hawkins=( 1|N (h)¿|∑N (h)

|z( i)−z j|1/2)0.457+0.494|N (h)|

4

(19)

Las funciones Variograma y Semivariograma son funciones decrecientes y alcanzan un valor límite constante, la distancia donde se alcanza este valor se denomina rango y marca la zona de influencia en torno a un punto, a partir del cual la correlación es nula, el salto en el origen de la función se denomina “efecto pepita” generado por la ausencia de medición en el espacio inmediato, (Riaño et al., 2005).

7. Covariograma: Dado un proceso estacionario de segundo orden, se define el covariograma como (Ecuación 20):

C (h)=Cov ¿ (20)

Donde h=si−s j, vector distancia entre

dichas locaciones.

8. El Kriging es una herramienta estadística para la predicción espacial y la interpolación (Calder & Cressie,2009).

Esta técnica proporciona una estimación lineal como una función entre las localizaciones cercanas y presenta dos ventajas: a) los pesos usados son determinados como una función entre la localización a ser estimada y la distancia estructural a cualquier otro par de datos, b) la estimación se acompaña

de una cuantificación de incertidumbre, (Riaño et al, 2005)

METODOLOGÍA

Localización y caracterización del área de estudio

La zona de estudio se ubica en el piedemonte llanero sobre la cuenca de los Llanos Orientales, en el departamento del Casanare, contempla un área aproximada de 549 km2, formando un corredor de aproximadamente 10 km de ancho (en dirección Este-Oeste) por 65.5 km de largo (en dirección SE-NW). Y abarca los municipios de Tauramena, Aguazul y Yopal Figura 2.

El área se sitúa sobre la cadena de abanicos aluviales que descienden de la Cordillera Oriental, se trata de depósitos sedimentarios conformados litológicamente por gravas con clastos tamaño cantos y bloques (granulometría mayor a 64 mm), subredondeados y subesféricos, con matriz de tamaño arena gruesa, condiciones que imprimen alta porosidad y permeabilidad y, por consiguiente caracteriza estos depósitos como excelentes acuíferos libres, subyaciendo estos abanicos se encuentran espesos depósitos aluviales

de edad cuaternaria que presentan capas de material grueso con similares características litológicas, intercalados con capas de material impermeable compuestos por arcillas, conformando de esta manera acuíferos confinados con porosidades y permeabilidades al igual que los abanicos superiores, óptimas para el almacenamiento y captación de agua subterránea, razón por la cual, son ampliamente explotados en la región

Con el objetivo de modelar la superficie piezométrica del acuífero somero confinado, se llevó a cabo el manejo e implementación de herramientas geoestadísticas, sobre un inventario de puntos de agua subterránea realizado entre mayo y junio del año 2010.

La base de datos original contaba con 247 puntos inventariados que abarcaban pozos profundos, aljibes y manantiales; para la finalidad del estudio fueron descartados los manantiales debido a que su proveniencia es el acuífero libre superficial; la medición del nivel piezométrico se realizó de forma indirecta midiendo la profundidad del nivel de agua en los pozos y aljibes respecto a la altura del terreno, para lo cual se utilizaron sondas electro-acústicas con resolución milimétrica.

El manejo geoestadístico de los datos se llevó a cabo en las siguientes etapas:

Determinación de estacionariedad de la función a través de diagramas de dispersión.

Análisis de datos con estadística descriptiva: se basó en el análisis del comportamiento y distribución de la variable por medio diagrama de frecuencias; resumen de las medidas de tendencia central (media, mediana), medidas de forma (coeficiente de simetría y kurtosis) y medidas de dispersión (desviación estándar y coeficiente de variación).

Análisis exploratorio de datos: cuyo objetivo es detectar anomalías o errores y descubrir modelos o patrones, este análisis se desarrolló por medio de diagramas de caja que permitieron descartar la presencia de datos atípicos, pruebas de hipótesis de normalidad y significancia, prueba de normalidad por el método de Chapiro-Francia. Una vez realizadas las pruebas se procedió a realizar las transformaciones correspondientes.

Regresión lineal: La aplicación de este método matemático busca modelar las relaciones entre las variables dependientes y las independientes, a través de la construcción de una recta promedio para la nube de puntos, la regresión se calculó con el modelo de regresión se calculó con el modelo de tercer orden teniendo en el resultado de los gráficos de dispersión.

Análisis Estructural: busca determinar la existencia de dependencia espacial y definir una función matemática que describa su comportamiento, para lo cual se graficó el semivariograma utilizando el estimador clásico

Análisis de anisotropía: para ello se observó el comportamiento del semivariograma en cuatro direcciones.

Ajuste y selección de un modelo de variograma óptimo para la predicción: esta tarea se realizó escogiendo la curva que representó la distribución de los datos del semivariograma y se discriminó que modelos representan mejor la tendencia, con la posibilidad de ajustar los parámetros a los modelos teóricos aplicado al modelo un método de cálculo de error.

Validación cruzada: consiste en validar cuál es el modelo óptimo de semivarianza, mediante un algoritmo que separa un valor muestral de la base de datos inicial y empleando las demás observaciones se estima el valor de la variable en la posición separada, el mejor modelo es aquel cuya diferencia entre el valor calculado y el valor real de la variable en la posición evaluada, tienda a cero.

Mapa de Predicción: Se determina por medio de un algoritmo de interpolación denominado kriging, que utiliza el modelo óptimo de semivarianza generando un mapa final de predicción de la superficie piezométrica en el año 2010 delimitado por el área de estudio.

Es importante resaltar que debido a la presencia de variabilidad de la varianza, que mostró la no estacionariedad del fenómeno se realizó tratamiento estadístico con los residuales obtenidos de la regresión lineal, y por la misma razón se llevó a cabo la interpolación por Kriging residual.

Es necesario precisar, que todos los análisis estadísticos desde las medidas descriptivas hasta la generación del modelo de interpolación por Kriging fue realizado utilizando el software de acceso libre R en su versión 3.1.1.

RESULTADOS YANALISIS DE RESULTADOS

Análisis de Estacionariedad: De acuerdo a las condiciones establecidas anteriormente para la estacionariedad de la variable regionalizada se deduce que el fenómeno de estudio presenta estacionariedad de segundo orden o estacionariedad débil, esto soportado en los diagramas de dispersión de la variable nivel pizométrico con respecto a las coordenadas que se permite observar la acumulación de datos en el NE, (Figura 3). Adicionalmente en los diagrama de dispersión por intervalos, de contornos, de símbolos, el mapa y superficie de interpolación (Figuras 4 -8), es posible observar la tendencia en donde los valores bajos (color morado y azul) se concentran hacia el suroccidente del corredor de estudio, mientras los valores altos (rosa y amarillo) se ubican preferiblemente en el nororiente, mostrando en general un

aumento del nivel piezométrico en dirección NW. Figura 3. Diagrama de dispersión espacial de los datos.

Figura 4. Diagramas de dispersión por intervalos

Figura 5 Diagrama de contornos Figura 6 mapa de interpolación

Figura 7 Diagrama de símbolos Figura 8 Superficie de interpolación

El análisis de dispersión evidencia que la media ni la varianza del nivel piezométrico parecen no ser constantes en la región de estudio.Análisis Descriptivo

De acuerdo con los resultados obtenidos en la tabla 1 y graficados en la Figura 9, se puede decir que la distribución es relativamente simétrica pues, el coeficiente de asimetría se encuentra entre -0,5 y 0,5 lo que se confirma visualmente en el diagrama box plot donde la mediana está muy próxima al centro de la caja; los valores de media y la mediana son similares; y los coeficientes de variación son menores a 15, éste último parámetro indica además relativa homogeneidad en los datos. En cuanto a la presencia de datos atípicos, el diagrama de caja (box plot) evidencia que no existen, lo cual es corroborando adicionalmente por el coeficiente de Kurtosis menor a 6.

Tabla 1. Resumen de Estadística Descriptiva

Medida Valor

Mínimo 223.22

Máximo 306.60

Promedio 270.71

Mediana 271.66

Desviación Estándar 20.79

Desviación Mediana 16.36

Asimetría -0.19

Kurtosis 1.98

Coeficiente de Variación Media 7.68

Coeficiente de Variación

Mediana

6.02

Figura 9 Histograma, y diagrama box plot de los niveles piezométricos.

Análisis Exploratorio Espacial:

Usando la prueba de normalidad Shapiro Francia, se tiene que la probabilidad del valor de normalidad (0.0037) es menor al nivel de significancia (α=0.05) por tanto aplicando el criterio de hipótesis1 indica que los datos no siguen una distribución normal. En consecuencia, se realizó la prueba Box-Cox para evaluar las reglas de decisión de normalidad con respecto

a la potencia de transformación (λ).

Como resultado se obtuvo que el valor

de probabilidad de λ (0)=0.057>∝ y

λ (1)=0.299>∝, determinándose de

acuerdo a la tercera condición de cumplimiento: “la distribución es relativamente simétrica”, pero no es contundente con respecto a la normalidad, razón por la cual se llevó a cabo inicialmente el procesamiento

estadístico con la variable sin transformar, pues comparando el conjunto de datos con una distribución teórica se verifica que poseen una distribución normal o muy cercana a ella exceptuando los datos con mayor valor de carga hidráulica que salen de la zona de tolerancia de la recta de normalidad (figura 10).

Figura 10. Gráfico de la probabilidad normal de la función nivel piezométrico

De acuerdo a Santa (2012) una alternativa para remover la tendencia en los datos es el ajuste de un modelo de regresión lineal. El ajuste se realizó con el nivel piezométrico como la variable explicada y las variables direccionales (coordenadas) como variables explicativas, la forma funcional se halló de acuerdo con la dispersión de la variable nivel piezométrico con respecto a cada variable explicativa, figura 11 y 12.

1 H0=La función es normalHa=La Función no es normal

Figura 11 Dispersión en dirección W-E

Figura 12. Dispersión en dirección S-N.

Modelo de regresión

Teniendo en cuenta que gráficamente la relación entre la dispersión de la función en cada dirección tiene una tendencia de tercer orden, se halló el modelo de regresión experimental que representa mejor las relaciones de dependencia, conforme a las hipótesis de significancia, y la prueba de contraste utilizando el criterio de información de AIC, los datos obtenidos de la prueba (Tabla 2.) confirman la regresión lineal de tercer orden con todos los componentes de la transformación no significativos.

Tabla 2. Resumen de modelo de regresión lineal.

Recordando que no se realizó transformación alguna sobre la variable original, y que presenta tendencias que evidencian la no estacionariedad del fenómeno se retoma la exploración de alternativas para cambiar la estructura de los observaciones, como transformaciones para estabilizar la variabilidad y los modelos de regresión para eliminar la tendencia (Santa, 2012), por tanto a continuación se realizará el análisis del comportamiento de la distribución de los residuales del modelo de regresión estimado, con el

objetivo de verificar que la variabilidad es baja y la eliminación de la tendencia que inicialmente presentaban los datos.

Análisis de Residuales

Posterior a la aplicación de la regresión lineal a la variable nivel piezométrico, se almacenaron los residuales en una nueva columna con la cual se llevó a cabo el manejo estadístico descriptivo (tabla 3, Figura 13.) y exploratorio de datos.

Tabla 3. Resumen descriptivo de los residuales del modelo de regresión de tercer orden.

Medida Valor

Mínimo -3.044000e1

Máximo 2.209000e1

Promedio 0.000000e0

Mediana 3.100000e-1

Desviación Estándar 1.0091000e1

Desviación Mediana 7.540000e0

Asimetría -9.000000e-2

Kurtosis 2.690000e0

Coeficiente de Variación

Media

-4.430000e18

Coeficiente de Variación

Mediana

2.45858000e03

Figura 13 Histograma, diagrama de caja y gráfico de probabilidad de los residuales del modelo de regresión lineal

Como se puede observar en la figura 13, junto con los resultados de la tabla 3, la función de los residuales es relativamente simétrica, con valores extremos hacia los valores bajos, presenta la mayoría de los residuales están muy cercanos a los cuantiles teóricos de la distribución normal sugiriendo que se trata de una función homogénea.

En cuanto al análisis exploratorio las figura 14, no presentan tendencias, es decir, no siguen patrones, confirmando de esta manera la eliminación de esta característica gracias a la regresión lineal de tercer orden

Figura 14 Mapa de símbolos, diagramas de dispersión en dirección Este y Norte, y dispersión 3D de los residuales del modelo de regresión lineal.

Como de esperar el test de normalidad sobre los residuales confirmó que la función seguía una distribución normal. Los gráficos de dispersión de la variable nivel piezométrico versus variables direccionales (coordenadas) no

presentan tendencia lo cual se verificó con un test significancia para descartar que hubiere cabida una nueva regresión lineal, (tabla 4).

En la figura 15 se presentan los gráficos que permiten observar la pérdida de la tendencia.

Figura 15 Mapa de símbolos, mapa de interpolación y superficie de interpolación de los residuales.

Tabla 4. Resumen estadística descriptiva para los residuales obtenidos de la regresión lineal.

El análisis y modelamiento de la estructura de dependencia espacial del fenómeno se debe realizar sobre los residuales ya que es sobre ellos que se han trabajado la varianza y media constante.

Estimación del semivariograma:

Se realizó la estimación de semivariograma experimental onmidireccional para los residuales del modelo de regresión con el estimador clásico (figura 16), el rezago escogido fue de 25.000 pues aunque el semivariograma inicia su decrecimiento con anterioridad se decido tomar un intervalo medio, para ver su comportamiento más detalladamente (figura 17)

Posteriormente se graficó el semivariograma direccional (en cuatro direcciones), lo que permitió observar si la variable presentaba un comportamiento anisotrópico, (figura 18).

Figura 16. Semivariograma experimental

Figura 17 Semivariograma experimental con rezago a 25.000.

Figura 18. Semivariograma experimental direccional

Como es posible observar en el semivariograma experimental direccional, la variable es anisotrópica en la dirección 90º. La isotropía se presenta a una distancia muy corta del origen (2000 m), de acuerdo al comportamiento similar de las cuatro componentes direccionales.

Ajuste del modelo Teórico de Semivarianza

Una vez estimado el semivariograma se busca identificar un modelo teórico que mejor se ajuste al comportamiento de la estructura de correlación espacial de los datos y posiblemente del fenómeno.

Por medio de las opciones que el software R, permite realizar un ajuste a sentimiento de los diferentes modelos obteniendo para nuestro caso: el modelo Exponencial, modelo Gaussiano y modelo esférico (figura 19) con los parámetros consignados en la tabla 5.

Tabla 5 Parámetros de los modelos teóricos ajustados.

Modelo varianza (sigma sq)

rango (phi)

pepita (tausq)

Exponencial 145.52 4545.59 5.39

Gaussiano 140.13 6493.69 21.56

Esférico 113.18 9091.17 16.17

Figura 19. Ajuste por sentimiento del semivariograma experimental a las curvas teóricas

El

semivariograma experimental se ajustó a las curvas teóricas por medio de distintos métodos (mínimos cuadrados, mínimos cuadrados, mínimos cuadrados ponderados de Cressie, máxima verosimilitud y máxima verosimilitud restringida).

La selección definitiva del modelo de correlación espacial se hace basado en el modelo que genere las mejores predicciones de la variable nivel piezométrico, la calidad de las predicciones se midió utilizando el método de validación cruzada y finalmente se obtuvo la función esférica con el método de mínimos cuadrados ordinarios como mejor modelo de predicción.

Los parámetros pepita, meseta y rango obtenidos del modelo óptimo se utilizaron posteriormente para el desarrollo de la técnica de Kriging Ordinario (Residual), finalmente se obtuvo el modelo de predicción del nivel piezométrico junto con el modelo de varianza que representa el error en cada punto respecto a la media. (Figura 20)

Figura 20. Mapas de predicciones de nivel piezométrico y varianza.

Como se puede observar en el mapa de varianza se obtuvieron valores de error demasiado grandes con respecto a las magnitudes de la función nivel piezométrico, lo que indica que el

modelo no es una predicción eficiente, esto se atribuye a tres importantes causas:

El fenómeno no es estacionario

La discontinuidad lateral del muestreo

El alto error en la topografía la cual fue tomada con GPS con error de 3m.

La no contundencia en cuanto a la normalidad de la función

Como solución a este resultado se anuló la topografía del nivel piezométrico, ya que la continuidad lateral no es posible de mejorar y que la estacionariedad es corregida a través del manejo estadístico de los residuales, por tanto la única variable que es posible de modificar es la topografía, a falta de datos confiables se decidió asumir el nivel del terreno como cero u origen de medida con su dirección hacia el centro de la tierra como positiva y tomar la profundidad del nivel estático en los puntos de agua como la variable explicada (es decir al nivel piezométrico se restó la acción de la topografía y la referencia con respecto al nivel del mar) continuación se presenta de manera breve los resultados del tratamiento estadístico realizado a la variable Nivel Estático.

Análisis Descriptivo

En cuanto a la distribución de los datos es la misma manejada en el modelo anterior. Sin embargo, al anular la

topografía, solo se depende de la profundidad tomada, el diagrama de símbolos permite apreciar que no se distingue tendencia alguna, por cuanto el fenómeno es en algún grado estacionario (Figura 21)

Figura 21 Mapa de símbolos

El análisis descriptivo de la tabla 6 y graficado en la Figura 22 reporta una función relativamente asimétrica a la izquierda, lo que también es observable en el diagrama de caja donde el bigote superior es más extenso que el inferior; los coeficientes de variabilidad son mayores a 30 indicando datos heterogéneos y del diagrama de caja también es posible confirmar la existencia de datos atípicos datos atípicos, por otro lado, la gráfica de probabilidad normal muestra datos que se alejan tanto de la recta como de la zona de aceptación.

Tabla 6 Resumen de medidas descriptivas

Figura 22. Histograma, diagrama de caja y diagrama de probabilidad de normalidad.

Análisis Exploratorio

A partir de la evaluación de las hipótesis a través de las pruebas de normalidad, se dedujo que era necesaria la transformación del tipo logarítmico

Una vez transformada la función se realizó de nuevo los análisis descriptivos y exploratorios sobre la función transformada obteniendo los resultados en la Tabla 7, y la figura 23.

Tabla 7. Resumen de medidas descriptivas de la variable transformada

Figura 23. Histograma, diagrama de caja y gráfico de probabilidad de normalidad.

A partir de los resultados la variable transformada es relativamente simétrica, con media y mediana muy semejantes, continúan la característica de heterogeneidad, y se confirma por medio del test de normalidad que sigue este tipo de distribución.

La regresión lineal de acuerdo a los gráficos de dispersión en cada variable direccional se obtuvo que en dirección Este presenta una tendencia lineal, en tanto en dirección norte es de tercer orden, sin embargo, la prueba de significancia es negativa para los tres modelos (lineal, cuadrática y cubica), por tanto, no se extrajeron los residuales.

En la gráfica 24 se presenta el variograma obtenido al aplicar el estimador clásico, y su correspondiente reducción al rezago 15.000 a partir del cual la función inicia decrecer.

Figura 24. Semivariograma de la función nivel estático bajo el estimador clásico, y semivariograma hasta regazo 20.000.

El ajuste de variograma experimental al modelo teórico se llevó a cabo por medio de la técnica de sentimiento obteniendo y aplicando la validación cruzada respectiva, lo que arrojo como mejor predictor el modelo exponencial con el método máxima verosimilitud-

Posteriormente se realizó el Kriging ordinario para obtener el mapa de predicción y su respectivo mapa de varianza (Figura 25)

Figura 25. Mapas de predicción de la función nivel Estático y varianza.

Conclusiones

Se obtuvo la predicción del nivel piezometrico y su correspondiente mapa de varianza de un corredor del piedemonte de Casanare.

Se realizó la corrección de la estacionariedad de la variable, evidente a partir de los diagrama de dispersión que evidenciaron tendencia en los datos obtenidos.

El valor alto en la varianza de la predicción de la variable nivel piezométrico cuyas pruebas de normalidad no fueron contundentes, se deben posiblemente a:

La variable no mostró un  comportamiento estacionario; el muestreo presentó discontinuidad lateral

y alto error en el levantamiento topográfico a raíz de los instrumentos de medición.

A consecuencia de  los problemas de estacionariedad que presentó la variable  nivel piezométrico fue necesario emplear manejo estadístico sobre los residuales producto de la regresión líneal. De esta manera fue posible la eliminación de la tendencia y por consiguiente, la adopción de un comportamiento constante por la media y la varianza de ellos.

Dado que fue posible eliminar la tendencia en los residuales, y no sobre la variable, el desarrollo estructural, el mejor modelo y el mapa de predicción se realizaron sobre los residuales, ya que permitió corregir el sistema de manera que fue posible estimar que la media y la varianza son constantes.

Para contrastar el resultado obtenido con alto valor de varianza para la variable nivel piezométrico se realizó paralelamente el  análisis estadístico eliminando del nivel piezométrico la topografía, obteniendo como nueva variable la profundidad del nivel estático, que se definió como positivo, el resultado de los dos mapas en la predicción se diferente siendo el de nivel estático mas homogéneo esto debido a los bajos niveles de varianza que presenta. Sin embargo, y aunque la varianza en el nivel piezometrico es mayor permite tener una visión más real de acuerdo a la distribución de los datos

REFERENCIAS BIBLIOGRÀFICAS

Calder, C., & Cressie, N. (2009). Kriging and Variogram Models. Lsevier Ltd., 7.

Cressie, N., & Hawkins, D. (1980). Robust Estimation of the variogram: I. Mathematical Geology, 115-125.

Díaz Viera, M. (2002). Geoestadística aplicada. Cuba: Instituto de Geofísica y Astronomía CITMA.

Giraldo, R. (2002). Introducción a la Geoestadística: Teoría y aplicación. Bogotá: Departamento de Estadística, Universidad Nacional de Colombia.

Iglesias López, A., & Rodríguez, R. (21 de Octubre de 2013). Hidrodinámica subterránea aplicada, ensayos de bombeo y modelos de flujo. Bogotá, Colombia: Asociación Colombiana de Hidrogeólogos.

Matheron, G. (1963). Les variables régionalisées et leur estimation. Une application de la theorié des fonctions aleatories aux sciences de la nature. París: Masson.

Melo, C. (2012). Análisis Geoestadístico Espacio Tiempo basado en Distancia y Spliners con Aplicaciones. Barcelona, España: Universidad de Barcelona.

Myers, D. (1987). Optimization of Sampling Locations for Variogram Calculations. Water Resource Research.