Proyecto Final GEOESTADÍSTICA

download Proyecto Final GEOESTADÍSTICA

of 57

Transcript of Proyecto Final GEOESTADÍSTICA

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    1/57

    ANALISIS GEOESTADISTICO DE LA VARIACION DECONCENTRACIONES DE CADMIO EN LA LLANURA

    DEL RIO MOSA

    Fabian Cetina CastilloGiselle Helena Toro Garay

    Noviembre 12 de 2013

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    2/57

    Indice

    1. Objetivos 5

    1.1. Ob jetivo general . . . . . . . . . . . . . . . . . . . . . . . . . 51.2. Objetivos especficos . . . . . . . . . . . . . . . . . . . . . . . 5

    2. Introduccion 6

    3. Marco teorico 7

    3.1. El Cadmio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73.2. Geoestadstica . . . . . . . . . . . . . . . . . . . . . . . . . . . 103.3. Estado del arte . . . . . . . . . . . . . . . . . . . . . . . . . . 14

    4. Descripcion de los datos 15

    5. Analisis Geoestadstico 17

    5.1. Analisis exploratorio de los datos . . . . . . . . . . . . . . . . 175.2. Analisis Estructural . . . . . . . . . . . . . . . . . . . . . . . . 285.3. Estimacion Kriging . . . . . . . . . . . . . . . . . . . . . . . . 48

    6. Diseno de red de muestreo 53

    7. Conclusiones 55

    2

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    3/57

    Indice de figuras

    1. Semivariogramas y covariogramas . . . . . . . . . . . . . . . . 122. Muestreo Espacial Llanura del Rio Mosa . . . . . . . . . . . . 153. Concentracion de Cadmio partes por millon sobre la llanura

    del ro Mosa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184. Graficas explotarias: Histograma, QQplot, Diagrama de caja . 195. Test shapiro wilk y Smirnov-kolmogorov . . . . . . . . . . . . 206. Regresion y ploteo de dispersion de la variable X contra Cadmio 217. Regresion y ploteo de dispersion de la variable Y contra Cadmio 228. Histograma de los residuales de la regresion de Cadmio . . . . 239. Box-Plot de los residuales de la regresion de Cadmio . . . . . 2410. Grafico de concentracion de Cadmio en 3d . . . . . . . . . . . 2511. Histograma de los datos transformados mediante Box-Cox . . 2612. Diagrama de Caja de los datos transformados mediante Box-Cox 2713. Regresion de los datos transformados mediante Box-Cox, X

    contra Cadmio . . . . . . . . . . . . . . . . . . . . . . . . . . 2814. Regresion de los datos transformados mediante Box-Cox, Y

    contra Cadmio . . . . . . . . . . . . . . . . . . . . . . . . . . 2915. Histograma residuales datos transformados mediante Box-Cox 3016. Box Plot residuales datos transformados mediante Box-Cox . . 3117. Regresion y tendencia con los residuales de los datos transfor-

    mados mediante Box-Cox, X contra cadmio . . . . . . . . . . 3218. Regresion y tendencia con los residuales de los datos transfor-

    mados mediante Box-Cox, Y contra cadmio . . . . . . . . . . 3319. Semivariograma clasico, robusto, mediana, media recortada . . 3420. Ajuste al semivariograma esferico clasico . . . . . . . . . . . . 3621. Ajuste al semivariograma esferico media . . . . . . . . . . . . 3722. Ajuste al semivariograma esferico media recortada . . . . . . . 3823. Ajuste al semivariograma esferico robusto . . . . . . . . . . . . 3924. Ajuste al semivariograma exponencial clasico . . . . . . . . . . 4025. Ajuste al semivariograma exponencial media . . . . . . . . . . 41

    26. Ajuste al semivariograma exponencial media recortada . . . . 4227. Ajuste al semivariograma exponencial robusto . . . . . . . . . 4328. Ajuste al semivariograma Gausiano clasico . . . . . . . . . . . 4429. Ajuste al semivariograma Gausiano media . . . . . . . . . . . 4530. Ajuste al semivariograma Gausiano media recortada . . . . . . 46

    3

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    4/57

    31. Ajuste al semivariograma Gausiano robusto . . . . . . . . . . 47

    32. Mapa de prediccion de la variable cadmio por Kriging simple . 4933. Mapa de Varianza de la Prediccion de la variable cadmio esti-mada por Kriging simple . . . . . . . . . . . . . . . . . . . . . 50

    34. Mapa de prediccion de la variable cadmio por Kriging ordinario 5135. Mapa de Varianza de la Prediccion de la variable cadmio esti-

    mada por Kriging Ordinario . . . . . . . . . . . . . . . . . . . 5236. Diseno de Red . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

    4

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    5/57

    1. Objetivos

    1.1. Objetivo general

    Hacer uso del analisis geoestadstico para encontrar la superficie de prediccionoptima de concentraciones de Cadmio sobre la llanura del Ro Mosa.

    1.2. Objetivos especficos

    Determinar el mejor modelo de semivarianza teorica para realizar laprediccion mediante kriging.

    Realizar analisis de la tendencia de los datos.

    Realizar un Mapa de prediccion.

    5

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    6/57

    2. Introduccion

    El estudio de variables con continuidad y relaciones en el espacio es el objetode estudio de la estadstica espacial, los fenomenos que se encuentran en unespacio continuo son aquellos que estudia la geoestadstica (rama de la estadistica espacial). La geoestadstica como la definio Matheron es la aplica-cion de la teora de las variables regionalizadas a un fenomeno espacial. Tienecomo finalidad generar predicciones en el espacio en sitios donde la variablede interes no ha sido muestreada mediante diferentes metodologas entre lascuales destacamos krigging ordinario, universal, simple, por bloques y cokri-ging.

    En el presente trabajo se espera encontrar las concentraciones del metal pe-sado Cadmio en zonas donde este no ha sido muestreado, realizando todo elproceso geoestadstico que incluye analisis exploratorio, analisis estructuraly la prediccion por medio de Kriging ordinario y simple. El area de estudio,es la llanura del ro mosa. Estudios similares se han realizado en otros pasesobteniendo resultados positivos y fiables implementando esta metodologa.

    6

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    7/57

    3. Marco teorico

    La medicion de metales pesados en el suelo es de vital importancia para lapoblacion en general, pues esta permite evaluar si dichos metales estan bajorangos que son o no nocivos para la salud humana, el cadmio es uno de los mastoxicos y perjudiciales para el hombre[1], este es un metal blanco azulado,ductil y maleable que tiene multiples usos en la industria[2]. Las medicionesde cadmio en el suelo presentan una estructura de correlaci on espacial loque permite el uso de la geoestadstica para obtener valores del cadmio enubicaciones donde este no ha sido muestreado[3]. A continuacion se presentanalgunas ideas generales importantes para el desarrollo del presente trabajo.

    3.1. El Cadmio

    La ATSDR1 define el cadmio como:Un elemento natural de la corteza terres-tre, generalmente se encuentra como mineral combinado con otros elementostales como oxgeno, oxido de cadmio, cloro, cloruro de cadmio o azufre sulfa-to de cadmio, sulfuro de cadmio. Todos los suelos y rocas, incluso el carbony abonos minerales, contienen una cantidad de cadmio. La mayor parte delcadmio que se usa en los Estados Unidos se extrae durante la produccion deotros metales como el cinc, plomo y cobre. El cadmio no se corroe f acilmente

    y tiene muchos usos tales como bateras, pigmentos, revestimiento de metalesy plasticos.

    Maxima concentracion permitida[4]:

    Concentraciones ambientales:

    Cadmio elemental: 0.01 mg/m3

    Compuestos Inorganicos: 0.002 mg/m3

    Alimentos: 500 m= 0,5mg/semana. En los alimentos de mar las ob-

    servaciones son mucho mas altas (2000veces mas). Ejm: camaron.

    1Agencia para Sustancias Toxicas y el Registro de Enfermedades, 4770 Buford HwyNE, Atlanta, GA 30341

    7

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    8/57

    Cigarrillos:

    1 2g por c/cigarrilloy se absorve el 10 % del cadmio

    1 cajetilla al da produce 1 mg/ano

    Concentraciones de Cadmio:

    Carga corporal de Cadmio 1.65 mg

    Fumadores: 11.34 mg promedio

    En la industria: 0.05 /m3

    Dosis letal oral: 30 40mg

    Lmites Biologicos:

    Orina: menor a 10 g/gr de creatinina

    Sangre: menor a 10g/dl. Menores de 5g/dl=menor de0,5mg/dl

    Que ocurre cuando el cadmio entra al medio ambiente?[5]

    El cadmio entra al suelo, al agua y al aire durante actividades indus-triales y de minera, y durante la combustion de carbon y desechosdomesticos.

    El cadmio no se degrada en el ambiente, pero s cambia de forma.

    Las partculas de cadmio en el aire pueden movilizarse largas distanciasantes de depositarse en la tierra o el agua.

    Algunas formas de cadmio se disuelven en agua.

    El cadmio se adhiere fuertemente a partculas del suelo.

    Las plantas, los peces y otros animales incorporan cadmio del ambiente.

    Que posibilidades hay de que cadmio produzca cancer?[5]

    El Departamento de Salud y Servicios Humanos DHHS ha determinado queel cadmio y los compuestos de cadmio son carcinogenicos en seres humanos.

    8

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    9/57

    Como puede ocurrir la exposicion al cadmio?[5]

    Comiendo alimentos que contienen cadmio; todos los alimentos con-tienen niveles bajos, los niveles mas altos se encuentran en mariscos,hgado y rinon.

    Fumando cigarrillos o respirando humo de cigarrillo.

    Respirando aire contaminado en el trabajo.

    Bebiendo agua contaminada.

    Viviendo cerca de plantas industriales que liberan cadmio al aire.

    Efectos colaterales[2]

    Tiene una intensa correlacion con el consumo o exposicion laboral cronica.Es Embriotoxico2 y Teratogenico3.

    2Este adjetivo se aplica a cualquier sustancia danina para un embrion en cualquiersentido.

    3Cualquier sustancia que produzca defectos de nacimiento no hereditarios.

    9

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    10/57

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    11/57

    Una de las etapas mas importantes es la eliminacion de la tendencia de losdatos,[7] la define como termino intercambiable con el de deriva. Aun-que tambien se asocia con la representacion determinstica del valor medioobtenida mediante el procedimiento de Analisis de Superficie de Tendencia(Trend Surface Analysis) usualmente como polinomios de las coordenadasmediante ajuste con mnimos cuadrados. Si se realiza un kriging sin eliminarla tendencia, entonces no se podra garantizar el insesgamiento del predictor.

    Parte del analisis geoestadstico requiere de la eleccion del modelo de vario-grama segun [9], este se define para un proceso intrnsecamente estacionario5

    como la funcion:

    2(h) =V ar$Z(Xi)

    -Z(Xj) (1)

    consi,sj D yh=Si sj vector de dichas localizaciones. Se puede deducirque (h) = (h) y que (0) = 0. El variograma a diferencia del covario-grama, no depende de la media del proceso. Una condicion necesaria que dedebe cumplir el variograma es que debe ser una funcion condicionalmente

    definida negativa.

    Luego la mitad del variograma (h), se conoce como la funcion de semiva-rianza y se caracteriza las propiedades de dependencia espacial del proceso.Dada una realizacion del fenomeno, la funcion de semivarianza es estimada,por el metodo de momentos, a traves del semivariograma experimental, quese calcula mediante [6]

    5En las estadstica es comun suponer que la variable es estacionaria, es decir, su distri-bucion es invariante bajo traslacion. De la misma manera, una funcion aleatoria es esta-cionaria homogenea y tiene autocorrelacion en el espacio. Para cualquier incremento h, ladistribucion de losZ(XI),Z(X2), ...Z(Xk) es la misma que la de Z(XI+ h),Z(X2 + h),

    ... Z(Xk + h) Esta hace posible la inferencia estadstica en una sola realizacion. En su sen-tido mas estricto estacionariedad requiere que todos los momentos sean invariantes bajotraslacion, pero ya que esta no se puede comprobar a partir de los datos experimentaleslimitados, por lo general requieren solo que los dos momentos (la media y la covarianza)sean constantes. Esto se llama debil o estacionariedad de segundo orden. En otras palabras,el valor esperado ( media) de Z(x) debe ser constante para todos los puntos x.[10]

    11

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    12/57

    (h) =

    (Z(x+h) Z(x+h))2

    2n (2)

    Durante el proceso de analisis una vez hallado el semivariograma 2 se deberealizar la estimacion del mismo; [9], muestra algunos metodos en los que seincluye el estimador clasico y el robusto, el primero de ellos es el mas sencillo;es una media muestral y es obtenido a partir del estimador del metodo demomentos; mientras que la segunda es una variacion del estimador clasicopero con mayor robustez, fue presentada por Cressie Hawkins. Se puede ase-gurar el insesgamiento del estimador introduciendo los coeficientes.

    Figura 1: Semivariogramas y covariogramas

    Algunos de los principales modelos de variogramas son presentados en la

    1,obtenidos de [9]

    Una vez escogido el modelo de semivariograma6hecho el respectivo ajuste del

    6Si se desea obtener el variograma simplemente se debe multiplicar por 2 tal y como semonstro en la definiciones anteriores

    12

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    13/57

    mismo, y se elimina la tendencia se puede elegir algun tipo de kriging.

    Los primeros trabajos acerca del Kriging fueron realizados por el D.G. Kri-ge 7 y posteriormente formalizados por Matheron [7] se trata de encontrarel mejor estimador lineal insesgado, y es una metodologia de interpolaci onbasada en la regresion generalizada por mnimos cuadrados.[9]. Existen dife-rentes tipos de kriging la escogencia de los mismos depende de la decision delinvestigador, del tipo y tendencia de los datos y de como se desee abordar elproblema.

    Algunos de ellos son el kriging simple,el kriging ordinario y el kriging univer-sal.

    Finalmente se debe realizar la validacion cruzada definida por [7] as: Esuna tecnica para probar la validez de un modelo de variograma obtenido porKriging de cada localizacion de la muestra con todas las otras muestras en lavecindad de busqueda, y comparando los estimados con los valores reales dela muestra. La interpretacion de los resultados, sin embargo, es en ocasionesmuy difcil. La existencia de grandes diferencias entre los valores reales yestimados, pueden indicar la presencia de outliers espaciales, o puntos queaparentemente no pertenecen a esos contornos.

    7D.G. Krige fue un ingeniero de minas de Sudafrica que desarrollo una tecnica de mediamovil para eliminar las leyes de oro mediante una regresion [10]

    13

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    14/57

    3.3. Estado del arte

    Como se menciono en captulos anteriores del presente trabajo, se han realiza-do multiples estudios con la geoestadstica y la presencia de metales pesadosen el suelo; como es el caso de [11] estudio en el que se trat o la influencia devarios metales pesados entre ellos cobre,mercurio y pomo, con procesos geo-estadsticos que arrojaron como resultados distribuciones complejas de cadauno de estos metales en las que se incluyo anisotropa geometrica en algunosy anisotropa zonal en otros.

    En [12] realizaron un estudio de caso de los contaminantes presentes cerca a

    una presa de jales mineros, analizando entre otros metales pesados el cadmioa traves de la geoestadstica para determianr la zona de afectacion. Existenotros estudios realizados en la una de las zonas que atraviesa el ro Meuse enBelgica; all se uso un kriging indicador para construir mediante una funcionde distribucion acumulada condicional local del cadmio, ya que este dependede la presencia de materia organica y arcilla y algunas zonas no tiene valorconstante, con este metodo se obtuvo un mapa de concentraciones de lamateria organica asociada al cadmio [13].

    Se encontraron estudios de esta problematica en otros pases como China,en donde los cultivos de arroz se ven afectados por la presencia del cadmio,

    causando efectos nocivos en la comunidad, [3] all se comprobo la correlacionde los datos y se uso un semivariograma esferico.Y como Iran [14] donde esetomaron muestras para un area grande y mediante un kriging indicador seencontro uqe la contaminacion por cadmio es muy grande con respecto ala contaminacion de otros metales como el plomo en la mayor parte de laregion de estudio, all se hizo un analisis del riesgo de perdida potencial ylos costos en atencion medica producidos. Finalmente se realizaron mapas deriesgo para le plomo sobre el peligro en la salud humana.

    Tambien se han realizado trabajos de las ventajas de el uso de la geoestads-tica en acciones correctivas y preventivas de los contaminantes en el suelo, taly como muestra [15] por medio de la herrmanienta geoestadstica encontrarzonas de gestion del riesgo y planeacion.

    14

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    15/57

    4. Descripcion de los datos

    Los datos usados para el analisis geoestadstico se obtuvieron a partir de labase de datos meuse, predeterminada en los contenidos de R-project[16] enla librera gstat[17], de la cual se escogio la variable cadmio4. En la figura 2se observan los puntos muestreados en la llanura del ro Mosa, sobre estos semidieron 4 metales pesados (plomo, cadmio, cobre, cinc).

    Figura 2: Muestreo Espacial Llanura del Rio Mosa

    El ro mosa atraviesa 3 paises: B elgica, F rancia, P aises Bajos[18] su cuencaes de 36.000km2 y alberga sobre su inmenso valle ciudades tan importantes

    4En secciones anteriores se definio esta variable

    15

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    16/57

    como Lieja, sus llanuras aluviales hacen de este un afluente natural impor-

    tante para la region, sus meandros5

    abarcan unos 950 km sobre los 3 paisesmencionados. Al ser estos industrializados, la carga de contaminantes en elsuelo es muy alta, esto conlleva a realizar mediciones periodicas que permitencontrolar y estudiar la cantidad presente para nuestro caso el cadmio en lasllanuras aluviales.

    5Un meandro es una curva descrita por el curso de un ro cuya sinuosidad es pronunciada

    16

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    17/57

    5. Analisis Geoestadstico

    En esta seccion se realiza el tratamiento geoestadstico formal de la variablecadmio siguiendo lo propuesto por [7] quien contempla 3 etapas dentro de unanalisis geoestadstico:

    el analisis exploratorio de los datos.

    el analisis estructural.

    las predicciones (kriging o simulaciones).

    5.1. Analisis exploratorio de los datos

    El analisis exploratorio de los datos segun [6] contempla todo el proceso quepermite describir la variable de estudio mediante graficos, evaluacion de laforma de la distribucion y el calculo de medidas de localizacion, posterior aesto es necesario realizar analisis de tendencia para analizar si la media oderiva no es constante[9].

    Inicialmente se realizo un ploteo en la figura 3 para observar el comportamien-to de la distribucion espacial del cadmio, siendo los puntos pequenos azuleslos valores de menor intensidad y los rojos grandes los de mayor intensidad.

    Por otro lado la figura 4 muestra un histograma asimetrico a la izquierda(valores bajos), presencia de atpicos y los cuantles no coinciden con losde una distribucion normal, esta primera aproximacion nos da una idea deposible ausencia de normalidad.

    17

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    18/57

    Figura 3: Concentracion de Cadmio partes por millon sobre la llanura del roMosa

    18

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    19/57

    Figura 4: Graficas explotarias: Histograma, QQplot, Diagrama de caja

    Los coeficientes de asimetra y curtosis muestran valores de: 1.761609 y6.051046, lo cual no es un buen indicador de normalidad, ya que estos debe-ran ser o estar cercanos a 0 y 3 respectivamente. Se realiza entonces el testShapiro wilk y smirnov Kolmogorov para verificar ausencia o presencia denormalidad, el resultado se muestra en la figura 5.

    19

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    20/57

    Shapiro-Wilk normality test

    data: cadmium

    W = 0.7856, p-value = 8.601e-14

    One-sample Kolmogorov-Smirnov test

    data: n.qo

    D = 0.2213, p-value = 5.09e-07

    alternative hypothesis: two-sided

    Figura 5: Test shapiro wilk y Smirnov-kolmogorov

    20

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    21/57

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    22/57

    Figura 7: Regresion y ploteo de dispersion de la variable Y contra Cadmio

    Las figuras 6 y 7 dan una aproximacion inicial sobre la tendencia de losdatos, es conveniente realizar una regresion de la variable cadmio, guardarlos residuales y construir un histograma figura 8 y diagrama de caja figura 9para corroborar si hay tendencia [9].

    22

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    23/57

    La figura 8 muestra un histograma con leve asimetra hacia los valores bajosy presencia de atpicos en los valores altos, se debe tener cuidado con estosultimos, ya que su eliminacion no siempre es factible pues puede causar unasubestimacion del potencial de un area.[7]

    Figura 8: Histograma de los residuales de la regresion de Cadmio

    23

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    24/57

    Figura 9: Box-Plot de los residuales de la regresion de Cadmio

    Otra herramienta interesante que permite validar si hay tendencia o no es unploteo en 3d como se indica en la figura 10:

    24

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    25/57

    Figura 10: Grafico de concentracion de Cadmio en 3d

    Se observa tendencia en la variable Y, se decide entonces transformar losdatos mediante Box-Cox y remover la tendencia a traves de una regersion delos residuales de la variable transformada, esta ultima parte se realizara enel analisis estrutural.

    25

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    26/57

    Al transformarse los datos, se obtiene como reultado el histograma de lafigura 11 y el diagrama de caja de la figura 12, de entrada parece que no seha obtenido normalidad, los valores de asimetria y curtosis son: 0.3971037 y2.312626 estos deberan estar cercanos a 0 y 3 para comportarse como unadistribucion normal [19], trabajaremos entonces con los datos transformadospara remover la tendencia.

    Figura 11: Histograma de los datos transformados mediante Box-Cox

    26

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    27/57

    Figura 12: Diagrama de Caja de los datos transformados mediante Box-Cox

    27

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    28/57

    5.2. Analisis Estructural

    En esta etapa del proceso se modela la funcion que describe la correla-cion espacial (V ariograma, Covariograma, Correlograma) de la variableestudiada[7], en la practica se suele utilizar el variograma o semivariogra-ma, dado que este no requiere de la media para su estimacion[6].

    Como se dijo en la seccion anterior, se va a modelar la tendencia con losresiduales obtenidos de la regresion de los datos transformados medianteBox-Cox con lo cual se construira un variograma que se sera estacionario almenos intrinsecamente [9].

    Figura 13: Regresion de los datos transformados mediante Box-Cox, X contraCadmio

    28

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    29/57

    Para remover el problema de la deriva como se muestra en las figuras 13 y 14se construyo un modelo de regresion de la variable transformada (transcadmio),se guardaron los residuales, se comprobo nuevamente si haba tendencia, ycon estos se construyo el semivariograma.

    Figura 14: Regresion de los datos transformados mediante Box-Cox, Y contraCadmio

    29

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    30/57

    Se obtuvo un modelo de regresion que permitio construir el histograma de lafigura 15 y el diagrama de caja de la figura 16.

    Figura 15: Histograma residuales datos transformados mediante Box-Cox

    30

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    31/57

    Se contruye nuevamente el ploteo y la regresion de x contra cadmio e y contracadmio para corroborar que ya no existe tendencia en nuestros datos figuras17 y 18.

    Figura 16: Box Plot residuales datos transformados mediante Box-Cox

    31

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    32/57

    Figura 17: Regresion y tendencia con los residuales de los datos transformadosmediante Box-Cox, X contra cadmio

    32

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    33/57

    Figura 18: Regresion y tendencia con los residuales de los datos transformadosmediante Box-Cox, Y contra cadmio

    Ahora se construye el semivariograma omnidireccional por los estimadoresclasico, robusto, mediana y media recortada figura 19. Los parametros utili-zados para el calculo son: 10 rezagos, un factor trim=0.1. Despues se buscaestablecer que modelos teoricos se ajustan mejor a las semivarianzas experi-mentales.

    33

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    34/57

    ........................................................................

    Figura 19: Semivariograma clasico, robusto, mediana, media recortada

    34

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    35/57

    Se utilizaron para este trabajo los modelos exponencial, gausiano y esferico:Exponencial.

    Esferico

    Gausiano

    La seleccion optima del semivariograma teorico se realiza de tal manera queaquel que presente mejor ajuste a las observaciones experimentales por algunode los metodos de estimacion [9], sera el optimo para realizar la prediccion.

    se muestran a continuacion los diferentes metodos para ajustar los modelosexperimentales.

    Mnimos Cuadrados:

    Este metodo fue disenado por gauss, se utiliza en muchas disciplinas:geodesia, econometra, ingeneiria civil, etc. Existen 3 metodos de esti-macion por Mnimos Cuadrados:

    Minimos cuadrados ponderados

    Minimos cuadrados generalizados Minimos cuadrados ordinarios

    Maxima Verosimilitud:

    La estimacion mediante maxima verosimilitud tiene como fin; encontrarprimero la funcion de densidad conjunta de todas las observaciones[9].Tambien se puede estimar va axima verosimilitud restringida, esta tie-ne ventajas y es mas poderosa que la anterior.

    35

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    36/57

    Figura 20: Ajuste al semivariograma esferico clasico

    36

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    37/57

    Figura 21: Ajuste al semivariograma esferico media

    37

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    38/57

    Figura 22: Ajuste al semivariograma esferico media recortada

    38

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    39/57

    Figura 23: Ajuste al semivariograma esferico robusto

    39

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    40/57

    Figura 24: Ajuste al semivariograma exponencial clasico

    40

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    41/57

    Figura 25: Ajuste al semivariograma exponencial media

    41

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    42/57

    Figura 26: Ajuste al semivariograma exponencial media recortada

    42

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    43/57

    Figura 27: Ajuste al semivariograma exponencial robusto

    43

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    44/57

    Figura 28: Ajuste al semivariograma Gausiano clasico

    44

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    45/57

    Figura 29: Ajuste al semivariograma Gausiano media

    45

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    46/57

    Figura 30: Ajuste al semivariograma Gausiano media recortada

    46

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    47/57

    Figura 31: Ajuste al semivariograma Gausiano robusto

    47

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    48/57

    Las figuras 22 a 31 muestran todos los semivariogramas que se usaron en estetrabajo y las curvas de ajuste que resultan por cada metodo de estimacion.

    5.3. Estimacion Kriging

    El kriging es una tecnica de estimacion local que ofrece el mejor estima-dor lineal insesgado de una caracterstica desconocida que se estudia. Lalimitacion a la clase de estimadores lineales es bastante natural ya que estosignifica que solamente se requiere el conocimiento del momento de segundoorden de la funcion aleatoria, la covarianza o el variograma, y que en gene-

    ral en la practica es posible inferir a partir de una realizacion de la misma.[7]

    El modelo de semivarianza que se escogio para hacer la prediccion fue elsiguiente: Estimador de media recortada, modelo teorico gausiano ajustadopor minimos cuadrados ordinarios con un error cudratico medio de 0.2002974.

    A continuacion se muestra el mapa de prediccion de concentraciones de Cad-mio por Kriging Simple figura 32, el mapa de varianza de la prediccion figura33 y el mapa de prediccion y varianza para Kriging ordinario en las figuras34 y 35.

    Validacion cruzada para krigin ordinario y kriging universal, se toma elRMSSPE cercano a 1; que en este caso es el valor para el kriging simple,el ASEPE debe estar cercano al RMSSPE, situacion que se confirma conel valor de 0.9499415 en el mismo kriging simple, finalmente el MSPE debeestar cercano a cero y el valor es de -0.01588404. Por tanto se concluye queel mejor kriging para los datos Cadmio sobre el ro Mosa el simple.

    48

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    49/57

    Figura 32: Mapa de prediccion de la variable cadmio por Kriging simple

    49

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    50/57

    Figura 33: Mapa de Varianza de la Prediccion de la variable cadmio estimadapor Kriging simple

    50

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    51/57

    Figura 34: Mapa de prediccion de la variable cadmio por Kriging ordinario

    51

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    52/57

    Figura 35: Mapa de Varianza de la Prediccion de la variable cadmio estimadapor Kriging Ordinario

    52

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    53/57

    6. Diseno de red de muestreo

    Cuando se realiza prediccion en puntos donde la variable objeto de estu-dio no se ha muestreo, cualquiera que sea el metodo de kriging usado, estese debe evaluar. Se realiza mediante el calculo de la varianza del error deprediccion.El diseno muestral, entonces logra establecer entre varias redes demuestreo de densidades y enmallados distintos, la relacion entre las varianzasde prediccion maximas obtenidas dependiendo de la forma del enmallado. Elproposito es llegar al costo necesario para un alto grado de certidumbre, osi se tiene el costo la varianza de la prediccion.[6] MacBratney y Warrickautores citados tambien por Ramon Giraldo proponen que para cualquier

    densidad muestral, la distancia maxima entre un punto de observacion y unpunto a interpolar es mnima cuando la configuracion de los puntos es hechaen un enmallado triangular, por lo cual bajo esta distribucion de puntos seobtendran las menores varianzas de prediccion. Sin embargo por razones lo-gsticas referentes a la ubicacion de los sitios en el campo y minimizacion derecorridos, el enmallado cuadrado es preferible.

    En este trabajo se realizaron 3 disenos de red para Kriging Ordinario, Sim-ple y Universsal, se evidencio que el mejor diseno de red era el del KrigingOrdinario con un Asepe de 1.0032 .

    53

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    54/57

    Figura 36: Diseno de Red

    54

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    55/57

    7. Conclusiones

    Es importante en cualquier analisis geoestadstico remover la tendenciaya que se pierde la condicion de insesgamiento y se puede sobreestimaro subestimar el valor de la varianza en la prediccion

    La predicciarrojo que los mayores valores de concentracion de cadmioen la llanura del ro Mosa se encuentran en elborde noroccidental, puedeser debido a la industrializacion de los pases que atraviesa el mismo.

    La geoestadstica es una herramienta que permite hacer prediccones decualquier variable correlacionada en el espacio, esto reduce los costos yproporciona resultados fiables

    55

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    56/57

    Referencias

    [1] Lars Friberg, Magnus Piscator, Gunnar F Nordberg, Tord Kjellstrom,et al. Cadmium in the environment. Number 2nd edition. 1974.

    [2] Lars Friberg, CG Elinder, T Kjellstrom, and GF Nordberg. Cadmiumand health: a toxicological and epidemiological appraisal, volume 1. CRCPress Boca Raton, 1985.

    [3] Shi Rong-Guang, Zhao Yu-Jie, Li Xiao-Hua, Liu Feng-Zhi, Zheng Xiang-Qun, and Zhou Qi-Xing. Geostatistical analyses of the spatial variationof soil cadmium in rice producing area in the luxian county, china. InBioinformatics and Biomedical Engineering (iCBBE), 2010 4th Inter-

    national Conference on, pages 18. IEEE, 2010.

    [4] Minimal Risk Levels ATSDR. for hazardous substances. ATSDR/EPAPriority list for, 1996, 1995.

    [5] US ATSDR. Agency for toxic substances and disease registry.Case Studies in Environmental Medicine./http://www. atsdr. cdc.gov/HEC/CSEM/csem. html S, 1997.

    [6] HR Giraldo. Introduccion a la geoestadstica: Teora y aplicacion. Uni-versidad Nacional de Colombia, sede Bogota, Bogota DC, 2002.

    [7] Martn A Daz Viera and Ricardo Casar Gonzalez. Geoestadstica apli-cada. Notas de curso. Instituto de Geofsica, Universidad Nacional Au-tonoma de Mexico (UNAM). Instituto de Geofsica y Astronoma, CIT-MA. Cuba, 2002.

    [8] Roger S Bivand, Edzer J Pebesma, and Virgilio Gomez Rubio. Appliedspatial data: analysis with R. Springer, 2008.

    [9] Carlos Eduardo Melo Martnez et al. Analisis geoestadstico espaciotiempo basado en distancias y splines con aplicaciones. 2012.

    [10] Margaret Armstrong. Basic linear geostatistics. Springer, 1998.

    [11] Zhou Sheng-lu, Wu Shao-hua, He Jia, and Xu Ming-xing. Spatial varia-bility of soil heavy metals content under the influence of urban expan-sion. InBioinformatics and Biomedical Engineering (iCBBE), 2010 4thInternational Conference on, pages 14. IEEE, 2010.

    56

  • 8/13/2019 Proyecto Final GEOESTADSTICA

    57/57

    [12] Irene SOMMER C, Pilar FERNANDEZ L, Hilda RIVAS S, and Mar-

    garita E Gutierrez. La geoestadstica como herramienta en estudiosde contaminacion de suelos. anallsis de caso: Afectacion por arsenico,plomo y cadmio contenidos en jales mineros. Revista Internacional deContaminacion Ambiental, 16(4):205214, 2012.

    [13] Marc Van Meirvenne and P Goovaerts. Evaluating the probability of ex-ceeding a site-specific soil cadmium contamination threshold. Geoderma,102(1):75100, 2001.

    [14] M Amini, M Afyuni, H Khademi, KC Abbaspour, and R Schulin. Map-ping risk of cadmium and lead contamination to human health in soilsof central iran. Science of the total environment, 347(1):6477, 2005.

    [15] Pierre Goovaerts. Geostatistics in soil science: state-of-the-art and pers-pectives. Geoderma, 89(1):145, 1999.

    [16] R Developement Core Team et al. R: A language and environment forstatistical computing, 2005.

    [17] Edzer J Pebesma. The gstat package. 2007.

    [18] C Prignon, JC Micha, and A Gillet. Biological and environmental cha-racteristics of fish passage at the tailfer dam in the meuse river, belgium.

    Fish Migration and Fish Bypasses, page 69, 1998.[19] Daniel Pena. Fundamentos de estadstica. Alianza editorial, 2001.