Apuntes de geoestadística

25
Apuntes básicos de Apuntes básicos de geoestadística. geoestadística.

Transcript of Apuntes de geoestadística

Apuntes básicos de Apuntes básicos de geoestadística.geoestadística.

Apuntes básicos de Apuntes básicos de geoestadística.geoestadística.

SABER QUE ES ESTADÍSTICA

DEFINICIÓN DE CONCEPTOS BÁSICOS

SABER QUE ES GEOESTADÍSTICA

DEFINICIÓN DE CONCEPTOS BÁSICOS

OBJETIVO

ESTADÍSTICA

DEFINICIÓN

Como una disciplina moderna, provee de métodos y procedimientos para la colección, organización, resumen y análisis cuantitativos de información con el fin de obtener conclusiones útiles para tomar decisiones razonables en situaciones de incertidumbre.

En la toma de decisiones en cualquier rama pero sobretodo en la minería, siempre existe un nivel de incertidumbre y/o variabilidad el cual es necesario manejarlo en forma científica y objetiva para obtener un resultado eficiente. La estadística es la herramienta que hace posible tratar esta incertidumbre.

ESTADÍSTICA DESCRIPTIVA

Permite el resumen y la presentación de grandes cantidades de información de tal manera que facilita su comunicación e interpretación.

ESTADÍSTICA INFERENCIAL

Con el fin de llegar a una decisión sobre una población, se toma una muestra aleatoria de esa población. Sobre la base de ese muestreo, inferimos ciertos datos acerca de la población. Esta inferencia que hacemos sobre bases de este tipo de muestreo se conoce como inferencia estadística. Dicho en otras palabras, las técnicas de la estadística inferencial permite al investigador hacer inferencias y generalizaciones de pequeños grupos llamados muestras, a grandes grupos llamados poblaciones, con un buen grado de confianza.

MUESTREO DE POBLACIONES

El muestreo en un sentido estadístico, es la selección de parte de una población para representar toda la población. Donde la población consiste de unidades bien mezcladas y no difieren radicalmente una de otra (ej. granos de maíz en un costal), cualquier muestra, aún si es pequeña, es representativa del todo. Cuando, sin embargo, las unidades son muy diferentes y no están bien mezcladas tal como ocurre con los valores de oro en una mina, una pequeña muestra de esas unidades puede, en características esenciales, diferir radicalmente de la población.

El método de muestreo también puede contribuir a que las muestras no sean representativas principalmente en el sentido de introducción de un sesgo. Por ejemplo, en el muestreo en los costados de un montón de carbón, contendrá una gran proporción de fragmentos más grandes y, por lo tanto, tendrá un sesgo.

Otro ejemplo, en un depósito de oro, el muestreo realizado a lo largo de una fajilla, contendrá más fragmentos de las partes más suaves que de las partes más duras. Este tipo de errores no puede ser eliminado tomando más y más muestras y, por lo tanto, es particularmente peligroso. Aún cuando este sesgo sea eliminado, el error de muestreo se irá incrementando con la oportunidad que tengan todas las esquirlas de ser incluidas en la muestra (muestreo aleatorio). La magnitud de esos llamados errores de muestreo depende del tamaño de las esquirlas de la muestra tomada, del tamaño de la muestra misma (peso), la variabilidad en composición química del material, el procedimiento de muestreo, y el método de cálculo para obtener los resultados.

Una muestra aleatoria (al azar) es obtenida cuando la extracción de cada esquirla de la muestra es realizada de tal forma que cada esquirla de la muestra tiene la misma oportunidad de ser tomada (D.G.Krige,1981).

Universo El Universo es la masa total de material en el cual estamos interesados y es la fuente total de todos los datos posibles (Hazen, 1967 en M.David, 1977).

La definición de un Universo Geológico lleva a numerosas discusiones. Pero se puede definir como algo que define exactamente nuestra área de interés: un depósito mineral. Población Es el conjunto de todas las muestras posibles de un mismo tamaño obtenidas del universo. Diferentes tamaños de muestra determinan diferentes poblaciones del mismo universo.

Muestra Es una porción pequeña de un universo. Ejemplo: Los ensayes geoquímicos.  La Mina y la Planta de Beneficio ven el mismo Universo a través de diferentes tamaños de muestra, es decir, a través de diferentes poblaciones; por eso las leyes de la Mina no se parecen a las leyes de la Planta.

MEDIDAS DE TENDENCIA CENTRAL

Una de las aplicaciones más útiles en estadística es la representación de un grupo de datos por una medida de tendencia central, que no es otra cosa que un valor típico (promedio) del grupo. Hay tres medidas de tendencia central de uso común.

Media Por mucho, la medida de tendencia central más útil es la media aritmética. La media de un grupo de datos, es simplemente la suma de todas las observaciones dividida por el número de observaciones, y puede ser calculada mediante la fórmula:

m = Sx / N donde x son las observaciones y N es el número total de observaciones

Mediana Existen algunos problemas para definir a la mediana, por la razón que no se puede definir algebraicamente. Una de las definiciones más satisfactorias es que la mediana es el valor que está en el medio de un ordenamiento (un ordenamiento es un arreglo de datos organizados, en base a sus valores, de mayor a menor o de menor a mayor), dicho en otras palabras, la mediana es aquel punto o posición en la escala de la variable que divide el ordenamiento en dos partes iguales. Ejemplo: 93, 89, 76, 74, 50. El valor del medio es 76. Esta es la mediana.

Moda Es simplemente aquel valor de la distribución que se repite con mayor frecuencia.

MEDIDAS DE DISPERSIÓN

Dispersión es la tendencia de los valores individuales de una variable a separarse alrededor de la media o promedio. Por lo tanto, mientras mayores sean las diferencias que exhiban los valores individuales entre sí, menor ha de ser el grado de representatividad que un promedio pueda tener con respecto a la distribución total. Como regla general, podemos decir que un promedio será una medida representativa de una distribución sólo si se estima en base a datos que sean homogéneos, por eso es recomendable que en nuestro ambiente minero, se utilice la estadística como herramienta para limitar los valores atípicos y proporcionar presupuestos más confiables.

Los diagramas de correlación son gráficos muy útiles ya que se puede visualizar de manera muy rápida el grado de dispersión que existe entre las muestras de dos elementos.

Gráficas para mostrar las medidas de dispersión

Varianza Promedio de las desviaciones de todas las posibles observaciones con relación a la media de una población, elevadas al cuadrado (la varianza es al cuadrado para eliminar los valores negativos). Desviación Estándar Raíz cuadrada de la varianza [para regresar a nuestras unidades originales (g/t)]. La desviación estándar de una población mide la desviación de los valores con respecto a la media de la misma población. Una desviación estándar pequeña significa que las observaciones se encuentran cerradas o apiñadas contra un valor central. Por el contrario, una desviación estándar grande significa que los valores se encuentran ampliamente dispersos en torno a la media y que la tendencia a agruparse es débil.

Rango El rango o recorrido, es la diferencia entre los valores mayor y menor de los datos. Es la medida de dispersión más sencilla y fácil de entender, pero ofrece menos información que las otras medidas. Coeficiente de variación El coeficiente de variación es útil para comparar la dispersión relativa de dos variables aleatorias. Es definido como la desviación estándar entre la media.  C.V. = S / m Un coeficiente grande (> 1) indica la presencia de valores erráticos anómalos.

MEDIDAS DE FORMA

Asimetría.- Las medidas de asimetría indican la falta de simetría en la distribución y muestran la dirección hacia donde se inclina la distribución. Es posible definir una medida de asimetría en base a la diferencia entre la media y la moda, a causa de los efectos de los valores extremos. Al dividir esta diferencia entre la desviación estándar, se obtiene un coeficiente de asimetría: Asimetría = (m - Mo) / S donde: m = media, Mo = Moda y S = Desviación Estándar Cuando la distribución es asimétrica y se inclina hacia los valores altos, entonces la media es mayor que la moda y, como consecuencia, se dice que tiene un sesgo positivo. Si por el contrario, la asimetría es hacia el lado de los valores bajos, tiene un sesgo negativo.

Gráfica para mostrar las medidas de forma

Histograma El histograma es la forma más común para la presentación de datos clasificados. Es una gráfica a base de barras sin espacios intermedios. Se dibuja sobre un par de ejes coordenados poniendo las unidades de medida de las observaciones (g/t, %, etc.) en el eje horizontal y el número de observaciones en el eje vertical.

Con esta herramienta, uno puede observar:

El grado de dispersión de los valoresSus rangos de variaciónLa concentración de valores alrededor de una o varias modasDetectar posibles errores de captura, yDetectar los valores atípicos o anómalos

Curtosis La curtosis es el grado de achatamiento que exhibe una distribución con respecto a la distribución normal. Se dice que la distribución es Platicúrtica cuando el coeficiente de curtosis es menor a 3, es decir, que los valores están muy dispersos con respecto a la media. Mesocúrtica cuando es igual a 3 (distribución normal) y Leptocúrtica cuando es mayor a 3, es decir, cuando los valores están cercanos al promedio. Coeficiente de Correlación El término correlación se refiere al grado de correspondencia o relación entre dos variables. Las variables correlacionadas son esas que tienden a variar juntas; cuando una es más grande, la otra tiende a ser sistemáticamente más grande o más pequeña.

GEOESTADÍSTICA

EVOLUCIÓN DE LA GEOESTADÍSTICA

1945 – 1965.- La Geoestadística Lineal, la ciencia ahora llamada Geoestadística, tuvo su comienzo en los trabajos de H.S. Sichel en 1947 y 1949 en la aplicación de la distribución lognormal en minas de oro, seguido por la ahora famosa contribución de D.G. Krige en la aplicación del análisis de regresión entre muestras y bloques de mena, los cuales fijaron la base de la Geoestadística Lineal, además de la introducción de la teoría de funciones aleatorias por B. Matern en el estudio de la variación espacial de un campo forestal. Esta generación culmina en el trabajo de G. Matheron en su tesis doctoral de 1965 titulada: “Las variables regionalizadas y su estimación”.

1966 – 1974.- La Geoestadística No Lineal. La segunda generación vio el establecimiento de la escuela de Fontainebleau. En Mayo de 1968, fue creado el Centro de Geoestadística, en la atmósfera tranquila de Fontainebleau según Matheron (1987).

GEOESTADÍSTICA

Durante este periodo se hicieron grandes contribuciones por diversos autores, entre los que destacan: M. David, A.G. Journel, Ch.J. Hiujbrets, P. Delfiner, entre otros.

1974 – 1987.- La tercera generación estuvo dedicada a resolver problemas más complejos asociados con la selección y combinación de bloques de mena, Matheron introduce el modelo de Kriging Disyuntivo. Durante este periodo ocurrieron numerosas actividades relacionadas con el cambio de soporte, la función de transferencia, parametrización de reservas, selectividad de la distribución, la simulación, el estudio de casos multivariados, etc. En 1980 W.J. Kleingeld, propuso el problema de extrema asimetría distribuidos en porciones discretas del yacimiento. Durante este periodo, fue también desarrollado por A.G. Journel el Kriging de Indicadores y una forma especial de Kriging Disyuntivo.

GEOESTADÍSTICA

En la actualidad, los dominios de aplicación de la Geoestadística son amplios, sin mencionar directamente a la minería que es el campo que le dio origen, se pueden mencionar: El petróleo, en la caracterización de reservorios. La salud, en la distribución espacial de enfermedades. La ingeniería civil, en la construcción de obras de grandes dimensiones que exigen del conocimiento de la variabilidad espacial de las propiedades del terreno. En la cartografía, la hidrogeología, el medio ambiente, los campos forestales, etc.

¿¿Preguntas??¿¿Preguntas??¿¿Preguntas??¿¿Preguntas??