3.2Métodos Estadísticos Para La Estimación de Reservas

13
3.1.- Métodos Estadísticos para la Estimación de Reservas. La estimación de las reservas a través de la estadística clásica se basa en la teoría de las propabilidades, es decir el estudio de las variables aleatorias. Deberemos entender por variables aleatorias, aquellas que puedan tomar diferentes valores, en diferentes puntos del espacio, mostrando de esta manera un comportamiento de independencia de su ubicación espacial Al diferencia de los métodos convencionales, los métodos estadísticos trabajan con sólo una pequeña fracción de las muestras, que sin embargo pueden llegar a ser muy influyentes sobre la estimación, razón por la cual uno de los elementos más críticos de este tipo de métodos es el carácter representativo que deben tener las muestras utilizadas, para esto existen muchas técnicas de muestreo que deben tomarse en cuenta al momento de realizarse el muestreo. La principal ventaja de los métodos estadísticos, es que permiten conocer el error asociado a la estimación, expresado en términos de la variación que puede esperarse en torno a los parámetros estimados. Una ventaja adicional de este tipo de métodos, son que permiten constatar la existencia de correlaciones entre las diferentes variables en estudio, en general, independiente del método usado para la estimación, siempre será conveniente utilizar esta herramienta. Distribución de Frecuencias Una de las principales herramientas que utilizan los métodos estadísticos, son la forma en la cual se distribuyen las variables de interés dentro de nuestra base de datos. Existen tres tipos de distribuciones a considerar: - Distribución Observada - Distribución Verdadera - Distribución de Referencia La distribución observada, corresponde a la distribución muestral, obtenida a partir del conjunto de muestras que se utilizarán para la estimación. La distribución verdadera corresponde a la distribución de las variables en estudio, dentro del depósito, se trata justamente de la distribución que se desconoce y que se intentará inferir a través de la distribución observada. La distribución de referencia por su parte, es una distribución teórica de probabilidades, las cuales se utilizarán como referencia para realizar un ajuste de la distribución observada, y que sirva como hipótesis de distribución verdadera, para utilizarla más tarde 1

description

Metodos estadisticos para la estimacion de reserva

Transcript of 3.2Métodos Estadísticos Para La Estimación de Reservas

Page 1: 3.2Métodos Estadísticos Para La Estimación de Reservas

3.1.- Métodos Estadísticos para la Estimación de Reservas.

La estimación de las reservas a través de la estadística clásica se basa en la teoría de las propabilidades, es decir el estudio de las variables aleatorias. Deberemos entender por variables aleatorias, aquellas que puedan tomar diferentes valores, en diferentes puntos del espacio, mostrando de esta manera un comportamiento de independencia de su ubicación espacial

Al diferencia de los métodos convencionales, los métodos estadísticos trabajan con sólo una pequeña fracción de las muestras, que sin embargo pueden llegar a ser muy influyentes sobre la estimación, razón por la cual uno de los elementos más críticos de este tipo de métodos es el carácter representativo que deben tener las muestras utilizadas, para esto existen muchas técnicas de muestreo que deben tomarse en cuenta al momento de realizarse el muestreo.

La principal ventaja de los métodos estadísticos, es que permiten conocer el error asociado a la estimación, expresado en términos de la variación que puede esperarse en torno a los parámetros estimados.

Una ventaja adicional de este tipo de métodos, son que permiten constatar la existencia de correlaciones entre las diferentes variables en estudio, en general, independiente del método usado para la estimación, siempre será conveniente utilizar esta herramienta.

Distribución de Frecuencias

Una de las principales herramientas que utilizan los métodos estadísticos, son la forma en la cual se distribuyen las variables de interés dentro de nuestra base de datos. Existen tres tipos de distribuciones a considerar:

- Distribución Observada- Distribución Verdadera - Distribución de Referencia

La distribución observada, corresponde a la distribución muestral, obtenida a partir del conjunto de muestras que se utilizarán para la estimación.

La distribución verdadera corresponde a la distribución de las variables en estudio, dentro del depósito, se trata justamente de la distribución que se desconoce y que se intentará inferir a través de la distribución observada.

La distribución de referencia por su parte, es una distribución teórica de probabilidades, las cuales se utilizarán como referencia para realizar un ajuste de la distribución observada, y que sirva como hipótesis de distribución verdadera, para utilizarla más tarde para realizar inferencias en todos aquellos sectores de depósito que fueron cubiertos por el muestreo.

El problema que nace con esto es poder definir cuál de entre las opciones de distribuciones teóricas representa en mejor forma la distribución observada, para esto la literatura existente entrega generalmente dos opciones; la alternativa visual, y la alternativa analítica.

La opción visual, una de las más utilizada es muy sencilla y consiste en realizar un test gráfico visual, conocido como el "Test de Henry".

La alternativa analítica consiste en las mediciones analíticas, de las desviaciones que presentan los valores de la distribución observada, con respecto a los valores de la distribución teórica, que esta siendo probada para comprobar su aplicabilidad.

A pesar de que la teoría aporta con gran número de distribuciones teóricas de referencia, la experiencia muestra que las muestras de elementos de depósitos minerales tienden a distribuirse en dos distribuciones teóricas conocidas, las distribuciones Normales y la Lognormales.

1

Page 2: 3.2Métodos Estadísticos Para La Estimación de Reservas

La figura XXX muestra una de las herramientas gráficas mayormente utilizadas para conocer la forma en que se distribuirán los elementos de un muestreo, el histograma, que corresponde a un clásico gráfico bivariable, en forma de rectángulos, de los elementos obtenidos en la etapa de muestreo en categorías o rangos de valores, que sirva para referenciar las cantidades de muestras pertenecientes a este intervalo, concepto conocido como "frecuencia simple". Las distintas categorías para la tabulación de estos rangos son conocidas como intervalos de clase, mientras que el número de muestras contenidas en dicho intervalo corresponde a la "frecuencia de clase".

Fig. XXX, forma clásica para un Histograma de Frecuencias

Existen algunas variaciones a la forma clásica del histograma, en donde en vez de plotear las frecuencias de clase simple, se pueden utilizar:

- Las frecuencias relativas, correspondiente al cuociente entre la frecuencia absoluta (ni) y el número total de muestras (N) - Las frecuencias acumuladas , que corresponden a la suma entre las frecuencias relativas de los intervalos de clase menor más la frecuencia relativa del intervalo de clase actual.

La forma que adquiera la distribución dependerá muy fuertemente de la definición de los intervalos de clase, si estos son muy amplios, sólo se logrará observar la tendencia central de los datos, obviando estructuras menores que puedan existir a menor escala, y la posibilidad de estudiar la variabilidad de los datos. En el caso contrario, donde se ha definido un pequeño intervalo de clase, se generarán distribuciones muy amplias, lo que genera el riego de definir poblaciones extras, que en realidad correspondan más bien a pequeñas fluctuaciones dentro de una misma población. Para seleccionar los intervalos de clase, generalmente suelen utilizarse alguno de los siguientes criterios:

- Libre selección- Criterio de Sturgess

En el criterio de libre selección, el técnico selecciona la dimensión de los intervalos de clase que le interesa estudiar, lo que puede resultar bastante ventajoso para un minucioso estudio de la base de datos, determinación de diferentes poblaciones, presencia de valores erráticos,etc.

2

Page 3: 3.2Métodos Estadísticos Para La Estimación de Reservas

El segundo criterio es usado ampliamente, ya que entrega la dimensión del intervalo de clase que permite la mejor definición de la forma real de la distribución en estudio. Para estimar el intervalo de clase, Sturguess planteó las siguientes expresiones.

En donde :

NI : Corresponde al número de intervalos de claseIC : Corresponde a la dimensión del intervalo de claseN : Corresponde al número de muestras de la poblaciónXmín : Es el mínimo valor de la población muestralXmáx : Es el máximo valor de la población muestral

Distribución Normal o de Gauss - Laplace

La más importante de las distribuciones teóricas es la curva de propabilidades normal, también conocida como curva de Gauss. Esta distribución se rige de acuerdo a la siguiente expresión:

En donde :

μx : Valor medio o valor esperado poblacional

π : Valor de la constante Pi

σx : Valor de la desviación standard poblacionalEn este caso se dirá que la variable "x" tendrá un comportamiento normal, y que estará centrada en torno al valor de la media poblacional "μx", y sus valores se dispersarán de este valor central de acuerdo al valor de su varianza σ2 . Lo anterior puede expresarse en forma resumida por la notación: X~( μx,σ2 ).

Esta función se describe por una curva semejante a una campana, y puede apreciarse gráficamente en la siguiente figura.

Fig. XXX, Distribución Normal

3

Page 4: 3.2Métodos Estadísticos Para La Estimación de Reservas

Si sobre la función de distribución normal, se realiza un cambio de variable de acuerdo a;

Entonces la función resultante de nuestra nueva variable "y" tendrá una distribución simétrica con respecto a un valor central de cero, y su variabilidad total se expresará con una desviación standard de uno. Esta función de distribución generada recibe el nombre de tiene la distribución normal standard, y también presenta una distribución normal Y~( 0,1 ), expresada por la siguiente función;

Esta estandarización de la variable en estudio resulta muy útil, ya que en este caso el área delimitada entre la curva y el eje "X" tendrá un valor de uno, que corresponderá a un 100% de probabilidades de ocurrencia de un valor determinado. Esto nos permitirá definir los límites de confianza para valores de interés.

Estimadores de la Distribución Normal

Para una población con distribución normal, los principales mejores estimadores de la población serán:

Media Aritmética, es el valor de posición central más descriptivo de esta distribución, y para su estimación podremos emplear la siguiente expresión:

En donde:_X : Es el valor medio de las muestras Xi

En el caso de la distribución normal, el valor de la media aritmética coincide con otro valor de posición central, la "Mediana", que representa el punto central de las muestras, y desde el cual se contarán el mismo número de realizaciones de la variable en estudio, al ir alejándose en ambos sentidos de la mediana.

Varianza, es una medida de dispersión, que representa cuan dispersados están las muestras con relación a su valor medio. La varianza se estima como el valor promedio de las diferencias de las muestras on su valor medio, de acuerdo a la siguiente expresión :

Desviación Standard, es otra medida de dispersión, que nace de la anterior, y que permite contar con una unidad de medición de la dispersión en las mismas unidades que la variable en estudio. Para al calcular la raíz cuadrada de la Varianza:

Error o Desviación de la Media, entrega un parámetro para medir el nivel de confianza para la media, y se estima a partir del valor de la desviación standard. El error de la media varia directamente con las variaciones del depósito, y en forma lógica en forma inversamente proporcional con el número de muestras. La importancia de este parámetro es que es muy usado para la estimación de los límites de confianza.

4

Page 5: 3.2Métodos Estadísticos Para La Estimación de Reservas

Coeficiente de Dispersión, es un índice porcentual del grado de variabilidad del depósito con respecto a su valor central, y que es calculado a través de la siguiente expresión:

Límites de Confianza, reflejan el grado de seguridad en el muestreo y el riesgo asociado al valor medio estimado, y normalmente son utilizados para mostrar el porcentaje de certeza de que una distribución normal standard nos permita encontrar el valor central en un intervalo cuyos límites inferiores y superiores estén definidos (límites de confianza).

La teoría estadística condiciona la definición de los límites de confianza de acuerdo al número de muestras disponibles para el estudio.

Para el caso de una distribución normal reducida o standard, donde el número de muestras es superior a 25 realizaciones, los límites de confianza serán calculados de acuerdo a la expresión:

Para facilitar el cálculo del parámetro "t" se han construido tablas que permiten calcular en forma rápida el área bajo la curva comprendida entre diferentes intervalos simétricos respecto a la media poblacional. De esta forma tenemos que:

- Para t=+/- 1, La curva normal reducida tendrá un 68.26% de probabilidades de encontrar la media en el intervalo:

- Para t=+/- 2, La curva normal reducida tendrá un 95.44% de probabilidades de encontrar la media en el intervalo:

- Para t=+/- 3, La curva normal reducida tendrá un 99.74% de probabilidades de encontrar la media en el intervalo:

Un resumen de los límites de confianza, y de las probabilidades asociadas más utilizadadas quedan reflejados en la siguiente figura:

Fig. XXX, límites de confianza de una distribución normal standard

5

Page 6: 3.2Métodos Estadísticos Para La Estimación de Reservas

Si en cambio, la distribución normal reducida dispone de un número de muestras inferior a 25, se considerará al parámetro "p" como la incerteza, que se repetirá en ambos extremos de la curva gaussiana, de encontrar el valor medio de nuestra distribución en los límites de confianza, por lo que la expresión (1-2p) representará por el contrario la probabilidad de poder encontrar el valor medio de la población dentro de los límites;

Entonces los límites de confianza ya no serán estimados utilizando las tablas de probabilidades para distribuciones normales reducidas, sino que se estimarán utilizando los valores entregados por la distribución de "Student", que al igual que las tablas normales reducidas, podrán encontrarse disponibles en cualquier texto de estadística clásica.

Fig. XXX, límites de confianza en poblaciones de menos de 25 muestras

6

Page 7: 3.2Métodos Estadísticos Para La Estimación de Reservas

Distribución Lognormal En este caso, los valores de la variable en estudio se distribuyen en una curva asimétrica, de acuerdo a la función de densidad de población:

En donde :

μy : Es el valor medio de los logaritmos de las muestras

π : Valor de la constante Pi

σy2

: Corresponde a la varianza de los logarítmos de las muestras

Como el lector podrá percatarse, si en la función anterior se reemplazan los valores logarítmicos por una nueva variable "y", entonces esta nueva variable se regirá por la función de distribución normal. Esta es justamente una de las principales propiedades de esta distribución, el hecho que los logaritmos de los valores observados obedecen una distribución normal.

Esta función se describe por una curva continua, semejante a una campana achatada hacia uno de sus valores extremos, marcando una clara asimetría hacia los extremos poblacionales. De acuerdo a la dirección de esta asimetría podremos distinguir dos tipos de distribuciones lognormales, distribución lognormal de asimetría positiva y distribución lognormal de asimetría negativa (Ver Fig. XXX).

Fig. XXX, Distribuciones Lognormal; de asimetría negativa y de asimetría positiva

El caso de las distribuciones lognormales de asimetría positiva, estas normalmente están asociadas a yacimientos de baja ley, donde la mayor concentración de valores se produce en torno a leyes de valor sub económico, muy cercanas a cero. Un ejemplo típico de este tipo de distribuciones puede encontrarse en los yacimientos de Oro.

Las disbuciones lognormales de asimetría negativa por su parte, estas normalmente están asociadas a yacimientos de alta ley, donde la mayor concentración de valores se produce en torno a leyes de muy alto valor. Un ejemplo típico de este tipo de distribuciones puede encontrarse en los yacimientos de Hierro y en algunos casos de depósitos de caliza.

En el caso de las distribuciones lognormales, los principales estimadores son:

7

Page 8: 3.2Métodos Estadísticos Para La Estimación de Reservas

Media Aritmética de los Logaritmos, es uno de los valores de posición central, y para su estimación podremos emplear la siguiente expresión:

Donde:

es un estimador de , el valor medio de los logaritmos de las muestras

Xi : Corresponde al valor en ley de las muestras

Varianza de los Logaritmos, corresponde al coeficiente de dispersión de los valores logarítmicos de las muestras, y para su estimación usaremos la expresión;

es un estimador de , la varianza de los logaritmos de las muestras

A partir de los dos parámetros anteriores, se podrán estimar los siguientes parámetros;

Media Geométrica de los Logarítmos (m), es uno de los valores de posición central más representativos de este tipo de distribución , y en el caso de una distribución lognormal es equivalente con el valor de la mediana. Para su estimación podremos emplear la siguiente expresión:

Entonces es un estimador de

Varianza Geométrica, es uno de los valores de dispersión más representativos de este tipo de distribución , y para su estimación podremos emplear la siguiente expresión:

Entonces es un estimador de

8

Page 9: 3.2Métodos Estadísticos Para La Estimación de Reservas

Límites de Confianza, corresponden al grado de seguridad en el muestreo y el riesgo asociado al valor medio estimado, y corresponden a la probabilidad de que el valor verdadero del depósito u x sea menor que upx.

Cuando el número de muestras es considerable, se acostumbra usar las siguientes expresiones para el cálculo de los intervalos de confianza:

- Para un 68.26% de probabilidades de encontrar la media en el intervalo:

- Para un 95% de probabilidades de encontrar la media en el intervalo:

- Para un 99.7% de probabilidades de encontrar la media en el intervalo:

Distribución Lognormal Tri Paramétrica

En algunas circunstancias, ocurre que al aplicar el logaritmo sobre los valores de determinadas distribuciones asimétricas, que se presuponen lognormales, la curva resultante no adquiere la forma gaussiana esperada. En este caso existe la posibilidad de que la distribución efectivamente no tenga un comportamiento lognormal, pero también cabe la posibilidad que al intentar añadir una pequeña constante a la distribución de los logaritmos de las muestras, esta adquiera efectivamente una distribución lognormal. Este comportamiento se conoce como distribución lognormal triparametrica, donde el tercer parámetro, la constante añadida a la distribución es conocida como constante aditiva. Este tipo de distribución es muy común encontrarlo en las minas de Oro de Africa del Sur.

En este caso la función de distribución, tendrá la siguiente expresión:

Donde β corresponde a la constante aditiva o tercer parámetro.

Para determinar el valor de la constante aditiva, Rendu propone un proceso iterativo, en el cual se establece un valor de β que satisfaga la condición de simetría para los logarítmos de valores observados, más el valor de esta constante.

Si el número de muestras es suficiente, entonces la constante aditiva puede estimarse utilizando la siguiente expresión:

En donde;

M, corresponde a la mediana de la distribución, yF1 y f2 corresponden a los valores de las frecuencias acumuladas, para las respectivas probabilidades "p" y "1-p". Teóricamente puede utilizarse cualquier valor de "p", sin embargo valores entre 5 y 20% entregan mejores resultados.

9