ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn...

92
COLEGIO DE POSTGRADUADOS INSTITUCIÓN DE ENSEÑANZA E INVESTIGACIÓN EN CIENCIAS AGRÍCOLAS CAMPUS MONTECILLO SOCIOECONOMÍA, ESTADÍSTICA E INFORMÁTICA ESTADÍSTICA ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN MUESTREO SISTEMÁTICO EN DOS DIMENSIONES ASISTIDA POR MODELOS GEOESTADÍSTICOS HERNÁNDEZ JARQUÍN JUAN DIEGO T E S I S PRESENTADA COMO REQUISITO PARCIAL PARA OBTENER EL GRADO DE: MAESTRO EN CIENCIAS MONTECILLO, TEXCOCO, EDO. DE MEXICO 2006

Transcript of ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn...

Page 1: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

COLEGIO DE POSTGRADUADOS INSTITUCIÓN DE ENSEÑANZA E INVESTIGACIÓN

EN CIENCIAS AGRÍCOLAS

CAMPUS MONTECILLO SOCIOECONOMÍA, ESTADÍSTICA E INFORMÁTICA

ESTADÍSTICA

ESTIMACIÓN DE LA VARIANZA DE LA

PROPORCIÓN EN MUESTREO SISTEMÁTICO

EN DOS DIMENSIONES ASISTIDA POR

MODELOS GEOESTADÍSTICOS

HERNÁNDEZ JARQUÍN JUAN DIEGO

T E S I S

PRESENTADA COMO REQUISITO PARCIAL

PARA OBTENER EL GRADO DE:

MAESTRO EN CIENCIAS

MONTECILLO, TEXCOCO, EDO. DE MEXICO

2006

Page 2: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

La presente tesis titulada: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN

MUESTREO SISTEMÁTICO EN DOS DIMENSIONES ASISTIDA POR MODELOS

GEOESTADÍSTICOS, realizada por el alumno: HERNÁNDEZ JARQUÍN JUAN DIEGO

bajo la dirección del Consejo Particular indicado, ha sido aprobada por el mismo y

aceptada como requisito parcial para obtener el grado de:

MAESTRO EN CIENCIAS

SOCIOECONOMÍA, ESTADÍSTICA E INFORMÁTICA

ESTADÍSTICA

CONSEJO PARTICULAR

CONSEJERO ________________________________________________

DR. GUSTAVO RAMÍREZ VALVERDE

ASESOR ________________________________________________

DR. BENITO RAMÍREZ VALVERDE

ASESOR ________________________________________________

DR. EDUARDO CASAS DÍAZ

Page 3: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

AGRADECIMIENTOS

Al Consejo Nacional de Ciencia y Tecnología (CONACYT) por el apoyo económico

brindado durante la realización de mis estudios.

Al Colegio de Postgraduados, por haberme brindado la oportunidad de seguir mi formación

académica en sus aulas.

A los integrantes de mi Consejo Particular:

Al Dr. Gustavo Ramírez Valverde mi más sincero agradecimiento, por sus atinadas

indicaciones, paciencia y consejos mismos que me fueron de gran utilidad en la realización

del presente trabajo de tesis.

A los Doctores. Benito Ramírez Valverde, Eduardo Casas Díaz y Antonio Fernando

Martínez Alcántara por su orientación, apoyo y colaboración desinteresada en el presente

trabajo.

A mis profesores, compañeros de clase y todas aquellas personas que de alguna manera

fueron coparticipes de esta tarea, a todos gracias.

Page 4: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

DEDICATORIA

A mi esposa e hijo.

A la familia sanguínea, consanguínea y extendida.

A ti que desde el cielo aún me vigilas, comprendes y perdonas. †

Page 5: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

CONTENIDO

RESUMEN I

ABSTRACT II

ÍNDICE DE CUADROS III

ÍNDICE DE FIGURAS IV

ÍNDICE DEL ANEXO V

1. INTRODUCCIÓN 1

2 CONCEPTOS BÁSICOS DE MUESTREO 2

2.1 NOTACIÓN Y DEFINICIONES BÁSICAS 2

2.2 VARIABLES BAJO ESTUDIO 3

2.3 PARÁMETRO POBLACIONAL 4

2.4 DISEÑO DE MUESTREO 5

2.5 ESTIMACIÓN 6

2.6 EFECTO DE DISEÑO 8

2.7 SESGO 9

2.8 ERROR CUADRADO MEDIO 9

3. DIFERENTES ENFOQUES DE MUESTREO 10

3.1 ENFOQUE BASADO EN EL DISEÑO 10

3.2 ENFOQUE BASADO EN EL MODELO 11

3.2.1 EJEMPLO DE ESTRATEGIAS UTILIZADAS PARA ESTIMAR A

LA VARIANZA DE LA PROPORCIÓN BAJO EL ENFOQUE ACTUAL 13

3.3 ENFOQUE ASISTIDO POR EL MODELO 16

3.3.1 EJEMPLO DE ESTRATEGIAS UTILIZADAS PARA ESTIMAR A

LA VARIANZA DE LA PROPORCIÓN BAJO EL ENFOQUE ACTUAL 17

3.3.1.1 POST-ESTRATIFICACIÓN 17

3.3.1.2 ESTIMADOR DE RAZÓN 19

3.3.1.3 ESTIMADOR DE REGRESIÓN 20

4. MUESTREO SISTEMÁTICO EN DOS DIMENSIONES 23

4.1 ESTIMACIÓN DE LA PROPORCIÓN 24

4.2 ESTIMACIÓN DE LA VARIANZA EN EL MUESTREO SISTEMÁTICO

EN DOS DIMENSIONES 25

4.2.1 ÍNDICE DE AUTOCORRELACIÓN ESPACIAL DE GEARY 25

4.2.2 ESTADÍSTICA DE AUTOCORRELACIÓN ESPACIAL DE MORAN 27

5. CONCEPTOS BÁSICOS EN GEOESTADÍSTICA 28

5.1 DESCRIPCIÓN DE LA CONTINUIDAD ESPACIAL 29

5.2 ESTADÍSTICAS RESUMEN 29

Page 6: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

5.2.1 COVARIOGRAMA MUESTRAL 29

5.2.2 SEMI-VARIOGRAMA 30

5.3 COMENTARIOS 31

5.4 DEFINICIONES PREELIMINARES 31

5.4.1 MOMENTOS 31

5.4.2 ESTACIONARIDAD ESTRICTA 32

5.4.3 ESTACIONARIDAD DE SEGUNDO ORDEN 32

5.4.4- HIPÓTESIS INTRÍNSECA 33

5.5 TERMINOLOGÍA 34

5.6 ISOTROPÍA 35

5.7 ANISOTROPÍA 35

5.8 MODELOS TEÓRICOS DE SEMI-VARIOGRAMAS 35

5.9 ESTIMACIÓN DE LA VARIANZA GEOESTADÍSTICA 40

5.10 MODELACIÓN DE SEMI-VARIOGRAMAS 42

6. ESTIMADORES BAJO ESTUDIO 45

7. ESTIMADORES PROPUESTOS 47

8. SIMULACIÓN 48

8.1 FACTORES BAJO ESTUDIO 48

8.2 PROCESO DE SIMULACIÓN UNO A UNO 49

8.3 PROCESO DE SIMULACIÓN POR PROMEDIOS 52

9. RESULTADOS Y DISCUSIÓN 54

9.1 ANÁLISIS DE LA SIMULACIÓN UNO A UNO 54

9.2 ANÁLISIS DE LA SIMULACIÓN POR PROMEDIO 60

9.3 DISCUSIÓN DE LA SIMULACIÓN UNO A UNO 64

9.4 DISCUSIÓN DE LA SIMULACIÓN POR PROMEDIO 64

10. CONCLUSIONES Y RECOMENDACIONES. 65

11. BIBLIOGRAFÍA 66

12. ANEXOS 68

Page 7: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

I

RESUMEN

Fueron propuestos estimadores de la varianza de la proporción y se estudio su

comportamiento en condiciones similares a las que se presentan en los derrames de

petróleo.

En muestreo sistemático en dos dimensiones frecuentemente el área estudiada es pequeña,

dando como resultado poblaciones pequeñas; un ejemplo se presenta en derrames de

petróleo donde se hace uso de muestreo con el fin de estimar la proporción de suelo

contaminado (concentraciones mayores a 1000 ppm. de TPH’s). En casos como este, el

diseño de muestreo sistemático en dos dimensiones es una buena opción, ya que ofrece la

posibilidad de hacer estudios geoestadísticos acerca de la distribución del contaminante. En

este diseño existe el problema de que no es posible derivar analíticamente la varianza. El

objetivo del presente es trabajo proponer un estimador de regresión y una corrección a este

por el índice de autocorrelación de Geary, los cuales se basan en la construcción asistida

por el modelo de la variable auxiliar (concentración de TPH’s). Haciendo uso de

simulación se evaluó el desempeño de los estimadores propuestos en condiciones

semejantes a las que ocurren en estas situaciones; comparando su comportamiento con

estimadores propuestos anteriormente.

Los factores estudiados fueron: a) Modelo (wave y exponencial), b) La media y varianza

del proceso (980, 1000 y 1020 y 300 y 600 respectivamente) y c) Diferentes índices de

autocorrelación (bajo, medio y alto). Para el modelo exponencial el mejor comportamiento

en base a estabilidad en los diferentes índices de autocorrelación, sesgo y razón fue el

estimador de regresión propuesto. Mientras que para el modelo wave, el mejor estimador

fue el resultante de la corrección mediante el índice de Geary al estimador de regresión.

Page 8: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

II

Palabras clave: Muestreo sistemático en dos dimensiones, geoestadística, autocorrelación,

varianza, proporción.

ABSTRACT

Estimators of the proportion variance were proposed and was studied its behavior under

similar conditions to those that are presented in the petroleum spills.

In two-dimensional systematic sampling frequently the studied area is small giving as result

small populations, an example appears in petroleum spills, where sampling is used with the

purpose of estimate the contaminated soil proportion (superior concentrations to 1000 ppm.

of TPH’s). Two-dimensional systematic sampling design is a good option for this situation,

because it gives the possibility of geostatistics studies about the distribution of the polluting

agent. Under this design exists a problem since is not possible to derive analytically the

variance. The present work proposes a regression estimator and a correction to this by the

index of autocorrelación of Geary, which are based on the construction assisted by the

auxiliary variable (concentration of TPH’s) in the model. Using simulation the performance

of the estimators proposed was evaluated under similar conditions to which occur in these

situations; comparing its behavior with proposed estimators previously. The studied factors

were: a) Model (wave and exponential), b) the average and variance of process (980, 1000

and 1020) and (300 and 600) respectively and c) Different indices of autocorrelación (low,

regular and high). In the exponential model the best behavior on the basis of stability with

respect to the different autocorrelation index, bias, and ratio was achieve by the proposed

regression estimator. In the wave model the best estimator was the resultant of the

correction by means the Geary’s index to the regression estimator.

Key words: Two-dimensional systematic sampling, geostatistics, autocorrelation, variance,

proportion.

Page 9: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

III

ÍNDICE DE CUADROS

Cuadro 1. Razones promedio obtenidas para el modelo exponencial 54

Cuadro 2. Error cuadrado medio promedio para el modelo exponencial 55

Cuadro 3. Razones estimadas para el modelo wave 56

Cuadro 4. Error cuadrado medio promedio para el modelo wave 58

Cuadro 5. Comparación de Razones estimadas, bajo diferentes enfoques, para el modelo exponencial 60

Cuadro 6. Comparación de Error Cuadrado Medio, bajo diferentes enfoques,para el modelo exponencial 61

Cuadro 7. Comparación de Razones estimadas, bajo diferentes enfoques, para el modelo wave 62

Cuadro 8. Comparación de Error Cuadrado Medio, bajo diferentes enfoques, para el modelo wave 63

Page 10: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

IV

ÍNDICE DE FIGURAS

Figura 1. Representación de la selección de una muestra sistemática en dos dimensiones 23

Figura 2. Forma típica del semi-variograma 34

Figura 3. Comportamiento del modelo Efecto Nugget 36

Figura 4. Comportamiento del modelo Esférico 37

Figura 5. Comportamiento del modelo Exponencial 38

Figura 6. Comportamiento del modelo Gaussiano 38

Figura 7. Comportamiento del modelo Wave 39

Figura 8. Comportamiento del modelo Power 40

Figura 9. Relación de varianzas respecto al parámetro expresada en razones, bajo el modelo exponencial 55

Figura 10. Relación de varianzas respecto al parámetro expresada en razones, bajo el modelo wave 58

Page 11: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

V

ÍNDICE DE ANEXOS

Anexo 1. Ejemplo del código utilizado para la simulación uno a uno 68

Anexo 2. Ejemplo del código utilizado para la simulación por promedio 71

Anexo 3. Figuras obtenidas con simulación para algunas de las situaciones estudiadas 76

Page 12: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

1

1. INTRODUCCIÓN

El diseño de muestreo sistemático en dos dimensiones se realiza frecuentemente en

áreas pequeñas, teniéndose por tanto poblaciones pequeñas; como por ejemplo cuando se

estudian derrames de petróleo.

En instalaciones donde se maneja petróleo frecuentemente ocurren derrames, estos

suelen dejar graves daños al suelo y cuerpos de agua, por lo que es necesario contratar a

compañías especializadas en su restauración. Durante el desarrollo de estas labores se

monitorea la proporción de suelo contaminado (concentraciones mayores a 1000 ppm. de

TPH’s). El área es divida en cuadros regulares de 10 m * 10 m y un circulo al centro del

cuadro se toma representativo de la unidad procediendo conforme la Norma Oficial

Mexicana Emergente NOM-EM-138-ECOL-2002 publicada en el Diario Oficial de la

Federación (2002). El interés es estimar la proporción de unidades contaminadas.

En esta situación el diseño de muestreo sistemático en dos dimensiones es una

buena opción, ya que puede aprovechar la información para realizar estudios

geoestadísticos acerca de la distribución del contaminante. Este diseño de muestreo tiene el

problema de que no es posible calcular analíticamente la varianza de la proporción, debido

a que solo es tomado un elemento de cada dominio.

En este trabajo, basados en un modelo geoestadístico bajo el enfoque asistido en el

Modelo (Särndal y Wretman, 1992; Lehtonen y Pahkinen, 2004), se proponen los

estimadores de regresión ( )pV REGEST ˆˆ. , ( )pV REGEST ˆˆ . y una corrección a estos, la cual toma en

cuenta la autocorrelación presente ( )pV CjREGEST ˆˆ_. , ( )pV CjREGEST ˆˆ

_. . Mediante simulación se

compara el desempeño de los estimadores propuestos.

Page 13: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

2

Se realizaron 2 estudios de simulación, en el primero se estudia el comportamiento

de los estimadores basados en el diseño y los asistidos por el modelo y en el segunda se

revisan algunos casos particulares donde se incluye además al estimador, ( )pV SIMESTˆˆ

1. , el

cual proviene del enfoque basado en el modelo(Särndal, 1978; Thompson, 1997; Aubri y

Debouzie, 2001) y se estudia el comportamiento de los estimadores propuestos obtenidos

con solo una realización.

2. CONCEPTOS BÁSICOS DE MUESTREO.

Aquí se pretende dar el contexto básico, notación necesaria y terminología que

generalmente es utilizada en el área del muestreo y que servirá como referencia durante el

desarrollo del presente trabajo.

Las siguientes definiciones fueron tomadas de Lehtonen R. and Pahkinen E. J.

(1995).

2.1 NOTACIÓN Y DEFINICIONES BÁSICAS.

Definición 1. Población.

Una población finita u1,…,uk,…,uN de N elementos es considerada con sus

elementos etiquetados de 1 a N. Por simplicidad, al k-ésimo elemento de población se

representa por su etiqueta k, de tal manera que la población puede ser denotada por:

U = 1,2,…,k,…,N

Page 14: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

3

Definición 2. Muestra.

Se refiere a un subconjunto S = 1,…,k,…n que pertenece a la población U.

Donde el tamaño de muestra n, es el número de unidades o elementos en S, tal que n < N.

2.2 VARIABLES BAJO ESTUDIO.

La variable de estudio denotada por y, tiene valores poblacionales desconocidos

Y1,Y2,…,Yk,…,YN.

En algunos casos se requiere información de una variable de estudio adicional,

usualmente denotada por X, tiene valores poblacionales desconocidos X1,X2,…,Xk,…,XN.

También es frecuente utilizar información auxiliar. La variable auxiliar z representa

información adicional en poblaciones finitas y usualmente se asumen conocidos sus valores

para todos los elementos de la población z1,z2,…,zk,…,zN.

El conocimiento de la variable auxiliar es importante en la elección de un diseño de

muestreo adecuado por ser un reflejo de la estructura de la población.

Ejemplos de variables auxiliares son:

a) Medidas de tamaño. Son referidas a estructuras definas a manera de conglomerados

como pueden ser locaciones geográficas o subgrupos de población. Generalmente se tienen

disponibles la medidas de tamaño zk.

b) Variables de estratificación. Una variable auxiliar z puede ser usada para particionar la

población U en L estratos no interceptados o sobrepuestos, es decir cada elemento de la

población pertenece a uno y solo a un estrato, donde cada estrato es definido por tener

Page 15: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

4

características similares dentro de si y características diferentes entre si, con tamaños de

estratos N1,..,NL tal que ∑=

=L

h

h NN1

c) Muestreo polietápico. Generalmente una población U tiene una estructura jerárquica, es

decir elementos primarios están agrupados en unidades de población mas grandes que la

unidad, ejemplo grupos, conglomerados, etc.

Estas unidades de población pueden estar contenidas en unidades de población más grandes

de manera sucesiva.

2.3 PARÁMETRO POBLACIONAL.

Un parámetro de una población finita U, es una función de los valores poblacionales

Yk de la variable de estudio y, en algunos casos la función incluye valores poblacionales Zk

de la variable auxiliar z.

Entre los parámetros mas conocidos se encuentran el total, la razón y la media, cabe

señalar que este parámetro puede ser tratado como el parámetro de proporción si se cumple

que los valores de la variable de estudio son binarios, los parámetros anteriores se definen

como sigue:

Total ∑=

=N

k

kYT1

Razón xTTR /= , donde TZ es el total de la poblacional de la variable auxiliar Z.

Media ∑=

=N

k

k

N

YY

1

.

Page 16: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

5

2.4 DISEÑO DE MUESTREO.

El propósito principal de una encuesta por muestreo es estimar parámetros

poblacionales desconocidos (total, media, proporción, razón, etc.) además del posible error

de estimación (error estándar), todo esto a través de una muestra.

De manera formal, un diseño de muestreo es una función p(s) definida para cada

subconjunto s de U, tal que

( ) Ussp ⊂∀≥ ,0

( )∑ =s

sp 1

El diseño de muestreo induce propiedades estadísticas (esperanza y error de

muestreo) de las cantidades aleatorias (total, razón, media) estimadas mediante la muestra y

se refiere a la forma en la cual se extrae una muestra de la población fijada.

De acuerdo al diseño de muestreo fijado p(s), una probabilidad de inclusión se

asigna a cada elemento de población para indicar la probabilidad de inclusión del elemento

en la muestra. Para el elemento k de la población, la probabilidad de inclusión se denota por

πk., y se define

( )∑⊂

=sk

k spπ , donde la suma se realiza sobre todas las posibles muestras s que incluyan al

elemento k.

Un elemento de la población puede aparecer más de una vez en una muestra s si el

muestreo considera el reemplazo de los elementos seleccionados en la población después de

Page 17: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

6

cada extracción. Tal que el diseño de muestreo es del tipo con reemplazo. Por el contrario,

bajo el muestreo del tipo sin reemplazo, un elemento de la población puede aparecer en una

muestra s solo una vez.

La variable de estudio y es medida para los elementos pertenecientes a la muestra s.

Entonces los n valores muéstrales de y se denotan por nyy ,...,1 .

2.5 ESTIMACIÓN.

La herramienta utilizada para obtener estimaciones es llamada estimador. Un

estimador es una función que depende de la muestra seleccionada y se usa para estimar los

valores de los parámetros poblacionales.

Generalmente es deseable trabajar con estimadores insesgados y consistentes

respecto al diseño de muestreo.

Los estimadores insesgados son aquellos cuyo valor esperado es igual al parámetro

poblacional Θ esto es

Θ=

Θ

E

Los estimadores consistentes son aquellos que para algún valor estimado de Θ , ∧

Θ ,

la diferencia entre el valor estimado y el valor poblacional (real) converge a cero con

probabilidad uno, cuando se incrementa el tamaño de muestra, esto es,

0→

<Θ−Θ

εP cuando n ∞ , para todo ε > 0.

Page 18: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

7

A continuación se presentan algunos de los estimadores mas utilizados.

Total ∑=

=n

k

kyt1

ˆ

Razón xttr∧∧∧

= / donde xt∧

es el total estimado de la variable auxiliar conocida x.

Media ∑=

=n

k

k

n

Yx

1

, donde Yk = 1 si tiene el atributo deseado y 0 de otra forma

Al valor numérico obtenido de un estimador para una muestra seleccionada, se le

llama estimación.

Debido a que las estimaciones de los parámetros poblacionales dependen de la

muestra seleccionada, generalmente el valor de cada estimación varía de una muestra a

otra.

A esta variación, que describe la incertidumbre de la inferencia basada en una

muestra particular, se le denomina error de muestreo y es medido por la varianza Vp(s) de un

estimador.

Como Vp(s) depende del diseño de muestreo adoptado, también es denominada

varianza del estimador bajo el diseño actual.

El valor de la varianza del estimador puede ser estimado a través de una muestra

seleccionada utilizando el estimador de la varianza denotado por ( )spV∧

. A la raíz

cuadrada de ( )spV∧

se le conoce como el error estándar estimado del estimador.

Page 19: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

8

2.6 EFECTO DE DISEÑO.

En cada diseño de muestreo se hace uso de diferentes estimadores de la varianza del

estimador del parámetro poblacional de interés.

Una forma conveniente para evaluar un diseño de muestreo es comparando el

estimador de la varianza bajo el diseño de muestreo adoptado con el proveniente de un

esquema de muestreo de referencia con el mismo tamaño de muestra esperado.

Generalmente, el estimador de la varianza del diseño de muestreo simple aleatorio

con o sin reemplazo es seleccionado como referencia.

A la razón de estimadores de la varianza bajo diferentes diseños de muestreo se le

llama efecto de diseño (DEFF) y se define:

( ) ( ) ( )( )pV

pVp

msa

sp

ˆ

ˆˆDEFFp(s) =

donde p(s) se refiere al diseño de muestreo a comparar.

Como en la práctica difícilmente se encuentran disponibles los valores requeridos es

necesario estimarlos de la muestra seleccionada utilizando los correspondientes estimadores

de varianza. Por lo tanto una estimación del efecto de diseño es:

De manera general, el efecto de diseño puede ser definido para la estrategia

( )

∗∧

psp , , a la combinación de un diseño de muestreo y el estimador se le llama

estrategia, donde ( )sp denota el diseño de muestreo y ∗∧

p al estimador de P .

( ) ( ) ( )( )pV

pVp

msa

sp

ˆˆ

ˆˆˆ deffp(s) =

Page 20: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

9

( ) ( ) ( )

=∧

pV

pVp

msa

sp

ˆ

ˆˆˆ DEFF

**

p(s)

Como regla general tenemos que si DEFF = 1 entonces el diseño de muestreo actual

es igual de eficiente que el diseño muestreo simple aleatorio, si es menor que uno es mas

eficiente y si es mayor que uno es menos eficiente.

2.7 SESGO.

El sesgo de un estimador puntual Θ , del parámetro Θ , se define como la diferencia

entre el valor esperado de Θ y Θ . Se representa como sigue:

( ) ( ) ( ) Θ−Θ=Θ−Θ=Θ ˆˆˆ EEs .

2.8 ERROR CUADRADO MEDIO.

El Error Cuadrado Medio (ECM) de un estimador Θ , del parámetro Θ , es la

función definida por ( )2ˆ Θ−ΘE .

Page 21: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

10

3. DIFERENTES ENFOQUES DE MUESTREO.

Para abordar el problema de estimación en muestreo, actualmente existen tres

diferentes enfoques de muestreo los cuales tienen supuestos diferentes acerca de la

naturaleza de la población de estudio.

Debido a estas diferencias hay un problema conceptual al querer comparar de

manera directa las estimaciones obtenidas, por lo que son utilizadas solo como referencia

entre los diferentes enfoques.

3.1 ENFOQUE BASADO EN EL DISEÑO.

En el contexto Basado en el Diseño, la población es tratada como fija mientras que a

la muestra se considera como la realización de un proceso estocástico.

La inferencia se basa en la distribución de las estimaciones generadas por el diseño

de muestreo y no depende de ningún supuesto acerca de la distribución de los valores de kY

en la población. A esta distribución se le conoce como la distribución de aleatorización.

En este contexto la distribución, a la que se refiere con el objeto de inferir las

propiedades estadísticas de los estimadores, es la resultante de las estimaciones de todas las

muestras posibles bajo el diseño de muestreo adoptado. Por ejemplo, Stuart (1976) enumero

las 15 posibles muestras sin reemplazo de tamaño n = 2 de una población de N = 6.

Las estimaciones correspondientes a todas las posibles muestras es el conjunto de

referencia y la distribución de estas estimaciones es la distribución de referencia.

Page 22: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

11

Haciendo uso de los valores del conjunto de referencia se obtiene la esperanza y

varianza correspondientes a la distribución de referencia.

Aquí la naturaleza probabilística del diseño de muestreo es crucial como la única

fuente de aleatoriedad atribuida a cada una de las posibles muestras deΩ .

La varianza del estimador, es la varianza entre las estimaciones de todas las posibles

muestras deΩ y la distribución de referencia es la distribución de las estimaciones, y no la

distribución de los valores ky en la población.

Esto no quiere decir que la varianza del estimador p no será afectada por la

variabilidad de los valores de Uyk ∈ (Timothy G. Gregoire 1998). De hecho para algunos

casos especiales la varianza del estimador puede ser expresada analíticamente como

función de la varianza entre los valores Uyk ∈ , por ejemplo ( )N

PyUk yk

y

∑ ∈−

=2

σ ,

donde yP es el parámetro de la proporción.

En el ejemplo anterior la varianza del estimador y la varianza de los valores de y

son tomadas en cuenta con respecto a dos diferentes distribuciones en el contexto basado en

el diseño.

En este contexto la varianza del estimador no depende estadísticamente de la

distribución de los valores de Uyk ∈ .

3.2 ENFOQUE BASADO EN EL MODELO.

La diferencia fundamental entre el enfoque basado en el diseño y el basado en el

modelo para la inferencia en encuestas de muestreo es que los valores Nyy ,...,1 son tratados

Page 23: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

12

como realizaciones de las variables aleatorias NYY ,...,1 (Särndal 1978; Thompson 1997), la

población es la realización de un proceso aleatorio llamado Modelo, Modelo de

Superpoblación o solo Superpoblación.

La inferencia no solo puede concernir a uno o a más parámetros de la población

encuestada, si no también a los parámetros del Modelo Superpoblación, digamos Θ .

Debido a los supuestos del modelo crece el espacio de la inferencia para incluir

parámetros de Superpoblación, esto requiere de más supuestos que el enfoque Basado en el

Diseño.

El modelo puede basarse en experiencias anteriores y esta sujeto al conocimiento de

la materia. Bajo alguno de los siguientes criterios (Mínimos Cuadrados, Máxima

Verosimilitud, Riesgo Mínimax) el modelo se ajusta a datos muéstrales. Se verifica la

bondad de ajuste, si se juzga conveniente se realizan alteraciones.

Finalmente los resultados del modelo ajustado son publicados. Por la familiaridad

de ajustar modelos a los datos es por lo que es llamada inferencia basada en el modelo en el

contexto de encuestas por muestreo (Thompson 1978).

Sin considerar el nivel de detalle estipulado por el análisis de la encuesta, la

inferencia basada en este enfoque se fija en el modelo, no en el diseño de muestreo. La

distribución de referencia es la distribución de Y para una muestra dada, no la distribución

de Y sobre todas las posibles muestras.

El estimador de la varianza es tratado condicionalmente en la muestra observada;

esta es la variabilidad de las posibles realizaciones de Y para el conjunto de y valores

observados en la muestra, donde las “posibles realizaciones” son gobernadas por la

distribución de Y especificada en el Modelo.

Page 24: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

13

Para que la inferencia sea valida en este contexto, la selección de la muestra debe

ser no informativa (Särndal 1978) con respecto a Y .

En el enfoque basado en el diseño no existe incertidumbre alguna acerca de la

proporción poblacional, yP , cuando la población entera es censada; en el enfoque Basado

en el Modelo, yP , es una variable aleatoria y aun después del censo no se conocerá su valor

con certeza, así como también el de los parámetros, Θ , de la superpoblación (Timothy G.

Gregoire 1998).

3.2.1 EJEMPLO DE ESTRATEGIAS UTILIZADAS PARA ESTIMAR A LA

VARIANZA DE LA PROPORCIÓN BAJO EL ENFOQUE ACTUAL.

El siguiente ejemplo fue utilizado por Marcello (2003) en la estimación

geoestadística de la varianza para la media espacial en muestreo sistemático en dos

dimensiones.

Sea ( )oZ una función aleatoria Gaussiana isotropica estacionaria de segundo orden,

denótese por C a la respectiva matriz de covarianzas la cual esta definida por ( )ijhC , solo

en función de la distancia euclidiana ijh entre iu y ju debido a los supuestos de

estacionaridad e isotropía.

La función de covarianza se expresa en términos del semivariograma como

( ) ( ) ( )hChC γ−= 0 (Journel and Huijbregts 1978). Debido a que C debe de ser positiva

definida es necesario hacer uso de un modelo valido para ( )hγ (Mc-Bratney y Webster

1986, Cressie 1991).

Page 25: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

14

Para obtener simulación incondicional de la función aleatoria ( )oZ , aleatoria e

independientemente se generan L,...,1=ι realizaciones ( ) ( )oιZ las cuales proporcionan en

promedio, la misma estructura de autocorrelación espacial.

Las realizaciones son generadas sobre un conjunto finito de soportes

NuuU ,...,1= , generalmente definidos como los nodos del lattice regular Ω .

Las realizaciones ( ) Lz ,...,1=ιo son generadas por el siguiente procedimiento.

1) Estimación y moderación de la covarianza espacial haciendo uso de los datos

( ) ( ) ( ) ( ) nszsz 01

0 ,..., , donde nss ,...,1 es un subconjunto de unidades tomadas de U . Un

modelo de covarianza espacial ( )hC es obtenido ajustando un modelo de transición valido

al semivariograma experimental computado con los datos muéstrales de la manera siguiente

(Journel y Huijbregts 1978):

( )( )

( ) ( ) ( ) ( )[ ]( ) 2

1

00

2

1∑=

−+

=

hN

i

ii xzhxzhN

hγ , donde ( )hN es el numero de pares de unidades

separadas por la distancia h y ix el centroide de is .

El modelo se ajusta haciendo uso del procedimiento de mínimos cuadrados y se calcula la

covarianza usando la relación ( ) ( ) ( )hChC γ−= 0 con ( )0C el sill del semivariograma.

2) Computo de la matriz C por medio del calculo de ( )ijhC para las distancias ijh entre ix y

jx para todas las unidades Uuu ji ∈, .

3) Se factoriza a C como C = L Lt.

4) 1+← ll , se genera el vector w conformado por desviaciones aleatorias Gaussianas.

5) Sea ( )tNzzz ,...,1= el vector de valores de la realización ( )oz localizada en las unidades

Nuu ,...,1 . La simulación incondicional de la l-ésima realización es calculada por

Page 26: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

15

Lwz += µ , donde w es un vector aleatorio de las desviaciones aleatorias ( )Niwi ,...,1=

obtenidas de la distribución normal (0,1).

6) Calculo de la media poblacional ( )lDz de la realización de la realización

( ) ( ) ( ) ( ) ( ) ( ) Nuzuzz lllo ,...,1= .

7) Se muestrea la realización ( )( )olz siguiendo el diseño de muestreo elegido y es estimada

la proporción muestral lsp∧

.

8) Se calcula el error de estimación ( )lsls pP

−=lε , donde lsP es el parámetro de proporción

de la l-ésima realización.

9) Si l < L, entonces se regresa al paso 4, de otro modo el numero de realizaciones

requeridas esta completo.

Nota: En este caso el valor de µ es irrelevante y se puede seleccionar el valor de 0=µ .

10) La estimación de la varianza del error

lsls pPVarξ , denotada por 2Eσ (Journel y

Huijbregts 1978), se aproxima por

( )( )2

1

2

1

1∑=

=L

l

EL

εεσ l donde ( )∑=

=L

lL 1

1 lεε .

Page 27: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

16

3.3 ENFOQUE ASISTIDO POR EL MODELO.

La estimación asistida por el modelo se refiere a las propiedades de los estimadores

(como el del modelo de regresión lineal) que son usadas en la incorporación de la

información auxiliar en el procedimiento de estimación de los parámetros de interés

(proporción) de la población finita.

Algunos métodos de estimación asistida en el modelo son post-estratificación,

razón, regresión, los cuales son casos particulares de los llamados estimadores de regresión

generalizados. Estos métodos propuestos mejoran las estimaciones de una muestra dada

haciendo uso de la información auxiliar disponible de la población.

De esto pueden resultar estimaciones cercanas al valor poblacional real y una

reducción a la varianza del diseño del estimador obtenido de los datos muestreados.

Algunos modelos relacionan a X con Y , asistiendo durante la etapa de diseño para

ayudar a elaborar un diseño conveniente (por ejemplo el diseño de muestreo con

probabilidad proporcional al tamaño de muestra), o un estimador eficiente (ejemplo el

estimador de razón generalizado), pero la inferencia permanece firmemente arraigada en el

diseño (Timothy G. Gregoire 1998).

Bajo este enfoque se trata de obtener estimadores con buenas propiedades Basadas

en el Diseño y que no obstante necesitan de un modelo descriptivo.

El papel del modelo es describir la dispersión de la población finita. Se espera que el

modelo se ajuste a la población razonablemente bien. Se piensa que la población finita

luzca como si su influencia haya sido generada de acuerdo con el modelo.

Sin embargo, el supuesto nunca es hecho en que la población fue realmente

generada por el modelo. Las conclusiones acerca de los parámetros de la población finita

Page 28: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

17

son por consiguiente independientes de los supuestos del modelo (Särndal y Wretman,

1992).

El principal interés es introducir estimadores que pueden ser usados con la muestra

seleccionada para obtener mejores estimaciones de los parámetros de interés, comparadas

con las estimaciones obtenidas con los estimadores basados en el diseño de muestreo

adoptado.

Suponiendo que apropiados datos auxiliares son disponibles de la población como

un conjunto de variables auxiliares. Algunas pueden ser categóricas y otras continúas.

Algunas quizás usadas para el procedimiento de muestreo y otras pueden ser usadas para

mejorar la eficiencia.

Una forma de mejorar la eficiencia es usar una variable auxiliar x , la cual esta

relacionada con la variable de estudio y , para la reducir la varianza del estimador de la

proporción poblacional bajo el diseño inicial (Lehtonen R. and Pahkinen E. J. 2004).

Con estos métodos, una sustancial ganancia en eficiencia y un incremento en la

exactitud son frecuentemente logrados.

3.3.1 EJEMPLO DE ESTRATEGIAS UTILIZADAS PARA ESTIMAR A LA

VARIANZA DE LA PROPORCIÓN BAJO EL ENFOQUE ACTUAL.

3.3.1.1 POST-ESTRATIFICACIÓN.

En la estimación asistida por el modelo, una variable auxiliar x es requerida, la cual

debe estar relacionada con la variable de estudio y .

Page 29: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

18

Si esta variable es categórica, la poblaciónU puede ser particionada en

subpoblaciones Gg UUU ,...,,...,1 de acuerdo a algún criterio de clasificación.

En la post-estratificación, estas subpoblaciones son llamadas post-estratos. Si los

post-estratos son homogéneos internamente, este particionamiento puede capturar una gran

parte de la varianza total de la variable de estudio, resultando en una disminución de la

varianza de un estimador basado en un diseño.

De tal manera que los estratos son formados con elementos similares haciendo

pequeña la varianza dentro de los estratos y grande entre estratos. Cabe señalar que un

elemento solo puede pertenecer a un y solo un estrato (condición de no intercepción).

La post-estratificación puede ser usada para obtener estimaciones puntuales más

exactas y reducir el sesgo de las estimaciones muéstrales causadas por la no respuesta.

Debido a que se esta estratificando después de la colecta de datos, no es posible

suponer algún esquema de asignación especifico. El tamaño de muestra n es fijo pero el

como se asigna en los diferentes estratos no se conoce hasta que la muestra es extraída.

Esta propiedad no causa daño alguno a la estimación de la proporción, pero la

estimación de la varianza requiere de más atención.

El estimador post-estratificado de la proporción P de y esta dado por

∑∑∑∑∑= =

= =

∧∗

=

∧⋅⋅

=⋅

==G

g

n

k g

ggkgkG

g

n

k g

ggkG

g g

g

post

gg

N

twg

N

tw

N

tp

1 11 11

ˆ , donde gt∧

es el total estimado para el

estrato g; ∧

=

g

g

gk

N

Ng son los pesos g;

n

NnN

g

g

⋅=

es el tamaño estimado del post-estrato g;

gN el tamaño de post-estrato g y los pesos originales de muestreo sonN

Nw

g

gk = .

Page 30: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

19

La varianza de postp puede ser determinada en varias formas, dependiendo del uso

de la configuración de la muestra observada. Esta se refiere en como se encuentra

distribuidos los tamaños de muestra gn en los pos-estratos y si estos son tomados en cuenta

es usada la varianza condicional (Lehtonen R. and Pahkinen E. J. 2004).

( )g

gG

g g

g

Ggpostconsrs

n

s

N

nnnnpV

=

−=

2

11, 1,..,,...,ˆ , donde la varianza de los pos-estratos esta

dada por ( )

( )∑=

−=

gn

k g

ggk

gn

yys

1

2

2

1.

3.3.1.2 ESTIMADOR DE RAZÓN.

El estimador de razón puede ser utilizado para mejorar de la estimación de P , si una

variable auxiliar continua x es disponible.

La media poblacional x junto con su respectivo estimador sx y los valores de las n

variables muéstrales kx se requieren para este método.

Tal información puede ser obtenida de registros administrativos o de estadísticas

oficiales. Esta información se utiliza para mejorar la estimación de P . Se calcula el

estimador muestral sx

pr

∧∧

= de la razón x

PR = y se multiplica

r por la media conocida x .

El estimador de razón puede ser muy eficiente si la razón, k

k

x

y de los valores de las

variables de estudio y auxiliar, es constante a través de la población.

Page 31: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

20

El estimador de razón de la proporción P de y bajo el diseño de muestreo simple

aleatorio sin reemplazo es xrpraz

×=∧∧

.

En la expresión anterior∧

r es una variable aleatoria y UZ es una constante. Por lo

tanto, la varianza de razP puede ser escrita como:

⋅=

∧∧

rVxpV srsrazsrs

2.

Una aproximación al estimador de la varianza esta dada por

∑=

∧∧

⋅−

−=

n

k

kk

razsrs

n

xry

nN

npV

1

2

1

11 .

3.3.1.3 ESTIMADOR DE REGRESIÓN.

La variable auxiliar x frecuentemente es continua. Si esta correlacionada

fuertemente con la variable de estudio y , se puede asumir un modelo de regresión lineal

con y como la variable dependiente y x como el predictor.

Esta regresión puede ser estimada de la muestra observada y usada en la estimación

del parámetro original.

La estimación de regresión de la proporción poblacional, p , de la variable de estudio y , se

basa en la regresión lineal entre la variable de estudio y la variable auxiliar continua x .

La regresión lineal puede por ejemplo, ser dada por ( ) kkM XyE ⋅+= βα con

varianza ( ) 2σ=kM yV , donde las ky son variables aleatorias independientes, con los

valores poblacionales kY supuestos como sus realizaciones, βα , y 2σ son parámetros

Page 32: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

21

desconocidos, kX son los valores poblacionales conocidos de x , y ME y MV se refieren

respectivamente al valor esperado y varianza bajo el modelo.

En poblaciones finitas las expresiones análogas a βα , , se denotan por A yB , los

cuales son estimados de la muestra haciendo uso de la estimación de mínimos cuadrados

ponderados tal que el diseño de muestreo es apropiadamente tomado en consideración.

Es inmediatamente obvio que múltiples variables auxiliares pueden también ser

incorporadas en el modelo. Nótese que el supuesto del modelo introduce un nuevo tipo de

aleatoriedad; en las estimaciones consideradas anteriormente, la selección de la muestra fue

la única fuente de variación.

Considérese el principio básico de la estimación de regresión para el diseño de

muestreo simple aleatorio sin reemplazo y utilizando el modelo de regresión con una sola

variable auxiliar.

Las cantidades, para la población finita, A y B son estimadas por el método de

mínimos cuadrados ordinarios obteniéndose a 2

z

yz

s

sb

∧∧

= como un estimador deB y

zbpa ⋅−=∧∧∧

como el estimador del intercepto A , donde yzs∧

es la covarianza estimada entre

la variable de estudio y la variable auxiliar; 2

zs∧

es la varianza estimada de la variable

auxiliar.

Por tanto, el estimador de regresión de la proporción, p , de y esta dado por

( )xXbpp reg −⋅+=∧∧∧

con x el estimador de X .

Page 33: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

22

Una aproximación a la varianza de regp∧

bajo el diseño de muestreo simple aleatorio

sin reemplazo esta dada por 21

1 ∧∧∧∧

−=

eregsrs snN

npV , donde ∑

=

∧∧

=∧n

k

k

e

n

ee

s1

2

2

1,

∑∧

=S n

ee y

kkk yye∧∧

−= es el error obtenido entre el valor predicho y el

valor observado para la unidad k.

Los valores ajustados kkzbay ⋅+=

∧∧∧

son obtenidos de los valores muéstrales con

( )

( )∑

−⋅−

=

S k

S kk

zz

pyzz

b2

y zbpa ⋅−=∧∧∧

.

Page 34: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

23

4. MUESTREO SISTEMÁTICO EN DOS DIMENSIONES.

El muestreo sistemático en dos dimensiones consiste en seleccionar aleatoriamente

un punto inicial y los puntos restantes quedan determinados de acuerdo a algún patrón

regular, por ejemplo un arreglo rectangular.

En este caso si se desea una muestra sistemática en dos dimensiones de tamaño n,

los N cuadros se agrupan en RC nnn •= subregiones rectangulares no sobrepuestas

llamadas dominios, cada uno conteniendo RC kkk •= cuadros ( CC kCn = y

RR kRn = son enteros)

Figura 1. Representación de la selección de una muestra sistemática en dos dimensiones.

Page 35: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

24

La muestra se obtiene seleccionando aleatoriamente un cuadro del primer dominio y

entonces los demás cuadros que ocupan la misma posición en los demás dominios son

seleccionan automáticamente.

La formación de un estrato dimensional se realiza uniendo dos dominios adyacentes,

ya sea horizontal o verticalmente.

4.1 ESTIMACIÓN DE LA PROPORCIÓN.

Un estimador insesgado de la proporción poblacional de Z en D esta dado por:

n

Z

p

n

i

ij

sisespj

∑== 1

..ˆ

El error de muestreo (varianza del estimador de la proporción poblacional) es:

( )( )

k

pp

pV

k

j

sisespj

sisespjSISESP

∑=

= 1

2..

...

ˆ

ˆ

Donde sisespjp ..ˆ es la proporción estimada de la j-ésima muestra. Por lo tanto un

estimador insesgado de la varianza, con respecto al diseño de muestreo, requiere de la

selección de al menos dos muestras sistemáticas independientes. Note que con una muestra,

solo se puede obtener una aproximación de la varianza.

Page 36: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

25

4.2 ESTIMACIÓN DE LA VARIANZA EN EL MUESTREO SISTEMÁTICO EN DOS

DIMENSIONES.

El problema de estimar el error de muestreo para el caso bidimensional a través de

solo una muestra sistemática es más difícil de resolver que para el caso lineal debido a que

las unidades se encuentran arregladas o colocadas en un plano en vez de una línea.

El único estimador que puede usarse sin tomar en cuenta el arreglo espacial de las

unidades, es el que se deriva del muestreo simple aleatorio.

Se esperan buenas estimaciones solo si la distancia entre los cuadros muestreados es

suficientemente grande para hacer la correlación espacial pequeña o en el mejor de los

casos ausente, sin embargo se subestima el valor de la verdadera varianza en presencia de

alta homogeneidad entre las unidades de la muestra (Wolter 1985, P.250).

A continuación se da, para la extensión del muestreo sistemático en dos

dimensiones, dos buenas aproximaciones de estimadores de la varianza utilizados en el

contexto unidimensional.

4.2.1 ÍNDICE DE AUTOCORRELACIÓN ESPACIAL DE GEARY.

La aproximación del estimador de la varianza que se utiliza cuando la población

esta estratificada implícitamente ( ) ( )( )( )12

11ˆˆ 2

.2 −•••−=

∑=

n

a

nfpV

n

i

i

sis para el caso

unidimensional puede ser vista como una corrección del estimador de la varianza de un

muestreo simple aleatorio.

Page 37: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

26

Observe que para el caso de muestreo sistemático lineal.

( ) ( ) ( )2

ˆˆ2

ˆˆˆˆ.1.2

k

MSA

k

sissis

dpV

dpVpV •=•= , donde kd es el estadístico de Durbin – Watson.

Por consiguiente en la ausencia de autocorrelación 2=kd y se espera que la

aplicación de muestreo sistemático sea igual de eficiente que la aplicación del muestreo

simple aleatorio.

Por el contrario, en presencia de autocorrelación positiva )20( << kd se obtienen

mejores resultados utilizando el muestreó sistemático ocurriendo lo contrario en la

presencia de autocorrelación negativa, es decir )42( << kd .

La extensión del estadístico Durbin – Watson al contexto espacial se representa por

el índice de autocorrelación espacial de Geary.

( )

( )∑

∑∑

∑∑=

= ≠

= ≠

•−•

−=

n

i

i

il

n

i

n

li

li

n

i

n

jl

il

j

pZ

ZZn

c

1

2

1

2

1

ˆ2

δ, donde 1=ilδ si la i-ésima y la l-ésima unidad

se encuentran en dominios adyacentes y 0=ilδ de otro modo.

Entonces ( ) ( ) jsisMSAsisESTESP cpVpV •= ˆˆˆˆ. , donde jc es el índice estimado de Geary

para la j-ésima muestra sistemática en dos dimensiones (D’Orazio, 1999). Este índice mide

el grado de semejanza entre las unidades muéstrales.

Valores de jc cercanos a 0 indican un alto grado de autocorrelación espacial y por

ende el muestreo sistemático en dos dimensiones resulta ser más eficiente que un muestreo

sistemático simple aleatorio. Valores de jc cercanos a 1 indican ausencia de

autocorrelación espacial dando como resultado que un muestreo simple aleatorio es igual de

eficiente que un muestreo sistemático en dos dimensiones.

Page 38: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

27

4.2.2 ESTADÍSTICA DE AUTOCORRELACIÓN ESPACIAL DE MORAN.

De manera similar a la anterior aproximación de la varianza, se puede llevar a cabo

la extensión al caso dimensional, de la aproximación del estimador de varianza utilizada en

el caso lineal cuando la población se encuentra autocorrelacionada ( )pV sis ˆ.3 .

Esto se logra sustituyendo en la formula el índice de autocorrelación qρ por su

contra parte para datos espaciados: el estadístico de Moran.

( ) ( )

( )∑

∑∑

∑∑=

= ≠

= ≠

•−•−•=

n

i

ji

n

i

n

il

ijjiji

n

i

n

il

ij

j

pZ

pZpZn

l

1

2

1

1

ˆ

ˆˆ δ

δ, donde 1=ijδ si la i-ésima y la

l-ésima unidad se encuentran en dominios adyacentes y 0=ijδ de otro modo. Este índice

mide el grado de desemejanza entre las unidades muéstrales.

Valores de jl cercanos a 1 indican un alto grado de autocorrelación espacial y por

ende el muestreo sistemático en dos dimensiones resulta ser más eficiente que un muestreo

sistemático simple aleatorio.

Valores de jl cercanos a 0 indican ausencia de autocorrelación espacial dando como

resultado que un muestreo simple aleatorio es igual de eficiente que un muestreo

sistemático en dos dimensiones.

Page 39: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

28

5. CONCEPTOS BÁSICOS EN GEOESTADÍSTICA.

El presente trabajo hace uso de modelos geoestadísticos con el fin de obtener los

estimadores de la varianza propuestos por lo que se estudia los conocimientos elementales

acerca de la ciencia aplicada denominada geoestadística con el fin de tener una percepción

más clara en el desarrollo de las secciones posteriores. El capitulo fue basado bajo el

enfoque de Chauvet P. (1993).

La Geoestadística, estudia las variables distribuidas espacialmente, partiendo de una

muestra representativa del fenómeno de estudio, utilizando como elemento fundamental el

análisis de la distribución espacial de la información disponible, proponiendo minimizar la

varianza del error de estimación.

Geoestadística es la aplicación de la teoría de las variables regionalizadas, es decir

las variables que presentan una estructura espacial de correlación, a la estimación de

procesos o fenómenos espaciales.

Desde un punto de vista teórico, la Geoestadística se basa en conceptos y

herramientas ya existentes en otros campos de la Estadística como procesos estocásticos

estacionarios, técnicas de análisis de la variancia y predicción por mínimos cuadrados, con

una extensión al caso de funciones aleatorias en dos o más dimensiones (Chica Olmo et al.,

1995).

Page 40: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

29

5.1 DESCRIPCIÓN DE LA CONTINUIDAD ESPACIAL.

En la mayoría de los datos de geociencias existe continuidad espacial, es decir,

datos de puntos cercanos tienen mas probabilidad de ser similares entre si que datos de

puntos lejanos.

A continuación de mencionan algunas de las herramientas mas utilizadas para el

análisis estructural de la población bajo estudio.

5.2 ESTADÍSTICAS RESUMEN.

Las siguientes estadísticas resumen proveen información sobre la covarianza.

Indican el tipo de dependencia o correlación que tienen los datos de los puntos con sus

vecinos.

5.2.1. COVARIOGRAMA MUESTRAL.

Es una medida de Semejanza de los valores de los puntos que se encuentran

separados a una distancia y dirección h y se define como:

( ) ( ) ( )( )hXZXZhC += ,covˆ

( ) ( )( ) ( )( )hi

hN

i

hi mhXZmXZhN

hC +=

− −+•−•= ∑)(

1)(

Page 41: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

30

( ) ( ) ( ) hhi

hN

i

i mmhXZXZhN

hC +−=

−•−+••= ∑)(

1)(

Donde )(hN es el número de pares de lugares ( )hXX ii +, que se encuentran en los

datos con ( )

( )( )

∑=

− ⋅=hN

i

ih xzhN

m1

1 y

( )( )

( )

∑=

+ +⋅=hN

i

ih hxzhN

m1

1

Valores grandes de ( )hC indican que existe mucha relación entre los puntos

( )hXX ii +, .

5.2.2 SEMI-VARIOGRAMA.

A diferencia de las medidas anteriores esta es una medida de desemejanza. Es decir

valores grandes de ( )h∧

γ implican que no existe mucha relación entre los valores de iX y

hX i + .

( )( )

( )( ) ( )[ ]2

1

2

1ii

hN

i

XZhXZhN

h −+••

= ∑=

γ

Debido a que el semi-variograma ( )h∧

γ depende de la dirección y de la magnitud del

vector h es necesario para obtener una primera impresión global, hacer un semi-variograma

omnidireccional. Se promedian todas las direcciones de h y se expresa ( )h∧

γ solo en

función de h .

( ) ( ) ( ) ( )[ ]∑ −•−

=∧

ji xX

ji XZXZhN

h,

2

2

1γ , con hXX ji =−

Page 42: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

31

El cálculo del semi-variograma experimental es la herramienta geoestadística más

importante en la determinación de las características de variabilidad y correlación espacial

del fenómeno estudiado.

5.3. COMENTARIOS.

Variogramas y covariogramas calculados en una dirección son iguales a los

calculados en dirección opuesta.

( ) ( )hh −=∧∧

γγ

Los variogramas y covariogramas no son constantes para una variable (ejemplo la

varianza), sino que son funciones del vector h, es decir, el valor obtenido depende de la

magnitud y dirección de h.

Las estadísticas resumen univariadas (como la media, mediana, varianza, etc.), las

bivariadas aquí mostradas y gráficos son útiles para: detectar errores en los datos, detectar

valores atípicos y su impacto, tener cierto conocimiento sobre las distribuciones de las

variables y las relaciones entre ellas.

5.4 DEFINICIONES PREELIMINARES.

5.4.1 MOMENTOS

Momentos de primer orden: Si la función de distribución de Z(Xi) tiene una media

definida, será una función de la localización Xi.

Page 43: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

32

m(xi) = EZ(xi)

Momento de segundo orden: Si la varianza (Var) de Z(Xi) existe, entonces se define

como el momento de segundo orden y será también una función de la localización Xi.

Var Z(xi) = E[Z(xi) - m(xi)] 2

Si la varianza de las variables Z(Xi) y Z(Xj) existe entonces la covarianza (Cov) de

éstas también existe y es función de las localizaciones Xi y Xj

Cov[Z(Xi), Z(Xj)] = E[Z(Xi) - m(Xi)][Z(Xj) - m(Xj)]

Como caso particular tenemos que si Xi = Xj entonces

Cov[Z(Xi), Z(Xj)] = Var Z(Xi)

5.4.2 ESTACIONARIDAD ESTRICTA.

Se dice que Z(X) es estrictamente estacionaria si la función de distribución de

probabilidades de las variables aleatorias Z(Xi) son iguales entre sí, independiente de la

localización Xi, lo que requiere que los momentos de distinto orden para cada variable

aleatoria regionalizada sean completamente independientes de la localización Xi.

Esta condición como su nombre lo indica es demasiado restrictiva al estudiar la

mayoría de los fenómenos encontrados en la práctica.

5.4.3 ESTACIONARIDAD DE SEGUNDO ORDEN.

Esta condición es más frecuente en la práctica, la misma exige que:

1) EZ(xi) = m, exista y no dependa de la localización Xi.

Page 44: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

33

2) La función covarianza, CovZ(Xi) - Z(Xj), exista y sólo dependa de la longitud del

vector h = Xi - Xj o sea.

C(h) = CovZ(xi), Z(xj) = EZ(xi), Z(xi+h) - m2

Esta hipótesis requiere la estacionaridad sólo para la media y para la función de

covarianza de la variable aleatoria regionalizada.

La segunda condición implica, estacionaridad de la varianza y del variograma.

1o Var[Z(xi)] = E[Z(xi) - m]2 = C(0) ∀x

2o γ(h) = E[Z(xi)]2 - EZ(xi), Z(xi+h) ∀x

como E[Z(xi), Z(xi+h)] = C(h) + m2 y E[Z2(xi)] = C(0) + m

2

γ(h) = C(0) + m2 - (C(h) + m2)

γ(h) = C(0) - C(h).

Como se observa en la última expresión γ(h) y C(h), son dos herramientas que

permiten expresar la correlación entre la variable aleatoria Z(xi) y Z(xi+h), separadas por el

vector h.

5.4.4- HIPÓTESIS INTRÍNSECA.

Una función aleatoria Z(x) se dice intrínseca cuando:

a) Su esperanza matemática existe y no depende de la localización Xi.

EZ(x) = m ∀x

b) Para todo vector h el incremento [Z(x+h) - Z(x)] tiene varianza finita y no depende de la

localización xi:

VarZ(x+h) - Z(x) = E[Z(x+h) - Z(x)]2 = 2γ(h) ∀x

Page 45: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

34

Cuando se cumple esta condición se dice que la función aleatoria Z(X) es

homogénea. Esta condición se encuentra con bastante frecuencia en la naturaleza, pues

existen muchos procesos que no tiene varianza finita y sin embargo, poseen una función

variograma finita.

La estacionaridad de segundo orden, siempre implica la condición intrínseca

(homogeneidad), sin embargo la relación inversa no siempre se cumple.

5.5 TERMINOLOGÍA.

Rango: Generalmente, si la distancia entre puntos crece, también el valor del semi-

variograma correspondiente crece. Sin embargo, después de cierta distancia el valor del

semi-variograma ya no aumenta más y alcanza una meseta (variabilidad máxima), esto se

debe a que los valores de la variable dejan de estar correlacionados. La distancia a la cual

alcanza la meseta se llama rango.

Figura 2. Forma típica del semi-variograma.

Sill: La altura a la cual se alcanza la meseta.

Page 46: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

35

Efecto nugget: Si el valor de h = 0, se supone que el valor del semi-variograma es

cero por que ( ) ( )[ ] 00 2 =−+ ii XZXZ , pero varios factores como el error de medida y

variación a escala muy pequeña causan una discontinuidad de ( )h∧

γ en h = 0.

5.6 ISOTROPÍA.

Se da cuando los valores de los puntos se encuentran distribuidos de forma igual. En

este caso el valor del variograma calculado ( )h∧

γ depende solo de la distancia h .

5.7 ANISOTROPÍA.

Este término se refiere a la existencia de una tendencia en cierta dirección del valor

de los puntos de la población. Por lo tanto un proceso es anisotropico si la variabilidad

espacial y consecuentemente el variograma calculado ( )h∧

γ depende de la dirección de h y

no sólo de la distancia h .

Para ver si existe anisotropía se puede realizar semi-variogramas unidireccionales en

diferentes direcciones y compararlos. Los ejes de anisotropía se detectan haciendo un

diagrama de rosa con los semi-variogramas calculados.

5.8 MODELOS TEÓRICOS DE SEMI-VARIOGRAMAS.

La estimación de semi-variogramas se realiza de manera no paramétrica. Este estimador

no entrega modelos válidos por que no cumple con la condición no negativa definida; el no

cumplir esta condición puede llevar al calculo de varianzas negativas. Además, para hacer

Page 47: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

36

una predicción espacial, se necesitan modelos para semi-variogramas ( )hγ definidos en

todos los h y no solo para los pocos valores donde se calcula ( )h∧

γ .

Por lo tanto, es necesario un modelo que pertenezca a alguna familia paramétrica de

semi-variogramas que refleje el variograma experimental ( )h∧

γ y el conocimiento previo

sobre el proceso.

Los modelos básicos isotrópicos más comunes que se usan para este ajuste son: modelo

efecto nugget, modelo esférico, modelo exponencial, modelo Gaussiano, modelo onda y

modelo potencia.

Modelo efecto nugget. ( )

>

=

=

0 h sí 1

0h sí 0

sin parámetro.

Figura 3. Comportamiento del modelo efecto nugget.

Corresponde a un fenómeno puramente aleatorio, sin correlación entre las muestras,

cualquiera que sea la distancia que las separe; el límite se alcanza de inmediato.

Page 48: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

37

Modelo esférico. ( )

modo otro de 1

h sí 2

1

2

33

<

•−•

=

aa

h

a

h

parámetro a=Θ

Figura 4. Comportamiento del modelo esférico.

Modelo esférico: Es una expresión polinomial simple, muestra un crecimiento casi

lineal y después a cierta distancia finita del origen (rango) se alcanza una estabilización

(meseta).

Modelo exponencial ( )

−−=a

hh exp1γ , para 0>h

parámetro a=Θ

Page 49: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

38

Figura 5. Comportamiento del modelo exponencial.

Este modelo a diferencia del modelo esférico crece inicialmente más rápido y

después se estabiliza de forma asintótica.

Modelo Gaussiano ( )

−−=

2

2

exp1a

hhγ , para 0>h

parámetro a=Θ

Figura 6. Comportamiento del modelo gaussiano.

Page 50: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

39

Este es un modelo extremadamente continuo, inicialmente presenta un

comportamiento parabólico en el origen, después al igual que en el modelo exponencial se

alcanza la meseta de forma asintótica.

Modelo onda ( )h

a

ha

h

−=

sin

1γ , para 0>h

parámetro a=Θ

Figura 7. Comportamiento del modelo onda.

Este es un modelo que se estabiliza asintóticamente con el incremento de h ; oscila

alrededor de la meseta.

Modelo potencia ( ) 20 , <<= λγλ

hh

parámetro λ=Θ

Page 51: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

40

Figura 8. Comportamiento del modelo potencia.

Este es un modelo sin meseta, su forma representada en la figura 10 corresponde a

valores de λ = (0.5, 1.0 y 1.5). Cabe mencionar que cuando 1=λ se obtiene el modelo

Lineal, el cual no tiene ni meseta ni alcance.

5.9 ESTIMACIÓN DE LA VARIANZA GEOESTADÍSTICA.

Sea z una variable regionalizada definida en A , el área de la población muestreada

la cual se divide en pequeñas áreas regulares a centradas en x . Supóngase que a es un

punto siendo esta área insignificante en comparación con A (Mailing 1989).

La función z definida en A es conocida solo para los n cuadros muestreados

( ) ( ) nxzxz ,...,1 . La media espacial del conjunto (la media espacial), Az de z se define por:

[ ] ( )dxxzA

zA

A ∫=1

con [ ] ∫=AdxA

Page 52: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

41

y es estimada por: ( )∑ =

∗ =n

i iiA xzz1λ con ∑ =

=n

i i11λ . Para el caso especial

donde todas las iλ son iguales a n

1, ∗

Az es la clásica media aritmética. La estimación del

error se define como ∗− AA zz .

La Geoestadística introduce un contexto probabilístico por la consideración de

z como una realización de la función aleatoria Z , definida como un conjunto de variables

aleatorias ( )xZ estadísticamente no independientes y relacionadas entre si por una

estructura de autocorrelación espacial. Matheron (1973) definió una clase especial de

funciones aleatorias llamadas funciones aleatorias intrínsecas de orden k .

La estacionalidad en geoestadística se limita al orden 0=k para que las diferencias

( ) ( )xZhxZ −+ sean estacionarias de segundo orden, siendo h el vector rezago de la

separación entre dos locaciones (Matheron 1965).

A esta hipótesis de estacionaridad débil se le llama hipótesis intrínseca, y por lo

tanto la autocorrelación espacial no depende de la localización de los cuadros, solo del

vector h .

Consecuentemente, la estructura de autocorrelación puede ser descrita por el

semivariograma teóricoγ definido como ( ) ( ) ( )[ ]xzhxZVarh −+=2

1γ .

Con la hipótesis clásica (Matheron 1965) de ( ) ( )[ ] 0=−+ xZhxZE , la cual hace

mas directo el desarrollo matemático, γ es escrito como ( ) ( ) ( ) [ ]22

1xZhxZEh −+=γ .

En Geoestadística de la varianza del error se define como [ ]∗− AA ZZVar , y se denota

por 2Eσ . Matheron (1965) demostró que puede ser calculada como sigue:

Page 53: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

42

( ) ( ) ( )∑ ∑∑= = =

−−=n

i

n

i

n

j

jijiiiE AAxxAx1 1 1

2 ,,,2 γγλλγλσ con

( )[ ]

( )∫=A

ii dxxxA

Ax ,1

, γγ y ( )[ ]

( ) ''

2,

1, dxdxxx

AAA

A A∫ ∫= γγ .

El término ( )Axi ,γ representa el semivariograma promedio entre el punto muestral

ix y todos los demás puntos en el área A de la población muestreada. El término ( )AA,γ es

el promedio del semivariograma dentro del área A .

Esto es valioso si se considera que 2Eσ no depende de los valores observados pero si de:

1) La forma y el tamaño de A .

2) La localización relativa dentro de A de los cuadros muestreados, es decir el diseño

de muestreo.

3) La estructura de autocorrelación espacial de la función aleatoria representada por γ .

Por lo tanto, dado el espacio A y la localización de los cuadros muestreados, 2Eσ

depende solo del modelo seleccionada para γ , lo cual justifica el cuidado que se debe de

tomar en la modelación del semivariograma.

5.10 MODELACIÓN DE SEMIVARIOGRAMAS.

El variograma teóricoγ describe la estructura de autocorrelación espacial de la

función aleatoria. En la practica, la función aleatoria y todos sus parámetros, comoγ , son

desconocidos.

Si fueran conocidas las medidas de la variable regionalizada para cada punto de A ,

seria posible calcular Aγ el semivariograma local definido por Matheron (1963) como

Page 54: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

43

( )( ) ( ) ∫

−∩

−+=hAA

A dxxzhxzhN

2

2

1γ siendo ( ) ∫

−∩

=hAA

dxhN , el área de intersección de A con

hA − , el espacio traslapado por el vector de rezago h .

Debido a que los valores de la variable regionalizada solo son conocidos para

muestra de A , Aγ debe de ser estimado por A

γ el semivariograma experimental:

( )( )

( ) ( ) ( ) 2

12

1∑=

−+=hN

i

ii xzhxzhN

hγ con ( )hN el numero de pares de puntos separados por

h .

La inferencia del semivariograma teórico γ a partir de A

γ , requiere de un modelo

ergodico, es decir, un modelo cuyos parámetros puedan ser estimados de cualquiera de sus

realizaciones (Chauvet 1993).

Los semivariogramas local y experimental son relativos para la población z dada la

cual se considera un bosquejo de la función aleatoria Z .

Estos dos semivariogramas pueden ser vistos como variables aleatorias, cuya

esperanza es el semivariograma teórico de Z (Matheron 1965): [ ] γγγ =

=

AA EE .

En la practica, el semivariograma experimental se calcula agrupando pares de

locaciones para diferentes distancias. Cada par de puntos que esta separado por la distancia

( )[ ]hh ε± es usado para estimar el valor ( )hAγ .

Con el fin de “suavizar” y con esto hacer más claro el semivariograma experimental,

puede utilizarse una tolerancia para el rezago de ( ) hh ×= 5.0ε (Isaaks y Srivastava 1989).

Page 55: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

44

Debido a que ( )hN varia según h , cada ( )hA

γ es calculado con una precisión

variable relacionada con el rezago. Journel y Huijbregts (1978) sugirieron, de su

experiencia en casos de minería, cada ( )hN debe exceder 30.

Muchos modelos han sido desarrollados para ajustar semivariogramas

experiméntales. Las técnicas de mínimos cuadrados ordinarios y máxima verosimilitud son

las mas usadas para ajustar el modelo ~

γ a A

γ .

Varios modelos candidatos para el semivariograma deben se evaluados; los cuales

pueden ser comparados por los criterios de error cuadrado medio y akaike (Webster 2001,

Chauvet 1993).

Page 56: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

45

6. ESTIMADORES BAJO ESTUDIO

Bajo los diferentes enfoques de muestreo se han propuesto distintos estimadores de

la varianza de la proporción, entre las cuales destacan.

a) En el enfoque basado en el diseño.

El estimador bajo el diseño aleatorio es:

( ) ( ) ( )( )1

ˆ1ˆ1ˆˆ

−−⋅

⋅−=n

ppfpVMSA (1)

donde ∑=S

i

n

yp .

Marcello (2003) propuso dos aproximaciones, que toman en cuenta la

autocorrelación presente en la muestra, son obtenidas al corregir al estimador obtenido bajo

el muestreo aleatorio.

Los estimadores que contemplan la autocorrelación son:

( ) ( ) jMSAESTESP cpVpV ⋅= ˆˆˆˆ. (2)

con ( )

( )∑

∑∑

∑∑=

= ≠

= ≠

•−•

−=

n

i

i

il

n

i

n

li

li

n

i

n

jl

il

j

pZ

ZZn

c

1

2

1

2

1

ˆ2

δ, donde 1=ilδ si la i-ésima y la l-ésima

unidad se encuentran en dominios adyacentes y 0=ilδ de otro modo.

Este estimador se construye a partir del índice de autocorrelación de Geary ( jc ),

este índice mide el grado de semejanza entre las unidades muéstrales.

El estimador

( ) ( ) jMSAAUTESP wpVpV ⋅= ˆˆˆˆ. (3)

Page 57: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

46

con ( )

++=

11

2

log

21

j

j

j

l

lw y

( ) ( )

( )∑

∑∑

∑∑=

= ≠

= ≠

•−•−•=

n

i

ji

n

i

n

il

ijli

n

i

n

il

ij

j

py

pypyn

l

1

2

1

1

ˆ

ˆˆ δ

δ donde

1=ijδ si la i-ésima y la l-ésima unidad se encuentran en dominios adyacentes y 0=ijδ de

otro modo.

Este es construido con la estadística de autocorrelación de Moran, la cual considera

el grado de desemejanza de las unidades muéstrales.

b) En el enfoque basado en el modelo en el contexto de modelación geoestadística

Aubri y Debouzie (2001) proponen el estimador

( ) ( )2

11. 1

1ˆˆ ∑

=

−−

=L

l

iSIMEST EEL

pV (4)

donde ∑=

=L

l

l

L

EE

1

; slsll PpE −= ˆ ; en este caso slp es el estimador del parámetro de

proporción , slP , de la población simulada (z1, z2, …, zN) en la l-ésima realización.

Page 58: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

47

7. ESTIMADORES PROPUESTOS

El presente trabajo, bajo el enfoque asistido por el modelo, propone un estimador de

regresión y una corrección a este por el índice de autocorrelación de Geary, los cuales se

basan en la construcción asistida por el modelo de la variable auxiliar (concentración de

TPH’s)

El estimador de regresión en un solo paso

( )2

.

11ˆˆ

eREGEST snN

npV

−= (5)

con ∑ −

−=

∧∧

S

k

e

n

ee

s1

2

2

; ∑∧

=S n

ee y kkk zye

∧∧

−= . Aquí ( )skslk xxpz −⋅+=∧∧

2ˆ β es el y-

valor predicho mediante simulación para la unidad k, ( ) ( )

( )∑∑

−⋅−=

S k

S kk

xx

zzxx22β con xk el k-

ésimo valor simulado de TPH’s y zk su valor discreto.

Corrección por el índice de Geary al estimador de regresión en un solo paso

( ) ( ) junoREGESTCjREGEST CpVpV ⋅= ˆˆˆˆ_._. (6)

los cuales son computados a través de solo una realización de la población de TPH´s

basándose en el mismo modelo geoestadístico estimado.

El estimador de regresión obtenido por promedio

( )( )

L

pV

pV

L

l

lREGEST

REGEST

∑== 1

.

.

ˆˆ

ˆˆ (7)

donde ( )lREGEST pV ˆˆ. se obtiene para la l-ésima realización.

Corrección mediante el Índice de Geary al Estimador (7)

Page 59: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

48

( ) ( ) jREGESTCjREGEST CpVpV ⋅= ˆˆˆˆ._. (8)

8. SIMULACIÓN.

8.1 FACTORES BAJO ESTUDIO.

La simulación del enfoque basado en el modelo, requiere de un número

considerable de realizaciones, al menos 10000 según Aubri y Debouzie (2000), y bajo los

otros enfoques basta con al menos una, por lo que la simulación se realizó en dos partes.

En la primer parte, denominada simulación uno a uno, se consideran 34 casos, los

cuales se derivan de la combinación de 4 factores de estudio:

a) Modelo geoestadístico.- se consideraron dos modelos generadores de los datos:

los modelos wave y exponencial (Isaaks y Srivastava, 1989; Chauvet, 1993).

b) La media y la varianza del proceso.- Se consideraron tres medias (980, 1000,

1020), dos varianzas (300, 600).

c) Índices de autocorrelación.- se consideraron tres diferentes niveles bajo (1.5),

medio (2.8) y alto (4.8).

Para el modelo exponencial se evaluó las estimaciones de la varianza ( )pVMSA ˆˆ ,

( )pV ESTESP ˆˆ. , ( )pV AUTESP ˆˆ

. y ( )pV REGESTˆˆ

. mientras que el modelo wave considera además el

estimador ( )pV CjREGESTˆˆ

_. debido a que con esta corrección se obtienen mejores resultados.

En la segunda parte de la simulación, denominada simulación por promedios son

estudiados seis casos particulares, tres corresponden al modelo exponencial donde se

mantiene constante la media (980) y varianza (300) y solo se varían los índices de

Page 60: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

49

autocorrelación; de igual manera para el modelo wave donde se mantiene constante la

media (1020) y varianza (600).

La simulación por promedios se realiza con el objetivo, de observar el desempeño

con el mismo número de realizaciones de los estimadores ( )pV SIMESTˆˆ

1. , ( )pV REGEST ˆˆ. y

( )pV CjREGEST ˆˆ_. y de observar el comportamiento de los estimadores ( )pV REGEST

ˆˆ. y

( )pV CjREGESTˆˆ

_. , comparando las estimaciones obtenidas con una sola realización contra las

obtenidas con 1000 realizaciones.

8.2 PROCESO DE SIMULACIÓN UNO A UNO

Para cada una de las 34 situaciones se genera la población que va a ser considerada

como real, la cual estará constituida por los valores de TPH´s ( )Nww ,..,1 . Enseguida se

procede a asignar un valor discreto a estos valores, unidades con contenidos de TPH´s

mayores a 1000 ppm. toman el valor 1 y 0 de otro modo ( )Nyy ,...,1 .

La población real se divide en las nueve muestras sistemáticas posibles, se toma una

muestra y se estima los parámetros verdaderos (varianza y escala) del modelo

geoestadístico.

Varios modelos candidatos para el semivariograma deben ser evaluados; los cuales

pueden ser comparados por los criterios de error cuadrado medio y akaike (Webster, 2001).

Se calcula los estimadores propuestos; el procedimiento se repite para las nueve

muestras sistemáticas posibles.

Page 61: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

50

Haciendo uso de la varianza de las estimaciones se obtiene la Razón que existe con

la esperanza de las estimaciones hechas.

=

∧∧

=

∧∧

∧∧

=

=9

1

2

9

1

j

j

j

j

pp

pV

pV

pVE

R (9)

donde

∧∧

jpV es la varianza estimada, con el estimador en turno, para la j-ésima muestra y

9

9

1∑=

= j

jp

p , con jp∧

la proporción estimada para la j-esima muestra.

La mejor estimación es cuando 1=R , valores mayores a 1 sobrestiman al parámetro

y menores a 1 lo subestiman en esa proporción.

La rutina anterior se repitió 1000 veces promediándose al final las razones obtenidas.

El diagrama de la simulación fue como sigue:

Page 62: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

51

Page 63: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

52

8.2 PROCESO DE SIMULACIÓN POR PROMEDIOS.

Se genera la población que va a ser considerada como real, la cual estará constituida

por los valores de TPH´s ( )Nww ,..,1 .

Enseguida se procede a asignar un valor discreto a estos valores, unidades con

contenidos de TPH´s mayores a 1000 ppm. tomaran el valor 1 y 0 de otro modo ( )Nyy ,...,1 .

La población real se divide en las nueve muestras sistemáticas posibles, se toma una

muestra y se estima los parámetros (varianza y escala) del modelo geoestadístico.

Utilizando el modelo estimado se simula 1000 poblaciones de TPH´s.

Se calcula los estimadores propuestos; el procedimiento se repite para las nueve

muestras sistemáticas posibles.

De igual manera que en la simulación uno a uno se obtiene R .

Esta rutina se repitió 200 veces promediándose al final los promedios de las razones

obtenidas.

El diagrama de la simulación fue como sigue:

Page 64: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

53

Se desarrollo el código de la simulación bajo el programa R versión 2.3.1 para el

paquete RandomFields versión 1.3.2.8.

Page 65: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

54

9. RESULTADOS Y DISCUSIÓN.

9.1 ANÁLISIS DE LA SIMULACIÓN UNO A UNO.

En el modelo exponencial, la razón promedio que existe entre las varianzas

estimadas por las diferentes aproximaciones y la varianza de las estimaciones,

comportamiento en base a estabilidad respecto a los diferentes índices de autocorrelación y

exactitud la mejor aproximación es ( )pV REGESTˆˆ

. debido a que tiene los valores más cercanos

a 1. (véase Cuadro 1).

Cuadro 1. Razones promedio obtenidas para el modelo exponencial.

Media Varianza I Aut¶ Rsrs Rest Raut Rreg†

1,5 1,79 1,70 1,00 1,09 980 300 2,8 2,35 1,99 0,79 1,40 4,8 2,72 2,03 0,66 1,63 1,5 2,07 1,93 1,04 1,03 980 600 2,8 2,43 2,01 0,72 1,21 4,8 3,12 2,23 0,67 1,54 1,5 2,03 1,87 0,93 0,74 1000 300 2,8 2,59 2,06 0,68 0,95 4,8 3,11 2,11 0,59 1,14 1,5 2,06 1,90 0,93 0,75 1000 600 2,8 2,63 2,09 0,70 0,96 4,8 3,21 2,18 0,61 1,18 1,5 1,80 1,70 0,99 1,09 1020 300 2,8 2,20 1,87 0,74 1,32 4,8 2,72 2,02 0,66 1,62 1,5 1,94 1,81 0,97 0,96 1020 600 2,8 2,43 2,00 0,71 1,20

4,8 2,99 2,13 0,64 1,47 † Corresponde a la razón obtenida con la aproximación ( )pV REGEST

ˆˆ. .

¶Índice de Autocorrelación.

Page 66: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

55

Los resultados anteriores pueden ser vistos de manera grafica en la Figura 9, donde los

valores de la razón promedio que se encuentran más cercanos a 1 son los mejores, tomando

encuentra que valores por debajo de 1 subestiman el valor de la varianza de las

estimaciones.

VARIANZAS

0

0.5

1

1.5

2

2.5

3

3.5

0 2 4 6 8 10 12 14 16 18 20

RAZONES

REAL

SRS

Ci

Wi

REG

Figura 9. Relación de varianzas respecto al parámetro expresada en razones, bajo el modelo exponencial.

En lo que concierne al error cuadrado medio promedio los valores mas pequeños

pertenecen a la aproximación que resulto ser la mejor para este modelo (véase Cuadro 2).

Page 67: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

56

Cuadro 2. Error cuadrado medio promedio para el modelo exponencial.

Media Varianza I Aut ECM(srs) ECM(est) ECM(aut) ECM(reg)†

1,5 2.32E-08 2.06E-08 2.47E-08 1.56E-08 980 300 2,8 3.25E-08 1.97E-08 1.90E-08 1.09E-08 4,8 3.86E-08 1.40E-08 1.28E-08 8.48E-09 1,5 5.83E-08 4.91E-08 5.11E-08 3.84E-08 980 600 2,8 7.41E-08 4.14E-08 3.61E-08 2.08E-08 4,8 9.31E-08 3.19E-08 2.74E-08 1.50E-08 1,5 1.38E-07 1.11E-07 1.16E-07 1.17E-07 1000 300 2,8 1.74E-07 8.50E-08 7.46E-08 5.01E-08 4,8 2.11E-07 6.28E-08 5.55E-08 2.67E-08 1,5 1.39E-07 1.10E-07 1.03E-07 1.04E-07 1000 600 2,8 1.80E-07 8.93E-08 7.17E-08 4.88E-08 4,8 2.20E-07 6.81E-08 5.37E-08 2.77E-08 1,5 2.45E-08 2.15E-08 2.59E-08 1.72E-08 1020 300 2,8 3.10E-08 1.87E-08 1.81E-08 1.04E-08 4,8 4.17E-08 1.59E-08 1.35E-08 9.63E-09 1,5 5.60E-08 4.72E-08 5.17E-08 3.91E-08 1020 600 2,8 7.07E-08 3.91E-08 3.93E-08 2.18E-08

4,8 9.25E-08 3.28E-08 2.85E-08 1.57E-08 †Corresponde al error cuadrado medio obtenido con la aproximación ( )pV REGEST

ˆˆ. .

En relación al modelo wave, el mejor estimador es ( )pV CjREGESTˆˆ

_. , debido a que se

obtienen valores de la razón promedio cercanos a 1, sin incurrir en subestimaciones serias

como las generadas por el estimador ( )pV AUTESP ˆˆ. (véase Cuadro 3).

Page 68: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

57

Cuadro 3. Razones estimadas para el modelo wave.

Media Varianza I Aut¶ Rsrs Rest Raut Rreg Rregc† 1.5 6.87 5.16 1.58 4.07 3.06 980 300 2.8 8.5 4.17 0.97 5.23 2.56 4.8 1.5 6.17 4.66 1.45 3.08 2.32 980 600 2.8 9.12 4.2 0.95 4.5 2.07 4.8 10.31 3.08 0.65 5.02 1.5 1.5 6.39 4.55 1.32 2.31 1.65 1000 300 2.8 9.69 4.19 0.92 3.48 1.51 4.8 11.43 3.18 0.63 4.03 1.12 1.5 6.36 4.56 1.33 2.3 1.65 1000 600 2.8 9.63 4.11 0.9 3.44 1.47 4.8 10.71 2.98 0.59 3.75 1.04 1.5 5.97 4.7 1.55 3.61 2.84 1020 300 2.8 8.8 4.26 1 5.37 2.6 4.8 1.5 6.61 5.01 1.56 3.26 2.47 1020 600 2.8 9.36 4.31 0.97 4.63 2.13 4.8 9.48 2.87 0.58 4.42 1.34

†Corresponde a la razón obtenida con la aproximación ( )pV CjREGESTˆˆ

_. . ¶Índice de Autocorrelación.

De la Figura 10 puede observarse que la razón promedio de los estimadores

( )pV CjREGESTˆˆ

_. y ( )pV AUTESP ˆˆ. tiene los valores mas cercanos a 1, pero el estimador

( )pV AUTESP ˆˆ. subestima al parámetro en varias ocasiones hecho que no ocurre con el otro

estimador.

Page 69: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

58

VARIANZAS

0

2

4

6

8

10

12

0 2 4 6 8 10 12 14 16 18 20

RAZONES

REAL

SRS

CI

WI

REG

REG_Ci

Figura 10. Relación de varianzas respecto al parámetro expresada en razones, bajo el modelo wave.

En cuanto al error cuadrado medio promedio los valores mas pequeños los tiene el

estimador ( )pV AUTESP ˆˆ. , el cual tiene valores cercanos de la razón promedio a 1 pero

incurriendo en subestimaciones, seguido del estimador ( )pV CjREGESTˆˆ

_. quien muestra un

mejor comportamiento al respecto (véase Cuadro 4).

Page 70: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

59

Cuadro 4. Error cuadrado medio promedio para el modelo wave.

Media Var I Aut ECM(srs) ECM(est) ECM(aut) ECM(reg) ECM(regc)†

1.5 7.89E-08 4.02E-08 7.80E-10 2.11E-08 1.31E-08 980 300 2.8 8.48E-08 1.40E-08 1.45E-09 2.31E-08 7.84E-09 4.8 1.5 1.57E-07 7.59E-08 5.05E-09 2.26E-08 1.89E-08 980 600 2.8 1.88E-07 2.72E-08 3.10E-09 3.07E-08 1.15E-08 4.8 1.86E-07 8.76E-09 4.52E-09 2.79E-08 7.29E-09 1.5 3.76E-07 1.58E-07 7.64E-09 2.12E-08 2.35E-08 1000 300 2.8 4.17E-07 5.23E-08 8.13E-09 3.03E-08 1.70E-08 4.8 4.00E-07 1.73E-08 1.08E-08 3.04E-08 1.33E-08 1.5 3.70E-07 1.56E-07 9.27E-09 2.11E-08 2.43E-08 1000 600 2.8 4.25E-07 5.20E-08 6.27E-09 3.09E-08 1.58E-08 4.8 4.00E-07 1.70E-08 1.15E-08 2.90E-08 1.40E-08 1.5 7.05E-08 3.80E-08 2.49E-09 1.75E-08 1.34E-08 1020 300 2.8 8.46E-08 1.38E-08 1.46E-09 2.26E-08 7.86E-09 4.8 1.5 1.66E-07 8.17E-08 4.66E-09 2.39E-08 1.90E-08 1020 600 2.8 1.82E-07 2.66E-08 2.96E-09 3.02E-08 1.13E-08

4.8 1.82E-07 8.23E-09 4.28E-09 2.57E-08 7.77E-09 †Corresponde al error cuadrado medio obtenido con la aproximación ( )pV CjREGEST

ˆˆ_. .

Page 71: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

60

9.2 ANÁLISIS DE LA SIMULACIÓN POR PROMEDIO.

Para el modelo exponencial los estimadores ( )pV REGEST ˆˆ . , ( )pV SIMEST ˆˆ1. y

( )pV unoREGEST ˆˆ_. en base a estabilidad y exactitud resultan ser los mejores y tienen valores de

la razón promedio cercanos entre si; mientras que los dos primeros son construidos con

200000 realizaciones para el tercero fue necesario solo 200 (véase Cuadro 5).

Cuadro 5. Comparación de Razones estimadas, bajo diferentes enfoques, para el modelo exponencial.

Media 980

Varianza 300

I Auto 1.5 2.8 4.8

Rsrs 1.73 2.37 2.64

Rest 1.64 2 1.97

Raut 0.98 0.79 0.64

Rsim1§ 1.29 1.38 1.28

Rreg prom† 1.06 1.42 1.56

Rreg uno¶ 1.06 1.43 1.55 †Corresponde a la razón obtenida con la aproximación ( )pV REGEST ˆˆ . .

¶Corresponde a la razón obtenida con la aproximación ( )pV unoREGEST ˆˆ_. .

§ Corresponde a la razón obtenida con la aproximación ( )pV SIMEST ˆˆ1. .

Respecto al error cuadrado medio promedio los valores mas pequeños los tienen las

aproximaciones que resultaron ser las mejores para este modelo; estos son muy cercanos

entre si (véase Cuadro 6).

Page 72: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

61

Cuadro 6. Comparación de Error Cuadrado Medio, bajo diferentes enfoques, para el modelo exponencial.

Media 980

Varianza 300

I Auto 1.5 2.8 4.8

Ecm(srs) 1.6826E-08 3.3211E-08 3.8858E-08

Ecm(est) 1.7295E-08 1.973E-08 1.378E-08

Ecm(aut) 1.2441E-08 1.5444E-08 1.5006E-08

Ecm(sim1) § 1.2685E-08 9.9314E-09 6.7552E-09

Ecm(reg prom)† 1.939E-08 9.9808E-09 7.5002E-09

Ecm(reg uno)¶ 1.5316E-08 1.0888E-08 8.9535E-09 †Corresponde al error cuadrado medio obtenido con la aproximación ( )pV REGEST ˆˆ . .

¶Corresponde al error cuadrado medio obtenido con la aproximación ( )pV unoREGEST ˆˆ_. .

§ Corresponde al error cuadrado medio obtenido con la aproximación ( )pV SIMEST ˆˆ1. .

En el modelo wave los estimadores ( )jCjREGEST pV ˆˆ

_. y ( )pV unoCjREGEST ˆˆ__. en base a

estabilidad y exactitud resultan ser los mejores y tienen valores de la razón promedio

cercanos entre si; mientras que el primeros es construido con 200000 realizaciones el

segundo requiere de solo 200 (véase Cuadro 7).

Page 73: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

62

Cuadro 7. Comparación de Razones estimadas, bajo diferentes enfoques, para el modelo wave.

Media 1020

Varianza 600

I Auto 1.50 2.80 4.80

Rsrs 5.84 9.55 10.94

Rest 4.32 4.44 3.40

Raut 1.31 1.00 0.70

Rsim1 3.45 1.85 1.61

Rreg prom 2.91 4.68 5.37

Rreg uno 2.91 4.69 5.27

Rreg prom ci† 2.15 2.17 1.73

Rreg uno ci¶ 2.15 2.18 1.69 †Corresponde a la razón obtenida con la aproximación ( )

jCjREGEST pV ˆˆ_. .

¶Corresponde a la razón obtenida con la aproximación ( )pV unoCjREGEST ˆˆ__. .

Considerando el error cuadrado medio promedio los valores más pequeños los

tienen: el estimador ( )pV AUTESP ˆˆ. el cual presenta problemas en condiciones de alta

autocorrelación, seguidos por ( )jCjREGEST pV ˆˆ

_. ( )pV unoCjREGEST ˆˆ__. y ( )pV SIMEST ˆˆ

1. con valores

muy cercanos entre si (véase Cuadro 8).

Page 74: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

63

Cuadro 8. Comparación de Error Cuadrado Medio, bajo diferentes enfoques, para el modelo wave.

Media 1020

Varianza 600

I Auto 1.5 2.8 4.8

Ecm(srs) 1.58E-07 1.74E-07 1.78E-07

Ecm(est) 7.25E-08 2.48E-08 9.76E-09

Ecm(aut) 3.62E-09 2.7E-09 6.08E-09

Ecm(sim1) § 6.58E-08 9.53E-09 4.08E-09

Ecm(reg prom) 2.17E-08 2.79E-08 2.43E-08

Ecm(reg uno) 2.2E-08 3.04E-08 2.75E-08

Ecm(reg prom ci)† 8.61E-09 5.24E-09 8.86E-09

Ecm(reg uno ci)¶ 2.38E-08 2.04E-08 1.73E-08 †Corresponde al error cuadrado medio obtenido con la aproximación ( )

jCjREGEST pV ˆˆ_. .

¶Corresponde al error cuadrado medio obtenido con la aproximación ( )pV unoCjREGEST ˆˆ__. .

§ Corresponde al error cuadrado medio obtenido con la aproximación ( )pV SIMEST ˆˆ1. .

Page 75: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

64

9.3 DISCUSIÓN DE LA SIMULACIÓN UNO A UNO.

En la simulación uno a uno para el modelo exponencial se puede observar que el

estimador ( )pV REGEST ˆˆ. tiene un comportamiento periódico con respecto a la autocorrelación

presente, en ausencia de autocorrelación puede incurrirse en subestimaciones de la

varianza; este estimador logra el menor error cuadrado medio promedio logrando así la

combinación de dos cualidades deseables.

El estimador ( )pV CjREGEST ˆˆ_. bajo el modelo wave tiene un comportamiento periódico

el cual mejora bajo condiciones de alta autocorrelación y aunque no tiene los valores de

error cuadrado medio promedio mas pequeños no incurre en serias subestimaciones de la

varianza.

9.4 DISCUSIÓN DE LA SIMULACIÓN POR PROMEDIO.

Para la simulación por promedio en los casos particulares del modelo exponencial,

los estimadores ( )pV REGEST ˆˆ. , ( )pV unoREGEST ˆˆ

_. y ( )pV SIMEST ˆˆ1. tienen estadísticas con valores

muy cercanos, siendo el estimador ( )pV unoREGEST ˆˆ_. preferible por su estabilidad debido a

que no necesita un gran número de realizaciones (simulaciones) para converger y lograr

resultados similares a los obtenidos con los otros dos estimadores.

En el modelo wave no existe gran diferencia en los indicadores logradas con los

estimadores ( )jCjREGEST pV ˆˆ

_. ( )pV unoCjREGEST ˆˆ__. y ( )pV SIMEST ˆˆ

1. teniéndose preferencia por el

Page 76: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

65

estimador de un solo paso debido a que es más estable al no necesitar de un gran número de

realizaciones.

10. CONCLUSIONES Y RECOMENDACIONES.

Para el modelo exponencial el mejor estimador de la varianza de la proporción

resulta ser el que se construye bajo el modelo de regresión obteniendo los mejores

resultados en presencia de alta autocorrelación.

En el modelo wave se tiene, bajo una postura conservadora, que el mejor estimador

de la varianza es el construido mediante la corrección por el Índice de Geary al estimador

de regresión.

Debido a las ventajas mostradas por el estimador de regresión y su variante

corregida por el Índice de Geary se recomienda utilizarlos (según el modelo en turno) al no

requerirse de un gran número de realizaciones para obtener resultados estables caso que no

ocurre con el estimador basado en el modelo.

Page 77: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

66

11. BIBLIOGRAFÍA.

Aubri, P., and D. Debouzie. 2000. Geoestatistical estimation variance for the spatial mean

in two-dimensional systematic sampling. Ecology 81:543-553.

Aubri, P., and D. Debouzie. 2001. Estimation of the mean from a two-dimensional sample:

the geostatistical model-based approach. Ecology 82:1484-1494.

Brus, D. J., and J. J. De Gruijter. 1993. Desig-based versus model-based estimates of spatial

means: theory and application in environmental soil science. Environmetrics 4:123-152.

Chauvet, P. 1993. Processing Data With a Spatial Support: Geostatistics and its Methods.

Cahiers de géostatistique, fascicule 4. Centre de géostatistique, ENSMP, Fontainebleau,

France. 57p.

Cressie, N. A. C. 1991. Statistics for Spatial Data. Wiley, New Cork, New Cork, USA.

Diario Oficial de la Federación. 2002. Norma Oficial Mexicana de Emergencia NOM-EM-

138-ECOL-2002, que establece los límites máximos permisibles de contaminación en

suelos afectados por hidrocarburos, la caracterización del sitio y procedimientos para la

restauración. Agosto 20. pp:49-60.

Isaaks, E. H., and R. M. Srivastava. 1989. Applied Geostatistics. Oxford University Press,

New York, New York, USA. 561.

Lehtonen, R., and E. Pahkinen. 2004. Practical Methods for Design and Analysis of

Complex Surveys. Second edition. John Wiley & Sons Ltd, Chichester, England. 349p.

Mailing, D. H. 1989. Measurements from maps. Principles and methods of cartometry.

Pergamon, Oxford, UK.

Page 78: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

67

Marcello, D. 2003. Estimating the variance of the sample mean in two-dimensional

systematic sampling. Journal of Agriculture, Biological and Environmental Statistics

8:280-295.

Matheron, G. 1963. Principles of geostatistics. Economic Geology 58:1246-1266.

Matheron, G. 1965. Les variablesrégionalisées et leur estimation. Une application de la

théorie des functions aléatoires aux sciences de la nature. Masson, Paris, France.

Matheron, G. 1973. The intrinsic random functions and their applications. Advances in

applied Probability 5:439-468.

Särndal, C.–E. 1978. Desig-Based and Model-Based Inference in Survey Sampling.

Scandinavian Journal of statistics 5: 27-52.

Särndal, C.-E., Swensson B. and Wretman J. 1992. Model Assisted Survey Sampling.

Springer, New York. 694p.

Thompson, M.E. 1997. Sampling. John Wiley & Sons, New York. 305p.

Webster, R. and M. A. Oliver. 2001. Geostatistics for Environmental Scientists. John Wiley

& Sons. Ltd, Chichester, England. pp:127-134.

Wolter, K. M. 1985. Introduction to Variance Estimation. Springer-Verlag, New York.

250p.

Page 79: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

68

Anexo 1. Ejemplo del código utilizado para la simulación uno a uno.

funcion_gene<-function(xx,yy) library(RandomFields) model <- "exponential" mean <-980 variance <-300 nugget <- 0 scale <-2.8 step <- 1 kC<-3 kR<-3 k<-kC*kR f <- GaussRF(x=xx, y=yy, model=model, grid=TRUE,param=c(mean, variance,nugget, scale)) gr<-ifelse(f<=1000,0,1) p_real<-mean(gr) C<-length(xx) R<-length(yy) N<-R*C nC<-C/kC nR<-R/kR n<-nC*nR pares<-merge(1:kR,1:kC) xx<-c(pares[,1]) yy<-c(pares[,2]) xx<-matrix(data = xx, nrow = length(xx), ncol = 1, byrow = FALSE, dimnames = NULL) yy<-matrix(data = yy, nrow = length(yy), ncol = 1, byrow = FALSE, dimnames = NULL) par<-cbind(xx,yy) h<-1:9 selec1<-function(h)(1:(C/kC)-1)*kC+par[h,1] selec2<-function(h)(1:(C/kC)-1)*kC+par[h,2] xs<-sapply(h, selec1, simplify = TRUE, USE.NAMES = TRUE) ys<-sapply(h, selec2, simplify = TRUE, USE.NAMES = TRUE) hh<-1 xss<-length(xs[,1]) yss<-length(ys[,1]) #inicio funcion de ajuste funcion_ajuste<-function(h) muestra_siso<-f[xs[,h],ys[,h]] model<-"exponential" coord<-(merge(xs[,h],ys[,h])) a1<-c(coord$x) a2<-c(coord$y) a11<-matrix(a1) a22<-matrix(a2) corde<-matrix(cbind(a11,a22),289,2) ro<-cbind(corde,c(muestra_siso)) estparam <- c(mean(muestra_siso), NA, 0,NA) # es el vector de parametros a estimarse, media, var, nug, esc tu<-fitvario(x<-corde , data=muestra_siso, model=model, param=estparam, lower=NULL, upper=NULL, sill=NA) # ajusta los prametros para un modelo dado return(c(tu$variogram$reml$param,tu$values$ml)) h<-1:9 vector_set<-function(h) eval.parent(funcion_ajuste(h),n=h) vector_conf_exponential<-sapply(h, vector_set, simplify = TRUE, USE.NAMES = TRUE) vector_conf_exponential #fin funcion de ajuste tu$nlsq$param, tu$variogram$reml$param,muestra_siso,mean(muestra_siso), sum((mean(muestra_siso)-muestra_siso)^2)/(17*17),x<-cbind(1:17,1:17),tu$variogram$self$param sum((f-mean(f))^2)/(51*51) x <- matrix(0, nr = (xss)^2, nc = (yss)^2) x[row(x)+1 == col(x)] <- 1 y <- matrix(0, nr = (xss)^2, nc = (yss)^2) y[row(x)-1 == col(x)] <- 1 corrector<-x+y alpha<-0.05 z<-qnorm(alpha/2, mean=0, sd=1, lower.tail = TRUE, log.p = FALSE) funcion_gene2<-function(h) muestra_sis<-gr[xs[,h],ys[,h]] p_estim<-mean(muestra_sis) V_srs<-(1-(n/N))*p_estim*(1-p_estim)/(n-1)

Page 80: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

69

inicial<-c(muestra_sis[1:xss,1:yss]) i<-1:(xss)^2 resta<-function(u) (inicial[u]-inicial)^2 d<-sapply(i, resta, simplify = TRUE, USE.NAMES = TRUE) suma1<-sum(corrector*d) ci<-((n-1)*(suma1))/((sum((muestra_sis-p_estim)^2))*(2*sum(corrector))) vector_ci<-cbind(ci) V_str.s<-V_srs*ci inversa<-t(inicial-p_estim) sum((t(inversa)%*%inversa)*corrector) li<-(n*sum((t(inversa)%*%inversa)*corrector))/(sum(corrector)*(sum((muestra_sis-p_estim)^2))) li<-ifelse(li>=1,.99,li) li<-ifelse(li<=0,0,li) wi<-1+(2/log(li))+(2/(1/li-1)) vector_li<-cbind(li) V_w.s<-V_srs*wi lower_srs<-p_estim+z*(V_srs)^.5 upper_srs<-p_estim-z*(V_srs)^.5 x_l_srs<-ifelse(lower_srs<p_real,1,0) x_u_srs<-ifelse(p_real<upper_srs,1,0) xi_srs<-x_u_srs*x_l_srs lower_str.s<-p_estim+z*(V_str.s)^.5 upper_str.s<-p_estim-z*(V_str.s)^.5 x_l_str.s<-ifelse(lower_str.s<p_real,1,0) x_u_str.s<-ifelse(p_real<upper_str.s,1,0) xi_str.s<-x_u_str.s*x_l_str.s lower_w.s<-p_estim+z*(V_w.s)^.5 upper_w.s<-p_estim-z*(V_w.s)^.5 x_l_w.s<-ifelse(lower_w.s<p_real,1,0) x_u_w.s<-ifelse(p_real<upper_w.s,1,0) xi_w.s<-x_u_w.s*x_l_w.s #parametros ajustados para simulacion model<-"exponential" param <- c(vector_conf_exponential[1,h], vector_conf_exponential[2,h] , 0 , vector_conf_exponential[4,h]) #comienzo de simulacion incondicional fi <- GaussRF(x=1:51, y=1:51, model=model, grid=TRUE,param=param) gi<-ifelse(fi<=1000,0,1) media_reali<-mean(gi) ggi<-gi[xs[,h],ys[,h]] media_esti<-mean(ggi) zi<-fi[xs[,h],ys[,h]] zi_med<-mean(zi) zit<-mean(fi) bi<-sum((zi-zi_med)*(ggi-media_esti))/sum((zi-zi_med)^2) yiajust<-media_esti-bi*zi_med+bi*zi Ei<-ggi-yiajust var_regi1<-(1-(n/N))*(1/n)*sum((Ei-mean(Ei))^2)/(n-1) var_regi1 lower_sim_regi1<-p_estim+z*(var_regi1)^.5 upper_sim_regi1<-p_estim-z*(var_regi1)^.5 x_sim_regi1_l<-ifelse(lower_sim_regi1<p_real,1,0) x_sim_regi1_u<-ifelse(p_real<upper_sim_regi1,1,0) x_sim_i_regi1<-x_sim_regi1_l*x_sim_regi1_u return(c(p_estim,ci,li,V_srs,V_str.s,V_w.s,var_regi1,xi_srs,xi_str.s,xi_w.s,x_sim_i_regi1)) h<-1:9 vector<-function(h) eval.parent(funcion_gene2(h),n=h) vector_conf<-sapply(h, vector, simplify = TRUE, USE.NAMES = TRUE) var_real<-sum((p_real-vector_conf[1,])^2)/k sesgo_srs<-(((sum(vector_conf[4,]))/k)-var_real) sesgo_str.s<-(((sum(vector_conf[5,]))/k)-var_real) sesgo_w.s<-(((sum(vector_conf[6,]))/k)-var_real) sesgo_regi1<-(((sum(vector_conf[7,]))/k)-var_real) error_cuad_med_srs<-sum((vector_conf[4,]-var_real)^2)/k error_cuad_med_str.s<-sum((vector_conf[5,]-var_real)^2)/k error_cuad_med_w.s<-sum((vector_conf[6,]-var_real)^2)/k error_cuad_med_regi1<-sum((vector_conf[7,]-var_real)^2)/k vector_xi_srs<-c(vector_conf[8,]) vector_xi_str.s<-c(vector_conf[9,]) vector_xi_w.s<-c(vector_conf[10,]) vector_xi_regi1<-c(vector_conf[11,])

Page 81: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

70

CEk_srs<-(1/k)*sum(vector_xi_srs)*100 CEk_str.s<-(1/k)*sum(vector_xi_str.s)*100 CEk_w.s<-(1/k)*sum(vector_xi_w.s)*100 CEk_regi1<-(1/k)*sum(vector_xi_regi1)*100 vector_ci<-c(vector_conf[2,]) vector_li<-c(vector_conf[3,]) ci_media<-mean(vector_ci) li_media<-mean(vector_li) return(c(p_real,var_real,ci_media,li_media,sesgo_srs,sesgo_str.s,sesgo_w.s,sesgo_regi1,error_cuad_med_srs,error_cuad_med_str.s,error_cuad_med_w.s,error_cuad_med_regi1,CEk_srs,CEk_str.s,CEk_w.s,CEk_regi1,mean(vector_conf[4,])/var_real,mean(vector_conf[5,])/var_real,mean(vector_conf[6,])/var_real,mean(vector_conf[7,])/var_real,mean(vector_conf[4,]),mean(vector_conf[5,]),mean(vector_conf[6,]),mean(vector_conf[7,]))) xx<-1:51 yy<-1:51 jj<-1:3 matriz<-function(jj) eval.parent(funcion_gene(xx,yy),n=jj) matriz_setup_980_300_28_exp_51_51<-sapply(jj, matriz, simplify = TRUE, USE.NAMES = TRUE) ecmr_srs<-sum((mean(matriz_setup_980_300_28_exp_51_51 [2,])-matriz_setup_980_300_28_exp_51_51 [21,])^2)/(length(jj)-1) ecmr_str.s<-sum((mean(matriz_setup_980_300_28_exp_51_51 [2,])-matriz_setup_980_300_28_exp_51_51 [22,])^2)/(length(jj)-1) ecmr_w.s<-sum((mean(matriz_setup_980_300_28_exp_51_51 [2,])-matriz_setup_980_300_28_exp_51_51 [23,])^2)/(length(jj)-1) ecmr_regi1<-sum((mean(matriz_setup_980_300_28_exp_51_51 [2,])-matriz_setup_980_300_28_exp_51_51 [24,])^2)/(length(jj)-1) jjj<-1:length(matriz_setup_980_300_28_exp_51_51[,1]) jjj medias_finales<-function(jjj) mean(matriz_setup_980_300_28_exp_51_51[jjj,]) medias_setup_980_300_28_exp_51_51<-sapply(jjj, medias_finales) tabla_setup_980_300_28_exp_51_51<-c(medias_setup_980_300_28_exp_51_51,ecmr_srs,ecmr_str.s,ecmr_w.s,ecmr_regi1) tabla_setup_980_300_28_exp_51_51 write(tabla_setup_980_300_28_exp_51_51, file = "C:/JARQUIN/tabla_setup_980_300_28_exp_51_51_uno_a_uno.txt", ncolumns = if(is.character(tabla_setup_980_300_28_exp_51_51)) 1 else 28, append = FALSE, sep = " ")

Page 82: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

71

Anexo 2. Ejemplo del código utilizado para la simulación por promedio. model <- "exponential" mean <- 980 variance <-300 nugget <- 0 scale <-1.5 step <- 1 kC<-3 kR<-3 k<-kC*kR xx<-1:51 yy<-1:51 f <- GaussRF(x=xx, y=yy, model=model, grid=TRUE,param=c(mean, variance,nugget, scale)) gr<-ifelse(f<=1000,0,1) p_real<-mean(gr) p_real ord1<-seq(1,51,3) ord2<-seq(2,51,3) ord3<-seq(3,51,3) muestra_sis1<-f[ord1,ord1] muestra_sis2<-f[ord1,ord2] muestra_sis3<-f[ord1,ord3] muestra_sis4<-f[ord2,ord1] muestra_sis5<-f[ord2,ord2] muestra_sis6<-f[ord2,ord3] muestra_sis7<-f[ord3,ord1] muestra_sis8<-f[ord3,ord2] muestra_sis9<-f[ord3,ord3] muestra_sisg1<-gr[ord1,ord1] muestra_sisg2<-gr[ord1,ord2] muestra_sisg3<-gr[ord1,ord3] muestra_sisg4<-gr[ord2,ord1] muestra_sisg5<-gr[ord2,ord2] muestra_sisg6<-gr[ord2,ord3] muestra_sisg7<-gr[ord3,ord1] muestra_sisg8<-gr[ord3,ord2] muestra_sisg9<-gr[ord3,ord3] p_estim1<-mean(muestra_sisg1) p_estim2<-mean(muestra_sisg2) p_estim3<-mean(muestra_sisg3) p_estim4<-mean(muestra_sisg4) p_estim5<-mean(muestra_sisg5) p_estim6<-mean(muestra_sisg6) p_estim7<-mean(muestra_sisg7) p_estim8<-mean(muestra_sisg8) p_estim9<-mean(muestra_sisg9) p_estim1 p_estim2 p_estim3 p_estim4 p_estim5 p_estim6 p_estim7 p_estim8 p_estim9 vector_medias_sist<-c(p_estim1,p_estim2,p_estim3,p_estim4,p_estim5,p_estim6,p_estim7,p_estim8,p_estim9) media_sist_real<-mean(vector_medias_sist) media_sist_real var_sist_real<-sum((vector_medias_sist-media_sist_real)^2)/9 var_sist_real #fin de simulacion de poblacion bajo estudio kC<-3 kR<-3 k<-kC*kR C<-51 R<-51 N<-R*C nC<-C/kC

Page 83: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

72

nR<-R/kR n<-nC*nR pares<-merge(1:kR,1:kC) xd<-c(pares[,1]) yd<-c(pares[,2]) xd<-matrix(data = xd, nrow = length(xd), ncol = 1, byrow = FALSE, dimnames = NULL) yd<-matrix(data = yd, nrow = length(yd), ncol = 1, byrow = FALSE, dimnames = NULL) par<-cbind(xd,yd) h<-1:9 selec1<-function(h)(1:(C/kC)-1)*kC+par[h,1] selec2<-function(h)(1:(C/kC)-1)*kC+par[h,2] xs<-sapply(h, selec1, simplify = TRUE, USE.NAMES = TRUE) ys<-sapply(h, selec2, simplify = TRUE, USE.NAMES = TRUE) hh<-1 xss<-length(xs[,1]) yss<-length(ys[,1]) #inicio funcion de ajuste funcion_ajuste<-function(h) muestra_siso<-f[xs[,h],ys[,h]] model<-"exponential" coord<-(merge(xs[,h],ys[,h])) a1<-c(coord$x) a2<-c(coord$y) a11<-matrix(a1) a22<-matrix(a2) corde<-matrix(cbind(a11,a22),289,2) ro<-cbind(corde,c(muestra_siso)) estparam <- c(mean(muestra_siso), NA, 0,NA) # es el vector de parametros a estimarse, media, var, nug, esc tu<-fitvario(x<-corde , data=muestra_siso, model=model, param=estparam, lower=NULL, upper=NULL, sill=NA) # ajusta los prametros para un modelo dado return(c(tu$variogram$reml$param,tu$values$ml)) h<-1:9 vector_set<-function(h) eval.parent(funcion_ajuste(h),n=h) vector_conf_exponential<-sapply(h, vector_set, simplify = TRUE, USE.NAMES = TRUE) vector_conf_exponential #fin funcion de ajuste tu$nlsq$param, tu$variogram$reml$param,muestra_siso,mean(muestra_siso), sum((mean(muestra_siso)-muestra_siso)^2)/(17*17),x<-cbind(1:17,1:17),tu$variogram$self$param sum((f-mean(f))^2)/(51*51) #empieza resultados a comparar x <- matrix(0, nr = (xss)^2, nc = (yss)^2) x[row(x)+1 == col(x)] <- 1 y <- matrix(0, nr = (xss)^2, nc = (yss)^2) y[row(x)-1 == col(x)] <- 1 corrector<-x+y alpha<-0.05 z<-qnorm(alpha/2, mean=0, sd=1, lower.tail = TRUE, log.p = FALSE) funcion_gene2<-function(h) muestra_sis<-gr[xs[,h],ys[,h]] muestra_siso<-f[xs[,h],ys[,h]] funcion_simulacion<-function(xx,yy) #parametros comunes para ambas simulaciones model<-"exponential" param <- c(vector_conf_exponential[1,h], vector_conf_exponential[2,h] , 0 , vector_conf_exponential[4,h]) #comienzo de simulacion incondicional fi <- GaussRF(x=1:51, y=1:51, model=model, grid=TRUE,param=param) gi<-ifelse(fi<=1000,0,1) media_reali<-mean(gi) N<-51*51 N1<-sum(gi) # VALORES MAYORES DE 1000 N2<-N-N1 # VALORES MENORES O IGUALES 1000 ggi<-gi[xs[,h],ys[,h]] media_esti<-mean(ggi) errori<-media_reali-media_esti media_reali media_esti errori zi<-fi[xs[,h],ys[,h]] zi_med<-mean(zi) zit<-mean(fi) bi<-sum((zi-zi_med)*(ggi-media_esti))/sum((zi-zi_med)^2)

Page 84: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

73

yiajust<-mean(muestra_sis)-bi*zi_med+bi*zi Ei<-ggi-yiajust var_regi1<-(1-(n/N))*(1/n)*sum((Ei-mean(Ei))^2)/(n-1) var_regi1 #fin de simulacion incondicional vector_media_reali<-c(media_reali) vector_media_esti<-c(media_esti) vector_errori<-c(errori) vector_var_regi1<-c(var_regi1) return(c(vector_media_reali,vector_media_esti,vector_errori,vector_var_regi1)) xx<-1:51 #SE INDICA EL NUMERO DE COLS yy<-1:51 #SE INDICA EL NUMERO DE RENG #funcion_simulacion(xx,yy) # SE LLAMA A LA FUNCION PARA xx Y yy jj<-1:100 #SE INDICA EL NUMERO DE REPETICIONES matriz<-function(jj) eval.parent(funcion_simulacion(xx,yy),n=jj) #SE EVALUA LA FUNCION jj VECES matriz_salida<-sapply(jj, matriz, simplify = TRUE, USE.NAMES = TRUE) media_medias_real_i<-mean(matriz_salida[1,] ) media_medias_esti<-mean(matriz_salida[2,] ) media_erroresi<-mean(matriz_salida[3,] ) var_medias_esti<-sum((matriz_salida[3,]-media_erroresi)^2)/(length(jj)-1) var_medias_esti vector_var_medias_esti<-c(var_medias_esti) media_var_regi1<-mean(matriz_salida[4,]) p_estim<-mean(muestra_sis) V_srs<-(1-(n/N))*p_estim*(1-p_estim)/(n-1) inicial<-c(muestra_sis[1:xss,1:yss]) i<-1:(xss)^2 resta<-function(u) (inicial[u]-inicial)^2 d<-sapply(i, resta, simplify = TRUE, USE.NAMES = TRUE) suma1<-sum(corrector*d) ci<-((n-1)*(suma1))/((sum((muestra_sis-p_estim)^2))*(2*sum(corrector))) vector_ci<-cbind(ci) V_str.s<-V_srs*ci inversa<-t(inicial-p_estim) sum((t(inversa)%*%inversa)*corrector) li<-(n*sum((t(inversa)%*%inversa)*corrector))/(sum(corrector)*(sum((muestra_sis-p_estim)^2))) li<-ifelse(li>=1,.99,li) li<-ifelse(li<=0,0,li) wi<-1+(2/log(li))+(2/(1/li-1)) vector_li<-cbind(li) V_w.s<-V_srs*wi lower_srs<-p_estim+z*(V_srs)^.5 upper_srs<-p_estim-z*(V_srs)^.5 x_l_srs<-ifelse(lower_srs<p_real,1,0) x_u_srs<-ifelse(p_real<upper_srs,1,0) xi_srs<-x_u_srs*x_l_srs lower_str.s<-p_estim+z*(V_str.s)^.5 upper_str.s<-p_estim-z*(V_str.s)^.5 x_l_str.s<-ifelse(lower_str.s<p_real,1,0) x_u_str.s<-ifelse(p_real<upper_str.s,1,0) xi_str.s<-x_u_str.s*x_l_str.s lower_w.s<-p_estim+z*(V_w.s)^.5 upper_w.s<-p_estim-z*(V_w.s)^.5 x_l_w.s<-ifelse(lower_w.s<p_real,1,0) x_u_w.s<-ifelse(p_real<upper_w.s,1,0) xi_w.s<-x_u_w.s*x_l_w.s lower_i<-p_estim+z*(var_medias_esti)^.5 upper_i<-p_estim-z*(var_medias_esti)^.5 x_l_i<-ifelse(lower_i<p_real,1,0) x_u_i<-ifelse(p_real<upper_i,1,0) xi_i<-x_l_i*x_u_i var_sim_i_corrg_ci<-vector_var_medias_esti*ci var_sim_i_corrg_wi<-vector_var_medias_esti*wi lower_sim_i_corrg_ci<-p_estim+z*(var_sim_i_corrg_ci)^.5 upper_sim_i_corrg_ci<-p_estim-z*(var_sim_i_corrg_ci)^.5 lower_sim_i_corrg_wi<-p_estim+z*(var_sim_i_corrg_wi)^.5 upper_sim_i_corrg_wi<-p_estim-z*(var_sim_i_corrg_wi)^.5 x_sim_i_corrg_ci<-ifelse(lower_sim_i_corrg_ci<p_real,1,0) x_sim_i_corrg_ci<-ifelse(p_real<upper_sim_i_corrg_ci,1,0) x_sim_i_corrg_ci_i<-x_sim_i_corrg_ci*x_sim_i_corrg_ci

Page 85: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

74

x_sim_i_corrg_wi<-ifelse(lower_sim_i_corrg_wi<p_real,1,0) x_sim_i_corrg_wi<-ifelse(p_real<upper_sim_i_corrg_wi,1,0) x_sim_i_corrg_wi_i<-x_sim_i_corrg_wi*x_sim_i_corrg_wi lower_sim_regi1<-p_estim+z*(media_var_regi1)^.5 upper_sim_regi1<-p_estim-z*(media_var_regi1)^.5 x_sim_regi1_l<-ifelse(lower_sim_regi1<p_real,1,0) x_sim_regi1_u<-ifelse(p_real<upper_sim_regi1,1,0) x_sim_i_regi1<-x_sim_regi1_l*x_sim_regi1_u return(c(p_real,p_estim,var_sist_real,V_srs,V_str.s,V_w.s,vector_var_medias_esti,var_sim_i_corrg_ci,var_sim_i_corrg_wi,media_var_regi1,xi_srs,xi_str.s,xi_w.s,xi_i,x_sim_i_corrg_ci_i,x_sim_i_corrg_wi_i, x_sim_i_regi1,V_srs/var_sist_real,V_str.s/var_sist_real,V_w.s/var_sist_real,vector_var_medias_esti/var_sist_real,var_sim_i_corrg_ci/var_sist_real,var_sim_i_corrg_wi/var_sist_real,media_var_regi1/var_sist_real,vector_ci,vector_li,vector_conf_exponential[4,h])) h<-1:9 vector<-function(h) eval.parent(funcion_gene2(h),n=h) vect_conf1_exp_980_300_15<-sapply(h, vector, simplify = TRUE, USE.NAMES = TRUE) vect_conf1_exp_980_300_15 sesgo_vsrs<-mean(vect_conf1_exp_980_300_15[4,])-var_sist_real sesgo_vst<-mean(vect_conf1_exp_980_300_15[5,])-var_sist_real sesgo_vaut<-mean(vect_conf1_exp_980_300_15[6,])-var_sist_real sesgo_vsi<-mean(vect_conf1_exp_980_300_15[7,])-var_sist_real sesgo_vsici<-mean(vect_conf1_exp_980_300_15[8,])-var_sist_real sesgo_vsiwi<-mean(vect_conf1_exp_980_300_15[9,])-var_sist_real sesgo_var_regi1<-mean(vect_conf1_exp_980_300_15[10,])-var_sist_real ecm_srs<-mean((vect_conf1_exp_980_300_15[4,])-var_sist_real)^2 ecm_st<-mean((vect_conf1_exp_980_300_15[5,])-var_sist_real)^2 ecm_aut<-mean((vect_conf1_exp_980_300_15[6,])-var_sist_real)^2 ecm_si<-mean((vect_conf1_exp_980_300_15[7,])-var_sist_real)^2 ecm_sici<-mean((vect_conf1_exp_980_300_15[8,])-var_sist_real)^2 ecm_siwi<-mean((vect_conf1_exp_980_300_15[9,])-var_sist_real)^2 ecm_regi1<-mean((vect_conf1_exp_980_300_15[10,])-var_sist_real)^2 sesgos<-c(sesgo_vsrs,sesgo_vst,sesgo_vaut,sesgo_vsi,sesgo_vsici,sesgo_vsiwi,sesgo_var_regi1) ecms<-c(ecm_srs,ecm_st,ecm_aut,ecm_si,ecm_sici,ecm_siwi,ecm_regi1) media_vsrs<-mean(vect_conf1_exp_980_300_15[18,]) media_vst<-mean(vect_conf1_exp_980_300_15[19,]) media_vaut<-mean(vect_conf1_exp_980_300_15[20,]) media_vsi<-mean(vect_conf1_exp_980_300_15[21,]) media_vsici<-mean(vect_conf1_exp_980_300_15[22,]) media_vsiwi<-mean(vect_conf1_exp_980_300_15[23,]) media_regil1<-mean(vect_conf1_exp_980_300_15[24,]) media_varianzas<-c(media_vsrs,media_vst,media_vaut,media_vsi,media_vsici,media_vsiwi,media_regil1) vect_conf1_exp_980_300_15<-matrix(cbind(vect_conf1_exp_980_300_15,sesgos,ecms,media_varianzas),27,12) write(vect_conf1_exp_980_300_15, file = "C:/JARQUIN/vect_conf1_exp_980_300_15.txt", ncolumns = if(is.character(vect_conf1_exp_980_300_15)) 12 else 27, append = TRUE, sep = " ") x <- matrix(0, nr = (xss)^2, nc = (yss)^2) x[row(x)+1 == col(x)] <- 1 y <- matrix(0, nr = (xss)^2, nc = (yss)^2) y[row(x)-1 == col(x)] <- 1 corrector<-x+y alpha<-0.05 z<-qnorm(alpha/2, mean=0, sd=1, lower.tail = TRUE, log.p = FALSE) funcion_gene2<-function(h) muestra_sis<-gr[xs[,h],ys[,h]] p_estim<-mean(muestra_sis) V_srs<-(1-(n/N))*p_estim*(1-p_estim)/(n-1) inicial<-c(muestra_sis[1:xss,1:yss]) i<-1:(xss)^2 resta<-function(u) (inicial[u]-inicial)^2 d<-sapply(i, resta, simplify = TRUE, USE.NAMES = TRUE) suma1<-sum(corrector*d) ci<-((n-1)*(suma1))/((sum((muestra_sis-p_estim)^2))*(2*sum(corrector))) vector_ci<-cbind(ci) V_str.s<-V_srs*ci inversa<-t(inicial-p_estim) sum((t(inversa)%*%inversa)*corrector) li<-(n*sum((t(inversa)%*%inversa)*corrector))/(sum(corrector)*(sum((muestra_sis-p_estim)^2))) li<-ifelse(li>=1,.99,li) li<-ifelse(li<=0,0,li) wi<-1+(2/log(li))+(2/(1/li-1)) vector_li<-cbind(li)

Page 86: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

75

V_w.s<-V_srs*wi lower_srs<-p_estim+z*(V_srs)^.5 upper_srs<-p_estim-z*(V_srs)^.5 x_l_srs<-ifelse(lower_srs<p_real,1,0) x_u_srs<-ifelse(p_real<upper_srs,1,0) xi_srs<-x_u_srs*x_l_srs lower_str.s<-p_estim+z*(V_str.s)^.5 upper_str.s<-p_estim-z*(V_str.s)^.5 x_l_str.s<-ifelse(lower_str.s<p_real,1,0) x_u_str.s<-ifelse(p_real<upper_str.s,1,0) xi_str.s<-x_u_str.s*x_l_str.s lower_w.s<-p_estim+z*(V_w.s)^.5 upper_w.s<-p_estim-z*(V_w.s)^.5 x_l_w.s<-ifelse(lower_w.s<p_real,1,0) x_u_w.s<-ifelse(p_real<upper_w.s,1,0) xi_w.s<-x_u_w.s*x_l_w.s #parametros ajustados para simulacion model<-"exponential" param <- c(vector_conf_exponential[1,h], vector_conf_exponential[2,h] , 0 , vector_conf_exponential[4,h]) #comienzo de simulacion incondicional fi <- GaussRF(x=1:51, y=1:51, model=model, grid=TRUE,param=param) gi<-ifelse(fi<=1000,0,1) media_reali<-mean(gi) ggi<-gi[xs[,h],ys[,h]] media_esti<-mean(ggi) zi<-fi[xs[,h],ys[,h]] zi_med<-mean(zi) zit<-mean(fi) bi<-sum((zi-zi_med)*(ggi-media_esti))/sum((zi-zi_med)^2) yiajust<-media_esti-bi*zi_med+bi*zi Ei<-ggi-yiajust var_regi1<-(1-(n/N))*(1/n)*sum((Ei-mean(Ei))^2)/(n-1) var_regi1 lower_sim_regi1<-p_estim+z*(var_regi1)^.5 upper_sim_regi1<-p_estim-z*(var_regi1)^.5 x_sim_regi1_l<-ifelse(lower_sim_regi1<p_real,1,0) x_sim_regi1_u<-ifelse(p_real<upper_sim_regi1,1,0) x_sim_i_regi1<-x_sim_regi1_l*x_sim_regi1_u return(c(p_estim,ci,li,V_srs,V_str.s,V_w.s,var_regi1,xi_srs,xi_str.s,xi_w.s,x_sim_i_regi1)) h<-1:9 vector<-function(h) eval.parent(funcion_gene2(h),n=h) vector_conf<-sapply(h, vector, simplify = TRUE, USE.NAMES = TRUE) var_real<-sum((p_real-vector_conf[1,])^2)/k sesgo_srs<-(((sum(vector_conf[4,]))/k)-var_real) sesgo_str.s<-(((sum(vector_conf[5,]))/k)-var_real) sesgo_w.s<-(((sum(vector_conf[6,]))/k)-var_real) sesgo_regi1<-(((sum(vector_conf[7,]))/k)-var_real) error_cuad_med_srs<-sum((vector_conf[4,]-var_real)^2)/k error_cuad_med_str.s<-sum((vector_conf[5,]-var_real)^2)/k error_cuad_med_w.s<-sum((vector_conf[6,]-var_real)^2)/k error_cuad_med_regi1<-sum((vector_conf[7,]-var_real)^2)/k vector_xi_srs<-c(vector_conf[8,]) vector_xi_str.s<-c(vector_conf[9,]) vector_xi_w.s<-c(vector_conf[10,]) vector_xi_regi1<-c(vector_conf[11,]) CEk_srs<-(1/k)*sum(vector_xi_srs)*100 CEk_str.s<-(1/k)*sum(vector_xi_str.s)*100 CEk_w.s<-(1/k)*sum(vector_xi_w.s)*100 CEk_regi1<-(1/k)*sum(vector_xi_regi1)*100 vector_ci<-c(vector_conf[2,]) vector_li<-c(vector_conf[3,]) ci_media<-mean(vector_ci) li_media<-mean(vector_li) matriz_setup_980_300_15_exp_51_51<-c(p_real,var_real,ci_media,li_media,sesgo_srs,sesgo_str.s,sesgo_w.s,sesgo_regi1,error_cuad_med_srs,error_cuad_med_str.s,error_cuad_med_w.s,error_cuad_med_regi1,CEk_srs,CEk_str.s,CEk_w.s,CEk_regi1,mean(vector_conf[4,])/var_real,mean(vector_conf[5,])/var_real,mean(vector_conf[6,])/var_real,mean(vector_conf[7,])/var_real) write(matriz_setup_980_300_15_exp_51_51, file = "C:/JARQUIN/matriz_setup_980_300_15_exp_51_51.txt", ncolumns = if(is.character(matriz_setup_980_300_15_exp_51_51)) 1 else 20, append = TRUE, sep = " ")

Page 87: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

76

Anexo 3. Figuras obtenidas con simulación para algunas de las situaciones estudiadas.

Figura obtenida con la simulación de la Función de Autocorrelación Exponencial (Generada en forma acorde a un proceso Aleatorio Isotrópico Gaussiano con µ = 980 y σ = 300) para un tamaño de lattice de 51 * 51 y grado de Autocorrelación = 1.5. Color negro indica valores permisibles de contaminación (x ≤ 1000 TPH). Se simula un terreno contaminado que se encuentra en la etapa final de restauración.

0 10 20 30 40 50

010

20

30

40

50

x

y

Page 88: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

77

0 10 20 30 40 50

010

20

30

40

50

x

y

Figura obtenida con la simulación de la Función de Autocorrelación Exponencial (Generada en forma acorde a un proceso Aleatorio Isotrópico Gaussiano con µ = 1000 y σ = 600) para un tamaño de lattice de 51 * 51 y grado de Autocorrelación = 4.8. Color negro indica valores permisibles de contaminación (x ≤ 1000 TPH). Se simula un terreno contaminado que se encuentra en la etapa intermedia de restauración.

Page 89: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

78

0 10 20 30 40 50

010

20

30

40

50

x

y

Figura obtenida con la simulación de la Función de Autocorrelación Exponencial (Generada en forma acorde a un proceso Aleatorio Isotrópico Gaussiano con µ = 1020 y σ = 300) para un tamaño de lattice de 51 * 51 y grado de Autocorrelación = 1.5. Color negro indica valores permisibles de contaminación (x ≤ 1000 TPH). Se simula un terreno contaminado que aun no ha sido tratado para la restauración del suelo.

Page 90: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

79

0 10 20 30 40 50 60

010

20

30

40

50

60

x

y

Figura obtenida con la simulación de la Función de Autocorrelación Wave (Generada en forma acorde a un proceso Aleatorio Isotrópico Gaussiano con µ = 980 y σ = 300) para un tamaño de lattice de 69 * 69 y grado de Autocorrelación = 1.5. Color negro indica valores permisibles de contaminación (x ≤ 1000 TPH). Se simula un terreno contaminado que se encuentra en la etapa final de restauración.

Page 91: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

80

0 10 20 30 40 50 60

010

20

30

40

50

60

x

y

Figura obtenida con la simulación de la Función de Autocorrelación Wave (Generada en forma acorde a un proceso Aleatorio Isotrópico Gaussiano con µ = 1000 y σ = 600) para un tamaño de lattice de 69 * 69 y grado de Autocorrelación = 4.8. Color negro indica valores permisibles de contaminación (x ≤ 1000 TPH). Se simula un terreno contaminado que se encuentra en la etapa intermedia de restauración.

Page 92: ESTIMACIÓN DE LA VARIANZA DE LA PROPORCIÓN EN … · estimaciÓn de la varianza de la proporciÓn en muestreo sistemÁtico en dos dimensiones asistida por modelos geoestadÍsticos

81

0 10 20 30 40 50 60

010

20

30

40

50

60

x

y

Figura obtenida con la simulación de la Función de Autocorrelación Wave (Generada en forma acorde a un proceso Aleatorio Isotrópico Gaussiano con µ = 1020 y σ = 600) para un tamaño de lattice de 69 * 69 y grado de Autocorrelación = 4.8. Color negro indica valores permisibles de contaminación (x ≤ 1000 TPH). Se simula un terreno contaminado que aun no ha sido tratado para la restauración del suelo.