Bitácora de Talleres - Estadística Espacial

58
P á g i n a 1 | 58 2015 BITÁCORA TALLERES ESTADÍSTICA ESPACIAL UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS FACULTAD DE INGENIERÍA ESPECIALIZACIÓN EN SIG ESTADÍSTICA ESPACIAL BOGOTÁ D.C. COLOMBIA 2015 JUAN MANUEL CARILLO GARCIA - 20142094023 CRISTIAN ENRIQUE MORA CORTEZ - 20151094012 DIEGO ARMANDO RODRÍGUEZ ÁLVAREZ - 20151094015

description

Talleres clase estadistica espacial

Transcript of Bitácora de Talleres - Estadística Espacial

Page 1: Bitácora de Talleres - Estadística Espacial

P á g i n a 1 | 58

2015

BITÁCORA TALLERES

ESTADÍSTICA ESPACIAL UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS FACULTAD DE INGENIERÍA ESPECIALIZACIÓN EN SIG ESTADÍSTICA ESPACIAL BOGOTÁ D.C. COLOMBIA 2015

JUAN MANUEL CARILLO GARCIA - 20142094023

CRISTIAN ENRIQUE MORA CORTEZ - 20151094012

DIEGO ARMANDO RODRÍGUEZ ÁLVAREZ - 20151094015

Page 2: Bitácora de Talleres - Estadística Espacial

P á g i n a 2 | 58

TABLA DE CONTENIDO

TALLER 1 – AUTOCORRELACIÓN ESPACIAL ..................................................... 5

ACTIVIDAD INICIAL ............................................................................................ 5

MATRIZ DE PESOS ............................................................................................ 5

ANÁLISIS DE AUTOCORRELACIÓN ESPACIAL ............................................... 9

TALLER 2 – REGRESIÓN ESPACIAL .................................................................. 15

ACTIVIDAD INICIAL .......................................................................................... 15

REGRESIÓN ESPACIAL ................................................................................... 19

TALLER 3. ESCOGER UN CRITERIO DE VECINDAD ........................................ 23

REGRESION SIMPLE DE LA TASA DE ANALFABETISMO (ILLITERACY): .... 23

REGRESION SIMPLE DE URBAN_POP CHINADATA (N=29: ......................... 27

REGRESION MULTIPLE CON URBAN_POP Y RMC_PC_UR_ ...................... 29

REGRESION DE ERROR SIMPLE Y RETARDO ESPACIAL ........................... 31

REGRESION DE LOGARITMO DE ANALFABETISMO: ................................... 32

TALLER 4 – PATRONES PUNTUALES ESPACIALES ........................................ 34

OBJETIVOS DEL CAPÍTULO ............................................................................ 34

TIPOS DE PATRONES PUNTUALES ESPACIALES ........................................ 34

CARGUE Y PREPARACIÓN DE DATOS .......................................................... 35

PRUEBA DE CONTEO POR CUADRANTES ................................................... 36

ÍNDICE DE VECINO MÁS CERCANO .............................................................. 38

ESTIMACIÓN KERNEL ..................................................................................... 38

ESTIMACIÓN DE LA FUNCIÓN G .................................................................... 42

ESTIMACIÓN DE LA FUNCIÓN F ..................................................................... 44

ESTIMACIÓN DE LA FUNCIÓN L ..................................................................... 46

GENERACIÓN DE PATRONES PUNTUALES .................................................. 48

TALLER 5 – PATRONES PUNTUALES ................................................................ 54

FUNCIÓN K AGREGACIÓN ESPACIO-TIEMPO .............................................. 54

AJUSTE POBLACIÓN CASO - CONTROL ....................................................... 55

Page 3: Bitácora de Talleres - Estadística Espacial

P á g i n a 3 | 58

LISTA DE FIGURAS

Figura 1-1. Proyecciones de la capa sids ................................................................ 5

Figura 2-1. Mapas de vecindad Queen y Rook. ...................................................... 6

Figura 2-2. Mapas de vecindad k vecinos. .............................................................. 6

Figura 2-3. Mapas de vecindad datos puntuales. .................................................... 7

Figura 2-4. Mapas de vecindad bandas de distancias. ........................................... 8

Figura 2-5. Matriz de pesos estandarizada (izquierda) y binaria (derecha). ............ 8

Figura 2-6. Matriz de pesos por inverso de distancia. ............................................. 9

Figura 3-1. Índice I de moran para matriz estandarizada y binaria. ....................... 10

Figura 3-2. Índice I de moran – Monte-Carlo. ........................................................ 11

Figura 3-3. Histograma residuales I de moran – Monte-Carlo. .............................. 11

Figura 3-4. Índice C de Geary. .............................................................................. 12

Figura 3-5. Diagrama de dispersión I de Moran Local. .......................................... 13

Figura 3-6. Mapa de Cluster I de Moran Local. ..................................................... 14

Figura 1-1. Proyecciones de la capa Boston. ........................................................ 15

Figura 1-2. Mapas de vecindad K vecinos............................................................. 16

Figura 1-3. Comparación Mapas de vecindad K vecinos. ..................................... 16

Figura 1-4. Mapas de vecindad bandas de distancia. ........................................... 17

Figura 1-5. Índices I de moran para matriz de pesos por k vecinos (arriba) y bandas de distancias (abajo). ............................................................................................ 18

Figura 1-5. Diagramas de dispersión I de moran para matriz de pesos por k vecinos (izquierda) y bandas de distancias (derecha). ....................................................... 18

Figura 2-1. Resumen modelo de regresión. .......................................................... 19

Figura 2-2. Test de moran. .................................................................................... 19

Figura 2-3. Parámetros Test de moran. ................................................................ 20

Figura 2-4. Resultados Test de Breusch-Pagan. ................................................... 20

Figura 2-5. Resumen modelo de retardo espacial. ................................................ 21

Figura 2-6. Resumen modelo de error. ................................................................. 22

Figura 4-2 Creación Matriz de pesos (China 35) ................................................... 23

Figura 4-5 Reporte de variación y predicción de regresión (China 35) ................. 25

Figura 4-6 Reporte de regresión (China 35) .......................................................... 25

Figura 4-7 Diagnostico de dependencia espacial (China 35) ................................ 26

Figura 4-8 Moran’s I para Residuales (China 35) .................................................. 26

Figura 4-9 Ploteo China 29 en GeoDa .................................................................. 27

Figura 4-10 Despliegue tabla China 29 ................................................................. 27

Figura 4-13 Diagnostico dependencia espacial (China 29) ................................... 28

Figura 4-15 Reporte de regresión (Urban_Pop y RMC_PC_UR_) ........................ 29

Figura 26 Eventos de pasto Cogon ....................................................................... 36

Page 4: Bitácora de Talleres - Estadística Espacial

P á g i n a 4 | 58

Figura 27 Conteo por cuadrantes de eventos del pasto Cogon ............................ 37

Figura 28 Determinación del A.B óptimo por error medio cuadrático .................... 39

Figura 29 Estimación por kernel con variación del parámetro k ............................ 41

Figura 30 Estimación de la función kernel en spatstat .......................................... 42

Figura 31 Estimación de la función G para eventos del pasto Cogon ................... 44

Figura 32 Estimación de la función F para eventos del pasto Cogon .................... 46

Figura 33 Estimación de la función L para eventos del pasto Cogon .................... 48

Figura 34 Eventos de un patrón puntual aleatorio CSR ........................................ 49

Figura 35 Estimación de la función G para un patrón puntual aleatorio ................ 50

Figura 36 Eventos de un patrón puntual regular ................................................... 51

Figura 37 Estimación de la función G para un patrón puntual regular ................... 51

Figura 38 Eventos de un patrón puntual agregado ............................................... 52

Figura 39 Estimación de la función G para un patrón puntual agregado ............... 53

Figura 6-1. Resultados Función K agregación espacio temporal .......................... 55

Figura 6-2. Ploteo funciones cruzadas K y L ......................................................... 57

Figura 6-3. Ploteo función cruzada K en intervalos. .............................................. 58

LISTA DE TABLAS

Tabla 2-1. Resumen de distancias entre elementos. .............................................. 8

Tabla 1-1. Resumen de distancias entre elementos. ............................................ 17

Page 5: Bitácora de Talleres - Estadística Espacial

P á g i n a 5 | 58

TALLER 1 – AUTOCORRELACIÓN ESPACIAL

ACTIVIDAD INICIAL

El proceso inicial consiste en familiarizarse con las funciones de lectura, proyección y transformación del sistema de coordenadas para archivos shapefile; en el caso de estudio se tiene una capa de datos de tipo lattice del estado de carolina del norte en los Estados Unidos de Norteamérica.

Una vez leído el archivo, se procede a proyectarlo en coordenadas geográficas mediante la siguiente función:

proj4string(sids)=CRS("+proj=longlat +ellps=WGS84")

Con el objeto de ejemplificar las funciones de transformación, se adoptan los siguientes códigos presentes en la organización de referencia espacial1:

• EPSG:3358: NAD83(HARN) / North Carolina • ESRI:102719: NAD 1983 StatePlane North Carolina FIPS 3200 Feet

Las funciones para realizar las transformaciones, así como los resultados obtenidos se presentan a continuación.

sids_NAD=spTransform(sids, CRS("+init=epsg:3358")) sids_SP=spTransform(sids, CRS("+init=ESRI:102719"))

Figura 0-1. Proyecciones de la capa sids

MATRIZ DE PESOS Una vez definidos los datos a analizar, se procede a determinar las matrices de pesos por cada uno de los criterios que aplican para datos de tipo lattice:

1 Organización de referencias espaciales http://www.spatialreference.org/ref/

Page 6: Bitácora de Talleres - Estadística Espacial

P á g i n a 6 | 58

Matriz de Contigüidad: en el caso de datos de área se define la contigüidad entre polígonos a partir de la definición de la vecindad, la cual puede ser mediante tres casos, en los cuales un elemento es vecino de otro si comparte por lo menos un límite o un punto (caso queen), si comparte como únicamente un límite (caso rook) o si comparte únicamente un punto (caso bishop). Para el caso de análisis se definen los casos queen y rook, así como se presenta la vecindad mediante los mapas y los enlaces entre los centroides de cada polígono.

sids_nbq=poly2nb(sids) sids_nbr=poly2nb(sids, queen=FALSE)

Figura 0-1. Mapas de vecindad Queen y Rook.

Como se puede observar, existen variaciones menores, pues existen pocos elementos que comparten un punto entre sí en el caso de polígonos irregulares como son los polígonos del caso de estudio.

Matriz por k vecinos: te método para la definición de vecindad a partir del número de vecinos más cercanos, evalúa para cada polígono los enlaces entre los centroides de cada uno. A continuación se presentan las funciones empleadas así como los mapas de vecindad para uno, dos y tres vecinos más cercanos. sids_kn1=knn2nb(knearneigh(coords,k=1),row.names=IDs) sids_kn2=knn2nb(knearneigh(coords,k=2),row.names=IDs) sids_kn3=knn2nb(knearneigh(coords,k=3),row.names=IDs)

Figura 0-2. Mapas de vecindad k vecinos.

Page 7: Bitácora de Talleres - Estadística Espacial

P á g i n a 7 | 58

Como era de esperarse el número de relaciones de vecindad aumenta consecuentemente con el nuero de vecinos definido, lo cual no solo se evidencia en la matriz definida sino en los mapas de vecindad presentados. Este tipo de vecindad aplica no solamente a los datos de áreas sino a datos puntuales, para el caso de estudio se evalúa una capa de puntos mediante la lectura de un archivo csv (comma-separated values), en el cual cada observación tiene como atributos su localización. La función de vecindad para dos vecinos, así como el mapa de vecindad se presenta a continuación. bost_k2=knn2nb(knearneigh(coord_b,k=2,longlat=T)

Figura 0-3. Mapas de vecindad datos puntuales.

Matriz por bandas de distancia: el concepto de vecindad por bandas de distancia consiste en que para cada elemento se crea un buffer de la distancia especificada y se toman como vecinos los elementos que caen dentro de dicho buffer, vale la pena aclarar que para el caso de datos de área se toman los centroides de los polígonos. A continuación se presentan las funciones implementadas así como los mapas de vecindad resultantes para 0,75, una vez y 1,5 veces la distancia máxima entre centroides, para lo cual se requiere la determinación de las distancias entre todos los elementos. dist=unlist(nbdists(sids_kn1, coords)) max_k1<-max(dist) sids_kd1<-dnearneigh(coords, d1=0, d2=0.75*max_k1, row.names=IDs) sids_kd2<-dnearneigh(coords, d1=0, d2=1*max_k1, row.names=IDs) sids_kd3<-dnearneigh(coords, d1=0, d2=1.5*max_k1, row.names=IDs)

Page 8: Bitácora de Talleres - Estadística Espacial

P á g i n a 8 | 58

Min. 1st Qu. Median Mean 3rd Qu. Max.

40100 89770 97640 96290 107200 134600

Tabla 0-1. Resumen de distancias entre elementos.

Figura 0-4. Mapas de vecindad bandas de distancias.

En virtud a que las bandas se realizaron con base en la distancia máxima, para el caso de 0,75 veces la distancia máxima existen un alto número de elementos sin vecindad. Generalmente una matriz de pesos es expresada en forma binaria en donde para cada elemento en filas se indica con 1 si existe vecindad y con cero 0 si no existe vecindad; sin embargo, es útil realizar una estandarización a partir del fraccionamiento de los valores indicados con tal que cada fila sume la unidad. Para el caso de estudio la matriz estandarizada para los primeros elementos así como la matriz binaria del caso de matriz por contigüidad en el caso queen y las funciones empleadas se presentan a continuación.

Figura 0-5. Matriz de pesos estandarizada (izquierd a) y binaria (derecha).

Page 9: Bitácora de Talleres - Estadística Espacial

P á g i n a 9 | 58

sids_nbq_w<-nb2listw(sids_nbq) sids_nbq_w$weights sids_nbq_wb<-nb2listw(sids_nbq, style="B") sids_nbq_wb$weights Adicionalmente la matriz de pesos se puede definir a partir del inverso de las distancias entre en este caso los centroides de los polígonos; se definen las distancias, la función inversa y la matriz de pesos por contigüidad en el caso queen cuyas funciones y resultado se presenta a continuación. dist=nbdists(sids_nbq, coordinates(sids_SP)) idw=lapply(dist, function(x) 1/(x/1000)) sids_nbq_idwb=nb2listw(sids_nbq, glist=idw, style="B") sids_nbq_idwb$weights

Figura 0-6. Matriz de pesos por inverso de distanci a.

ANÁLISIS DE AUTOCORRELACIÓN ESPACIAL El análisis de autocorrelación espacial se determina a partir de la estimación del índice I de Moran, la cual es la mejor medida clásica que depende de la matriz de pesos definida y la variable de estudio.

Para el caso de estudio se comparan los valores del índice obtenido para la variable SIDR79 y las dos matrices definidas, estandarizada por filas y binaria. A continuación se presentan las funciones y los resultados obtenidos.

Page 10: Bitácora de Talleres - Estadística Espacial

P á g i n a 10 | 58

moran.test(sids_NAD$SIDR79, listw=sids_nbq_w, alternative="two.sided") moran.test(sids_NAD$SIDR79, listw=sids_nbq_wb)

Figura 0-1. Índice I de moran para matriz estandari zada y binaria.

Como se puede observar el valor del índice para la variable en particular, son similares y cercanos a cero, sin embargo el pvalue para un nivel de confianza del 95% de la matriz estandarizada es menor por lo que su significancia indica que se rechaza la hipótesis alternativa de aleatoriedad espacial indicando que existe una autocorrelacion débil.

Así mismo, el i de moran supone normalidad y aleatoriedad en los datos, razón por la cual para el primer supuesto se acostumbra a realizar simulaciones de Montecarlo en las cuales a partir de un número significativo de simulaciones se obtiene conjuntamente la normalidad. En el caso de estudio se realizaron 999 simulaciones cuyas funciones aplicadas y resultados se presentan a continuación:

bperm=moran.mc(sids_NAD$SIDR79, listw=sids_nbq_w, nsim=999)

Page 11: Bitácora de Talleres - Estadística Espacial

P á g i n a 11 | 58

Figura 0-2. Índice I de moran – Monte-Carlo.

Como se puede observar el índice presenta un valor similar pero el pvalue se reduce aún más indicando posible autocorrelación espacial.

Figura 0-3. Histograma residuales I de moran – Mont e-Carlo.

El histograma de los residuales del i de moran simulados presentan una media de cero indicando normalidad.

Adicionalmente el índice C de Geary permite validar los resultados obtenidos, en la cual valores menores a 1 indican posible autocorrelación y valores mayores indican autocorrelación negativa. El valor del índice así como las funciones empleadas se presentan a continuación igualmente para las dos matrices de pesos consideradas anteriormente.

geary.test(sids_NAD$SIDR79, listw=sids_nbq_w) geary.test(sids_NAD$SIDR79, listw=sids_nbq_wb)

Page 12: Bitácora de Talleres - Estadística Espacial

P á g i n a 12 | 58

Figura 0-4. Índice C de Geary.

Como se puede observar, valores menores a 1 indican una posible autocorrelación espacial.

Finalmente el análisis del índice I de moran, aplicado de manera local, permite identificar la localización de los conglomerados espaciales, cuyas presencias fueron definidas por el I de Moran global, para poder construir los mapas de conglomerados. Los cinco tipos de conglomerados espaciales definidos son:

i) alto-alto. ii) bajo-bajo. iii) bajo-alto. iv) alto-bajo. v) relación no significativa.

A continuación se presentan las funciones aplicadas para graficar los valores del i de moran resaltando los estadísticos significantes agrupados así como los resultados obtenidos.

nci=moran.plot(sids_NAD$SIDR79,sids_nbq_w,labels=as.character(sids_NAD$NAME), xlim=c(-1,6.5), ylim=c(-1,4.5), xlab="SIDS Rate", ylab="SL SIDS Rate")

Page 13: Bitácora de Talleres - Estadística Espacial

P á g i n a 13 | 58

Figura 0-5. Diagrama de dispersión I de Moran Local .

El grafico de dispersión muestra el índice global (0,14), el cual se encuentra entre el rango de 0 y 1, indicando que existe una posible autocorrelación espacial, validado por la pendiente de la regresión. Los puntos en el cuadrante inferior izquierdo muestran los conglomerados bajo-bajo y los puntos del cuadrante superior derecho indica los conglomerados alto-alto. Así mismo, a continuación se presenta las funciones implementadas y el mapa de cluster, indicando la localización de los diferentes tipos de conglomerados espaciales.

infl=apply(nci$is.inf, 1, any) x=sids_NAD$SIDR79 lhx=cut(x, breaks=c(min(x), mean(x), max(x)),labels=c("L", "H"), include.lowest=TRUE) wx=lag(sids_nbq_w, sids_NAD$SIDR79) lhwx=cut(wx, breaks=c(min(wx), mean(wx), max(wx)),labels=c("L", "H"), include.lowest=TRUE) lhlh=interaction(lhx, lhwx, infl, drop=TRUE) cols=rep(1, length(lhlh)) cols[lhlh == "H.L.TRUE"]=2 cols[lhlh == "L.H.TRUE"]=3 cols[lhlh == "H.H.TRUE"]=4 plot(sids_NAD, col=grey.colors(4, 0.95, 0.55, 2.2)[cols]) legend("bottomright", legend=c("None", "HL", "LH", "HH"), fill=grey.colors(4, 0.95, 0.55, 2.2), bty="n", cex=0.8, y.intersp=0.8)

Page 14: Bitácora de Talleres - Estadística Espacial

P á g i n a 14 | 58

Figura 0-6. Mapa de Cluster I de Moran Local.

Page 15: Bitácora de Talleres - Estadística Espacial

P á g i n a 15 | 58

TALLER 2 – REGRESIÓN ESPACIAL

ACTIVIDAD INICIAL El objetivo del análisis de regresión espacial consiste en tratar la autocorrelación espacial que existe entre una variable dependiente con relación a una o varias variables independientes y la correlación de los errores entre las observaciones y las estimaciones; en el caso de estudio se tiene una capa de datos de tipo puntual de la ciudad de Boston del estado de Massachusettes en los Estados Unidos de Norteamérica.

El análisis de regresión espacial requiere de la definición de la autocorrelación entre las variables y los residuales del modelo de regresión, razón por la cual el presente taller requiere de las herramientas y conceptos definidos en el taller anterior.

En primer lugar luego de cargados los datos, se requieren realizar las proyecciones y transformaciones. Según el estado de análisis se adoptan los siguientes códigos presentes en la organización de referencia espacial:

• EPSG:2805: NAD83(HARN) / Massachusetts Mainland • ESRI:102686: NAD 1983 StatePlane Massachusetts Mainland FIPS 2001

Feet

Los esquemas de los datos en las diferentes proyecciones se presentan a continuación.

Figura 0-1. Proyecciones de la capa Boston.

Posteriormente, al igual que para el análisis anterior, se requiere la estimación de las matrices de vecindad, las cuales para el tipo de datos disponibles se realiza mediante los criterios de k vecinos y bandas de distancias. Las funciones aplicadas

Page 16: Bitácora de Talleres - Estadística Espacial

P á g i n a 16 | 58

son las mismas que se presentaron anteriormente razón por la cual a continuación se presentan los mapas de vecindad indicados.

Figura 0-2. Mapas de vecindad K vecinos.

En virtud a que en el taller anterior se realizó el análisis de vecindad para datos puntuales por k vecinos, a continuación se presenta la comparación entre los mapas de vecindad, en donde la única diferencia radica en el sistema de proyección aplicado.

Figura 0-3. Comparación Mapas de vecindad K vecinos .

Al igual que en los análisis anteriores, se evidencia que a mayor número de vecinos indicados mayores relaciones se observan en los mapas de vecindad.

Para el caso de la matriz de pesos por el método de bandas de distancias se calculan nuevamente las distancias entre cada uno de los elementos con el objeto

Page 17: Bitácora de Talleres - Estadística Espacial

P á g i n a 17 | 58

de poder identificar la distancia critica la cual es adoptada como la distancia máxima. Los resultados los mapas de vecindad se presentan a continuación.

Min. 1st Qu. Median Mean 3rd Qu. Max.

166.6 1088.0 1790.0 2472.0 3128.0 13030.0

Tabla 0-1. Resumen de distancias entre elementos.

Figura 0-4. Mapas de vecindad bandas de distancia.

Así mismo se observa que al incrementar el ancho de banda analizado las relaciones entre los elementos dentro del mapa de vecindad igualmente aumentan y densifican el esquema.

Para el caso de la matriz de pesos, se empleara la matriz estandarizada por filas, a partir de las vecindades definidas; vale la pena aclarar que en el caso de bandas de distancias con un ancho de 0,75 la distancia máxima se obtienen elementos sin vecindades, razón por la cual a continuación se indicaran los resultados del índice I de Moran para ambos casos de matriz de pesos y la variable LOGMEDV.

Las funciones implementadas en el caso de elementos sin vecindades requieren de la inclusión del parámetro zero.policy=TRUE, por consiguiente las funciones aplicadas son:

boston_kn1_w<-nb2listw(boston_kn1) boston_kd1_w<-nb2listw(boston_kd1, zero.policy=T) moran.test(boston$LOGMEDV, listw=boston_kn1_w) moran.test(boston$LOGMEDV, listw=boston_kd1_w,zero.policy=T)

Page 18: Bitácora de Talleres - Estadística Espacial

P á g i n a 18 | 58

Figura 0-5. Índices I de moran para matriz de pesos por k vecinos (arriba) y bandas de distancias (abajo).

Como se puede observar los pvalue son iguales indicando significancia, el valor del índice es mayor en el caso de la matriz por k vecinos (0.76) respecto del índice para el caso de bandas de distancias (0.39), indicando así una mayor autocorrelación espacial para el primer método, igualmente se presentan los diagramas de dispersión para ambos casos.

Figura 0-6. Diagramas de dispersión I de moran para matriz de pesos por k vecinos (izquierda) y bandas de distancias (derecha).

Igualmente se valida la suposición realizada a partir de la pendiente de la recta de regresión entre la variable y el rezago espacial de la variable.

Page 19: Bitácora de Talleres - Estadística Espacial

P á g i n a 19 | 58

REGRESIÓN ESPACIAL Se realiza la regresión espacial de la variable de estudio en función de 6 variables independientes RM, LSTAT, CRIM, ZN, CHAS y DIS. Y se procede a guardar los datos de los residuales para cada una de las observaciones. El resumen del modelo de regresión el cual busca definir la significancia de las variables independientes se presenta a continuación.

Figura 0-1. Resumen modelo de regresión.

Como se puede observar, todas las variables incluidas son significativas, adicional al valor del R2, la cual si bien no es una medida confiable del ajuste del modelo para la regresión espacial es indicativa.

Una vez definida la matriz de pesos, como aquella obtenida mediante el método de k vecinos, se procede a realizar el test de moran mediante la siguiente función con el objeto de verificar los residuales para autocorrelación espacial, cuyos resultados se presentan a continuación

lm.morantest(bostlm,boston_kn1_w)

Figura 0-2. Test de moran.

Page 20: Bitácora de Talleres - Estadística Espacial

P á g i n a 20 | 58

En virtud a que se tiene un pvalue significativo y al valor alto del índice de moran de los residuales se puede establecer que existe autocorrelación espacial para los residuales indicando así que el modelo requiere de la inclusión de una variable espacial.

Para determinar el tipo de dependencia espacial del modelo de regresión se obtienen todos los parámetros del test de moran mediante la siguiente función con los siguientes resultados.

lm.LMtests(bostlm, boston_kn1_w, test="all")

Figura 0-3. Parámetros Test de moran.

Estos resultados indican como significativos LMerr y LMlag, razón por la cual se aplican test robustos para determinar el tipo de dependencia espacial. Adicionalmente se aplica el test de Breusch-Pagan, el cual busca establecer la existencia de heterocedasticidad (varianza no constante) en los errores. Las funciones aplicadas así como los resultados del test se indican a continuación:

library(lmtest) bptest(bostlm)

Figura 0-4. Resultados Test de Breusch-Pagan.

Page 21: Bitácora de Talleres - Estadística Espacial

P á g i n a 21 | 58

El resultado del test y el valor de pvalue significativo indican que los errores son heteroscedásticos, lo cual es consistente puesto que se tiene dependencia espacial

Finalmente se corren los modelos de retardo espacial y de error, los cuales buscan definir la variable espacial a agregar al modelo de regresión. Las funciones aplicadas y los resultados obtenidos se presentan a continuación:

bostlag=lagsarlm(LOGMEDV~RM + LSTAT + CRIM + ZN + CHAS + DIS, data=boston, boston_kn1_w) summary(bostlag) bptest.sarlm(bostlag)

Figura 0-5. Resumen modelo de retardo espacial.

Para el modelo de retardo espacial el pvalue del test LM indica que aún existe una mínima autocorrelación espacial de los para el nivel de confianza definido y el test BP indica que permanece la heterocedasticidad en los residuales.

Page 22: Bitácora de Talleres - Estadística Espacial

P á g i n a 22 | 58

bosterr=errorsarlm(LOGMEDV~RM + LSTAT + CRIM + ZN + CHAS + DIS, data=boston, listw=boston_kn1_w) summary(bosterr) bptest.sarlm(bosterr)

Figura 0-6. Resumen modelo de error.

Para el modelo de error el pvalue del test LR indica el peso de la variable espacial lambda equivalente al 41%.

Page 23: Bitácora de Talleres - Estadística Espacial

P á g i n a 23 | 58

TALLER 3. ESCOGER UN CRITERIO DE VECINDAD

REGRESION SIMPLE DE LA TASA DE ANALFABETISMO (ILLIT ERACY):

Visualizacion ShapeFile de China 35.

Figura 4-1 Ploteo China 35 en GeoDa

Después creamos los pesos por el método basado contigüidad, utilizando el caso Queen de orden grado uno, esto se realiza necesario para probar la auto correlación espacial. Con este paso se genera un archivo (.gal)

Figura 7-2 Creación Matriz de pesos (China 35)

Realizamos la regresión simple, tomando como variable dependiente a illiteracy, y como variable independiente Urban_pop_, en este proceso nos genera un reporte,

Page 24: Bitácora de Talleres - Estadística Espacial

P á g i n a 24 | 58

donde se encuentran que los coeficientes de la constante y de la variable Urban_Pop_ son de 11.3146 y -6.5784 respectivamente.

Figura 4-3 Reporte de regresión (China 35)

En esta imagen observamos los coeficientes utilizados, para realizar la regresión ordinaria. Ahora se procede a capturar estos resultados en la tabla, para ello captura las variables de la predicción y los valores de los residuales, generando el campo de los atributos respectivamente.

Figura 4-4 Almacenamiento y despliegue de predicció n y residuales (China 35)

Page 25: Bitácora de Talleres - Estadística Espacial

P á g i n a 25 | 58

Procedemos a realizar la visualización de esta información en forma gráfica, allí visualizar valores extremos, dando como resultado que la media de los residuos es siempre cero.

Figura 8-5 Reporte de variación y predicción de reg resión (China 35)

Variación Total Illiteracy v. Urban Pop%

Predicción por la regresión OLS_Predict v. Urban Pop%

Variación del residual OLS_Resid v. Urban Pop%

En el análisis del resultado de la regresión simple se obtiene las estadísticas de la variable dependiente que están resaltadas color rojo. Igualmente se puede hacer una interpretación de los resultados donde la regresión explica el 4.6% de la varianza en este caso en Y, por ello podemos decir que NO es estadísticamente significante por la probabilidad (F-staticstic) que tiene un valor de 0.215.

Figura 4-69 Reporte de regresión (China 35)

Page 26: Bitácora de Talleres - Estadística Espacial

P á g i n a 26 | 58

En este mismo sentido se puede comparar los valores de la Variación de la estimación que la cual se calcula Sum squared residual / Degres os Fredom, 1368.89/33=41.4816 y la del error estándar e la estimación que se encuentra raíz de la variación calculada √√41.4816=6.44062.

Figura 10 Diagnostico de dependencia espacial (Chin a 35)

Nota: Para este proceso se realizó el diagnostico de los estadísticos espaciales dependientes a través de peso basados por contigüidad, caso Queen de primer grado.

Dada la anterior aclaración, se puede determinar de esta manera que como el Moran’s I (error) es igual a 0.0933, este es efectivamente no existe autocorrelación debido a que este tiende a cero (0).

En la siguiente grafica se puede ver reflejado el valor de Moran’s donde esta variable espacial tiende a los valores agregados bajos bajos, y con alta variabilidad debido a la presencia de datos atipocos.

Figura 4-811 Moran’s I para Residuales (China 35)

Page 27: Bitácora de Talleres - Estadística Espacial

P á g i n a 27 | 58

REGRESION SIMPLE DE URBAN_POP CHINADATA (N=29:

Este mismo procesamiento se realiza para los datos de China con 29 provincias.

Figura 4-9 12Ploteo China 29 en GeoDa

En esta regresión se encuentran que los coeficientes de la constante y de la variable Urban_Pop_ son de 16.0475 y -16.1450 respectivamente

Figura 4-1013 Despliegue tabla China 29

Procedemos a realizar la visualización de esta información en forma grafica

Figura 4-11 Reporte de variación y predicción de re gresión (China 29)

Variacion Total Illiteracy v. Urban Pop%

Predicción por la regresión OLS_Predict v. Urban Pop%

Variacion del residual OLS_Resid v. Urban Pop%

Page 28: Bitácora de Talleres - Estadística Espacial

P á g i n a 28 | 58

En el análisis del resultado de la regresión simple se obtiene las estadísticas de la variable dependiente que están resaltadas color rojo. Igualmente se puede hacer una interpretación de los resultados donde la regresión explica el 33.4 % de la varianza en este caso en Y con respecto a la de 23 providencias que solo explicaba un 4.6%. Por ello podemos decir que es estadísticamente significante por la probabilidad (F-staticstic) que tiene un valor de 0.001.

Figura 4-12 Reporte de regresión (China 29)

En este mismo sentido se puede comparar los valores de la Variación de la estimación que la cual se calcula Sum squared residual / Degres os Fredom, 314/27=11.64 y la del error estándar e la estimación que se encuentra raíz de la variación calculada √11.6461=3.29

Figura 4-1314 Diagnostico dependencia espacial (Chi na 29)

Page 29: Bitácora de Talleres - Estadística Espacial

P á g i n a 29 | 58

Nota: Para este proceso se realizó el diagnostico de los estadísticos espaciales dependientes a través de peso basados por contigüidad, tipo Queen de primer orden.

Dada la anterior aclaración, se puede determinar de esta manera que como el Moran’s I (error) es igual a 0.563, este es efectivamente tiene autocorrelación espacial positiva.

En este caso, ya con los datos reducidos a 29, se observa una distribución mejor de los datos en los cuadrantes, son no tienen tendencia, ni agregación.

Figura 4-14 Moran’s I para Residuales (China 29)

REGRESION MULTIPLE CON URBAN_POP Y RMC_PC_UR_

Con los mismos datos de la China de 29 provincias, se calcula ahora la regresión múltiple para, Illiteracy con % Pop Urban con UrbanIncome.

Dado que ya se calcularon los pesos por medio de la vecindad contigua se procede a generar la regresión múltiple.

Figura 4-15 15Reporte de regresión (Urban_Pop y RMC _PC_UR_)

Page 30: Bitácora de Talleres - Estadística Espacial

P á g i n a 30 | 58

Así mismo se obtienen las estadísticas generales de los datos, aunque al observar la probabilidad de los datos se obtiene que la variable URBAN_POP, es significativa dado que tienes un valor de 0.004 pero, el RMB_PC_URB no lo es debido a que si probabilidad es de 0.1585. Además al observar el diagnostico de dependencia espacial el Moran’s I (error) lo encontramos como No significativo.

Figura 4-16 Reporte de regresión (Urban_Pop y RMC_P C_UR_)

Para una visualización de los datos se presentan las siguientes graficas:

Figura 4-17 Cluster (Urban_Pop y RMC_PC_UR_)

En estos términos se ratifica la expresión anterior, donde se dice que No es estadísticamente significativo y que no existe auto correlación espacial debido a que el Moran’s I es de 0.0225, con un p-valor de 0.448.

Figura 4-18 Moran’s I y Montecarlo (Urban_Pop y RMC _PC_UR_)

Gráfica Moran’s I Permutaciones de Monte Carlo

Page 31: Bitácora de Talleres - Estadística Espacial

P á g i n a 31 | 58

REGRESION DE ERROR SIMPLE Y RETARDO ESPACIAL

De esta misma forma, se realiza la regresión múltiple de los anteriores datos, pero esta genera los resultados del modelo de errores espaciales.

Figura 4-19 Reporte de regresión (Modelo error espa cial)

Dado que LAMBDA es la variable espacial, esta dice cumplir con el 60% del todo el modelo y esta dependen del p-valor y el nivel de confianza, y como el valor es de 0.871 podemos afirmar que este No es significativo.

Figura 4-20 Regresión múltiple los resultados del modelo de retardos espaciales.

Page 32: Bitácora de Talleres - Estadística Espacial

P á g i n a 32 | 58

Para continuar con este análisis, se obtiene la regresión múltiple para la obtención de los resultados del modelo de retardos espaciales.

Igualmente cuando se visualiza el resultado del peso de la variable se obtiene que este retardo espacial no sea significativo.

REGRESION DE LOGARITMO DE ANALFABETISMO:

Para obtener un mejor entendimiento de lo anterior descrito se presenta los modelos gráficamente, dado que la relación que de la grafia xx, no es lineal se debe realizar un calculó logarítmico (Log base 10), de la variable Illiteracy.

Figura 4-21 Scatter Plot (URBAN_POP Y LOG_ILLT)

Page 33: Bitácora de Talleres - Estadística Espacial

P á g i n a 33 | 58

Figura 4-22 Reporte de regresión (Log de Illiteracy )

Page 34: Bitácora de Talleres - Estadística Espacial

P á g i n a 34 | 58

TALLER 4 – PATRONES PUNTUALES ESPACIALES

OBJETIVOS DEL CAPÍTULO

1. Determinar si existe tendencia de los eventos a encontrarse en un patrón sistemático sobre el área de estudio como contradicción a estar aleatoriamente distribuidos.

2. Identificar si un patrón muestra una agregación, regularidad o aleatoriedad.

TIPOS DE PATRONES PUNTUALES ESPACIALES

Aleatorio: Cualquier punto es igualmente

probable de ocurrir en cualquier ubicación y la posición de cualquier

punto no es afectada por la posición de otro punto.

Uniforme: Todos los puntos están alejados a

una distancia aproximadamente igual

de sus vecinos más próximos.

Agregado: Muchos puntos se agrupan cerca los unos a los otros y en extensas áreas se ubican unos pocos.

Page 35: Bitácora de Talleres - Estadística Espacial

P á g i n a 35 | 58

CARGUE Y PREPARACIÓN DE DATOS Los datos corresponden a un grupo de 191 localizaciones donde se observó la presencia de la especie de pasto Cogon (especie invasiva en Florida).

En primera medida se cargan las librerías que se utilizarán para el análisis de los datos.

library(maptools) library(rgdal) library(shapefiles) library(spatstat) library(splancs)

Luego se define el directorio de trabajo.

workingDir="D:/Clase 5"

Posteriormente se define la ventana de análisis con el fin de delimitar la zona donde efectivamente se harán todos los procedimientos y se cargan los puntos de coordenadas que representan la ocurrencia de los eventos.

border<-readShapePoly(paste(workingDir, "/FLBndy.shp", sep="")) flbord<-border@polygons[[1]]@Polygons[[1]]@coords str(border) flinv<-readShapePoints("D:/Clase 5/FL_Invasive.shp") flinvxy<-coordinates(flinv) flinv<-readShapePoints("D:/Clase 5/FL_Invasive.shp") flpt<-as(flinv,"ppp") border<-readShapePoly(paste(workingDir, "/FLBndy.shp", sep="")) flbdry<-as(border,"owin") flppp<-ppp(flpt$x,flpt$y,window=flbdry)

Adicionalmente se grafica la ventana de análisis y los eventos al interior de ella.

Page 36: Bitácora de Talleres - Estadística Espacial

P á g i n a 36 | 58

plot(flppp,axes=T)

Figura 16 Eventos de pasto Cogon

En la gráfica se ve claramente la forma y borde del área de interés así como la posición de cada uno de los eventos en su interior.

PRUEBA DE CONTEO POR CUADRANTES

El método de conteo por cuadrantes divide el área de estudio en subregiones de igual tamaño. Generalmente cuadrados, pero no necesariamente deben serlo (se debe tener en cuenta que una subdivisión o grilla diferente en tamaño o forma arroja resultados diferentes). Luego cuenta la frecuencia de los eventos y calcula la intensidad de estos en cada subregión.

En R se ejecuta un test para comprobar la hipótesis de completa aleatoriedad espacial. Incicialmente se indica al test que divida la ventana de análisis en una cuadrícula compuesta por 10 filas y 10 columnas.

qt=quadrat.test(flppp, nx=10, ny=10) qt

Page 37: Bitácora de Talleres - Estadística Espacial

P á g i n a 37 | 58

Resultado de la prueba

Chi-squared test of CSR using quadrat counts Pearson X2 statistic data: flppp X2 = 292.51, df = 89, p-value < 2.2e-16 alternative hypothesis: two.sided Quadrats: 90 tiles (irregular windows)

El p-valor de esta prueba efectuada sobre una distribución a dos colas, indica claramente que se rechaza la hipótesis nula. Por lo anterior es posible afirmar que los datos conforman un patrón puntual agregado.

Ahora se grafica el resultado del conteo por cada tile de la cuadrícula versus el conteo esperado.

Figura 17 Conteo por cuadrantes de eventos del past o Cogon

Page 38: Bitácora de Talleres - Estadística Espacial

P á g i n a 38 | 58

En la gráfica se evidencian algunos cuadrantes con un número elevado de eventos, muy superior al número esperado. La gráfica confirma el resultado del test.

ÍNDICE DE VECINO MÁS CERCANO

Con el método del vecino más cercano es posible conocer cuál es la proporción entre la distancia mínima entre parejas de puntos vecinos y la distancia media esperada. Para un patrón agregado esta proporción será cercana a cero, para un patrón aleatorio será de uno y para un patrón uniforme será mayor a uno.

A diferencia del método de los cuadrantes, este no se ve afectado por el tamaño de una cuadrícula, sólo considera la distancia entre puntos, por lo que el analista no debe asignar valores a parámetros.

ESTIMACIÓN KERNEL

La estimación kernel permite conocer la densidad de eventos dentro de un radio de búsqueda específico alrededor de cada punto. En este método se define un kernel mediante una función matemática que pondera la influencia de cada vecino dentro del área de influencia determinada por el ancho de banda o los parámetros utilizados para definir la forma del kernel.

Es fundamental la determinación del tipo de kernel a utilizar así como el ancho de banda respectivo. Mediante el uso del error medio cuadrático es posible el A.B óptimo.

mse<-mse2d(flinvxy,flbord,100,600) plot(mse$h, mse$mse,xlab="Bandwidth", ylab="MSE", type="l", xlim=c(100,600), ylim=c(-30,50)) i<-which.min(mse$mse) mse$h[i] mse$mse[i] points(mse$h[i], mse$mse[i])

Page 39: Bitácora de Talleres - Estadística Espacial

P á g i n a 39 | 58

Figura 18 Determinación del A.B óptimo por error me dio cuadrático

Luego de identificar el ancho de banda apropiado, se procede a generar el objeto tipo grilla donde serán almacenados los valores arrojados por este método. Adicionalmente se crea un objeto del tipo grid topology, indicando la resolución espacial deseada.

sG<-Sobj_SpatialGrid(border, maxDim=400)$SG grd<-slot(sG, "grid") summary(grd)

poly<-slot(border, "polygons")[[1]] poly1 <-slot(poly, "Polygons")[[1]] coords<-slot(poly1, "coords") min(coords[,1]) min(coords[,2]) grd<-GridTopology(cellcentre.offset=c(616593,531501), cellsize=c(150,150), cells.dim=c(400,400)) summary(grd)

Page 40: Bitácora de Talleres - Estadística Espacial

P á g i n a 40 | 58

Se procede luego al cálculo de la estimación por kernel mediante la variación del parámetro con el fin de tener un resultado más suavizado o más granular. Esto se desarrolla con el paquete splancs o spatstat.

Usando splancs

k0 <-spkernel2d(flinvxy, flbord, h0=400, grd) k1 <-spkernel2d(flinvxy, flbord, h0=600, grd) k2 <-spkernel2d(flinvxy, flbord, h0=800, grd) k3 <-spkernel2d(flinvxy, flbord, h0=1000, grd) df<-data.frame(k0=k0, k1=k1, k2=k2, k3=k3) kernels<-SpatialGridDataFrame(grd, data=df) summary(kernels) gp<-grey.colors(5, 0.9, 0.45, 2.2) print(spplot(kernels, at=seq(0,.00001,length.out=20),col.regions=colorRampPalette(gp)))

Page 41: Bitácora de Talleres - Estadística Espacial

P á g i n a 41 | 58

Figura 19 Estimación por kernel con variación del p arámetro k

Usando spatstat

plot(density(flppp, sigma = 600))

Page 42: Bitácora de Talleres - Estadística Espacial

P á g i n a 42 | 58

Figura 20 Estimación de la función kernel en spatst at

ESTIMACIÓN DE LA FUNCIÓN G

Es una medición simple en la que se estudia la distribución acumulada del número de parejas de vecinos en la medida en que se va incrementando el umbral de distancia entre ellos hasta llegar al par de vecinos más cercanos que se hallan a mayor distancia. Se presentan finalmente como la proporción de número de parejas a cierta distancia respecto el total de puntos considerados.

Se hace adicionalmente una simulación de intervalo de confianza de completa aleatoriedad espacial CSR para identificar visualmente si la gráfica de eventos se aleja significativamente de un comportamiento típico de un patrón aleatorio.

r=seq(0,350,by=50) G <-envelope(flppp, Gest, r=r, nsim= 59, rank= 2)

Page 43: Bitácora de Talleres - Estadística Espacial

P á g i n a 43 | 58

plot(G)

Page 44: Bitácora de Talleres - Estadística Espacial

P á g i n a 44 | 58

Figura 21 Estimación de la función G para eventos d el pasto Cogon

En la gráfica de la función G es evidente que la línea de los valores observados se aleja significativamente de la envolvente generada para un patrón con completa aleatoriedad espacial CSR. El rápido incremento de la función G indica que efectivamente el conjunto de puntos es un patrón agregado.

ESTIMACIÓN DE LA FUNCIÓN F

La función F también es relativamente simple, pero en esta se genera un número aleatorio de ubicaciones al interior del área de interés. Luego se observa la mínima distancia entre cada uno de estos puntos y el evento más cercano. Considerando que en este método los pares se forman entre puntos aleatorios y eventos, es comprensible que la función tenga un comportamiento opuesto al de la función G

Page 45: Bitácora de Talleres - Estadística Espacial

P á g i n a 45 | 58

ya que en un patrón agregado la distancia de estos puntos aleatorios a un evento será mayor que la esperada.

De la misma forma se genera una simulación para identificar visualmente cuándo la gráfica presenta un comportamiento significativo.

r=seq(0,350,by=50) F <-envelope(flppp, Fest, r=r, nsim= 59, rank= 2)

plot(F)

Page 46: Bitácora de Talleres - Estadística Espacial

P á g i n a 46 | 58

Figura 22 Estimación de la función F para eventos d el pasto Cogon

En la gráfica se observa que efectivamente la función F se ubica por debajo de la zona de simulación de completa aleatoriedad espacial, esto confirma que el patrón observado es agregado.

ESTIMACIÓN DE LA FUNCIÓN L

La función L a diferencia de las otras estudiadas previamente, tiene en cuanta los efectos de agregación a varias escalas. Estudia el patrón mediante el conteo de eventos al interior de un círculo con radio definido, haciendo lo mismo para todos los puntos en el área de estudio. Se controla el resultado mediante la modificación del parámetro h o rezago espacial.

Adicionalmente se puede aplicar una corrección por efectos de borde con la cual se minimizan los efectos causados por la ausencia de puntos en aquellas zonas de

Page 47: Bitácora de Talleres - Estadística Espacial

P á g i n a 47 | 58

borde. Mediante la asignación de una ponderación alta si la totalidad del círculo se halla al interior del área de estudio, y baja si hay una porción del círculo que está por fuera del área de interés.

L <-envelope(flppp, Lest, nsim= 59, rank = 2, global=TRUE)

También para la gráfica se crean envolventes que permiten identificar visualmente la significancia del comportamiento evidenciado con la función L.

Page 48: Bitácora de Talleres - Estadística Espacial

P á g i n a 48 | 58

Figura 23 Estimación de la función L para eventos d el pasto Cogon

Tal como se ve en la gráfica, la función k observada de los eventos se aleja de las bandas sombreadas que corresponderían a la función si el patrón presentara completa aleatoriedad espacial. Según lo anterior, se concluye que el patrón es agregado. También se observa en este caso que los patrones espaciales se generan a distancias inferiores a 2000.

GENERACIÓN DE PATRONES PUNTUALES

• Patrón aleatorio

En primera medida se genera un patrón con completa aleatoriedad espacial CSR, esto se hace mediante la simulación de 500 puntos provenientes de una distribución homogénea de Poisson.

pa=rpoispp(500)

Page 49: Bitácora de Talleres - Estadística Espacial

P á g i n a 49 | 58

plot(pa)

Figura 24 Eventos de un patrón puntual aleatorio CS R

Adicionalmente se crea una envolvente con 99 simulaciones con base en el comportamiento de un patrón bajo completa aleatoriedad espacial para compararlo con la función G de los eventos observados.

r=seq(0,0.04,by=0.0004) #G=envelope(pc, Gest, r=r, nsim= 59, rank= 2) paG=envelope(pa, Gest, r=r) paG plot(paG)

Page 50: Bitácora de Talleres - Estadística Espacial

P á g i n a 50 | 58

Figura 25 Estimación de la función G para un patrón puntual aleatorio

En la gráfica se observa claramente que la función G de los eventos analizados se comporta de forma muy similar a la envolvente generada bajo la hipótesis de completa aleatoriedad espacial CSR.

• Patrón regular

Ahora se procede a la generación de un conjunto de puntos que presenten un comportamiento de patrón puntual regular.

pr=rSSI(0.05, 500) plot(pr) r=seq(0.05,0.1,by=0.0004) prG=envelope(pr, Gest, r=r) prG plot(prG)

Page 51: Bitácora de Talleres - Estadística Espacial

P á g i n a 51 | 58

Figura 26 Eventos de un patrón puntual regular

Adicionalmente se crea una envolvente de simulaciones con base en el comportamiento de un patrón bajo completa aleatoriedad espacial para compararlo con la función G de los eventos observados.

Figura 27 Estimación de la función G para un patrón puntual regular

Page 52: Bitácora de Talleres - Estadística Espacial

P á g i n a 52 | 58

En esta gráfica es evidente que el patrón regular no presenta parejas de vecinos cercanos a menos de una determinada distancia. Es a partir de 0.05 que la función G de eventos observados empieza a tener un comportamiento creciente.

• Patrón agregado

Finalmente se genera un patrón con comportamiento agregado. Esto se logra mediante el uso de la función rMatClust, en esta se definen ciertos parámetros con los que se determina el comportamiento específico del patrón puntual agregado que se desea generar.

pc=rMatClust(50, 0.05, 4) plot(pc)

Figura 28 Eventos de un patrón puntual agregado

Adicionalmente se crea una envolvente de simulaciones con base en el comportamiento de un patrón bajo completa aleatoriedad espacial para compararlo con la función G de los eventos observados.

r=seq(0,0.05,by=0.0004) pcG=envelope(pc, Gest, r=r, rank= 2) pcG plot(pcG)

Page 53: Bitácora de Talleres - Estadística Espacial

P á g i n a 53 | 58

Figura 29 Estimación de la función G para un patrón puntual agregado

En la gráfica de la función G para los eventos observados es evidente que sale de la envolvente de un patrón puntual con completa aleatoriedad espacial. La función G incrementa rápidamente para luego estabilizarse cerca del final, este comportamiento es propio de un patrón agregado.

Page 54: Bitácora de Talleres - Estadística Espacial

P á g i n a 54 | 58

TALLER 5 – PATRONES PUNTUALES

FUNCIÓN K AGREGACIÓN ESPACIO-TIEMPO

Adicional a la identificación y determinación de la existencia de algún tipo de patrón puntual espacial, se requiere evaluar si ante un patrón agregado, el mismo es generado por una variación de la población, o de la heterogeneidad en el área de estudio, si el mismo es debido a un factor externo como por ejemplo un foco de contaminación o incluso si existe una agregación temporal.

Para evaluar dichas condiciones se parte igualmente de la formulación de la hipótesis nula en la cual se plantea completa aleatoriedad espacio temporal y es entonces como los diferentes métodos aplicados buscan evaluar la significancia de diferentes pruebas con el objeto de aceptar o rechazar dicha hipótesis.

Las pruebas aplicadas son de tipo global entre las que se incluyen la prueba de Knox, Mantel, la función K y de tipo local algunas medidas exploratorias.

En el presente taller se evalúa el método de la función K aplicada mediante la herramienta R; una vez se cargan los datos de análisis se requiere la definición de los vectores de fechas. Se procede a evaluar la función K (stkhat), a recuperar los residuales de la función y a aplicar la simulaciones de Montecarlo y evaluar la significancia. Las funciones aplicadas así como el gráfico resumen se presentan a continuación.

#PUNTOS fluxy<-readOGR(dsn="C:/TrabajoR/E ESPACIAL/Clase 6",layer="Birdflu") #VECTOR FECHAS date<-as.Date(fluxy$OutbreakSt) date date2<-as.numeric(date) date2 #FRONTERA border<-readOGR(dsn="C:/TrabajoR/E ESPACIAL/Clase 6",layer="Birdflu_bndy") flubord <- border@polygons[[1]]@Polygons[[1]]@coords fluxy<-coordinates(fluxy)

Page 55: Bitácora de Talleres - Estadística Espacial

P á g i n a 55 | 58

#FUNCION K flu1<-stkhat(fluxy, date2, flubord, c(12400, 13580), seq(1,10,.5), seq(30,1200,20)) flu1se<-stsecal(fluxy, date2, flubord, c(12400, 13580), seq(1,10,.5), seq(30,1200,20)) flu1mc <- stmctest(fluxy, date2, flubord, c(12400, 13580), seq(0,10,.5), seq(30, 1200, 20), nsim=49,quiet=TRUE) stdiagn(fluxy, flu1, flu1se, flu1mc, Dzero=TRUE)

Figura 6-1. Resultados Función K agregación espacio temporal

AJUSTE POBLACIÓN CASO - CONTROL Adicionalmente, en virtud a que en algunos tipos de eventos como lo es en el caso de la epidemiologia la agregación que se presenta se debe a la distribución espacial de la población, razón por la cual se debe realizar un ajuste empleando como medida global la aplicación de la función K cruzada implementada en la herramienta R. Una vez se cargan los datos, los cuales dentro de sus atributos especifican si obedecen a casos o controles, se convierten en un tipo ppp que es la clase definida para representar patrones puntuales en dos dimensiones. Las funciones aplicadas así como los datos analizados se presentan a continuación.

Page 56: Bitácora de Talleres - Estadística Espacial

P á g i n a 56 | 58

#MARCAS spasthma<-readShapePoints("C:/TrabajoR/E ESPACIAL/Clase 6/spasthma.shp") border<- readShapePoly("C:/TrabajoR/E ESPACIAL/Clase 6/spbdry.shp") ppp<-as(spasthma,"ppp") # make points into ppp file bdry<-as(border,"owin") # make boundary into owin file m<-spasthma$Asthma # create marks file asthppp<-ppp(ppp$x,ppp$y,marks=m,window=bdry)

Figura 6-2. Mapeo casos y controles

Seguidamente se corren las funciones cruzadas k y L, las líneas ejecutadas así como los resultados obtenidos se presentan a continuación.

#FUNCION K CRUZADA asthkcross<-Kcross(asthppp, "case", "control",r=NULL) asthlcross<-Lcross(asthppp, "case", "control",r=NULL) par(mfrow=c(1,2)) plot(asthkcross) plot(asthlcross)

Page 57: Bitácora de Talleres - Estadística Espacial

P á g i n a 57 | 58

Figura 6-1. Ploteo funciones cruzadas K y L

Posteriormente se procede a correr la función K cruzada en intervalos permitiendo definir las bandas de confianza y determinar el tipo de patrón espacial que presentan los datos. Las funciones ejecutadas así como los resultados obtenidos se presentan a continuación.

#FUNCION K CRUZADA INTERVALOS r=seq(0,.4,by=.01) akmult <- envelope(asthppp, Kcross, i="case", j="control", r=r, simulate=expression(rlabel(asthppp))) lmult = sqrt(akmult / pi) - r par(mfrow=c(1,2))

Page 58: Bitácora de Talleres - Estadística Espacial

P á g i n a 58 | 58

plot(akmult, main="Cross-K Function") ylim = c(min(lmult$obs, lmult$hi, lmult$lo, na.rm=TRUE), max(lmult$obs, lmult$hi, lmult$lo, na.rm=TRUE)) plot(r, lmult$obs, type="l", xlab="Distance (m)", main="Ripley's K12 (Asthma Cases/Controls)", ylab="Estimated L", xlim=c(0,.4), ylim=ylim) lines(r, lmult$hi, lty=2) lines (r, lmult$lo, lty=2)

Figura 6-2. Ploteo función cruzada K en intervalos.

Como se puede observar para la función K en intervalos los datos observados se encuentran dentro de la banda de confianza indicando así que existe un patrón espacial aleatorio.