Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente...

21
Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3ª Reunión Española de Usuarios de STATA 2010

Transcript of Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente...

Page 1: Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3ª Reunión Española.

Herramientas adicionales

en STATA para el análisis de

datos espaciales

Raúl Ramos y Vicente Royuela

AQR-IREA, Universitat de Barcelona

3ª Reunión Española de Usuarios de STATA 2010

Page 2: Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3ª Reunión Española.

2

Estructura de la presentación

• STATA como herramienta para el análisis de datos

espaciales: procedimientos disponibles

• Desarrollos en curso:

• Matriz de pesos espaciales

• Sobre la introducción de retardos espaciales de las

variables explicativas en modelos de regresión

• Sobre la visualización de los resultados del análisis

exploratorio espacial

Análisis de datos espaciales

Page 3: Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3ª Reunión Española.

3

ssc install spmapssc install shp2dtassc install mif2dta

Análisis de datos espaciales

Herramientas disponibles

Page 4: Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3ª Reunión Española.

4

net install sg162.pkg

Análisis de datos espaciales

http://www.stata.com/products/stb/journals/stb60.pdf

Page 5: Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3ª Reunión Española.

5Análisis de datos espaciales

Columbus – Ohio

http://www.rri.wvu.edu/WebBook/LeSage/spatial/anselin.html

http://www.rri.wvu.edu/WebBook/LeSage/spatial/aford.html

• 49 vecindarios del distrito de Columbus en Ohio

(Estados Unidos)

• Información para 1980 sobre:

– Precio de la vivienda

– Ingresos familiares

– Robos por cada 1000 viviendas

Page 6: Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3ª Reunión Española.

6Análisis de datos espaciales

(43.299999,96.400002](33.5,43.299999](25.700001,33.5][17.9,25.700001]

(48.585487,68.892044](34.000835,48.585487](20.048504,34.000835][.178269,20.048504]

Precio de la vivienda Crimen

_cons 68.61896 4.233089 16.21 0.000 60.09819 77.13973 INC -1.597311 .4609711 -3.47 0.001 -2.525197 -.6694242 HOVAL -.2739315 .1625712 -1.68 0.099 -.6011702 .0533073 CRIME Coef. Std. Err. t P>|t| [95% Conf. Interval] Robust

Root MSE = 11.435 R-squared = 0.5524 Prob > F = 0.0000 F( 2, 46) = 45.47Linear regression Number of obs = 49

Page 7: Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3ª Reunión Española.

7

• En el análisis econométrico “estándar”, se supone que cada

una de las observaciones analizadas es independiente del

resto (hipótesis de no autocorrelación”).

• Autocorrelación espacial y/o retardos espaciales de

las variables explicativas: matriz de pesos espaciales.

• La matriz de pesos espaciales recoge la existencia de

relaciones entre los territorios analizados. Existen

diferentes especificaciones de dicha matriz.

Análisis de datos espaciales

La matriz de pesos espaciales

Page 8: Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3ª Reunión Española.

8

• Se han propuesto distintas especificaciones:

– Contigüidad (matriz de contactos binaria)

– Proximidad (matriz basada en distancias entre

centroides o entre capitales)

– Flujos (matriz basada en movimientos de personas,

mercancias, etc. – asimétrica)

– …

• Es importante analizar la robustez de los resultados a

distintas especificaciones de la matriz.

Análisis de datos espaciales

Page 9: Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3ª Reunión Española.

9

• Pero, los procedimientos existentes en STATA sólo permiten

trabajar con matrices binarias generadas manualmente

por el usuario o matrices basadas en distancias

(simétricas).

• En otros programas como GEODA-PYSAL, MATLAB o R es

posible generar y utilizar distintas matrices de

manera muy simple (a partir del propio mapa). Sin

embargo, estos programas no ofrecen la potencialidad de

STATA en otros aspectos.

Análisis de datos espaciales

Page 10: Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3ª Reunión Española.

10Análisis de datos espaciales

Geoda

Page 11: Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3ª Reunión Española.

11

• Hemos desarrollado procedimientos que permiten importar

matrices generadas desde estos programas, normalizarlas

y utilizarlas con spatreg (aunque sean asimétricas por

naturaleza como las obtenidas a partir del procedimiento K-

nearest neighbours-)

gal2dta gwt2dta sparse2dta normw

Análisis de datos espaciales

Page 12: Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3ª Reunión Española.

12

• La existencia de autocorrelación espacial en un modelo de

regresión puede indicar la omisión de variables relevantes

como retardos espaciales de alguna de las explicativas.

• Sin embargo, los procedimientos existentes en STATA no

permiten introducir de manera directa retardos de las

variables, por lo que hemos desarrollado un procedimiento

que permite hacerlo de manera muy sencilla.

slag

Análisis de datos espaciales

Retardos espaciales de las variables explicativas

Page 13: Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3ª Reunión Española.

13Análisis de datos espaciales

Visualización del análisis exploratorio de datos espaciales

Geoda

Stata

spatlsa2

Measures of local spatial autocorrelationWeights matrix--------------------------------------------------------------Name: W1Type: Imported (binary)Row-standardized: No--------------------------------------------------------------Moran's Ii (CRIME)------------------------------------------------------------- Location | Ii E(Ii) sd(Ii) z p-value*--------------------+----------------------------------------- 1 | 1.474 -0.042 1.381 1.097 0.136 2 | 1.586 -0.063 1.674 0.985 0.162 3 | 0.375 -0.083 1.912 0.240 0.405

Page 14: Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3ª Reunión Española.

14Análisis de datos espaciales

Matriz binaria decontactos normalizada

SWMImpo 0 0 0 0 0 0 0SWMImpo 0 0 0 0 0 0 0SWMImpo 0 0 0 0 0 0 0SWMImpo 0 0 0 0 .25 0 0SWMImpo 0 0 0 0 0 0 .16666667SWMImpo 0 0 0 0 0 0 .33333333SWMImpo 0 0 0 0 0 0 0SWMImpo 0 0 0 0 .25 0 0SWMImpo 0 0 0 0 0 0 0SWMImpo 0 0 0 0 .16666667 .16666667 0SWMImpo 0 0 0 .2 .2 0 .2SWMImpo 0 0 0 0 0 0 0SWMImpo 0 0 0 0 .5 0 0SWMImpo 0 0 .14285714 .14285714 0 .14285714 0SWMImpo 0 .25 .25 0 .25 0 0SWMImpo .25 .25 0 .25 .25 0 0SWMImpo .33333333 0 .33333333 .33333333 0 0 0SWMImpo 0 .5 .5 0 0 0 0 c1 c2 c3 c4 c5 c6 c7W[49,49]

12

3

Page 15: Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3ª Reunión Española.

15Análisis de datos espaciales

Acceptable range for lambda: -1.531 < lambda < 1.000

Lagrange multiplier test of lambda=0: chi2(1) = 5.815 (0.016)Likelihood ratio test of lambda=0: chi2(1) = 8.127 (0.004)Wald test of lambda=0: chi2(1) = 13.365 (0.000) lambda .5484742 .1500262 3.66 0.000 .2544282 .8425201 _cons 60.37518 5.798748 10.41 0.000 49.00985 71.74052 INC -.9610433 .3704535 -2.59 0.009 -1.687119 -.2349678 HOVAL -.3031982 .0927166 -3.27 0.001 -.4849194 -.121477CRIME CRIME Coef. Std. Err. z P>|z| [95% Conf. Interval]

Log likelihood = -183.31357 Sigma = 9.75 Squared corr. = 0.537 Variance ratio = 0.329Spatial error model Number of obs = 49

Row-standardized: SWMImpo Type: Name: WWeights matrix

Iteration 4: log likelihood = -183.31357 Iteration 3: log likelihood = -183.31357 Iteration 2: log likelihood = -183.31857 Iteration 1: log likelihood = -183.50365 Iteration 0: log likelihood = -187.42512 rescale eq: log likelihood = -187.42512rescale: log likelihood = -187.42512initial: log likelihood = -187.42512

. spatreg CRIME HOVAL INC, weights(W) eigenval(E) model(error)

Page 16: Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3ª Reunión Española.

16Análisis de datos espaciales

Acceptable range for lambda: -1.531 < lambda < 1.000

Lagrange multiplier test of lambda=0: chi2(1) = 5.600 (0.018)Likelihood ratio test of lambda=0: chi2(1) = 5.943 (0.015)Wald test of lambda=0: chi2(1) = 7.422 (0.006) lambda .4480536 .1644596 2.72 0.006 .1257187 .7703886 _cons 72.69648 9.01754 8.06 0.000 55.02242 90.37053 WHOVAL1 .0961597 .2040779 0.47 0.638 -.3038257 .4961451 WINC1 -1.041591 .5847625 -1.78 0.075 -2.187704 .1045227 INC -1.057194 .3242875 -3.26 0.001 -1.692786 -.4216026 HOVAL -.2774837 .0919551 -3.02 0.003 -.4577123 -.0972552CRIME CRIME Coef. Std. Err. z P>|z| [95% Conf. Interval]

Log likelihood = -181.74271 Sigma = 9.60 Squared corr. = 0.597 Variance ratio = 0.524Spatial error model Number of obs = 49

Row-standardized: SWMImpo Type: Name: WWeights matrix

Iteration 5: log likelihood = -181.74271 Iteration 4: log likelihood = -181.74271 Iteration 3: log likelihood = -181.74275 Iteration 2: log likelihood = -181.76435 Iteration 1: log likelihood = -183.1555 Iteration 0: log likelihood = -184.85114 rescale eq: log likelihood = -184.85114rescale: log likelihood = -184.85114initial: log likelihood = -184.85114

. spatreg CRIME HOVAL INC WINC WHOVAL, weights(W) eigenval(E) model(error)

Page 17: Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3ª Reunión Española.

17Análisis de datos espaciales

Matriz binaria decontactos de primery segundo ordennormalizada

SWMImpo 0 0 0 0 .05263158 .05263158 0SWMImpo 0 0 0 0 .04166667 .04166667 0SWMImpo 0 0 0 0 .05555556 0 0SWMImpo 0 0 0 0 0 0 0SWMImpo 0 0 0 0 .05263158 .05263158 0SWMImpo 0 0 0 0 0 0 0SWMImpo 0 0 0 0 .04761905 .04761905 0SWMImpo 0 0 0 0 0 0 .09090909SWMImpo 0 0 0 0 .07142857 0 .07142857SWMImpo 0 0 0 0 0 0 0SWMImpo 0 0 .04761905 .04761905 .04761905 .04761905 .04761905SWMImpo 0 0 .05 .05 .05 .05 0SWMImpo 0 0 0 0 .08333333 0 .08333333SWMImpo 0 0 0 .1 .1 0 .1SWMImpo 0 0 0 .07692308 .07692308 0 .07692308SWMImpo 0 0 .0625 .0625 .0625 .0625 .0625SWMImpo 0 0 0 0 .0625 .0625 0SWMImpo 0 0 .04166667 .04166667 .04166667 .04166667 0SWMImpo 0 .07692308 .07692308 .07692308 .07692308 .07692308 .07692308SWMImpo 0 0 0 .1 .1 0 0SWMImpo 0 0 .07692308 .07692308 .07692308 0 0SWMImpo .04761905 .04761905 .04761905 .04761905 0 .04761905 .04761905SWMImpo .07692308 .07692308 .07692308 0 .07692308 .07692308 .07692308SWMImpo .1 .1 0 .1 .1 .1 0SWMImpo .2 0 .2 .2 .2 0 0SWMImpo 0 .25 .25 .25 .25 0 0 c1 c2 c3 c4 c5 c6 c7W[49,49]

12

34

5

Page 18: Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3ª Reunión Española.

18Análisis de datos espaciales

Acceptable range for lambda: -3.301 < lambda < 1.000

Lagrange multiplier test of lambda=0: chi2(1) = 2.977 (0.084)Likelihood ratio test of lambda=0: chi2(1) = 3.645 (0.056)Wald test of lambda=0: chi2(1) = 6.030 (0.014) lambda .5759911 .2345679 2.46 0.014 .1162464 1.035736 _cons 61.58694 6.763022 9.11 0.000 48.33166 74.84222 INC -1.177725 .3796858 -3.10 0.002 -1.921896 -.4335548 HOVAL -.2840458 .0930066 -3.05 0.002 -.4663353 -.1017563CRIME CRIME Coef. Std. Err. z P>|z| [95% Conf. Interval]

Log likelihood = -185.55462 Sigma = 10.47 Squared corr. = 0.548 Variance ratio = 0.385Spatial error model Number of obs = 49

Row-standardized: SWMImpo Type: Name: WWeights matrix

Iteration 4: log likelihood = -185.55462 Iteration 3: log likelihood = -185.55462 Iteration 2: log likelihood = -185.55549 Iteration 1: log likelihood = -185.59347 Iteration 0: log likelihood = -187.42512 rescale eq: log likelihood = -187.42512rescale: log likelihood = -187.42512initial: log likelihood = -187.42512

. spatreg CRIME HOVAL INC, weights(W) eigenval(E) model(error)

Page 19: Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3ª Reunión Española.

19Análisis de datos espaciales

Acceptable range for lambda: -3.301 < lambda < 1.000

Lagrange multiplier test of lambda=0: chi2(1) = 1.484 (0.223)Likelihood ratio test of lambda=0: chi2(1) = 1.397 (0.237)Wald test of lambda=0: chi2(1) = 1.598 (0.206) lambda .366046 .2896015 1.26 0.206 -.2015626 .9336545 _cons 81.06832 13.16094 6.16 0.000 55.27335 106.8633 WHOVAL1 .0177241 .4586195 0.04 0.969 -.8811537 .9166019 WINC1 -1.343775 .915043 -1.47 0.142 -3.137226 .4496763 INC -1.135263 .3397802 -3.34 0.001 -1.80122 -.469306 HOVAL -.3052847 .096751 -3.16 0.002 -.4949132 -.1156562CRIME CRIME Coef. Std. Err. z P>|z| [95% Conf. Interval]

Log likelihood = -183.83993 Sigma = 10.24 Squared corr. = 0.601 Variance ratio = 0.562Spatial error model Number of obs = 49

Row-standardized: SWMImpo Type: Name: WWeights matrix

Iteration 4: log likelihood = -183.83993 Iteration 3: log likelihood = -183.83993 Iteration 2: log likelihood = -183.84089 Iteration 1: log likelihood = -183.93603 Iteration 0: log likelihood = -184.67541 rescale eq: log likelihood = -184.67541rescale: log likelihood = -184.67541initial: log likelihood = -184.67541

. spatreg CRIME HOVAL INC WINC WHOVAL, weights(W) eigenval(E) model(error)

Page 20: Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3ª Reunión Española.

20Análisis de datos espaciales

High-HighLow-HighLow-LowNon Significant

Columbus Ohio. Source: Geoda

LISA MAP. CRIME1%5%10%Non Significant

Columbus Ohio. Source: Geoda

LISA SIGNIFICANCE MAP. CRIME

Page 21: Herramientas adicionales en STATA para el análisis de datos espaciales Raúl Ramos y Vicente Royuela AQR-IREA, Universitat de Barcelona 3ª Reunión Española.

21

• Los interesados en los procedimientos mencionados pueden

contactar con nosotros a través del correo electrónico en las

siguientes direcciones: [email protected], [email protected]

• Existen otros procedimientos de interés en este ámbito:

anketest, usswm, chinaspatdwm, spmlreg, …

• … y seguimos a la espera de la difusión de spmat, sarml y

g2sls de David Drukker http://repec.org/snasug08/drukker_spatial.pdf

Análisis de datos espaciales