Garcia - Analisis Cluster

30
1° SEMAGEC . - PRIMER SEMINARIO ARGENTINO DE GEOGRAFÍA CUANTITATIVA AVANCES CONCEPTUALES Y METODOLÓGICOS PARA UNA GEOGRAFÍA EN ACCIÓN Planetario de la Ciudad de Buenos Aires “Galileo Galilei” - TITULO DE PONENCIA: "Análisis Cluster y automatización cartográfica en áreas urbanas como base de muestreo de un censo diferencial de consumo". AUTOR: Dra. María Celia García (Centro de Investigaciones Geográficas – Fac. de Cs. Humanas de la Universidad Nacional del Centro de la Provincia de Buenos Aires, Tandil, Argentina) RESUMEN: Cuando se dispone de información heterogénea (por ejemplo la empleada para construir las variables que se definen para determinar áreas homogéneas de Calidad de Vida) referidas a un conjunto de individuos (los radios y fracciones que componen a cada una de las localidades tomadas como muestras); y se pretende determinar el conjunto de características que fortalezcan o sustenten el agrupamiento entre las unidades de análisis (los Radios-fracciones originales); surgen irremediablemente algunas cuestiones y preguntas, entre otras: ¿Existen diferentes grupos de variables entre las originales de Calidad de Vida introducidas?, ¿Hay alguna manera de reducir el número de variables y justificar la reducción de las variables originales (disponibles en el Censo) a fin de hacer más rápido y “aplicable” un mismo método para el estudio en varias localidades?, ¿Tienen algunas de esas variables originales o grupos de variables más influencia o mayor peso sobre los otros? (es decir son interdependientes o dependientes las variables). Si tomo al conjunto de radios – fracciones y se los pretende agrupar de acuerdo con el comportamiento conjunto de variables: ¿Cómo se conforman estos grupos teniendo en cuenta que las variables pueden ser muy heterogéneas en cuanto a su magnitud y comportamiento estadístico? Y algo muy importante: -¿Se pueden hacer comparaciones entre los agrupamientos realizados entre los radios-fracciones de las seis (6) ciudades tomadas como localidades donde se realizan las muestras de residuos para diferenciar el consumo de la población en el presente trabajo? En este trabajo se intenta mostrar los resultados de la aplicación de clusters clasificatorios e índices jerárquicos de modo tal de hacer un muestreo comparativo del nivel de consumo (o nivel de vida) de la población en seis localidades de tamaño intermedio en Argentina.

description

analisis de textos

Transcript of Garcia - Analisis Cluster

Page 1: Garcia - Analisis Cluster

1° SEMAGEC . - PRIMER SEMINARIO ARGENTINO DE GEOGRAFÍACUANTITATIVA

AVANCES CONCEPTUALES Y METODOLÓGICOS PARA UNA GEOGRAFÍA EN ACCIÓN

Planetario de la Ciudad de Buenos Aires “Galileo Galilei” -

TITULO DE PONENCIA:"Análisis Cluster y automatización cartográfica en áreas urbanas comobase de muestreo de un censo diferencial de consumo".

AUTOR:• Dra. María Celia García (Centro de Investigaciones Geográficas – Fac. de Cs.

Humanas de la Universidad Nacional del Centro de la Provincia de Buenos Aires,Tandil, Argentina)

RESUMEN:Cuando se dispone de información heterogénea (por ejemplo la empleada para

construir las variables que se definen para determinar áreas homogéneas de Calidad deVida) referidas a un conjunto de individuos (los radios y fracciones que componen acada una de las localidades tomadas como muestras); y se pretende determinar elconjunto de características que fortalezcan o sustenten el agrupamiento entre lasunidades de análisis (los Radios-fracciones originales); surgen irremediablementealgunas cuestiones y preguntas, entre otras:¿Existen diferentes grupos de variables entre las originales de Calidad de Vidaintroducidas?,¿Hay alguna manera de reducir el número de variables y justificar la reducción de lasvariables originales (disponibles en el Censo) a fin de hacer más rápido y “aplicable” unmismo método para el estudio en varias localidades?,¿Tienen algunas de esas variables originales o grupos de variables más influencia omayor peso sobre los otros? (es decir son interdependientes o dependientes lasvariables).Si tomo al conjunto de radios – fracciones y se los pretende agrupar de acuerdo con elcomportamiento conjunto de variables: ¿Cómo se conforman estos grupos teniendo encuenta que las variables pueden ser muy heterogéneas en cuanto a su magnitud ycomportamiento estadístico?Y algo muy importante: -¿Se pueden hacer comparaciones entre los agrupamientosrealizados entre los radios-fracciones de las seis (6) ciudades tomadas como localidadesdonde se realizan las muestras de residuos para diferenciar el consumo de la poblaciónen el presente trabajo?En este trabajo se intenta mostrar los resultados de la aplicación de clustersclasificatorios e índices jerárquicos de modo tal de hacer un muestreo comparativo delnivel de consumo (o nivel de vida) de la población en seis localidades de tamañointermedio en Argentina.

Page 2: Garcia - Analisis Cluster

INTRODUCCIÓN:Debido a que cada vez más se utiliza la palabra sustentabilidad urbana (y sobre

todo en discursos, conferencias y nombres de Seminarios, Congresos, Jornadas yEncuentros de gestión de las ciudades), es evidente que existe una preocupación acercade la sustentabilidad de las ciudades.

En el presente trabajo se intenta hacer un abordaje metodológico y desde lageografía cuantitativa, a fin de medir grados de sustentabilidad urbana en ciudades detamaño intermedio de Argentina (que son las que tuvieron mayor crecimiento ennúmero y población en los últimos 4 periodos intercensales).

Se parte de definir que la sustentabilidad requiere de una situación de equilibriosocial (el cual puede lograrse a partir de una calidad de vida generalizada en toda lapoblación urbana), y equilibrio en el uso de los recursos (el consumo y el acceso alconsumo de dicha población no debe presentar desfazajes o brechas muy altas); de talmodo que no se afecte la calidad de vida presente o futura, ni el acceso a los recursosen el presente o el futuro. Desigualdades sociales, y el uso desigual o inapropiado de losrecursos conducen a situaciones no sustentables ya sea para la población presente o delfuturo.

Para evaluar estas situaciones (y desde un trabajo que excede a los objetivos delque aquí se pretende mostrar) se recurre a diseñar y aplicar herramientas que permitanmostrar diferencias en los planos social, económico y ecológico ambiental de seis casosde estudio, que corresponden a las localidades bonaerenses de Azul, Bahía Blanca, Mardel Plata, Olavarría, Tandil y Zárate. Y particularmente diferencias de nivel de consumoentre sus habitantes. Y aquí radica el meollo del trabajo: mostrar cómo se llegó a medirconsumo o nivel de vida en seis ciudades argentinas.

Concretamente en el desarrollo de esta ponencia se intentará mostrar laconfección y empleo de un análisis cluster (agrupamiento en este caso de radiosfracciones urbanos) para medir consumo y diferencias de consumo entre la población,que permitiera resultados comparables tanto dentro de la misma ciudad de origen de lasmuestras, como respecto a las muestras provenientes de las otras localidades.

El muestreo en cada caso parte de un análisis cluster que determina áreas dehomogénea calidad de vida, y ayudándose del empleo de cartografías obtenidas dentrode un sistema de información geográfica, se pudieron delinear puntos de muestra debolsas de residuos domiciliarios de viviendas ocupadas en cada área homogénea.Analizando los pesos en Kilogramos y contenidos del consumo emanado en estasviviendas se pudieron contemplar las diferencias de consumo o Nivel de Vida de lapoblación resultando de una tabulación y análisis de 884,60 kilogramos de residuossólidos domiciliarios (RSD) muestreados.

En el trabajo original luego estos datos se correlacionaron a los de Calidad deVida, Valores económicos de la Gestión de Residuos Domiciliarios en cada localidad einclusive costos ambientales derivados de la localización de rellenos sanitarios y obasurales municipales.

METODOLOGIA:

Page 3: Garcia - Analisis Cluster

El objetivo central de esta ponencia es mostrar como mediante la confección deun agrupamiento o clusters en áreas homogéneas de calidad de vida, se puedeorganizar rápidamente un muestreo de datos, en este caso muestreo de bolsas deresiduos por viviendas ocupadas de cada área homogénea, lo cual permitirá analizardiferencias en el consumo de la población.

El trabajo desde el cual se aplica esta metodología, originalmente se organizó enetapas siguiendo el esquema de Cerrutti (1991). La etapa de Operacionalización dedatos es la que se expone en detalle en el presente trabajo.

En primer lugar y a fin de realizar una diferenciación espacial de calidad de vidaen las localidades escogidas como muestra, se escogen indicadores socioeconómicossignificativos (estadísticamente) por cada una de las unidades radio-fracción censal delas ciudades intermedias de Azul, Bahía Blanca, Mar del Plata, Olavarría, Tandil y Zárate.En este trabajo, se emplearon datos inéditos, a nivel de radios fracciones del CensoNacional de INDEC 1991, los cuales se compraron en el propio INDEC. Con estos datosse estandarizan y construyen tablas para lograr hacer los agrupamientos de radiosfracciones. En estos agrupamientos o clusters se empleó distancia de Gower.

La distancia Gower utilizada en la construcción del cluster o agrupamiento de losradios fracciones de las localidades se hizo a fin de amortiguar y considerar los rangos oescalas de las variables que intervendrán en la realización del análisis cluster (el quepermite el agrupamiento de radios fracciones en zonas homogéneas), requiere de laconfección de una matriz cuadrada de distancias mediante la aplicación de una fórmulacuya traducción literal sería la siguiente.

La medida entre dos radios-fracciones (radiofraccióniésimo –fri- yradiofracción enésimo –frn-) es igual a:

la Suma de los Modulos de las diferencias de valores Estandarizados yAbsolutos de las variables que corresponden a fri y frn,

dividido el Número de Variables empleadas para caracterizar a losradios fracciones.

La expresión matemática para calcular esta distancia entre radiosfracciones (fr)es la que se dispone bajo la siguiente fórmula :

1 8 / xi k - xn k / D(fri, frn)= ----- ∑ ------------- 8 k rk

Donde; D (fri, frn) es igual a la Distancia entre la fracción iésima y la fracción Enésima; y cuyo cálculo se realiza de la siguiente forma. Primero se suman loa valores

estandarizados de las variables aplicando:

/ xi k - xn k / El módulo (en valores absolutos) de resta entre el valor de la ------------- variable x de la iésima r-fracción menos el valor de la misma

rk variable de la enésima fracción dividido por el rango (valor máximo – valor mínimo de todos los valores x del conjunto)

de la variable;

Page 4: Garcia - Analisis Cluster

Luego de hacer el agrupamiento cluster de radios fracciones (que en cadalocalidad determinan áreas de calidad de vida homogénea, teniendo en cuenta elcomportamiento estadístico de los indicadores socioeconómicos utilizados), se calculauna cuota de muestreo estratificado mínimo (en el cual se consideren el % de viviendasocupadas en cada área homogénea de calidad de vida, determinadas en el clusteranterior; y que en cada área homogénea al menos se tome una muestra que lorepresente). La localización de las muestras se determina mediante la confección de unmapa temático (construido en un SIG de formato vectorial), donde la ubicación de lasmuestras de residuos a realizar (número de muestras ingresado como dato atributo encada área homogénea o en radios fracciones que posean mayor cantidad de viviendasocupadas dentro de cada área homogénea), por defecto, dentro de un SIG aparecen oen forma aleatoria dentro del área homogénea, o en el centroide del polígono queocupan. De esta forma se puede identificar calles y alturas de viviendas de las cualesobtener las muestras (cantidades y tipos de RSD generados), superponiendo el mapaSIG de distribución de muestras (ver en cartografías 13) a un plano o manzanero de lalocalidad.

DESARROLLO Y DISCUSIÓN DE LAS TECNICAS Y METODOLOGÍA EMPLEADA.• En una Primera Etapa de trabajo se realizaron los abordajes teóricos que

sustentan las variables y significados de Calidad de Vida, Nivel de Vida,Brecha o Desigualdad y Sustentabilidad (o falta de ella) en las ciudades.

• En la Segunda Etapa del proyecto original desde el cual se ha abordado estetrabajo (a la que se la denomina de Operacionalización de datos y variables)se incluye a procesos de solicitud de datos al INDEC, observación de suscaracterísticas y formatos de estos datos , recolección de información,selección de indicadores para construir las variables teóricas y las estrategias(cuerpo metodológico y de técnicas empleadas con mayor desarrollo delanálisis Cluster) para medir Calidad de Vida y luego en otra etapa Nivel deVida.

Estos procesos tienen vinculación directa en la Selección de datos a partir deFuentes de Información Secundaria, provenientes de datos estadísticos inéditos delCenso Nacional de Población y Vivienda del INDEC y todos ellos georreferenciados aescala de fracciones-radios de las localidades a estudiar (Ver cartografías 1 a 8);

La construcción y el análisis de las variables de Calidad de Vida para determinar áreashomogéneas y medir Calidad de Vida Urbana, se realizan basadas en justificacionesteóricas y metodológicas. Para ello es necesario establecer la construcción de variablescon datos e información disponible (que permite una diferenciación espacial por radiosfracciones de localidades) y su reducción a la mínima cantidad posible(estadísticamente hablando).De ese modo se escogen ocho variables de tipo objetivas (obtenidas desde el censoINDEC y no sobre una encuesta de opinión a los habitantes) y de Calidad de Vida

Page 5: Garcia - Analisis Cluster

Privada (referida a la satisfacción de necesidades básicas de la población de un hogar ysu vivienda, y no acerca de la gestión pública que hace a su satisfacción), aunque unade ellas, en parte, significa ausencia de Calidad de Vida Pública (es decir ausencia depolíticas públicas que aseguren una calidad de vida de la población). En este caso seconsideran viviendas con problemas de abastecimiento de agua en el área urbana(véase cartografía 1, correspondiente a la localidad de Zárate).Con datos estandarizados de estas 8 variables se construye una tabla de doble entradaque permite contraponer el comportamiento conjunto de ellas entre todos los radiosfracciones de la localidad, y de ese modo, se agrupan radios y fracciones en “áreashomogéneas de Calidad de Vida”. Con la salida gráfica del cluster quedan definidosgrupos de radios fracciones con comportamiento homogéneo (del conjunto de las 8variables de calidad de vida escogidas). Este agrupamiento es sólo clasificatorio, y lacantidad de grupos depende de la distancia del corte de cluster (para hacer unadiferencia jerárquica de esos grupos se les aplica luego un índice de calidad de vida, quepara el caso que se expone se llevó a cabo con las mismas variables empleadas para elcluster).

La elección de las 8 (ocho) variables seleccionadas para realizar agrupamientos entre lasfracciones - radios de cada ciudad (mediante métodos de Cluster clasificatorio), hacehincapié en trabajos que la autora viene desarrollando como integrante de un grupointerdisciplinario y que luego formara parte de su trabajo de tesis doctoral. Con ellas seintenta mejorar y agilizar estadísticamente las mediciones simultáneas y comparativasde Calidad de Vida en las ciudades, y también intentan minimizar la cantidad devariables utilizadas (válidas estadísticamente), sin que por ello los resultados pierdan elsignificado de los encuadres teóricos de Calidad de Vida Urbana. Se incluyenparámetros que se refieren a necesidades básicas insatisfechas de Calidad de VidaPrivada (las siete primeras variables) y en forma indirecta de Calidad de Vida Pública (lavariable número 8).

Los enunciados de las ocho variables son los siguientes:

1. “Porcentaje de hogares que no cuentan con retrete de uso exclusivo”2. “Porcentaje de hogares no propietarios”;3. “Porcentaje de hogares con hacinamiento extremo (más de tres personas

por cuarto)”,4. “Porcentaje de hogares cuyo jefe tiene nivel de instrucción deficiente”,5. “Porcentaje de población con nivel de instrucción menor a primario”,6. .“Porcentaje de viviendas rancho”,7. “Porcentajes de viviendas de inquilinato o pensiones”,8. “Porcentaje de viviendas con problemas de acceso al agua”.

En todos los casos se trabaja con porcentajes de modo tal que al aumentar elvalor que le corresponde a la variable, disminuye la Calidad de Vida para la población yhogares que radican en el radio fracción de la cual es atributo. Este hecho simplifica la

Page 6: Garcia - Analisis Cluster

tarea de aplicación de índices ya que todas las variables se comportan en el mismosentido: restan calidad de vida a medida que aumentan. Es decir se trata de variablesque a medida que aumentan sus porcentajes denotan carencia de calidad de vida pornecesidades básicas no satisfechas.

Luego de haberse seleccionado las variables, se procede a la construcción de lasmismas, todas ellas a partir de datos inéditos del Censo 1991 de población y vivienda(comprados en el Instituto Nacional De Estadísticas y Censos –INDEC- en 1999), que serefieren a radios y fracciones censales por localidad1. Si bien se reconoce que estosdatos no son actualizados, en realidad son los más nuevos, confiables como fuente y losúnicos disponibles con este nivel de desagregación espacial (para radios-fracciones) delas seis localidades muestra: Azul; Bahía Blanca; Mar dar del Plata, Olavarría; Tandil yZárate, en este trabajo realizado durante 2000 y 2001.

La construcción del valor para cada una de las variables se explica brevemente acontinuación:

1. “Porcentaje de hogares que no cuentan con retrete de uso exclusivo”Se ha calculado a partir de considerar el porcentaje que significa el valor

de la sumatoria de las variables identificadas como C013 H y C014 H(Cantidad de hogares con inodoro compartido y Hogares sin inodororespectivamente) sobre el valor de variable C001 H que corresponde al Totalde hogares de cada una de estas unidades radio-fracción.El valor final que se obtiene, se ingresa en una planilla de cálculo bajo elrótulo de columna %siino a fin de reconocerlo en forma rápida (las Planillasde Cálculo correspondientes efectuadas en el programa Excel permitió laconfección de cuadros por cada localidad).

2. “Hogares no propietarios de Vivienda”;Se calcula hallando el porcentaje que representa el valor total de Hogares

No propietarios de Vivienda sobre el total de Hogares (variable C001 H) quese radican en el radio fracción.El valor total de Hogares No Propietarios se halla considerando la sumatoriade los valores INDEC de hogares que se enuncian a continuación.

C022 H, Inquilino o arrendatario

C023 H, Ocupante en relación de dependencia

C024 H, Ocupante por préstamo, cesión o permiso

C025 H, Ocupante de hecho

1 INDEC entiende por localidad, a un recorte espacial dentro de la unidad administrativa que lo contiene, en el cual se desarrollan lasciudades o núcleos urbanos con población mayor a 2000 habitantes. De cada localidad posee una cartografía básica con ladelimitación de radios y fracciones urbanos, que permite diferenciarlos de las fracciones rurales del entorno de la localidad.

Page 7: Garcia - Analisis Cluster

y C026 H, Otro tipo de tenencia

El valor obtenido se ha identificado bajo el título de columna %noprop dela Planilla de Cálculo Excel empleada para cada una de las localidades (ver suidentificación de columna y valores en los primeros cuadros de cadaLocalidad).

3. “Porcentaje de Hogares con hacinamiento extremo (más de tres personaspor cuarto)”,

Se obtiene calculando el porcentaje que significa el valor de la sumatoriade las variables C042 H (hacinamiento 03,00 a 99,98) y C 043 H(Hacinamiento 99,99 ignorado), con respecto al total de Hogares (C 001 H).Este valor se identifica en un cuadro de variables bajo el rótulo de columna%hacina de la Planilla de Cálculo Excel correspondiente a cada localidad.

4. “Porcentaje de hogares cuyo jefe tiene nivel de instrucción deficiente”,

Se calcula como proporción entre el valor resultante de sumar las variablesC 044 H y C 045 H (Nivel de Jefe que nunca asistió y Nivel de instrucciónprimario incompleto), con respecto al valor de la variable C 002 P (Total jefesde hogar).El valor que se incorpora en la planilla de cálculo se identifica bajo la columnatitulada %nijh.

5. “Porcentaje de población con nivel de instrucción menor a primario”,

En su construcción se emplea el cálculo de la proporción porcentual quesignifica la suma de la población cuyo “Nivel alcanzado es el Primarioincompleto” y la población con “Nivel alcanzado primario ignorado” (variablesC057 P + C 058 P) respecto del valor correspondiente a la población que “Noasiste pero asistió” a algún nivel educativo (variable C 032 P). El rótulo deidentificación de la columna en la que se incorporan estos valores es el que sedenomina Penp%.

6. “Porcentaje de viviendas rancho”,

Se calcula multiplicando por 100 (cien) el valor de la variable Total deRanchos (C 006 V) y dividiendo su resultado por el valor sumatoria de C 001

Page 8: Garcia - Analisis Cluster

V(Viviendas Ocupadas), y C 002 V (Viviendas desocupadas) que corresponde altotal de viviendas.En la Planilla de cada localidad estos valores aparecen bajo la columnadenominada %RANCH.

7. “Porcentajes de viviendas de inquilinato o pensiones”,

Se suman en primer lugar las variables C 008 V (Casas de inquilinato) y C009 V (Pensiones y hoteles). Al valor resultante se lo calcula como porcentajerespecto del valor que corresponde al total de viviendas.Como título de la columna que encabeza a estas variables se reconoce altérmino %INQL.

8. “Porcentaje de viviendas con problemas de acceso al agua”.

Para la construcción de esta variable, se suman los valores de las variablesque representan problemas de provisión de agua en las viviendas por no teneragua dentro de ella, o poseer provisión por pozo y bombeo manual, aljibe, etc.(C 020 V; C 021 V; C 024 V; C 025 V; C 026 V; C 027 V; C 028 V y C 029 V).Es entonces la proporción (de la suma de estas variables) con respecto al totalde viviendas presentes en el área.Por último, se identifica la columna que representa este valor de variable bajoel título de %Ktotal.

Cada una de estas variables, se incorpora en una cartografía básica por localidad,dentro de un archivo de atributos georreferenciados en radios fracciones. Ello permite laconfección de mapas temáticos por cada variable (ver cartografías 1 a 8 en anexos) ypara cada localidad estudiada. Se emplea en cada caso un software vectorial comoSistema de Información Geográfica (SIG).

A fin de definir el mapa de áreas homogéneas de Calidad de Vida por localidad yluego el Cálculo del Índice de Calidad de Vida, a continuación se explica el tratamientomatricial de variables para identificar una distancia entre radios-fracciones que posibilitala aplicación de un análisis Cluster para determinación de Areas Homogéneas de Calidadde Vida.

Cuando se dispone de información heterogénea (por ejemplo la empleada paraconstruir las variables que se definen para determinar áreas homogéneas de Calidad deVida) referidas a un conjunto de individuos (los radios y fracciones que componen acada una de las localidades tomadas como muestras); y se pretende determinar elconjunto de características que fortalezcan o sustenten el agrupamiento entre lasunidades de análisis (los Radios-fracciones originales); surgen irremediablementealgunas cuestiones y preguntas, entre otras:

Page 9: Garcia - Analisis Cluster

¿Existen diferentes grupos de variables entre las que se introducen para agrupar radiosfracciones?, ¿Hay alguna manera de reducir el número de variables y justificar lareducción de las variables originales (disponibles en el Censo) a fin de hacer más rápidoy “aplicable” un mismo método para el estudio comparativo en varias localidades?,¿ son interdependientes o dependientes las variables entre ellas?, ¿Cómo se puedenequilibrar esas influencias entre variables?.Si tomo al conjunto de radios – fracciones y se los pretende agrupar de acuerdo con elcomportamiento conjunto de variables: ¿Cómo se conforman estos grupos teniendo encuenta que las variables pueden ser muy heterogéneas en cuanto a su magnitud ycomportamiento estadístico?Y algo muy importante para el presente trabajo: -¿Se pueden hacer comparacionesentre los agrupamientos realizados entre los radios-fracciones de las seis (6) ciudadestomadas como muestra en el presente trabajo?

Respecto a las primeras tres preguntas las respuestas surgen desde el enunciadodel marco teórico metodológico que se lleva a cabo desde la Etapa Preliminar, así comodesde el desarrollo y explicación de los procedimientos estadísticos que llevan a lajustificación e inclusión de las variables de calidad de vida que se utilizan en estetrabajo (durante la presente Etapa de Operacionalización).

El objetivo de responder a las siguientes preguntas es la movilización hacia labúsqueda de un tratamiento estadístico que sea el más idóneo ante este particularconjunto de datos, y que permita la posibilidad de realizar el análisis de matriz final enla que se puedan contraponer radios-fracciones contra radios fracciones de la mismalocalidad; pero con posibilidades de poder comparar las homogeneidades de calidad devida de las 6 localidades.Para ello se recaba información acerca de tres métodos estadísticos en particular :• Análisis Factorial Múltiple (Landaluce, C.; Fernández A. y Modroño H.; 1999) el cual

se denomina comúnmente como AFM;• Particularmente dentro de la Metodología STATIS, el Método de Jaffrenou (Analyse

Triadique de Jaffrenou) con distancia euclidiana (Landaluce, C.; Fernández A. yModroño H.; Op.Cit.); y

• Y el Método de análisis Cluster con ligamiento completo para matriz de distancias deGower (Torcida, S., Marinelli, C., Cepeda R.y Winzer,N; 1999; Marinelli, C., Torcida,S., Cepeda, R., García, M., y Velázquez G. ; 1999ª y 1999b ; Torcida, S., Cepeda,R., Marinelli, C., García, M., y Velázquez 2000; y G.Velázquez, G. y García, M.;2000).

Como se explica a continuación, los dos primeros métodos se descartan, optándose porel análisis Cluster aplicando matriz de distancias con distancia Gower. La razón de noaplicar los dos primeros métodos es una serie de limitaciones que impiden llegar aresultados adecuados.

El AFM permite el tratamiento simultáneo (como si todas las tablas estuvieranactivas) de tablas de datos referidos “al mismo conjunto de individuos, pudiendo tenerdiferente número de variables y de distinta naturaleza (cuantitativa, cualitativa), aunque

Page 10: Garcia - Analisis Cluster

en el seno de cada una de ellas las variables deben ser de la misma naturaleza”(Landaluce, C.; Fernández A. y Modroño H.; Op. Cit.). Por tanto el AFM, no se adaptapara la determinación de ‘áreas homogéneas de calidad de vida’ a partir del juegoconjunto de variables de calidad de vida pública y privada (de calidad de vivienda, nivelde educación, acceso al agua, etc.) aunque todas las variables pertenezcan a lacategoría ya definida (desde la teoría) como “Objetiva”, o que todas ellas seancuantitativas, y presentadas en porcentajes (que a medida que aumentan significanpeores condiciones). Además este análisis únicamente permite la correlación entre lasvariables que pertenecen a diferentes individuos; pero no permite medir a que distanciaestá un individuo con respecto al resto.

La metodología STATIS también permite el tratamiento simultáneo de tablas dedatos referidas al mismo conjunto de individuos, pero mediante la construcción dematrices de correlación para medir distancia entre los individuos ya caracterizados.Particularmente los principios de funcionamiento del Análisis Jaffrenou permiten elanálisis simultáneo de matrices de datos referidas a los mismos individuos y a lasmismas variables, pudiendo ser estas últimas de cualquier naturaleza. Para medir comose acercan o difieren los individuos emplea distancia euclidiana entre las tablas dedatos. Esta distancia no tiene un límite de variación (por ejemplo entre 0 y 1) y portanto no garantiza buenos resultados cuando los rangos o escalas de medición de lasvariables son muy diferentes (por ejemplo los porcentajes de Nivel de Instrucción dejefe de hogar con una variación o escala entre 15% a 45%, mientras que el Porcentajede y pensiones varia entre 0% y 49%) y sobre todo cuando se pretenden hacermediciones simultáneas en seis estudios de caso a la vez (localidades). Por tanto esteanálisis comprometería la lectura del agrupamiento final de radios y fracciones así comola comparación entre los grupos de las seis ciudades.

En la búsqueda de aplicar una metodología más apropiada, se trabaja en formaconjunta con especialistas del campo de Matemática y Estadística aplicada a CienciasSociales. Se puede comprobar que existen ciertas bondades en la aplicación del métodode Análisis Cluster con ligamiento completo y matriz de distancias de Gower, que no seobtienen mediante los dos expuestos anteriormente. Este método y a fin de que lasvariables incorporadas (heterogéneas en cuanto a su magnitud y comportamientoestadístico) permitan definir una distancia “donde todas las variables tengan laposibilidad de contribuir de manera similar, considera en primera instancia unaestandarización de las variables por rangos. De esta manera las variables transformadaspermanecen sensibles a las diferencias iniciales pero teniendo intervalos de variacióncomparables”(Marinelli, C.;Torcida, S.;Cepeda, R.; García, M. y Velázquez, G.; 1999a), ytiene como conveniencia particular que la variación de la distancia es acotada entrelímites. Es decir que el valor de Distancia de Gower (D²) l tiene límites definidos, por locual la distancia entre individuos puede variar entre valores 0 y 1, donde 0 es la mínimadistancia entre dos elementos comparados y 1 es la mayor distancia (Marinelli, C.20012).

2 Aclaraciones de discusión metodológica en reunión de trabajo realizada el 22 de noviembre de 1999 en el Núcleo Consolidado deMatemática Aplicada (NUCOMPA), Facultad de Ciencias Exactas de la Universidad Nacional del Centro. Tandil.

Page 11: Garcia - Analisis Cluster

En este método se parte de la planilla con los valores o datos de variables dispuestospor individuos los que a su vez poseen diferentes dimensiones de acuerdo a la localidad.Por la heterogeneidad de las variables (variables que se construyeron como parámetrosde calidad de vida) estas se estandarizan por rangos (rx= xmáx – xmin) que permitenhacer una comparación entre el comportamiento de variables de diferentes localidades.Y luego se calculan las correspondientes distancias de Gower entre individuos (o seaentre radios – fracciones de cada localidad).Para construir la matriz de distancia Gower en primer lugar se aplica la fórmula y seconstruyen los cálculos desde una Planilla Excel. Luego se introduce la matriz resultanteen un software específico (denominado Statistica, Versión 5.1 para Windows, 1997)que permita tomar la matriz, hacer el ligamiento de todas las distancias (entre radiosfracciones) y generar el agrupamiento en una representación de Dendrograma.

Debido a la mejor adaptación del tercer método, y de acuerdo con la experiencia dehaberlo aplicado en trabajos anteriores, se decide optar por su aplicación.

Los datos incorporados en cada matriz de datos fueron tratados del siguiente modo:

En las filas se hace la georreferenciación de los identificadores de unidadescensales radios – fracciones a agrupar;

Encolumnadas se dispusieron las ocho variables de calidad de vida construidasque caracterizan a cada uno de esos radios-fracciones, y en su comportamientoconjunto conllevan a caracterizar la distancia entre grupos de radios-fracciones (verejemplo de tabla inicial que se incorpora en el párrafo siguiente). Luego se hacen loscálculos de distancia de Gower para generar la matriz de distancia.

EJEMPLO DE TABLA INICIAL PARA CONSTRUIR LA MATRIZ DE DISTANCIAVCV1 VCV2 VCV3 VCV4 VCV5 VCV6 VCV7 VCV8 x y z a b e i u

Radio Fraccióni

23 40 33 45 6 57 8 2

Radio Fracciónj

12 23 7 16 12 34 19 5

Radio Fracciónn

15 50 30 37 9 45 10 1

(los valores que se asignan a la Variable de Calidad de Vida VCV1 - o variable x-correspondientes al Radio Fracción i así como el resto de los valores que se insertan enel cuadro son a modo de ejemplo y se retoman para cálculos explicativos posteriores)

Para construir esta tabla y procesar sus datos se trabaja de la siguiente forma:1º) En primer lugar se procede a incorporar como enunciado de cada fila a los “n”radios fracciones, que son los que en definitiva se intentan agrupar en ‘áreas

Page 12: Garcia - Analisis Cluster

homogéneas’, de acuerdo al comportamiento conjunto de las 8 variables de calidad devida en cada uno de ellos3.En las columnas se completan, en primer lugar, los Valores Porcentuales de las 8variables o indicadores construidos para caracterizar la calidad de vida, y sus valoresrespectivos irán uno a uno por cada columna (primera, segunda, etc.), ycorrespondiéndose con sus respectivas filas (radios fracciones) como dato atributo.

2º) Se confeccionan los pasos para aplicar distancia Gower. Se escoge esta distancia afin de amortiguar y considerar los rangos o escalas de las variables que intervendrán enla realización del análisis cluster (el que permite el agrupamiento de radios fracciones enzonas homogéneas).En primer término se procede a hacer la confección de una matriz cuadrada dedistancias, mediante la aplicación de una fórmula cuya traducción literal sería lasiguiente.

La medida entre dos radios-fracciones (radiofraccióniésimo –fri-y radiofracción enésimo –frn-) es igual a:la Suma de los Módulos de las diferencias de valoresestandarizados de las variables que corresponden afri y frn,dividido el Número de Variables empleadas paracaracterizar a los radios fracciones.

La expresión matemática para calcular esta distancia entre radios-fracciones (fr)es la que se dispone bajo la siguiente fórmula :

1 8 / xi k - xn k / D(fri, frn)= ----- ∑ ------------- 8 k rk

Donde; D (fri, frn) es igual a la Distancia entre la fracción iésima y la fracción Enésima; y cuyo cálculo se realiza de la siguiente forma.Primero se suman los valores estandarizados de las variables aplicando:

/ xi k - xn k / El módulo de la resta entre el valor de la ------------- variable x de la iésima r-fracción menos el valor de la

rk misma variable de la enésima fracción dividido por el rango (valor máximo – valor mínimo de todos los valores x delconjunto)

de la variable;

3 Dentro de los ene radio - fracciones se incluyen el total de la localidad o área urbana con el agregado de algunas unidades del árearural circundante al azar. Se diseña de este modo a fin de comprobar si existen zonas urbanas que por su comportamiento devariables quedan agrupadas junto a radios - fracciones rurales.

Page 13: Garcia - Analisis Cluster

Para los valores de la variable x dados en el ejemplo de la tabla enunciada en páginasanteriores,y considerando la distancia entre Radio Fracciones (fr) i y n sería;

/ 23-15/23-12

Esto mismo se debe realizar para cada una de las variables de Calidad de Vida;y luego se procede del siguiente modo:Se suman los valores obtenidos para todas las variables de la Tabla original sobre eltotal de las variables, comparadas de ese modo y se divide el resultado por lasumatoria de las variables (que en este caso son un total de ocho). Para ello se empleala siguiente parte de la fórmula:

1 8 ----- ∑ cuyo valor resulta de sumar los valores anteriores 8 k de todas las variables (tratadas por dicha fórmula) y

dividirlo por el número total de variables (que en este caso son ocho variables)

A fin de arrojar claridad sobre esta fórmula se procede, a continuación, a realizar unejemplo de cálculo de distancia entre dos Radios Fracciones (fr) de acuerdo a losvalores de las variables (x,y.z,a,b,e,i y u dados en la tabla que se insertó en dospáginas anteriores. En este caso se calcula la distancia entre Radio Fracciones (fr)denominados i y n .

La traducción del cálculo de distancia a valores sería la siguiente:

/23 –15/ /40 – 50/ /33 – 30/ /45 – 37/ /6 – 9/ /57 – 45/ /8 – 10/ /2 – 1/ 23-12 + 50 – 23 + 33- 7 + 45-16 + 12-6 + 57-34 + 19-8 + 5-1 .

D (fri, frn) = ------------------------------------------------------------------------------------- 8

0,7272+0,3703+0,1153+0,2758+0,5000+0,5217+0,1818+0,25D (fri, frn) = ---------------------------------------------------------------- 8

D (fri, frn) = 0,3677625

Page 14: Garcia - Analisis Cluster

De igual manera como se ha explicado en este ejemplo, para el trabajo seprocedió en primer lugar a estandarizar las variables de calidad de vida (variablescalculadas con datos originales del Censo del INDEC (1991) para cada uno de los radiosfracciones urbanos de cada ciudad.

Luego se toman los valores absolutos de las diferencias entre las mismasvariables de cada radio - fracción del cual se pretende hallar la distancia.

Por último se procede a hallar la distancia entre los radios-fracciones (fr) de cadalocalidad y completar la matriz de distancia Gower. Estos valores de distancia fueroncalculados y dispuestos en una matriz cuadrada empleando el software Excel. Estamatriz cuadrada, tiene la particularidad que en su diagonal, donde se contraponen valorde distancia entre un radio fracción y el mismo radio fracción, la distancia será igual a 0.La distancia mayor entre este radio fracción y otro radio fracción tendrá la particularidadde variar entre ese valor 0 distancia hasta / 1/ como máxima distancia. Estos valoresconstituyen la propiedad de la Distancia de Gower.

Para los valores de distancia se asignan formato de celdas en números y concuatro (4) decimales (ej. 0,0002), de tal modo que la menor distancia se representa porel valor 0,0000 y la mayor distancia entre radios-fracciones se puede identificarfácilmente como valor 1,0000.

Con los valores calculados ya dispuestos como matriz de distancia entre cada unode los radios fracciones censales (con respecto a todos y cada uno de los radiosfracciones de la misma localidad), se procede a copiarlos e insertarlos dentro de unsoftware que permite el análisis cluster y su representación en forma de Dendrograma(empleando salida gráfica del Software Statistica). Para el análisis Cluster se emplea unligamiento completo y la distancia de Gower entre las unidades censales.

En la figura de Dendrograma (ver Gráfico 1 en el Anexo) se aprecian losagrupamientos de acuerdo al acercamiento de las uniones entre las unidades radiosfracciones, con respecto al eje de las x. Ese mayor acercamiento del cierre de los gruposradios-fracciones se determina por el funcionamiento más homogéneo de las variablesde calidad de vida incorporadas. Esa distancia traducida a términos de homogeneidadpermite a su vez apreciar cual de las localidades se encuentra ubicada en una situaciónestadística de mayor heterogeneidad u homogeneidad (respecto de las ocho variablesde Calidad de Vida estudiadas).

A fin de hacer comparables los grupos de radios-fracciones de las diferenteslocalidades, se decide escoger una distancia o nivel de fusión de los radios-fracciones entorno a la distancia 0,1000. Se estipula una variación a ambos lados de esa magnitud decorte de 0,025. De esta forma, los grupos homogéneos de las seis ciudades quedandefinidos por la unión de radios-fracciones entre distancias comprendidas entre 0,075 y0,125 con respecto al eje x del dendrograma. Este nivel de corte permite la explicaciónde los agrupamientos en áreas homogéneas obtenidos.

Una forma de interpretación rápida del conjunto de esos grupos homogéneos deradios-fracciones generados es a partir de la lectura de la salida gráfica de los gruposunidos antes o hasta el intervalo de distancia estipulada para la clasificación. De todosmodos, en la clasificación obtenida, quedan algunos radios y fracciones que se han

Page 15: Garcia - Analisis Cluster

optado por considerar dentro de un grupo, cuando su nivel de fusión al grupoconsiderado se lleve a cabo en una distancia inferior a 0,500. Mientras que algunosradios y fracciones quedan “sueltos” o conformando un grupo de un solo radio -fracción, debido a que su nivel de fusión (al grupo colindante al cual está unido)sobrepasa la mitad del intervalo de variación de distancia 0 a 1.

Como resultado de la aplicación de este análisis Cluster y la interpretación delDendrograma surge la delimitación de los agrupamientos para cada una de laslocalidades muestra (las matrices y salidas gráficas se ha incluido en el anexocorrespondiente al tratamiento de cada localidad). Algunos Cluster como loscorrespondientes a las ciudades de tamaño intermedio mayor (casos de Mar del Plata yel de Bahía Blanca que se incluye en anexos como Gráfico 1) se llevan a cabo por variasmatrices, por existir límites de tamaño de matriz en los programas estadísticosdisponibles. En estos casos se realizan cuatro y dos matrices cuadradasrespectivamente.

En cambio para los casos de ciudades intermedias medianas y más pequeñas(Tandil, Olavarría, Zárate y Azul) no requieren de este proceso de ‘partición’ de lasmatrices cuadradas para hacer el análisis cluster. La importancia de la delimitación de estos grupos homogéneos es por un lado lareducción de las unidades de análisis (radios fracciones censales) con la generación denuevas unidades de análisis como son las “áreas homogéneas” que los agrupan. Y parael trabajo que aquí se explica, define una nueva unidad de análisis que permite hacerun trabajo de muestreo en forma menos compleja que si se hubiera efectuadodirectamente sobre los radios - fracciones censales (dicho muestreo se llevó a cabocomo corolario de la denominada tercera etapa del trabajo).

Los resultados de estos agrupamientos constituidos por radios – fracciones de lalocalidad, se representan mediante la confección de cartografías temáticas, con una solavariable (correspondiente al número de grupo homogéneo) y por rangos discontinuos, apartir del empleo de un sistema de información geográfica vectorial.

Como último paso de esta segunda etapa, se calcula el Índice de Calidad de Vida(I.C.V.) en las áreas homogéneas obtenidas por localidad, lo que permitió ladiferenciación de la Calidad de Vida presente en cada ciudad.

Debido a que el análisis Cluster que se emplea determina clasificación (pero nouna jerarquización) de grupos homogéneos de radios fracciones, de acuerdo alcomportamiento conjunto de las variables de Calidad de vida; este agrupamiento noindica el valor de la Calidad de Vida, sino únicamente indica un comportamientohomogéneo de las variables consideradas. De allí que al Grupo de radios-fraccionestambién se lo denomine como área homogénea.

Es necesario entonces, realizar una jerarquización de Calidad de Vida de estosgrupos, y por tanto determinar de alguna forma el Valor de Calidad de Vida que lecorresponde a la población albergada en cada uno de esos Grupos, formados deacuerdo al análisis anterior. Por ello posteriormente se calcula un índice de Calidad deVida que jerarquiza a los grupos o áreas homogéneas formados.

Page 16: Garcia - Analisis Cluster

En una planilla de cálculo se disponen en primer lugar los radios - fracciones enforma agrupada (acorde a las distintas ‘áreas homogéneas’ obtenidas para cada lalocalidad). Siguiendo esa nueva disposición de radios fracciones se les introdujo las ochoVariables de Calidad de Vida en valores de porcentajes y (en una columna inmediata),los correspondientes valores estandarizados. Luego, y para cada una de estas variablesse construyen índices de valoración en diez intervalos y con valores redondeados (a finde permitir una lectura más rápida de las situaciones obtenidas). De acuerdo al valorde la variable se asignan proporcionalmente valores entre 0 y 10 de Índice de Calidadde Vida (ICV), donde:

10 es la mejor situación de ICV (en estas variables se debe recordarque coincide con los valores más bajos de los porcentajes y de susvalores estandarizados), y0 es el valor que representa las peores condiciones relativas del ICV.

Posteriormente a éste cálculo (realizado para cada uno de los radios - fraccionesque componían a los grupos homogéneos de cluster), se halla el índice de calidad devida por radio-fracción (por promedio de los valores de índices obtenidos en lasvariables), y sin darle ponderación diferente a cada variable.Por último se obtiene el Valor de I.C.V. (entre valores 0 a 10) que le corresponde a cadagrupo de radios fracciones o área homogénea, por el promedio de los I.C.V. de losradios - fracciones que integran la nueva unidad de análisis.

De esta forma, se asigna a cada uno de los Grupos un Valor de I.C.V. que loscaracteriza y jerarquiza. Los grupos, una vez evaluados se identifican y jerarquizanmediante su representación cartográfica. Algunos de los mapas temáticos donde sesintetizan los Grupos homogéneos (Cartografías 9 y 11) y otro mapa conteniendo elValor de I.C.V. de una de las seis localidades muestra (Cartografía 12), se puedenapreciar en anexo del presente trabajo. En dichas cartografías, copiadas directamentedesde la pantalla del software (empleado para construirlas), se pueden observar que losdatos temáticos no son nada menos que los datos de uno de los campos de un archivode atributos activo, tratados aquí con rangos y por medio de tramas.

Teniendo en cuenta que para cada radio fracción que conforman a dichos gruposde igual I.C.V., se dispone de datos de Población y Viviendas Ocupadas; se calculaluego y por sumatoria simple; la cantidad de Población y de Viviendas ocupadasincluidas dentro de cada grupo con determinado Valor de I.C.V. de la localidad. Setraducen los valores numéricos del índice a valores de categorías de calidad de vida.Para ello se estipula que de acuerdo con los porcentajes y bajos valores de variablesincluidos en cada uno de los ICV; los ICV 9 y 10 se pueden asimilar a una Alta Calidadde Vida; los valores de I.C.V. 7 y 8 en cambio representan Mediana Calidad de Vida. Y,por último, de acuerdo a los altísimos porcentajes de algunas variables, los valores deíndice ICV 6 y menores se integran en una categoría denominada Baja Calidad de Vida.Esta tarea se lleva a cabo dentro de planillas de cálculo de Excel, lo cual permite graficarla estratificación en categorías de calidad de vida de la población de cada localidad.

Page 17: Garcia - Analisis Cluster

• En una Tercera Etapa del trabajo original se llevaron a cabo las Tareas dePlanificación para la recolección de datos primarios por medio de unmuestreo y toma y análisis de muestras de Residuos sólidos Domiciliarios(RSD) por localidad. Se llevó a cabo la puesta a punto de los instrumentos derecolección de datos (calibración de balanza digital y planificación derecorridos para hacer muestreo de RSD), luego se toman las muestras, seanalizan y ordenan los datos para su posterior análisis en planillas ad hoc yluego en tablas construidas en Excel.

Las técnicas empleadas incluyen el simple manejo estadístico y a partir de losresultados de técnicas estadísticas complejas elaboradas en la etapa anterior.

Para el diseño del muestreo estratificado de los RSD, se considera como universo deanálisis a las viviendas ocupadas de la localidad, y la proporción de viviendas ocupadasde cada grupo homogéneo permite asignar el número de muestras por grupo. Es decir,aquí se tienen en cuenta los resultados de la Etapa de Operacionalización de datos yadescripta. Para las localidades de mayor tamaño de población se calcula un muestreo de0,1% y para las localidades medias e inferiores del 0,2% sobre las viviendas ocupadassegún el Censo INDEC 1991. En todas las localidades se hacen ajustes teniendo encuenta que cada área o grupo homogéneo estuviera representado al menos por unamuestra. Es decir que cada área homogénea pueda estar representada por la o lasbolsas retiradas desde el frente de una de sus viviendas ocupadas. De allí que, aunquede acuerdo con las proporciones de estratificación (calculadas en una planilla Excel),algunas áreas homogéneas no alcanzan a alojar viviendas ocupadas como para requeriruna muestra (por ejemplo si le correspondía un valor menor a 1), sin embargo se asignauna muestra forzada a fin de tener los datos referidos al área.

Luego se planifica la tarea de campo para recolectar las muestras así calculadas y seefectúan cada uno de los recorridos para cada localidad. La tarea de campo se completaen tres meses del año 2000 (meses correspondientes a la primavera). Para ello serecorre un camino prediseñado sobre los puntos (Viviendas ocupadas) en los que serecogen las bolsas muestra.

La elección de los puntos de muestreo estratificado se realiza al azar o pordefecto de ubicación de variables atributos incorporados en el SIG. Es decir lalocalización de dónde sacar las bolsas de residuos se logra a partir de realizar un mapatemático construido en un SIG de tipo vectorial, en el cual se le asigna a cada áreahomogénea el número de muestras que le corresponde de acuerdo al porcentaje deviviendas ocupadas. Al hacer el dibujo de cada muestra el SIG distribuye los símbolos deatributos (banderitas, bolsas, puntos, etc.) en un determinado punto dentro del espaciode polígono que corresponde al área homogénea (Cartografía 13 del anexo). En las dosprimeras localidades que se efectúa el muestreo (Azul y Olavarría) se realizaron ajustesa la hora de recolectar las muestras: por ejemplo se cambia de manzana cuando no

Page 18: Garcia - Analisis Cluster

existen viviendas ocupadas en la escogida al azar por el SIG. Para el resto de laslocalidades se sortea éste inconveniente previa observación de imágenes satelitalesSPOT que permiten eludir zonas sin cobertura por viviendas.

• En una etapa siguiente (que excede al trabajo aquí presentado) se analizanlos datos del muestreo, se tabulan datos primarios(Cuadro 1, 3 del anexo) yse comparan (Cuadro 2 y Gráficos 2 y 3 del anexo), permitiendo ver lasdiferentes pautas y niveles de consumo dentro de cada localidad y en formacomparativa entre las seis ciudades, lo cual forma parte de los resultadosprimarios que se retoman luego para medir sustentabilidad urbana en lasciudades en las que se realizó este estudio. A modo de ejemplo se haninsertado algunos gráficos comparativos (2 y 3) sobre desigualdades en clasesde calidad de vida y en niveles de consumos, que se recomiendan observar enel anexo, ya que el consumismo (tema que excede a esta presentación, peroque ha dado origen al trabajo metodológico aquí expuesto) está impregnadoen la base de la sociedad urbana, inclusive en ciudades de tamaño intermediopequeñas.

CONCLUSIONES:Es posible trabajar con pocas variables estadísticas a fin de definir áreas

homogéneas de calidad de vida y realizar en ellas un muestreo de datos posterior.Esta economía de variables inclusive permite, al emplear un método cluster con

distancia de Gower, reducir problemas de límites de variables, y en el caso de estudioscomparativos entre ciudades, tener una base homogénea para su comparaciónposterior.Este paso de diferenciar partes de la ciudad en áreas homogéneas ahorra esfuerzos (entiempo y en dinero) al momento de tener que realizar un muestreo. Y de acuerdo a lasvariables empleadas, se adaptan perfectamente al muestreo de pautas de consumodiferenciado en la población (obtenido a partir demuestras de residuos sólidosdomiciliarios).

Las herramientas SIG, no sólo permiten ver estas “realidades” estadísticas deciertas homogeneidades, sus diferencias en el área de estudio y su comparación conotras áreas de estudio (es decir aplicar los abordajes desde la geografía cuantitativa enun área geográfica determinada o comparativamente entre áreas diferentes), sino queunidas a una previa tarea de cluster con distancia de GOWER aporta un rápido criteriode selección de lugares desde donde tomar las muestras que introduzcan nuevoselementos de análisis tanto internamente en una ciudad como comparativamente entreciudades.

BIBLIOGRAFÍA:CERRUTTI, M.; 1991. “ESQUEMA DE LAS ETAPAS DEL PROCESO DE INVESTIGACION”. Documento de

consulta para la Cátedra de Metodología y Técnicas de la Investigación Social, Carrera deSociología. Facultad de ciencias Sociales de la Universidad de Buenos Aires. UBA. Bs.As.49pp.

GARCÍA, M.C.; 2001 “Calidad de Vida Urbana y Gestión de Residuos Sólidos Domiciliarios comoparámetros de sustentabilidad en ciudades intermedias de Argentina”. Tomo I Tesis de DoctoradoUniversidad Nacional del Sur. Bahía Blanca.

Page 19: Garcia - Analisis Cluster

GARCÍA, M.C.; 2001 “Calidad de Vida Urbana y Gestión de Residuos Sólidos Domiciliarios comoparámetros de sustentabilidad en ciudades intermedias de Argentina”. Tomo II Tesis de DoctoradoUniversidad Nacional del Sur. Bahía Blanca.

INDEC, 1991: Datos inéditos para Localidad de Azul. Censo Nacional de Población y Viviendas. InstitutoNacional de Estadísticas y Censos. Compilación 1999.

INDEC, 1991: Datos inéditos para Localidad de Bahía Blanca. Censo Nacional de Población y Viviendas.Instituto Nacional de Estadísticas y Censos. Compilación 1999.

INDEC, 1991: Datos inéditos para Localidad de Gral. Pueyrredón. Censo Nacional de Población yViviendas. Instituto Nacional de Estadísticas y Censos. Compilación 1999.

INDEC, 1991: Datos inéditos para Localidad de Olavarría. Censo Nacional de Población y Viviendas.Instituto Nacional de Estadísticas y Censos. Compilación 1999.

INDEC, 1991: Datos inéditos para Localidad de Tandil. Censo Nacional de Población y Viviendas. InstitutoNacional de Estadísticas y Censos. Compilación 1999.

INDEC, 1991: Datos inéditos para Localidad de Zárate. Censo Nacional de Población y Viviendas. InstitutoNacional de Estadísticas y Censos. Compilación 1999.

LANDALUCE CALVO, M. FERNÁNDEZ AGUIRRE J.Y MODROÑO HERRÁN,1999. “Reflexiones sobre el usocomparativo del análisis factorial multiple (AFM) y de la metodología STATIS para el análisis detablas múltiples”. En METHODOLOGICA Revista de técnicas, métodos e instrumentos deinvestigación en ciencias Humanas. Pp37-66.

TORCIDA, S., MARINELLI, C., CEPEDA, R. Y WINZER, N.; 1999 “Una metodología tendiente a validar lahipótesis de continuidad espacial en relación a la calidad de vida para ciudades Intermedias”. EnSesión Elaboración de índices de Calidad de Vida, problemas ambientales y desigualdadeseconómico-sociales en ciudades intermedias. V Jornadas de la Asociación de Estudios de Poblaciónde la Argentina. AEPA.INDEC. Universidad Nacional de Luján.

MARINELLI, C, TORCIDA, S., CEPEDA, R., GARCÍA, M., VELÁZQUEZ, G.; 1999A “ Un procedimientoalternativo para la selección estadística de Variables de Calidad de Vida”. En Velázquez, G. y GarcíaM. CALIDAD DE VIDA URBANA. APORTES PARA SU ESTUDIO EN LATINOAMÉRICA. Centro deInvestigaciones Geográficas de la U.N.C.P.B.A.ISBN 987-97729-0-3 Tandil, (pp133 – 141).

MARINELLI, C., TORCIDA, S.; CEPEDA, R.; GARCÍA, M.; VELÁZQUEZ G.1999B y “Selección y reducciónestadística de variables de calidad de vida”. V Jornadas de la Asociación de Estudios de poblaciónde la Argentina AEPA-INDEC. Universidad Nacional de Luján.

TORCIDA, S., CEPEDA, R., MARINELLI., C., GARCÍA, M. Y VELÁZQUEZ, G.; 2000. “Discusionesmetodológicas acerca de la validez de la Elaboración de un Indice de Calidad de Vida Urbanaaplicable a ciudades de Tamaño intermedio”. En Metodologías para Medir calidad de Vida del VSEMINARIO LATINOAMERICANO DE CALIDAD DE VIDA URBANA. UNIVERSIDAD DEL BIO BIO. CDEditado por Departamento de Extensión Fac. de Educación y Humanidades Depto. De Historia yGeografía de la Universidad del Bío Bío y la secretaría General del Instituto Panamericano deGeografía e Historia (IPGH). Chillán.

VELÁZQUEZ, G. Y GARCÍA, M. 2000. “Calidad de Vida en Argentina. Un análisis según categoríasurbanas”. En Metodologías para Medir calidad de Vida del V SEMINARIO LATINOAMERICANO DECALIDAD DE VIDA URBANA. UNIVERSIDAD DEL BIO BIO. CD Editado por Departamento deExtensión Fac. de Educación y Humanidades Depto. De Historia y Geografía de la Universidad delBío Bío y la secretaría General del Instituto Panamericano de Geografía e Historia (IPGH). Chillán.

ANEXOS DE FIGURAS Y CUADROS:

Page 20: Garcia - Analisis Cluster
Page 21: Garcia - Analisis Cluster
Page 22: Garcia - Analisis Cluster
Page 23: Garcia - Analisis Cluster
Page 24: Garcia - Analisis Cluster
Page 25: Garcia - Analisis Cluster
Page 26: Garcia - Analisis Cluster
Page 27: Garcia - Analisis Cluster
Page 28: Garcia - Analisis Cluster
Page 29: Garcia - Analisis Cluster
Page 30: Garcia - Analisis Cluster