Tema 3 Tratamiento de Datos.clasificacion

27
Cartografía Temática y Topografía Subterránea Página nº 1 Tema 3 “TRATAMIENTO DE DATOS” TRATAMIENTO DE DATOS TEMA 3.- TRATAMIENTO DE LOS DATOS EN CARTOGRAFÍA MÁTICA

description

Tema 3 Tratamiento de Datos.clasificacion

Transcript of Tema 3 Tratamiento de Datos.clasificacion

Page 2: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 2

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

Estudio de los métodos y técnicas estadísticas básicas para el conocimiento científico de la realidad social y su posterior plasmación cartográfica.

Conocer las condiciones de aplicación de las diferentes medidas estadísticas.

Evaluar los diferentes métodos de clasificación para la realización de cartografía temática.

1.- OBJETIVOS

Page 3: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 3

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

2.- GENERALIZACIÓN ESPACIAL Y TEMÁTICA

Tratamiento: Comprende todas las operaciones que se realizan con los datos tras su adquisición hasta que toman forma cartográfica Desde la obtención de coordenadas, hasta complejas técnicas de tratamiento estadístico o de

algoritmos de simplificación de líneas Afectan tanto a la componente espacial como a la componente temática Puede encaminarse a la simplificación o generalización de información o por el contrario a la

generación de nueva información (análisis, SIG) Nos centraremos en lo primero; lo segundo es más propio de otros especialistas, aunque los

límites a veces no quedan claros Generalización cartográfica: Conjunto de técnicas que permiten mantener la cantidad de

información presente en una mapa a pesar de reducir la cantidad de datos Se aplica a todas las componentes del datos pero tradicionalmente en Cartografía se ha

dedicado más atención a la espacial Además de esta generalización cartográfica podemos hablar de la generalización de datos,

normalmente previa a la cartografía Tratamiento estadístico: medidas, regresión. Cálculo de datos relativos y derivados Clasificación, agregación y conversión de datos

Page 4: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 4

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

Son operaciones que se aplican sobre todo a la componente espacial, pero que terminan afectando a la temática

Implica una selección de elementos, una esquematización de los mismos y una armonización del conjunto

La generalización se realiza a través de una serie de operadores

colapso

clasificación y simbolización

agregación y amalgamado

desplazamiento

simplificación

suavizado

exageración

tipificación

2.- GENERALIZACIÓN ESPACIAL Y TEMÁTICA

Page 5: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 5

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

La generalización espacial, afecta sobre todo a la componente espacial de los datos aunque la temática se pueda ver afectada

Generalización vectorial: Simplificación y suavizado de líneas Generalización de áreas

Reducción

Generalización raster − Estructural: Remuestreo, interpolación de celdas

− Numérica: Filtros de suavizado, realce, direccionales

− Morfología matemática (cascos urbanos)

2.- GENERALIZACIÓN ESPACIAL Y TEMÁTICA

Page 6: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 6

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

3.- REDUCCIÓN NÚMERO DE DIMENSIONES

• En Cartografía, se produce en muchas ocasiones una reducción del número de dimensiones (o componentes de los datos) que puede ser considerada como una generalización (simplificación)

• Los datos se pueden considerar que tienen n dimensiones: • 3 espaciales (x, y, z) • Varios atributos (a1, a2, …) • Varios momentos en el tiempo (t1, t2, …) • Metadatos, compleción, linaje, …

• En primer lugar se prescinde de la componente temporal (datos espacio-temporales o 4D) y

de otras componentes • En segundo lugar se suele considerar un solo atributo (capa) asociado a cada dato • En tercer lugar se prescinde de la tercera dimensión, reduciendo los datos a puntos, líneas o

zonas • En cuarto lugar los datos puntuales (ciudades) y lineales (ríos) pueden ser una generalización

a escala de datos en realidad zonales

Page 7: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 7

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

4.- TRATAMIENTO DE DATOS. CLASIFICACIÓN

El primer paso en el proceso cartográfico es decidir una jerarquía para las clases a cartografiar, así como el modelo de distribución que se tomará Tras estas decisiones básicas se puede proceder a valorar una serie de cuestiones relacionadas con los datos:

o Homogeneizar los datos estadísticos, si se obtienen de distintas fuentes para tener valores comparables.

o Depurar las estadísticas para eliminar datos innecesarios. o Convertir los datos para poderlos utilizar en la elaboración cartográfica como índices,

rendimientos por hectárea, densidades, porcentajes, etc. debiéndose calcular antes de proceder al diseño del mapa.

o Clasificación de los datos en intervalos de clase.

Page 8: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 8

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

5.- CONCEPTOS BÁSICOS DE ESTADÍSTICA

La estadística descriptiva (en los últimos años también llamada “Análisis de Datos”) está compuesta por una serie de técnicas orientadas a extraer información de un conjunto de datos, mediante determinadas medidas que resumen los principales rasgos de la distribución de frecuencias de ese conjunto de datos. La estadística inferencial, por su parte, tiene por objeto la verificación de inferencias acerca de los parámetros de la población o del colectivo de objetos a analizar a partir de una muestra o subconjunto de elementos conocidos. En nuestro caso, aplicaremos la estadística descriptiva para el análisis de las diferencias espaciales entre unidades territoriales (divisiones administrativas o cualquiera de las variables con una distribución espacial dada) y a la elaboración de cartografía temática. Conviene iniciar este apartado diferenciando inicialmente las variables geográficas en función de su naturaleza: cualitativas y cuantitativas. Las primeras son aquellas que clasifican a los individuos geográficos en función de una categoría o etiqueta (agrupación de municipios según comarcas, provincias o comunidades autónomas de pertenencia, usos de suelo, unidad geológica, etc.). Las variables cuantitativas aplican una unidad de medida a todos los objetos o individuos, de manera que es posible diferenciarlos por valores concretos y precisos.

Page 9: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 9

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

Población: Conjunto de todos los objetos en los que se quiere estudiar un determinado carácter Muestra: Subconjunto o cierto número de objetos de una población. Utilizado en caso de

poblaciones muy grandes Estadística inferencial o inductiva: El análisis de una muestra permite inferir resultados de toda la

población Estadística descriptiva: Analizar o describir un conjunto de datos correspondientes a una población o a una muestra

Representatividad de la muestra. Muestreos

• Los mapas cualitativos se hacen representando en ellos valores de dos tipos: • Absolutos • Relativos. Mapas que muestran los datos en forma absoluta: los valores se muestran tal y como se toman: producción o el consumo de bienes, población, las elevaciones de la superficie terrestre sobre el nivel del mar, etc. Se muestran sobre el mapa en términos absolutos. Mapas que representan valores relativos: expresan algún tipo de resumen o alguna clase de relación entre dos o más juegos de datos: densidad de población, los ingresos per cápita, la tasa de paro

POBLACIÓN Y MUESTRA

DATOS ABSOLUTOS Y DATOS RELATIVOS

5.- CONCEPTOS BÁSICOS DE ESTADÍSTICA

Page 10: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 10

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

5.- CONCEPTOS BÁSICOS DE ESTADÍSTICA

Las tablas estadísticas permiten conocer el número de veces que se repite un fenómeno. En su nivel más desagregado se trata de un listado de valores, que muestra la distribución de valores de la variable representada. Sobre estos datos realizaremos después las operaciones encaminadas a calcular las medidas estadísticas básicas. Con el fin de reducir la presentación de los datos y poder elaborar una representación de cartográfica de los mismos es habitual agrupar los valores en clases y presentar la frecuencia de las mismas (número de unidades territoriales que se incluyen en cada clase), estos datos se presentan en una tabla de frecuencias. Como ejemplo, tomando la distribución de la renta a nivel provincial es posible agrupar los valores principales en intervalos iguales y presentar el número de provincias en cada uno de ellos. Es decir, presentamos las frecuencias absolutas (repeticiones) de cada una de esas clases (siguiente tabla). Es habitual presentar estás las frecuencias de forma porcentual, frecuencias relativas o porcentuales, que se calculan dividiendo las frecuencias absolutas por el total de observaciones (multiplicando por 100 en las porcentuales). Estas últimas permiten ver el peso de cada clase sobre el total.

TABLAS ESTADÍSTICAS. FRECUENCIAS

Número de provincias según PIB por habitante: intervalos iguales, frecuencias absolutas y relativas.

El número de provincias según intervalos representa la frecuencia de la distribución y la frecuencia relativa se obtiene como el porcentaje de la frecuencia absoluta de cada clase sobre el total de provincias.

Page 11: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 11

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

5.- CONCEPTOS BÁSICOS DE ESTADÍSTICA

La tabla de frecuencias para una variable cualitativa o nominal presenta el número de casos en cada una de las categorías posibles. Para elaborar una tabla de frecuencias en el caso de las variables cuantitativas en necesario establecer antes las clases o grupos. El número de clases es variable, estando en función del número de observaciones. Algunos autores proponen que una distribución de frecuencias debe tener un número de clases no inferior a 6 y superior a 20. Otros han propuesto algunas formulaciones para establecer el número de clases a partir del número de observaciones ,la más famosa es la de Huntesberge lo estima con la formula :

𝑘𝑘 = 1 + 3,3 log𝑛𝑛 10 siendo “n” el número de observaciones. En realidad, no existe una regla fija, lo más recomendable es establecer el número de intervalos después de una buena observación de los datos. Para establecer los límites de las clases se parte del rango de la variable, que se obtiene como la diferencia entre el valor máximo y el mínimo. Dividiendo el rango de la variable por el número de clases se obtiene el ancho de cada una de las clases, de manera que pueden calcularse los límites entre estas. Se conoce como marca de clase o punto medio al valor que representa la mitad de cada clase establecida.

TABLAS ESTADÍSTICAS. FRECUENCIAS

Page 12: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 12

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

5.- CONCEPTOS BÁSICOS DE ESTADÍSTICA

Cuando se analiza la distribución de una variable en el tiempo se habla de series temporales. De esta manera, el tiempo sirve de referencia y una variable se observa y analiza en función del mismo. Para la descripción de una serie temporal es frecuente la elaboración de números índice. Se trata de igualar un año base a un valor (normalmente 100) y analizar la evolución por comparación con el valor para ese año base:

TABLAS ESTADÍSTICAS. FRECUENCIAS

𝑙𝑙𝑥𝑥𝑥𝑥 =𝑋𝑋𝑙𝑙𝑋𝑋1

Donde: 𝑙𝑙𝑥𝑥𝑥𝑥 = 𝑒𝑒𝑒𝑒 𝑒𝑒𝑙𝑙 𝑣𝑣𝑣𝑣𝑙𝑙𝑣𝑣𝑣𝑣 𝑑𝑑𝑒𝑒𝑙𝑙 í𝑛𝑛𝑑𝑑𝑛𝑛𝑛𝑛𝑒𝑒 𝑝𝑝𝑣𝑣𝑣𝑣𝑣𝑣 𝑒𝑒𝑙𝑙 𝑣𝑣𝑎𝑣𝑣 𝑛𝑛. 𝑋𝑋𝑥𝑥 = 𝑒𝑒𝑒𝑒 𝑒𝑒𝑙𝑙 𝑣𝑣𝑣𝑣𝑙𝑙𝑣𝑣𝑣𝑣 𝑑𝑑𝑒𝑒 𝑙𝑙𝑣𝑣 𝑣𝑣𝑣𝑣𝑣𝑣𝑛𝑛𝑣𝑣𝑣𝑣𝑙𝑙𝑒𝑒 𝑒𝑒𝑛𝑛 𝑒𝑒𝑙𝑙 𝑣𝑣𝑎𝑣𝑣 𝑛𝑛. 𝑋𝑋1 = 𝑒𝑒𝑒𝑒 𝑒𝑒𝑙𝑙 𝑣𝑣𝑣𝑣𝑙𝑙𝑣𝑣𝑣𝑣 𝑑𝑑𝑒𝑒 𝑙𝑙𝑣𝑣 𝑣𝑣𝑣𝑣𝑣𝑣𝑛𝑛𝑣𝑣𝑣𝑣𝑙𝑙𝑒𝑒 𝑒𝑒𝑛𝑛 𝑒𝑒𝑙𝑙 𝑣𝑣𝑎𝑣𝑣 𝑑𝑑𝑒𝑒 𝑣𝑣𝑒𝑒𝑟𝑟𝑒𝑒𝑣𝑣𝑒𝑒𝑛𝑛𝑛𝑛𝑛𝑛𝑣𝑣

Evolución de la población en la región centro. Absoluta y número índices respecto a la situación de 1991

Page 13: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 13

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

5.- CONCEPTOS BÁSICOS DE ESTADÍSTICA

FRECUENCIAS ACUMULADAS

La distribución de frecuencias presentarse de forma acumulada. Si los valores no han sido agrupados en clases las frecuencias acumuladas se corresponden al número de observaciones con valor igual o inferior al considerado. Cuando los datos se presentan agrupados en clases, éstas son ordenadas desde las de valores inferiores a los mayores, y para cada clase las frecuencias absolutas acumuladas se corresponden con el número de observaciones en esa clase y las inferiores. Es habitual presentar los datos de frecuencias acumuladas porcentuales, de manera que se presentan el porcentaje de unidades incluidas en cada clase y en las clases de orden inferior a las mismas.

Distribución del PIB por habitante provincial: frecuencias absolutas acumuladas y porcentuales

Page 14: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 14

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

5.- CONCEPTOS BÁSICOS DE ESTADÍSTICA

REPRESENTACIÓN GRÁFICA. DIAGRAMAS DE BARRAS

Un diagrama de barras permite representar la importancia cuantitativa de las diferentes categorías de una variable cualitativa. De esta forma, mediante el diagrama de barras es posible representar la distribución de usos del suelo en un determinado espacio a partir de la superficie que estos ocupan, o la importancia de los parque naturales de una determinada comunidad autónoma a partir del número de municipios que los integran o nuevamente de su superficie total.

El histograma de frecuencias se construye con un eje vertical que representa la frecuencia absoluta o relativa y un eje horizontal para las clases, que son definidas por su intervalo y su punto medio o marca de clase. En el histograma de frecuencias las barras están contiguas, pues implican diferencias cuantitativas entre ellas. El polígono de frecuencias aprovecha el mismo material que el histograma pero tomando no una barra sino una línea poligonal como esquema de representación. Para ello se define como identificador de cada barra el punto medio de la misma (o marca de clase) y como valor el que corresponde con la frecuencia.

Un diagrama de sectores (conocido frecuentemente como un gráfico de tarta) se basa en la misma idea que un diagrama de barras o un gráfico de frecuencias. Puede usarse indistintamente para variables cualitativas o cuantitativas. Su representación hace equivaler la frecuencia de las categorías o de las clases establecidas de forma proporcional al área de una circunferencia

Page 15: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 15

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

MEDIDAS DE CENTRALIDAD. PROMEDIOS

Los promedios constituyen probablemente el tipo más común de variables derivadas empleadas, ya que utilizan una cualidad o cantidad seleccionada para caracterizar una serie de datos que normalmente son numerosos. Existen muchos tipos de promedios, pero en términos generales, en cartografía interesan principalmente tres de ellos que son, la media aritmética, la mediana y la moda.

La mayoría de los mapas de clima, ingresos, producción, y otros elementos tratados en el estudio del carácter físico y humano de las regiones se basan en medias aritméticas obtenidas mediante la reducción de grandes cantidades de datos estadísticos.

En cartografía a menudo la media debe considerarse en función de una superficie. Si se da la misma importancia a todas las regiones se falsea el promedio de las comunidades, por lo que siempre que los valores(x) en una distribución estén relacionados de cualquier modo con una extensión de superficie, éstos deben considerarse en función de su frecuencia superficial.

La expresión general para cualquier media considerada en función del área es, por lo tanto:

xs=Sa x/A

Donde Sa x representa la suma de los productos de cada valor x por su superficie y A es la superficie total. La media considerada en función de la superficie también se denomina media geográfica

LA MEDIA ARITMÉTICA

Page 16: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 16

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

Si ordenamos todos los valores que toma una variable desde el inferior hasta el superior, la mediana es el valor situado en el centro, de forma que la mitad de los valores serán superiores y la otra mitad inferiores a dicho valor. Es otro tipo de medida relativa de la tendencia central, utilizable por ejemplo en un mapa que represente, en este caso, la mediana de los valores de tierra de cultivo por hectárea en cada provincia, obtenida a partir de los datos municipales.

Al igual que en el caso anterior, si las regiones varían muchísimo en cuanto a extensión, debe considerarse la mediana en función de la superficie. Haciéndolo así, la mediana geográfica será el valor por encima y por debajo del cual se halla la mitad de la superficie total. El valor de la mediana geográfica es aquel cuya superficie acumulada asociada, resulta igual a la mitad de la superficie total

Es el valor que presenta mayor frecuencia o mayor área

En caso de variables clasificadas en intervalos, tendremos el intervalo modal como el que presenta mayor frecuencia

Calculo de la moda. Datos agrupados por intervalos

INTERVALOS FRECUENCIA

4-6 1

7-9 2

10-12 3

13-15 3

16-18 6

19-21 7

22-24 4

25-27 3

28-30 2

31-33 1

LA MEDIANA

LA MODA

Page 17: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 17

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

De las medidas de centralidad sobra decir que la media aritmética es la más utilizada, pues además de su fácil cálculo presenta una serie de propiedades importantes. Por un lado, la suma de las desviaciones de los datos respecto a la media es cero, por otro, si se suma o multiplica un valor constante a cada uno de los datos la media se mantiene constante sumándola o multiplicándola por ese valor. Sin embargo, la media está muy afectada por los datos extremos, y deja de representar bien a la distribución cuando hay valores que están lejos del resto de los datos. En estos casos es más valida la mediana, pues está menos afectada por la variabilidad de los datos. La figura siguiente muestra las posiciones de los estadísticos de centralidad en una distribución típica. Igualmente, la moda no suele verse afectada por variaciones fuertes en uno de los datos.

MEDIDAS DE CENTRALIDAD. CONCLUSIONES

Posición de la media, la mediana y la moda en una distribución de frecuencias

Page 18: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 18

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

Al igual que la mediana, los cuartiles se calculan ordenando los datos de menor a mayor, y buscando aquellos valores que dividen el conjunto de la distribución en cuatro partes iguales. Se denominan primer Q1, segundo Q2 y tercer Q3 cuartiles. Por lo tanto, Q1 deja por debajo el 25% de los datos y por encima el 75%, mientras Q3 deja por debajo el 75% de los valores y por encima el 25%. Lógicamente, Q2 coincide con la mediana. De lo anterior, se deduce que entre Q1 y Q3 hay un 50% de los datos.

OTRAS MEDIDAS DE POSICIÓN NO CENTRALES: CUANTILES, DECILES O PERCENTILES

De la misma manera, los valores que dividen al conjunto de datos en cinco partes iguales son llamados quintiles (Q1, Q2, Q3 y Q4 ), los que dividen al conjunto de datos en diez partes iguales son llamados deciles (D1, D2, … D9) y los que lo hacen en 100 partes iguales son llamados percentiles (P1, P2, … P9). Tanto los cuartiles como los deciles, percentiles u otros valores que subdividen el conjunto de datos en grupos con el mismo número de valores se llaman cuantiles.

Page 19: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 19

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

La figura presenta de forma gráfica las medidas de posición o cuantiles (ya sean cuartiles, quintiles, deciles y percentiles):

OTRAS MEDIDAS DE POSICIÓN NO CENTRALES: CUANTILES, DECILES O PERCENTILES

Page 20: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 20

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

MEDIDAS DE DISPERSIÓN

Las medidas de centralización proporcionan una información parcial de la distribución de la variable. El rango y los cuantiles proporcionan cierta información complementaria a las medias de centralización sobre la distribución de la variable. Sin embargo, es necesario completar esta información con medidas relativas a las desviaciones de los datos respecto a las medidas de centralización. Las dos medidas más usadas son la desviación típica y la varianza. La varianza se refiere a la media del cuadrado de las diferencias de los valores con la media. La formulación es la que sigue:

𝜎𝜎2 = ∑ (𝑥𝑥𝑖𝑖−𝑥𝑥)𝑛𝑛𝑖𝑖=1

𝑁𝑁*fi

Los valores de las diferencias respecto a la media se elevan al cuadrado pues como vimos una de las propiedades de la media es que la suma de las desviaciones es 0. Al elevar los valores al cuadrado, estos toman siempre valores positivos, y cuando los valores son altos y las desviaciones grandes la varianza será grande. Para reducirla, se utiliza la desviación típica, que se obtiene como la raíz cuadrada de la varianza

Page 21: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 21

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

COEFICIENTES DE DISPERSIÓN

Cualquier distribución pueden ser caracterizado, por tanto, a partir de la media y la desviación típica. De esta forma, ambas medidas son usadas con frecuencia para comparar las diferencias de las distribuciones de una variable en dos espacios diferentes o la evolución de una misma variable en distintos momentos temporales. Sin embargo, para comparar la variabilidad de datos que tienen distintas unidades se utiliza el coeficiente de variación de Pearson. Este se calcula como el porcentaje del cociente de la desviación típica entre la media, y tiene la ventaja de no poseer unidades, lo que permite comparar la dispersión entre datos de distinta naturaleza:

𝐶𝐶𝐶𝐶 = 𝜎𝜎�̅�𝑥

*100

Page 22: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 22

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

Otra clase de cantidad relativa es la consistente en medidas como razones o índices, proporciones y porcentajes, en las que algo se mide por unidades de otro elemento, o en las que algún elemento de los datos se individualiza para compararlo con el resto. Los mapas que representan el porcentaje de días de lluvia, la proporción de ganado vacuno dentro de la ganadería en general, las tasas o índices de mortalidad, o la tasa de crecimiento o decrecimiento de algún fenómeno son algunos ejemplos. En este grupo el valor numérico representado en el mapa será normalmente el resultado de una de las siguientes operaciones:

La razón es una expresión de relación entre datos que se expresa de la forma fa/fb, en donde fa es la frecuencia de una clase a y fb es la frecuencia o número de elementos de otra clase b. Como ejemplo podemos considerar la razón de sexos de una pequeña población. Saber que existen 3000 hombres da una idea al respecto, pero si además se sabe que el número de mujeres es de 1500 la idea cambia y vemos que la razón es de dos hombres por mujer

La proporción es la razón entre la frecuencia de una clase (fa para la clase a) y el total (fa/N) siendo N la frecuencia total. En el ejemplo anterior, la proporción de hombres es de 3000/4500, es decir de 0,66

INDICES

RAZÓN O ÍNDICE

PROPORCIÓN

Page 23: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 23

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

Normalmente las proporciones se dan multiplicadas por 100, o lo que es lo mismo en porcentajes. En este caso decir que el 66% de la población son hombres, es más sencillo y fácil de entender que hablar de una proporción de hombres de 0,66. También estas estadísticas presentan a veces las características de un promedio espacial. Este tipo de razones son la base del concepto de densidad que se trata más adelante. Una razón típica de la geografía es la de densidad de población, definida como el número de habitantes por kilómetro cuadrado o por otra unidad superficial. Si el área de la población anterior es de 10 kilómetros cuadrados, la densidad de población sería de 4500/10, es decir de 450 hab/km2.

La cartografía de este tipo de cantidades relativas se elabora para mostrar las variaciones de un lugar a otro de la realización definida, y normalmente se prepara a partir de resúmenes de datos estadísticos. Cuando los porcentajes, razones y tasas se simbolizan en unos límites, el usuario supone que el valor representado se extiende de modo más o menos uniforme a través de dicha unidad.

INDICES

PORCENTAJE

Page 24: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 24

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

Las densidades se utilizan cuando lo que se quiere reflejar es la acumulación o escasez geográfica relativa de datos discretos. Se calcula dividiendo el dato por la superficie en la que se encuentra, pero en muchos casos este valor no es tan significativo como el que expresa la razón entre otros factores que están más estrechamente relacionados. Por ejemplo, la relación entre número de personas y superficie productiva en sociedades predominantemente agrícolas. Esta relación se considera más útil que lo es el simple cálculo de la población con respecto al área total, productiva o no.

Al trabajar con densidades el cartógrafo está limitado en el detalle que puedan presentar los tamaños de las unidades de enumeración (municipios, regiones o países).

Otra categoría de cantidades relativas son las potenciales (o criterio de gravedad), que también se utilizan en mapas, y que supone que los elementos de una distribución (personas o precios por ejemplo) influyan entre sí directamente con las magnitudes del fenómeno e inversamente con la distancia entre sus ubicaciones. De este modo el valor del potencial en un punto, es la suma de la influencia de todos los demás puntos sobre él, más su propia influencia

DENSIDADES

INDICES

Page 25: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 25

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

A menudo los datos que se representan en un mapa son demasiado numerosos por lo que se presentan categorizadas, en clases ordenadas y con diferencias cuantitativas expresas, de modo que se agrupan en función de que tengan menos de 25.000 habitantes o de 25.000 a 100.000 y así sucesivamente hasta alcanzar el máximo, o la ciudad más habitada.

La forma de categorizar las poblaciones anteriores es desde luego arbitraria, en el sentido de que los límites pueden ser cualesquiera, aunque siempre se debe buscar la forma más representativa de mostrar la distribución que se trate, siendo decisivo al emplear la técnica coroplética, donde se verá que hay que resumir en un número de clases reducido el total de los datos que hay que representar.

Son dos las decisiones fundamentales a tomar al clasificar los datos; por un lado el número de clases a representar y por otro los límites de cada uno de los intervalos. Cada subdivisión de datos estadísticos en intervalos de clase puede ser comparada con un proceso de generalización, asumiendo que esta generalización afecta a la superficie estadística correspondiente, uniformizando sus irregularidades

CLASIFICACION DE LOS DATOS EN INTERVALOS DE CLASE

Page 26: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 26

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

LA SUPERFICIE ESTADÍSTICA

Una superficie estadística es la superficie formada al asignar a cada punto del territorio (x,y), una z proporcional al valor que toma una variable cuantitativa en dicho punto.

EL NÚMERO DE CLASES

El número de clases es función del detalle necesario para mostrar adecuadamente el contenido temático, pero viene limitado por aspectos perceptivos. Hay que buscar un punto de equilibrio según cada caso particular.

LOS LÍMITES DE CLASE

Una vez decidido el número de clases que se van a emplear en una representación, el siguiente paso es establecer por dónde se realizarán los cortes en la distribución. Los sistemas que se pueden emplear son muy numerosos.

Como guía general a seguir, se deben buscar límites que reduzcan al mínimo las diferencias entre los datos de una misma clase y que a su vez hagan máximas las diferencias entre clases.

CLASIFICACION DE LOS DATOS EN INTERVALOS DE CLASE

Page 27: Tema 3 Tratamiento de Datos.clasificacion

Cartografía Temática y Topografía Subterránea Página nº 27

Tema 3 “TRATAMIENTO DE DATOS”

TRATAMIENTO DE DATOS

La clasificación de datos en intervalos es un proceso de generalización que afecta a la superficie estadística correspondiente, donde se uniforman sus pequeñas irregularidades. No obstante se deben intentar mantener los rasgos más destacados de cada distribución, de modo que si entre los datos existe alguno excepcional, éste debe constar como tal en el mapa.

Se debe intentar seleccionar las clases de manera que se mantengan las características más significativas de la distribución, abarcando todo el rango de datos y sin que existan claves vacías. Asimismo resulta conveniente dividir los datos en grupos de números de observaciones razonablemente similares, así como buscar una relación lógica en los tamaños de los intervalos pues facilitará la lectura.

Una progresión aritmética será adecuada cuando la gráfica de la distribución del conjunto de datos se asemeje a una progresión aritmética, y lo mismo ocurriría con las progresiones geométricas, que serán aplicables cuando la gráfica tienda a mostrar una progresión geométrica

Los puntos de ruptura de la distribución nos proporcionarán grupos de valores homogéneos, lo que sin duda es deseable, y su utilización será interesante cuando dichas rupturas queden claramente definidas. Además este sistema puede utilizarse junto con algún otro sistema de clasificación.

Vistos los distintos tipos de clasificación para un mismo conjunto de datos, sólo queda ver cuál de ellos es el que mejor se adecua a la distribución real de los mismos. La más parecida al modelo real es la correspondiente a la mejor clasificación para el conjunto de datos

CONCLUSIONES