CARTOGRAFÍA ESTADÍSTICA2

download CARTOGRAFÍA ESTADÍSTICA2

of 23

Transcript of CARTOGRAFÍA ESTADÍSTICA2

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    1/23

    Grupo 1: Clases de iguales intervalos

    Intervalo para n clases:

    Clase 1: Mnimo -> Mnimo+Ic

    Clase 2: Mnimo+Ic -> Mnimo+(2*Ic)

    Clase i:

    Clase n: Mnimo+((n-1)*Ic) -> Mnimo+(n*Ic) o Mximo

    IMximo Mnimo

    nc

    Desventaja:muy sensible a los valores extremos

    Con una distribucin asimtrica o que presenta discontinuidades, algunas clases

    pueden ser vacas y provocar una concentracin en pocas clases.

    Ventaja:

    Facilidad de clculo y de interpretacin.

    Muy til cuando la variable se extiende de 0 a 100 o segn valores extremos

    conocidos.

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    2/23

    Grupo 1: Progresin aritmtica

    Para n clases, se calcula la razn de la progresin de manera que:

    Clase 1: Mnimo -> Mnimo+A Clase 2: Mnimo+A -> Mnimo+(2*A)

    Clase i:

    Clase n: Mnimo+((n-1)*A) -> Mnimo+(n*A)

    Mismas d esventajas

    Ventajas:permite tener ms clases en los pequeos valores, cuando la

    distribucin es asimtrica.

    Mximo Mnimo A A A nA

    A Mximo Mnimo

    n

    2 3

    1 2 3

    ...

    ...

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    3/23

    Grupo 1: Progresin geomtrica

    Para n clases, se calcula la razn de la progresin de manera que:

    Clase1: Mnimo -> Mnimo*G

    Clase 2: Mnimo*G -> Mnimo*G2

    Clase i:

    Clase n: Mnimo*G(n-1) -> Mnimo*Gn

    Este mtodo propone clases an ms finas en los pequeos valores. Corresponde

    a la discretizacin con iguales intervalos aplicada a una serie de valores

    transformados con la funcin logartmica.

    Esto supone que el mnimo no sea 0.

    Mximo Mnimo G

    G Mximo

    Mnimo

    o

    Log G Mximo Mnimo

    n

    n

    n

    1010 10log log

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    4/23

    Densidad total 1992: mapa con los tres tipos dediscretizacin Ctrl E, Ctrl A, Ctrl G

    Densidad total 2001. idem

    Idem con densidad rural

    Conclusin ?

    Mirar el histograma

    EJ1.CAT

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    5/23

    Grupo 1: Ut il izac in de es tos mtodos

    1. Verificar que la distribucin no presenta una fuerte asimetra, valores demnimo y mximo demasiados particulares o discontinuidades en ladistribucin.

    2. Si la distribucin es aproximadamente normal o uniforme, utilizar losiguales intervalos. En el segundo caso, se aproximar una discretizacin

    por cuantiles.

    3. Si la distribucin presenta una fuerte asimetra en los pequeos valores,o discontinuidades en los grandes valores, utilizar la progresinaritmtica.

    4. Si, adems de la asimetra, la distribucin se acerca de un modelo log-normal, utilizar la progresin geomtrica.

    5. Progresin aritmtica y geomtrica pueden ser utilizadas tambincuando se trata de mostrar fenmenos particulares que se distribuyennaturalmente de manera muy desigual, por ejemplo la densidad de lapoblacin.

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    6/23

    Grupo 2: Clases segn cuantiles

    Este mtodo calcula los limites de clase de manera quecada clase tenga el mismo nmero de observacin.

    Nmero de observacin en cada clase:

    (Nt: Nmero total de observacin, n: nmero de

    clases) La serie de datos est ordenada en orden creciente. Se

    establece los limites de clase contando m observacin ytomando el valor de la m observacin.

    Si n=4, los los limites son los cuartiles. Si n=10 sonpercentiles, etc.

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    7/23

    Desventaja: Se puede que cada clase no tenga exactamente el mismo nmero de individuos,

    porque pueden existir varias observaciones con el mismo valor.

    Puede ser difcil establecer los limites de clase en el caso de series muydiscontinuadas.

    Tambin si existen valores muy particulares a los extremos, los lmites de clasesestarn difcil de interpretar. En este caso, suele tomar como clases extremas lospercentiles 5 y 95.

    Ventaja: Este mtodo funciona con cualquier tipo de distribucin, que sea normal o no.

    Es completamente independiente de los valores; y no depende de los valoresextremos.

    La discretizacin permite una comparacin entre diferentes series, con comparacindel orden de las observaciones de la distribucin..

    Considerando que cada clase tiene el mismo nmero de individuos, la entropa esmxima. Es decir que es la discretizacin que trae el mximo de informacin, y quepermite la mejor lectura grfica del mapa.

    Los lmites de clase son valores reales.

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    8/23

    Grupo 2: Clases segn media y desv iacin

    es tndar .

    Se calcula la media (m) y la desviacin estndar (s).

    Se calcula los limites de clases de manera a tener la misma extensin de una

    desviacin estndar.

    Nmero par de clases Nmero impar

    Clase 1: (m-1s)

    Clase 3: (m-0.5s) -> (m+0.5s) Clase 3: (m-1s) -> m

    Clase 4: (m+0.5s) -> (m+1.5s) Clase 4: m -> (m+1s)

    Clase 5 > m+1.5s Clase 5: (m+1s) -> (m+2s)

    Clase 6 > m+2s

    Este mtodo calcula los limites de clases segn una fraccin de ladesviacin estndar. Se supone que la distribucin sigue un modelo normal,o que se ha hecho una transformacin de los datos de manera que ladistribucin se acerque a un modelo normal.

    Ventaja:

    Permite la comparacin entre variables muy disimilares porque la comparacin se hace a partir de

    variables de origen comn (media) y de unidad de medida similar (desviacin estndar), a

    condicin de tener una distribucin normal.

    A veces es necesario subdividir ms las clases cerca de la media e incluir en una sola clase losvalores extremos que salen del intervalo de confianza.

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    9/23

    Grupo 2: - Medias encajadas

    La media aritmtica

    separa una

    distribucin en dos

    grupos y constituye

    un punto de

    equilibrio en ladistribucin.

    Tambin, por cada

    grupo se puede

    calcular la media

    que sera el punto de

    equilibrio de estosgrupos.

    Con este mtodo se

    puede tener

    solamente 4 o 8

    clases.

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    10/23

    Ventajas:

    Construye las clases segn la diferencia que existeentre las medias aritmticas.

    Si la distribucin no presenta demasiados valoresextremos, se acerca de la discretizacin de los cuantiles.

    Si la distribucin es muy asimtrica, se acerca de ladiscretizacin de la progresin geomtrica.

    Desventajas:

    Si hay clases con poco nmero de observacin, lamedia no tiene sentido, sobretodo si eso ocurre cerca delos valores extremos.

    El nmero de clases no se puede cambiar, siempre ser4 o 8.

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    11/23

    Grupo 2: - Mtodo de Jenks o de

    anlis is de la varianza.

    Este mtodo propone, sobre base de un anlisis de la varianza,

    minimizar la varianza dentro de cada clase, y maximizar la varianza

    entre las clases.

    Los datos se ordenan por valor creciente.

    Se buscan todos los grupos que se pueden constituir con k clases.Por cada configuracin, se calcula la varianza dentro de los grupos, y la

    varianza entre los grupos.

    Se hace una comparacin entre estos valores y se toma la configuracin que

    minimiza la varianza dentro de los grupos, y maximiza la varianza entre los

    grupos.

    Ventajas:

    Este mtodo es el mejor del punto de vista estadstica porque constituye grupos con

    mxima homogeneidad y busca una mxima heterogeneidad entre los grupos.

    Los lmites de clase son valores reales de la distribucin.

    Desventaja:

    Cada configuracin da clases muy diferentes

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    12/23

    Grupo 2: - Equ iprobab i lidades.

    Este mtodo se basa en la distribucin terica de las probabilidades

    de las frecuencias asociadas a una distribucin normal.

    La distribucin de frecuencia adoptada es una equireparticin con el

    mismo nmero de observacin en cada clase.

    El nmero de observacin es calculado como:

    E=Nmero total de observacin / Nmero de clases.

    Se utiliza la tabla de las probabilidades de una ley normal para buscar la

    probabilidad de tener E observacin en cada clase. Estos valores tericos

    corresponden a valores centradas y reducidas.

    Se usa la media y la desviacin estndar de la distribucin para calcular los

    limites de clase.

    Ventajas:

    Si la distribucin es normal, se cumula las ventajas del mtodo de los cuantiles y de la

    desviacin estndar. Frecuencias y probabilidades son similares.

    Si la distribucin no es normal, el nmero de observacin en cada clase no es constante y la

    diferencia indica la distancia entre las dos distribuciones.

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    13/23

    % Poblacin rural: ver el histograma e intentar realizar

    un mapa

    Conclusin ?

    EJ1.CAT

    EJ2.CAT

    Variable %Joven 2001: hacer los cinco mapas: Ctrl Q, Ctrl P,

    Ctrl J, Ctrl S, Ctrl M

    Por cada mapa mirar el men Estadsticas /

    Estadsticas descriptivas

    Tomar notas y hacer un recapitulativo

    Conclusin ?

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    14/23

    Comparacin de los criterios estadsticos

    Normalidad Redundencia Intra/Inter

    Quantiles 0.128 0.000 0.079

    Probabilidades 0.134 0.008 0.081

    Jenks 0.166 0.069 0.052

    Estndar 1 0.259 0.083

    Medias 0.191 0.009 0.124

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    15/23

    Conclusin

    Ratio entre la varianza entre las clases y la varianza dentro delas clases (Anlisis de varianza): Cuanto ms este ndice espequeo, ms la clasificacin es significativa, es decir, granhomogeneidad de las clases y gran diferencia entre clases.

    En nuestro caso ?

    Examinando los mapas: Similaridad y analysis de loshistogramas. ,

    La ventaja de estos mtodos, particularmente de la

    equiprobabilidad, de las medias encajadas y del estndar,reside en la posibilidad de hacer una representacin grficapor media de una gama de colores en oposicin, de amboslado de la media o de la mediana. En el caso del mtodo delestndar, la eleccin de un nmero impar de clases permitetener una clase promedio que representa los valores alrededorde la media.

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    16/23

    Grupo 3: Curva Cl inogrfica

    Este mtodo permite escoger los limites de clase de una variable a partir de la

    distribucin de otra variable. Un caso tpico es la distribucin de la

    poblacin con respecto a la superficie de cada unidad espacial. Otro caso

    puede ser la distribucin de un carcter de una poblacin con respecto a la

    distribucin de esta poblacin.

    Para realizar esta curva, es necesario:

    Ordenar la variable principal X por valor creciente

    Calcular el valor cumulado de la variable Y

    Calcular el % cumulado de la variable Y

    Se construye la curva poniendo en abscisa la variable X (en el ejemplo el

    analfabetismo de los productores agrcolas) y en ordenado la variable Y

    cumulada (por ejemplo la poblacin de los productores)..

    Se toma los limites de clase leyendo en la curva el porcentaje (100/k)

    correspondiendo a k clases.

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    17/23

    Ventajas: Permite incluir en la discretizacin la cantidad de una variable de

    ponderacin. En general se utiliza la superficie o la poblacin.

    En el caso de la superficie, cada clase, es decir cada color del mapa,representa la misma superficie.

    Se puede estudiar tambin la relacin que existe en dos variablesrelacionadas. En el ejemplo, existe una parte de la curva que muestra unaproporcionalidad entre la tasa de analfabetismo y el nmero cumulado deproductores. Es decir tambin que la clase con menos tasa representa elmismo peso que la clase con ms analfabetismo. El estudio de la forma dela curva da algunas caractersticas de la distribucin geogrfica de lavariable.

    EJ2.CATMapa clinogrfica del % de joven y % de viejos:

    Comparacin de los mapas y de los histogramas

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    18/23

    Grupo 3: Usuario o histograma

    A partir del mapa de los viejos: Ctrl U y

    precisar los valores.

    Mostrar el histograma en tipo bigote y con

    el men modif, modificar las clases

    EJ2.CAT

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    19/23

    Pruebas de significacin de una

    discretizacin

    La discretizacin optima no existe. Cada discretizacin dar un mapadiferente ms o menos conforme a la distribucin de los datos. Eso por dosrazones:

    La agrupacin de datos en clases, es decir la reduccin de la informacintil, introduce un error o una distorsin en la percepcin de estadistribucin.

    El modelo de distribucin de los datos interviene en la eleccin de unmtodo de discretizacin. Esto introduce hiptesis que necesitan pruebas.

    Tres parmetros permiten escoger una discretizacin.

    Si se trata de un solo mapa o de un grupo de mapas que se necesitacomparar;

    Si se trata de probar una hiptesis de distribucin

    Si la distribucin se conforma a un modelo particular.

    Cada vez, es necesario probar la significacin de las clases escogidas, yasea por medio de un anlisis de varianza, o por medio de la comparacinde las medias de cada grupo.

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    20/23

    Distribucin de la frecuencia

    Simtrica Simtrica Asimtrica Asimtrica Uniforme No uniforme

    Pequea escalaGrande

    escalaPequea escala

    Grande

    escala

    Err or mnim o

    Iguales

    intervalos

    Estndar

    Medias

    encajadas

    Histograma

    Homogeneidad

    de las clases

    Iguales

    intervalos

    Estndar

    Jenks

    Medias

    encajadas

    Jenks

    Jenks

    Tranformacin de

    los datos

    Medias

    encajadas

    Mapas

    independientesEn tr opa mxim a

    Equi-

    Probabilidades

    Quantiles

    Quantiles

    Clinogrfico

    Quantiles

    Clinogrfico

    Equi-

    Preservacin de

    la estruct ura

    espacial

    Distanciacumulada

    Quantiles

    Clinogrfico

    Iguales intervalosTransformacin de

    los datos

    Jenks

    Histograma

    Clinogrfico

    Err or m nim o y

    hom ogeneidad de

    las clases

    Estndar

    Jenks

    Estndar

    Transformacin de

    los datos Jenks

    Serie de mapas En tr opa mxim aEqui-

    Probabilidades

    Equi-

    Probabilidades

    Preservacin de

    la estruct ura

    espacial

    Distancia

    cumulada

    Medias

    enca adas

    Distancia

    cumulada

    Medias encajadas

    Quantiles

    Equi-

    Probabilidades

    Histograma

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    21/23

    FAMILIA MTODO NOTA

    Intuitivo ..Intuicin y experiencia

    del autor

    Requiere un buen conocimiento de la variable estudiada.

    No permite la comparacin

    Exgeno ..Segn una referencia

    externa a la distribucin

    Exclusivamente para hacer comparacin con base a un

    valor de referencia

    Matemtica Iguales intervalosLas clases tiene n lamism a magnitud

    Eficaz con una distribucin uniforma. No permite

    comparacin. Incorrecto en caso de una distribucinasimtrica

    Progresin

    aritmtica

    Los intervalos de las

    clases aumentan delmnimo al mximosegn una progresinaritmtica (Aditivo)

    Eficaz con una distribucin asimtrica en los pequeos

    valores, donde da clases ms detalladas.

    Progresin

    geomtrica

    Los intervalos de las

    clases aumentan delmnimo al mximosegn una progresingeomtrica(Multiplicacin)

    Eficaz con una distribucin asimtrica en los pequeos

    valores, donde da clases ms detalladas.

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    22/23

    FAMILIA MTODO NOTA

    Estadstica y

    Probabilidades Quantiles

    Cada clase tiene e l

    mismo mmero deindividuos. Ladistribucin no tieneque ser normal

    Clasificacin ordinal (Rango). Se utiliza con cualquier tipo

    de distribucin. No toma en cuenta los valoresparticulares

    Estandr

    El intervalo de la clasees proporcional a unafraccin de la desviacinestandr.

    Necesita una distr ibucin normal. Eficaz para hacer

    comparacin entre varias distribuciones.

    Medias encajadas

    Clculo de la media

    aritmtica. Clculo de lamedia del grupo bajo la

    me dia y del grupoencima de la media.... Eficaz para hacer comparacin. No necesita unadistribucin norm al

    Jenks

    Minimizacin de la

    variancia de un grupo ymaximizacin de lavariancia entre losgrupos (basado en laanlisis de variancia)

    No depende del tipo de distribucin. Da la mejor

    clasificacin pues todas las clases son significativas

    Iguales probabilidad

    Los intervalos son

    calculados con base auna distribucin tericanormal de parametro lamedia y la desviacin dela distribucin real.

    Necesita una distr ibucin normal. Es una com binacin

    del m todo de los quantiles y del mtodo es tandr.

  • 7/25/2019 CARTOGRAFA ESTADSTICA2

    23/23

    FAMILIA MTODO NOTA

    Grfica Histograma

    Busca de los intervalos

    sobre un histograma ouna curva de lasfrecuencias cumuladas

    Basado en rupturas del histograma. Mtodo intuitivo. No

    perm ite la comparacin

    Curva clinogrfica

    Basado en una curva de

    distancia o variablecumulada

    Quantile espacial. Perm ite corregir el efecto del tamao

    de las unidades espaciales.