Medidas de Centralidad y Dispersión

91
Unidad I. Conceptos Básicos y Estadística Descriptiva Prof. Eliana Guzmán U. Semestre A-2011

Transcript of Medidas de Centralidad y Dispersión

Page 1: Medidas de Centralidad y Dispersión

Unidad I. Conceptos Básicos y Estadística Descriptiva

Prof. Eliana Guzmán U.Semestre A-2011

Page 2: Medidas de Centralidad y Dispersión

Concepto de Estadística

Se refiere a un conjunto de métodos para manejar la obtención, presentación y análisis de observaciones numéricas. T

ema 1

. Intro

ducció

n

Page 3: Medidas de Centralidad y Dispersión

Concepto de Estadística

Sus fines son describir al conjunto de datos obtenidos y tomar decisiones o realizar generalizaciones acerca de las características de todas las observaciones bajo consideración.

Tem

a 1. In

troducció

n

Page 4: Medidas de Centralidad y Dispersión

Áreas que conforman a la Estadística

Estadística Descriptiva (Deductiva): es la encargada de la organización, condensación, presentación de los datos en tablas y gráficos y del cálculo de medidas numéricas que permitan estudiar los aspectos más importantes de los datos.

Tem

a 1. In

troducció

n

DESCRIBIRDESCRIBIR

Page 5: Medidas de Centralidad y Dispersión

Áreas que conforman a la Estadística

Estadística Inferencial o Inferencia Estadística: está definida por un conjunto de técnicas, mediante las cuales se hacen generalizaciones o se toman decisiones en base a información parcial obtenida mediante técnicas descriptivas.

Tem

a 1. In

troducció

n

INFERIRINFERIR

Page 6: Medidas de Centralidad y Dispersión

Áreas de Aplicación de la Estadística

El uso de la Estadística es muy amplio. Resulta difícil nombrar un área en la cual no se emplee.

Los métodos estadísticos han encontrado aplicación en: Gobierno Negocios Ciencias Sociales Ingeniería Ciencias Física y Naturales Control de Calidad Procesos de Manufactura Muchos otros campos de la actividad intelectual.

Tem

a 1. In

troducció

n

Page 7: Medidas de Centralidad y Dispersión

Áreas de Aplicación de la Estadística

Esto se debe a la creciente facilidad con la cual se pueden manejar grandes cantidades de datos numéricos, debido al uso de …

Tem

a 1. In

troducció

n

Page 8: Medidas de Centralidad y Dispersión

Conceptos de Población y Muestra

Población: es la colección de todas las posibles mediciones u observaciones que pueden hacerse de una variable bajo estudio.

Tem

a 1. In

troducció

n

Page 9: Medidas de Centralidad y Dispersión

Conceptos de Población y Muestra

Se clasifica en dos categorías: Finita: es aquella que incluye una

cantidad limitada contable de observaciones, individuos o medidas. Siempre que sea posible alcanzar (contar) el número total de todas las posibles mediciones, se considera como finita la población.

Tem

a 1. In

troducció

n

Page 10: Medidas de Centralidad y Dispersión

Conceptos de Población y Muestra

Infinita: es aquella que incluye un gran conjunto de observaciones o mediciones que no pueden alcanzarse por conteo. Al menos, hipotéticamente, no existe límite en cuanto al número de observaciones que el experimento puede generar.

Tem

a 1. In

troducció

n

Page 11: Medidas de Centralidad y Dispersión

Conceptos de Población y Muestra

Muestra: es un conjunto de mediciones u

observaciones tomadas a partir de una población.

es un subconjunto de la población. Tem

a 1. In

troducció

n

Page 12: Medidas de Centralidad y Dispersión

Conceptos de Población y Muestra

Muestra aleatoria: se considera aleatoria siempre y cuando cada observación, medición o individuo de la población tenga la misma probabilidad de ser seleccionado. T

ema 1

. Intro

ducció

n

Page 13: Medidas de Centralidad y Dispersión

Tipos de datos y escalas de medida

Variables: son las características o lo que se

estudia de cada individuo de la muestra. Ej: sexo, edad, peso, estatura, color de ojos, estado civil, temperatura, cantidad de nacimientos, presión, grosor, diámetro, ...

Datos: son los valores que toma la variable en

cada caso.

Tem

a 1. In

troducció

n

Page 14: Medidas de Centralidad y Dispersión

Tipos de datos

Cualitativos: son datos que solo toman valores asociados a las cualidades o atributos, clasificándolos en una de varias categorías, es decir, no son valores numéricos. Ej: Sexo: f/m. Hábito de fumar: Fumador/No fumador Color de ojos: negro, azul, marrón, … Religión: católica, evangélica, … Estado civil: soltero, casado, divorciado,…

Tem

a 1. In

troducció

n

Page 15: Medidas de Centralidad y Dispersión

Tipos de datos

Cuantitativos: provienen de variables que pueden medirse, cuantificarse o expresarse numéricamente. Ejemplos: Peso Edad Estatura Presión Humedad Intensidad de un sismo Cantidad de hermanos

Tem

a 1. In

troducció

n

Page 16: Medidas de Centralidad y Dispersión

Escalas de medida

Tipos de variables cuantitativas: Discretas: es aquella que solo puede

tomar un número finito o infinito numerable de valores. Ejemplo: cantidad de hermanos.

Continuas: es la variable que puede tomar cualquier valor en una escala continua. Ejemplo: cantidad de líquido contenido en un recipiente.

Tem

a 1. In

troducció

n

Page 17: Medidas de Centralidad y Dispersión

Escalas de medida

Escala Nominal. Escala Ordinal. Escala de Intervalos. Escala de Razón o Proporción. Escala Absoluta.

Variables Cualitativas

VariablesCuantitativas Tem

a 1. In

troducció

n

Page 18: Medidas de Centralidad y Dispersión

Escalas de medida

Escala nominal: los datos se pueden agrupar en categorías que no mantienen una relación de orden entre si, por lo tanto no están definidas las operaciones lógicas (>, <, ≤, ≥) sino solo las de igualdad o diferencia.

Ejemplos: color de ojos, sexo, profesión, estado civil, religión.

Tem

a 1. In

troducció

n

Page 19: Medidas de Centralidad y Dispersión

Escalas de medida

Escala ordinal: existe un cierto orden o jerarquía entre las categorías (>, <, ≤, ≥).

Ejemplos: grados militares, organigrama de una empresa, escalafón de los profesores universitarios, grados de disnea, estadiaje de un tumor.

Tem

a 1. In

troducció

n

Page 20: Medidas de Centralidad y Dispersión

Escalas de medida

Escala de Intervalos: valores numéricos de las variables y además de las relaciones de orden (>, <, ≤, ≥), se pueden establecer distancias, es decir, tienen sentido las operaciones de suma y resta. Tiene dos propiedades: Existe una unidad de medida que se mantiene

constante para todos los valores que toma la variable.

Existe un valor patrón u origen relativo que no significa la ausencia de valor en la variable.

Tem

a 1. In

troducció

n

Page 21: Medidas de Centralidad y Dispersión

Escalas de medida

Ejemplo: temperatura, nivel de ruido, movimientos sísmicos.

Tem

a 1. In

troducció

n

Page 22: Medidas de Centralidad y Dispersión

Escalas de medida

Escala de razón o proporción: es la más completa y general de todas las escalas. Se caracteriza porque los valores de la variable son números entre los cuales, además de las relaciones de orden (>, <, ≤, ≥) y distancia (+,-), se pueden establecer múltiplos y proporciones.

Ejemplos: peso, altura, volumen…

Tem

a 1. In

troducció

n

Page 23: Medidas de Centralidad y Dispersión

Escalas de medida

Escala Absoluta: se caracteriza porque los valores que toma la variable son el resultado de contar y por lo tanto, está constituida por los enteros positivos y el cero.

Ejemplos: número de hermanos, cantidad de autos vendidos, cantidad de accidentes en una intersección, cantidad de hijos,…

Tem

a 1. In

troducció

n

Page 24: Medidas de Centralidad y Dispersión

Datos Univariantes y Multivariantes

Univariantes o unidimensionales: sólo recogen información sobre una característica (Ej: edad de los alumnos de una clase).

Bivariantes o bidimensionales: recogen información sobre dos características de la población. (Ej: edad y estatura de los alumnos de una clase).

Tem

a 1. In

troducció

n

Page 25: Medidas de Centralidad y Dispersión

Datos Univariantes y Multivariantes

Multivariantes o pluridimensionales: recogen información sobre tres ó más características. (Ej: edad, estatura y peso de los alumnos de una clase). T

ema 1

. Intro

ducció

n

Page 26: Medidas de Centralidad y Dispersión

Abusos que se pueden cometer con la Estadística

Conclusiones erróneas debido a que los datos son numéricamente insuficientes.

Representaciones gráficas engañosas (escalas).

Datos muestrales no representativos: Muestra que no incluye a elementos de toda la

población. Ciertas categorías de personas no responden

correctamente. Respuestas voluntarias (sesgadas).

Tem

a 1. In

troducció

n

Page 27: Medidas de Centralidad y Dispersión

TEMA 2. ESTADÍSTICA DESCRIPTIVA

Page 28: Medidas de Centralidad y Dispersión

Organización de los datos

Una vez que se ha realizado la recolección de los datos, se obtienen datos en bruto, los cuales rara vez son significativos sin una organización y tabulación.

Tem

a 2. E

sta dística D

escr iptiva

Page 29: Medidas de Centralidad y Dispersión

Organización de los datos

Formas de organizar los datos: Un arreglo: es la forma más sencilla de

organizar los datos en bruto, consiste en colocar las observaciones en orden según su magnitud: ascendente o descendente.

Poco práctica cuando se tiene una gran cantidad de datos.

Tem

a 2. E

sta dística D

escr iptiva

Page 30: Medidas de Centralidad y Dispersión

Organización de los datos

Una distribución de frecuencias: es un arreglo de los datos que permite expresar la frecuencia de ocurrencias de las observaciones en cada una de las clases, mostrando el patrón de la distribución de manera más significativa.

Clase Pto.Medio

fi Fi fri FRi

Tem

a 2. E

sta dística D

escr iptiva

Page 31: Medidas de Centralidad y Dispersión

Organización de los datos

La Distribución de Frecuencias: Se recomienda su uso cuando se tienen

grandes cantidades de datos (n). Su construcción requiere, en primer

lugar, la selección de los límites de los intervalos de clase.

Para definir la cantidad de intervalos de clase (k), se puede usar:

La regla de Sturges: k = 1 + 3.3log(n) k = √n

Tem

a 2. E

sta dística D

escr iptiva

Page 32: Medidas de Centralidad y Dispersión

Organización de los datos

La cantidad de clases no puede ser tan pequeño (menos de 5) o tan grande (más de 20), que la verdadera naturaleza de la distribución sea imposible de visualizar.

La amplitud de todas las clases deberá ser la misma. Se recomienda que sea impar y que los puntos medios tengan la misma cantidad de cifras significativas que los datos en bruto.

Los límites de las clases deben tener una cifra significativa más que los datos en bruto.

Tem

a 2. E

sta dística D

escr iptiva

Page 33: Medidas de Centralidad y Dispersión

Organización de los datos

Determinar: Punto medio = (Li+Ls)/2. Frecuencia absoluta de la clase (fi).

Frecuencia acumulada de la clase (Fi). Frecuencia relativa de la clase (fri):

fri = fi/n

Frecuencia relativa acumulada de la clase (FRi).

Tem

a 2. E

sta dística D

escr iptiva

Page 34: Medidas de Centralidad y Dispersión

A continuación se presentan las calificaciones de 60 estudiantes que presentaron la PINA en el año 2009:

Tem

a 2. E

sta dística D

escr iptiva

Ejemplos de Distribución de Frecuencias

Page 35: Medidas de Centralidad y Dispersión

23 60 79 32 57 74 52 70 82 3680 77 81 95 41 65 92 85 55 7652 10 64 75 78 25 80 98 81 6741 71 83 54 64 72 88 62 74 4360 78 89 76 84 48 84 90 15 7934 67 17 82 69 74 63 80 85 61

a) Construya una distribución de frecuencias.b) Qué puede concluir de estos datos.

Ejemplos de Distribución de Frecuencias

Page 36: Medidas de Centralidad y Dispersión

Representación gráfica de los datos

Los gráficos permiten visualizar en forma global y rápida el comportamiento de los datos.

Para datos cuantitativos agrupados en clases, comúnmente se utilizan tres gráficos: Histogramas. Polígono de frecuencias. Ojiva o Polígono de frecuencias acumuladas.

Tem

a 2. E

sta dística D

escr iptiva

Page 37: Medidas de Centralidad y Dispersión

Representación gráfica de los datos

Histograma

Page 38: Medidas de Centralidad y Dispersión

Representación gráfica de los datos

Tem

a 2. E

sta dística D

escr iptiva

Histograma y Polígono de Frecuencias

Page 39: Medidas de Centralidad y Dispersión

Ojiva

Representación gráfica de los datos

Tem

a 2. E

sta dística D

escr iptiva

Page 40: Medidas de Centralidad y Dispersión

Representación gráfica de los datos

Para datos cualitativos se usan: Curvas Barras Sectores

Tem

a 2. E

sta dística D

escr iptiva

Page 41: Medidas de Centralidad y Dispersión

Barras

Representación gráfica de los datos

Barras

Page 42: Medidas de Centralidad y Dispersión

Representación gráfica de los datos

Curvas

Page 43: Medidas de Centralidad y Dispersión

Representación gráfica de los datos

Sectores, torta o circular

Tem

a 2. E

sta dística D

escr iptiva

Page 44: Medidas de Centralidad y Dispersión

Ejemplos de construcción de gráficos T

ema 2

. Esta d

ística Descr ip

tiva

Page 45: Medidas de Centralidad y Dispersión

Medidas de tendencia central o posición

Corresponden a valores que generalmente se ubican en la parte central de un conjunto de datos.

Forma como los datos pueden condensarse en un solo valor central alrededor del cual todos los datos muestrales se distribuyen.

Tem

a 2. E

sta dística D

escr iptiva

Page 46: Medidas de Centralidad y Dispersión

Medidas de tendencia central o posición

Las medidas de tendencia central más importantes son: Media: Aritmética y Aritmética

ponderada. Mediana. Moda.

Tem

a 2. E

sta dística D

escr iptiva

Page 47: Medidas de Centralidad y Dispersión

Media Aritmética

Es la suma de todas las observaciones dividida entre el número total de observaciones.

Expresada de forma más intuitiva, podemos decir que la media aritmética es la cantidad total de la variable distribuida a partes iguales entre cada observación. (wikipedia)

Por ejemplo, si en una habitación hay tres personas, la media de dinero que tienen en sus bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la información de una distribución (dinero en el bolsillo) suponiendo que cada observación (persona) tendría la misma cantidad de la variable. (wikipedia)

Tem

a 2. E

sta dística D

escr iptiva

Page 48: Medidas de Centralidad y Dispersión

Cálculo de la media aritmética

Para datos no agrupados:

n

xX

n

ii∑

== 1

Para datos agrupados:

n

fmX

k

iii∑

== 1

Donde: mi: punto medio de la clase i fi: frecuencia absoluta de la clase i

k: cantidad de clases

Tem

a 2. E

sta dística D

escr iptiva

Page 49: Medidas de Centralidad y Dispersión

Mediana

Es el valor que ocupa la posición central de un conjunto de observaciones, una vez que han sido ordenados en forma ascendente o descendente.

Divide al conjunto de datos en dos partes iguales.

Tem

a 2. E

sta dística D

escr iptiva

Page 50: Medidas de Centralidad y Dispersión

Cálculo de la mediana

Para datos no agrupados: Si n es impar: posición donde se ubica

la mediana es igual a (n+1)/2. Si n es par: (n+1)/2 no es entero, por

lo tanto la mediana será igual al promedio de las dos posiciones centrales.

Tem

a 2. E

sta dística D

escr iptiva

Page 51: Medidas de Centralidad y Dispersión

Cálculo de la mediana

Datos agrupados: clase mediana es la que contiene a la observación que ocupa la posición n/2.

Cmxf

xFn

LmMdm

m

)(

)(21

1−−+

+=

Donde: Lm: límite inferior de la clase mediana. F(xm-1): frecuencia acumulada de la clase anterior a la clase mediana. f(xm): frecuencia absoluta de la clase mediana. Cm: amplitud de la clase mediana.

Tem

a 2. E

sta dística D

escr iptiva

Page 52: Medidas de Centralidad y Dispersión

Moda

Observación o clase que tiene la mayor frecuencia en un conjunto de observaciones.

Un conjunto de datos puede ser unimodal, bimodal o multimodal.

Es la única medida de tendencia central que se puede determinar para datos de tipo cualitativo.

Tem

a 2. E

sta dística D

escr iptiva

Page 53: Medidas de Centralidad y Dispersión

Cálculo de la moda

Para datos no agrupados: es simplemente la observación que más se repite.

Para datos agrupados:

CmLimMo21

1

∆+∆∆+=

Donde: Lim: límite inferior de la clase modal. ∆1: diferencia entre fi de la clase modal y la anterior. ∆2: diferencia entre fi de la clase modal y la posterior. Cm: amplitud de la clase modal (clase de mayor frecuencia).

Tem

a 2. E

sta dística D

escr iptiva

Page 54: Medidas de Centralidad y Dispersión

Relación entre la media, la mediana y la moda

Tem

a 2. E

sta dística D

escr iptiva

Cuando los datos son sesgados es mejor emplear la Md

Page 55: Medidas de Centralidad y Dispersión

Propiedades, ventajas y desventajas de la media

Propiedades: La suma de las diferencias entre las

media muestral y el valor de cada observación es cero.

La media de una constante es la constante.

Si todas las observaciones xi se multiplican por una constante a, la X también se debe multiplicar por ese mismo valor constante.

Tem

a 2. E

sta dística D

escr iptiva

Page 56: Medidas de Centralidad y Dispersión

Propiedades, ventajas y desventajas de la media

Si se somete a una variable estadística X a un cambio de origen y escala, Y = a + bX, la media aritmética de dicha variable X varía en la misma proporción.

La media de la suma de dos variables es igual a la suma de sus medias.

Tem

a 2. E

sta dística D

escr iptiva

Page 57: Medidas de Centralidad y Dispersión

Propiedades, ventajas y desventajas de la media

Ventajas: Emplea en su cálculo toda la

información disponible. Se expresa en las mismas unidades

que la variable en estudio. Es el centro de gravedad de toda la

distribución, representando a todos los valores observados.

Es una valor único.

Tem

a 2. E

sta dística D

escr iptiva

Page 58: Medidas de Centralidad y Dispersión

Propiedades, ventajas y desventajas de la media

Se trata de un concepto familiar para la mayoría de las personas.

Es útil para llevar a cabo procedimientos estadísticos como la comparación de medias de varios conjuntos de datos.

Tem

a 2. E

sta dística D

escr iptiva

Page 59: Medidas de Centralidad y Dispersión

Propiedades, ventajas y desventajas de la media

Desventajas: Se ve adversamente afectada por valores

extremos, perdiendo representatividad. Si el conjunto de datos es muy grande

puede ser tedioso su cálculo manual. No se puede calcular para datos

cualitativos. No se puede calcular para datos que

tengan clases de extremo abierto, tanto superior como inferior.

Tem

a 2. E

sta dística D

escr iptiva

Page 60: Medidas de Centralidad y Dispersión

Ventajas y desventajas de la mediana

Ventajas: Fácil de calcular si el número de

observaciones no es muy grande. No se ve influenciada por valores

extremos, ya que solo influyen los valores centrales.

Fácil de entender.

Tem

a 2. E

sta dística D

escr iptiva

Page 61: Medidas de Centralidad y Dispersión

Ventajas y desventajas de la mediana

Se puede calcular para cualquier tipos de datos cuantitativos, incluso los datos con clase de extremo abierto.

Es la medida de tendencia central más representativa en el caso de variables que solo admiten la escala ordinal.

Tem

a 2. E

sta dística D

escr iptiva

Page 62: Medidas de Centralidad y Dispersión

Ventajas y desventajas de la mediana

Desventajas: No utiliza en su “cálculo” toda la

información disponible. No pondera cada valor por el

número de veces que se ha repetido.

Hay que ordenar los datos antes de determinarla.

Tem

a 2. E

sta dística D

escr iptiva

Page 63: Medidas de Centralidad y Dispersión

Ventajas y desventajas de la moda

Ventajas: No requiere cálculos. Puede usarse para datos tanto

cuantitativos como cualitativos. Fácil de interpretar. No se ve influenciada por valores

extremos. Se puede calcular en clases de

extremo abierto.

Tem

a 2. E

sta dística D

escr iptiva

Page 64: Medidas de Centralidad y Dispersión

Ventajas y desventajas de la moda

Desventajas: Para conjuntos pequeños de datos su

valor no tiene casi utilidad, si es que de hecho existe. Solo tiene significado en el caso de una gran cantidad de datos.

No utiliza toda la información disponible.

No siempre existe, si los datos no se repiten.

Tem

a 2. E

sta dística D

escr iptiva

Page 65: Medidas de Centralidad y Dispersión

Ventajas y desventajas de la moda

En ocasiones, el azar hace que una sola observación se no representativa se el valor más frecuente del conjunto de datos.

Difícil de interpretar si los datos tiene 3 o más modas.

Tem

a 2. E

sta dística D

escr iptiva

Page 66: Medidas de Centralidad y Dispersión

Medidas de dispersión, variación o variabilidad.

Son valores numéricos que indican o describen la forma en que las observaciones están dispersas o diseminadas, con respecto al valor central.

Tem

a 2. E

sta dística D

escr iptiva

Page 67: Medidas de Centralidad y Dispersión

Medidas de dispersión, variación o variabilidad.

Son importantes debido a que dos muestras de observaciones con el mismo valor central pueden tener una variabilidad muy distinta.

Tem

a 2. E

sta dística D

escr iptiva

Page 68: Medidas de Centralidad y Dispersión

Medidas de dispersión, variación o variabilidad.

Rango. Varianza. Desviación Típica. Coeficiente de variación.

Tem

a 2. E

sta dística D

escr iptiva

Page 69: Medidas de Centralidad y Dispersión

Medidas de dispersión: Rango

Rango (amplitud o recorrido): Está determinado por los dos

valores extremos de los datos muestrales, es simplemente la diferencia entre la mayor y menor observación.

Es una medida de dispersión absoluta, ya que depende solamente de los datos y permite conocer la máxima dispersión.

Tem

a 2. E

sta dística D

escr iptiva

Page 70: Medidas de Centralidad y Dispersión

Medidas de dispersión: Rango

Casi no se emplea debido a que depende únicamente de dos valores.

No proporciona una medida de variabilidad de las observaciones con respecto al centro de la distribución.

Notación: R

Tem

a 2. E

sta dística D

escr iptiva

Page 71: Medidas de Centralidad y Dispersión

Medidas de dispersión: Varianza

Es un valor numérico que mide el grado de dispersión relativa porque depende de la posición de los datos x1,x2,…,xn con respecto a la media.

Es el promedio al cuadrado de las desviaciones de cada observación con respecto a la media.

Notación: s2, σ2, var(X)

Tem

a 2. E

sta dística D

escr iptiva

Page 72: Medidas de Centralidad y Dispersión

Medidas de dispersión: Varianza

Si la varianza de un conjunto de observaciones es grande se dice que los datos tiene una mayor variabilidad que un conjunto de datos que tenga un varianza menor.

( )

21

2

2

1

2

2

xn

xs

n

xxs

n

ii

n

ii

−=

−=

=

=

Tem

a 2. E

sta dística D

escr iptiva

Para datos NOagrupados:

Page 73: Medidas de Centralidad y Dispersión

Para datos agrupados en una distribución de frecuencias:

Medidas de dispersión: Varianza

( )

( ) 21

2

2

1

2

2

xn

fms

n

fxms

k

iii

k

iii

−×

=

×−=

=

=

Page 74: Medidas de Centralidad y Dispersión

Medidas de dispersión: Desviación Típica

Es la raíz cuadrada de la varianza. Notación: s, σ.

2ss =

Tem

a 2. E

sta dística D

escr iptiva

Page 75: Medidas de Centralidad y Dispersión

Medidas de dispersión: Coeficiente de Variación

Es una medida de dispersión relativa que permite comparar el nivel de dispersión de dos muestras de variables estadísticas diferentes.

No tiene dimensiones. Notación: CV

%100×=x

sCV

Tem

a 2. E

sta dística D

escr iptiva

Page 76: Medidas de Centralidad y Dispersión

Ventajas y Desventajas del Rango

Ventajas: Útil cuando se quiere conocer la

extensión de las variaciones extremas (valor máximo de la dispersión).

Fácil de calcular.

Tem

a 2. E

sta dística D

escr iptiva

Page 77: Medidas de Centralidad y Dispersión

Ventajas y Desventajas del Rango

Desventajas: No es una MD con respecto al

centro de la distribución. Solo emplea dos valores en su

cálculo. No se puede calcular en

distribuciones de límite de clase abierto.

Tem

a 2. E

sta dística D

escr iptiva

Page 78: Medidas de Centralidad y Dispersión

Propiedades, Ventajas y Desventajas de la Varianza

Propiedades:1. Siempre es mayor o igual a cero y

menor que infinito.2. La varianza de una constante es

cero.3. Si a una variable X la sometemos a

Y=a+bX, la varianza de Y será Var(Y) = b2Var(X)

Tem

a 2. E

sta dística D

escr iptiva

Page 79: Medidas de Centralidad y Dispersión

Propiedades, Ventajas y Desventajas de la Varianza

Ventajas: Es útil cuando se compara la variabilidad

de dos o más conjuntos de datos. Utiliza toda la información disponible.Desventajas: No proporciona ayuda inmediata cuando

se estudia la dispersión de un solo conjunto de datos.

Difícil de interpretar por tener sus unidades elevadas al cuadrado.

Tem

a 2. E

sta dística D

escr iptiva

Page 80: Medidas de Centralidad y Dispersión

Ventajas y Desventajas de la Desviación Típica

Ventajas: Esta expresada en las mismas

unidades que la variable en estudio. Utiliza todas las observaciones en

su cálculo. Fácil de interpretar.Desventajas: No tiene.

Tem

a 2. E

sta dística D

escr iptiva

Page 81: Medidas de Centralidad y Dispersión

Ventajas y Desventajas del Coeficiente de Variación

Ventajas: Es la única MD que permite

comparar el nivel de dispersión de dos muestras de variables diferentes.

Emplea toda la información disponible en su cálculo.

Fácil de calcular.

Tem

a 2. E

sta dística D

escr iptiva

Page 82: Medidas de Centralidad y Dispersión

Ventajas y Desventajas del Coeficiente de Variación

Desventaja: No es una MD con respecto al

centro de la distribución de los datos.

Tem

a 2. E

sta dística D

escr iptiva

Page 83: Medidas de Centralidad y Dispersión

Medidas de Forma

Son medidas numéricas que permiten determinar la forma que tiene la curva de los datos, por lo tanto, sirven para corroborar lo que los gráficos muestran.

Medidasde forma

-Asimetría

-Kurtosis o apuntamiento

Coeficiente de PearsonCoeficiente de Fisher

Tem

a 2. E

sta dística D

escr iptiva

Page 84: Medidas de Centralidad y Dispersión

Medidas de Forma: Asimetría

Permiten estudiar la forma de la curva, dependiendo de cómo se agrupan los datos. T

ema 2

. Esta d

ística Descr ip

tiva

Page 85: Medidas de Centralidad y Dispersión

Medidas de Forma: Asimetría

Coeficiente de Asimetría de Pearson: Fácil de calcular e interpretar. Cálculo: ( )

s

MdXASP

−= 3

o Interpretación:

ASP

= 0, X=Md Simétrica

> 0, X>Md Asimétrica Positiva

< 0, X<Md Asimétrica Negativa

Tem

a 2. E

sta dística D

escr iptiva

Page 86: Medidas de Centralidad y Dispersión

Medidas de Forma: Asimetría

Coeficiente de Asimetría de Fisher: No es de fácil cálculo, pero si su

interpretación. Tem

a 2. E

sta dística D

escr iptiva

( )

( )3

1

3

31

3

ns

fxMASF

ns

XxASF

k

iii

n

ii

=

=

×−=

−= Datos NO agrupados

Datos Agrupados

Page 87: Medidas de Centralidad y Dispersión

Medidas de Forma: Asimetría

o Interpretación:

ASF

= 0, Simétrica

> 0, Asimétrica Positiva

< 0, Asimétrica Negativa

Tem

a 2. E

sta dística D

escr iptiva

Page 88: Medidas de Centralidad y Dispersión

Medidas de Forma: Kurtosis

Miden si los valores de la distribución están más o menos concentrados alrededor de los valores medios de la muestra (zona central de la distribución).

Se definen tres tipos de distribución según su grado de Kurtosis:

Tem

a 2. E

sta dística D

escr iptiva

Page 89: Medidas de Centralidad y Dispersión

Medidas de Forma: Kurtosis

Mesocúrtica: grado de concentración medio alrededor de los valores centrales de la variable.

Leptocúrtica: grado de concentración elevado.

Platicúrtica: grado de concentración reducido.

Tem

a 2. E

sta dística D

escr iptiva

Page 90: Medidas de Centralidad y Dispersión

Medidas de Forma: Kurtosis

( )

( )3

3

41

4

41

4

−×−

=

−−

=

=

=

ns

fXMCK

ns

XxCK

k

iii

n

ii

Datos No Agrupados

Datos Agrupados

Interpretación:

CK

=0 Mesocúrtica

>0 Leptocúrtica

<0 Platicúrtica

Tem

a 2. E

sta dística D

escr iptiva

Page 91: Medidas de Centralidad y Dispersión

Referencias:

Wikipedia(http://es.wikipedia.org/wiki/Wikipedia:Portada)

Walpole y Myers. Probabilidad y Estadística. Mc Graw-Hill.

Triola, Mario F. Estadística. Pearson.