Sesión 4 Abril

20
Universidad Alberto Hurtado Trabajo Social Estadística Estadígrafos de posición Paulina Gajardo Serrano 1

description

Curso ESTADÍSTICA, UAH 2014

Transcript of Sesión 4 Abril

Page 1: Sesión 4 Abril

Universidad Alberto Hurtado Trabajo Social

Estadística

Estadígrafos de posición

Paulina Gajardo Serrano 1

Page 2: Sesión 4 Abril

Contenidos

Estadígrafos de Posición: Sentido

Moda

Mediana

Fractiles / Percentiles

Media Aritmética

Page 3: Sesión 4 Abril

Estadígrafos

Un estadígrafo es una “medida” resumen de alguna característica de una variable

Existen al menos 3 tipos distintos de estadígrafos:

◦ De posición o tendencia central Resume en torno a qué valores se mueve una variable

Ej: media, mediana y moda

◦ De dispersión Resume como se (concentra o desconcentra) una variable en

torno a un indicador de tendencia central

Ej: varianza, desviación estándar, coeficiente de dispersión

◦ De forma: Describen “la forma” de el histograma de una variable

Ej: coeficiente de asimetría, coeficiente de curtósis

Page 4: Sesión 4 Abril

Que es un Estadígrafo

Valor de la variable que ayuda a resumir el

comportamiento de dicha variable.

Estadígrafo de Posición: Valor de la

variable que indica una tendencia central

en el comportamiento de la misma.

Page 5: Sesión 4 Abril

La Moda

Se simboliza como Mo:

Es el valor de la variable que más se repite en un conjunto de datos (mayor frecuencia relativa y/o absoluta).

No requiere cálculos, sólo observar las frecuencias ◦ Es el único que puede aplicarse a variables

cualitativas

La ocurrencia de un valor extremo de la variable no afecta a la moda

Puede existir más de una moda por población

Page 6: Sesión 4 Abril

La Moda

La moda de un conjunto de observaciones es el valor de la observación que ocurre con mayor frecuencia en el conjunto.

La moda es apropiada para variables medidas con cualquier unidad de medida (Nominales, ordinales, intervalo/ratio, continuas y discretas).

Todos los demás estadígrafos son más restrictivos que la moda (ninguno de los demás es apropiado para variables nominales).

La moda para una variable no se ve afectada por la existencia de valores extremos.

Page 7: Sesión 4 Abril

Ejemplo: MODA (I)

Page 8: Sesión 4 Abril

Ejemplo: MODA (II)

◦ Variable numérica continua

Page 9: Sesión 4 Abril

La Mediana:

Se simboliza como Me

La mediana de un conjunto de observaciones es el valor para el cual, cuando todas las observaciones se ordenan de manera creciente, la mitad de estas es menor que este valor y la otra mitad es mayor.

La mediana es un valor de la variable que divide a la población en dos grupos de igual tamaño (50% c/u).

La mediana es apropiada para variables con unida de medida de intervalo/ratio, pero no para variables nominales.

Page 10: Sesión 4 Abril

La Mediana

Cómo se calcula

1. Ordene los datos en forma creciente (o decreciente)

2. Calcule n/2 (identificador del lugar central) Para un número de observaciones impares la mediana es justo

el valor del medio

Para un número de observaciones pares, la mediana es el promedio entre los dos valores centrales

Es más cómodo y “natural” identificarla en datos no tabulados

En datos tabulados (Tablas de frecuencia SPSS) puede utilizar la columna de “porcentaje acumulado” ◦ Buscando de arriba hacia abajo, la mediana es valor de la

variable (o intervalo) cuyo porcentaje acumulado exceda el valor “n/2”

Page 11: Sesión 4 Abril

Ejemplo: MEDIANA (I)

Page 12: Sesión 4 Abril

Ejemplo: MEDIANA (II)

◦ Problema con variables tabuladas en intervalos

• Con datos tabulados en intervalos se identifica el intervalo de la mediana, más

no la mediana

• Mediana de IAI datos no tabulados: $230.652

Page 13: Sesión 4 Abril

Percentiles

La mediana es un «punto de corte» que divide

a la población en dos mitades

Si dividimos a un conjunto de observaciones en

5 grupos iguales en función de los valores de

una variable, se requieren 4 «cortes» cada uno

de los cuales se denomina quintil

Si lo hacemos en 10 grupos, hablamos de 9

cortes, cada uno de los cuales se denomina

decil

El concepto más general es el de percentil

Page 14: Sesión 4 Abril

Ejemplo CUARTILES (I)

Q1

Q2=Me

Q3

Q1 Q2 Q3

Page 15: Sesión 4 Abril

Ejemplo: CUARTILES (II)

◦ Problema con variables tabuladas

Q1

Q2=Me

Q3

Q1

Q2

Q3

Page 16: Sesión 4 Abril

La Media Aritmética

Es el estadístico más usado

Para presentarla suponga el siguiente conjunto de valores para 14 observaciones de una variable artificialmente creada

1, 2, 2, 3, 4, 4, 4, 8, 8, 9, 9, 10, 10, 10

Page 17: Sesión 4 Abril

Notación usada

Existen varias notaciones para la media aritmética

◦ Media poblacional:

◦ Media muestral: 𝑥

◦ Esperanza matemática: 𝐸 𝑥𝑖

X1 = 1, X2 = 2, X3 = 2, X4 = 3, X5 = 4, X6 = 4, X7 = 4,

X8 = 8, X9 = 8, X10 = 9, X11 = 9, X12 = 10, X13 = 10, X14 = 10

Denotemos a la variable por X, y la observación individual por xi

El Subíndice “i” identifica cada observación particular X puede ir desde i hasta n (n tamaño de la muestra)

En nuestro ejemplo n = 14 y las observaciones son…

Page 18: Sesión 4 Abril

Calculando el Promedio

𝑥 = 𝑥𝑖𝑛𝑖=1

𝑛

𝑥 =𝑥1 + 𝑥2 +⋯𝑥𝑛

𝑛

𝑥 =1 + 2 + 2 + 3 + 4 + 4 + 4 + 8 + 8 + 9 + 9 + 10 + 10 + 10

14= 6

Page 19: Sesión 4 Abril

En resumen…

La media aritmética está dada por:

𝑥 = 𝑥𝑖𝑛𝑖=1

𝑛

La suma de los valores de la variable

dividida por el total de observaciones

En términos estrictos, la media es útil

sólo en el caso de variables en escalas de

medias de intervalo y de razón

4/15/2014 Footer Text 19

Page 20: Sesión 4 Abril

Adicionalmente

La media es sensible a valores extremos

(outliers)

Ejemplo: Distribución del ingreso en países

de Latinoamérica

Para Variables con importante asimetría

(positiva o negativa) es recomendable

presentar tanto la media como la mediana