Material u5

59
10/06/22 Aura Mélida De la Selva 1 ESTADISTICA DESCRIPTIVA UNAM FCPyS SUA Material de apoyo didáctico, UNIDAD 5. Aura Mélida De la Selva Menéndez

Transcript of Material u5

Page 1: Material u5

15/04/23 Aura Mélida De la Selva 1

ESTADISTICA DESCRIPTIVA UNAM FCPyS SUA

Material de apoyo didáctico, UNIDAD 5.

Aura Mélida De la Selva Menéndez

Page 2: Material u5

15/04/23 Aura Mélida De la Selva 2

Recomendaciones

El presente material ha sido preparado como apoyo para las clases de las materias de Estadística Descriptiva e Inferencial y en ningún momento sustituye la lectura y consulta detallada de la bibliografía recomendada así como la elaboración de los ejercicios de práctica a cada una de las técnicas.

Page 3: Material u5

15/04/23 Aura Mélida De la Selva 3

Descripción de los datos: medidas de ubicación

UNOCalcular la media aritmética, mediana, moda, media ponderada y media geométrica.

DOS Explicar las características, utilización, ventajas y desventajas de cada medida de ubicación.

TRESIdentificar la posición de la media aritmética, la mediana, y la moda, tanto para distribuciones simétricas como asimétricas o sesgadas.

Page 4: Material u5

Media de la población

Para datos no agrupados, la media de la población es la suma de todos los valores en ella dividida entre el total de valores en la población:

donde µ representa la media de la población.N es el número total de elementos en la población.X representa cualquier valor en particular. indica la operación de sumar.

NX /

3-2

Page 5: Material u5

EJEMPLO 1

Parámetro: una característica de una población.La familia Sánchez posee cuatro carros. Los datos son las millas recorridas por cada uno:56 000, 23 000, 42 000 y 73 000. Encuentre el promedio de millas de los cuatro carros.Esto es (56 000 + 23 000 + 42 000 + 73 000)/4 = 48 500

3-3

Page 6: Material u5

Media de una muestra

Para datos no agrupados, la media de una muestra es la suma de todos los valores divididos entre el número total de los mismos:

donde X denota la media muestral

n es el número total de valores en la muestra.

X X n /

3-4

Page 7: Material u5

EJEMPLO 2

Dato estadístico: una característica de una muestra.Una muestra de cinco ejecutivos recibió la siguiente cantidad en bonos el año pasado: $14 000, $15 000, $17 000, $16 000 y $15 000. Encuentre el promedio en bonos para los cinco ejecutivos.Como estos valores representan la muestra de 5 ejecutivos, la media de la muestra es (14 000 + 15 000 + 17 000 + 16 000 + 15 000) / 5 = $15 400.

3-5

Page 8: Material u5

Propiedades de la media aritmética

Todo conjunto de datos de nivel de intervalo y de nivel de razón tiene un valor medio.Al evaluar la media se incluyen todos los valores.Un conjunto de valores sólo tiene una media.La cantidad de datos a evaluar rara vez afecta la media.La media es la única medida de ubicación donde la suma de las desviaciones de cada valor con respecto a la media, siempre es cero.

3-6

Page 9: Material u5

EJEMPLO 3

Considere el conjunto de valores: 3, 8 y 4. La media es 5. Para ilustrar la quinta propiedad, (3 - 5) + (8 - 5) + (4 - 5) = - 2 + 3 - 1 = 0. En otras palabras,

( )X X 0

3-7

Page 10: Material u5

Media ponderada

La media ponderada de un conjunto de números X1, X2, ..., Xn, con las ponderaciones correspondientes w1, w2, ...,wn, se calcula con la fórmula:

wXwXw

wwwXwXwXwXw nnn

/)*(

).../()...( 212211

3-8

Page 11: Material u5

EJEMPLO 6

Durante un periodo de una hora en una tarde calurosa de un sábado, el cantinero Chris sirvió cincuenta bebidas. Calcule la media ponderada de los precios de las bebidas. (Precio ($), cantidad vendida): (.50,5), (.75,15), (.90,15), (1.10,15).La media ponderada es: $(.50 x 5 + .75 x 15 + .90 x 15 + 1.10 x 15) / (5 + 15 + 15 + 15) = $43.75/50 = $0.875

3-9

Page 12: Material u5

Mediana

Mediana: es el punto medio de los valores después de ordenarlos de menor a mayor, o de mayor a menor. La misma cantidad de valores se encuentra por arriba de la mediana que por debajo de ella.

Nota: para un conjunto con un número par de números, la mediana será el promedio aritmético de los dos números medios.

3-10

Page 13: Material u5

EJEMPLO 4

Calcule la mediana para los siguientes datos.La edad de una muestra de cinco estudiantes es: 21, 25, 19, 20 y 22.Al ordenar los datos de manera ascendente quedan: 19, 20, 21, 22, 25. La mediana es 21.La altura, en pulgadas, de cuatro jugadores de basquetbol es 76, 73, 80 y 75.Al ordenar los datos de manera ascendente quedan: 73, 75, 76, 80. La mediana es 75.5.

3-11

Page 14: Material u5

Propiedades de la mediana

La mediana es única para cada conjunto de datos.

No se ve afectada por valores muy grandes o muy pequeños, y por lo tanto es una medida valiosa de tendencia central cuando ocurren.

Puede obtenerse para datos de nivel de razón, de intervalo y ordinal.

Puede calcularse para una distribución de frecuencias con una clase de extremo abierto, si la mediana no se encuentra en una de estas clases.

3-12

Page 15: Material u5

Moda

La moda es el valor de la observación que aparece con más frecuencia.

EJEMPLO 5: las calificaciones de un examen de diez estudiantes son: 81, 93, 84, 75, 68, 87, 81, 75, 81, 87. Como la calificación 81 es la que más ocurre, la calificación modal es 81.

3-13

Page 16: Material u5

Media geométrica

La media geométrica (MG) de un conjunto de n números positivos se define como la raíz n-ésima del producto de los n valores. Su fórmula es:

La media geométrica se usa para encontrar el promedio de porcentajes, razones, índices o tasas de crecimiento.

n nXXXXMG ))...()()(( 321

3-14

Page 17: Material u5

EJEMPLO 6

Las tasas de interés de tres bonos son 5%, 7% y 4%.La media geométrica es = 5.192.La media aritmética es (6 + 3 + 2)/3 = 5.333. La MG da una cifra de ganancia más conservadora porque no tiene una ponderación alta para la tasa de 7%.

3 )4)(5)(7(MG

3-15

Page 18: Material u5

Media geométrica continuación

3-16

Otra aplicación de la media geométrica es determinar el porcentaje promedio del incremento en ventas, producción u otros negocios o series económicas de un periodo a otro. La fórmula para este tipo de problema es:

1periodo) del inicio alvalor periodo)/( del final alvalor ( nMG

Page 19: Material u5

EJEMPLO 7

El número total de mujeres inscritas en colegios americanos aumentó de 755 000 en 1986 a 835 000 en 1995.

Aquí n = 10, así (n - 1) = 9.

Es decir, la media geométrica de la tasa de crecimiento es 1.27%.

.0127.1000755/0008358 MG

3-17

Page 20: Material u5

Media de datos agrupados

La media de una muestra de datos organizados en una distribución de frecuencias se calcula mediante la siguiente fórmula:

XXf

f

Xf

n

3-18

Page 21: Material u5

EJEMPLO 9

Una muestra de diez cines en una gran área metropolitana dio el número total de películas exhibidas la semana anterior. Calcule la media de las películas proyectadas.

X

Xf

f

Xf

n

3-19

Page 22: Material u5

EJEMPLO 9 continuación

Películas exhibidas

frecuencia f

punto medio de clase X

(f)(X)

1-2 1 1.5 1.5

3-4 2 3.5 7.0

5-6 3 5.5 16.5

7-8 1 7.5 7.5

9-10 3 9.5 28.5

Total 10 61

61/10 = 6.1 películas

3-20

Page 23: Material u5

Mediana de datos agrupados

La mediana de una muestra de datos organizados en una distribución de frecuencias se calcula mediante la siguiente fórmula: Mediana = L + [(n/2 - FA)/f] (i)donde L es el límite inferior de la clase que contiene a la mediana, FA es la frecuencia acumulada que precede a la clase de la mediana, f es la frecuencia de clase de la mediana e i es el intervalo de clase de la mediana.

3-21

Page 24: Material u5

Cálculo de la clase de la mediana

Para determinar la clase de la mediana de datos agrupados:

Elabore una distribución de frecuencias acumulada.

Divida el número total de datos entre 2.

Determine qué clase contiene este valor. Por ejemplo, si n=50, 50/2 = 25, después determine qué clase contiene el 25° valor (la clase de la mediana).

3-22

Page 25: Material u5

EJEMPLO 10

La clase de la mediana es 5 - 6, ya que contiene el 5° valor (n/2 = 5)

Películas exhibidas

Frecuencia Frecuencia acumulada

1-2 1 1

3-4 2 3

5-6 3 6

7-8 1 7

9-10 3 10

3-23

Page 26: Material u5

EJEMPLO 10 continuación

De la tabla, L = 5, n = 10, f = 3, i = 2, FA = 3.

Así, mediana = 5 + [((10/2) - 4)/3](2) = 6.33

3-24

Page 27: Material u5

Moda de datos agrupados

La moda de los datos agrupados se aproxima por el punto medio de la clase que contiene la frecuencia de clase mayor.Las modas en el EJEMPLO 10 son 5.5 y 9.5. Cuando dos valores ocurren una gran cantidad de veces, la distribución se llama bimodal, como en el ejemplo 10.

3-25

Page 28: Material u5

Distribución simétrica

sesgo cero moda = mediana = media

3-26

Page 29: Material u5

Distribución con asimetría positiva sesgo a la derecha: media y mediana se

encuentran a la derecha de la moda.

moda < mediana < media

3-27

Page 30: Material u5

Distribución con asimetría negativasesgo a la izquierda: media y mediana

están a la izquierda de la moda.

media < mediana < moda

3-28

Page 31: Material u5

NOTA

Si se conocen dos promedios de una distribución de frecuencias con sesgo moderado, el tercero se puede aproximar.

moda = media - 3(media - mediana)

media = [3(mediana) - moda]/2

mediana = [2(media) + moda]/3

3-29

Page 32: Material u5

15/04/23 Aura Mélida De la Selva 32

Descripción de los datos: medidas de dispersión

OBJETIVOSAl terminar este capítulo podrá:UNO

Calcular e interpretar la amplitud de variación, la desviación media, la variancia, y la desviación estándar de los datos originales.

DOS Calcular e interpretar la amplitud de variación, la variancia y la desviación estándar de datos agrupados.

TRESExplicar las características, usos, ventajas y desventajas de cada medida de dispersión.

Page 33: Material u5

15/04/23 Aura Mélida De la Selva 33

Descripción de datos: medidas de dispersión Continuación

CUATROEntender el problema de Chebyshev y la regla normal o empírica, y su relación con un conjunto de observaciones.

CINCO Calcular y explicar los cuartiles y la amplitud de variación intercuartílica.

SEISElaborar e interpretar los diagramas de caja.

SIETE Calcular y entender el coeficiente de variación y el coeficiente de asimetría.

Page 34: Material u5

Desviación media

Desviación media: la media aritmética de los valores absolutos de las desviaciones respecto a la media aritmética.

nXX

MD

4-3

Page 35: Material u5

EJEMPLO 1

Los pesos de una muestra de cajas con libros en una librería son (en libras) 103, 97, 101, 106 y 103.X = 510/5 = 102 libras = 1 + 5 + 1 + 4 + 1 = 12MD = 12/5 = 2.4Por lo común los pesos de las cajas están a 2.4 libras del peso medio de 102 lb.

4-4

Page 36: Material u5

Variancia de la población

La varianza de la población para datos no agrupados es la media aritmética de las desviaciones cuadráticas respecto a la media de la población.

2

2

( )X

N

4-5

Page 37: Material u5

EJEMPLO 2

Las edades de la familia Dunn son 2, 18, 34, y 42 años. ¿Cuál es la variancia de la población?

X N/ /96 4 24

2 2 944 4 236 ( ) / /X N

4-6

Page 38: Material u5

Variancia poblacional continuación

Una fórmula alternativa para la variancia poblacional es:

22

2 )(NX

NX

4-7

Page 39: Material u5

Desviación estándar poblacional

La desviación estándar poblacional () es la raíz cuadrada de la variancia de la población.

Para el EJEMPLO 2, la desviación estándar poblacional es 15.19 (raíz cuadrada de 230.81).

4-8

Page 40: Material u5

Variancia muestral

4-9

La variancia muestral estima la variancia de la población.

1

)Σ(Σ

= =operativa Fórmula

1)(Σ

== conceptualFórmula

22

2

22

nnX

XS

nXX

S

Page 41: Material u5

EJEMPLO 3

Una muestra de cinco salarios por hora para varios trabajos en el área es: $7, $5, $11, $8, $6. Encuentre la variancia.

X = 37/5 = 7.40

= 21.2/(5-1) = 5.3s2

4-10

Page 42: Material u5

Desviación estándar muestral

La desviación estándar muestral es la raíz cuadrada de la variancia muestral.

En el EJEMPLO 3, la desviación estándar de la muestra es = 2.30

4-11

Page 43: Material u5

Medidas de dispersión:datos no agrupados

Para datos no agrupados, la amplitud es la diferencia entre los valores mayor y menor en un conjunto de datos.

AMPLITUD = valor mayor - valor menor

EJEMPLO 4: una muestra de cinco graduados de contaduría indicó los siguientes salarios iniciales: $22 000, $28 000, $31 000, $23 000, $24 000. La amplitud es $31 000 - $22 000 = $9 000.

4-12

Page 44: Material u5

Varianza muestral para datos agrupados

La fórmula de la varianza para datos agrupados usada como estimador de la variancia poblacional es:

donde f es la frecuencia de clase y X es el punto medio de la clase.

SfX

fX

nn

2

22

1

( )

4-13

Page 45: Material u5

Interpretación y usos de la desviación estándar

Teorema de Chebyshev: para cualquier conjunto de observaciones, la proporción mínima de valores que está dentro de k desviaciones estándar desde la media es al menos 1 - 1/k , donde k2 es una constante mayor que 1 (uno).

4-14

Page 46: Material u5

Interpretación y usos de la desviación estándar

Regla empírica: para una distribución de frecuencias simétrica de campana, cerca de 68% de las observaciones estará dentro de ±1 de la media (); cerca de 95% de las observaciones estará dentro de ±2 de la media (); alrededor de 99.7% estará dentro de ±3 de la media ().

4-15

Page 47: Material u5

© 2001 Alfaomega Grupo Editor

Curva en forma de campana que muestra la relación entre y

Page 48: Material u5

Dispersión relativa

El coeficiente de variación es la razón de la desviación estándar a la media aritmética, expresada como porcentaje:

CVs

X (100%)

4-17

Page 49: Material u5

AsimetríaAsimetría (sesgo) es la medida de la falta de simetría en una distribución.El coeficiente de asimetría se calcula mediante la siguiente fórmula:

3(media - mediana)

4-18

Sk =

desviación estándar

Page 50: Material u5

Amplitud intercuartílica

La amplitud intercuartílica es la distancia entre el tercer cuartil Q3 y el primer cuartil Q1.Amplitud intercuartílica

= tercer cuartil - primer cuartil= Q3 - Q1

4-19

Page 51: Material u5

Primer cuartilEl primer cuartil es el valor correspondiente al punto debajo del cual se encuentra el 25% de las observaciones en un conjunto ordenado de datos.

donde L = límite de las clases que contienen Q1, CF = frecuencia acumulada que precede a la clase que contiene a Q1, f = frecuencia de la clase que contiene Q1, i= tamaño de la clase que contiene Q1.

Q L

nCF

fi1

4

( )

4-20

Page 52: Material u5

Tercer cuartil

El tercer cuartil es el valor correspondiente al punto debajo del cual se encuentra 75% de las observaciones en un conjunto ordenado de datos: donde L = límite inferior de la clase que contiene a Q3, CF = frecuencia acumulada precedente a la clase que contiene a Q3, f = frecuencia de la clase que contiene a Q3, i = tamaño de la clase que contiene a Q3.

)(43

+=3 if

CFn

LQ

4-21

Page 53: Material u5

Desviación cuartílica

La desviación cuartílica es la mitad de la distancia entre el tercer cuartil, Q3, y el primero, Q1.

QD = [Q3 - Q1]/2

4-22

Page 54: Material u5

EJEMPLO 5

Si el tercer cuartil = 24 y el primer cuartil = 10, ¿cuál es la desviación cuartílica? La amplitud intercuartílica es 24 - 10 = 14; por lo tanto, la desviación cuartílica es 4/2 = 7.

4-23

Page 55: Material u5

Amplitud cuartílica

Cada conjunto de datos tiene 99 percentiles, que dividen el conjunto en 100 partes iguales.

La amplitud cuartílica es la distancia entre dos percentiles establecidos. La amplitud cuartílica 10 a 90 es la distancia entre el 10º y 90º percentiles.

4-24

Page 56: Material u5

Fórmula para percentiles

4-25

100)1+(=

PnLp

Page 57: Material u5

Diagramas de caja

Un diagrama de caja es una ilustración gráfica, basada en cuartiles, que ayuda a visualizar un conjunto de datos.

Se requieren cinco tipos de datos para construir un diagrama de caja: el valor mínimo, el primer cuartil, la mediana, el tercer cuartil, y el valor máximo.

4-26

Page 58: Material u5

EJEMPLO 6

Con base en una muestra de 20 entregas, Dominos Pizza determinó la siguiente información: valor mínimo = 13 minutos, Q1 = 15 minutos, mediana = 18 minutos, Q3 = 22 minutos, valor máximo = 30 minutos. Desarrolle un diagrama de caja para los tiempos de entrega.

4-27

Page 59: Material u5

EJEMPLO 6 continuación

mediana

mín Q1 Q3 máx

12 14 16 18 20 22 24 26 28 30 32

4-28