Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la...

41
Unidad III: Medidas de Resumen

Transcript of Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la...

Page 1: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Unidad III:

Medidas de Resumen

Page 2: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

80

Unidad III

3.1 MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN.

EJERCICIOS RESUELTOS

1.- En un grupo se estudia la variable “Religión”, definida por las categorías; protestantes,

judíos y católicos. El recuento de frecuencias en las diversas categorías arrojó los

siguientes resultados.

a. ¿Con qué tipo de variable se está trabajando?

b. ¿En qué escala está medida la variable?

c. ¿Qué medidas de tendencia central sería adecuado calcular? Calcule cada una.

Solución:

a. Se está trabajando una variable cualitativa.

b. La variable está medida en una escala nominal.

c. Para una variable cualitativa nominal sólo es apropiado calcular la moda, ya que ésta

variable no está asociada a un valor numérico ni a un orden.

La moda es(son) la(s) categoría(s) con mayor frecuencia. En el grupo estudiado la

moda es católicos.

2.- La medida de la longitud de 50 cierres de metal ha dado los siguientes resultados: 8 cierres

de 5 cm, 6 cierres de 6 cm, 6 cierres de 8 cm, 9 cierres de 9 cm, 11 cierres de 10 cm, 7 cierres

de 12 cm y 3 cierres de 13 cm.

a. Calcule e interprete la longitud media de las cierres.

b. Calcule e interprete la mediana de la longitud de las cierres.

c. Calcule e interprete la moda de la longitud de las cierres.

X: Religión 𝑛𝑖

Protestantes 127

Judíos 228

Católicos 345 Fuente: D. F.

Page 3: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

81

Unidad III

Solución:

Sea X: Longitud de cierres metálicos en centímetros.

a.

𝜇𝑥 =∑ 𝑥𝑖 ∙ 𝑛𝑖

𝑘𝑖=1

𝑁

=5 ∙ 8 + 6 ∙ 6 + 8 ∙ 6 + 9 ∙ 9 + 10 ∙ 11 + 12 ∙ 7 + 13 ∙ 3

50= 8,76 𝑐𝑚.

Si todos los cierres tuvieran la misma longitud ésta sería 8,76 cm.

b.

Longitud de los cierres 𝑛𝑖 𝑁𝑖

5 8 8

6 6 14

8 6 20

9 9 29

10 11 40

12 7 47

13 3 50

La mediana corresponde al dato que ocupa la posición central cuando estos están ordenados.

𝑀𝑒(𝑥) =𝑥𝑛

2+ 𝑥𝑛

2+1

2=

(𝑥25 + 𝑥26)

2=

9 + 9

2= 9

El 50% de los cierres tienen a lo más(o a lo menos) 9cm de longitud.

c.

La moda está asociada a la categoría con la frecuencia más alta, por tanto en éste los cierres

de 9 cm de longitud son la moda.

De entre todos los cierres hay más de los de 9 cm que de otras longitudes.

Fuente: D. F.

Sabías que… si n

es par, entonces

son dos datos

centrales y como

convenio se

promedian

Page 4: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

82

Unidad III

3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística

Descriptiva, primero con los datos sin agrupar, luego con los datos agrupados en intervalos.

Las notas son:

2,3 4,5 6,5 7,0 5,1 4,3 6,5 3,4 3,8 4,2 2,0 5,0 4,7

6,7 6,2 5,8 4,6 5,9 3,9 5,8 6,1 6,5 4,3 4,3 4,2 5,6

7,0 4,6 7,0 6,8 5,6 4,5 6,8 2,9 3,7

¿Afecta en el valor de la media el utilizar los datos agrupados o sin agrupar? Argumente su

respuesta.

¿Qué sucede cuando la población es muy grande para calcular la media con los datos sin

agrupar?

Solución:

Media con los datos sin agrupar:

𝜇𝑥 =∑ 𝑥𝑖

𝑁𝑖=1

𝑁=

2,3 + 4,5 + 6,7 + ⋯ + 3,7

35≈ 5,1

Media con los datos agrupados:

𝑅 = 7,0 − 2,0 = 5,0

𝑁 = 35

𝐾 = 1 + 3,3 log(35) = 6,095 ≈ 6

Si construimos la tabla con 6 intervalos obtendríamos un sexto intervalo que no es

adecuado para la variable en estudio, ya que sus límites serían 7,0 y 8,0

respectivamente pero la nota 8,0 no es empleada en la escala nacional. Por tanto sólo

emplearemos 5 intervalos.

𝑎 =5,0

5= 1

Nota en la prueba 𝑥𝑖 Frecuencia

Absoluta

Frecuencia

Relativa

[2,0 – 3,0[ 2,5 3 0,07

[3,0 – 4,0[ 3,5 4 0,27

[4,0 – 5,0[ 4,5 10 0,27

[5,0 – 6,0[ 5,5 6 0,23

[6,0 – 7,0] 6,5 12 0,13

Fuente: D. F.

Fuente: D. F.

Page 5: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

83

Unidad III

𝜇𝑥 =∑ 𝑥𝑖 ∙ 𝑛𝑖

𝑘𝑖=1

𝑁=

2,5 ∙ 3 + 3,5 ∙ 4 + 4,5 ∙ 10 + 5,5 ∙ 6 + 6,5 ∙ 12

35≈ 5,1

No afecta en el valor de la media que los datos están agrupados o no, ya que las notas ocupan

un decimal, lo que al aproximar empareja los valores de ambos métodos.

4.- Un servicio de pruebas de consumo obtuvo los siguientes kilómetros por litro de bencina

en cinco recorridos de prueba realizados con cada uno de tres automóviles compactos:

Automóvil A: 27,9 30,4 30,6 31,4 31,7

Automóvil B: 31,2 28,7 31,3 28,7 31,3

Automóvil C: 28,6 29,1 28,5 32,1 29,7

a. Si los fabricantes del automóvil A quieren anunciar que su automóvil obtuvo el mejor

rendimiento en esta prueba. ¿Cuál de las medidas de tendencia central se podría usar

para sustentar su aseveración?

b. ¿Cuál es la media para el automóvil B y C?

Solución:

La medida de tendencia central más apropiada es la media aritmética, pues ésta utiliza todos

los datos y es la más representativa si no hay datos atípicos como en este caso.

𝜇𝐴 =27,9 + 30,4 + 30,6 + 31,4 + 31,7

5=

152

5= 30,4 𝑘𝑚/𝑙

b.

𝜇𝐵 =31,2 + 28,7 + 31,3 + 28,7 + 31,3

5=

151,2

5= 30,24 𝑘𝑚/𝑙

𝜇𝐶 =28,6 + 29,1 + 28,5 + 32,1 + 29,7

5=

148

5= 29,6 𝑘𝑚/𝑙

En conclusión obteniendo la media del consumo de los tres automóviles, en promedio el que

rindió más kilómetros por litro de bencina fue el automóvil A, lo cual sustenta su aseveración.

Fuente: D. F.

Page 6: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

84

Unidad III

5.- Sea 𝑥1, 𝑥2, … 𝑥𝑛 una muestra de X. Demuestre: 𝑎𝑥̅̅ ̅ = 𝑎 ∙ �̅�, con 𝑎 constante.

Demostración:

𝑎𝑥̅̅ ̅ =∑ 𝑎𝑥𝑖

𝑛𝑖=1

𝑛

=𝑎𝑥1 + 𝑎𝑥2 + ⋯ + 𝑎𝑥𝑛

𝑛

=𝑎(𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛)

𝑛

= 𝑎 (∑ 𝑥𝑖

𝑘𝑖=1

𝑛)

= 𝑎 ∙ �̅�

6. Dada una distribución de frecuencias agrupada en intervalos (𝐿𝑖−1 − 𝐿𝑖; 𝑓𝑖), deduzca la

expresión de la mediana.

Solución:

Representamos la parte del polígono de frecuencias acumuladas correspondiente al intervalo

mediano, 𝐿𝑖−1 − 𝐿𝑖.

Según se ilustra en esta gráfica, la mediana es un valor cuya frecuencia absoluta acumulada

es igual a 𝑁

2. Podemos observar, también, que el punto de coordenadas (𝑀𝑒(𝑥),

𝑁

2) pertenece

a la recta de los puntos (𝐿𝑖−1, 𝑁𝑖−1) y (𝐿𝑖, 𝑁𝑖), con lo cual, para hallar la expresión de la

Page 7: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

85

Unidad III

mediana basta con sustituir el valor de la abscisa, 𝑀𝑒(𝑥), y el de la ordena, 𝑁

2, en la ecuación

de la recta que una dichos puntos:

𝑥 − 𝐿𝑖

𝐿𝑖 − 𝐿𝑖−1=

𝑦 − 𝑁𝑖−1

𝑁𝑖 − 𝑁𝑖−1

o, lo que es lo mismo, en

𝑥 − 𝐿𝑖−1

𝑎𝑖=

𝑦 − 𝑁𝑖−1

𝑛𝑖

Sustituyendo, entonces, en esta ecuación el punto (𝑀𝑒(𝑥),𝑁

2), se tiene:

𝑀𝑒(𝑥) − 𝐿𝑖−1

𝑎𝑖=

𝑁2 − 𝑁𝑖−1

𝑛𝑖

con lo que, despejando, resulta el valor de la mediana:

𝑀𝑒(𝑥) = 𝐿𝑖 +

𝑁2 − 𝑁𝑖−1

𝑛𝑖∙ 𝑎𝑖

Page 8: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

86

Unidad III

EJERCICIOS PROPUESTOS

1.- Las edades de seis trabajadores escogidos al azar en un comercio son: 18, 19, 25, 29, 34, 35

años.

a. Calcule la media de dichas edades e intérprete.

2.- Calcule e interprete la media de la distribución correspondiente a la estatura en

centímetros de los 40 estudiantes que están cursando el ramo Estadística Descriptiva y

Nociones de Probabilidad en la UMCE, ordenados en la siguiente tabla:

X: Estatura en

Centímetros

𝑛𝑖

[148,5 – 153,5[ 2

[153,5 – 158,5[ 4

[158,5 – 163,5[ 11

[163,5 – 168,5[ 14

[168,5 – 173,5[ 5

[173,5 – 178,5] 4

3.- Calcule la media de los puntajes obtenidos por los 35 estudiantes de un curso de Estadística

Descriptiva en una prueba parcial, primero con los datos sin agrupar, luego agrupándolos en

intervalos. Estos puntajes son:

49 48 43 42 49 41 42 43 43 44 44 51 53 54 51 59 58 57

54 51 54 53 64 62 64 63 62 61 62 68 68 67 66 69 56

¿Afecta en el valor de la media el utilizar los datos agrupados o sin agrupar? Argumente su

respuesta.

¿Qué sucede cuando la población es muy grande para calcular la media con los datos sin

agrupar?

Fuente: D. F.

Fuente: D. F.

Page 9: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

87

Unidad III

4.- Un trabajador de un centro comercial realizó diez ventas en la última hora. El promedio de

dichas ventas fue de $720. El valor de nueve ventas es: $480, $710, $790, $955, $445, $572,

$754, $834 y $970. Si uno de los clientes regresó la mercancía ¿A cuánto equivalía la venta de

dicha mercancía?

5.- Dada la siguiente distribución de frecuencias de la variable X, obtenida a través de una

muestra:

X 𝑛𝑖

2 2

3 2

8 3

12 3

17 1

Calcule e interprete:

a. Media aritmética, Mediana y Moda.

b. ¿Qué relación existe entre estas medidas?

c. ¿Qué sucede con la Media aritmética, Mediana y Moda si cada valor de la variable X

es multiplicado por 3 y sumado 5?

6.- Calcule la frecuencia correspondiente a 𝑛3 de la siguiente distribución de frecuencias,

perteneciente a una población, sabiendo que la media aritmética es igual a 11,50.

X 𝑛𝑖

[4 – 6[ 4

[6 – 10[ 5

[10 – 16[ X

[16 – 20[ 3

[20 – 30] 1

Fuente: D. F.

Fuente: D. F.

Page 10: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

88

Unidad III

7.- La tabla de frecuencias correspondiente a los incentivos mensuales en pesos de una

muestra de 100 empleados de una empresa es:

X: Incentivos en pesos 𝑛𝑖

[6.150 – 6.650[ 10

[6.650 – 7.150[ 16

[7.150 – 7.650[ 32

[7.650 – 8.150[ 20

[8.150 – 8.650[ 12

[8.650 – 9.150] 10

a. Calcule e interprete la media, mediana, moda, percentil 30 y el decil 8.

b. ¿Qué porcentaje de trabajadores recibe a lo menos $7.150?

8.- Los valores de la presión sanguínea cuando se reportan son redondeados a veces a los 5

mm Hg (milímetros de mercurio) más cercanos (100, 105, 110, etc.). Suponga que los valores

reales de presión sanguínea para nueve individuos seleccionados al azar de entre todos los

pacientes de un hospital de la capital son:

118,6 127,4 138,4 130,0 113,7 122,0 108,3 131,5 133,2

a. ¿Cuál es la mediana de los valores reportados de la presión sanguínea? Interprete.

b. Suponga que la presión del segundo individuo es de 127,6 en lugar de 127,4 (un

pequeño cambio en un sólo valor). ¿Cómo afecta éste cambio en el valor de mediana?

9.- Las notas de la asignatura de Matemática de los 33 alumnos de una clase vienen

expresadas por la siguiente tabla:

Notas 1 2 3 4 5 6 7

𝑛𝑖 2 2 4 5 8 9 3

Fuente: D. F.

Fuente: D. F.

Fuente: D. F.

Page 11: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

89

Unidad III

Calcule e intérprete:

a. Cuartiles 1 y 3.

b. Percentiles de orden 30 y 70.

c. ¿Existe alguna relación entre dichos cuartiles y percentiles?

d. ¿Qué relación existe entre mediana y cuartil 2?

10.- Se tiene la siguiente distribución de datos, expresada en la siguiente tabla:

X 𝑛𝑖

[38 – 44[ 7

[44 – 50[ 8

[50 – 56[ 15

[56 – 62[ 25

[62 – 68[ 18

[68 – 74[ 9

[74 – 80[ 6

Calcule e intérprete:

a. Cuartiles 1 y 3.

b. La diferencia entre los cuartiles 1 y 3 ¿Qué puede decir del resultado obtenido?

c. Centiles o percentiles de orden 40 y 90.

d. La diferencia entre los percentiles 40 y 90 ¿Qué puede decir del resultado obtenido?

11.- Dada la siguiente distribución, ¿qué percentil corresponde a 222? ¿Qué percentil

corresponde a 230?

X [210 – 215[ [215 – 220[ [220 – 225[ [225 – 230[ [230 – 235]

𝑛𝑖 2 10 11 5 2

Los percentiles (o centiles) son una

medida de posición en la cual se divide

el conjunto ordenado de datos en cien

partes iguales, dándonos 99 posiciones

distintas.

Fuente: D. F.

Fuente: D. F.

Page 12: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

90

Unidad III

12.- La siguiente distribución de frecuencias corresponde al número de aviones que despegan

diariamente en el aeropuerto capitalino, tomando como muestra aleatoria los primeros 20 días

de un mes.

𝑥𝑖 𝑛𝑖 𝑛𝑖 ∙ 𝑥𝑖 𝑥𝑖 − �̅� |𝑥𝑖 − �̅�| 𝑛𝑖 ∙ |𝑥𝑖 − �̅�| 41 1 41 41-46=-5 5 5

42 2 84 42-46=-4 4 8

44 4 176 44-46=-2 2 8

46 6

48 4

50 2

51 1

∑ 20 ∑ ∑ = 0 ∑ ∑

a. Complete la tabla de frecuencias.

b. Determine la media de los datos.

c. Determine la diferencia de cada observación menos la media. 𝑥𝑖 − �̅� ¿Qué mide esta

diferencia? ¿Qué sucede al sumar estas diferencias?

13.- Los trabajadores de una oficina cobran los siguientes sueldos semanales:

X: Sueldos (miles) [10 – 20[ [20 – 30[ [30 – 50[ [50 – 70]

𝑛𝑖 40 30 20 10

a. Obtenga el sueldo medio de los trabajadores.

b. Determine la mediana y la moda de la distribución de los sueldos y explique qué

relación tienen estas dos medidas.

c. ¿Qué porcentaje de trabajadores cobran a lo más $30.000 semanales?

d. ¿Qué porcentaje de trabajadores no cobra entre $20.000 y $50.000 semanales?

Fuente: D. F.

Fuente: D. F.

Page 13: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

91

Unidad III

3.2 MEDIDAS DE DISPERSIÓN O VARIABILIDAD.

EJERCICIOS RESUELTOS

1.- Una muestra de 100 varones obtiene una 𝑠2 = 10 𝑘𝑖𝑙ó𝑔𝑟𝑎𝑚𝑜𝑠2, en la variable X: peso en

kilogramos, mientras que la muestra de 100 mujeres alcanza en la misma variable una 𝑠2 =

15 𝑘𝑖𝑙ó𝑔𝑟𝑎𝑚𝑜𝑠 2. ¿Podemos afirmar que los varones varían muchos más que las mujeres en

dicha variable? Razone la respuesta.

Solución:

Puesto que la varianza según su magnitud nos dirá si la muestra tiene una mayor o menor

dispersión respecto del promedio, y siendo éste en caso la varianza de las mujeres es mayor

que la de los varones no podemos afirmar que los varones varían mucho más que las mujeres

según la variable estudiada.

2.- En un furgón escolar se les pregunta a los alumnos por el tiempo que tardan en llegar a su

casa desde el colegio en el furgón. Los resultados se recogen en la siguiente tabla:

X: Tiempo (minutos) [0 – 5[ [5 – 10[ [10 – 15[ [15 – 20[ [20 – 25[

𝑛𝑖: N° de alumnos 20 13 18 5 4

a. Calcule e interprete la media y la desviación típica de esta distribución.

b. ¿Qué porcentaje de alumnos tarda más de 10 minutos en llegar a su casa desde el

colegio en furgón?

Solución:

Intervalo 𝑥𝑖′ 𝑛𝑖 𝑥𝑖

′ ∙ 𝑛𝑖 𝑛𝑖 ∙ 𝑥𝑖′2 𝑓𝑖% 𝐹𝑖%

[0 – 5[ 2,5 20 50 125 33,3 33,3

[5 – 10[ 7,5 13 97,5 731,25 21,7 55

[10 – 15[ 12,5 18 225 2812,50 30 85

[15 – 20[ 17,5 5 87,5 1531,25 8,3 93,3

[20 – 25[ 22,5 4 90 2025 6,7 100

Total 60 550 7225

a.

𝜇𝑥 =∑ 𝑥𝑖

′ ∙ 𝑛𝑖

𝑁=

550

60= 9,17 𝑚𝑖𝑛𝑢𝑡𝑜𝑠.

𝜎𝑥 = √∑ 𝑛𝑖 ∙ 𝑥𝑖

′2

𝑁− 𝜇2 = √

7225

60− 9,172 = √36,33 = 6,03 𝑚𝑖𝑛𝑢𝑡𝑜𝑠.

Fuente: D. F.

Fuente: D. F.

Page 14: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

92

Unidad III

Interpretación: Si todos los alumnos tardaran lo mismo en llegar a sus hogares, demorarían

9,17 minutos, con una variación de 6,03 minutos.

b. En la tabla de frecuencias, agregamos dos columnas para calcular la frecuencia

relativa y su acumulada. Entonces:

𝐹5 − 𝐹2 = 100 − 55 = 45%

El 45% de los alumnos tardan más de 10 minutos en llegar a sus hogares.

3.- El peso medio de una especie de animales, A, es de 21,3 Kg y la desviación típica es de 2,5

Kg. En otra especie de animales, B, el peso medio es de 125 Kg y su desviación típica es de 13

Kg.

Calcule el coeficiente de variación y analice cuál de las dos especies tiene mayor variación

relativa en los pesos.

Solución:

C. VA =σA

μA=

2,5

21,3= 0,117 → 11,7%

C. VB =σB

μB=

13

125= 0,104 → 10,4%

Debido a que la diferencia entre los coeficientes de variación es ínfima no podemos asegurar

que hay una mayor o menor variación relativa de los pesos entre las especies estudiadas.

Sabías que…

La desviación

estándar

también es

conocida como

desviación

típica.

Page 15: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

93

Unidad III

EJERCICIOS PROPUESTOS

1.- Se ha lanzado un dado 100 veces, anotando el resultado obtenido cada vez. La información

queda registrada en la siguiente tabla:

X: Resultado 1 2 3 4 5 6

𝑛𝑖 12 20 10 15 20 23

a. Identifique la variable.

b. Calcule e interprete la media y la desviación típica de la variable.

c. ¿Qué porcentaje de resultados hay entre 𝜇 − 𝜎 y 𝜇 + 𝜎 (ambos valores incluidos)?

d. ¿Qué porcentaje de lanzamientos realizados, se ha obtenido una puntuación mayor

que la media?

2.- Al preguntar a 50 familias, elegidas al azar, por el número de personas que forman el grupo

familiar, pertenecientes a una comuna de la región metropolitana, se ha obtenido información

que se muestra en la siguiente tabla:

X: N° de personas 1 2 3 4 5 6

𝑛𝑖 3 10 23 9 3 2

a. Calcule la media y la desviación típica de la cantidad de personas por grupo familiar.

b. ¿Qué sucede con el valor de la desviación típica si por error se omitió contar al jefe del

grupo familiar en el grupo familiar, de modo que es necesario calcularla pero ahora

sumando 1 a cada valor de la variable?

c. ¿Qué porcentaje de familias hay entre �̅� − 𝑠 y �̅� + 𝑠 (ambos valores excluidos)?

d. ¿Qué porcentaje de familias tienen un número de integrantes menor que la media?

3.- Las notas de un curso obtenidas en un examen en matemática se exponen en la siguiente

tabla:

X: Nota [0 – 1[ [1 – 2[ [2 – 3[ [3 – 4[ [4 – 5[ [5 – 6[ [6 – 7]

𝑛𝑖 1 3 4 5 7 3 2

a. Calcule la media y la desviación estándar de las notas obtenidas.

b. Si el examen corresponde al 10% de la nota final del ramo ¿Qué sucede con la media y

la desviación típica sí éstas se calculan sobre la ponderación de la nota?

c. ¿Qué porcentaje de alumnos obtienen notas mayores que la media?

4.- El sueldo medio de los trabajadores de una empresa, A, es de 1,2 millones de pesos al mes,

con una desviación estándar de 0,32 millones. En otra empresa, B, el sueldo medio es 1,5 al

mes con una desviación estándar de 0,47 millones.

Fuente: D. F.

Fuente: D. F.

Fuente: D. F.

Page 16: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

94

Unidad III

a. Calcule el coeficiente de variación para cada empresa.

b. ¿En cuál empresa el promedio es más representativo?

c. ¿Por qué es adecuado en ésta situación calcular el coeficiente de variación para

comparar la dispersión de los grupos? Fundamente su respuesta.

5.- El tiempo empleado en la fabricación de un cierto producto, A, es de 235 minutos con una

desviación típica de 55 minutos. En otro producto, B, el tiempo medio empleado en su

fabricación es de 42 minutos, con una desviación típica de 8 minutos.

a. Calcule e interprete el coeficiente de variación y analice en cuál de los dos casos hay

mayor variación relativa.

b. ¿Qué sucede con el coeficiente de variación del producto B si su desviación estándar

tiende acero? Fundamente su respuesta.

c. ¿Qué ocurre con el coeficiente de variación del producto A si su media aritmética

tiende a cero? Fundamente su respuesta.

6.- La estatura media de un grupo de varones es de 168 cm y su desviación estándar es de 12

cm. En un grupo de mujeres, la estatura media es de 154 cm y su desviación estándar es de 7

cm.

a. Calcule e interprete el coeficiente de variación y compare la dispersión de ambos

grupos.

b. ¿Por qué es adecuado en ésta situación calcular el coeficiente de variación para

comparar la dispersión de los grupos? Fundamente su respuesta.

7.- En un almacén de una fábrica de baterías, al almacenar las cajas en forma incorrecta, se

detectó que algunas de las baterías se habían deteriorado, por lo que se hizo una inspección. Se

tomaron 10 cajas al azar para su revisión habiéndose obtenido la siguiente información:

De la primera caja 2 baterías deterioradas, de las siguientes: 3, 1, 0, 4, 2, 1, 3, 0, 2.

a. Determine la variabilidad de las baterías deterioradas.

b. Luego de estudiar las baterías deterioradas los ingenieros de la fábrica determinaron

que éstas rendían un 30% menos. Con ésta información determine la variabilidad del

rendimiento de las baterías deterioradas.

c. Si cada caja de baterías contenía 10 baterías calcule e interprete el coeficiente de

variación y compare la dispersión de las baterías en buen estado y las baterías

deterioradas.

Page 17: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

95

Unidad III

3.3 CONSTRUCCIÓN E INTERPRETACIÓN DEL DIAGRAMA DE CAJÓN CON

BIGOTES (BOX PLOT).

EJERCICIOS RESUELTOS

1.- Se seleccionó una muestra de 20 botellas de vidrio de determinado tipo, y se midió la

resistencia de cada una a la presión interna en megapascal. Examine la siguiente información

parcial de la muestra:

Mediana = 1,39 𝑀𝑃𝑎 primer cuartil = 1,35 𝑀𝑃𝑎 tercer cuartil = 1,49 𝑀𝑃𝑎

Tres observaciones más pequeñas: 0,87 – 1,30 – 1,34

Tres observaciones más grandes: 1,53 – 1,59 – 1,73

a. Realice un diagrama de cajón con bigotes que muestre los valores atípicos y comente

las características interesantes que encuentre.

b. ¿Hay algunos valores atípicos en la muestra?

Solución:

a.

Sabías que…

Los datos atípicos

(outlier) son los

datos que son

significativamente

diferentes a los

otros datos de la

colección.

Resistencia de botellas

de vidrio

Fuente: D. F.

Page 18: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

96

Unidad III

b. Sí, ya que la observación más pequeña y la observación más grandes se encuentran

tan alejados del recorrido intercuartílico que pueden ser considerados datos atípicos

de la muestra.

2.- El número de días que 9 trabajadores escogidos al azar de una empresa han estado con

licencia médica son los siguientes:

15 7 8 85 19 12 8 22 14

a. Represente este conjunto de datos mediante un diagrama de cajón con bigotes

¿Observa algún valor atípico?

b. ¿Qué puede decir de la simetría de es estos datos?

Solución:

Sea X: Número de días de licencia médica.

a.

Para la construcción de un diagrama de cajón con bigote primero es necesario ordenar los

datos, para así calcular el valor de 𝑄1, 𝑄2 y 𝑄3, ya que con dichos valores a su vez se

calculan los bigotes superior e inferior.

7 8 8 12 14 15 19 22 84

𝑄1 =𝑛

4=

9

4= 2,25 ⇒ 𝑃25 = 8

𝑄2 =𝑛

2=

9

2= 4,5 ⇒ 𝑃50 = 14

𝑄3 =3 ∙ 𝑛

4=

3 ∙ 9

4= 6,75 ⇒ 𝑃25 = 19

Bigote superior: 𝐵𝑆 = 𝑄3 + 1,5(𝑄3 − 𝑄1) = 19 + 1,5(19 − 8) = 35,5

Bigote inferior: 𝐵𝐼 = 𝑄1 − 1,5(𝑄3 − 𝑄1) = 8 − 1,5(19 − 8) = −8,5

Fuente: D. F.

Page 19: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

97

Unidad III

El bigote inferior tiene un valor que no tiene sentido para el contexto la variable en estudio,

por tanto como bigote inferior se empleara al dato de menor valor y como bigote superior al

calculado, ya que esto no altera la distribución de los datos.

b.

La distribución que muestra el gráfico revela una simetría en torno a la media, la cual se

puede confirmar con los valores de la misma respecto del recorrido intercuartílico.

3.- Se consideran los siguientes datos, correspondientes a la tasa de incrementos de precios al

consumo, en 1985, para 24 países seleccionados de la OCDE:

2,2 7,6 2,9 4,6 4,1 3,9

7,4 3,2 5,1 5,3 20,1 2,3

5,5 32,7 9,1 1,7 3,2 5,8

16,3 15,9 5,9 6,7 3,4 40,5

a. Calcule e interprete la media aritmética, desviación estándar, mediana, moda de los

datos agrupándolos por intervalos.

b. Grafique los datos en un histograma y un box-plot, analice asimetría.

Días de licencia

Médica

Fuente: D. F.

Fuente: D. F.

Page 20: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

98

Unidad III

Solución:

a.

𝑅 = 40,5 − 1,7 = 38,8

𝑁 = 24

𝐾 = 1 + 3,3 𝑙𝑜𝑔(24) = 5,55 ≈ 6

𝑎 =38,8

6= 6,46̅ ≈ 6,5

Tasa de incremento

de precios al consumo 𝑥𝑖 ni Ni 𝑥𝑖 ∙ 𝑛𝑖 𝑥𝑖

2 ∙ 𝑛𝑖

[1,7 – 8,2[ 4,95 18 18 89,1 441,05

[8,2 – 14,7[ 11,45 1 19 11,45 131,1

[14,7 – 21,2[ 17,95 3 22 53,85 966,61

[21,2 – 27,7[ 24,45 0 22 0 0

[27,7 – 34,2[ 30,95 1 23 30,95 957,9

[34,2 – 40,7] 37,45 1 24 37,45 1402,5

Total 24 222,8 3899,16

�̅� =∑ 𝑥𝑖 ∙ 𝑛𝑖

𝑛𝑖=1

𝑛=

222,8

24= 9,283̅ ≈ 9,29

𝑆𝑥 = √∑ 𝑛𝑖 ∙ 𝑥𝑖

2

𝑛 − 1− �̅�2 = √

3899,16

23− 9,292 = √83,22 ≈ 9,12

Si todos los países contaran con la misma tasa de incremento de precios al consumo esta sería

de 9,29, con una variación de 9,12.

𝑀𝑒(𝑥) = 𝑄2 = 𝐿𝑖−1 +

𝑛2

− 𝑁𝑖−1

𝑛𝑖∙ 𝑎𝑖 = 1,7 +

242

− 0

18∙ 6,5 = 6,03̅ ≈ 6,03

El 50% de los países tienen a lo más(o a lo menos) una tasa de incremento de precios al

consumo de 6,03.

𝑀𝑜(𝑥) = 𝐿𝑖−1 +𝑛𝑖 − 𝑛𝑖−1

(𝑛𝑖 − 𝑛𝑖−1) + (𝑛𝑖 − 𝑛𝑖+1)∙ 𝑎𝑖 = 1,7 +

18 − 0

(18 − 0) + (18 − 1)∙ 6,5 = 5,04

De entre todas las tasas de incremento de precios al consumo la más frecuente es 5,04.

Page 21: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

99

Unidad III

b.

𝑄1 = 𝐿𝑖−1 +

𝑛4 − 𝑁𝑖−1

𝑛𝑖∙ 𝑎𝑖 = 1,7 +

244 − 0

18∙ 6,5 = 3,86̅ ≈ 3,87

𝑄2 = 𝐿𝑖−1 +

𝑛2 − 𝑁𝑖−1

𝑛𝑖∙ 𝑎𝑖 = 1,7 +

242 − 0

18∙ 6,5 = 6,03̅ ≈ 6,03

𝑄3 = 𝐿𝑖−1 +

3 ∙ 𝑛4 − 𝑁𝑖−1

𝑛𝑖∙ 𝑎𝑖 = 1,7 +

3 ∙ 244 − 0

18∙ 6,5 = 8,2

Bigote superior: 𝐵𝑆 = 𝑄3 + 1,5(𝑄3 − 𝑄1) = 8,2 + 1,5(8,2 − 3,87) = 14,95

Bigote inferior: 𝐵𝐼 = 𝑄1 − 1,5(𝑄3 − 𝑄1) = 3,87 − 1,5(8,2 − 3,87) = −2,625

El bigote inferior tiene un valor que no tiene sentido para el contexto la variable en estudio,

por tanto como bigote inferior se empleara al dato de menor valor y como bigote superior al

calculado, ya que esto no altera la distribución de los datos.

Page 22: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

100

Unidad III

En el histograma podemos ver la distribución de los datos que quedan fuera del recorrido

intercuartílico, no obstante el cajón con bigotes revela una simetría entorno a la media, la

cual se pude confirmar con los valores de la misma respecto del recorrido intercuartílico.

Tasa de incremento de

precios al consumo

Page 23: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

101

Unidad III

EJERCICIOS PROPUESTOS

1.- Dos profesores (A y B) están interesados en estudiar los hábitos de sueño de los estudiantes

en sus clases. Ambos profesores registran el tiempo (en minutos) que demoran en quedarse

dormidos sus alumnos desde que empieza la clase. El gráfico muestra los tiempos que

demoran en quedarse dormidos los alumnos del profesor A.

a. ¿Cuál es el valor aproximado de las medidas de dispersión del tiempo del Profesor A?

b. ¿Qué porcentaje de alumnos se queda dormido antes de los 14 minutos con el Profesor

A? Justifique su respuesta.

c. Los datos del Profesor B son los siguientes:

10,5 11,3 11,9 12 12,3 12,3 12,5 12,7 13,4 13,7

13,8 14,2 14,8 15,1 15,3 16,7 16,8 18,8 20,8

Construya un diagrama de cajas correspondiente a los tiempos en que se quedan dormidos los

alumnos en la clase del Profesor B. ¿Qué puede concluir de ambos diagramas de cajas?

Compare.

2.- Los datos siguientes representan una muestra de 80 determinaciones de la emisión diaria de

óxidos de azufre de una planta industrial (en toneladas), ordenados de menor a mayor:

Tie

mp

o e

n m

inu

tos

Fuente: D. F.

Fuente: D. F.

Page 24: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

102

Unidad III

6,2 7,7 8,3 9,4 10,5 … 29,6 31,8 35,0 39,8

A continuación se resumen algunos estadísticos calculados sobre esta muestra:

Máximo = 39,8 toneladas.

Mínimo = 6,2 toneladas.

Cuartil 1 = 14,95 toneladas.

Cuartil 2 = 19,05 toneladas.

Cuartil 3 = 22,95 toneladas.

Promedio = 21,5 toneladas.

a. Intérprete los valores del cuartil 2 y del cuartil 3

b. Represente en un boxplot, el resumen de los 5 números e intérprete.

c. Determine si existen datos anómalos (outliers) en la muestra.

3.- Un análisis realizado para saber el porcentaje de grasa en la leche de 50 vacas han dado los

siguientes datos:

X: porcentaje de

grasa en la leche 𝑛𝑖

[3,45 – 3,55[ 2

[3,55 – 3,65[ 3

[3,65 – 3,75[ 7

[3,75 – 3,85[ 8

[3,85 – 3,95[ 9

[3,95 – 4,05[ 11

[4,05 – 4,15[ 5

[4,15 – 4,25[ 3

[4,25 – 4,35[ 2

a. Calcule e intérprete el recorrido intercuartílico.

b. Represente este conjunto de datos mediante un diagrama de cajón con bigotes

¿Observa algún valor atípico?

4.- Una zapatería para caballeros vende en un día 45 pares de zapatos de las siguientes tallas:

X: Talla 37 38 39 40 41 42 43 44

Fuente: D. F.

Fuente: D. F.

Page 25: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

103

Unidad III

𝑛𝑖 1 3 5 8 12 9 5 2

a. Calcule e intérprete: Mediana

b. Calcule e intérprete: 𝜇𝑥

c. Calcule e intérprete: Cuartiles 1 y 3.

d. Represente este conjunto de datos mediante un diagrama de cajón con bigotes y analice

asimetría.

Fuente: D. F.

Page 26: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

104

Unidad III

3.4 MEDIDAS DE ASIMETRÍA Y CURTOSIS.

EJERCICIOS RESUELTOS

1.- En los cursos de estadística descriptiva, un total de 150 alumnos rindieron el examen final,

obteniéndose las siguientes notas agrupadas en una tabla:

X: Notas 𝑛𝑖

1 2

2 3

3 10

4 15

5 20

6 35

7 45

a. Calcule el coeficiente de asimetría de Pearson. Interprete.

b. Realice un gráfico de barras con los datos.

c. Calcule el coeficiente de curtosis de Fisher. Interprete.

Solución:

a.

Para calcular el coeficiente de asimetría de Pearson es necesario calcular la media, moda y

desviación estándar.

𝜇𝑥 =∑ 𝑥𝑖 ∙ 𝑛𝑖

𝑛𝑖=1

𝑛=

723

150= 4,82

La moda corresponde a la categoría con frecuencia más alta, en éste caso es la nota 7.

𝜎𝑥 = √∑ 𝑛𝑖 ∙ 𝑥𝑖

2

𝑛− 𝜇𝑥

2 = √4309

150− 4,822 = √5,49 ≈ 2,34

𝐴𝑃 =𝜇𝑥 − 𝑀𝑜(𝑥)

𝜎𝑥=

4,82 − 7

2,34= −0,93

La muestra es asimétrica negativa, de modo que la media se sitúa por debajo de la moda.

Fuente: D. F.

Page 27: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

105

Unidad III

b.

c.

𝑔2 =𝑚4

𝑆4=

1𝑛 ∙ ∑(𝑋𝑖 − �̅�)4 ∙ 𝑛𝑖

[1𝑛 ∙ ∑(𝑋𝑖 − �̅�)2 ∙ 𝑛𝑖]

2 =12,11

5,13= 2,36 < 3

Como el coeficiente de curtosis de Fisher es menor que 3 la distribución de los datos es

platicúrtica, lo que quiere decir que existe una baja concentración en relación a una

distribución normal.

Page 28: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

106

Unidad III

2.- En una ciudad, analizamos el nivel de vida a través de la renta anual familiar. Se recoge

información sobre 50 familias. Los datos en millones de pesos, son los siguientes:

3,2 1,1 3,3 0,2 2

1,3 0,8 0,4 3,8 2,6

2,3 3,4 2,8 1,7 1,2

3,2 3,2 2,6 1,1 2,4

2,6 1,6 0,9 2 1,8

3,6 1,3 2,7 2,3 2,3

1,7 2,9 1,2 2,2 2

1,3 1,8 0,8 2,3 1,4

0,9 1,1 2,1 1,7 1,2

2,3 1,6 2,2 1,7 2,1

a. Obtenga medidas de tendencia central, recorrido intercuartílico, la dispersión, la

asimetría y la curtosis.

b. Obtener las medidas mencionadas agrupando los datos en intervalos de amplitud 0,5 y

posteriormente en intervalos de amplitud 1.

c. Comprobar si existen grandes diferencias.

Solución:

En este problema deseamos comprobar si, al agrupar los datos en intervalos, la información

original aportada por los datos en cierta forma se conserva, o por el contrario, hay

diferencias relevantes.

Teniendo en cuenta los resultados concretos procedentes de diferentes familias, recogemos

esta información:

Nº de datos: 50

Mínimo: 0,2 millones

Máximo: 3,8 millones

Media: 1,964

Moda: 2,3

Varianza: 0,7095

Desv. Típica: 0,8423

Primer Cuartel: 1,3

Mediana: 2

Tercer Cuartel: 2,6

Asimetría: 0,1697

Curtosis: -0,5984

Coef. de Pearson: 0,4289

Fuente: D. F.

Page 29: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

107

Unidad III

En este primer análisis, las rentas son valores que oscilan entre 200.000 pesos y 3,8 millones;

la renta media familiar es de 1.964.000 pesos; es una distribución que tiende a ser simétrica

(el coeficiente de asimetría es igual a 0,1697) y el coeficiente de curtosis es negativo, que

indica que la distribución está por debajo de la distribución normal tipificada, es decir, es

platicúrtica.

Agrupemos los datos en intervalos de amplitud 0,5; como la renta toma valores positivos y no

superan el valor 4, podemos considerar rango 0-4.

Renta 𝑥𝑖 𝑛𝑖 𝑁𝑖

[0,0 – 0,5[ 0,25 2 2

[0,5 – 1,0[ 0,75 4 6

[1,0 – 1,5[ 1,25 10 16

[1,5 – 2,0[ 1,75 8 24

[2,0 – 2,5[ 2,25 13 37

[2,5 – 3,0[ 2,75 6 43

[3,0 – 3,5[ 3,25 5 48

[3,5 – 4,0] 3,75 2 50

Como esta información se puede calcular las siguientes medidas:

Media: 1,99

Varianza: 0,7324

Desv. Típica: 0,8558

Moda: 2,2143

Mediana: 2,0385

Asimetría: 0,046

Curtosis: -0,5888

Índice de Pearson: 0,4301

Page 30: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

108

Unidad III

No hay mucha variación respecto del caso anterior; lo más significativo es que la renta media

ahora es 1990.000; si nos guiamos por este procedimiento, comparando este valor medio con

el primero, estaremos sustrayendo a cada familia unos 26.000 pesos.

Los intervalos con mayor frecuencia están situados en el centro; agrupar los datos en un

sentido u otro hace que el coeficiente de asimetría cambie (el nuevo valor es 0’046), aunque

en todos los casos toma valores cercanos a cero.

A pesar de que el intervalo con marca 2,25 es el de mayor frecuencia (por encima de la

gráfica de la distribución normal), los intervalos adyacentes reflejan lo contrario. Debido a

esta situación, el coeficiente de curtosis es negativo.

Si consideramos intervalos con mayor amplitud:

Renta 𝑥𝑖 𝑛𝑖 𝑁𝑖

[0 – 1[ 0,5 6 6

[1 – 2[ 1,5 18 24

[2 – 3[ 2,5 19 43

[3 – 4] 3,5 7 50

Media: 2,04

Varianza: 0,7684

Desviación Típica: 0,8766

Moda: 2,28

Mediana: 2,0526

Asimetría: -0,0331

Curtosis: - 0,6989

Coef. Pearson: 0,4297

Page 31: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

109

Unidad III

3.- Analice el efecto que produce una transformación lineal sobre el coeficiente de variación

de Pearson de una distribución de frecuencias (𝑥𝑖; 𝑓𝑖). Aplique el resultado al caso particular

de un cambio de origen y de escala.

Solución:

Sea V el coeficiente de variación de Pearson de la distribución de frecuencias (𝑥𝑖; 𝑓𝑖),

𝑉 =𝑆

�̅�

donde �̅� y 𝑆 son, respectivamente la media y la distribución típica de la distribución.

La distribución resultante de una transformación lineal, (𝑎 ∙ 𝑥𝑖 + 𝑏; 𝑓𝑖), tiene por media y por

desviación típica:

𝑎 ∙ �̅� + 𝑏

y

|𝑎| ∙ 𝑆

respectivamente.

Por tanto el coeficiente de variación de Pearson de la nueva distribución es

|𝑎| ∙ 𝑆

𝑎 ∙ �̅� + 𝑏

Hay que tener en cuenta que, si 𝑏 es igual a cero y 𝑎 es un número positivo, la distribución

transformada tiene un coeficiente de variación igual al de la distribución de partida, ya que

|𝑎| ∙ 𝑆

𝑎 ∙ �̅�=

𝑎 ∙ 𝑆

𝑎 ∙ �̅�=

𝑆

�̅�

Además, si 𝑏 es cero y 𝑎 es menor que cero, el coeficiente de variación de la nueva

distribución será

𝑉′ =|𝑎| ∙ 𝑆

𝑎 ∙ �̅�= −

𝑎 ∙ 𝑆

𝑎 ∙ �̅�= −

𝑆

�̅�= −𝑉

Ahora bien, puesto que la interpretación del coeficiente de variación es en valor absoluto, al

ser |𝑉′| = |−𝑉| = |𝑉|, puede afirmarse que la distribución inicial y la distribución

transformada tienen idéntica dispersión relativa.

Page 32: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

110

Unidad III

Un caso particular se obtiene si 𝑎 =1

𝑒 y 𝑏 = −

𝑜

𝑒, (𝑒 > 0), esto es, si la transformación lineal

es un cambio de origen y de escala. En tal caso, el coeficiente de variación de la distribución

transformada resultará ser:

𝑉′ =|1𝑒| ∙ 𝑆

1𝑒 ∙ �̅� −

𝑜𝑒

=

1𝑒 ∙ 𝑆

1𝑒

(�̅� − 𝑜)=

𝑆

�̅� − 𝑜

Ya que 𝑒 > 0 implica que |1

𝑒| =

1

𝑒

En consecuencia, el coeficiente de variación de Pearson de una distribución se ve afectado

únicamente por cambios de origen.

Page 33: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

111

Unidad III

EJERCICIOS PROPUESTOS

1.- La dirección general de tráfico está interesada en estudiar la educación vial en los jóvenes.

Para ello selecciona una muestra aleatoria de sujetos que acaban de obtener el carnet de

conducir, correspondiente al grupo 1, y otra con sujetos que lo tienen hace 5 años,

correspondiente al grupo 2, y registra el número de veces que han sido multados en el último

año. Los resultados se muestran a continuación.

Grupo 1: 1, 2, 4, 1. 𝑋1̅̅ ̅ = 2 𝑚𝑢𝑙𝑡𝑎𝑠 𝑆1

2 = 1,5 𝑚𝑢𝑙𝑡𝑎𝑠2

Grupo 2: 2, 7, 7, 8. 𝑋2̅̅ ̅ = 6 𝑚𝑢𝑙𝑡𝑎𝑠 𝑆2

2 = 5,5 𝑚𝑢𝑙𝑡𝑎𝑠2

a. Calcule los índices de asimetría y curtosis para cada grupo. Interprete.

2.- Durante una semana del mes de junio se registraron las temperaturas mínimas en tres

ciudades de chile, las cuales se muestran a continuación:

Antofagasta: 13° 15° 10° 14° 17° 15° 12°

Santiago: 0° 2° 2° 6° 10° 6° 5°

Punta Arenas: -5° -4° 3° -1,3° 0° -4° -1°

a. Calcule el índice de asimetría y curtosis. Interprete.

b. ¿Cuál ciudad tiene temperaturas más simétricas?

c. Grafique y compare.

3.- En un estudio luego de encuestar a 25 familias del sur de Chile sobre el número de hijos

que tenían, se obtuvieron los siguientes datos:

X: Número de hijos 0 1 2 3 4

𝑛𝑖 5 6 8 4 2

Calcule el índice de asimetría y curtosis. Interprete.

4.- Una empresa que instala equipos abridores automáticos para puertas de garaje. Los

minutos necesarios para la instalación de los equipos en una muestra de 10 puestas son los

siguientes:

28 32 24 46 44 40 54 38 32 42

a. Calcule el índice de asimetría y curtosis. Interprete.

Fuente: D. F.

Fuente: D. F.

Fuente: D. F.

Fuente: D. F.

Page 34: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

112

Unidad III

5.- Las siguientes noticias se obtuvieron del diario el mercurio y se presentan a continuación:

5.1

Fuente: Diario Publimetro, 2015.

a. ¿Quién es el individuo en estudio?

b. De las tres muestras, ¿Cuál es el promedio más representativo?

c. De las muestras: Mejores en Lectura y Mejores en Matemática, ¿Cuál de ellas es más

simétrica? ¿Cuál tiene mayor apuntamiento?

Page 35: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

113

Unidad III

5.2

Fuente: Diario Publimetro, 2015.

a. ¿Cuál es la variable de estudio? Clasifíquela.

b. ¿Cuál es la mediana del total de Episodios críticos del 2014?

c. ¿Cuántos fueron el 90% de los episodios críticos del 2015?

Page 36: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

114

Unidad III

CONTROL UNIDAD

1.- Demuestre que:

a. �̅� = 𝑎, 𝑎 es constante.

b. 𝜇𝑥+𝑦 = 𝜇𝑥 + 𝜇𝑦

c. Sea 𝑥1 … 𝑥𝑛, un conjunto de datos.

Si 𝑦 = 𝑎 ∙ 𝑥 + 𝑏, 𝑎 y 𝑏 ctes entonces 𝜇𝑦 = 𝑎 ∙ 𝜇𝑥 + 𝑏

d. 𝑀𝑜 = 𝐿𝑖−1 +𝑛𝑖−𝑛𝑖−1

(𝑛𝑖−𝑛𝑖−1)+(𝑛𝑖−𝑛𝑖+1)∙ 𝑎𝑖

Dónde: 𝐿𝑖 Límite inferior modal.

𝑛𝑖+1 Frecuencia posterior al 𝑛𝑖 mayor.

𝑛𝑖−1 Frecuencia anterior al 𝑛𝑖 mayor.

e. 𝑠𝑥 = √𝑥2̅̅ ̅ − �̅�2

Page 37: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

115

Unidad III

EJERCICIOS TIPO PRUEBA

1.- Al evaluar, durante seis meses, las tasas de delito entre dos ciudades (Ciudad A y Ciudad

B), un investigador encontró que en la Ciudad A, el promedio (media aritmética) de

automóviles robados fue de 25, la mediana de 20 y la moda de 15 automóviles. En la Ciudad B

también el promedio de automóviles robados por día fue de 25, pero la mediana fue de 30 y la

moda de 35. Sobre la base de la información anterior ¿en qué ciudad se sentiría Usted más

seguro para estacionar su automóvil en la calle?

2.- En una ciudad, analizamos el nivel de vida a través de la renta anual familiar. Se recoge

información sobre 50 familias. Los datos en millones de pesos, son los siguientes:

3,2 1,1 3,3 0,2 2 1,3 0,8 0,4 3,8 2,6

2,3 3,4 2,8 1,7 1,2 3,2 3,2 2,6 1,1 2,4

2,6 1,6 0,9 2 1,8 3,6 1,3 2,7 2,3 2,3

1,7 2,9 1,2 2,2 2 1,3 1,8 0,8 2,3 1,4

0,9 1,1 2,1 1,7 1,2 2,3 1,6 2,2 1,7 2,1

a. Calcule: medidas de tendencia central, recorrido intercuartílico, dispersión, asimetría y

curtosis.

b. Calcule: las medidas mencionadas en a) con los datos agrupados en intervalos.

3.- Habiéndose medido el coeficiente intelectual (C.I.) de los alumnos de un colegio se obtuvo

los siguientes resultados:

X: Coeficiente

Intelectual

𝑛𝑖

[61 – 69[ 2

[69 – 77[ 10

[77 – 85[ 12

[85 – 93[ 20

[93 – 101[ 25

[101 – 109[ 18

[109 – 117[ 9

[117 – 125] 4

a. Calcule: Media aritmética y moda.

b. ¿Qué porcentaje del total representan los alumnos que tienen entre 93 y 109 de

coeficiente intelectual?

c. ¿Qué percentil corresponde al C.I. 90?

d. ¿Qué porcentaje de alumnos tienen a los más un C.I. de 101?

Fuente: D. F.

Page 38: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

116

Unidad III

4.- Se tienen datos de la cantidad mensual de lluvia caída en 3 estaciones meteorológicas de

una Ciudad para los 12 meses de 1999.

a. ¿Cuál de las 3 estaciones tiene el mayor rango de lluvia caída en los 12 meses?

Justifique.

b. En general ¿Qué medidas de dispersión se puede calcular en un gráfico de cajas?

c. ¿Cuál es el valor aproximado de las medidas de dispersión en la estación 2?

d. ¿Aproximadamente cuántos meses llovió menos de 8 mm en la estación 1? Justificar.

e. En vista de que la caja de la estación 1 es simétrica, se puede decir que la distribución

de los valores de lluvia caída en la estación 1 será simétrica, Justifique su respuesta.

Estos son los datos de la lluvia caída en la estación 4:

3 5 9 9 9 10 11 11 11 11 12 15

f. Calcule las medidas de tendencia central y de dispersión a estos datos.

g. Dibuje en el gráfico la caja correspondiente a la estación 4.

Llu

via

ca

ída

en

mm

Fuente: D. F.

Fuente: D. F.

Page 39: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

117

Unidad III

5.- El tratamiento de los niños con desórdenes de la conducta puede ser complejo. El

tratamiento se puede proveer en una variedad de escenarios dependiendo de la severidad de los

comportamientos. Además del reto que ofrece el tratamiento, se encuentran la falta de

cooperación del niño/niña y el miedo y la falta de confianza de los adultos. Para poder diseñar

un plan integral de tratamiento, el siquiatra de niños y adolescentes puede utilizar la

información del niño, la familia, los profesores y de otros especialistas médicos para entender

las causas del desorden. Para ello, un siquiatra local ha considerado una muestra aleatoria de

20 niños, anotando el tiempo necesario que requiere en cada niño para lograr un plan integral

del tratamiento, obteniéndose lo siguiente (en horas):

6 7 7 8 8 8 8 9 9 9

9 9 9 9 10 10 10 10 10 11

a. Calcule las medidas de tendencia central y de dispersión de estos datos.

b. Dibuje un diagrama de caja. Comente el resultado acerca de la distribución.

c. Dibuje un polígono de frecuencias. Comente el resultado acerca de la distribución.

6.- Un corrector de textos contabiliza el número de errores que encuentra en cada página.

Después de pasar este corrector por un texto de 50 páginas, se obtiene el siguiente número de

erratas por página:

2 3 5 0 1 4 0 6 2 1 1 0 2 4 5 3 1 2 3 2 3 1 2 4 4

2 5 4 1 3 2 6 8 2 0 1 0 2 3 1 5 10 2 1 3 6 2 0 1 3

a. A partir del enunciado del problema, identifique la variable e indique de qué tipo es.

b. Construya la tabla de frecuencias correspondiente.

c. ¿Cómo sería el diagrama de barras de las frecuencias absolutas? Solamente mirando

este gráfico, ¿Puede determinar cuánto vale la moda? ¿A cuánto equivale?

d. ¿Qué porcentaje de páginas, respecto del total de las que se han corregido, tienen 2

errores?

e. ¿Qué porcentaje de páginas respecto del total tienen menos de 6 errores? ¿Y 6 errores

o más?

f. ¿Qué porcentaje de páginas respecto del total tienen como mínimo 5 errores?

g. Calcule los siguientes estadísticos descriptivos: media aritmética, mediana, moda,

varianza y cuartiles. Con los datos agrupados y sin agrupar. ¿existe alguna diferencia?

h. Compare la media aritmética y la mediana, ¿Entre qué valores se encuentran el 50 %

central de los datos?

i. Construya un diagrama de caja. ¿Hay algún valor anómalo? ¿Cuál es? Identifique e

interprete la asimetría de la distribución: ¿presenta una cola hacia los valores grandes o

hacia los valores pequeños?

Fuente: D. F.

Fuente: D. F.

Page 40: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

118

Unidad III

7.-La siguiente tabla indica la distribución del Coeficiente Intelectual (CI) de 120 alumnos de

cierta Universidad:

X: Coeficiente

Intelectual

𝑛𝑖

[60 – 70[ 2

[70 – 80[ 3

[80 – 90[ 25

[90 – 100[ 46

[100 – 110[ 35

[110 – 120[ 5

[120 – 130[ 3

[130 – 140] 1

a. Complete la tabla de distribución de frecuencias.

b. Calcule la media, moda, mediana, desviación estándar y rango intercuartílico.

Interprete los valores.

c. Construya un box-plot, comentar acerca de la simetría de esta distribución.

d. Si se consideran bien dotados a los alumnos cuyo CI esta sobre el percentil 95, ¿Qué

CI mínimo habrá que tener para ser considerado bien dotado?

e. ¿En qué percentil estaría un alumno con 109 de CI?

f. Determine la proporción de alumnos cuyo CI se encuentra entre 70 y 120.

Fuente: D. F.

Page 41: Unidad III: Medidas de Resumen · 2017. 11. 5. · Medidas de Resumen 82 Unidad III 3.- Calcule la media de las notas obtenidas por 35 estudiantes en una prueba de Estadística Descriptiva,

Medidas de Resumen

119

Unidad III

LECTURA COMPLEMENTARIA.

1.- La mediana en la educación secundaria obligatoria: ¿un concepto sencillo?

Belén Cobo y Carmen Batanero. Universidad de Granada, España.

Resumen

Se presenta un análisis conceptual y didáctico de la mediana, incluyendo sus definiciones

métodos de cálculo y propiedades. El interés del análisis de justifica por la inclusión en los

currículo de la ESO del análisis exploratorio de datos donde la mediana y estadísticos de

orden cobran un papel significativo.

2.- Significado y comprensión de las medidas de posición central.

Carmen Batanero. Universidad de Granada, España.

Resumen

Los nuevos diseños curriculares incorporan la enseñanza de la estadística en la escuela

primaria y secundaria enfatizando el enfoque exploratorio y el trabajo de los alumnos con

proyectos interdisciplinares abiertos. Para afrontar con éxito esta propuesta, el profesor debe

ser consciente de la complejidad de los conceptos estadísticos, incluso los "elementales" cuyo

significado debe construirse progresivamente. Como ejemplo, analizamos los componentes

del significado de las medidas de posición central y describimos las dificultades en su

comprensión, que, respecto a estos componentes se han puesto de manifiesto en las

investigaciones en educación estadística.