Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3....

39
Capítulo Medidas de posición © 2010 Pearson Prentice Hall. All rights reserved 3 3

Transcript of Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3....

Page 1: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

Capítulo

Medidas de

posición

© 2010 Pearson Prentice Hall. All rights reserved

33

Page 2: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

3-2© 2010 Pearson Prentice Hall. All rights reserved

La regla empírica

Page 3: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

La duración de vida de los lagartos en un zoológico en

particular se distribuye normalmente. En promedio duran

3.1 años con una desviación estándar de 0.6 años. Use la

regla empírica para estimar el porciento de lagartos

que duran menos de 2.5 años.

3-3

Aplicaciones de la Regla Empírica

Solución:

Page 4: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

A una gran muestra de mujeres se les midió la presión

arterial sistólica. La presión sanguínea media fue 125

milímetros de mercurio y la desviación estándar fue 10

milímetros de mercurio.

¿Qué porcentaje de mujeres tenía presión arterial entre

105 y 135 milímetros de mercurio?

3-4

Aplicaciones de la Regla Empírica

Page 5: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

En la muestra del ejercicio anterior participaron un total de

400 mujeres. Aproximadamente, ¿cuántas mujeres en la

muestra tenían presiones sanguíneas más altas que 145

ml-hg?

3-5

Aplicaciones de la Regla Empírica (cont.)

Page 6: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

MEDIDAS DE POSICIÓNSec. 3.4

Page 7: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

Medidas de posición

• Las medidas de posición, describen la posición relativa de una cierta observación dentro de todo el conjunto de datos.

– Z-score

– Percentiles

– Quartiles

Page 8: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

z Score (valor estándarizado)

identifica el número de desviaciones estándares al

cual se encuentra un valor por debajo o porencima de la media de un conjunto

Z score (valor Z)

Page 9: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

Para una muestra Para una población

x – µz =

Se redondean valores z a 2 lugares decimales.

Medidas de posición: z Score

z =x – x

s

Page 10: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

Interpretación de valores Z

Siempre que una observación es menor que la media, la puntuación z correspondiente es negativo.

Valores ordinaries o típicos: –2 ≤ z score ≤ 2

Valores atípicos: z score < –2 ó z score > 2

Page 11: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

Ejemplo

Determine cuál medida es más extrema en un hombre: una estatura de 76.2 in. o un peso de 237.1 lb. si sabemos lo siguiente sobre los conjuntos a los cuales pertenecen los datos:

– Estatura promedio de un hombre: 68.34 in– Desviación estándar de las estaturas: 3.02 in– Peso promedio de un hombre: 172.55 lb.– Desviación estándar de los pesos: 26.33 lb.

• Nota: Las estaturas y los pesos se miden en diferentes escalas con diferentes unidades de medida, pero podemos estandarizar los valores de los datos mediante la conversión a puntuaciones z.

Page 12: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

Ejemplo - continuación

• Estatura promedio de un hombre: 68.34 in

• Desviación estándar de las estaturas: 3.02 in

• Peso promedio de un hombre: 172.55 lb.

• Desviación estándar de los pesos: 26.33 lb.

Solución:

Page 13: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

Ejemplo

Determine si los Angelinos de Los Angeles (de la Liga Americana) o los Rockies de Colorado (de la Liga Nacional) tuvieron una temporada de producción de carreras relativamente mejor si:

– Los Angelinos anotaron 773 carreras.– En la Liga Americana la media de carreras anotadas fue

m = 677.4 y la desviación estándar fue s = 51.7 carreras. – Los Rockies anotaron 755 carreras .– En la Liga Nacional el número medio de carreras

anotadas fue m = 640.0 y la desviación estándar fue s = 55.9 carreras.

Sullivan, Michael III. Fundamentos de estadística (página 148). Educación Pearson. Versión Kindle.

Page 14: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

Ejemplo - continuación

• Los Angelinos anotaron 773 carreras.

• En la Liga Americana la media de carreras anotadas fue m = 677.4 y la desviación estándar fue s = 51.7 carreras.

• Los Rockies anotaron 755 carreras .

• En la Liga Nacional el número medio de carreras anotadas fue m = 640.0 y la desviación estándar fue s = 55.9 carreras.

Solución:

Page 15: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

El k-ésimo percentil de un conjunto de datos

• se denota, Pk

• es el valor tal que k porciento de las observaciones

es menor o igual al valor.

• Entonces los percentiles dividen un conjunto de

datos ordenado de forma ascendente en100 partes.

3-15© 2010 Pearson Prentice Hall. All rights reserved

Percentiles

Ejemplo:

𝑃90 se refiere al valor de un conjunto que separa el 90% de los

datos inferiores del 10% de los datos superiores.

Muchos exámenes estandarizados usan percentiles para que los

estudiantes sepan cómo estuvieron sus puntuaciones en relación

con todos los demás estudiantes que tomaron el examen.

Page 16: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

El Graduate Record Examination (GRE) es una prueba necesaria para

la admisión a muchas escuelas graduadas de Estados Unidos. La

Escuela Graduada de Salud Pública de la Universidad de Pittsburgh

requiere una puntuación en el GRE no menor que el percentil 70 para

la admisión en su program graduada de Genética Humana (Fuente:

http://www.publichealth.pitt.edu/interior.php?pageID=101.)

Interprete este requisito de admisión.

3-16© 2010 Pearson Prentice Hall. All rights reserved

EJEMPLO

Page 17: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

3-17© 2010 Pearson Prentice Hall. All rights reserved

Calcular percentiles:

Valor percentil de x = • 100número de valores menores que x

número total de valores

Page 18: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

Determinar el percentil de un valor de

un conjuntoLa tabla siguiente contiene 35 valores que representan los

presupuestos ordenados (en millones de dólares) de una muestra

aleatoria simple de películas taquilleras. Encuentre el percentil para el

valor de $68 millones.

Solución:

Page 19: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

Hallar el valor de un conjunto de datos

que representa el késimo percentil

1. Ordenar los datos de menor a mayor.

2. Calcular 𝐿 =𝑘

100𝑛, donde n es la cantidad de valores, y

k el percentil dado.

3. Si L es un entero, hallar el promedio del valor en la

posición L y la posición L + 1.

4. Si L no es entero, redondearlo al entero mayor. El valor

correspondiente a 𝑃𝑘 es valor en la posición L.

Page 20: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

Ejemplo

Encuentre el presupuesto en el percentil setenta (𝑃70).

Solución:

Page 21: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

Los cuartiles dividen un conjunto de datos en cuartos o 4

partes iguales.

• El 1er cuartil, se denota Q1, separa el 25% inferior de los

datos del 75% superior. Por lo tanto, el 1er cuartil es

equivalente al percentil 25.

• El 2do cuartil, se denota Q2, separa el 50% inferior de los

datos del 50% superior. Por lo tanto, el 2do cuartil es

equivalente a la mediana.

• El 3er cuartil, se denota Q3, separa el 75% inferior de los

datos del 25% superior. Por lo tanto, el 3er cuartil es

equivalente al percentil 75.

3-21© 2010 Pearson Prentice Hall. All rights reserved

Cuartiles

Page 22: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

3-22© 2010 Pearson Prentice Hall. All rights reserved

Cuartiles - resumen

•Q2 es la mediana del conjunto completo.

•Q1 es la mediana de la mitad inferior del conjunto.

•Q3 es la mediana de la mitad superior del conjunto.

Page 23: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

Un grupo de estudiantes recolectó datos sobre la velocidad de

vehículos que viajan por una zona de construcción en una carretera

estatal, donde la velocidad máxima es 25 mph. La velocidad

registrada de 14 vehículos seleccionados al azar, es la siguiente:

20, 24, 27, 28, 29, 30, 32, 33, 34, 36, 38, 39, 40, 40

Determinar e interpretar los cuartiles para la velocidad en la zona de

construcción.

3-23

EJEMPLO Determinar e interpretar los cuartiles

Page 24: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

3-24© 2010 Pearson Prentice Hall. All rights reserved

El rango intercuartil, se denota IQR, es el rango del

50% central de los datos. Esto es la diferencia entre Q3 y Q1 .

𝐼𝑄𝑅 = 𝑄3 − 𝑄1

Rango intercuartil

Page 25: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

20, 24, 27, 28, 29, 30, 32, 33, 34, 36, 38, 39, 40, 40

3-25© 2010 Pearson Prentice Hall. All rights reserved

EJEMPLO Determinar e interpretar el rango intercuartil

para los datos sobre velocidad en la zona de construcción

Page 26: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

Se toma la velocidad de un 15to auto que atraviesa la zona de

construcción y su velocidad es 100 mi/hr. ¿Qué impacto tiene

sobre la media, mediana, desviación estándar y rango intercuartil?

Con 14 autos Con 15 autos

Media 32.1 mph

Mediana 32.5 mph

Desviación estándar 6.2 mph

IQR 10 mph

3-26© 2010 Pearson Prentice Hall. All rights reserved

Resumen: ¿Cuál medida debes reportar?

Forma de la distribución

Medida de tendencia central

Medida de dispersión

Simétrica Media Desviación estándar

Sesgado Mediana Rango intercuartil

20, 24, 27, 28, 29, 30, 32, 33, 34, 36, 38, 39, 40, 40

36.7 mph

33 mph

18.5 mph

11 mph

, 100

Page 27: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

Teorema de Chebyshev

• Dice que, independientemente de la naturaleza de la distribución de frecuencia de una variable, existen límites garantizados para el porciento de observaciones que se encuentran dentro de una cierta cantidad de desviaciones estándares de la media.

• Al menos 1 −1

𝑘2∙ 100% de los datos está

entre 𝜇 − 𝑘𝜎 y 𝜇 + 𝑘𝜎, para k>1

3-27© 2010 Pearson Prentice Hall. All rights reserved

Page 28: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

EJEMPLO Usar el Teorema de Chebyshev

Usando los datos del ejemplo anterior, sobre el HDL total en la

sangre para 54 pacientes del sexo femenino de un médico de

familia,

(a) determine el porcentaje de pacientes, segun Chebyshev, que

tienen un nivel de HDL dentro de 2 desviaciones estándares de

la media.

3-28

(b) determine el porcentaje real de pacientes que tienen un nivel de

HDL en [𝑢 − 2𝜎, 𝑢 + 𝜎2].

35 37 38 39 41 43 44 44 4445 47 47 48 48 48 50 52 5253 54 54 54 55 55 56 56 56

57 58 58 59 60 60 60 61 6262 63 64 64 64 65 67 69 69

70 72 74 74 74 75 77 82 85

Page 29: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

3-29© 2010 Pearson Prentice Hall. All rights reserved

𝑥𝑖 se considera un valor extremo si:

• 𝑥𝑖 < 𝑄1 − 1.5(𝐼𝑄𝑅) ó

• 𝑥𝑖 > 𝑄3 + 1.5(𝐼𝑄𝑅)

donde

𝑄1 − 1.5(𝐼𝑄𝑅) es el límite inferior de los valores típicos

y

𝑄3 + 1.5(𝐼𝑄𝑅) es el límite superior de los valores típicos

Valores Extremos

Page 30: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

3-30

EJEMPLO Determinar valores extremos en el conjunto de

velocidades en la zona de construcción

20, 24, 27, 28, 29, 30, 32, 33, 34, 36, 38, 39, 40, 40

Page 31: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

3-31© 2010 Pearson Prentice Hall. All rights reserved

Cinco valores que resumen un conjunto de datos

son:

Resumen de 5 valores

Mínimo 𝑸𝟏 M 𝑸𝟑 Máximo

Resumen de 5 valores

Page 32: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

Cada seis meses, la Junta de la Reserva Federal

de los Estados Unidos lleva a cabo un estudio de

los planes de tarjetas de crédito en los EE.UU. Los

datos siguientes son las tasas de interés cobradas

por los 10 emisores de tarjetas de crédito,

seleccionados al azar para la encuesta de julio de

2005.

Determine el resumen de cinco valores para los

datos que se muestran a continuación.

3-32© 2010 Pearson Prentice Hall. All rights reserved

EJEMPLO Obtener un resumen de cinco valores

Page 33: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

Institución Taza

Pulaski Bank and Trust Company 6.5%

Rainier Pacific Savings Bank 12.0%

Wells Fargo Bank NA 14.4%

Firstbank of Colorado 14.4%

Lafayette Ambassador Bank 14.3%

Infibank 13.0%

United Bank, Inc. 13.3%

First National Bank of The Mid-Cities 13.9%

Bank of Louisiana 9.9%

Bar Harbor Bank and Trust Company 14.5%

Fuente:

http://www.federalreserve.gov/pubs/SHOP/survey.htm

3-33© 2010 Pearson Prentice Hall. All rights reserved

EJEMPLO Obtener un resumen de cinco valores (cont.)

Page 34: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

3-34

Diagrama de caja

1. Determinar los extremos inferior y superior del diagrama. a) 𝑄1 − 1.5(𝐼𝑄𝑅)b) 𝑄3 + 1.5(𝐼𝑄𝑅)donde IQR = 𝑄3 − 𝑄1

2. Marcar los extremos encontrados en paso 1.3. Dibujar una caja que va desde 𝑄1 hasta 𝑄3. Dibujar una línea

vertical dentro de la caja en M.3. Dibujar una línea desde 𝑄3 hasta el máximo y desde 𝑄1

hasta el mínimo.4. Cualquier valor menor que el extremo inferior o mayor que

el extremo superior se marca con *5. Borrar extremos.

Page 35: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

Institución Taza

Pulaski Bank and Trust Company 6.50%

Bank of Louisiana 9.90%

Rainier Pacific Savings Bank 12.00%

Infibank 13.00%

United Bank, Inc. 13.30%

First National Bank of The Mid-Cities 13.90%

Lafayette Ambassador Bank 14.30%

Wells Fargo Bank NA 14.40%

Firstbank of Colorado 14.40%

Bar Harbor Bank and Trust Company 14.50%

Fuente:

http://www.federalreserve.gov/pubs/SHOP/survey.htm

Usando el resumen

de 5 valores:

Mínimo:

Máximo:

𝑄1 =

𝑄2 ó M =

𝑄3 =

3-35© 2010 Pearson Prentice Hall. All rights reserved

EJEMPLO Construir un diagrama de caja y describir la

forma de la distribución de los datos.

Page 36: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

Paso 1: IQR

Paso 2: límites inferior y superior:

Paso 3:

3-36© 2010 Pearson Prentice Hall. All rights reserved

6.50%, 9.90%, 12.00%, 13.00%, 13.30%, 13.90%, 14.30%, 14.40%, 14.40%, 14.50%Datos:

Page 37: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

El diagrama de caja anterior sobre la taza de interés indica que la

distribución es sesgada hacia la izquierda.

3-37© 2010 Pearson Prentice Hall. All rights reserved

Describir la forma de la distribución de los datos usando un diagrama de caja

Page 38: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

Teorema de Chebyshev

• Dice que, independientemente de la naturaleza de la distribución de frecuencia de una variable, existen límites garantizados para el porciento de observaciones que se encuentran dentro de una cierta cantidad de desviaciones estándares de la media.

• Al menos 1 −1

𝑘2∙ 100% de los datos está

entre 𝜇 − 𝑘𝜎 y 𝜇 + 𝑘𝜎, para k>1

3-38© 2010 Pearson Prentice Hall. All rights reserved

Page 39: Capítulo 33 · 2020-02-24 · 𝑛, donde n es la cantidad de valores, y k el percentil dado. 3. Si L es un entero, hallar el promedio del valor en la posición L y la posición

EJEMPLO Usar el Teorema de Chebyshev

Usando los datos un ejemplo anterior se presentan las edades de los

54 pacientes del sexo femenino de un médico de familia.

(a) Determine el porcentaje de pacientes, segun Chebyshev, que

tienen una edad dentro de 2 desviaciones estándares de la media.

3-39

(b) Determine el porcentaje real de pacientes que tienen una edad en

[𝑢 − 2𝜎, 𝑢 + 𝜎2].

35 37 38 39 41 43 44 44 4445 47 47 48 48 48 50 52 5253 54 54 54 55 55 56 56 56

57 58 58 59 60 60 60 61 6262 63 64 64 64 65 67 69 69

70 72 74 74 74 75 77 82 85