Metodos cuantitativos sesion 4

68
7/28/2019 Metodos cuantitativos sesion 4 http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 1/68 ••••••••••••••••••••••••••• ••••••••••••••••••••••••••••• capítulo Proporcionar una comprensión de las características o propiedades de los datos numéricos (tendencia central, variación, forma) y sus mediciones descriptivas de resumen correspondientes, como una ayuda para el análisis e interpretación de datos. OBJETIVO DEL CAPíTULO Resumen y descripción de los datosnumé.ricos - , ! , 10 3

Transcript of Metodos cuantitativos sesion 4

Page 1: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 1/68

••••••••••••••••••••••••••• • •••••••••••••••••••••••••••••

capítulo

Proporcionar una comprensión de lascaracterísticas o propiedades de losdatos numéricos (tendencia central,

variación, forma) y sus mediciones

descriptivas de resumencorrespondientes, como una ayuda

para el análisis e interpretaciónde datos.

OBJETIVO DEL

CAPíTULO

Resumen

y descripciónde los datosnumé.ricos

- ,

!,

103

Page 2: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 2/68

m Introducción: Lo que sigue

En los capítulos anteriores aprendimos cómo recolectar y presentar datos numéri-

cos tanto en formato tabular como en formato gráfico. Ahora bien, ¿cómo le

sacamos sentido a tal información? Por ejemplo, ¿qué nos dicen los datos de la

Encuesta sobre la sat isfacción de los empleados de Industrias Kalosha de la tabla

2.3 (páginas 33-40)? ¿Cómo puede la B&LCorporation, la compañía de consultoría

sobre beneficios a empleados, usar finalmente estos resultados para desarrollar unpaquete de beneficios para los empleados? Aunque la recolección y la posterior

presentación de los datos son dos componentes esenciales del tema de la estadís

tica descriptiva, éstos no cuentan toda la historia. Un buen análisis de datos no sólo

implíca lapresentación (es decir, la graficación) de los datos numéricos recolectados

y la observación (es decir, el estudio) de lo que los datos tratan de transmitir, sino

que también implica el cómputo (es decir, la caracterización o resumen) de las características clave y la descripción (es decir, el análisis) de los hallazgos. En este capí

tulo, examinaremos estos últimos aspectos: el resumen, descripción y, finalmente,

la interpretación de los datos.Con el fin de presentar las ideas importantes del capítulo, podemos ver en el dia

grama de resumen del capítulo de la página 160 que existen tres características o

propiedades esenciales de los datos numéricos: la tendencia central, la variación y la

forma. Elobjetivo de este capítulo es proporcionar una comprensión de estas características o propiedades de los datos numéricos y sus mediciones descriptivas de

resumen correspondientes, como una ayuda para el análisis e interpretación de datos.Después de concluir este capítulo, usted debe poder:

1. Comprender la propiedad de la tendencia central.

2. Interpretar las diferencias entre las diversas mediciones de tendencia

cent ral corno la media, la mediana, la moda, el alcance medio y el

eje medio.

3. Comprender la diferencia entre la tendencia central y la tendencia

no central.

4. Comprender la propiedad de la variación.

S. Interpretar las diferencias entre las diversas medidas de variación

como el alcance, el alcance intercuartil, la varianza, la desviaciónestándar y el coeficiente de variación.

6. Comprender el papel y el uso de las reglas de Bienaymé-Chebyshev yreglas empíricas.

7. Comprender la propiedad de la forma.

8. Apreciar el valor de las técnicas de análisis de datos exploratorio: los

resúmenes de cinco números y las gráficas de caja y bigotes.

9. Saber cómo aproximar mediciones descriptivas de resumen de una

distribución de frecuencia, polígono u ojiva.

10. Apreciar el valor de paquetes de software estadístico para calcular lasmediciones descriptivas de resumen.

11. Aprender a distinguir entre las mediciones descriptivas de resumen

adecuadas e inadecuadas que se reportan en los periódicos y revistas,

así como las cuestiones éticas implícadas.

m Exploración de los datos

Con elfin de introducir las ideas importantes de este capítulo, regresemos a nuestroanalista investigador de la compañía de servicios de asesoría colegial quien (en elcapítulo 3) deseaba estudiar las colegiaturas cobradas a residentes fuera del estado

104 Capítulo 4 Resumen y descripción de los datos numéricos

,L-':,l ! ~ { ~-------------_.......

Page 3: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 3/68

Exploración de los datos

Observamos que las seis escuelas (registradas en el orden en que fueron selec-cionadas) se presentan junto con sus colegiaturas (en miles de dólares) cobradas a

residentes fuera del estado. ¿Qué puede aprenderse de estos datos que ayude anuestro analista investigador en su evaluación? Basándonos en esta muestra,observamos lo siguiente:

por colegios y universidades de diferentes regiones del país. En particular, se selec-c ionaron tres estados para su inmediata evaluación: Texas, Carolina del Norte yPennsylvania. Suponga, con propósitos exploratorios, que nuestro analista investi-gador debe empezar seleccionando una muestra aleatoria de seis escuelas del listadode poblaciones de 90 colegios y universidades del estado de Pennsylvania (véaseConjunto de datos especiales 1 del apéndice O de las páginas 04-05).

lOS

10.34.98.911.76.37.7

C o l e g i a t ~ r a (en $000)scuelade Pennsylvania

University of Pittsburgh

East Stroudsburg University

Geneva CollegeDrexel UniversityCalifornia Univ. of Pa.Slippery Rock University

1. Los datos están en forma sin procesar. Esto es, los datos recolectadosparecen estar en un orden aleatorio sin un patrón aparente respecto a lamanera en que se enumeran las observaciones individuales.

2. Cada una de las colegiaturas ocurre sólo una vez. Esdecir, ninguna deellas se observa con más frecuencia que cualquier otra.

3. La extensión de las colegiaturas varía entre 4.9 y 11.7 miles de dólares.4. No parece haber ninguna colegiatura inusual o extraordinaria en estamuestra. Arregladas en orden numérico (es decir la clasificación

ordenada), estas colegiaturas (en miles de dólares) son 4.9,6.3,7.7,8.9,

10.3, 11.7. (Si las colegiaturas, en miles de dólares,hubieran

sido 4.9,6.3, 7.7, 8.9, 10.3 Y28.0, entonces 28.0 miles de dólares se hubieraconsiderado una observación extrema o externa.)

Sinuestro analista investigador nos pidiera examinar los datos y presentar un

breve resumen de nuestros hallazgos, entonces lo úni co que básicamente

podríamos esperar hacer, sin más entrenamiento estadístico formal, serían comen

tarios similares a los cuatro anteriores. Sin embargo, al hacer tales comentarios,hemos analizado e interpretado lo que los datos tratan de transmitir. Un análisis esobjetivo; debemos estar de acuerdo con estos resultados. Por otra parte, una inter-pretación es subjetiva;podemos formar diferentes conclusiones al interpretar nues-tros resultados analíticos. De lo anterior, los puntos 2 a 4 se basan en el análisis,mientras que el punto 1 es una interpretación. Con respecto a esta última, no se

hizo ninguna prueba analítica formal (véase la prueba de corridas del capítulo 12),simplemente es nuestra conjetura que no existe ningún patrón de la secuencia

de datos recolectados. Además, nuestra conjetura parecería apropiada si la mues-tra de seis escuelas se extrajo de manera aleatoria e independiente del lis tado depoblación usando los métodos de encuesta descritos en el capítulo 2. Ésefue el casoaquí.

Ahora veamos cómo podemos aumentar nuestra comprensión de lo que losdatos nos dicen al examinar de manera más formal tres propiedades de los datosnuméricos.

Page 4: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 4/68

106 Capítulo 4

DI Propiedades de los datos numéricos

Las tres mejores propiedades que describe una serie numérica de datos son

1. Tendencia central2. Variación

3. Forma

En cualquier análisis y/o intepretación puede usarse una variedad de medi-

ciones descriptivas que representan las propiedades de tendencia central, variacióny forma para extraer y resumir las principales características de la serie de datos. Si

estas mediciones descriptivas de resumen se calculan a part ir de una muestra dedatos, se denominan estadísticas; si se calculan a part ir de una población completa

de datos, se denominan parámetros. Puesto que los estadísticos generalmente toman

muestras en vez de usar poblaciones enteras, nuestro principal énfasis en este textoestá puesto en las estadísticas más que en los parámetros.

m Mediciones de la tendencia central

La mayor par te de las series de datos muest ran una clara tendencia a agruparse

alrededor de un cierto punto central. Así pues, dada cualquier serie de datos par-ticular, por lo general es posible seleccionar algún valor o promedio típico para

describir toda la serie de datos. Estevalor descriptivo típico es una medición de ten-dencia central o de ubicación.

Cinco tipos de promedios a menudo usados como mediciones de tendenciacentral son la media aritmética, la mediana, la moda, el rango medio y el ejemedio.

4 .4 . I La media aritmética

Lamedia aritmética (también llamada lamedia) es el promedio! o medición de

tendencia central de uso más común. Secalcula sumando todas las observacionesde una serie de datos y luego dividiendo el tota l entre el número de elementos

involucrados.

• Introducción de la notación algebraica Por lo tanto, para una muestraque contiene una serie de n observaciones X ,X r ••• r X ! la media aritmética (dadapor el símbolo X, denominado "X barra") p Ú e d ~ escribirse como

X = X! + X 2 + .oo + X n

n

Para simplificar la notación y por comodidad se usa convencionalmente el término

(que significa la sumatoria de todos losvalores X) siempre que deseemos sumar unaserie de observaciones. Esto es, 1

Resumen y descripción de los datos numéricos

Page 5: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 5/68

!X ; =: XI + X 2 + ... + X"i = 1

Lamedia aritmética para esta muestra se calcula como

(4.1)

n

n = tamaño de la muestra

X = iésima observación de la variable aleatoria Xi

x =media aritmética de la muestra

n

IX; =sumatoria de todos los valores X¡de la muestrai = J (véase el apéndice B)

donde

n

IX ¡

X ¡ =1 10.3 + 4.9 + 8.9 + 11.7 + 6.3 + 7.7 = 8.30miles de dólares;

n 6

Aquí observamos que la media se calcula como 8.3 miles de dólares aun

cuando ninguna escuela en particular de la muest ra tenía realmente esa cole

giatura. Además, vemos de la escala de puntos de la figura 4.1 en la página 108que para esta serie de datos tres observaciones son menores que la media y tres son

mayores. La media actúa como punto de equilibrio de tal forma que las observa

ciones menores compensan aquellas que son mayores.Observe que el cálculo de la media se basa en todas las observaciones (X

J, X

z' ... ,

X ) de la serie de datos. Ninguna otra medición de tendencia central comúnmente

usada posee esta característica. Puesto que su cálculo se basa en cada observación,la media aritmética se ve afectada en gran medida por cualquier valor extremo. En

estos casos, la media aritmética presenta una representación distorsionada de lo

que los datos están transmitiendo; así pues, la media no sería elmejor promedio a

usarse para describir o resumir esta serie de datos.

Las reglas relativas a la notación de sumatoria se presentan en el apéndice Ben

las páginas B1-B5. Usando esta notación de sumatoria, la media aritmética de lamuestra puede expresarse de manera más simple como

Para la muestra de nuestro analista investigador, las colegiaturas cobradas a resi

dentes fuera del estado (en miles de dólares) son

X =10.3 en University of PittsburghJ

X = 4.9 en East Stroudsburg University2

X3= 8.9 en Geneva College

X = 11.7 en Drexel University4

X = 6.3 en California Univ. of Pa.s

X = 7.7 en Slippery Rack University6

Mediciones de la tendencia central 107

: 1I

11

I

1'1',:,11, di¡¡I[inJIi:!I',;

!{:¡¡,i,II,'::,;;1.Jl4,J

Page 6: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 6/68

Para continuar demostrando las características de la media, suponga que nues-tro investigador toma una muestra aleatoria de n = 6 escuelas del marco depoblación de 60 en el estado de Texas y otra muestra aleatoria de n = 6 escuelas dell istado de 45 del estado de Carolina del Norte. Las colegiaturas cobradas a resi-dentes fuera del estado (en miles de dólares) se reportan deja siguiente manera:

Figura 4.1Escuela de puntos que representa las

colegiaturas (en $000) en seis escuelas

de Pennsylvania.

o O O O O O! I

t i! I

4 6 10 12

X=8.3

:1']

loa Capítulo 4

Escuela de Texas Colegiatura (en $000)

Concordia Lutheran College 6.4

Southern Methodist University 12.0Texas A& M University 4.9Lubbock Christian University 6.4

Rice University . 8.5Trinity University 11.6

Escuela de Carolina del Norte Colegiatura (en $000)

Methodist College 8.3Warren Wilson College 8.7

Campbell University 7.6Belmont Abbey College 8.3

Catawba College 9.0North Carolina State Uníversity 7.9

Las escalas de puntos respectivas se muestran en las figuras 4.2 y 4.3.Observe que la colegiatura media para cada una de estas muestras también es

8.3 miles de dólares. No obstante, como se observa en las figuras 4.2 y 4.3, las dosmuestras aquí extraídas tienen características claramente distintas, respecto a laotra y respecto a la muestra de seis escuelas de Pennsylvanía descrita en la figura4.1. Por ejemplo , t res de las seis escuelas de Texas tienen colegiaturas bastante

dis tintas de las de la Trini ty Univers ity y de la Southern Methodist Uníversity,

Para esta muestra , la media aritmética presenta una representación algo distor-sionada de lo que los datos están transmitiendo y puede que no sea el mejor

promedio a usarse.Por otra parte, para la muestra de las escuelas de Carolina del Norte y la mues-

tra de las escuelas de Pennsylvania, la media es la medición descriptiva apropiadapara caracterizar y sumar las series de datos respectivas porque no están presentesobservaciones externas.

De hecho, los datos de Carolina del Norte son bastante homogéneos. Dos de las

seis escuelas de esta muestra tienen colegiaturas equivalentes a la media; además,de las figuras 4.1 a 4.3, es claro que las colegiaturas cobradas por estas seis escuelasde Carolina del Norte contienen la mínima cantidad de dispersión o variabilidadentre las tres muestras. Asimismo, también se observa que los datos de colegiaturasde cada una de las muestras de Pennsylvanía y Carolina del Norte poseen lapropiedad de simetría, mientras que no ocurre así con los datos de colegiaturas deTexas. (Las propiedades de variación y forma se abordarán más adelante en las sec-ciones 4.5 y 4.6.)

Resumen y descripción de los datos numéricos

I . J . . ~

__ ,. .4 " ' ~ : ~ ~ l .

Page 7: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 7/68

4.4.2 La mediana

n+ l

2

109ediciones de la tendencia central

7.7.31.7.9.90.3

oo o o 00

I ,

». I I4 6 10 12

Figura 4.1

X=8.3Escala de puntos que representa lascolegiaturas (en $000) en seis

escuelas de Texas.

O00000

I I

l \I I

4 6 10 12

Figura 4 .3

X=8.3Escala de puntos que representa. lascolegiaturas (en $000) en seis

escuelas de Carolina de l Norte.

Regla 2 Si el tamaño de la muestra es un número par, entonces el punto

de posicionamiento cae entre las dos observaciones medias de la

clasificación ordenada. La mediana es el promedio de los valores numéricos

correspondientes a estas dos observaciones medias.

Regla I Si el tamaño de la muestra es un número impar, la mediana se

representa mediante el valor numérico correspondiente al punto de

posicionamiento, la observación ordenada es (n + 1)/2.

• Muest ra de tamaño uniforme Para la muestra de nuestro investigador

de seis escuelas de Pennsylvania, los datos sin procesar (en miles de dólares) fueron

para encontrar el lugar de la clasificación ordenada que corresponde al valor de la

mediana. Se sigue una de dos reglas:

La mediana es el valor medio de una secuencia ordenada de datos. Si no hayempates, la mitad de las observaciones serán menores y la otra mitad serán ma-

yores. La mediana no se ve afectada por ninguna observación extrema de una seriede datos. Por tanto, siempre que esté presente una observación extrema es apro-piado usar la mediana en vez de la media para describir una serie de datos.

Para calcular la mediana de una serie de datos recolectados en su forma sin

procesar, primero debemos poner los datos en una clasificación ordenada. Despuésusamos la fórmula delpunto deposicionamiento

Page 8: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 8/68

La clasificación ordenada se vuelve

4.9

Obsevación

ordenada

6.3

2

10.3

5

11.7

6

Mediana =8.30 miles de dólares

Para estos datos, el punto de posicionamiento es (n + 1)/2 = (6 + 1)/2 = 3.5. Por t';consiguiente, la mediana se obtiene promediando la tercera y la cuarta observa

ciones ordenadas:

7.7 + 8.9 = 8.30 miles de dólares2

Como puede verse en la clasificación ordenada, la mediana no se ve afectada

por observaciones extremas. Sin importar si la colegiatura mayor es 11.7 miles de

dólares, 21.7 miles de dólares o 31.7 miles de dólares, la mediana sigue siendo 8.3miles de dólares.

• Muestra de tamaño no uniforme Si la muestra hubiera tenido unnúmero impar, lamediana estaría representada simplemente por el valor numéricodado a la observación (n": 1)/2 de la clasificación ordenada. Por tanto; en la siguiente

clasificación ordenada de n = 5 colegiaturas de estudiantes GMAf, la mediana es elvalor de la tercera observación ordenada [esdecir, (5+ 1)/2], 590:

500 570 590 600 690

l'Mediana

Observación tordenada 2 3 4 5

• Empates en los datos Alcalcular la mediana, ignoramos el hecho de que

puede haber valores empatados en los datos. Suponga, por ejemplo, que la siguiente serie de datos representa los sueldos de inicio (en miles de dólares) de una mues

tra de n = 7 estudiantes de comercio recientemente graduados de su colegio:

La clasificación ordenada se vuelve

22.6 22.6 23.7

l'Mediana

t3 4 5

Observación

ordenada

24.1

19.8

22.6

21.5

2

27.0 19.8 21.5 23.7

24.1

6

22.6

27.0

7

~ _ .. HM· · +-h.. .· · ' - . - -L .__... t •. • - •. -

110 Capítulo 4

Para esta muestra de tamaño impar, el punto de posicionamiento de lamediana esla (11 + 1)/2 = 4a observación ordenada. Así, lamediana es 22.6 miles de dólares, elvalor medio de la secuencia ordenada, aun cuando la tercera observación ordenadasea también 22.6 miles de dólares.

• Características de la media Para resumir, el cálculo del valor de la mediana se ve afectado por el número de observaciones, no por la magnitud de

Resumen y descripción de los datos numéricos

.""';, .

:1:'

Page 9: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 9/68

4.4.3 Lamoda

cualquier extremo. Cualquier observación seleccionada aleatoriamente tiene la

misma probabilidad de exceder la mediana como de ser excedida por ésta.

vemos que no hay moda. Ninguna de las colegiaturas fue la "más típica".Observe que hay una diferencia entre ninguna moda y una moda de O,como se

ilustra en la siguiente clasificación ordenada de temperaturas de mediodía (OF) enDuluth durante la primera semana de enero:

11.70.3.9.7.3.9

Algunas veces, al resumir o describir una serie de datos, la moda se usa como una

medición de tendencia central. La moda es el valor de una serie de datos que

aparece con más frecuencia. Se obtiene Iácilrnente de Lüid d d ~ i f I c a c i ó n ordenada.Adiferencia de la media aritmética, la moda no se ve afectada por la ocurrencia decualesquier valores extremos. Sin embargo, la moda no se usa para propósitos más

que descriptivos porque es más variable de muestra a muestra que otras medicionesde tendencia central.

Usando la clasificación ordenada de las colegiaturas cobradas en una muestra _

de seis escuelas de Pennsylvania

Clasificación ordenada

(Duluth, Minnesota) _4 ° _2° _1° _1 ° 0° 0° 0°

Moda = 0°

Además, una serie de datos puede t ener más de una moda, como se ilustra en la

siguiente clasificación ordenada de temperaturas de mediodía (OF) en Richmond

durante la primera semana de enero:

Mediciones de la tendencia central I I I

4.4.4 El rango medio

EnRichmond vemos que hubo dos modas, 28° y 43°.Estos datos se describen como

bimodales.

(4.2)

43'3°1 °5°

2

28°

X menores + Xmllyores

28°

Rango medio

Clasificación ordenada

(Richmond, Virginia) 21 °

El rango medio es el promedio de las observaciones menores y mayores de una

serie de datos. Esto puede escribirse como

Usando la clasificación ordenada de colegiaturas cobradas de lamuestra de nuestro

analista investigador de seis escuelas de Pennsylvania:

Page 10: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 10/68

4.9 6.3 7.7 8.9 10.3 11.7

el rango medio se calcula a partir de la ecuación (4.2) como

4.4.5 El ejemedio

El rango medio a menudo es usado como una medición de resumen tanto

po r analistas financieros como por reporteros meteorológicos, puesto que puede

proporcionar una medición adecuada, rápida y simple para caracterizar toda una

serie de datos, sea ésta una serie de precios de acciones diarias al cierre durante todo

un año o una serie de lecturas registradas de temperatura por horas durante todo un

día.

Al tratar con datos como los precios de acciones diarias al cierre o lecturas de

temperatura po r horas, no es probable que ocurra un valor extremo. No obstante,

en la mayoría de las aplicaciones, a pesar de su s impl ic idad , el rango medio debe

usarse con precaución. Dado que involucra sólo las observaciones menores y ma

yores de una serie de datos, el rango medio se distorsiona como una medición deresumen de tendencia central si está presente una observación externa. En tales

situaciones, el rango medio es inapropiado; una medición de resumen de alguna

manera similar en formato al rango medio que siempre es apropiada porque no se

ve afectada por externas es el ejemedio.

X mmOrt:5 + Xml/yores

8.30 miles de dólares

2

4.9 + 11.7

2

Rango medio

El eje medio es el promedio del primery tercer cuartiles de una serie de datos. Es

decir,

Eje medio (4.3)

donde ~ =primer cuartil

es = tercer cuartil

Es una medición de resumen usada para zanjar problemas potenciales introduci-.

dos por los valores extremos de los datos.

112 Capítulo 4

• Cuartiles: Mediciones de ubicación "no central" Además de las

mediciones de tendencia central, también existen algunas mediciones úti les de

ubicación "no central" que se emplean particularmente al resumir o descr ibir las

propiedades de grandes series de datos numérícos." Las mediciones de este tipo más

ampliamente usadas son los cuartiles.

Mientras que la mediana es un valor que divide la clasificación ordenada a la

mitad (50.0% de las observaciones son menores y 50.0% de las observaciones son

mayores), los cuartiles son mediciones descriptivas que dividen los datos ordena

dos en cuatro cuartos.

Resumen y descripción de los datos numéricos

Ii

···.... cW' . @ue " s o , ; **

Page 11: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 11/68

Mediciones de la tendencia central

.Por tanto, ~ puede aproximarse como 6.30 miles de dólares.

En consecuencia, ~ puede aproximarse como 10.30 miles de dólares.Regresando a la ecuación (4.3), ahora podemos calcular el eje medio como

113

1.75ta. _ 2da. observación clasificada

Q¡ = n + 1 observación clasificada4

6 + 1

4

valor correspondiente a n + 1 observación clasificada4

3(n + 1)valor correspondiente a observación clasificada

4=

~ =

3(n + 1)Q3 = 4 observación clasificada

~ = mediana, el valor correspondiente a 2(n + 1) = n + 1 observación clasificada4 2

Elprimer cuartil, Q , es un valor tal que 25.0% de las observaciones son1

menores y 75.0% de las observaciones son mayores.

El segundo cuartil, Q , es la mediana, 50.0% de las observaciones son2

menores y 50.0% de las observaciones son mayores.

El tercer cuartil, Q , es un valor tal que 75.0% de las observaciones sonmenores y 25.0 fYo de fas observaciones son mayores.

Para aproximar los cuartíles, se usan las siguientes fórmulas de punto de posi-

cionamiento:

3(6 + 1)= 5.25ta.;: 2da. observación clasificada

4

Lassiguientes reglas se usan para obtener los valores de cuartiles:

1. Siel punto de posicionamiento resultante es un entero, se elige la

observación numérica particular correspondiente a ese punto deposicionamiento para el cuartil.

2. Siel punto de posicionamiento resultante está a la mitad del camino

entre dos enteros, se selecciona el promedio de sus valores

correspondientes.3. Sie l punto de posicionamiento resultante no es ni un entero ni un

valor a la mitad del camino entre dos enteros, se usa una regla simple

para aproximar el cuartil particular que consiste en redondear al puntode posicionamiento entero más cercano y seleccionar el valor

numérico de la observación correspondiente.

Para calcular nuestro eje medio [véase la ecuación (4.3)], primero necesitamos

calcular ~ y Q. Por ejemplo, de la observación clasificada de las colegiaturas

cobradas (en miles de dólares) a residentes fuera del estado en las seis escuelas dePennsylvania tenemos

Page 12: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 12/68

Page 13: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 13/68

4.4

4.5

Q4.6

4.7

Suponga que, debido a un error, una serie de datos que contiene los cocientes

de precios-ingresos (PE)de nueve compañías negociadas en la Bolsa de Valores

estadounidense se registró como 13,15,14,17,13,16,15,16 Y61, donde el

último valor debería haber sido 16 en vez de 61. Demuestre cuánto se afectan

la media, la mediana y el rango medio por el error (es decir, calcule estas estadís

ticas para los conjuntos de datos "malos" y "buenos", y compare los resultadosde usar diferentes estimadores de tendencia central).

Un fabricante de baterías de linternas tomó una muestra de 13 baterías de la

producción de un día y las probó continuamente hasta que fallaron. Elnúmero de horas que fueran probcdas :u e

342,426,317,545,264,451,1049,

631,512,266,492,562,298

(a) Calcule la media, la mediana, el rango medio y el eje medio. Observando

la distribución de tiempos, ¿qué mediciones descriptivas parecen mejores

y cuáles parecen peores? (¡,Y por qué?)

(b) ¿De qué manera sería útil esta información para el fabricante? Analice.

En la sección 4.5.3 se establece que una propiedad importante de la media

aritmética es

n

¿(Xi -R) Oj = 1

(a) Usando las colegiaturas a residentes fuera del estado de la muest ra de seis

colegios y universidades de Texas (véase la página 108), verifique que se

cumple esta propiedad.

(b) Usando las colegiaturas a residentes fuera del estado de la muestra de seiscolegios y universidades de Carolina del Norte (véase la página 108),

verifique que se cumple esta propiedad.

Los siguientes datos representan los precios (sin receptores de césped) de una

muestra de 15 segadoras mecánicas de bolsa lateral de un alcance de

20 pulgadas:

Marca y modelo

Sears Craftsman 38023Cub Cadet 074RWhite 072RSears Craftsman 38033Sears Craftsman 38045Lawn Chief 50-HMastercut 5020-20Atlas 20 2011 (Winston)RallyA103 CRMurray 20203Sears Companion 38004Sycamore 20-4000

Lawn Chief 60-HWheeler WE20Wheeler WB20

Fuente: Copyright 1990 porConsumers Union of Uníted States,Inc.. Yonkers, N.Y. 10703. Adaptadocon permiso de Consurner Repoits,Junio 1990. pág. 396.

Precio

$150245220200160130160130119

112

114

110

160150127

Mediciones de la tendencia central l iS

Page 14: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 14/68

(a) ¿Cuál es el precio medio? ¿El precio mediano?

(b) ¿Cómo sería de utilidad esta información para una compañía a punto de

comercializar un nuevo modelo? Analice.(c) Si se incluyera una segadora adicional por error en esta muestra (es decir,

una unidad de bolsa posterior que contuviera un conducto de descarga ytuviera un precio total de $320), ¿cuál sería la media y la mediana?

(d) Analice las razones de las diferencias en sus respuestas de (a) y (c).

Los siguientes datos son las cantidades de calorías de una ración de 30 gramospara una muestra aleatoria de 10 tipos de galletas de chispas de chocolate

recién horneadas:

Q4. 8

Producto

Hillary Rodham Clinton'sOriginal Nestle Toll HouseMrs. FieldsStop & ShopDuncan HinesDavíd's

David's Chocolate ChunkGreat American Cookie CompanyPillsbury Oven Lovin'PilIsbury

Calorías

153152146

138130

146

149

138168

147

4.9

Fuente: Copyright 1993 por Consumers Union ofUnited States, lnc., Yonkers, N.Y.10703. Adaptadocon permiso de Consumer Reports, octubre de 1993,págs. 646-647.

(a) ¿Cuál es la cantidad media de calorías? ¿La cantidad mediana de calorías?(b) ¿Cómo sería de utilidad esta información para una compañía a punto de

comercializar una nueva galleta de chispas de chocolate recién horneada?

Analice.

Los siguientes datos son los precios de lista (en dólares) de una muestra

aleatoria de 17 cintas de audio de tipo IV (metal):

4.955.29

3.99

11.005.99

4.59

18.99

3.49

5.50

5.99

3.49

2.99

5.29

3.99

9.95

14.99

3.50

f.¡¡i#t'. p·é+ 'lI" did "'hi'-",· t , . . . . . .·

I 16 Capítulo 4

Fuente: Copyright 1993 por Consumers

Union of United States, Inc., Yonkers,N.Y.10703. Adaptado con permiso deConsumer Reports, enero de 1993,págs. 38-39.

(a) ¿Cuál es el precio medio? ¿El precio mediano?

(b) ,NiNf''''')- ¿Qué otra información desearía conocer antes de comprar una

de estas cintas? Prepare una lista de preguntas que le haría al vendedor.

• 4.10 Los siguientes datos representan la cantidad de fondos (en millones de $)

proporcionada por la Administración de Salud Mental, de Abuso de Drogas yde Alcohol a través de donativos a una muestra de 21 instituciones durante un 'año reciente:

Resumen y descripción de los datos numéricos

Page 15: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 15/68

Mediciones de la tendencia central 117

1,1,

14.9

14.1

6.813.17.6

13.2

5.111.98.57.15.15.06.2

5.53.83.4

3.52.84.115.9

5.7

2,

Cantidad invertida

(en millones $)

124,4,0,,,3,

Nombre de la institución

[ohns Hopkins UniversityUniversíty of California at San FranciscoUníversíty of Washington

Vale University

Stanford UniversityUníversíty of California at LosAngeles

Harvard Uníversíty

University of MichiganUníversity of PcnnsylvaniaColumbia University

Washington University at SI. LouisDuke UniversityUniversity of Minnesota

University of California at San DiegoUníversity of North Carolina

University of Wisconsin

University of RochesterYeshiva Uníversíty

University of Chicago

University of PittsburghCornell University

11.2,21.5,16.4,19.7,14.6,16.9,32.2, 18.2,

13.1,23.8,18.3,15.5,18.8,22.7,14.0

(a) ¿Cuál es la cantidad media de agua usada por familia? ¿Lamediana? ¿El

rango medio? ¿El eje medio?

(a) Organice los datos en una clasificación ordenada o diagrama de tal lo yhojas.

(b) Calcule la media, la mediana, el rango medio y el eje medio.

(e) Describa la propiedad de tendencia central para estos datos.

Durante los últimos diez días de junio, el tren "Shore Special" llegó tarde a su

destino en los siguientes tiempos (en minutos; un número negativo significa

que el tren llegó temprano ese número de minutos):

(a) Si usted fuera contratado por el ferrocarril como estadístico para

demostrar que el tren está proporcionando un buen servicio, ¿cuáles son

algunas de las mediciones de resumen que usaría para lograr esto?

(b) Si usted fuera contratado por una estación de televisión que estuviera

produciendo un documental para demostrar que el ferrocarril está

proporcionando un mal servicio, ¿Qué mediciones de resumen usaría?

(e) Si usted tratara de ser objet ivo y no parcial al aseverar el desempeño del

ferrocarril, ¿qué mediciones de resumen usaría? (Esta es la parte más dura,

porque no puede contestar esto sin hacer supuestos adicionales respecto a

los costos relativos de llegar tarde por diversas cantidades de tiempo.)

Con el fin de estimar cuánta agua se necesitará para abastecer la comunidad de

Falling Rack en la próxima década, el ayuntamiento pidió al administrador

municipal que averigüe cuánta agua usa una muestra de familias actualmente.

La muestra de 15 familias usó el siguiente número de galones (en miles) el

último año:

Fuente: U.S. Department oí Health and Human Services, PublieHealth Servlces.

4.12

Q 4.11

Page 16: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 16/68

(b) Suponga que el ayuntamiento espera que dentro de diez años habrá

45 mil familias viviendo en Falling Rack. ¿Cuántos galones de agua por

año se necesitarán si la tasa de consumo por familia permanece igual?

(c) ¿De qué manera sería úti l la información proporcionada en (a) y (b) para

el ayuntamiento? Analice.

(d) ¿Por qué el ayuntamiento habría usado los datos de una encuesta en vez

de simplemente medir el consumo total de la c iudad? (Piense en el tipo de

usuarios que todavía no están incluidos en el proceso de estimación.)

Problemas intercapitulares de la sección 4.4

4.13

Q

4.14

• 4.15

Usando los registros mensuales de facturación de la compañía de libros por

correo (problema 3.2 de la página 58):

(a) Calcule la media, la mediana, la moda, el rango medio y el eje medio.

(b) Si estuvieran pendientes un total de 350 facturas, use la media para _

estimar la cantidad que se le debe a la compañía. (Sugerencia: Total = NX.)

(e) ,·r;¡N/.Jj.> Escriba un borrador del memorándum que el auditor deseará

enviar al presidente ejecutivo de la compañía de libros por correo respecto

a los resultados.

(d) ¿De qué manera será útil esta información al presidente ejecutivo?

Analice.

Usando los datos sobre la tasa de flu jo máximo de las regaderas (problema 3.3de la página 58):

(a) Calcule la media, la mediana, la moda, el rango medio y el eje medio.

(b) ,·tOíJiiJl.f.!.> Describa la propiedad de tendencia central para estos datos.

Usando los datos sobre cobros de servicios eléctricos y de gas (problema 3.12

de la página 66):

(a) Ca lcu le la med ia, la mediana, la moda, el rango medio y el eje medio.

(b) ,·r;¡jiil.f.!.> Describa la propiedad de tendencia central para estos datos.

4.5. I El rangoEl rango es la diferencia entre la mayor y la menor observación en una serie dedatos. Esto es,

m Mediciones de la variación

(4.4)maror - X meflorango

Una segunda propiedad importante que describe una serie de datos numéricos esla variación. La variación es la cant idad de dispersión o "propagación" en los

datos. Dos series de datos pueden diferir tanto en la tendencia central como en la

variación; o, como se muestra en las figuras 4.1 y 4.3, dos series de datos pueden

tener las mismas mediciones de tendencia central, pero diferir grandemente en tér

minos de variación. La serie de datos que se describe en la figura es mucho

menos variable que la descrita en la figura 4.1 (véanse las páginas 108 y 109).

Cinco mediciones de variación son el rango, el rango intercuartil, la varianza,

la desviación estándar y el coeficiente de variación.

Resumen y descr ipción de los datos numéricosapítulo 418

...

.,__"""" ' . , _ " """""" ' .•,,,,,,,,¡.. ........1'.... . . . - ~ __ , _ ._ ,'oo •

Page 17: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 17/68

Page 18: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 18/68

Page 19: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 19/68

(4.7)

• Cálculo de 52 y de 5 Para calcular la varianza

1. Obtenernos la diferencia entre cada observación y la media

2. Elevarnos al cuadrado cada diferencia

3. Sumarnos los resultados cuadrados

4. Dividirnos la sumatoria entre n - 1

Para calcular la desviación estándar simplemente tornarnos la raíz cuadrada de la

varianza.

Para nuestra muestra de seis escuelas de Pennsylvanía, los datos sin procesar

(colegiaturas) (en miles de dólares) son

10.3 4.9 8.9 11.7 6.3 7.7

y X=8.30 miles de dólares.

La varianza de muestra se calcula corno

¡ = 1

y la desviación estándar se calcula corno

= 6.368 (en miles de dólares cuadrados)

121ediciones de la variación

I;(X; - X)'S = g = \1 í = 1 = f6368 = 2.52 miles de dólares

, n - 1

31.84

5

n - 1

(10.3 - 8.3)2+ (4.9 - 8.3)2+ oo. + (7.7- 8.3)2

6-1

• Obtención de 52 y de 5 Puesto que en los cálculos anteriores elevamos al

cuadrado las diferencias, ni la varianza ni la desviación estándar pueden ser negativas.

La única vez en que S2 y S podrían ser cero sería cuando no hubo variación alguna

en los datos, cuando cada observación de la muestra fuera exactamente igual. En

este inusual caso el alcance también sería cero.

Pero los datos numéricos son inherentemente variables, no constantes.Cualquier fenómeno de interés aleatorio que pudiéramos imaginar generalmente

torna una variedad de valores. Por ejemplo, los colegios y las universidades

cobran distintas colegiaturas a residentes fuera del estado, al igual que la gente

tiene distintos CI, ingresos, pesos, a lturas , edades, velocidades de pulso, etc.

Debido a que los datos numéricos varían de manera inherente resulta tan impor-

tante estudiar no sólo las mediciones (de tendencia central) que resumen los

datos, sino también las mediciones (o variación) que reflejan cómo están disper

sos los datos numéricos.

Page 20: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 20/68

Page 21: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 21/68

Page 22: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 22/68

donde "I X¡2 = sumatoria de los cuadrados de las observaciones individuales;==1

nX2 = tamaño de muestra por el cuadrado de la media de muestra

"IX¡2 _nX2

j 1

"I (X¡ - X)2i ::: 1

n -1

(10.32+ 4.9

2+ ... + 7.7

2) - 6(8.3

2)

6 - 1

(106.09 + 24.01 + ... + 59.29) - 6(68.89)

5

Más aún, puesto que S2 (y S) nunca pueden ser negativas,

445.18 - 413.34

5

= 31.84 = 6.368 (en miles de dólares cuadrados)5 .

la sumatoria de cuadrados, siempre debe ser igualo exceder

S = 6.368 == 2.52 miles de dólares

Í,X¡2 - nX2

i = 1

- 2nX

Las fórmulas de calculadora, ecuaciones (4.8) Y(4.9), son idénticas a las fórmu

las de definición, ecuaciones (4.6) y (4.7). Puesto que los denominadores son

iguales, es fácil mostrar mediante la expansión y el uso de las reglas de sumatoria

(véase el apéndice B)que

y

4.5 .4 El coeficiente de variación

el tamaño de muestra por el cuadrado de la media de muestra.

Regresando a los datos de colegiaturas de Pennsylvania, la varianza y la

desviación estándar se vuelven a calcular usando las ecuaciones (4.8) y (4.9) de la

siguiente manera:

A diferencia de las mediciones previas que hemos estudiado, el coeficiente de

variación es un a medición relativa de variación. Se expresa como un porcentaje

antes que en términos de las unidades de los datos particulares.

Resumen y descripción de los datos numéricosapítulo 424

_

Page 23: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 23/68

Page 24: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 24/68

Page 25: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 25/68

Page 26: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 26/68

Page 27: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 27/68

4.7.1 Resumen de cinco números

Un resumen de cinco números consiste en

xmenor

mediana xmayor

Resumen de cinco números y gráfica de caja y sesgos

! ¡,I i

.. _ . _ ~

119

11.70.3.3.3.9

Para nuest ros datos de colegiaturas de Pennsylvanía, el resumen de cinco

números es

Ahora podemos usar el resumen de cinco números para estudiar la forma de la

distribución. De las reglas anteriores resulta claro que los datos de colegiaturas para

nuestra muestra de seis escuelas de Pennsylvania son perfectamente simétricos.

4.7 .2 Gráfica de caja y sesgos

Combina tres mediciones de tendencia central (la mediana, el eje medio y el rango

medio) y dos mediciones de variación (el rango intercuartil y el rango) para darnos

una mejor idea de la forma de la distribución.Si los datos fueron perfectamente simétricos, lo siguiente se cumpliría:

1. Ladistancia de ~ a la mediana sería igual a la distancia de la mediana

aQ .

2. La distancia de X a Q sería igual a la distancia de Q a X .. . menor . 1 o" J mayor

3. La rnedíana, el eje medío y el rango medio senan todos Iguales. (Estas

mediciones también serían iguales a la media en los datos.)

Por otra parte, para distribuciones no simétricas, lo siguiente sería cierto:

l . En distribuciones sesgadas a la derecha la distancia de n a X~ mayor

excede en gran medida a la distancia de X a ~ .2. En distribuciones sesgadas a la derecha, med1'ana < eje medio < rango

medio.3. En distribuciones sesgadas a la izquierda la distancia de X a ~

excede en gran medida a la distancia de es aX . menor

4. En distribuciones sesgadas a la izquierda rango ñiedio < eje medio <

mediana.

En su forma más simple, una gráfica de caja y sesgos proporciona una repre-

sentación gráfica de los datos mediante su resumen de cinco números. Esta gráfica

se describe en la figura 4.7 de la página 130 para las colegiaturas de las seis escue-las de Pennsylvania.

Lalínea vertical trazada dentro de la caja representa la ubicación del valor de

la mediana en los datos. Observe además que la línea vertical al lado izquierdo de la

caja representa la ubicación de ~ y la l ínea vertical al lado derecho de la caja re-

presenta la ubicación de Por lo tanto, vemos que la caja contiene el 50% de las

observaciones de en medio de la dis tr ibución. El 25% infer ior de los datos estánrepresentados por una línea punteada (es decir, un sesgo) que conecta el lado

izquierdo de la caja con la ubicación del valor menor, X . De manera similar, el

25% superior de los datos están representados por una líñea punteada (es decir, un

sesgo) que conecta el lado derecho de la caja con X .

Esta representación visual de las colegiaturas dé'Strita en la figura 4.7 indica laforma simétrica de los datos. No sólo observamos que la línea mediana vertical está

centrada en la caja, también vemos que los largos de los sesgos son claramente

iguales.

Page 28: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 28/68

Page 29: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 29/68

Cuando una serie de datos es perfectamente simétrica, como sería el caso en

los grupos (a), (d) y (e), el largo del sesgo izquierdo será igual al largo del sesgoderecho y la línea mediana dividirá la caja a la mitad. En la práctica, es poco proba-ble que observemos una serie de datos que sea perfectamente simétrica. Sinembargo, debemos poder establecer que nuestra serie de datos es aproximadamen-

te simétrica si las longitudes de los dos sesgos son casi iguales y la l ínea mediana

divide la caja casi a la mitad.

Por otra parte, cuando nuestra serie de datos está claramente sesgada a la

izquierda o a la derecha, como se presenta respectivamente en los grupos (b) y (c)de la figura 4.8, las longitudes de los sesgos pueden variar considerablemente y no

es probable que la línea mediana esté centrada en la caja. En el grupo (b), por ejem-plo, la naturaleza sesgada (es decir, distorsionada) de la serie de datos indica que

existe un fuerte agrupamiento de observaciones en el extremo superior de la escala(es decir, el lado derecho); 75% de todos los valores de datos se encuentran entre

el extremo izquierdo de la caja (Q) y el f inal del sesgo derecho (X al. En conse-cuencia, el largo del sesgo izquierdo contiene la distribución de sÓlo 25% de lasobservaciones, demostrando la distorsión de simetría en esta serie de datos.

Al observar una serie de datos sesgada a la derecha, como en el grupo (e) de lafigura 4.8, la concentración de puntos de datos estará en el extremo inferior de

la escala (es decir, el lado izquierdo de la gráfica de caja y sesgos). Aquí, 75% de todos

los valores de datos se e n c ~ e n t r a n entre el principio del sesgo i z q ~ i e r d o (Xj1Jen). y

el extremo derecho de la caja (Q), y el restante 25% de las observaciones estan dIS-

persas a lo largo del sesgo derecho en el extremo superior de la escala.

Problemas de la sección 4.7

4.37 Usandolosdatos sobre laduración de bateríasdel problema 4.5 de la página 115:(a) Enumere el resumen de cinco números.(b) Formela gráfica de caja y sesgosy describa la forma.(e) Compare su respuesta en (b) con la del problema 4.29 de la página 127.

Analice.

4.38 Usando los datos de los precios de segadoras(excluyendo la unidad de bolsa

posterior) del problema 4.7 de la página 115:(a) Enumere el resumen de cinco números.(b) Forme lagráfica de caja y sesgosy describa la forma.(e) Compare su respuesta en (b) con la del problema 4.30 de la página 128.

Analice.• 4.39 Usando los datos de las donaciones del problema 4.10 de la página 116:

(a) Enumere el resumen de cinco números.(b) Forme la gráfica de caja y sesgosy describala forma.(e) Compare su respuesta en (b) con la del problema 4.31 de la página 128.

Analice.4.40 Usando los datos de la "tardanza" del tren del problema 4.11 de la página 117;

(a) Enumere el resumen de cinco números.(b) Formela gráfica de cajay sesgos y describa la forma.(e) Compare su respuesta en (b) con la del problema 4.32 de la página 128.

Analice.4.41 Usando los datos del consumo de agua del problema 4.12 de la página 117:

(a) Enumere el resumen de cinco números.(b) Formela gráfica de caja y sesgosy describala forma.(e) Compara su respuesta en (b) con la del problema 4.33 de la página 128.

Analice.

Resumen de cinco números y gráfica de caja y sesgos 131

1:l.';

".....

Page 30: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 30/68

Problemas intercapitulares de la sección 4.7

4.42 Usando los datos sobre la cantidad adeudada a la compañía de libros por

correo del problema 3.2 de la página 58:

(a) Enumere el resumen de cinco números.

(b) Forme la gráfica de caja y sesgos y describa la forma.

(e) Compare su respuesta en (b) con la del problema 4.34 de la página 128.

Analice.

4.43 Usando los datos sobre las tasas de flujo máximo de las regaderas del problema

:1.3 de la página 58:(a) Enumere el resumen de cinco números.

(b) Forme la gráfica de caja y sesgos y describa la forma.

(e) Compare su respuesta en (b) con la del problema 4.35 de la página 128.

Analice.

• 4.44 Usando los datos sobre los cobros de servicios de electricidad y gas del

problema 3.12 de la página 66:(a) Enumere el resumen de cinco números.

(b) Forme la gráfica de caja y sesgos y describa la forma.

(e) Compare su respuesta en (b) con la del problema 4.36 de la página 128.

Analice.

ID Cálculo de mediciones descriptivasde resumen de una población

En las secciones 4.4 a 4.7 examinamos diversas estadísticas que se uti lizan para

resumir o describir información numérica de una muestra. En particular, usamosestas estadísticas para describir las propiedades de tendencia central, variación yforma para los datos de colegiaturas obtenidos de la muestra de n = 6 escuelas de

Pennsylvania. Suponga, sin embargo, que nuestro analista investigador de la compañía de servicios de asesoría colegial ahora desea conducir una investigación más

a fondo de las colegiaturas cobradas (en miles de dólares) a residentes fuera delestado de los 90 colegios y universidades del estado de Pennsylvania (es decir, la

población). Las mediciones resultantes (es decir, los parámetros) calculadas a partir

de la población de N = 90 escuelas de Pennsylvania para resumir y describir laspropiedades de tendencia central, variación y forma podrían ser utilizadas pornuestra analista investigador para escribir un informe al gerente de comercia

lización de la compañía de servicios de asesoría colegial comparando y contrastando las diferencias en tales colegiaturas a lo largo de regiones de Estados Unidos.

4.8.1 Mediciones de la población de tendencia central

• La media de población Lamedia de población está dada por el sím-bolo Ilx ¡ la letra minúscula griega mu subíndice X. Esdecir,

- - - - - - - - - - - - _ . _ - - ~ . ~ _ .

132 Capítulo 4 Resumen y descripción de los datos numéricos

(4.11)

' . , ~ -

Page 31: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 31/68

donde

4.8.1 Mediciones de población de variación

(4.12)

N

N

L(X¡-Jlx)2kl

= sumatoria de todas las diferencias entre los valores X y PI X

2O"X

N = tamaño de la población

X = iésimo valor de la variable aleatoria X¡

NL X¡= sumatoria de todos los valores X¡ de la población¡ =1

; 1

donde

y

N = tamaño de población

X = iésimo valor de la variable aleatoria Xn I

LX = sumatoria de todos los valores X. de la poblaciónj = 1

• El rango y el rango intercuartil de población Elrango y el rango inter-cuartil para una población de tamaño N se obtienen respectivamente como se

describe en las secciones 4.5.1 y 4.5.2 parauna

muestra detamaño n.

• La media, moda, rango medio y eje medio de población La media,

moda, rango medio y eje medio de población para una población de ti'lmi1ño N seobtienen respectivamente como se describió con anterioridad en las secciones4.4.2 a 4.4.5 para una muestra de tamaño n. Simplemente reemplazamos el sím-bolo n con N.

• La varianza y la desviación estándar de población La varianza de

pobladón está dada por el símbolo c:r, la letra minúscula griega sigma subíndiceX cuadrada, y la desviadón estándar de pobladón está dada por el símbolo( j . Esto es,x

Cálculo de mediciones descriptivas de resumen de una población

;=1

N

(4.13)

133

Page 32: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 32/68

Observamos que las fórmulas para la varianza y la desviación estándar depoblación difieren de las de la muestra en que (n - 1) en el denominador de 52 y 5

[véanse ecuaciones (4.6) y (4.7)] se reemplaza por N en el denominador de ¿. y (J .x x

• El coeficiente de variación de población El c oeficien te de

variación de población, dado por el símbolo CV ,mide la dispersión en los

datos relativa él la media. Puede calcularse mediante pob

Los datos sin procesar de las colegiaturas cobradas (en mi les de dóla res) en los

N = 90 colegios y univers idades del estado de Pennsylvania se presentan en el

Conjunto de da tos especiales 1 del apéndice D de las páginas D4-D5. De estosdatos, se obtiene el siguiente diagrama de tallo y hojas revisado (figura 4.9):

(4.14)

donde ( J = desviación estándar en la poblaciónx

u = media aritmética en la poblaciónx

Resultados.8.3

Figura 4.9Diagrama de tallo y hojas

revisado de las colegiaturas

cobradas a residentes fuera de l

estado en 90 colegios y

universidades de Pennsylvania.Fuente: Conjunto de datos especiales1 del apéndice D, páginas D4-D5.

2 73

4 048999

5 056 011113

7 778 33344499 11333445566777710 00122223334667711 24456777912 3613 0235714 123915 24616 14417 017789918 39

19202122 3

114 Capítulo 4

Usando los datos sin procesar o los datos arreglados en el d iagrama de tal lo yhojas, se obtienen las siguientes mediciones de resumen:

Resumen y descripción de los datos numéricos

~ __ - - - ~ - - - -

Page 33: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 33/68

Page 34: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 34/68

Page 35: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 35/68

Page 36: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 36/68

4 .8 .6 Uso de la desviación estándar: La regla empírica

En la mayor parte de las series de datos, un a gran porción de las observaciones tien-

de n a agruparse de alguna manera cerca de la mediana. En las series de datos ses-gadas a la derecha este agrupamiento ocurre a la izquierda (es decir, debajo) de la

mediana y en series de datos sesgadas a la izquierda las observaciones tienden aagruparse a la derecha (es decir, arriba) de la mediana. En series de datos simétri-

cas, donde la mediana y la media so n iguales, las observaciones tienden a dis-tribuirse igualmente alrededor de estas mediciones de tendencia central. Cuando

el sesgado extremo no se presenta y tal agrupamiento se observa en un a serie de

datos, podemos usar la denominada regla empírica para examinar la propiedad

de variabilidad de datos y obtener un a mejor idea de lo que la desviación estándar

está midiendo.

a causa del pequeño tamaño de la mues tra y únicamente debido al azar, las cole-

giaturas cobradas po r los colegios y universidades seleccionadas so n bastantehomogéneas y no logran justificar el rango de las colegiaturas que existe en la

población entera de 90 escuelas. Esto se ilustra claramente en el diagrama de pun-

tos de la figura 4.11. Los datos de muestra no están sesgados a la derecha porqueninguna de las escuelas seleccionadas tuvo un a colegiatura para residentes fueradel estado (puntos claros) que estuviera entre el 30% de las más altas de la

población de escuelas.

• ••L . Jo ._ .1 u . ~ ,

2 4 6 12 14 16 18 20 ~lx= 10.89

Figura 4.11Escala de puntos qu e muestra las colegiaturas cobradas (e n $000) en 90 escuelas de Pennsylvania.

Nota: Figura 4.9.

La regla empírica establece que en la mayoría de las series de datos

encontraremos qu e aproximadamente dos de cada tres observaciones (es

decir, 67°¡b) están contenidas en un a distancia de un a desviación estándar

alrededor de la media y aproximadamente 90 a 95% de las observaciones

están contenidas en un a distancia de 2 desviaciones estándar alrededor de la

media.

Así pues, la desviación estándar, como un a medición de la variación promedio

alrededor de la media, nos ayuda a comprender cómo se distribuyen las observa-

ciones por encima y por debajo de la media y nos ayuda a enfocar y señalar obser-

vaciones inusuales (es decir, externas) al analizar un a serie de datos numéricos.

4 .8 .7 Uso de ladesviación estándar: La regla de BienayméChebyshev

Hace más de un siglo, los matemáticos Bienaymé y Chebyshev (referencia 4) exa-

minaron de manera independiente la propiedad de variabil idad de los datosalrededor de la medía." Encontraron que, sin importar cómo se distribuye un a serie

Resumen y descripción de los datos numéricosapítulo 438 tr- • - " " ' _ ~ - - - - - - L .'" .

Page 37: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 37/68

Page 38: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 38/68

interesante observar que aun cuando los datos de colegiaturas están sesgados a la

derecha en forma, los porcentajes de colegios y universidades con colegiaturas que

caen dentro de una o más desviaciones estándar alrededor de lamedia no son muy

distintos de lo que se esperaría si los datos se distribuyeran como una distribución

gaussiana de campana, simétrica.

Problemas de la sección 4.8

• 4.45 Dada la siguiente serie de datos para una población de tamaño N =10:

7 5 11 8 3 6 2 1 9 8

(a) Calcule la media, mediana, moda, rango medio y eje medio.

(b) Calcule el rango, rango intercuartil, varianza, desviación estándar y

coeficiente de variación.

(e) ¿Están sesgados estos datos? Sí es así, ¿cómo?

4.46 Dada la siguiente serie de datos para una población de tamaño N =10:

7 5 6 6 6 4 8 693

(a) Calcule la media, mediana, moda, rango medio y eje medio.

(b) Calcule el rango, rango intercuartil, varianza, desviación estándar y

coeficiente de variación.

(e) ¿Están sesgados estos datos? Sí es así, ¿cómo?

(d) Compare las mediciones de tendencia central con aquellas del problema4.45(a). Analice

(e) Compare las mediciones de variación con las del problema 4.4S(b). Analice

4.47 Los siguientes datos representan los recibos de impuestos de ventas

trimestrales (en $) presentados al administrador del municipio de Gmoserville

para el periodo que finaliza en marzo de 1994 por los 50 establecimientos de

negocios en esa localidad:

140 Capítulo 4

10.3 11.1 9.6 9.0 14.513.0 6.7 11.0 8.4 10.313.0 11.2 7.3 5.3 12.58.0 11.8 8.7 10.6 9.511.1 10.2 11.1 9.9 9.811.6 15.1 12.5 6.5 7.5

10.0 12.9 9.2 10.0 12.812.5 9.3 10.4 12.7 10.59.3 11.5 10.7 11.6 7.8

.;

10.5 7.6 10.1 8.9 8.6

(a) Organice los datos en una clasificación ordenada o diagrama de tal lo y

hojas.

(b) Calcule la media, mediana, moda, rango medio y eje medio para estapoblación.

(e) Calcule el rango, rango intercuartil, varianza, desviación estándar y

coeficiente de variación para esta población.

(d) Forme la gráfica de caja y sesgos y describa la forma de estos datos de

recibos de impuestos de ventas trimestrales.

(e) ¿Qué proporción de estos negocios tienen recibos de impuestos de ventastrimestrales

(1) dentro de ±1 desviación estándar de la media?(2) dentro de ±2 desviaciones estándar de la media?

(3) dentro de ±3 desviaciones estándar de la media?

(f) ¿Está sorprendido por los resultados de (e)? (Sugerencia: compare y

contraste sus resultados con lo que se esperaría basándose en la reglaempírica.)

(g) t . r ; d ' J l . t . , , ~ Ayude al administrador de este municipio escribiendo un

borrador del memorándum que será enviado al gobernador respecto a losrecibos recolectados.

Resumen y descripción de los datos numéricos

----.- --.,.....---...-_..........._---......,..-_....._

Page 39: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 39/68

Page 40: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 40/68

Figura 4.11Curva en forma de

campana.

MediaMedianaModa

RangomedioEjemedio

ro'

Figura 4.13Dos distribuciones normales de

campana simétricas.

AB

Figura 4.14Dos distribuciones normales de

campana simétricas que difieren

sólo en la tendencia central.

A

/ : ' = - - p ~ l í g o n oI : \: \: \: \

"-La figura 4.16 ilustra tres polígonos hipotét icos: el polígono A es una distri

bución normal de campana simétrica: el polígono L es sesgado a la izquierda o

negativo (puesto que la distorsión a la izquierda es ocasionada por valores extremadamente pequeños); y el polígono Res sesgado a la derecha o positivo (puesto que

la distorsión a la derecha es ocasionada por valores extremadamente grandes).Las posiciones relativas de las diversas mediciones de tendencia central (la

media, mediana , moda, rango medio y eje medio) en distr ibuciones sesgadas

pueden examinarse mejor en las figuras 4.17 y 4.18 de las páginas 143-144.

142 Capítulo 4 Resumen y descripción de los datos numéricos

9> a

r. , -........ ~ - - _ . _ _ - .....-.

Page 41: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 41/68

Page 42: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 42/68

Page 43: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 43/68

Page 44: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 44/68

2420810 12 14 16

Colegiaturas (en $000)

6

......--.. - ..,

,".,.".,.,,,

,•,,,.,..

,.,,4

100

90

80<fJCll 70;:Jo

60fJQ)

Q)

" 50Q)

'roe 40Q)

30a.

20

10

oo 2

Figura 4.22Ojiva de porcentaje de colegiaturas cobradas a residentes fuera del estado en 90 escuelas de

Pennsylvania.Fuente:Los datos fueron tomados de la tabla 4.3,

La mediana puede aproximarse fácilmente a partir de la ojiva de porcentajeilustrada en la figura 4.22. Esto es, ¿50% de las colegiaturas están por debajo de quécantidad? Para determinar esto, como se muest ra en la figura 4.23, se traza una

línea horizontal desde el punto de porcentaje acumulativo especificado (50.0)hasta que ésta interseca la curva "menor que". Lacolegiatura mediana se aproximaentonces bajando una perpendicular (una línea vertical) desde el punto de inter-sección hasta el eje horizontal. De la figura 4.23 observamos que la colegiaturamediana se aproxima como 10.5 miles de dólares.

La moda puede aproximarse a partir de una distribución de frecuenciaeligiendo el punto medio de la clase que contenga la mayor parte de las observa-ciones. Esta clase es la más típica o clase modal. Por tanto, para las 90 escuelas dePennsylvania (tabla 4.3), la clase modal contiene colegiaturas de 10.0 a 12.0 milesde dólares y la moda se aproxima como 11.0 miles de dólares.

El rango puede aproximarse a partir de una distribución de frecuencia prome-diando los extremos posibles, el límite superior del agrupamiento de la última clase(X ) Yel límite inferior del agrupamiento de la primera clase (X Para las

mayo . . 1 n

escuefas de Pennsylvanía, el rango medio es aproximadamente í l miles dedólares (es decir, el promedio de 2.0 y 24.0 miles de dólares).

Para aproximar los cuartiles se usa la ojiva de porcentaje (figura 4.22). Para ~ ,se traza una línea horizontal desde el punto de porcentaje acumulativo 25.0 hasta

que interseca la curva "menor que"; para~ ,

se traza una línea horizontal desde elpunto de porcentaje acumulativo 75.0. Los cuartiles se aproximan entonces ba-jando perpendiculares desde los puntos de intersección hasta el eje horizontal. Dela figura 4.23 observamos que la colegiatura del primer cuartil se aproxima como8.5 miles de dólares, mientras que la colegiatura del tercer cuartil se aproximacomo 13.3 miles de dólares.

Eleje medio puede aproximarse promediando los cuartiles. Para las escuelas dePennsylvania, el eje medio es aproximadamente 10.9 miles de dólares (es decir, elpromedio de 8.5 y 13.3 miles de dólares),

Resumen y descripción de los datos numéricosapítulo 446

-------__- _

Page 45: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 45/68

Page 46: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 46/68

Tabla 4.4 Una comparación de valores reales y aproximaciones

de datos agrupados.

desviación estándar se aproxima generalmente como 4.4 miles de dólares (es decir,un quinto del alcance). Además, el coeficiente de variación se aproxima generalmente como 37.4% (es decir, el cociente de la desviación estándar entre la media,

multiplicado por 100%).

Colegiaturas ($000) en 90 colegios yuniversidades de Pennsylvania obtenidas de

Datos (sin procesar) DatosMedición descriptiva no agrupados agrupados

11.75

10.5

11.0

2.0

24.0

13.0

8.5

13.310.9

22.0

4.8

19.36

4.4

37.4%

Sesgada a laderecha

10.89

10.2

Multimodal2.7

22.3

12.5

8.4

13.310.85

19.6

4.9

15.594

3.95

36.3%

Sesgada a laderecha

MediaMedianaModaXXm

t!tlO1

maror

Rango medio

~Eje medioRangoRango intercuartilVarianzaDesviación estándarCoeficiente de variaciónForma

4.9.3

Comparación de mediciones descriptivas: Valoresreales y aproximaciones de datos agrupados

La tabla 4.4 presenta un resumen de las mediciones descriptivas reales obtenidas

de los datos sin procesar (véase Conjunto de datos especiales 1 del apéndice D de

las páginas D4-DS) y sus aproximaciones correspondientes obtenidas de la dis

tribución de frecuencia y ojiva de porcentaje (véase la tabla 4.3 de la página 145 yla figura 4 .22 de la página 146). Al examinar estos resultados se esclarecerá que las

interpretaciones tabular y gráfica, que son mucho menos complicadas, producen

buenas aproximaciones de los valores reales obtenidos a partir de los cá lculos de

datos no agrupados más laboriosos.

Problemas de la sección 4.9

4.49 Refiérase a los datos de recibos de impuestos de ventas trimestrales delproblema 4.47 de la página 140:

(a) Construya una distribución de frecuencia y una distribución deporcentaje.

(b) ,arme la distribución de porcentaje acumulativo.(e) Grafique la ojiva (polígono de porcentaje acumulativo).(d) Usesustablas en (a) y (b) Yel diagrama en (e):

(1) Aproximela media, mediana, moda, rango medio y eje medio paraesta población.

.,O!

" ..

148 Capítulo 4 Resumen y descripción de los datos numéricos

Page 47: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 47/68

(2) Aproxime el rango, rango intercuartil, desviación estándar y coeficientede variación para esta población.

(3) Describa la forma de los datos .

(e) H'iil'/1,J.j.) Compare y contraste sus aproximaciones en (d) con las delproblema 4.47(b) y (e). Analice.

• 4.50 Refiérase a los datos de donaciones del problema 4.10 de la pag 116:

(a) Construya una distribución de frecuencia y una distribución de

porcentaje.

(b) Forme la distribución de porcentaje acumulativo.

(e) Grafique la ojiva (polígono de porcentaje arumulativo).

(d) Use sus tablas en (a) y (b) Yel di agrama en (e);

(1) Aproxime la media, mediana, moda, rango medio y eje medio paraesta muestra.

(2) Aproxime el rango, rango intercuartil, desviación estándar y

coeficiente de variación para esta muestra.

(3) Describa la forma de los datos.

(e) H!iil?¡'¡'¡" Compare y contraste sus aproximaciones en (d) con las del

problema 4.10 (página 116),4.22 (página 126),4.31 (página 128) y 4.39

(página 131). Analice.

t Problemas intercapitulares de la sección 4.9

4.51 Refiérase a los datos sobre la cantidad adeudada a la compañía de libros por

correo del problema 3.2 de la página 58:

(a) Construya una distribución de frecuencia y una distribución de

porcentaje.

(b) Forme la distribución de porcentaje acumulativo.

(e) Grafique la ojiva (polígono de porcentaje acumulativo).

(d) Use sus tablas en (a) y (b) Yel d iagrama en (e):

(1) Aproxime la media, mediana, moda, rango medio y eje medio para

esta muestra.

(2) Aproxime el rango, rango intercuartil, desviación estándar y

coeficiente de variación para esta muestra.

(3) Describa la forma de los datos.

(e)t.f;ii?,,,.j., Compare

ycontraste

susaproximaciones

en (d)con

lasde los problemas 4.13 (página 118), 4.25 (página 126), 4.34 (página 128) y

4.42 (página 132). Analice.

4.52 Refiérase a los datos sob re las tasas de flujo máximo de las regaderas del

problema 3.3 de la página 58:

(a) Use sus tablas y d iagramas en los problemas 3.13 (página 66), 3.20

(página 70), 3.27 (página 73) y 3.35 (página 77):

(1) Aproxime la media, mediana, moda, rango medio y eje medio para

esta muestra.

(2) Aproxime el rango, rango íntercuartil, desviación estándar y

coeficiente de variación para esta muestra.

(3) Describa la forma de los datos.

(b) t.r;ii?/.].j,) Compare y contraste sus aproximaciones en (a) con las de los

problemas 4.14 (página 118),4.26 (página 127),4.35 (página 128) y 4.43

(página 132). Analice.4.53 Refiérase a los datos sobre los cobros de servicios de electricidad y gas del

problemas 3.12 de la página 66:

(a) Use sus tab las y diagramas en los problemas 3.12, 3.19 (página 70), 3.26

(página 73) y 3.34 (página 77):

(1) Aproxime la media, mediana, moda, rango medio y eje medio para

esta muestra.

Obtención de mediciones descriptivas de resumen de datos agrupados 149

Page 48: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 48/68

_

ISO Capítulo 4

(2) Aproxime el rango, rango intercuartil, desviación estándar y

coeficiente de variación para esta muestra.

(3) Describa la forma de los datos.

(b) rNi1iJI."'." Compare y contraste sus aproximaciones en (a) con las de los

problemas 4.15 (página 118), 4.27 (página 127), 4.36 (página 128) y 4.44

(página 132). Analice.

4.54 Refiérase a los datos de incidencia de cáncer del problema 3.6 de la página 60:

(a) Use sus tablas y diagramas en los problemas 3.15 (página 66), 3.22

(página 70) y 3.29 (página 73) y 3.37(página 78):

(1) Aproxime la media, mediana. rnode. rango nlPQi(' y f'jf.' medio paraesta muestra.

(2) Aproxime el rango, rango intercuartil, desviación estándar y

coeficiente de variación para esta muestra.

(3) Describa la forma de los datos.

(b) '.(MM''''''' Compare y contraste sus aproximaciones en (a) con las delproblema 4.48 (página 141). Analice.

• 4.55 Refiérase a los datos de valores en libros del problema 3.5 de la página 60:

(a) Use sus tablas y diagramas en los problemas 3.14 (página 66),3.21

(página 70) y 3.28 (página 73) y 3.36 (página 78):

(1)Aproxime la media, mediana, moda, rango medio y eje medio para

esta muestra.

(2)Aproxime el rango, rango intercuartil, desviación estándar y

coeficiente de variación para esta muestra.

(3) Describa la forma de los datos.

(b) Use los datos del problema 3.5:(1)Aproxime la media, mediana, moda, rango medio y eje medio reales

para esta muestra.(2) Aproxime el rango, rango intercuartil, desviación estándar y

coeficiente de variación reales para esta muestra.

(3) Describa la forma de los datos.

(c) rNml."'.,. Compare y contraste sus aproximaciones en (a) con las de las

mediciones de resumen reales en (b). Analice.

mm USO de la computadora paraobtener mediciones descriptivasde resumen: La encuesta de

satisfacción de los empleados de

Industrias Kalosha

4.10.1 Introducción y visión general

Al trabajar con grandes series de datos, podemos usar la computadora para ayudarnosen nuestro análisis estadístico descriptivo. En esta sección, demostraremos

cómo varios paquetes de software estadístico pueden usarse para caracterizar yresumir datos numéricos. Apreciaremos la asistencia que la computadora puededarnos en la resolución de problemas estadísticos, particularmente aquellos queinvolucran grandes números de variables o grandes series de datos. (Véanse las referencias 6-9.) Para hacer esto, regresemos a la Encuesta sobre la satisfacción de losempleados de Industrias Kalosha que se desarrolló en el capítulo 2 y para la que se

inició un análisis estadístico descriptivo en la sección 3.8.2,

Resumen y descripción de los datos numéricos

,.,

Page 49: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 49/68

Page 50: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 50/68

Gráfica de caja y sesgos

100 1-

*

40 1-

I II I

10 1-I

400 casos.'

Figura 4.2S

Gráfica de caja y sesgos de salida de 5TATI5TIX.Nota: Existe mucha t1exibilidad entre los diversospaquetes de software estadístico con respecto al diseño ydespliegue de la gráfica de caja y sesgos. Como semuestra aquí, una gráfica de caja y sesgos obtenida porSTATISTlX se imprime verticalmente (con los valoresaltos hasta arriba de la escala) en vez de horizontalmente(con los valores altos del lado derecho de la escala).Además. observamos que los valores extremos y lasexternas potenciales se señalan por separado fuera de lossesgos de la gráfica.

RI 70

N

e

oME

*

*

IS 2 Capítulo 4

en la par te superior de la gráfica de caja y sesgos (figura 4.25) indica que el 25%superior de los ingresos personales de los empleados se encuentran en el amplio

alcance de 37.85 a 91.9 miles de dólares. No obstante, una mayoría sustancial de los

ingresos personales de los empleados (72.75%) cae entre 15.449 miles de dólares y43.661 miles de dólares (es decir, el intervalo formado desde X ± S). Además (del

resumen de cinco números), aunque los ingresos personales varían en valor de 10.1a 91.9 miles de dólares, la "propagación media" o alcance intercuartil va de 18.725a 37.85 miles de dólares.

Para responder la pregunta específica Bde Bud Conley, se requiere una evaluación de diferencias de género en los ingresos personales de los empleados detiempo completo, una clasificación de las respuestas numéricas en las dos categorías de género (hombre y mujer). Este proceso puede realizarse accesando uno

de los paquetes estadísticos. Una vez que se hace esto, para cada agrupamiento de

género se necesitarían tipos de salidas similares a los presentados en las figura 4.24y 4.25. Para resaltar esto, la figura 4.26 (página 153) presenta el conjunto de

mediciones descriptivas de resumen de los ingresos personales de los empleadosde tiempo completo hombres y mujeres, y la figura 4.27 (página 154) ilustra las gráficas de caja y sesgos correspondientes. La salida representada en estas figuras

respectivas se obtuvo accesando SAS y SPSS.

De las figuras 4.26 y 4.27, así como de los diagramas de tallo y hojas de la figura3.18 de la página 87, se observa que mientras las distribuciones de los ingresos personales de los empleados basados en el género están sesgados a la derecha, los

empleados de tiempo completo, hombres, de Industrias Kalosha tienen ingresospersonales sustancialmente más altos que las mujeres. Lasmedias, medianas y ejes

medios correspondientes indican cada una que, en promedio, los ingresos personales de los empleados hombres son de 9 a 10 dólares más. Además, respecto a lavariación, los ingresos personales de los empleados hombres son menos homogéneos que los de los empleados mujeres. Como se indica en las desviaciones están

dar, los rangos y los -rangos intercuarti les obtenidos de la figura 4.26, existesustancialmente más variación en los ingresos personales de los empleados hom-

bres que en los de mujeres. Sin embargo, tales diferencias en los ingresos personales de los dos grupos de género se disipan un tanto cuando se hace unacomparación de los coeficientes de variación. Para los empleados hombres la dispersión relativa de los ingresos personales alrededor de la media es de 45.3%; paralos empleados mujeres, es de 40.9%.

Resumen y descripción de los datos numéricos

Page 51: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 51/68

SEX=MALES - - - - - - - - - - - - - __

U n i va r i a t e Procedure

Vayiable=RINCOME

Moments Quan t i l e s (Def=5)

N 233 Sum Wgts 23 3 100% Max 91 .9 99% 78 .3Mean 33 .70687 Sum 7853.7 75% Q3 42 .7 95% 59 .3S td De v 15 .27374 Var iance 233.2872 50% Med 31 2 90% 52.8skewnes s 0 . 915475 Kur t .o s i s 0 .934922 25% Ql '::2 10% 16.1uss 318846 .2 c s s 54122 61 0% Min 10.2 5% 14 .5cv 45.31344 S td Mean 1 .000616 1% l a 5T:Mean=O 33 .68612 Pr:> ITI 0.0001 Range 81 .7

Num : o 233 Num :> o 23 3 Q3-Ql 20 .7

M!3ignl 116 . 5 Pr:>= IMI 0.0001 Mode 22.5

Sgr, Rank 13630 .5 Pr:>= S 0.0001

- - - - - - - - - - - - _. - - - - - - - - . - - - - - - - - - - - - - - - - . - - - - - - - - - - - - - - - - - _. - - _. SEX=FEMALES - - - - - - - - - - - - - -

U n i va r i a t e Procedure

Variable=RINCOME

Moments Quan t i l e s (Def=5)

Figura 4.26Mediciones de resumen de salida de 5A5.Nota:Como vemos de la salida bajo los encabezados de Moments (momentos) y Quantiles (cuantiles), SAS proporciona un extenso conjunto demediciones de resumen, algunas de las cuales todavía no hemos aprendido y otras que no veremos (véase la referencia 8). Lasmediciones deresumen de interés para nosotros se resaltan en blanco.

Bud Conley también estaba interesado en evaluar otras diferencias de género

potenciales con respecto a las horas trabajadas, la duración del empleo y el númerode promociones. Un análisis estadístico descriptivo basado en las respuestas a éstasy otras preguntas relativas a las variables numéricas de la Encuesta sobre la satisfacción de los empleados (véase Proyecto Encuesta/Base de datos) le hará tener unamejor comprensión de la composición de la fuerza de trabajo de tiempo completode Industrias Kalosha y le ayudará en sus deliberaciones con la B&L Corporationrespecto al desarrollo de un paquete de beneficios a empleados.

Uso de la computadora para obtener mediciones descriptivas de resumen 153

61.740 7

36 .1

14 211 910 3

99%95%90%10%5%1%

52 .7

11.4

15

62 .8

28 .1

21 .9

16 710 .1

RangeQ3-Q1Mode

100% Max75% Q350% Med25% QlC% Min

1673968.4

94.26488

2 .848284

15647 .97

0 .751306

0.0001

1670 .0001

0.0001

Sum WgtsSumVar i an c eKur t os i s

CSSS td MeanPr:> IT INum :> O

~ ~ ~ : I ~ I

16723 .76287

9 .70901

1.433697

109948 .6

40 8578931 .62877

16783 .5

7014

NMeanS td De...

Skewnessu ss

CV

T : ~ e a n = ONU11 A : O

M:s ign)

5g:1 Rank

Proyecto encuesta/Base de datos de la sección 4. 10

Lossiguientes problemasse refieren a los datos demuestra obtenidos del

cuestionario de la figura 2.6 de las páginas 28-29 y presentados en la tabla 2.3 delas páginas 33-40. Deben resolverse con la ayuda de U11 paquete de computadoradisponible.

Suponga que usted es contratado como asistente de investigación de BudConley, el vicepresidente de recursos humanos de Industrias Kalosha. Élle hadado una lista de preguntas (véanse los problemas 4.56 a 4.69) que necesitaresponder antes de su reunión con un representante de B&L Corporation, lacompañía consultora sobre beneficios a empleados que él ha contratado.

Page 52: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 52/68

Page 53: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 53/68

Page 54: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 54/68

T1

universidades de Pennsylvania. En estos términos, sin conocer el contenido de este

capítulo, intentamos analizar e interpretar lo que los datos trataban de transmitir.Nuestro análisis fue objetivo; todos debimos concordar con nuestros limitados

hallazgos visuales: no había un valor de colegiatura típico; la propagación de lascolegiaturas variaba de 4.9 a 11.7 miles de dólares; y no había externas presentes

en los datos. Por otra parte, habiendo leído ahora el capítulo y conociendo diver-sas mediciones descriptivas de resumen y sus puntos fuertes y débiles, ¿cómo

podríamos mejorar nuestro análisis previamente objetivo? ¿No proporciona la

desviación es tándar más información sobre la propiedad de variación que el

alcance? ¿No deberíamos describir la serie de datos como simétrica en forma?Laobjetividad en el análisis de datos reporta las más apropiadas mediciones de

resumen para una serie de datos dada, aquellas que mejor satisfacen las suposi-

ciones sobre la serie de datos dada. En nuestro ejemplo, supusimos adecuaclamente

que los datos estaban en forma sin procesar, es decir, no había patrón de secuenciade los datos recolectados. Si esta suposición se hubiera violado, todavía podríamos

haber hecho comentarios descriptivos objetivos como aquí se indica, pero nohabríamos podido extraer inferencias sobre la población de colegios y universi-

dades del estado de Pennsylvania; tales inferencias dependen de la suposición deque las escuelas muestreadas se seleccionaron aleatoria e independientemente. Por

tanto, sólo a través del conocimiento y la conciencia puede tener lugar un buen

análisis de datos objetivo.

Por otra parte, nuestra interpretación de datos fue subjetiva; podríamos haberformado diversas conclusiones al interpretar nuestros hallazgos analíticos. Todosvemos el mundo desde diferentes perspectivas. El optimista ve un vaso cuyo volu-men contiene 50% de agua como "medio l leno"; el pesimista ve el mismo vasocomo "medio vacío". Algunos de nosotros veremos la clasificación ordenada decolegiaturas en miles de dólares (4.9, 6.3, 7.7,8.9, 10.3, 11.7) Yconcluiremos quelos residentes fuera del estado que asisten a las escuelas de Pennsylvania pagandemasiado; otros, que asisten a instituciones privadas más caras, verán la mismaserie de datos y concluirán que los residentes fuera del estado pagan demasiado

poco. Por consiguiente, puesto que la interpretación de datos es subjetiva, debehacerse de una manera justa, neutral y clara.

4.1 1.2 Prevención de errores en la representación:

Innecesarios adornos tabulares y basura gráfica

Con el fin de analizar e interpretar nuestros datos apropiadamente, primero debe-

mos construir tablas y diagramas apropiados como en el capítulo 3 y luego resumirlos resultados calculando las mediciones descriptivas adecuadas. Con demasiada

frecuencia, al hojear revistas y periódicos, encontramos que, para evitar la presen-tación aburrida de datos, las tablas y diagramas se adornan con diversos iconos y

símbolos para hacerlas atractivas a sus lectores. Desafortunadamente, el "reavivar"una tabla o diagrama a menudo oculta o distorsiona el mensaje pretendido que losdatos transmiten.

Como ejemplos de una buena y una mala presentación tabular, compare latabla 4.5 con la tabla 4.6 de las páginas 157 Y158, respectivamente. En la tabla 4.5,el adorno (es decir, las banderas que representan los;;íses particulares) de hecho

acrecienta la información que se está transmitiendo. Este no es el caso en la tabla4.6, donde los adornos extra innecesarios disminuyen la información que se estátransmitiendo.

Observe que en esta últ ima presentación el adorno (es decir, las barras hori-zontales) "intenta" producir una gráfica de barras horizontal de una tabla combi-

nando las calificaciones de verbos y matemáticas promedio. ¿Por qué? Dejemos

:

Resumen y descripción de los datos numéricosapítulo 4ses

- - - - - - - - - . . - ~ - - - - ~ ........_ . . . . . " . . . , - ~ - = - - - ~ ~ ~ - - - - ~ - . . , . , . - , - - - - .

Page 55: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 55/68

Page 56: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 56/68

Test Results

Tabla 4 .6 Presentación"inaprcplada"de califica.ciones 5ATpor estado.

Del.

Me.

Ky.

La.

Fla.

Ga.

111.

Ind.

u.s,

R.I.

S.C.

5.0.

Tex.

D.C.

Nevo

Ariz.

Kan.

Neb.

Iowa

Utah

VI.

N.H•

N.J.

N.M.N.Y•

N.C.

N.O•

Colo.

Ohlo

Okla.

Ore.

Pa.

Ark.

Calit.

Idaho

Miss.

Tenn.

Mlnn.

Mich.

Conn.

Mo,

Mont.

Mass.

Va.

Wash.

Hawail

Ala.

Alaska

W. Va.

Wls.

Wyo.

Sovrce Col/ege Bo,lId

Average S AT verbal andmath scores In 1993 A

number ot variables can

rnake state-by-statecornpansons cutrcutt The

tcp poss.blc score Ineachcalegcry IS 800

1VERBAL ! MATH

-.. - ..JL ._ 4 ; ~ 4 . ~48 0 tI14311111Kw

. 4 4 4 1 1 1 Em4 7 B ~' 4 1 S ~L 4 s 4 ~430.-ua

· ' ¡ ~ 9 . - m4 0 S ~4 1 6 ~; ¡ 9 9 ~4 0 1 ~4 6 5 ~, 47 5 ti'4 0 9 ~

1:%1

494 jl:1

47 6 1 ; )

48 1 ti'4 2 2 ~Md. : •• 4;.31 ~

42.7.-m

,469 fJ:I

19i148 1 tt ,

~ ~ 1 - 5 tf)45 9 1'147 9 "fi"' 4 3 2 ~4 4 2 ~

.. 1 9 ~47 8 t+1

416-.uJ

. 4 0 6 ~518 j:".. . ¡ ~ ~

. . , . . 4.82. ;fJl!

.. 4 ; 4 ; 1 . ~41 8 ¡¡¡¡¡¡¡w4.19.-eJ

396-m

50 2 i"1:'

48 6 j ' !

.413 .-:fI). ~ o o triP'4 2 6 ~4 2 5 ~' 4 3 5 ~4 3 9 ~4851' %i'4 6 3 ~

- . _ - ~ - - - - - - - - - - - - - - - - - - -

Fuente: The New York Tinies, agosto ]9 de 1993, pág. A16.

Resumen y descripción de los datos numéricosapítulo 4S S

Page 57: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 57/68

Page 58: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 58/68

Diagrama de resumen del capítulo 4.

Propiedades dedatos numéricos

l

I '1 I

TendenciaVariación Forma

central

- Media 1 -- Rango 1-- Gráfica decaja y bigotes

t - - Mediana 1 -- RangoIntercuartil ,

t--- Moda t - - Varianza

1 -- Rango medio 1-- Desviaciónestándar

t-- Eje medio 1--Coeficientede variación

'-o

Ao aqrupados Agrupados

)deatos

I 1 r r I

Datos sin Clasificación Diagrama de DistribuciónPolígono Ojiva

procesar ordenada tallos y hojas de frecuencia

160 Capítulo 4

!:I'm Resumen y descripción de datos

numéricos: Un repaso

Como se observa en el diagrama de resumen siguiente, este capítulo trató sobre el

resumen y descripción de datos. En la página 104 de la sección 4.1 se le dio una

lista que ponía énfasis en los puntos importantes a estudiarse en el capítulo. Revise

la lista ahora para ver si siente que tiene una comprensión de estos puntos clave. Para

estar seguro, usted debe poder responder las siguientes preguntas conceptuales:

1. ¿Qué debemos buscar al intentar caracterizar y describir laspropiedades de una serie de datos numéricos?

2. ¿Qué queremos decir con la propiedad de ubicación o tendencia

central?3. ¿Cuáles son las diferencias entre las diversas mediciones de

tendencia central como la media, mediana, moda, rango medio y ejemedio, y cuáles son las ventajas y desventajas de cada una?

Resumen y descripción de los datos numéricos

Page 59: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 59/68

Juntando todo

1,.

.,

.;

1

",¡ •

1')

I!nIl'¡'i61érminos clave

forma sin procesar105

gráfica de caja y sesgos 129

media 106

media aritmética 106

media de población 132

mediana 109

mediciones de resistencia 114

moda 111

promedio 106

propagación media 11 9

propiedades de los datos numéricos 106

Q1: primer cuartil 113Q2: sgundo cuartil 113

Q3: tercer cuartil 113

análisis de datos104

clase modal 146

cuartiles 112

coeficiente de variación 12 4

coeficiente de variación de población134

datos agrupados 141

datosno agrupados 141

desviación estándar 120

desviación estándar de población 133

ejemedio 112

escala de puntos 107

externa o valor extremo 105

forma 127

TÉRMINOS CLAVE

4. ¿Cuál es la diferencia entre mediciones de tendencia central y detendencia no central?

S. ¿Qué queremos decir con la propiedad de variación?

6. ¿Cuáles son las diferencias entre las diversas mediciones de variación

como el rango, rango intercuartil, varianza, desviación estándar y

coeficiente de variación, y cuáles son las ventajas y desventajas de

cada una?

7. ¿Cómo ayuda la regla de Bienayrné-Chebyshev y la empír ica a

explicar las formas en que las observaciones de una serie de datosnuméricos se agrupan, congregan y distribuyen?

8. ¿Qué queremos decir con la propiedad de forma?

9. ¿Por qué son tan útiles las técnicas de análisis de datos exploratorias

y la gráfica de caja y sesgos?

10. ¿Cómo podemos aproximar mediciones descriptivas de resumen a

partir de una distribución de frecuencia, un polígono o una ojiva?

11. ¿Cuáles son algunas de las cuestiones éticas pertinentes al distinguirentre el uso de mediciones descriptivas apropiadas e inapropiadas

reportadas en periódicos y revistas?

Verifique la lista de preguntas para ver si verdaderamente conoce las respues

tas y podría (1) explicar sus respuestas a alguien que no leyó este capítulo y (2) dar

referencia de lecturas o ejemplos específicos que apoyen su respuesta. Asimismo,vuelva a leer cualquiera de las secciones que pudieran haber parecido confusas para

ver si ahora tienen sentido.

Page 60: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 60/68

rango 118

r ango intercuar ti l 119

rango medio 111

regla de Bienaymé-Chebyshev 139

regla empírica 1 38

resumen de cinco números 129

sesgo 127

sesgo a la derecha 127

sesgo a la izquierda 127

simetría 127

tendencia central o ubicación 106

variación o dispersión 118

varianza 120

varianza de población 133

107

)V24')0 '

;-s:36

. 2 S - ~ ·}2

78

%~ S - . -

.10' }ffFuente: Copyright 1992 por Consumers Union oí United States,Inc., Yonkers, N,Y. 10703. Adaptado con permiso de ConsumerReports, diciembre de 1992, págs, 780-781.

t H ¡ ¡ ¡ J 1 . z . ¡ . ~ Escriba una carta a un amigo resaltando lo que considera lascaracterísticas más interesantes o importantes de este capítulo.

Explique la diferencia entre una estadística y un parámetro.

Una serie de datos numéricos tiene tres propiedades principales. Defina estaspropiedades y dé ejemplos de cada una.

Los siguientes datos son los precios al por menor (en dólares) para una muestra aleatoria de 32 modelos telefónicos de cordón:

Manhattan$955 $1000 $985 $980 $940 $975 $965 $999 $1247 $1119BrooklynHeights$750 $775 $725 $705 $694 $725 $690 $745 $575 $800

(a) Analice completamente los datos.(b) tNd'i/.z.¡..,Escriba un artículo para un periódico que se distribuye entre

los consumidores para informarles sobre este tema.

4.77 Los siguientes datos son los precios de renta mensual para una muestra de 10apartamentos de estudio no amueblados en Manhattan y una muestra de 10apartamentos de estudio no amueblados en Brooklyn Heights:

4.73

4.74

4.75

4.76

(a) Para cada serie de datos calcule la media, mediana, eje medio, rango,rango intercuartil, desviación estándar y coeficiente de variación.

(b) ¿Qué puede decirse sobre los apartamentos de estudio no amueblados que

se rentan en Manhattan f ren te a los que se rentan en Brooklyn Heights?(c) t · t ; ¡ ¡ i J / , z · , . ~ ¿Cómo podría ser de utilidad esta información para un

individuo que desea cambiarse al área de Nueva York?Escriba un artículosobre esto para la columna de bienes raíces de su periódico local.

V 4,78 El artículo deGlenn Kramon "Persuadiendo al elefante de Stanford para que

baile" (The New York Times Sunday Business Section, noviembre 1] de 1990)implica que los costos del Centro Médico de Stanford se han incrementado

más que en las instituciones competidoras porque es más probable que elprimero atienda a indigentes, Medicare, Medicaid y pacientes más enfermos ycomplejos. Para ilustrar esto, se proporciona un diagrama que describe una

comparación de cobros promedio de hospitales en 1989-1990 por tresprocedimientos médicos (derivación coronaria, nacimiento simple e implante

de piel) en tres instituciones competidoras (El Camino, Sequoia y Stanford),

Problemas de repaso del capítulo

Resumen y descripción de los datos numéricosapítulo 4G2

Page 61: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 61/68

lj. ~

163roblemas de repaso del capítulo

8.4

9.210.79.59.8

Injerto

10.6

10.1

8.57.59.3

Escuelas preparatorias

de l oeste medio

7.98.2

9.1

9.3

8.8

[ ; h ' ; T J ~ El Camino

O Sequoia

OStanford

9.6

9.111.2

10.5

9.9

8.9

9.3

9.710.4

10.0

N/A

Desviación coronaria Nacimiento simple

Escuelas preparatorias

de l nordeste

10.5

10.1

10.0

11.0

9.1\

Los costos de El Camino son el promedio de los cobros alias y bajos de un nacimientosimple con una estancia de dos días y un injerto con una estancia de nueve días.

Los costos de Sequoia son promedios del 50% medio de todos los cobrospor cada operación.

Los datos de Stanford son el costo promedio de todas las operaciones.

4.80

Su directora ejecutiva sabe que usted está tomando actualmente un curso de

estadística y lo llama para discutir el art ículo. Ledice que anoche, al sajó r de

una junta de directores de hospitales, uno de ellos mencionó que este

diagrama carece totalmente de sentido y le pid ió su opinión. Ella le pide queusted prepare su respuesta. Usted sonríe, toma aire y le contesta ...

4.79 Un colegio lleva a cabo un fonotón para recabar fondos para la construcción

de un Centro de Artes. Eldirector esperaba obtener medio millón de dólares

para este propósito. Los datos siguientes representan las cantidades prometidas

(en $000) por todos los exalumnos que fueron llamados durante las primeras

nueve noches de la campaña.

16, 18, 11,17,13,10,22,15,16(a) Calcule la media , mediana y desviación estándar.

(b) Describa la forma de esta ser ie de datos.(c) Estime la cantidad total prometida (en $000) por todos los exalumnos si

la campaña durara 30 noches. (Sugerencia: Total = N5(.)

(d) '·¡'iil'li.].f.> Escriba un memorándum al director resumiendo susresultados hasta la fecha y, si fuera necesario, ofreciéndole cualquier

recomendación necesaria.(e) ¿Cómo podría ayudar esta información al director? Analice.

Los datos siguientes representan las colegiaturas cobradas (en $ miles) en una

muestra de 15 escuelas preparatorias del nordeste y en una muestra de 15

escuelas preparatorias del medio oeste durante el año académico 1993-1994:

Lo que Cuesta el Cos to de la Sal ud

Una comparación de precios hospitalarios promedio en 1989-1990 en Californiapara varias operaciones. Los Hospitales Sequoia y El Camino son la principalcompetencia local del Centro Médico de Stanford.

Fuente: Centro Médico de Stanford, Hospital Sequoia y Hospital El Camino.

~O

O

50,000

40,000

<IJ 30,000ltl

:oO 20,000

10,000

O

L-.---__

.J

Page 62: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 62/68

' · .- - ~ _

164 Capítulo 4

(a) Para cada serie de datos calcule la media, mediana, eje medio, rango,

rango intercuartil, desviación estándar y coeficiente de variación.

(b) Para cada serie de datos forme el diagrama de tal lo y hojas y la gráfica de

caja y sesgos.(c) Enumere el resumen de cinco números e interprete la forma de cada serie

de datos.

(d) Resuma sus resultados.

(e) t·to;iilJl.f.j.> Suponga que t iene un primo que le pide consejo respecto al

costo de asistir a una escuela preparatoria en el nordeste en comparación de

una del medio oeste. Escríbale una carta basándose en su resumen de (d).4.81 Wisconsin Power & Light estaba interesada en mejorar la eficiencia de los

sistemas de calefacción por gas domésticos y usted es contratado para

participar en la investigación de este problema. Para obtener una mejor

comprensión del problema, usted decide hacer un a encuesta sobre el consumo

actual de energía en hogares de una sola familia.

Lasiguiente distribución de frecuencia representa el consumo de energía

promedio (en BTU)por hogar unifamiliar durante un periodo de dos semanas

para una muestra aleatoria de 90 hogares a lo largo del estado de Wisconsin:

Consumo de energía

(BTU) Núm. de hogares

2.4 pero menos de 4.8 24.8 pero menos de 7.2 67.2 pero menos de 9.6 259.6 pero menos de 12.0 2912.0 pero menos de 14.4 1614.4 pero menos de 16.8 816.8 pero menos de 19.2 319.2 pero menos de 21.6 ~Total 90

(a) Forme las tablas y diagramas apropiados y analice completamente los

datos.

(b) t . r ; i I l J l . f . j . ~ Escriba un informe preliminar para el presidente ejecutivo.

Problema intercapitular

4.82 Refiérase a los datos del problema 3.8 (página 61) que representan la cantidad

de tiempo (en segundos) necesaria para llegar de Oa 60 mph durante una

prueba de carretera para una muestra de 22 modelos de automóviles alemanes

y una muestra de 30 modelos de automóviles japoneses:

(a) Usando sus tablas y diagramas de los problemas 3.17 (página 66), 3.24

(página 70), 3.31 (página 73) y 3.39 (página 78):

(1)Aproxime la media, mediana, moda, rango medio y eje medio para

cada muestra.

(2)Aproxime el rango, rango intercuartil, desviación estándar y

coeficiente de variación para cada muestra.

(3) Describa la forma de cada serie de datos.

(b) Usando sus datos del problema 3.8:

(1)Calcule la media, mediana, moda, rango medio y eje medio reales para

cada muestra.

(2)Calcule el rango, rango intercuartíl, desviación estándar y coeficiente

de variación reales para cada muestra.

(3) Describa la forma de cada serie de datos.

(c) t . r ; d f ) ¡ . f . j . ~ Compare y contraste sus aproximaciones en (a) con las

mediciones de resumen reales en (b). Analice.

(d) , . r ; d ' J ¡ " " ' ~ Escriba un artículo para una revista que trate sobre

automóviles resumiendo sus hallazgos.

Resumen y descripción de los datos numéricos

Page 63: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 63/68

Proyectos de minicasos deaprendizaje colaborativo

Proyectos de minicasos de aprendizaje colaborativo

Nota: La e/ase debe dividirse engrupos de tres o cuatro estudiantes. Inicialmente seselecciona un estudiante paraqueseacoordinador delproyecto, otro estudiante esquien registra elproyecto y 1111 tercero esel cronometrador del proyecto. Para quecada

estudiante ganeexperiencia enel desarrollo del trabajo de equipo y en las habilidadesde liderazgo, después de cada proyecto debe haoer una rotacion deposicumes. Al prin-cipio de cada proyecto, los estudiantes deben trabajar silenciosa e individualmentedurante un corto periodo de tiempo especificado. U/la vezquecada estudiante hatenido la oportunidad de estudiar los asuntos y de reflejar SI/S posibles respuestas,elgrupo se reúne y se sigue con una discusián degrupo. Si todus losmiembros deungrupo están deacuerdo con las soluciones, el coordinador es responsable depresentarla solución delproyecto del equipo al instructor con las firmas de losestudiantes indi-cando tal acuerdo. Por otra parte, si 11/10 omás miembros del equipo noestán de

acuerdo con la solución ofrecida porlamayoría del equipo, una opinión deminoríapuede anexarse al proyecto presentado, con firma(s).

165

-----_._----------- ; ~

CL4.1 Refiérase a CL 3.1 de la página 101. Su grupo, la Corporación ,hasido contratado para ayudar al analista investigador de la compañía deservicios de asesoría colegial a terminar su informe respecto a las colegiaturascobradas a residentes fuera del estado por colegios y universidades endiferentes regiones del país. En particular, usando elConjunto de datosespeciales 1 del apéndice O de las páginas 04-0S respecto a las colegiaturascobradas a residentes fuera del estado en los 60 colegios y universidades delestado de Texas, 4S instituciones de Carolina del Norte y 90 escuelas dePennsylvanía, la Corporación está preparada para:(a) Delinear cómo procederán los miembros del grupo con sus tareas

(b) Obtener diversas mediciones descriptivas de resumen para cada una de

estas poblaciones.

(e) Escribir y presentar un resumen ejecutivo, comparando y contrastando los

resultados a lo largo de los tres estados.

(h) Preparar y ofrecer una presentación oral de diez minutos al gerente de

comercialización.

Refiérase a CL 3.2 de la página 101. Su grupo, la Corporación , hasido contratado por el editor de la sección de comida de una popular revistafamiliar para estudiar el costo y características nutricionales de los cereales listos para comerse. Habiendo preparado las tablas y diagramas apropiados (véaseCL 3.2), la Corporación está preparada para arn piiar su análisispreliminar. Provisto del Conjunto de datos especiales 2 del apéndice O de laspáginas 06-07 que muestra información útil sobre 84 de estos cereales:(a) Delinee cómo procederán los miembros del grupo con sus tareas.

(b) Obtenga diversas mediciones descriptivas de resumen sobre costo, peso,

calorías y azúcar (en gramos por ración), desglosadas por el tipo de cereal.

(e) Escriba y presente un resumen ejecutivo describiendo los resultados.

(d) Prepare y ofrezca una presentación oral de diez minutos al editor de

comida de la revista.

Refiérase a CL 3.3 de la página 102. Su grupo, la Corporación , hasido contratado por el director de comercialización de un fabricante deconocidas fragancias de hombres y mujeres para estudiar las características defragancias actualmente disponibles. Los resultados de los esfuerzos de su grupodeben permitir al fabricante tomar decisiones de precios respecto a una nuevalínea de productos cuya distribución está planeada para la siguiente temporadade vacaciones. Habiendo preparado las tablas y diagramas apropiados (véaseCL 3.3), la Corporación está preparada para ampliar su análisispreliminar. Provisto del Conjunto de datos especiales 3 del apéndice O de laspáginas 08-09 que muestra información útil sobre el costo por onza de 83 deestas fragancias:

CL4.3

CL4.2

Page 64: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 64/68

Page 65: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 65/68

Características nutricionales de 47 sopas enlatadas diferentes.

Marca Producto Tipo Costo Calorías GrasaCaloríasde grasa Sodio

Estudio de caso B -Estudio sobre nutrición en la cafetería universitaria

Notas: Por producto: C N ~ f i d e o s de pollo, v-vegeraíes.I'etomatepor tipo: C C ~ e n l a t a d a / c o n d e n s a d a , C R ~ e n l a t a d a , lista para servirse,DC=deshidratada/cocinada, Dledeshidratada/lnstantánea

Costo en centavos, calorías por ración de 8 onzasCalorías por ración de 8 onzasGrasa en gramos por ración de 8 onzasCalorías como porcentaje de grasa por ración de 8 onzasNivel de sodio en miligramos por ración de 8 onzas

Fuente: Copyright 1993 por Consurners Uníon of Uníted States, Inc., Yonkers,N.Y. 10703. Adaptado con permiso de Consurner Reports,

noviembre de 1993, págs. 698-699.

_ . _ J

167

880730870970

460

700970

960700840840780840790800860

8009001190890

81047018065

580

670680800600940680

540880

640830

280480160

670

410710630700630710300740

3024304223

23

3841

18303043

301516

26

33

26

2614

3023

1129

1922

16

23

9

2412

19308

20

6

10

1020209

9

O9

9

12

O

2

2

2

8

2

289

2

2

2

9

2

1

2

3

4

2

3

1

4

2

1

4

2

3

2

31

2

1

32

1

2

11

1

2

2

1

1

O

1

1

1

O

607560

17080

80190200

1006060

19060

601101051107010565

12080

8012595

125

1101201057575140

6011090

SS90909090100

100

80

100

1007590

.35

.66

.18

.33

.77

.21

.09

.11

.26

.17

.19

.09

.19

.76

.54

.74

.96

.12

.48

.36

.74

.70

.97

.80

.78

.83

.53

.53

.71

.46

.44

.73

.34

.53

.23

.92

.55

.94

.15

.20

.13

.14

.16

.15

.18

.87

.28

CC

CR

CC

DICR

DCDC

DC

DC

CCCCDC

CCCR

DC

CR

CR

DC

DI

DI

CRCR

CR

CR

CR

CR

CR

CR

CR

CR

CR

CR

CCCR

CCCR

CR

CR

CCCC

CCCC

CCCC

CCCR

CC

CN

CN

CN

CN

CN

CNCN

CN

CN

CN

CN

CN

CN

CN

CN

CN

CN

CN

CN

CN

CNCN

CN

CN

CN

V

V

VV

V

V

V

V

V

V

V

V

V

T

T

T

T

T

T

T

T

T

Carnpbell's Homestyle

Progresso

Carnpbell's

Nissin Cup O'Noodles

Progresso Healthy Class,

Lipton Soup MixCarnpbell's Ramen Noodle

Nissin Tip Ramen

Carnpbell's Soup Mix

Pathrnark

ShopRite

Maruchan Ramen

Lady Lee

Weight Watchers

Knorr Chicken Flavor

Carnpbell's Home Cookin '

Hain

Mrs. Grass Noodle Soup

Carnpbell's Cup Instant

Lipton Cup-A-Soup Instant

Carnpbell's Chunky ClassicCampbell's Healt. Request

Prítikin Chicken Soup

Carnpbell's Low Sodium

Healthy Choice

Hain Vegetarian

Carnpbell's Home Cookin'

Carnpbell's Chunky

Healthy Choice Garden

Progresso Tomato

Progresso Vegetable

Healthy Choice Tomato

Carnpbell's Homestyle

Campbell's Home Cookin'

Campbell's Made With Beef

Health Valley Fat-Free

Carnpbell's Healt . Request

Pritikin

Carnpbell's

Campbell's Healt. Request

ShopRite

Kroger

Lady Lee

Pathmark

Vons

Health Valley Org.

Carnpbell's Italian

;

.!

Page 66: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 66/68

Resumen y descripción de los datos numéricos

Referencias

Notas finales

1. Aunque la palabra promedio se refiere a cualquier mediciónde resumen de tendencia cen tra l, se usa más a menudo

como sinónimo de la media .

2. Estas mediciones se denominan cuantiles. Algunos de loscuantiles más ampliamente usados son los deciles (que dividen los datos ordenados en décimos) y los percentiles (quedividen los datos ordenados en centécimos). Para mayor

información sobre estas mediciones, véase la referencia 1.

3. Usando las reglas de sumatorias del apéndice B, hacemos lasiguiente demostración:

basándose en el tipo de sopa, enlatada/condensada, enla tada y listapara servirse,deshidratada/cocinadao deshidratada/instantánea.

(d) Hacer recomendaciones en vista desus resultados.En dos semanas debe hacer una

exposición oral de diez minutos frente ala doctora Foxe y la señora Neller y pre

sentar un informe escrito, anexandotodas las tablas y diagramas. Además, sele ha pedido esbozar una encuesta delgrupo de estudiantes, con preguntas referentes a los gustos y aversiones de lostipos de sopas y diversas comidas rápidas. Sabiendo que sus resultados seránde gran valor para sus compañeros, sedispone a realizar este proyecto.

4. Laregla de Bienaymé-Chebyshev puede aplicarse sólo a distancias mayores de ±1 desviación estándar alrededor de lamedia.

5. Aquí Il ± 30- produce el intervalo -0.96 a 22.74 miles dedólares; sin embargo, una colegiatura negativa no tiene sentidoy registramos el intervalo como Oa 22.74 miles de dólares.

6. Observaremos en la sección 8.3 que el alcance "práctico" dedatos normalmente distribuidos es seis distancias dedesviación estándar. Por consiguiente, la desviación estándar

es aproximadamente un sexto del rango. Además, para una

serie de datos que está normalmente distribuida, el rango

intercuartil es 1.33 distancias de desviación estándar. Portanto, la desviación estándar es aproximadamente trescuartos del alcance intercuartil. Con una serie de datos que

está aproximadamente distribuida en forma normal, elpromedio de estas dos aproximaciones proporcionaría una

estimación más cercana de la desviación estándar.

7. De la tabla 4.5, si lo deseáramos, podríamos calcular, filapor fila de cada un o de los indicadores económicos dados,diversas mediciones descriptivas de resumen a lo largo delos países enumerados.

8. El sarcasmo es atribuido con más frecuencia a BenjaminDisraeli (1804-1881), dos veces primer ministro de Inglaterra.Sin embargo, un informe reciente (Woerner, D., "Who ReallySaid It?" Chance, vol. 6 (otoño de 1993), pág. 37 indica que talvez lo haya dicho antes alguna otra persona.

7. Norusis, M., SPSS Guide to Data Anaivsis [ot SPSS-X withAdditional Instructions [orSPSS/PC+ (Chicago, IL: SPSSInc.,1986).

8. SAS User'sGuide VersiOll6 (Raleigh, NC: SAS lnstítute, 1988).9. STATISTIX VersiOIl 4.0 (Tallahassee, FL: AnalyticalSoftware, Inc., 1992).

10. Tukey, J., Exploratory Data AI/alysis (Reading, MA:Addíson-Wesley, 1977).

11. Vellernan, P.E , YD. C. Hoaglín, Applications, Basics, andComputing of Exploratorv Data Analysis (Boston, MA:Duxbury Press, 1981).

---------_._---_._. ----_....._--_.---- oo---

Usted decide:(a) Emprender una evaluación descrip

tiva completa de todas las variablesnuméricas (costo en centavos, calorías por ración de 8 onzas, grasa engramos por ración de 8 onzas, calorías como porcentaje de grasa por

ración de 8 onzas y nivel de sodio enmiligramos por ración de 8 onzas).

(b) Realizar una evaluación similarcomparando y contrastando cadauna de estas variables numéricasbasándose en si el producto es una

sopa de pollo de fideos, vegetal ode tomate.

(c) Realizar una evaluación similarcomparando y contrastando cadauna de estas variables numéricas

11

L(X; - X) Oi = 1

n n

LXi LX Oi 1 i -= 1

11

LX; - nX Oj = 1

n n

LXi LXi Oí = 1 i = 1

Capítulo 468

1. Croxton, E, D. Cowden, y S. Klein, Applied General Statistics,3a. ed. (Englewood Cliffs, N]: Prentice-Hall, 1967).

2. Ehrenberg, A. S. e, "Rudiments of Numeracy," iournatof

the Royal Statistical Society, Series A, vol. 140 (1977), págs.277-297.

3. Huff, D., How to Líe w ith Statistics (Nueva York: W. W.Norton, 1954).

4. Kendall , M. G., YA. Stuart, tt« Advanced Theory ofStatistics, vol. I (Londres: Charles W. Griffin, 1958).

5. Kimble, G. A., How to Use (andMisuse)Statistics(Englewood Cliffs, N]: Prentíce-Hall, 1978).

6. MINITAB Reference Manual Release 8 (State College, PA:MINITAB, Inc., 1992).

--......-----------------

Page 67: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 67/68

D-S Apéndice D

m Conjunto especial de datos 3

Éstees un archivo que contiene los datos correspondientes a una muestra de n = 83fragancias. Para utilizar este archivo, tome en cuenta lo siguiente:

• sexo (M=mujer y H =hombre, con valores de código de 1 y 2, respectiva-mente).• Tipo de fragancia (P=perfume, C =colonia, O =otro;

con valores de código de 1, 2 Y3, respectivamente),• Costo en dólares por hora.• Intensidad de la fragancia(MF =muy fuerte, F=fuerte, Me=mediana y Li =ligera;los respectivos valores de código son 1, 2, 3,4)

Fragrancia Sexo Tipo Costo Intensidad

Gio M P 300 FCaboehard M P 175 F"Delícious" M P 190 FChanel No. 5 M C 19 FObsession M P 180 FSublime M P 250 MFVivid M P 230 FChanel No. 5 M O 32 FDune M P 185 FNinja M C 8 FSafari M C 19 Li

Soft Musk M C 7 Me360 M P 200 FTresor M P 220 Li

Venzia M P 320 MFCoco M P 215 FOpium M O 30 MF

Osear de la Renta M P 200 LiVolupte M P 220 MeWild Heart M C 9 F"An Impression of Chanel # 5" M C 4 MeChanel No. 5 M P 215 FChloe M P 170 Li

Mesmerize M C 9 MeObsession M C 21 Li

Aliage Sport Fragranee M C 12 MeChanelNo.5 M O 19 Li

Passion M P 185 FCharlie M C 8 FRealm Women M O 29 MFShalimar M P 205 MF

Conjunto especial de datos

> . - : ~ ; ! ~ t t

~ á. t . ~ ~ ; . ,: : ~ . "

: ~ ; ~", .",:. . , ~ " ; ' ..

-J..

.:.,.

;

j

Page 68: Metodos cuantitativos sesion 4

7/28/2019 Metodos cuantitativos sesion 4

http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 68/68