Cap 2 Levin y Rubin Estad_para_admin_y_economa Copy.pdf

54

Transcript of Cap 2 Levin y Rubin Estad_para_admin_y_economa Copy.pdf

  • Vistenos en:www.pearsoneducacion.net

    El objetivo de esta sptima edicin de Estadstica para administracin y economa es crear un libro que resulte amigable para los estudiantes de estadstica y donde los profesores que imparten la ctedra encuentren material suficiente para adaptar el curso de acuerdo a sus necesidades.

    El libro sigue una metodologa que parte de lo que los estudiantes ya conocen para explicar los nuevos conceptos. A partir de sus experiencias y mediante un proceso intuitivo, va desarrollando los conceptos; y los complementa con ideas del mundo real, ejemplos y explicaciones pacientes: una tcnica que facilita la enseanza y el aprendizaje. Todo esto en un marco que describe situaciones administrativas reales a las cuales debern enfrentarse los estudiantes. Entre las caractersticas nuevas de esta sptima edicin para facilitar la enseanza y el aprendizaje se encuentran las siguientes:

    Sugerencias y suposiciones con comentarios breves. Estos bloques revisan las suposiciones importantes y explican por qu se hicieron; proporcionan al estudiante sugerencias tiles para trabajar en los ejercicios que siguen y les advierten sobre peligros potenciales al encontrar e interpretar las soluciones.

    Ms de 1,500 notas al margen resaltan el material importante para los estudiantes.

    Cada captulo comienza con un problema del mundo real, en el que un administrador debe tomar una decisin. Ya dentro del captulose analiza y resuelve este problema como parte del proceso de enseanza.

    Un captulo nuevo con temas para aprender a resolver problemas de estadstica utilizando Microsoft Excel.

  • ESTADSTICA PARA ADMINISTRACIN

    Y ECONOMASptima edicin

  • Richard I. LevinThe University of North Carolina at Chapel Hill

    David S. RubinThe University of North Carolina at Chapel Hill

    CON LA COLABORACIN Y REVISIN TCNICA DEMiguel Balderas Lozada

    Juan Carlos del Valle SoteloRal Gmez Castillo

    Departamento de MatemticasInstituto Tecnolgico y de Estudios Superiores de Monterrey

    Campus Estado de Mxico

    TRADUCCINMarcia Gonzlez Osuna

    Maestra en Ingeniera IndustrialUniversity of Arizona

    REVISIN TCNICARoberto H. Valadez Soto

    Mario Alberto Naranjo GonzlezDepartamento de Mtodos Cuantitativos

    Centro Universitario de Ciencias Econmico-AdministrativasUniversidad de Guadalajara

    Jess Rodrguez FrancoDepartamento de Matemticas

    Facultad de Contadura y AdministracinUniversidad Nacional Autmoma de Mxico

    Alberto I. Pierdant RodrguezDivisin de Ciencias Sociales y Humanidades

    rea de MatemticasUniversidad Autnoma Metropolitana, Unidad Xochimilco

    ESTADSTICA PARA ADMINISTRACIN

    Y ECONOMASptima edicin

  • Authorized translation from the English languaje edition, entitled Statistics for Management, Seventh Edition, by Richard I. Levin &David S. Rubin, published by Pearson Education, Inc., publishing as PRENTICE HALL, Copyright 1998. All rights reserved.

    ISBN 0-13-476292-4

    Traduccin autorizada de la edicin en idioma ingls titulada Statistics for Management, Seventh Edition, por Richard I. Levin &David S. Rubin, publicada por Pearson Education, Inc., publicada como PRENTICE HALL, Copyright 1998. Todos los derechosreservados.

    Esta edicin en espaol es la nica autorizada.

    EDICIN EN ESPAOLEditor: Guillermo Trujano Mendoza

    e-mail: [email protected] Editor de desarrollo: Miguel B. Gutirrez Hernndez Supervisor de produccin: Enrique Trejo Hernndez

    SPTIMA EDICIN, 2004

    D.R. 2004 por Pearson Educacin de Mxico, S.A. de C.V. Atlacomulco 500, 5 pisoCol. Industrial Atoto53519, Naucalpan de Jurez, Edo. de MxicoE-mail: [email protected]

    Cmara Nacional de la Industria Editorial Mexicana Reg. Nm. 1031.

    Prentice Hall es una marca registrada de Pearson Educacin de Mxico, S.A. de C.V.

    Reservados todos los derechos. Ni la totalidad ni parte de esta publicacin pueden reproducirse, registrarse o transmitirse, por unsistema de recuperacin de informacin, en ninguna forma ni por ningn medio, sea electrnico, mecnico, fotoqumico, magnticoo electroptico, por fotocopia, grabacin o cualquier otro, sin permiso previo por escrito del editor.

    El prstamo, alquiler o cualquier otra forma de cesin de uso de este ejemplar requerir tambin la autorizacin del editor o de susrepresentantes.

    ISBN 970-26-0497-4

    Impreso en Mxico. Printed in Mexico.

    1 2 3 4 5 6 7 8 9 0 - 07 06 05 04

    EDICIN EN INGLSAcquisitions Editor: Tom TuckerAssistant Editor: Audrey ReganAssociate Editor: Diane PeiranoMarketing Manager: Patrick LynchEditorial/Production Supervision: Kelli Rahlf, Carlisle

    Publishers ServicesManaging Editor: Katherine EvancieSenior Manufacturing Supervisor: Paul SmolenskiManufacturing Manager: Vincent SceltaSenior Designer: Suzanne BehnkeDesign Director: Patricia WosczykInterior Design: Lisa JonesCover Design: Suzanne BehnkeComposition: Carlisle Communications, Ltd.Cover Photo: Richard Megna/Fundamental Photographs,

    NYC

  • Objetivos

    Contenido del captulo

    7

    c a p t u l o

    Mostrar la diferencia entremuestras y poblaciones

    Convertir los datos sin procesaren informacin til

    Construir y utilizar datosordenados

    Construir y utilizar distribucio-nes de frecuencias

    Representar grficamentedistribuciones de frecuenciascon histogramas, polgonos y ojivas

    Utilizar distribuciones defrecuencias para tomardecisiones

    2.1 Cmo podemos ordenar losdatos? 8

    2.2 Ejemplos de datos sin procesar11

    2.3 Ordenamiento de datos enarreglos de datos y distribucio-nes de frecuencias 12

    2.4 Construccin de unadistribucin de frecuencias 20

    2.5 Representacin grfica dedistribuciones de frecuencias29

    Estadstica en el trabajo 42 Ejercicio de base de datos

    computacional 43

    Trminos introducidos en el captulo 2 45

    Ecuaciones introducidas en el captulo 2 46

    Ejercicios de repaso 46

    22 AGRUPACIN YPRESENTACIN DE DATOS PARA EXPRESAR SIGNIFICADOS:

    TABLAS Y GRFICAS

  • 8 Captulo 2 Agrupacin y presentacin de datos para expresar significados: tablas y grficas

    Los datos son colecciones de cualquier cantidad de observaciones relacionadas. Podemos recopilarel nmero de telfonos que diferentes empleados instalan en un da dado o el nmero de telfonosque instala un trabajador dado durante un da en un periodo de varios das, y podemos llamar datosa estos resultados. Una coleccin de datos se conoce como conjunto de datos; una sola observacines un dato puntual.

    2.1 Cmo podemos ordenar los datos?Para que los datos sean tiles, necesitamos organizar nuestras observaciones de modo que podamosdistinguir patrones y llegar a conclusiones lgicas. Este captulo presenta las tcnicas tabular y grfi-ca para organizacin de datos; en el captulo 3 mostraremos cmo usar nmeros para describir datos.

    Recoleccin de datosLos especialistas en estadstica seleccionan sus observaciones de manera que todos los grupos rele-vantes estn representados en los datos. Para determinar el mercado potencial de un nuevo produc-to, por ejemplo, los analistas podran estudiar cien consumidores de cierta rea geogrfica. Dichosanalistas deben tener la certeza de que este grupo incluya personas que representan distintas varia-bles como nivel de ingresos, raza, nivel educativo y vecindario.

    Los datos pueden provenir de observaciones reales o de registros elaborados con otros propsi-tos. Por ejemplo, con fines de facturacin e informes mdicos, un hospital registra el nmero depacientes que utilizan los servicios de rayos X. Esta informacin puede organizarse para producirdatos que los especialistas en estadstica puedan describir e interpretar.

    Los datos pueden ayudar a los responsables de tomar decisiones a hacer suposiciones razonadasacerca de las causas y, por tanto, de los efectos probables de ciertas caractersticas en situaciones da-das. El conocimiento de tendencias derivado de la experiencia previa puede, tambin, permitir a losciudadanos conscientes anticipar resultados posibles y actuar en consecuencia. Una investigacin demercado puede revelar que determinado producto es preferido por amas de casa de origen afroame-ricano de las comunidades suburbanas, con ingresos y educacin promedios. Los textos publicitariosdel producto debern, por tanto, estar dirigidos a esta audiencia. Y si los registros del hospital mues-

    Use los datos delpasado para tomardecisiones del futuro

    Encuentre datos apartir de observacio-nes o de registros

    Represente todos los grupos

    Algunas definiciones

    El gerente de produccin de la Dalmon Carpet Company esresponsable de la fabricacin de alfombras en ms de 500 telares.Para no tener que medir la produccin diaria (en yardas) de cadatelar, toma una muestra de 30 telares cada da, con lo que llega a unaconclusin respecto a la produccin promedio de alfombras de las 500mquinas. La tabla que se presenta ms adelante exhibe la produccinde cada uno de los 30 telares de la muestra. Estas cantidades son losdatos sin procesar a partir de los cuales el director de produccin puedesacar conclusiones acerca de la toda la poblacin de telares en sudesempeo del da anterior.

    Produccin en yardas de 30 telares para alfombra

    Mediante los mtodos introducidos en este captulo, podemos ayudaral director de produccin a llegar a la conclusin correcta.

    16.2 15.4 16.0 16.6 15.9 15.8 16.0 16.8 16.9 16.815.7 16.4 15.2 15.8 15.9 16.1 15.6 15.9 15.6 16.016.4 15.8 15.7 16.2 15.6 15.9 16.3 16.3 16.0 16.3

  • 2.1 Cmo podemos ordenar los datos? 9

    tran que un nmero mayor de pacientes ha utilizado el aparato de rayos X en junio que en enero, eldepartamento de personal del hospital deber determinar si esto sucedi slo ese ao o es indicati-vo de una tendencia y, tal vez, debera ajustar su programa de contratacin y asignacin de vacacio-nes de acuerdo con la informacin.

    Cuando los datos se ordenan de manera compacta y til, los responsables de tomar decisionespueden obtener informacin confiable sobre el entorno y usarla para tomar decisiones inteligentes.En la actualidad, las computadoras permiten a los especialistas en estadstica recolectar enormesvolmenes de observaciones y comprimirlas en tablas, grficas y cifras instantneamente. stas sonformas compactas y tiles, pero son confiables? Recuerde que los datos producidos por una compu-tadora son tan precisos como los datos que entraron en ella. Como dicen los programadores,BEBS! o basura entra, basura sale!. Los administradores deben tener mucho cuidado y cercio-rarse que los datos empleados estn basados en suposiciones e interpretaciones correctas. Antes dedepositar nuestra confianza en cualquier conjunto de datos interpretados, vengan de una computado-ra o no, pngalos a prueba mediante las siguientes preguntas:

    1. De dnde vienen los datos? La fuente es tendenciosa?, es decir, es posible que exista inte-rs en proporcionar datos que conduzcan a cierta conclusin ms que a otras?

    2. Los datos apoyan o contradicen otras evidencias que se tienen?3. Hace falta alguna evidencia cuya ausencia podra ocasionar que se llegue a una conclusin di-

    ferente?4. Cuntas observaciones se tienen? Representan a todos los grupos que se desea estudiar?5. La conclusin es lgica? Se ha llegado a conclusiones que los datos no confirman?

    Estudie las respuestas que d a estas preguntas. Vale la pena usar los datos o debemos esperar yrecabar ms informacin antes de actuar? Si el hospital se queda corto de personal porque contratpocos tcnicos para operar las instalaciones de rayos X, quiere decir que su administrador confi endatos insuficientes. Si la agencia de publicidad dirigi su propaganda slo a las amas de casa afroa-mericanas de los suburbios cuando pudo haber triplicado sus ventas al incluir tambin a amas de casablancas, quiere decir que tambin en este caso hubo confianza en datos insuficientes. En ambos ca-sos, probar los datos disponibles podra haber ayudado a los administradores a tomar mejores deci-siones.

    El efecto de emplear datos incompletos o tendenciosos puede ilustrarse con el siguiente ejemplo:una asociacin nacional de lneas de transporte afirma, en un comercial, que el 75% de todo lo queuno utiliza se transporta en camin. Esta afirmacin podra conducir a creer que automviles, ferro-carriles, aeroplanos, barcos y otras formas de transporte slo trasladan el 25% de lo que utilizamos.Es fcil llegar a tal conclusin, pero sta no es completamente ilustrativa. En la afirmacin no setoma en cuenta la cuestin del conteo doble. Qu pasa cuando algo es llevado hasta su ciudad porferrocarril y luego en camin hasta su casa? O cmo se considera la paquetera si se transportapor correo areo y luego en motocicleta? Cuando se resuelve la cuestin del conteo doble (algo bas-tante complicado de manejar), resulta que los camiones transportan una proporcin mucho menor debienes que la afirmada por los transportistas. Aunque los camiones estn involucrados en la entregade una proporcin relativamente alta de lo que utilizamos, el ferrocarril y los barcos llevan ms bie-nes a lo largo de ms kilmetros.

    Diferencia entre muestras y poblacionesLos expertos en estadstica recogen datos de una muestra y utilizan esta informacin para hacer in-ferencias sobre la poblacin que representa esa muestra. As, una poblacin es un todo y una mues-tra es una fraccin o segmento de ese todo.

    Se estudiarn las muestras para poder describir las poblaciones. El hospital del ejemplo puede es-tudiar un grupo pequeo y representativo de los registros de rayos X, en lugar de examinar cada unode los registros de los ltimos 50 aos. La Gallup Poll puede entrevistar una muestra de slo 2,500

    Funcin de lasmuestras

    Definicin de mues-tra y poblacin

    Ejemplo de conteodoble

    Pruebas para datos

  • estadounidenses adultos con el fin de predecir la opinin de todos los adultos que viven en EstadosUnidos.

    El estudio de una muestra es ms sencillo que el de la poblacin completa, cuesta menos y llevamenos tiempo. A menudo, probar la resistencia de una parte de avin implica destruirla; en conse-cuencia, es deseable probar la menor cantidad de partes. En algunas ocasiones, la prueba implica unriesgo humano; el uso de muestras disminuye ese riesgo a un nivel aceptable. Por ltimo, se ha pro-bado que incluso el examen de una poblacin entera deja pasar algunos elementos defectuosos. Portanto, en algunos casos, el muestreo puede elevar el nivel de calidad. Si usted se pregunta cmo pue-de suceder esto, piense en lo cansado y poco animoso que estara si tuviera que observar de maneracontinua miles y miles de productos en una banda continua.

    Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cua-les intentamos sacar conclusiones. Debemos definir esa poblacin de modo que quede claro cundocierto elemento pertenece o no a la poblacin. Para el estudio de mercado mencionado, la poblacinpuede estar constituida por todas las mujeres residentes dentro de un radio de 25 kilmetros con cen-tro en la ciudad de Cincinnati, que tengan un ingreso familiar anual entre $20,000 y $45,000 y hayancursado por lo menos 11 aos de educacin formal. Una mujer que viva en el centro de Cincinnati,con ingresos familiares de $25,000 y estudios universitarios completos podra ser parte de esa po-blacin, mientras que una mujer residente de San Francisco, o que tenga ingresos familiares de$7,000 o con cinco aos de estudios profesionales, no se considerara miembro de nuestra poblacin.

    Una muestra es una coleccin de algunos elementos de la poblacin, no de todos. La poblacinde nuestra investigacin de mercado son todas las mujeres que cumplen con los requisitos anterio-res. Cualquier grupo de mujeres que cumpla con tales requisitos puede constituir una muestra, siem-pre y cuando el grupo sea una fraccin de la poblacin completa. Una porcin grande de relleno deframbuesas con slo algunas migajas de corteza es una muestra de tarta, pero no es una muestra re-presentativa debido a que las proporciones de los ingredientes no son las mismas en la muestra queen el todo.

    Una muestra representativa contiene las caractersticas relevantes de la poblacin en las mismasproporciones en que estn incluidas en tal poblacin. Si la poblacin de mujeres del ejemplo es untercio de afroamericanas, entonces una muestra representativa en trminos de raza tendr tambinun tercio de afroamericanas. En el captulo 6 se analizan con ms detalle los mtodos especficos pa-ra realizar muestreos.

    Bsqueda de un patrn significativo en los datosLos datos pueden organizarse de muchas maneras. Podemos, simplemente recolectarlos y mante-nerlos en orden. O, si las observaciones estn hechas con nmeros, podemos hacer una lista de losdatos puntuales de menor a mayor segn su valor numrico. Pero si los datos consisten en trabaja-dores especializados (como carpinteros, albailes o soldadores) de una construccin, o en los distin-tos tipos de automviles que ensamblan todos los fabricantes, o en los diferentes colores de suteresfabricados por una empresa dada, debemos organizarlos de manera distinta. Necesitaremos presen-tar los datos puntuales en orden alfabtico o mediante algn principio de organizacin. Una formacomn de organizar los datos consiste en dividirlos en categoras o clases parecidas y luego contarel nmero de observaciones que quedan dentro de cada categora. Este mtodo produce una distri-bucin de frecuencias, que se estudiar ms adelante, en este mismo captulo.

    Organizar los datos tiene como fin permitirnos ver rpidamente algunas de las caractersticas delos datos recogidos. Buscamos cosas como el alcance (los valores mayor y menor), patrones eviden-tes, alrededor de qu valores tienden a agruparse los datos, qu valores aparecen con ms frecuen-cia, etc. Cuanta ms informacin de este tipo podamos obtener de una muestra, mejor entenderemosla poblacin de la cual proviene, y mejor ser nuestra toma de decisiones.

    Por qu debemosorganizar los datos?

    Los datos puedenorganizarse demuchas maneras

    Necesidad de una muestrarepresentativa

    Funcin de laspoblaciones

    Ventajas de lasmuestras

    10 Captulo 2 Agrupacin y presentacin de datos para expresar significados: tablas y grficas

  • Ejercicios 2.1

    Aplicaciones

    2-1 Cuando se les pregunta qu medicamento tomaran si estuvieran en una isla abandonada y slo pudieranelegir un analgsico, la mayora de los mdicos prefiere Bayer, en lugar de Tylenol, Bufferin o Advil. Selleg a esta conclusin a partir de una muestra o de una poblacin?

    2-2 El 25% de los automviles vendidos en Estados Unidos en 1992 fue armado en Japn. Se lleg a estaconclusin a partir de una muestra o de una poblacin?

    2-3 Hace poco, una fbrica de aparatos electrnicos introdujo al mercado un nuevo amplificador, y en la ga-ranta se indica que se han vendido 10,000 de esos amplificadores. El presidente de la empresa, bastantepreocupado despus de recibir tres cartas de quejas con respecto a los nuevos amplificadores, inform algerente de produccin que se implantaran costosas medidas de control para asegurar que los defectos noaparecieran de nuevo. Haga un comentario sobre la reaccin del gerente desde la perspectiva de las cincopruebas para datos que se dieron en la pgina 9.

    2-4 Alemania permanecer siempre dividida, afirm Walter Ulbricht despus de la construccin del Muro deBerln en 1961. Sin embargo, hacia finales de 1969, el gobierno de Alemania del Este empez a permitirel libre trnsito entre la parte oriental y la occidental, y veinte aos despus, el muro fue destruido por com-pleto. Mencione algunas razones por las cuales Ulbricht hizo una prediccin incorrecta.

    2-5 Analice los datos dados en el problema planteado al inicio del captulo en trminos de las cinco pruebaspara datos dados en la pgina 9.

    2.2 Ejemplos de datos sin procesarLa informacin obtenida, antes de ser organizada y analizada, se conoce como datos sin procesar.Son sin procesar puesto que an no han sido manejados mediante un mtodo estadstico.

    Los datos de los telares proporcionados al inicio del captulo son un ejemplo de datos sin procesar.Consideremos un segundo ejemplo. Suponga que el personal de admisin de una universidad, preocu-pado por el xito de los estudiantes que escogen para ser admitidos, desea comparar el desempeo delos estudiantes universitarios con otros logros, como calificaciones en el nivel anterior, resulta-dos de exmenes y actividades extracurriculares. En lugar de estudiar a todos los alumnos de todoslos aos, el personal puede tomar una muestra de la poblacin de estudiantes en un periodo dado yestudiar slo ese grupo, para llegar a conclusiones sobre qu caractersticas parecen predecir el xito.Por ejemplo, puede comparar las calificaciones del nivel educativo anterior con el promedio de cali-ficaciones universitarias de los estudiantes de la muestra. El personal puede sumar las calificacionesy dividir el resultado entre el nmero total de ellas para obtener un promedio, o media, para cada es-tudiante. En la tabla 2-1 se presentan tabulados estos datos sin procesar: 20 pares de calificacionespromedio en el bachillerato y en la universidad.

    Cuando se disea un puente, los ingenieros deben determinar la tensin que un material dado,digamos el concreto, puede soportar. En lugar de probar cada pulgada cbica de concreto para de-terminar su capacidad de resistencia, los ingenieros toman una muestra, la prueban y llegan a laconclusin sobre qu tanta tensin, en promedio, puede resistir ese tipo de concreto. En la tabla 2-2se presentan los datos sin procesar obtenidos de una muestra de 40 bloques de concreto que se utili-zarn para construir un puente.

    Problema deconstruccin de un puente

    Problema queenfrenta el personalde admisin

    2.2 Ejemplos de datos sin procesar 11

    Promedios de califica-ciones en bachillerato y universidad de 20estudiantes universita-rios del ltimo ao

    Tabla 2-1 Bach. Univ. Bach. Univ. Bach. Univ. Bach. Univ.

    3.6 2.5 3.5 3.6 3.4 3.6 2.2 2.82.6 2.7 3.5 3.8 2.9 3.0 3.4 3.42.7 2.2 2.2 3.5 3.9 4.0 3.6 3.03.7 3.2 3.9 3.7 3.2 3.5 2.6 1.94.0 3.8 4.0 3.9 2.1 2.5 2.4 3.2

  • Los datos no necesariamente son informa-cin; tener ms datos no necesariamenteproduce mejores decisiones. La meta esresumir y presentar los datos de manera

    til para apoyar la toma de decisiones efectiva y gil. La ra-zn por la que los datos deben organizarse es ver si existeun patrn en ellos, patrones como el valor ms grande y el

    ms pequeo, o el valor alrededor del cual parecen agrupar-se. Si los datos provienen de una muestra, se suponen re-presentativos de la poblacin de la que se tomaron. Todoslos buenos estadsticos (y usuarios de datos) reconocen queusar datos sesgados o incompletos conduce a malas deci-siones.

    12 Captulo 2 Agrupacin y presentacin de datos para expresar significados: tablas y grficas

    Presin en libras porpulgada cuadrada que puede resistir elconcreto

    Tabla 2-2

    Muestra de laproduccin diaria de 30 telares para alfombra(en yardas)

    Tabla 2-3

    SUGERENCIASY

    SUPOSICIONES

    2500.2 2497.8 2496.9 2500.8 2491.6 2503.7 2501.3 2500.02500.8 2502.5 2503.2 2496.9 2495.3 2497.1 2499.7 2505.02490.5 2504.1 2508.2 2500.8 2502.2 2508.1 2493.8 2497.82499.2 2498.3 2496.7 2490.4 2493.4 2500.7 2502.0 2502.52506.4 2499.9 2508.4 2502.3 2491.3 2509.5 2498.4 2498.1

    Ejercicios 2.2

    Aplicaciones

    2-6 Observe los datos de la tabla 2-1. Por qu los datos necesitan organizarse ms? Puede usted llegar a unaconclusin partiendo de los datos tal como se presentan?

    2-7 El gerente de mercadotecnia de una compaa grande recibe un informe mensual de las ventas de uno delos productos de la compaa. El informe consiste en una lista de las ventas del producto por estado du-rante el mes anterior. Es ste un ejemplo de datos sin procesar?

    2-8 El gerente de produccin de una compaa grande recibe un informe mensual de su departamento de con-trol de calidad. El informe presenta el ndice de rechazo de la lnea de produccin (nmero de rechazospor cada 100 unidades producidas), la mquina que ocasiona el mayor nmero de productos defectuososy el costo promedio de reparacin de las unidades rechazadas. Es ste un ejemplo de datos sin procesar?

    2.3 Ordenamiento de datos en arreglos dedatos y distribuciones de frecuencias

    Una ordenacin de datos es una de las formas ms sencillas de presentarlos: organiza los valores enorden ascendente o descendente. En la tabla 2-3 repetimos los datos de la produccin de alfombrasdel problema presentado al inicio del captulo, y en la tabla 2-4 reordenamos los nmeros en un or-den ascendente.

    La ordenacin de datos ofrece varias ventajas con respecto a los datos sin procesar:1. Podemos identificar los valores mayor y menor rpidamente. En el ejemplo de las alfom-

    bras, los datos van de las 15.2 a las 16.9 yardas.

    Ventajas de laordenacin de datos

    Definicin de orde-nacin de datos

    16.2 15.8 15.8 15.8 16.3 15.615.7 16.0 16.2 16.1 16.8 16.016.4 15.2 15.9 15.9 15.9 16.815.4 15.7 15.9 16.0 16.3 16.016.4 16.6 15.6 15.6 16.9 16.3

  • 2. Es fcil dividir los datos en secciones. En la tabla 2-4, los primeros 15 valores (la mitad infe-rior de los datos) estn entre 15.2 y 16.0 yardas, y los ltimos 15 (la mitad superior) entre 16.0 y16.9 yardas. De manera similar, el tercio ms bajo de los datos est entre 15.2 y 15.8 yardas, eltercio de en medio est entre 15.9 y 16.2 yardas, y el tercio ms alto entre 16.2 y 16.9 yardas.

    3. Podemos ver si algunos valores aparecen ms de una vez en el arreglo. Los valores igualesquedan juntos. En la tabla 2-4 se muestra que nueve niveles ocurren ms de una vez cuando setoma una muestra de 30 telares.

    4. Podemos observar la distancia entre valores sucesivos de los datos. En la tabla 2-4, 16.6 y16.8 son valores sucesivos. La distancia entre ellos es de 0.2 yardas (16.8 16.6).

    A pesar de las ventajas, en algunas ocasiones un ordenamiento de datos no resulta til. Como dauna lista de todos los valores, es una forma incmoda de mostrar grandes cantidades de datos. Sue-le ser necesario comprimir la informacin sin que pierda su utilidad para la interpretacin y la tomade decisiones. Cmo podemos hacerlo?

    Una mejor forma de organizar datos:la distribucin de frecuenciasUna manera de compactar datos es mediante una tabla de frecuencias o distribucin de frecuencias.Para entender la diferencia entre sta y el ordenamiento de datos, tome como ejemplo las existenciaspromedio (en das) para 20 tiendas de autoservicio:

    Las distribuciones defrecuencias permitenmanejar ms datos

    Desventajas de laordenacin de datos

    2.3 Ordenamiento de datos en arreglos de datos y distribuciones de frecuencias 13

    Ordenamiento de losdatos de la produccindiaria de 30 telares paraalfombra (en yardas)

    Tabla 2-4

    15.2 15.7 15.9 16.0 16.2 16.415.4 15.7 15.9 16.0 16.3 16.615.6 15.8 15.9 16.0 16.3 16.815.6 15.8 15.9 16.1 16.3 16.815.6 15.8 16.0 16.2 16.4 16.9

    Ordenamiento de datospara las existencias pro-medio (en das) para 20tiendas de autoservicio

    Tabla 2-5

    2.0 3.8 4.1 4.7 5.53.4 4.0 4.2 4.8 5.53.4 4.1 4.3 4.9 5.53.8 4.1 4.7 4.9 5.5

    Distribucin defrecuencias para lasexistencias promedio (en das) en 20 tiendasde autoservicio (6 clases)

    Tabla 2-6 Clase (grupo de valores Frecuencia (nmero de parecidos de datos puntuales) observaciones que hay en cada clase)

    2.0 a 2.5 12.6 a 3.1 03.2 a 3.7 23.8 a 4.3 84.4 a 4.9 55.0 a 5.5 4

    En las tablas 2-5 y 2-6, hemos tomado los mismos datos concernientes a las existencias prome-dio y los hemos organizado, primero, como un arreglo ascendente y luego como una distribucin defrecuencias. Para obtener la tabla 2-6 tuvimos que dividir los datos en grupos de valores parecidos. Despus registramos el nmero de datos puntuales que caen en cada grupo. Observe que perdimosalgo de informacin al construir la distribucin de frecuencias. Ya no podemos saber, por ejemplo,que el valor 5.5 aparece cuatro veces y que el valor 5.1 no aparece. Sin embargo, ganamos informa-cin acerca del patrn de existencias promedio. En la tabla 2-6, podemos ver que las existencias pro-medio caen con ms frecuencia en el intervalo de 3.8 a 4.3 das. No es usual encontrar existencias

    Pierden algo deinformacin

    Pero se obtiene otrotipo de informacin

  • promedio en el intervalo de 2.0 a 2.5 das o en el que va de 2.6 a 3.1 das. Las existencias que estnentre 4.4 y 4.9 das y entre 5.0 y 5.5 das no son las que prevalecen, pero ocurren con ms frecuen-cia que algunas otras. As pues, las distribuciones de frecuencias sacrifican algunos detalles pero nosofrecen nuevas perspectivas sobre los patrones de los datos.

    Una distribucin de frecuencias es una tabla en la que organizamos los datos en clases, es decir,en grupos de valores que describen una caracterstica de los datos. El inventario promedio es unacaracterstica de las 20 tiendas de autoservicio. En la tabla 2-5, esta caracterstica tiene once valoresdiferentes. Pero estos mismos datos podran dividirse en cualquier nmero de clases. En la tabla 2-6,por ejemplo, utilizamos seis. Podramos comprimir todava ms los datos y utilizar slo dos clases:menores que 3.8 y mayores o iguales que 3.8. O podramos aumentar el nmero de clases utilizan-do intervalos ms pequeos, como se hace en la tabla 2-7.

    Una distribucin de frecuencias muestra el nmero de observaciones del conjunto de datos quecaen en cada una de las clases. Si se puede determinar la frecuencia con la que se presentan los va-lores en cada clase de un conjunto de datos, se puede construir una distribucin de frecuencias.

    Definicin de distribucin de frecuencias relativasHasta aqu hemos considerado la frecuencia con que aparecen los valores en cada clase como el n-mero total de datos puntuales u observaciones que caen en cada clase. Podemos expresar la frecuen-cia de cada valor tambin como una fraccin o un porcentaje del nmero total de observaciones. Lafrecuencia de un inventario promedio de 4.4 a 4.9 das, por ejemplo, es 5 en la tabla 2-6, pero 0.25en la tabla 2-8. Para obtener este valor de 0.25, dividimos la frecuencia de esa clase (5) entre el n-mero total de observaciones del conjunto de datos (20). La respuesta se puede expresar como unafraccin (5/20), un nmero decimal (0.25) o un porcentaje (25%). En una distribucin de frecuenciasrelativas se presentan las frecuencias en trminos de fracciones o porcentajes.

    Observe, en la tabla 2-8, que la suma de todas las frecuencias relativas es igual a 1.00, o 100%.Esto se debe a que una distribucin de frecuencias relativas da una correspondencia de cada clasecon su fraccin o porcentaje del total de los datos. Por consiguiente, las clases que aparecen en cual-quier distribucin de frecuencias, sean relativas o simples, son completamente incluyentes. Todos losdatos caen en una u otra categora. Note tambin que las clases de la tabla 2-8 son mutuamente ex-cluyentes, es decir, ningn dato puntual cae en ms de una categora. En la tabla 2-9 se ilustra esteconcepto mediante la comparacin de clases mutuamente excluyentes con clases que se traslapan.En las distribuciones de frecuencias no existen clases que se traslapen.

    Las clases soncompletamenteincluyentes

    Son mutuamenteexcluyentes

    Caractersticas de lasdistribuciones de fre-cuencias relativas

    Por qu se le cono-ce como distribucinde frecuencias?

    Funcin de las clasesen una distribucinde frecuencias

    14 Captulo 2 Agrupacin y presentacin de datos para expresar significados: tablas y grficas

    Distribucin defrecuencias para lasexistencias promedio (en das) en 20 tiendasde autoservicio (12 clases)

    Tabla 2-7 Clase Frecuencia Clase Frecuencia

    2.0 a 2.2 1 3.8 a 4.0 32.3 a 2.5 0 4.1 a 4.3 52.6 a 2.8 0 4.4 a 4.6 02.9 a 3.1 0 4.7 a 4.9 53.2 a 3.4 2 5.0 a 5.2 03.5 a 3.7 0 5.3 a 5.5 4

    Distribucin defrecuencias relativas del inventario promedio(en das) para 20 tiendasde autoservicio

    Tabla 2-8 Frecuencia relativa:Clase Frecuencia fraccin de observaciones en cada clase

    2.0 a 2.5 1 0.052.6 a 3.1 0 0.003.2 a 3.7 2 0.103.8 a 4.3 8 0.404.4 a 4.9 5 0.255.0 a 5.5 4 0.20

    20

    1.00

    (suma de frecuencias relativas de todas las clases)

  • Distribucin Distribucin deClase de frecuencias frecuencias relativas

    ocupacional (1) (1) 100

    Actor 5 0.05Banquero 8 0.08Empresario 22 0.22Qumico 7 0.07Mdico 10 0.10Agente de seguros 6 0.06Periodista 2 0.02Abogado 14 0.14Maestro 9 0.09Otros 17 0.17

    100

    1.00

    Hasta ahora, las clases han consistido en nmeros y describen algn atributo cuantitativo de loselementos de la muestra. Podemos, tambin, clasificar la informacin de acuerdo con caractersticascualitativas, como raza, religin y sexo, que no entran de manera natural en categoras numricas.Igual que las clases de atributos cuantitativos, stas deben ser completamente incluyentes y mutua-mente excluyentes. En la tabla 2-10 se muestra cmo construir distribuciones de frecuencias simpleso absolutas y distribuciones de frecuencias relativas usando el atributo cualitativo de ocupacin.

    Aunque en la tabla 2-10 no se enumeran todas las ocupaciones de los graduados del CentralCollege, sigue siendo completamente incluyente. Por qu? La clase otros cubre a todas las obser-vaciones que no entran en las categoras mencionadas. Utilizaremos algo parecido siempre que nues-tra lista no incluya especficamente todas las posibilidades. Por ejemplo, si la caracterstica puedepresentarse durante cualquier mes del ao, una lista completa debera incluir 12 categoras. Pero sideseamos enumerar slo los ocho primeros meses, de enero a agosto, podemos utilizar el trminootros para referirnos a las observaciones correspondientes a los restantes cuatro meses, septiembre,octubre, noviembre y diciembre. Aunque nuestra lista no incluye especficamente todas las posibili-dades, sigue siendo completamente incluyente. La categora otros se conoce como clase de extre-mo abierto cuando permite que el extremo inferior o el superior de una clasificacin cuantitativa noest limitado. La ltima clase de la tabla 2-11 (72 o ms) es de extremo abierto.

    Clases de extremoabierto para listasque no sonexhaustivas

    Clases de datoscualitativos

    2.3 Ordenamiento de datos en arreglos de datos y distribuciones de frecuencias 15

    Clases mutuamenteexcluyentes y clases que se traslapan

    Tabla 2-9

    Ocupacin de losintegrantes de unamuestra de 100graduados del CentralCollege

    Tabla 2-10

    Mutuamente excluyentes 1 a 4 5 a 8 9 a 12 13 a 16No mutuamente excluyentes 1 a 4 3 a 6 5 a 80 7 a 10

    Edades de los habitantesdel condado de Bunder

    Tabla 2-11 Clase: edad Frecuencia Frecuencia relativa(1) (2) (2) 89,592

    Nacimiento a 7 8,873 0.09908 a 15 9,246 0.1032

    16 a 23 12,060 0.134624 a 31 11,949 0.133432 a 39 9,853 0.110040 a 47 8,439 0.094248 a 55 8,267 0.092356 a 63 7,430 0.082964 a 71 7,283 0.081372 o ms 6,192 0.0691

    89,592 1.0000

  • Ejercicios 2.3

    Ejercicios de autoevaluacin

    EA 2-1 Las edades de los 50 integrantes de un programa de servicio social del gobierno son:83 51 66 61 82 65 54 56 92 6065 87 68 64 51 70 75 66 74 6844 55 78 69 98 67 82 77 79 6238 88 76 99 84 47 60 42 66 7491 71 83 80 68 65 51 56 73 55

    Use estos datos para construir las distribuciones de frecuencia relativa con 7 y 13 intervalos iguales. Lapoltica del estado para los programas de servicio social requiere que alrededor de 50% de los participan-tes tengan ms de 50 aos.a) Cumple el programa con la poltica?b) La distribucin de frecuencias relativas de 13 intervalos ayuda a responder el inciso a) mejor que la

    distribucin de 7 intervalos?c) Suponga que el director de servicios sociales desea saber la proporcin de participantes en el progra-

    ma que tienen entre 45 y 50 aos de edad. A partir de cul distribucin de frecuencias relativas, de 7o de 13 intervalos, puede estimar mejor la respuesta?

    EA 2-2 Use los datos de la tabla 2-1 para elaborar un ordenamiento de mayor a menor del promedio general enbachillerato. Despus haga un ordenamiento de mayor a menor del promedio general en la universidad.A partir de los dos ordenamientos, qu puede concluir que no poda a partir de los datos originales?

    Aplicaciones

    2-9 Los talleres Transmissions Fix-It registran el nmero de comprobantes de servicio extendidos el mes an-terior en cada una de sus 20 sucursales de la forma siguiente:

    Los esquemas de clasificacin pueden ser tanto cuantitativos como cualitativos y tanto discretoscomo continuos. Las clases discretas son entidades separadas que no pasan de una clase a la siguien-te sin que haya un rompimiento. Clases como el nmero de nios de cada familia, el nmero de ca-miones de una compaa de transportistas o las ocupaciones de los graduados del Central Collegeson discretas. Los datos discretos son aquellos que pueden tomar slo un nmero limitado de valo-res o un nmero infinito numerable de valores. Los graduados del Central College pueden clasifi-carse como doctores o qumicos, pero no como algo intermedio. El precio de cierre de las accionesde AT&T puede ser 391/2 o 397/8 (pero no 39.43), o su equipo de bsquetbol favorito puede ganar por5 o 27 puntos (pero no por 17.6 puntos).

    Los datos continuos pasan de una clase a otra sin que haya un rompimiento. Implican medicio-nes numricas como el peso de las latas de tomates, la presin sobre el concreto o las calificacionesde bachillerato de los estudiantes del ltimo ao en la universidad, por ejemplo. Los datos continuospueden expresarse con nmeros fraccionarios o con enteros.

    Clases continuas

    Clases discretas

    16 Captulo 2 Agrupacin y presentacin de datos para expresar significados: tablas y grficas

    Existen muchas maneras de presentar da-tos. Para empezar, puede elaborar unordenamiento de datos de manera des-cendente o ascendente. Mostrar cuntas

    veces aparece un valor usando una distribucin de frecuen-

    cias es an ms efectivo; convertir estas frecuencias en de-cimales (que se conocen como frecuencias relativas) puedeayudar todava ms. Sugerencia: debe recordar que las va-riables discretas son cosas que se pueden contar y las varia-bles continuas aparecen en algn punto de una escala.

    SUGERENCIASY

    SUPOSICIONES

  • 823 648 321 634 752669 427 555 904 586722 360 468 847 641217 588 349 308 766

    La compaa tiene la creencia de que una sucursal no puede mantenerse financieramente con menos de475 servicios mensuales. Es tambin poltica de la compaa otorgar una bonificacin econmica al ge-rente de la sucursal que genere ms de 725 servicios mensuales. Ordene los datos de la tabla e indiquecuntas sucursales no pueden mantenerse y cuntas recibirn bonificacin.

    2-10 Utilice los datos de la empresa Transmissions Fix-It del ejercicio 2-9. La vicepresidente financiera de lacompaa ha establecido lo que llama una lista de observacin de sucursales que contiene las sucursalescuya actividad en cuanto a servicios prestados es lo suficientemente baja como para que la casa matriz lepreste atencin especial. Esta categora incluye a las sucursales cuya actividad est entre 550 y 650 ser-vicios mensuales. Cuntos talleres debern estar en dicha lista si nos basamos en la actividad del mes an-terior?

    2-11 El nmero de horas que les toma a los mecnicos retirar, reparar y reinstalar una transmisin en uno delos talleres de Transmissions Fix-It, durante un da de la semana anterior, se registra de la manera siguiente:

    4.3 2.7 3.8 2.2 3.43.1 4.5 2.6 5.5 3.26.6 2.0 4.4 2.1 3.36.3 6.7 5.9 4.1 3.7

    A partir de estos datos, elabore una distribucin de frecuencias con intervalos de una hora. A qu con-clusiones puede llegar acerca de la productividad de los mecnicos si toma en cuenta la distribucin defrecuencias? Si el gerente de la Transmissions Fix-It cree que ms de 6.0 horas es evidencia de un desem-peo insatisfactorio, de qu magnitud es el problema del desempeo de los mecnicos en este taller enparticular?

    2-12 El comisionado de transporte del condado de Orange est preocupado por la velocidad a la que los con-ductores manejan en un tramo de la carretera principal. Los datos de velocidad de 45 conductores son lossiguientes:

    15 32 45 46 42 39 68 47 1831 48 49 56 52 39 48 69 6144 42 38 52 55 58 62 58 4856 58 48 47 52 37 64 29 5538 29 62 49 69 18 61 55 49

    Use estos datos para elaborar distribuciones de frecuencias relativas con 5 y 11 intervalos iguales. El De-partamento de Transporte informa que, a nivel nacional, no ms de 10% de los conductores excede 55 mph.a) Se comportan los conductores del condado de Orange de acuerdo con las afirmaciones del informe

    del Departamento de Transporte acerca de los patrones de manejo?b) Qu distribucin us para responder el inciso a)?c) El Departamento de Transporte ha determinado que la velocidad ms segura para esta carretera es ms

    de 36 y menos de 59 mph. Qu proporcin de conductores maneja dentro de este intervalo? Qudistribucin ayuda a responder a esta pregunta?

    2-13 Ordene los datos de la tabla 2-2, en un arreglo de mayor a menor.a) Suponga que la ley estatal requiere que los puentes de concreto puedan soportar al menos 2,500

    lb/pulg2. Cuntas muestras no pasarn esta prueba?b) Cuntas muestras podran soportar una presin de al menos 2,497 lb/pulg2 pero no una de 2,504

    lb/pulg2?c) Si examina con cuidado el arreglo, se dar cuenta de que algunas muestras pueden soportar cantida-

    des iguales de presin. Proporcione una lista de tales presiones y el nmero de muestras que puedensoportar cada cantidad de presin.

    2-14 Un estudio reciente sobre los hbitos de los consumidores de televisin por cable en Estados Unidos pro-porcion los siguientes datos:

    Nmero de horas que venNmero de canales comprados televisin por semana

    25 1418 16

    2.3 Ordenamiento de datos en arreglos de datos y distribuciones de frecuencias 17

    Contina

  • Nmero de horas que venNmero de canales comprados televisin por semana

    42 1296 628 1343 1639 929 717 1984 476 822 13

    104 6

    Ordene los datos. Qu conclusin puede deducir de estos datos? 2-15 La agencia de proteccin ambiental estadounidense tom muestras de agua de 12 ros y arroyos que de-

    sembocan en el lago Erie. Las muestras se probaron en los laboratorios de la agencia y clasificadas segnla cantidad de contaminantes slidos suspendidos en cada muestra. Los resultados de la prueba se dan en latabla siguiente:

    Muestra 1 2 3 4 5 6Contaminantes (ppm) 37.2 51.7 68.4 54.2 49.9 33.4

    Muestra 7 8 9 10 11 12Contaminantes (ppm) 39.8 52.7 60.0 46.1 38.5 49.1

    a) Ordene los datos en un arreglo descendente.b) Determine el nmero de muestras con un contenido de contaminantes entre 30.0 y 39.9, 40.0 y 49.9,

    50.0 y 59.9 y entre 60.0 y 69.9.c) Si 45.0 es el nmero que utiliza la agencia de proteccin ambiental para indicar una contaminacin exce-

    siva, cuntas muestras sern clasificadas como excesivamente contaminadas?d) Cul es la distancia ms grande entre dos muestras consecutivas cualesquiera?

    2-16 Suponga que el personal de admisiones al que nos referimos al analizar la tabla 2-1 de la pgina 12 deseaexaminar la relacin entre la diferencial de un estudiante que realiza el examen de admisin (la diferen-cia entre el resultado real del examen y el esperado segn el promedio general del nivel anterior) y la dis-persin de los promedios generales del estudiante en el bachillerato y la universidad (la diferencia entreel promedio general de la universidad y el del nivel anterior). El personal de admisiones utiliza los datossiguientes:

    Prom. bach. Prom. univ. Resultado examen Prom. bach. Prom. univ. Resultado examen

    3.6 2.5 1,100 3.4 3.6 1,1802.6 2.7 940 2.9 3.0 1,0102.7 2.2 950 3.9 4.0 1,3303.7 3.2 1,160 3.2 3.5 1,1504.0 3.8 1,340 2.1 2.5 9403.5 3.6 1,180 2.2 2.8 9603.5 3.8 1,250 3.4 3.4 1,1702.2 3.5 1,040 3.6 3.0 1,1003.9 3.7 1,310 2.6 1.9 8604.0 3.9 1,330 2.4 3.2 1,070

    Adems, el personal de admisiones ha recibido la siguiente informacin del servicio de pruebas educati-vas:

    Prom. bach. Resultado examen Prom. bach. Resultado examen

    4.0 1,340 2.9 1,0203.9 1,310 2.8 1,0003.8 1,280 2.7 9803.7 1,250 2.6 960

    18 Captulo 2 Agrupacin y presentacin de datos para expresar significados: tablas y grficas

    Contina

  • Prom. bach. Resultado examen Prom. bach. Resultado examen

    3.6 1,220 2.5 9403.5 1,190 2.4 9203.4 1,160 2.3 9103.3 1,130 2.2 9003.2 1,100 2.1 8803.1 1,070 2.0 8603.0 1,040

    a) Ordene estos datos en un arreglo descendente de las dispersiones. (Considere positivo un aumento enel promedio general de universidad respecto al de bachillerato y como negativo el caso contrario.) In-cluya con cada dispersin la diferencial de admisin correspondiente. (Considere negativo un resul-tado de admisin que est por debajo del esperado y positivo uno que est por arriba.)

    b) Cul es la dispersin ms comn?c) Para la dispersin del inciso b), cul es la diferencial de admisin ms comn?d) A qu conclusiones llega, partiendo del anlisis que ha hecho?

    Soluciones a los ejercicios de autoevaluacin

    EA 2-1 7 intervalos 13 intervalos

    Frecuencia Frecuencia FrecuenciaClase relativa Clase relativa Clase relativa

    30-39 0.02 35-39 0.02 70-74 0.1040-49 0.06 40-44 0.04 75-79 0.1050-59 0.16 45-49 0.02 80-84 0.1260-69 0.32 50-54 0.08 85-89 0.0470-79 0.20 55-59 0.08 90-94 0.0480-89 0.16 60-64 0.10 95-99 0.0490-99 0.08 65-69 0.22 1.00

    1.00

    a) Como se puede saber a partir de cualquiera de las distribuciones, cerca de 90% de los participantestiene ms de 50 aos, por lo que el programa no cumple la poltica.

    b) En este caso, es igualmente sencillo usar las dos.c) La distribucin de 13 intervalos da una mejor estimacin porque tiene una clase de 45-49, mientras

    que la distribucin de 7 intervalos agrupa todas las observaciones entre 40 y 49.EA 2-2 Ordenamiento de datos segn el promedio general de bachillerato:

    Prom. bach. Prom. univ. Prom. bach. Prom. univ.

    4.0 3.9 3.4 3.44.0 3.8 3.2 3.53.9 4.0 2.9 3.03.9 3.7 2.7 2.23.7 3.2 2.6 2.73.6 3.0 2.6 1.93.6 2.5 2.4 3.23.5 3.8 2.2 3.53.5 3.6 2.2 2.83.4 3.6 2.1 2.5

    Ordenamiento de datos segn el promedio general en la universidad:Prom. bach. Prom. univ. Prom. bach. Prom. univ.

    4.0 3.9 3.2 3.73.9 4.0 3.2 2.4

    2.3 Ordenamiento de datos en arreglos de datos y distribuciones de frecuencias 19

    Contina

  • Ancho de un intervalo de clase

    [2-1]

    Valor unitario siguiente despus Valor ms pequeodel valor ms grande de los datos de los datos

    Nmero total de intervalos de claseAncho de los

    intervalos de clase

    Prom. bach. Prom. univ. Prom. bach. Prom. univ.

    3.8 4.0 3.0 3.63.8 3.5 3.0 2.93.7 3.9 2.8 2.23.6 3.5 2.7 2.63.6 3.4 2.5 3.63.5 3.2 2.5 2.13.5 2.2 2.2 2.73.4 3.4 1.9 2.6

    De estos ordenamientos se puede ver que los promedios generales altos en un nivel tiendena relacionarse con promedios generales altos en el otro, aunque hay algunas excepciones.

    2.4 Construccin de una distribucin de frecuencias

    Ahora que ya hemos aprendido a dividir una muestra en clases, podemos tomar los datos sin proce-sar y construir una distribucin de frecuencias. Para resolver el problema de los telares para alfom-bra de la primera pgina del captulo, siga estos tres pasos:

    1. Decida el tipo y nmero de clases para dividir los datos. En este caso, ya hemos escogidoclasificar los datos de acuerdo con la medida cuantitativa del nmero de yardas producidas, msque con respecto a un atributo cualitativo como color o estampado. En seguida, necesitamos decidircuntas clases distintas usar y el alcance que cada clase debe cubrir. El rango total debe dividir-se entre clases iguales; esto es, el ancho del intervalo, tomado desde el principio de una clasehasta el principio de la siguiente, debe ser el mismo para todas. Si escogemos un ancho de 0.5yardas para cada clase de la distribucin, las clases sern las que se muestran en la tabla 2-12.

    Si las clases fueran desiguales y el ancho de los intervalos variara de una clase a otra, tendra-mos una distribucin mucho ms difcil de interpretar que una con intervalos iguales. Imaginelo difcil que sera interpretar los datos de la tabla 2-13!

    El nmero de clases depende del nmero de datos puntuales y del alcance de los datos reco-lectados. Cuantos ms datos puntuales se tengan o ms grande sea el rango, ms clases se nece-sitarn para dividir los datos. Desde luego, si solamente tenemos 10 datos puntuales, no tendrasentido plantear 10 clases. Como regla general, los estadsticos rara vez utilizan menos de seis yms de 15 clases.

    Debido a que necesitamos hacer los intervalos de clase de igual tamao, el nmero de clasesdetermina el ancho de cada clase. Para hallar el ancho de los intervalos podemos utilizar estaecuacin:

    Determine el anchode los intervalos declase

    Use de 6 a 15 clases

    Problemas con clasesdesiguales

    Divida el rango total de los datos en clases de igual tamao

    Clasifique los datos

    20 Captulo 2 Agrupacin y presentacin de datos para expresar significados: tablas y grficas

    Produccin diaria de unamuestra de 30 telarespara alfombras conintervalos de clase de0.5 yardas

    Tabla 2-12 Clase en yardas Frecuencia

    15.1-15.5 215.6-16.0 1616.1-16.5 816.6-17.0 4

    30

  • Clase Frecuencia

    15.2-15.4 215.5-15.7 515.8-16.0 1116.1-16.3 616.4-16.6 316.7-16.9 3

    30

    2.4 Construccin de una distribucin de frecuencias 21

    Debemos utilizar el siguiente valor de las mismas unidades, ya que estamos midiendo el in-tervalo entre el primer valor de una clase y el primer valor de la siguiente. En nuestro estudiode los telares, el ltimo valor es 16.9, de modo que el siguiente valor es 17.0. Como estamos uti-lizando seis clases en este ejemplo, el ancho de cada clase ser:

    [2-1]

    0.3 yd ancho de los intervalos de clase

    El paso 1 est completo. Hemos decidido clasificar los datos segn las mediciones cuantitati-vas de cuntas yardas de alfombra fueron producidas. Definimos seis clases para cubrir el rangode 15.2 a 16.9 y, como resultado de ello, utilizamos 0.3 yardas como el ancho de nuestros interva-los de clase.

    2. Clasifique los datos puntuales en clases y cuente el nmero de observaciones que hay encada una. Hicimos esto en la tabla 2-14. Cada dato puntual entra al menos en una clase y ningndato puntual entra en ms de una clase. En consecuencia, nuestras clases son completamenteincluyentes y mutuamente excluyentes. Observe que el lmite inferior de la primera clase corres-ponde al dato puntual menor de la muestra, y que el lmite superior de la ltima clase correspon-de al de dato puntual mayor.

    3. Ilustre los datos en un diagrama. (Vea la figura 2-1.)

    Estos tres pasos nos permiten organizar los datos en forma tanto tabular como grfica. En estecaso, nuestra informacin se muestra en la tabla 2-14 y en la figura 2-1. Estas dos distribuciones defrecuencias omiten algunos de los detalles contenidos en los datos sin procesar de la tabla 2-3, peronos facilitan la observacin de los patrones contenidos en ellos. Por ejemplo, una caracterstica ob-via es que la clase 15.8-16.0 contiene el mayor nmero de elementos; mientras que la 15.2-15.4, con-tiene el menor.

    Construya las clases y cuente las frecuencias

    Examine los resultados

    1.86

    17.0 15.26

    Valor unitario siguiente despus del valorms grande de los datos Valor ms pequeo de los datos

    Nmero total de intervalos de clase

    Produccin diaria de unamuestra de 30 telarespara alfombra utilizandointervalos de clasedesiguales

    Tabla 2-13 Clase Ancho de intervalos de clase Frecuencia

    15.1-15.5 15.6 15.1 0.5 215.6-15.8 15.9 15.6 0.3 815.9-16.1 16.2 15.9 0.3 916.2-16.5 16.6 16.2 0.4 716.6-16.9 17.0 16.6 0.4 4

    30

    Produccin diaria de unamuestra de 30 telarespara alfombra conintervalos de clase de0.3 yardas

    Tabla 2-14

  • Observe, en la figura 2-1, que las frecuencias de las clases con ancho de 0.3 yardas siguen unasecuencia regular: el nmero de datos puntuales empieza con dos para la primera clase, aumentahasta cinco en la segunda, alcanza 11 en la tercera clase, disminuye a seis y luego cae a tres enla quinta y sexta clases. Tendremos que, cuanto ms ancho sea el intervalo de clase, ms suave ser laprogresin. Sin embargo, si las clases son demasiado anchas, podemos perder mucha informacin,al grado de que la grfica carezca de significado. Por ejemplo, si compactamos la figura 2-1 y toma-mos slo dos categoras, oscurecemos el patrn. Esto se hace evidente en la figura 2-2.

    Uso de la computadora para construir distribuciones de frecuencias A lo largo del presente texto, usaremos ejemplos sencillos para ilustrar cmo realizar muchos tiposde anlisis estadsticos. Con tales ejemplos, usted puede aprender qu tipo de clculos debe hacer.Esperamos que tambin sea capaz de entender los conceptos que hay detrs de los clculos, de modoque pueda apreciar por qu algunos clculos en particular son los apropiados. Sin embargo, prevale-ce la cuestin de hacer los clculos de forma manual es tedioso, cansado y proclive al error. Adems,muchos problemas reales tienen tal cantidad de datos que no es posible hacer los clculos a mano.

    Por esta razn, casi todos los anlisis estadsticos reales se hacen con ayuda de computadoras. Ustedprepara los datos que introducir a la mquina e interpreta los resultados y decide las acciones adecua-das, pero la computadora realiza todos los clculos numricos. Existen muchos paquetes de softwareampliamente utilizados para hacer anlisis estadsticos. Entre otros, estn Minitab, SAS, Excel, SPSSy SYSTAT.* Pero emplearemos Minitab, SPS y Excel para ilustrar los resultados tpicos que producen.

    El apndice 10 contiene los datos de calificaciones de los 199 estudiantes que usaron este textodurante 2002. En la figura 2-3 se us Minitab para crear una distribucin de frecuencias de las cali-ficaciones totales sin procesar de los estudiantes del curso. Los valores de la columna TOTPOR10son los puntos medios o marcas de clase. Con frecuencia tambin son de inters las distribucionesde frecuencias bivariadas, en las que los datos se clasifican de acuerdo con dos atributos diferentes.En la figura 2-4 se ilustra una distribucin que muestra las calificaciones con letras en las seis sec-

    Uso de los datos de calificaciones

    Paquetes de softwarepara anlisis estadsticos

    Los clculos manuales sontediosos

    Detecte las tendencias

    22 Captulo 2 Agrupacin y presentacin de datos para expresar significados: tablas y grficas

    FIGURA 2-1

    Distribucin de frecuencia de los niveles de produccin de una muestra de 30telares para alfombra con intervalos de clase de 0.3 yardas

    14

    12

    10

    8

    6

    4

    2

    15.2-15.4 15.5-15.7 15.8-16.0Nivel de produccin en yardas

    Frec

    uenc

    ia

    16.1-16.3 16.4-16.6 16.7-16.9

    2 5 11 6 3 3

    FIGURA 2-2

    Distribucin de frecuencias de los niveles de produccinde una muestra de 30 telares para alfombra conintervalos de clase de una yarda

    20

    2

    4

    6

    8

    10

    12

    14

    16

    18

    15.1-16.0 16.1-17.0Nivel de produccin en yardas

    Frec

    uenc

    ia

    18 12

    *Minitab es marca registrada de Minitab, Inc., University Park, Pa. SAS es marca registrada de SAS Institute, Inc., Cary N.C. SPSS es marca registrada de SPSS, Inc., Chicago, Ill. SYSTAT es marca registrada de SYSTAT, Inc. Evanston, Ill. Exceles marca registrada de Microsoft.

  • Resumen estadstico para variables discretas

    2.4 Construccin de una distribucin de frecuencias 23

    FIGURA 2-3

    Distribucin defrecuencias de calificacionestotales sin procesar obtenidacon Minitab

    TOTPOR10 Cuenta Porcentaje Ctaacum Pctacum

    FIGURA 2-4Distribucin defrecuenciasbivariada obtenidacon Minitab quemuestra lascalificaciones encada seccin

    Estadsticas tabuladasRENGLONES: CALIFNUM COLUMNAS: SECCIN

    CONTENIDO DE CELDAS --CUENTA% DE TABLA

    TODO

    TODO

    ciones de la clase. La variable CALIFNUM tiene valores de 0 a 9, que corresponden a las califica-ciones con letras F, D, C, C, C, B, B, B+, A y A.

    El apndice 11 contiene los datos correspondientes a las ganancias del ltimo trimestre de 1989de 224 compaas, los cuales fueron publicados en The Wall Street Journal durante la segunda se-mana de febrero de 1990. La figura 2-5 ilustra la distribucin de frecuencias obtenida con Minitabde las ganancias del ltimo trimestre de 1989. La variable Q489 representa las ganancias del ltimotrimestre de 1989, en cifras redondeadas a dlares.

    Debido a que las compaas incluidas en la New York Stock Exchange (Bolsa de Valores de Nue-va York) (3) tienden a tener caractersticas financieras diferentes a las enumeradas en la AmericanStock Exchange (Bolsa de Valores Estadounidense) (2), y debido tambin a que stas, a su vez, son

  • 24 Captulo 2 Agrupacin y presentacin de datos para expresar significados: tablas y grficas

    FIGURA 2-6

    Distribucin defrecuenciasbivariadasobtenida conMinitab en dondese muestran losingresos de cadatransaccin

    Resumen estadstico para variables discretas

    FIGURA 2-5

    Distribucin defrecuenciasobtenida conMinitab de lascalificaciones delltimo trimestre de 1989

    Q489 Cuenta Porcentaje Ctaacum Pctacum

    distintas a las de las compaas enumeradas en al contado (1), tambin utilizamos MYSTAT paraproducir la distribucin bivariada de los mismos datos en la figura 2-6.

    Estadsticas tabuladasRENGLONES: Q489 COLUMNAS: TRANSACCIN

    CONTENIDO DE LAS CELDAS --CUENTA% DE RENGLN% DE COLUMNA% DE TABLA

    TODO

    TODO

  • 2.4 Construccin de una distribucin de frecuencias 25

    Es necesario ser extremadamente cuida-dosos al elegir las clases cuando se elaborauna distribucin de frecuencias, inclusocuando un programa de computacin de-

    fine las clases. Por ejemplo, un programa de cmputo pue-de clasificar las respuestas a un estudio de mercado deacuerdo con la edad del consumidor: 15-19, 20-24, 25-29,

    y as sucesivamente. Pero si el producto bajo estudio estdirigido a estudiantes universitarios, tendra ms sentidoagrupar los datos en las categoras: 18, 19-22 y 23 o ma-yores. No pierda de vista que el uso de una computadorapara efectuar clculos estadsticos no sustituye al sentidocomn.

    SUGERENCIASY

    SUPOSICIONES

    Ejercicios 2-4

    Ejercicios de autoevaluacin

    EA 2-3 La compaa High Performance Bicycle Products de Chapel Hill, Carolina del Norte, hizo un muestreode sus registros de embarque para cierto da con los siguientes resultados:

    Tiempo entre la recepcin de una orden y su entrega (en das)

    4 12 8 14 11 6 7 13 13 1111 20 5 19 10 15 24 7 29 6

    Construya una distribucin de frecuencias para estos datos y una distribucin de frecuencias relativas. Useintervalos de 6 das.a) Qu puede asegurar acerca de la efectividad del procesamiento de pedidos a partir de la distribucin

    de frecuencias?b) Si la compaa desea asegurar que la mitad de sus entregas se hagan en 10 das o menos, puede de-

    terminar, a partir de la distribucin de frecuencias, si han logrado esta meta?c) Qu puede hacer con los datos si tiene una distribucin de frecuencias relativas, que es difcil lograr

    con slo una distribucin de frecuencias?EA 2-4 El seor Franks, un ingeniero de seguridad de Mars Point Nuclear Power Generating Station, elabor una

    tabla de la temperatura pico del reactor cada da durante el ltimo ao y prepar la siguiente distribucinde frecuencias:

    Temperaturas en C Frecuencia

    Menos de 500 4501-510 7511-520 32521-530 59530-540 82550-560 65561-570 33571-580 28580-590 27591-600 23

    Total 360

    Enumere y explique los errores que pueda encontrar en la distribucin del seor Franks.

    Aplicaciones 2-17 La Universal Burger est preocupada por la cantidad de desperdicio que genera, por lo que obtuvo una

    muestra del desperdicio de hamburguesas desde el ao pasado con los siguientes resultados:

  • 26 Captulo 2 Agrupacin y presentacin de datos para expresar significados: tablas y grficas

    Nmero de hamburguesas descartadas durante un turno

    2 16 4 12 19 29 24 7 1922 14 8 24 31 18 20 16 6

    Construya una distribucin de frecuencias y una distribucin de frecuencias relativas para estos datos. Uti-lice intervalos de 5 hamburguesas.a) Una de las metas de Universal Burger es que al menos 75% de los turnos tengan no ms de 16 ham-

    burguesas desperdiciadas. Puede determinar a partir de la distribucin de frecuencia si se logra estameta?

    b) Qu porcentaje de turnos tienen desperdicios de 21 hamburguesas o menos? Qu distribucin uspara determinar su respuesta?

    2-18 Remtase a la tabla 2-2 y construya una distribucin de frecuencias relativas usando intervalos de 4.0lb/pulg2. Qu se puede concluir a partir de esta distribucin?

    2-19 La Oficina de Estadstica Laboral ha definido una muestra de 30 comunidades de todo Estados Unidos ycompil los precios de productos bsicos en cada comunidad al principio y al final del mes de agosto, conel fin de encontrar cunto ha variado aproximadamente el ndice de Precios al Consumidor (IPC) (CPI,Consumer Price Index) durante ese mes. Los cambios porcentuales en los precios para las 30 comunida-des son:

    0.7 0.4 0.3 0.2 0.1 0.1 0.3 0.7 0.0 0.40.1 0.5 0.2 0.3 1.0 0.3 0.0 0.2 0.5 0.1

    0.5 0.3 0.1 0.5 0.4 0.0 0.2 0.3 0.5 0.4

    a) Ordene los datos en un arreglo ascendente.b) Utilizando las siguientes cuatro clases de igual tamao, construya una distribucin de frecuencias:

    0.5 a 0.2, 0.1 a 0.2, 0.3 a 0.6 y 0.7 a 1.0.c) Cuntas comunidades tienen precios que no han cambiado o que se han incrementado en menos de

    1.0%?d) Son estos datos continuos o discretos?

    2-20 Sarah Anne Ralpp, presidenta de Baggit, Inc., acaba de obtener algunos datos sin procesar de una inves-tigacin de mercado que su compaa hizo recientemente. La investigacin se llev a cabo para determi-nar la efectividad del nuevo lema publicitario de la empresa, Cuando termine con todo, emblselo! Pa-ra determinar el efecto del lema sobre las ventas de los empaques Emblselo para comida, se interrog a20 personas respecto a cuntos empaques compraba mensualmente antes de conocer el lema publicitarioy cuntos compra despus que ste se utiliz en una campaa. Los resultados fueron los siguientes:

    Antes/Despus Antes/Despus Antes/Despus Antes/Despus

    4 3 2 1 5 6 8 104 6 6 9 2 7 1 31 5 6 7 6 8 4 33 7 5 8 8 4 5 75 5 3 6 3 5 2 2

    a) Construya las distribuciones de frecuencias simples y relativas para las respuestas dadas antes, uti-lizando como clases los intervalos 1 a 2, 3 a 4, 5 a 6, 7 a 8 y 9 a 10.

    b) Haga lo mismo que en el inciso anterior para los datos de despus.c) Mencione la razn fundamental por la cual tiene sentido utilizar las mismas clases para ambos tipos

    de respuestas, antes y despus.d) Para cada pareja de respuestas antes/despus, reste la respuesta antes de la respuesta despus

    para obtener el nmero que llamaremos cambio (ejemplo: 3 4 1), y construya ambas distri-buciones de frecuencias, simples y relativas, para la categora cambio, utilizando las clases 5 a4, 3 a 2, 1 a 0, 1 a 2, 3 a 4 y 5 a 6.

    e) Con base en su anlisis, establezca si el nuevo lema publicitario ha contribuido a las ventas, e indiqueuna o dos razones que sustenten su conclusin.

    2-21 A continuacin presentamos las edades de 30 personas que compraron grabadoras de video en la tiendade msica Symphony durante la semana pasada:

  • 2.4 Construccin de una distribucin de frecuencias 27

    26 37 40 18 14 45 32 68 31 3720 32 15 27 46 44 62 58 30 4222 26 44 41 34 55 50 63 29 22

    a) A partir de una observacin de los datos como se presentan, a qu conclusiones puede llegar rpida-mente acerca del mercado de Symphony?

    b) Construya una clasificacin cerrada de seis categoras. Esta clasificacin le permite llegar a alguna con-clusin adicional sobre el mercado de Symphony?

    2-22 Utilice los datos del ejercicio 2-21.a) Construya una clasificacin de extremo abierto de cinco categoras. Esta clasificacin le permite lle-

    gar a alguna otra conclusin acerca del mercado de Symphony?b) Construya ahora una distribucin de frecuencias relativas que corresponda a la clasificacin de extre-

    mo abierto de cinco categoras. Esta distribucin le proporciona a Symphony informacin adicionaltil acerca de su mercado? Por qu?

    2-23 John Lyon, dueo de la tienda de alimentos Fowlers de Chapel Hill, Carolina del Norte, tiene organiza-das las compras que le hicieron sus clientes durante la semana anterior en la siguiente distribucin de fre-cuencias:

    Cant. gastada Frecuencia

    0.00- 0.99 1,0501.00- 3.99 1,2404.00- 6.99 1,3007.00- 9.99 1,460

    10.00-12.99 1,90013.00-15.99 1,05016.00-18.99 1,15019.00-21.99 98022.00-24.99 83025.00-27.99 78028.00-30.99 76031.00-33.99 72034.00-36.99 61037.00-39.99 42040.00-42.99 28043.00-45.99 10046.00-48.99 90

    John dice que es incmodo tener 17 intervalos, cada uno definido por dos nmeros. Puede usted sugerircmo simplificar la clasificacin de los datos sin perder demasiado su valor?

    2-24 A continuacin puede ver los puntos medios de los intervalos de una distribucin de frecuencias que re-presenta el tiempo en minutos que tardaron los miembros del equipo de atletismo de una universidad enrecorrer ocho kilmetros a campo traviesa.

    25 35 45

    a) Dira que el entrenador puede obtener informacin suficiente a partir de estos puntos medios paraayudar al equipo?

    b) Si la respuesta al inciso anterior es no, cuntos intervalos pareceran los apropiados? 2-25 Barney Mason examin la cantidad de desperdicio de papas fritas (en libras) durante los ltimos 6 meses

    en Universal Burger y cre la siguiente distribucin de frecuencias:Desperdicio de papas fritas en libras Frecuencia

    0.0- 3.9 374.0- 7.9 468.0-11.9 23

    12.0-16.9 2717.0-25.9 726.0-40.9 0

    180

  • Enumere y explique los errores que pueda encontrar en la distribucin de Barney. 2-26 Construya una clasificacin discreta y cerrada para las posibles respuestas a la pregunta acerca del esta-

    do civil en una solicitud de empleo. Construya tambin una clasificacin discreta y de extremo abiertode tres categoras para las mismas respuestas.

    2-27 Las listas de la bolsa de valores por lo general contienen el nombre de la compaa, las ofertas superior einferior, el precio de cierre y el cambio con respecto al precio de cierre del da anterior. A continuacinpresentamos un ejemplo:

    Nombre Oferta superior Oferta inferior Cierre Cambio

    Sistemas asociados 1112 1078 11

    14 12

    Se trata de una distribucin: a) de todos los valores de la Bolsa de Valores de Nueva York por industria,b) por precios al cierre de un da determinado y c) por cambios en los precios de un da dado?

    La distribucin es1) cuantitativa o cualitativa?2) continua o discreta?3) de extremo abierto o cerrado?

    Respondera de manera diferente al inciso c) si el cambio fuera expresado slo como mayor, me-nor o sin cambio?

    2-28 Los niveles de ruido en decibeles de un avin que despega del aeropuerto del condado de Westchester fue-ron redondeados al decibel ms cercano y agrupados en una distribucin de frecuencias con intervalos quetienen puntos medios entre 100 y 130. Por debajo de los 100 decibeles no se consideran altos, mientrasque cualquier nivel por arriba de los 140 decibeles resulta casi ensordecedor. Los miembros de la organi-zacin Residentes de un barrio ms tranquilo estn recabando datos para su pleito contra el aeropuer-to, esta distribucin es adecuada para sus propsitos?

    2-29 Utilice los datos del ejercicio 2-28. Si el abogado defensor del aeropuerto est recogiendo datos en su pre-paracin para irse a juicio, tomar los datos del punto medio (o marca de clase) de los intervalos del ejer-cicio 2-28 como favorables para sus objetivos?

    2-30 El presidente de Ocean Airlines intenta hacer una estimacin de cunto se tardar el Departamento deAeronutica Civil (DAC) en decidir acerca de la solicitud de la compaa sobre una nueva ruta entre Char-lotte y Nashville. Los asesores del presidente han organizado los siguientes tiempos de espera de las so-licitudes formuladas durante el ao anterior. Los datos se expresan en das, desde la fecha de la solicitudhasta la respuesta del DAC.

    34 40 23 28 31 40 25 33 47 3244 34 38 31 33 42 26 35 27 3129 40 31 30 34 31 38 35 37 3324 44 37 39 32 36 34 36 41 3929 22 28 44 51 31 44 28 47 31

    a) Construya una distribucin de frecuencias utilizando diez intervalos cerrados, igualmente espaciados.Qu intervalo contiene el mayor nmero de datos puntuales?

    b) Construya una distribucin de frecuencias utilizando cinco intervalos cerrados, igualmente espacia-dos. Qu intervalo contiene el mayor nmero de datos puntuales?

    c) Si el presidente de la Ocean Airlines tiene una distribucin de frecuencias relativas, ya sea para a) opara b), le ayudar sta para estimar la respuesta que necesita?

    2-31 Con el propsito de hacer una evaluacin de desempeo y un ajuste de cuotas, Ralph Williams estuvo ins-peccionando las ventas de automviles de sus 40 vendedores. En un periodo de un mes, tuvieron las si-guientes ventas de automviles:

    7 8 5 10 9 10 5 12 8 610 11 6 5 10 11 10 5 9 138 12 8 8 10 15 7 6 8 85 6 9 7 14 8 7 5 5 14

    a) Con base en la frecuencia, cules seran las marcas de clase (puntos medios de los intervalos) de-seadas?

    b) Construya distribuciones de frecuencias y de frecuencias relativas con el mayor nmero posible demarcas de clase. Haga los intervalos igualmente espaciados y con un ancho de al menos dos automviles.

    28 Captulo 2 Agrupacin y presentacin de datos para expresar significados: tablas y grficas

  • c) Si las ventas menores de siete automviles por mes se consideran como un desempeo inaceptable,cul de los dos incisos, a) o b), es de mayor utilidad para identificar al grupo insatisfactorio de ven-dedores?

    2-32 Kesslers Ice Cream Delight intenta mantener los 55 sabores diferentes de helado en existencia en cadauna de sus sucursales. El director de investigacin de mercado de la compaa sugiere que mantener unmejor registro para cada tienda es la clave para evitar quedarse sin existencias. Don Martin, director deoperaciones, recolecta datos redondeados al medio galn ms cercano sobre la cantidad diaria de heladode cada sabor que se vende. Nunca se venden ms de 20 galones de un solo sabor al da.a) La clasificacin con respecto a los sabores es discreta o continua? Abierta o cerrada?b) La clasificacin con respecto a la cantidad de helado es discreta o continua? Abierta o cerrada?c) Son los datos cuantitativos o cualitativos?d) Qu le sugerira a Don Martin para generar mejores datos para llevar a cabo una investigacin de

    mercado? 2-33 Doug Atkinson es dueo y recogedor de boletos de un trasbordador que transporta pasajeros y automvi-

    les desde Long Island hasta Connecticut. Doug tiene datos que indican el nmero de personas y de auto-mviles que han utilizado el trasbordador durante los dos ltimos meses. Por ejemplo,

    3 de julio Nmero de pasajeros 173 Nmero de automviles 32

    podra ser la informacin tpica registrada durante un da. Doug ha establecido seis clases igualmente es-paciadas para registrar el nmero diario de pasajeros y las marcas de clase son 84.5, 104.5, 124.5, 144.5,164.5 y 184.5. Las seis clases igualmente espaciadas que construy Doug para el nmero diario de auto-mviles tienen marcas de clase de 26.5, 34.5, 42.5, 50.5, 58.5 y 66.5. (Las marcas de clase son los puntosmedios de los intervalos.)a) Cules son los lmites inferior y superior de las clases para el nmero de pasajeros?b) Cules son los lmites inferior y superior de las clases para el nmero de automviles?

    Soluciones a los ejercicios de autoevaluacinEA 2-3 Clase 1-6 7-12 13-18 19-24 25-30

    Frecuencia 4 8 4 3 1Frecuencia relativa 0.20 0.40 0.20 0.15 0.05a) Suponiendo que la compaa abre 6 das a la semana, se ve que 80% de las rdenes se entregan en 3

    semanas o menos.b) Se puede decir que slo entre 20 y 60% de las entregas se hacen en 10 das o menos, de manera que

    la distribucin no genera suficiente informacin para determinar si la meta se cumple.c) Una distribucin de frecuencias relativas permite presentar frecuencias como fracciones o porcenta-

    jes.EA 2-4 La distribucin no contiene todos los datos. El valor 500C no aparece, tampoco los puntos entre 541 y

    549C, inclusive. Adems, la distribucin est cerrada a la derecha, lo que elimina todos los datos mayo-res de 600C. Estas omisiones pueden explicar el hecho de que el nmero total de observaciones sea slo360, en lugar de 365 como podra esperarse del conjunto de datos coleccionados durante un ao. (Nota:no es absolutamente necesario que la distribucin est abierta a la derecha, en especial si no se registra-ron valores mayores que 600C. Sin embargo, para que est completa, la distribucin debe ser continua enel intervalo seleccionado, aun cuando no haya datos en algunos intervalos.) Por ltimo, las clasificacionesno son mutuamente excluyentes. Los puntos 530C y 580C estn contenidos en ms de un intervalo. Alcrear un conjunto continuo de clasificaciones, debe tenerse cuidado de evitar este error.

    2.5 Representacin grfica de distribuciones de frecuencias

    Las figuras 2-1 y 2-2 son un avance de lo que estudiaremos a continuacin: cmo presentar las dis-tribuciones de frecuencias de manera grfica. Las grficas proporcionan datos en un diagrama de dosdimensiones. En el eje horizontal podemos mostrar los valores de la variable (la caracterstica queestamos midiendo), como la produccin de alfombras en yardas. En el eje vertical sealamos las fre-cuencias de las clases mostradas en el eje horizontal. De esta forma, la altura de las barras de la figura

    Identificacin de los ejes horizontaly vertical

    2.5 Representacin grfica de distribuciones de frecuencias 29

  • 2-1 mide el nmero de observaciones que hay en cada clase sealada en el eje horizontal. Las grfi-cas de distribuciones de frecuencias y de distribuciones de frecuencias relativas son tiles debido aque resaltan y aclaran los patrones que no se pueden distinguir fcilmente en las tablas. Atraen laatencin del que las observa hacia los patrones existentes en los datos. Las grficas tambin ayudana resolver problemas relacionados a las distribuciones de frecuencias; nos permiten estimar algunosvalores con slo una mirada y proporcionan una verificacin visual sobre la precisin de nuestras so-luciones.

    HistogramasLas figuras 2-1 y 2-2 son dos ejemplos de histogramas. Un histograma consiste en una serie de rec-tngulos, cuyo ancho es proporcional al rango de los valores que se encuentran dentro de una clase,y cuya altura es proporcional al nmero de elementos que caen dentro de la clase. Si las clasesempleadas en la distribucin de frecuencias son del mismo ancho, entonces las barras verticales delhistograma tambin tienen el mismo ancho. La altura de la barra correspondiente a cada clase repre-senta el nmero de observaciones de la clase. Como consecuencia, el rea contenida en cada rectn-gulo (base por altura) ocupa un porcentaje del rea total de todos los rectngulos la cual es igual a lafrecuencia absoluta de esa clase correspondiente respecto a todas las observaciones hechas.

    Un histograma que utiliza las frecuencias relativas de los datos puntuales de cada una de lasclases, en lugar de usar el nmero real de puntos, se conoce como histograma de frecuencias relati-vas. Este tipo de histograma tiene la misma forma que un histograma de frecuencias absolutas cons-truido a partir del mismo conjunto de datos. Esto es as debido a que en ambos, el tamao relativode cada rectngulo es la frecuencia de esa clase comparada con el nmero total de observaciones.

    Recuerde que la frecuencia relativa de cualquier clase es el nmero de observaciones que entranen la clase, dividido entre el nmero total de observaciones hechas. La suma de todas las frecuenciasrelativas de cualquier conjunto de datos debe ser igual a 1.0. Con esto en mente, podemos convertirel histograma de la figura 2-1 en un histograma de frecuencias relativas como el presentado en la fi-gura 2-7. Observe que la nica diferencia entre stos es el lado izquierdo de la escala del eje verti-cal. Mientras que la escala vertical del histograma de la figura 2-1 representa el nmero absoluto deobservaciones de cada clase, la escala del histograma de la figura 2-7 es el nmero de observacionesde cada clase tomadas como una fraccin del nmero total de observaciones.

    Poder presentar los datos en trminos de la frecuencia relativa de las observaciones, ms que entrminos de la frecuencia absoluta, es de gran utilidad, ya que mientras los nmeros absolutos pue-den sufrir cambios (si probamos ms telares, por ejemplo), la relacin entre las clases permanece es-table. El 20% de todos los telares puede entrar en la clase 16.1-16.3 yardas, ya sea que probemos30 o 300 telares. Resulta fcil comparar los datos de muestras de diferentes tamaos cuando utiliza-mos histogramas de frecuencias relativas.

    Ventajas del histo-grama de frecuenciasrelativas

    Funcin de un histograma de frecuencias relativas

    Descripcin de loshistogramas

    Funcin de las grficas

    30 Captulo 2 Agrupacin y presentacin de datos para expresar significados: tablas y grficas

    FIGURA 2-7

    Distribucin defrecuencias relativas de losniveles deproduccin de unamuestra de 30telares paraalfombrautilizandointervalos de clasede 0.3 yardas

    0.40

    0.30

    0.20

    0.10

    15.2-15.4 15.5-15.7 15.8-16.0 16.1-16.3 16.4-16.6 16.7-16.9Nivel de produccin en yardas

    Frec

    uenc

    ia re

    lativa

    0.07 0.17 0.37 0.20 0.10 0.10

  • Polgonos de frecuenciasAunque se utilizan menos, los polgonos de frecuencias son otra forma de representar grficamentedistribuciones tanto de frecuencias como de frecuencias relativas. Para construir un polgono de fre-cuencias sealamos stas en el eje vertical y los valores de la variable que estamos midiendo en eleje horizontal, del mismo modo en que se hizo con el histograma. A continuacin, graficamos cadafrecuencia de clase trazando un punto sobre su punto medio y conectamos los puntos sucesivos re-sultantes con una lnea recta para formar un polgono (una figura con muchos lados).

    La figura 2-8 representa un polgono de frecuencias construido a partir de los datos de la tabla 2-14. Si compara esta figura con la 2-1, notar que se han agregado dos clases, una en cada extremode la escala de valores observados. stas contienen cero observaciones, pero permiten que el pol-gono llegue al eje horizontal en ambos extremos de la distribucin.

    De qu manera podemos convertir un polgono de frecuencias en un histograma? Un polgonode frecuencias es slo una lnea que conecta los puntos medios de todas las barras de un histograma.Por consiguiente, podemos reproducir el histograma mediante el trazado de lneas verticales desdelos lmites de clase (sealados en el eje horizontal) y, luego, conectando esas lneas con rectas hori-zontales a la altura de los puntos medios del polgono. En la figura 2-9 hicimos esto con lneas pun-teadas.

    Un polgono de frecuencias que utiliza frecuencias relativas de datos puntuales en cada una de lasclases, en lugar del nmero real de puntos, se conoce como polgono de frecuencias relativas. Estepolgono tiene la misma forma que el polgono de frecuencias construido a partir del mismo conjun-to de datos, pero con una escala diferente en los valores del eje vertical. En lugar del nmero abso-luto de observaciones, la escala representa el nmero de observaciones de cada clase expresadascomo una fraccin del total de observaciones.

    Los histogramas y los polgonos de frecuencias son similares. Por qu necesitamos ambos? Lasventajas de los histogramas son:

    1. Los rectngulos muestran cada clase de la distribucin por separado.2. El rea de cada rectngulo, en relacin con el resto, muestra la proporcin del nmero total de

    observaciones que se encuentran en esa clase.

    Ventajas del histograma

    Construccin de unpolgono de frecuen-cias relativas

    Conversin de un polgono de frecuencias en unhistograma

    Aada dos clases

    Utilice los puntosmedios en el eje horizontal

    2.5 Representacin grfica de distribuciones de frecuencias 31

    FIGURA 2-8

    Polgono defrecuencias delnivel deproduccin de unamuestra de 30telares paraalfombrautilizandointervalos de clasede 0.3 yardas

    2

    4

    6

    8

    10

    12

    14

    15.0 15.3 15.6 15.9 16.2 16.5 16.8 17.1Nivel de produccin en yardas

    Frec

    uenc

    ia

    FIGURA 2-9

    Histogramatrazado a partir de los puntos delpolgono defrecuencias de la figura 2-8

    2

    4

    6

    8

    10

    12

    14

    15.0 15.3 15.6 15.9 16.2 16.5 16.8 17.1Nivel de produccin en yardas

    Frec

    uenc

    ia

  • Los polgonos, por su parte, tambin poseen ciertas ventajas.1. El polgono de frecuencias es ms sencillo que su histograma correspondiente.2. Bosqueja con ms claridad un perfil del patrn de los datos.3. El polgono se vuelve cada vez ms suave y parecido a una curva conforme aumentamos el

    nmero de clases y el nmero de observaciones.

    Un polgono como el que acabamos de describir, suavizado mediante el aumento de clases y dedatos puntuales, se conoce como curva de frecuencias. En la figura 2-10, hemos utilizado el ejem-plo de los telares para alfombra, pero en esta ocasin aumentamos el nmero de observaciones a 300y el nmero de clases a 10. Note que conectamos los puntos con lneas curvas para tener una apro-ximacin de la manera en que se vera el polgono si tuviramos un gran nmero de datos puntualese intervalos de clase muy pequeos.

    OjivasUna distribucin de frecuencias acumuladas nos permite ver cuntas observaciones estn por enci-ma de ciertos valores, en lugar de hacer un mero registro del nmero de elementos que hay dentrode los intervalos. Por ejemplo, si deseamos saber cuntos telares tejen menos de 17.0 yardas, pode-mos utilizar una tabla que registre las frecuencias acumuladas menores que de nuestra muestra,como se presenta en la tabla 2-15.

    La grfica de una distribucin de frecuencias acumuladas se conoce como ojiva. En la figura2-11 se muestra la ojiva de la distribucin de frecuencias de la tabla 2-15. Los puntos representadosen la grfica indican el nmero de telares que tienen una produccin menor que el nmero de yardasmostrado en el eje horizontal. Note que el lmite inferior de las clases de la tabla se convierte en ellmite superior de la distribucin acumulada de la ojiva.

    Una ojiva menor que

    Definicin dedistribucin de frecuenciasacumuladas

    Creacin de unacurva de frecuencia

    Ventajas de los polgonos

    32 Captulo 2 Agrupacin y presentacin de datos para expresar significados: tablas y grficas

    FIGURA 2-10

    Curva defrecuencias de losniveles deproduccin de unamuestra de 300telares paraalfombrautilizandointervalos de 0.2 yardas

    48

    12162024283236404448525660

    14.8 15.0 15.2 15.4 15.6 15.8 16.0 16.416.2 16.6 16.8 17.0Nivel de produccin en yardas

    Frec

    uenc

    ia

    Distribucin de frecuencias menoresque acumulada de losniveles de produccin deuna muestra de 30 telares para alfombra

    Tabla 2-15 Clase Frecuencia acumulada

    Menos que 15.2 0Menos que 15.5 2Menos que 15.8 7Menos que 16.1 18Menos que 16.4 24Menos que 16.7 27Menos que 17.0 30

  • En algunas ocasiones, la informacin que utilizamos se presenta en trminos de frecuenciasacumuladas mayores que. La ojiva adecuada para tal informacin tendra una inclinacin haciaabajo y hacia la derecha, en lugar de tener una hacia arriba y a la derecha, como en la figura 2-11.

    Podemos construir una ojiva de una distribucin de frecuencias relativas de la misma manera enque trazamos la ojiva de una distribucin de frecuencias absolutas de la figura 2-11. Slo habr uncambio: la escala en el eje vertical. Como en la figura 2-7, esta escala debe sealar la fraccin delnmero total de observaciones que caen dentro de cada clase.

    Para construir una ojiva acumulada menor que en trminos de frecuencias relativas, podemosremitirnos a una distribucin de frecuencias relativas (como la de la figura 2-7) y construir una tablautilizando los datos (como la tabla 2-16). Luego podemos convertir las cifras de dicha tabla en unaojiva (como en la figura 2-12). Observe que las figuras 2-11 y 2-12 son equivalentes y difieren sloen la escala del eje vertical.

    Ojivas de frecuenciasrelativas

    2.5 Representacin grfica de distribuciones de frecuencias 33

    FIGURA 2-11

    Ojiva menor que de ladistribucin deniveles deproduccin de unamuestra de 30telares paraalfombra

    3

    6

    9

    12

    15

    18

    21

    24

    27

    30

    33

    15.2Menor que 15.5 15.8 16.1 16.4 16.7 17.0Nivel de produccin en yardas

    Nm

    ero

    acum

    ulad

    o de

    telar

    es d

    e la m

    uestr

    a

    Distribucin defrecuencias relativasacumuladas de losniveles de produccin de una muestra de 30telares para alfombra

    Tabla 2-16 Clase Frecuencia acumulada Frecuencia relativa acumulada

    Menor que 15.2 0 0.00Menor que 15.5 2 0.07Menor que 15.8 7 0.23Menor que 16.1 18 0.60Menor que 16.4 24 0.80Menor que 16.7 27 0.90Menor que 17.0 30 1.00

    FIGURA 2-12

    Ojiva menor que de la distri-bucin de losniveles de pro-duccin de unamuestra de 30telares paraalfombrautilizandofrecuenciasrelativas

    1.00

    0.90

    0.80

    0.70

    0.60

    0.50

    0.40

    0.30

    0.20

    0.10

    15.2Menor que 15.5 15.8 16.1 16.4 16.7 17.0

    Nivel de produccin en yardas

    Frec

    uenc

    ia re

    lativa

    acum

    ulad

    a

  • Suponga que ahora trazamos una lnea recta perpendicular al eje vertical en la marca 0.50 hastaintersecar a la ojiva (como en la figura 2-13). De esta manera, es posible leer un valor aproximadode 16.0 del nivel de produccin del decimoquinto telar de un arreglo de 30.

    As pues, hemos regresado a la primera organizacin de datos estudiada en el presente captulo.A partir del ordenamiento de datos podemos construir distribuciones de frecuencias; a partir de lasdistribuciones de frecuencias podemos construir distribuciones de frecuencias acumuladas; a su vez,a partir de stas podemos trazar una ojiva. Y con base en esta ojiva podemos aproximar los valoresprovenientes del arreglo de datos. Sin embargo, en general no es posible recobrar los datos origina-les exactos a partir de ninguna de las representaciones grficas analizadas.

    Uso de la computadora para graficar distribuciones de frecuenciasProduzcamos algunos histogramas a partir de los datos de calificaciones presentados en el apndice10. La figura 2-14 proporciona un histograma de los promedios totales sin procesar de los estudian-tes. Observe que ste tiene barras en posicin horizontal en lugar de las barras verticales trazadashasta ahora. Adems, a la derecha de las barras, SPSS proporciona las frecuencias absolutas, las re-

    Uso de SPSS paraproducir histogramas

    Aproximacin delarreglo de datos

    34 Captulo 2 Agrupacin y presentacin de datos para expresar significados: tablas y grficas

    FIGURA 2-13

    Ojiva menor que de ladistribucin de los niveles deproduccin de unamuestra de 30telares paraalfombra, endonde se indica el valor medioaproximado delarreglo de datosoriginal

    15.2Menor que

    Valor aproximado deldecimoquinto telar = 16.0

    15.5 15.8 16.1 16.4 16.7 17.0

    Nivel de produccin en yardas

    Frec

    uenc

    ia re

    lativa

    acum

    ulad

    a

    1.00

    0.90

    0.80

    0.70

    0.60

    0.50

    0.40

    0.30

    0.20

    0.10

    FIGURA 2-14

    Histograma ydistribucin de frecuencias depromedios totalessin procesar,obtenidos conSPSS

    5

    15

    25

    35

    45

    55

    65

    75

    85

    95

    Total

    de p

    unto

    s med

    ios

    Calificaciones de estadstica en los negociosHistograma

    9

    1

    1

    2

    27

    26

    0 10 20 30 40 50 60 70

    68

    65

  • 2.5 Representacin grfica de distribuciones de frecuencias 35

    FIGURA 2-15

    Histograma ydistribucin defrecuencias paralas calificacionesde Estadstica parala administracin,obtenidos conMinitab

    Histograma de caracteresHistograma de TOTAL N = 199Cada * representa 2 observaciones

    Punto medio Cuenta5.0 0

    15.0 025.0 1 *35.0 1 *45.0 9 *****55.0 27 ************65.0 68 ******************************75.0 65 *****************************85.0 26 ***********95.0 2 *

    FIGURA 2-16Histograma SPSSde calificacionesque muestra altipo de instructor

    45

    40

    35

    30

    25

    20