Estadistica para administración y la economía - Levin y Rubin Pearson

956

description

 

Transcript of Estadistica para administración y la economía - Levin y Rubin Pearson

  • 1. El objetivo de esta sptima edicin de Estadstica para administracin y economa es crear un libro que resulte amigable para los estudiantes de estadstica y donde los profesores que imparten la ctedra encuentren material suficiente para adaptar el curso de acuerdo a sus necesidades. El libro sigue una metodologa que parte de lo que los estudiantes ya conocen para explicar los nuevos conceptos. A partir de sus experiencias y mediante un proceso intuitivo, va desarrollando los conceptos; y los complementa con ideas del mundo real, ejemplos y explicaciones pacientes: una tcnica que facilita la enseanza y el aprendizaje. Todo esto en un marco que describe situaciones administrativas reales a las cuales debern enfrentarse los estudiantes. Entre las caractersticas nuevas de esta sptima edicin para facilitar la enseanza y el aprendizaje se encuentran las siguientes: Sugerencias y suposiciones con comentarios breves. Estos bloques revisan las suposiciones importantes y explican por qu se hicieron; proporcionan al estudiante sugerencias tiles para trabajar en los ejercicios que siguen y les advierten sobre peligros potenciales al encontrar e interpretar las soluciones. Ms de 1,500 notas al margen resaltan el material importante para los estudiantes. Cada captulo comienza con un problema del mundo real, en el que un administrador debe tomar una decisin. Ya dentro del captulo se analiza y resuelve este problema como parte del proceso de enseanza. Un captulo nuevo con temas para aprender a resolver problemas de estadstica utilizando Microsoft Excel.Vistenos en: www.pearsoneducacion.net

2. ESTADSTICA PARA ADMINISTRACIN Y ECONOMA Sptima edicin 3. ESTADSTICA PARA ADMINISTRACIN Y ECONOMA Sptima edicin Richard I. Levin The University of North Carolina at Chapel HillDavid S. Rubin The University of North Carolina at Chapel Hill CON LA COLABORACIN Y REVISIN TCNICA DE Miguel Balderas Lozada Juan Carlos del Valle Sotelo Ral Gmez Castillo Departamento de Matemticas Instituto Tecnolgico y de Estudios Superiores de Monterrey Campus Estado de Mxico TRADUCCIN Marcia Gonzlez Osuna Maestra en Ingeniera Industrial University of Arizona REVISIN TCNICA Roberto H. Valadez Soto Mario Alberto Naranjo Gonzlez Departamento de Mtodos Cuantitativos Centro Universitario de Ciencias Econmico-Administrativas Universidad de Guadalajara Jess Rodrguez Franco Departamento de Matemticas Facultad de Contadura y Administracin Universidad Nacional Autmoma de Mxico Alberto I. Pierdant Rodrguez Divisin de Ciencias Sociales y Humanidades rea de Matemticas Universidad Autnoma Metropolitana, Unidad Xochimilco 4. Authorized translation from the English languaje edition, entitled Statistics for Management, Seventh Edition, by Richard I. Levin & David S. Rubin, published by Pearson Education, Inc., publishing as PRENTICE HALL, Copyright 1998. All rights reserved. ISBN 0-13-476292-4 Traduccin autorizada de la edicin en idioma ingls titulada Statistics for Management, Seventh Edition, por Richard I. Levin & David S. Rubin, publicada por Pearson Education, Inc., publicada como PRENTICE HALL, Copyright 1998. Todos los derechos reservados. Esta edicin en espaol es la nica autorizada. EDICIN EN INGLSEDICIN EN ESPAOL Editor:Guillermo Trujano Mendoza e-mail: [email protected] Editor de desarrollo: Miguel B. Gutirrez Hernndez Supervisor de produccin: Enrique Trejo HernndezAcquisitions Editor: Tom Tucker Assistant Editor: Audrey Regan Associate Editor: Diane Peirano Marketing Manager: Patrick Lynch Editorial/Production Supervision: Kelli Rahlf, Carlisle Publishers Services Managing Editor: Katherine Evancie Senior Manufacturing Supervisor: Paul Smolenski Manufacturing Manager: Vincent Scelta Senior Designer: Suzanne Behnke Design Director: Patricia Wosczyk Interior Design: Lisa Jones Cover Design: Suzanne Behnke Composition: Carlisle Communications, Ltd. Cover Photo: Richard Megna/Fundamental Photographs, NYCSPTIMA EDICIN, 2004 D.R. 2004 por Pearson Educacin de Mxico, S.A. de C.V. Atlacomulco 500, 5 piso Col. Industrial Atoto 53519, Naucalpan de Jurez, Edo. de Mxico E-mail: [email protected] Cmara Nacional de la Industria Editorial Mexicana Reg. Nm. 1031. Prentice Hall es una marca registrada de Pearson Educacin de Mxico, S.A. de C.V. Reservados todos los derechos. Ni la totalidad ni parte de esta publicacin pueden reproducirse, registrarse o transmitirse, por un sistema de recuperacin de informacin, en ninguna forma ni por ningn medio, sea electrnico, mecnico, fotoqumico, magntico o electroptico, por fotocopia, grabacin o cualquier otro, sin permiso previo por escrito del editor. El prstamo, alquiler o cualquier otra forma de cesin de uso de este ejemplar requerir tambin la autorizacin del editor o de sus representantes. ISBN 970-26-0497-4 Impreso en Mxico. Printed in Mexico. 1 2 3 4 5 6 7 8 9 0 - 07 06 05 04 5. ContenidoPrefacio xiii Captulo 1 Introduccin 1.1 1.2 1.3 1.4 1.51Por qu hay que tomar este curso y quin utiliza la estadstica? 2 Historia 3 Subdivisiones de la estadstica 4 Un enfoque simple y fcil de entender 4 Caractersticas que facilitan el aprendizaje y cmo usarlas 5Captulo 2 Agrupacin y presentacin de datos para expresar significados: Tablas y grficas 7 2.1 2.2 2.3 2.4 2.5Cmo podemos ordenar los datos? 8 Ejemplos de datos sin procesar 11 Ordenamiento de datos en arreglos de datos y distribuciones de frecuencias 12 Construccin de una distribucin de frecuencias 20 Representacin grfica de distribuciones de frecuencias 29 Estadstica en el trabajo 42 Ejercicio de base de datos computacional 43 Trminos introducidos en el captulo 2 45 Ecuaciones introducidas en el captulo 2 46 Ejercicios de repaso 46Captulo 3 Medidas de tendencia central y dispersin en distribuciones de frecuencias 57 3.1 3.2 3.3 3.4 3.5 3.6Estadstica sumaria 58 Una medida de tendencia central: la media aritmtica 60 Una segunda medida de tendencia central: la media ponderada 69 Una tercera medida de tendencia central: la media geomtrica 74 Una cuarta medida de tendencia central: la mediana 77 Una medida final de tendencia central: la moda 84v 6. 3.7 3.8 3.9 3.10 3.11Dispersin: por qu es importante 89 Rangos: medidas de dispersin tiles 91 Dispersin: medidas de desviacin promedio 96 Dispersin relativa: el coeficiente de variacin 107 Anlisis exploratorio de datos (AED) 112 Estadstica en el trabajo 116 Ejercicio de base de datos computacional 117 Trminos introducidos en el captulo 3 118 Ecuaciones introducidas en el captulo 3 119 Ejercicios de repaso 121Captulo 4 Probabilidad I: Ideas introductorias 127 4.1 4.2 4.3 4.4 4.5 4.6 4.7Historia y relevancia de la teora de la probabilidad 128 Terminologa bsica en probabilidad 129 Tres tipos de probabilidad 131 Reglas de probabilidad 137 Probabilidades bajo condiciones de independencia estadstica 143 Probabilidades bajo condiciones de dependencia estadstica 151 Revisin de las estimaciones anteriores de probabilidades: teorema de Bayes 158 Estadstica en el trabajo 165 Ejercicio de base de datos computacional 166 Trminos introducidos en el captulo 4 168 Ecuaciones introducidas en el captulo 4 169 Ejercicios de repaso 170Captulo 5 Distribuciones de probabilidad 177 5.1 5.2 5.3 5.4 5.5 5.6 5.7viContenidoQu es una distribucin de probabilidad? 178 Variables aleatorias 181 Uso del valor esperado en la toma de decisiones 187 La distribucin binomial 191 La distribucin de Poisson 202 La distribucin normal: distribucin de una variable aleatoria continua 209 Seleccin de la distribucin de probabilidad correcta 222 Estadstica en el trabajo 223 Ejercicio de base de datos computacional 224 Trminos introducidos en el captulo 5 225 Ecuaciones introducidas en el captulo 5 226 Ejercicios de repaso 227 7. Captulo 6 Muestreo y distribuciones de muestreo 235 6.1 6.2 6.3 6.4 6.5 6.6Introduccin al muestreo 236 Muestreo aleatorio 238 Diseo de experimentos 244 Introduccin a las distribuciones de muestreo 247 Distribuciones de muestreo a detalle 251 Una consideracin operacional en el muestreo: la relacin entre el tamao de muestra y el error estndar 261 Estadstica en el trabajo 265 Ejercicio de base de datos computacional 266 Trminos introducidos en el captulo 6 267 Ecuaciones introducidas en el captulo 6 268 Ejercicios de repaso 268Captulo 7 Estimacin 273 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8Introduccin 274 Estimaciones puntuales 277 Estimaciones de intervalo: conceptos bsicos 281 Estimaciones de intervalo e intervalos de confianza 285 Clculo de estimaciones de intervalo de la media a partir de muestras grandes 288 Clculo de estimaciones de intervalo de la proporcin a partir de muestras grandes 293 Estimaciones de intervalos con la distribucin t 297 Determinacin del tamao de muestra en estimacin 303 Estadstica en el trabajo 309 Ejercicio de base de datos computacional 309 Del libro de texto al mundo real 311 Trminos introducidos en el captulo 7 312 Ecuaciones introducidas en el captulo 7 313 Ejercicios de repaso 313Captulo 8 Prueba de hiptesis: Prueba de una sola muestra 319 8.1 8.2 8.3 8.4 8.5Introduccin 320 Conceptos bsicos en el procedimiento de prueba de hiptesis 321 Prueba de hiptesis 324 Pruebas de hiptesis de medias cuando se conoce la desviacin estndar de la poblacin 331 Medicin de la potencia de una prueba de hiptesis 338 Contenidovii 8. 8.6 8.7Prueba de hiptesis para proporciones: muestras grandes 341 Pruebas de hiptesis de medias cuando no se conoce la desviacin estndar de la poblacin 347 Estadstica en el trabajo 351 Ejercicio de base de datos computacional 351 Del libro de texto al mundo real 352 Trminos introducidos en el captulo 8 353 Ejercicios de repaso 353Captulo 9 Prueba de hiptesis: Pruebas de dos muestras 359 9.1 9.2 9.3 9.4 9.5 9.6 9.7Prueba de hiptesis para diferencias entre medias y proporciones 360 Pruebas para diferencias entre medias: muestras grandes 362 Pruebas para diferencias entre medias: muestras pequeas 366 Prueba de diferencias entre medias con muestras dependientes 372 Pruebas para diferencias entre proporciones: muestras grandes 378 Valor P: otra manera de ver las pruebas de hiptesis 386 Uso de computadoras para las pruebas de hiptesis 390 Estadstica en el trabajo 392 Ejercicio de base de datos computacional 392 Del libro de texto al mundo real 394 Trminos introducidos en el captulo 9 395 Ecuaciones introducidas en el captulo 9 395 Ejercicios de repaso 396Captulo 10 Calidad y control de la calidad 403 10.1 10.2 10.3 10.4 10.5 10.6 10.7viiiContenidoIntroduccin 404 Control estadstico de procesos 406 Grficas x : grficas de control para medias de procesos 407 Grficas R: grficas de control para variabilidad de procesos 417 Grficas p: diagramas de control para atributos 422 Administracin con vistas a la calidad total 428 Muestreo de aceptacin 433 Estadstica en el trabajo 438 Ejercicio de base de datos computacional 438 Del libro de texto al mundo real 440 Trminos introducidos en el captulo 10 441 Ecuaciones introducidas en el captulo 10 442 Ejercicios de repaso 443 9. Captulo 11 Ji-cuadrada y anlisis de varianza44711.1 Introduccin 448 11.2 Ji-cuadrada como prueba de independencia 449 11.3 Ji-cuadrada como prueba de bondad de ajuste: prueba de lo apropiado de una distribucin 462 11.4 Anlisis de varianza 468 11.5 Inferencias acerca de una varianza de poblacin 484 11.6 Inferencias acerca de las varianzas de dos poblaciones 489 Estadstica en el trabajo 496 Ejercicio de base de datos computacional 496 Del libro de texto al mundo real 498 Trminos introducidos en el captulo 11 498 Ecuaciones introducidas en el captulo 11 499 Ejercicios de repaso 501Captulo 12 Regresin simple y correlacin 509 12.1 12.2 12.3 12.4 12.5Introduccin 510 Estimacin mediante la recta de regresin 516 Anlisis de correlacin 535 Inferencias sobre parmetros de poblacin 545 Uso del anlisis de regresin y correlacin: limitaciones, errores y advertencias 551 Estadstica en el trabajo 553 Ejercicio de base de datos computacional 553 Del libro de texto al mundo real 554 Trminos introducidos en el captulo 12 555 Ecuaciones introducidas en el captulo 12 555 Ejercicios de repaso 557Captulo 13 Regresin mltiple y modelado 565 13.1 13.2 13.3 13.4 13.5Anlisis de regresin mltiple y correlacin 566 Deduccin de la ecuacin de regresin mltiple 567 La computadora y la regresin mltiple 574 Inferencias sobre parmetros de poblacin 582 Tcnicas de modelado 595 Estadstica en el trabajo 608 Ejercicio de base de datos computacional 609 Del libro de texto al mundo real 609 Trminos introducidos en el captulo 13 610 Ecuaciones introducidas en el captulo 13 611 Ejercicios de repaso 612 Contenidoix 10. Captulo 14 Mtodos no paramtricos 621 14.1 Introduccin a la estadstica no paramtrica 622 14.2 Prueba de signo para datos por pares 624 14.3 Pruebas de suma de rangos: prueba U de Mann-Whitney y prueba de Kruskal-Wallis 630 14.4 Prueba de corridas de una sola muestra 640 14.5 Correlacin de rango 646 14.6 Prueba de Kolmogorov-Smirnov 655 Estadstica en el trabajo 659 Ejercicio de base de datos computacional 660 Del libro de texto al mundo real 661 Trminos introducidos en el captulo 14 662 Ecuaciones introducidas en el captulo 14 662 Ejercicios de repaso 663Captulo 15 Series de tiempo y pronsticos 673 15.1 15.2 15.3 15.4 15.5 15.6 15.7 15.8Introduccin 674 Variacin en las series de tiempo 675 Anlisis de tendencia 676 Variacin cclica 686 Variacin estacional 691 Variacin irregular 699 Problema que incluye a las cuatro componentes de una serie de tiempo 699 Anlisis de series de tiempo en pronsticos 707 Estadstica en el trabajo 708 Ejercicio de base de datos computacional 709 Del libro de texto al mundo real 709 Trminos introducidos en el captulo 15 710 Ecuaciones introducidas en el captulo 15 711 Ejercicios de repaso 712Captulo 16 Nmeros ndice 16.1 16.2 16.3 16.4 16.5 16.6xContenido719Definicin de nmero ndice 720 ndice de agregados no ponderados 723 ndice de agregados ponderados 727 Mtodos de promedio de relativos 735 ndices de cantidad y de valor 740 Problemas en la construccin y el uso de nmeros ndice 744 Estadstica en el trabajo 745 Ejercicio de base de datos computacional 746 11. Del libro de texto al mundo real 747 Trminos introducidos en el captulo 16 747 Ecuaciones introducidas en el captulo 16 748 Ejercicios de repaso 749Captulo 17 Teora de decisiones 755 17.1 El entorno de la decisin 756 17.2 Ganancia esperada en condiciones de incertidumbre: asignacin de valores de probabilidad 757 17.3 Uso de distribuciones continuas: anlisis marginal 765 17.4 Utilidad como criterio de decisin 773 17.5 Ayuda para que los tomadores de decisiones proporcionen las probabilidades correctas 776 17.6 Anlisis de rboles de decisiones 780 Estadstica en el trabajo 790 Del libro de texto al mundo real 791 Trminos introducidos en el captulo 17 793 Ecuaciones introducidas en el captulo 17 793 Ejercicios de repaso 794Estadstica con Excel8011 Introduccin 801 2 Elaboracin de tablas de frecuencia, histogramas y grficos (diagramas de barras o circulares) 807 3 Medidas de tendencia central y dispersin para datos no agrupados 814 4 Anlisis de varianza de un factor 816 5 Anlisis de regresin lineal mltiple mediante el uso de Excel 818Anexos827A Conjuntos y tcnicas de conteo 1 A.1 Definiciones 1 A.2 Operaciones con conjuntos 4 A.3 Frmulas de cardinalidad 8 A.4 Algunos conjuntos de uso frecuente 9 A.5 Principio fundamental del conteo 9 A.6 Permutaciones 10 A.7 Combinaciones 12 A.8 Teorema del binomio 14Contenidoxi 12. B Habilidad del proceso 15 B.1 Grficas de control y parmetros de poblacin 15 B.2 Resumen de frmulas tiles para diagramas de control y parmetros de poblacin 18 B.3 Lmites de variabilidad natural del proceso 19 B.4 Lmites de especificacin 19 B.5 Cambio en el tamao de la muestra para una grfica de control 20 B.6 Habilidad del proceso 21 B.7 Estimacin de la habilidad de un proceso para variables con dos lmites de especificacin 22 B.7.1 Habilidad potencial 22 B.7.2 Habilidad real 25 B.8 Estimacin de la habilidad real mediante la curva normal (para dos lmites de especificacin) 27 B.9 Estimacin de la habilidad de un proceso para variables con un lmite de especificacin 29 B.10 Estimacin de la habilidad real para el caso de un solo lmite de especificacin empleando la tabla de la normal estndar 31 B.11 Habilidad del proceso a partir de grficos p o np 32Respuestas a ejercicios pares seleccionados ndice I-1xiiContenidoR-1 13. PrefacioUna oportunidad para ideas innovadoras Escribir una nueva edicin de nuestro libro fue emocionante. En los dos aos que lleva completarla, pudimos interactuar con personas que han adoptado nuestro libro; nos beneficiamos con profundos comentarios de profesores que revisaron el manuscrito. Nuestros estudiantes en la University of North Carolina de Chapel Hill siempre tienen buenas ideas de cambios, y nuestro equipo en Prentice Hall organiz todo el proceso y ofreci sugerencias de muy alto nivel. Aunque sta es la sptima edicin, nuestra meta original de escribir el libro ms amigable para estudiantes y profesores de estadstica para administracin y economa contina guiando nuestros pensamientos a la hora de escribir.Qu ha diferenciado a este libro a travs de sus seis ediciones Nuestra filosofa acerca de lo que debe ser un buen libro de estadstica para negocios no ha cambiado desde el da en que comenzamos a escribir la primera edicin, hace veinte aos. Desde entonces hemos persistido en producir un libro que cumpla los siguientes objetivos: Pensamos que un libro introductorio de estadstica para administracin y economa debe ser intuitivo y sencillo. Al explicar los conceptos estadsticos, comenzamos con lo que los estudiantes ya saben a partir de sus experiencias y ampliamos ese conocimiento mediante un proceso que los gua casi sin darse cuenta. El sentido comn, las ideas del mundo real, referencias, explicaciones pacientes y enfoques intuitivos facilitan el aprendizaje a los estudiantes. Creemos que un libro introductorio de estadstica para administracin y economa debe abarcar todos los temas que cualquier profesor desee ensear en un curso de dos semestres o dos trimestres. No todos los profesores cubrirn todo el contenido, pero ofrecemos el temario ms completo para que pueda adaptarse a las necesidades que se requieran en cualquier curso. No creemos que usar notacin matemtica compleja mejore la enseanza de la estadstica para administradores y economistas, y nuestra experiencia sugiere que incluso puede hacer ms difcil el aprendizaje. La notacin matemtica compleja pertenece a cursos avanzados de matemticas y estadstica (y la usamos en ellos), pero no aqu. ste es un libro que lo har sentirse cmodo aunque no haya obtenido la mejor calificacin en lgebra. Creemos que un libro introductorio de estadstica para administracin y economa debe centrarse sustancialmente en el mundo real. Los estudiantes deben ver en el libro lo que observan en suxiii 14. vida diaria. La perspectiva que usamos, los ejercicios elegidos para esta edicin y el nfasis continuo en el uso de estadstica para resolver problemas de negocios hacen que el libro sea relevante. Usamos un gran nmero de problemas reales, y nuestras explicaciones tienden a ser anecdticas, con trminos y referencias que los estudiantes leen en los diarios y revistas o ven en la televisin y en los monitores de sus computadoras. Conforme ha aumentado el uso de la estadstica en nuestras prcticas como consultores, tambin lo hemos aplicado en las referencias de cmo y por qu funciona. Este libro describe situaciones administrativas reales, a las cuales se enfrentarn en unos cuantos aos la mayora de los estudiantes.Nuevas caractersticas de esta edicin para facilitar la enseanza y el aprendizaje Cada una de nuestras ediciones y los suplementos que las acompaaron contienen un conjunto completo de ayudas pedaggicas para facilitar tanto la enseanza como el aprendizaje. En cada revisin, agregamos nuevas ideas, nuevas herramientas y nuevos enfoques. Esta edicin incluye su propio conjunto de nuevas caractersticas. Los siguientes son los doce cambios ms importantes en la sptima edicin: Los ejercicios al final de cada seccin se dividieron en tres subconjuntos: Conceptos bsicos, Aplicaciones, y Ejercicios de autoevaluacin. Los conceptos bsicos contienen ejercicios sin escenario, las aplicaciones tienen un contexto y, para los ejercicios de autoevaluacin, se desarroll la solucin completa en la seccin donde se presentan, despus de los ejercicios de aplicacin. Se adopt Minitab en todo el libro como el paquete de computadora preferido y se incluy un captulo acerca del uso de Excel en la estadstica. Las sugerencias y suposiciones son comentarios breves que se encuentran al final de cada seccin, justo antes de los ejercicios. Estos bloques, que revisan las suposiciones importantes y explican por qu se hicieron, proporcionan al estudiante sugerencias tiles para trabajar en los ejercicios que siguen y les advierten sobre peligros potenciales al encontrar e interpretar las soluciones. Se duplic el nmero de ejemplos del mundo real en la seccin de ejercicios de repaso al final del captulo y se actualizaron muchos de los ejercicios de las ediciones anteriores. La mayor parte de las pruebas de hiptesis en los captulos 8 y 9 se hacen usando la escala estandarizada. Los escenarios para la cuarta parte de los ejercicios en esta edicin fueron totalmente reescritos. Se han incluido ms de cien ejercicios nuevos. Todas las secciones de prueba de conceptos de cada captulo se integraron en un solo archivo y se incluyeron en el CD-ROM que acompaa al libro tanto en formato PDF, listo para imprimir, como en formato para Word, susceptible de modificar. Todos los conjuntos de datos que ocupaban varias pginas en el libro se integraron en un CDROM que se incluye con el libro. El material de anlisis exploratorio de datos se ampli de manera significativa. El diseo de esta edicin se cambi completamente para integrar las ms recientes tcnicas pedaggicas de seguimiento sencillo de conceptos. Se incluyeron los temas de conjuntos y tcnicas de conteo y habilidad del proceso.Caractersticas exitosas de las ediciones previas que se conservaron en la sptima edicin En el tiempo que transcurre entre una edicin y otra, escuchamos a los profesores que usan nuestro libro. Los muchos adeptos a nuestra sexta edicin confirmaron nuestro sentimiento de que las siguientes caractersticas probadas en el saln de clases deban conservarse en esta nueva edicin:xivPrefacio 15. Los objetivos de aprendizaje se despliegan en forma destacada al iniciar cada captulo. Ms de 1,500 notas al margen resaltan temas o conceptos importantes. El nuevo formato facilita el seguimiento de las explicaciones. Cada captulo comienza con un problema del mundo real, en el que un administrador debe tomar una decisin. Ms adelante en el texto, se analiza y resuelve este problema como parte del proceso de enseanza. Cada captulo contiene una seccin titulada Trminos introducidos en el captulo que funciona a manera de glosario. Despus de los trminos introducidos, aparece Ecuaciones introducidas en el captulo, una seccin comentada de gran utilidad. Cada captulo contiene una Prueba de conceptos del captulo en donde se presentan preguntas de opcin mltiple, falso/verdadero y de completar. Esta seccin, como se coment antes, puede encontrarla en el CD-ROM que acompaa a este libro. Los captulos 2 a 16 incluyen un Ejercicio de base de datos computacional que utiliza datos del CD-ROM proporcionado con cada ejemplar del libro. Las secciones Del libro de texto al mundo real facilitan al estudiante la apreciacin de cmo se aplican con xito las tcnicas estadsticas a problemas significativos de negocios. Un diagrama de flujo para cada uno de los captulos 2 a 16 organiza el material y facilita a los estudiantes el desarrollo de un enfoque lgico y secuencial para la solucin de problemas. Este material podr encontrarlo en el CD-ROM mencionado. La seccin Estadstica en el trabajo de cada captulo permite que los estudiantes piensen en los conceptos de la estadstica para administradores sin perderse en un mundo de datos. Este complemento didctico se basa en la historia continua de Loveland Computers y las experiencias de sus empleados conforme introducen cada vez ms aplicaciones estadsticas a la administracin de su negocio.Material de apoyo para el profesor Los siguientes materiales, en ingls, representan complementos probados en el saln de clases para la enseanza de estadstica en un curso basado en este libro. Juntos proporcionan un completo apoyo para el instructor. El Instructors Solutions Manual con el desarrollo de las soluciones a todos los ejercicios del libro. Un conjunto completo de notas para la clase, desarrollado en Microsoft PowerPoint. Dividido de acuerdo a los captulos del libro, estas notas para la clase contienen los objetivos de aprendizaje, ejemplos resueltos y la notacin y las cifras tomadas del libro. El CD-ROM contiene datos para los ejercicios de base de datos computacional y para los ejercicios marcados con el icono de CD en el libro.Se necesitan muchas personas para hacer un libro Nuestro trabajo en el proceso de crear una nueva edicin es presentar las ideas que creemos funcionarn en el saln de clases. El equipo de Prentice Hall toma estas ideas y las convierte en un libro. Por supuesto, esto no es sencillo. El proceso completo comienza con nuestro editor, Tom Tucker, que vigila el proceso desde su oficina en St. Paul. Tom es como un director de cine: se asegura que todos hagan su parte y que el proceso completo marche puntualmente. Tom gui el proyecto desde el da en que se inicio la planeacin de la sptima edicin hasta que apareci la versin final del libro en su escritorio. Sin Tom estaramos sin rumbo. Despus viene Kellie Rahlf, nuestra supervisora de produccin de Carlisle Publishers Services. Junto con Katherine Evancie, nuestra gerente de produccin en Prentice Hall, administra las miles de actividades diarias que deben llevarse a cabo para producir un libro. Juntas llevan el manuscrito original por el proceso de edicin e impresin, se cercioran de que nos lleguen las pginas formadas Prefacioxv 16. listas para impresin, mantienen el proceso de correccin y lectura a tiempo, trabajan con los formadores y los creativos, y hacen como mil cosas importantes ms que no vemos pero apreciamos enormemente. Un grupo de profesores que ayuda mucho revis el manuscrito de la sptima edicin y dedic su tiempo a hacer sugerencias tiles. Estamos contentos de informarles que incorporamos la mayora. Este proceso da al libro terminado un enfoque estudiante-profesor que no hubiramos logrado sin ellos; gracias por su esfuerzo. Los revisores de esta edicin fueron Richard P. Behr, Broome Community College; Ronald L. Coccari, Cleveland State University; V. Reddy Dondeti, Norfolk State University; Mark Haggerty, Clarion University; Robert W. Hull, Western Illinois University; James R. Schmidt, University of Nebraska-Lincoln; y Edward J. Willies. En el libro usamos tablas estadsticas que originalmente prepararon otras personas, y damos las gracias al albacea literario del desaparecido Sir Ronald Fisher, F.R.S., el Dr. Frank Yates, F.R.S., y Longman Group, Ltd., Londres, por el permiso para reimprimirlas de su libro Statistical Tables for Biological, Agricultural, and Medical Research, sexta edicin, 1974. El Dr. David O. Robinson de Hass School of Business, Berkeley University, contribuy con algunos ejercicios del mundo real; produjo muchos de los cambios en los contextos de los problemas y, como siempre, nos persuadi de que sera mucho menos divertido revisar el libro sin l. Kevin Keyes proporcion un gran nmero de ejercicios nuevos y Lisa Klein desarroll el ndice. Estamos agradecidos con todas estas importantes y trabajadoras personas. Estamos encantados de haber terminado esta obra y, de ahora en adelante, esperamos or sus comentarios acerca de cmo funciona en su saln de clase. Gracias a todos por su ayuda. R.L. D.R.xviPrefacio 17. 1INTRODUCCINcaptuloObjetivos Examinar quin realmente utiliza la estadstica y cmo lo hace Proporcionar una muy breve historia del uso de la estadsticaPresentar un rpido repaso de las caractersticas del presente libro, diseadas para facilitar al lector el aprendizaje de la estadsticaContenido del captulo 1.1 Por qu hay que tomar este curso y quin utiliza la estadstica? 2 1.2 Historia 3 1.3 Subdivisiones de la estadstica 41.4 Un enfoque simple y fcil de entender 4 1.5 Caractersticas que facilitan el aprendizaje y cmo usarlas 51 18. 1.1 Por qu hay que tomar este curso y quin utiliza la estadstica? Cada cuatro aos, los estadounidenses padecen la ansiedad derivada de la eleccin presidencial. Con una anticipacin de varios meses, la televisin, la radio y los peridicos difunden notas del tipo un sondeo realizado por XYZ Opinion Research muestra que el candidato del partido Demcrata (o Republicano) tiene el apoyo de 54% de los votantes, con un margen de error de ms o menos 3%. Qu significa esta afirmacin? Qu quiere decir el trmino margen de error? Quin realiz el sondeo? A cuntas personas entrevistaron y a cuntas debieron entrevistar para afirmar esto? Se puede confiar en el informe? Los sondeos previos a las elecciones son un gran negocio y muchas compaas los realizan para candidatos polticos, nuevos productos e, incluso, programas de televisin. Si tiene la ambicin de convertirse en presidente, ser dueo de una compaa o llegar a estrella televisiva, necesita saber algo de las estadsticas y los estadsticos. Es la ltima jugada del partido y los Gigantes se encuentran abajo en el marcador por cuatro puntos; tienen el baln en la yarda 20 de los Cargadores. El coordinador defensivo de stos pide tiempo y acude a la lnea lateral para dialogar con el entrenador. Dado que un gol de campo no servira ni para empatar el partido, el entrenador sabe que los Gigantes lanzarn un pase o intentarn una corrida. El asistente de estadstica consulta rpidamente su computadora y seala que, en las ltimas 50 situaciones parecidas, los Gigantes han pasado el baln 35 veces. Tambin le informa al entrenador de los Cargadores que, de esos pases, dos tercios han sido pases cortos sobre el rea del centro. El entrenador, por tanto, le comunica a su coordinador defensivo que espere un pase corto por el centro. El baln es puesto en juego, el mariscal de campo de los Gigantes hace exactamente lo previsto y los Cargadores concentran sus esfuerzos en interceptar o impedir el pase. La estadstica sugiri la defensa correcta. El Departamento de Alimentos y Medicina est realizando la prueba final de un nuevo medicamento que cura el cncer de prstata en 80% de los casos en que es administrado, con slo 2% de incidencia de efectos secundarios no deseables. El cncer de prstata es la segunda causa de mortalidad humana y actualmente no existe una cura. El director de Investigacin debe decidir si recomienda el medicamento para su uso general; har la recomendacin slo en el caso de tener la certeza al 99% de que no habr diferencias significativas entre los efectos secundarios no deseables en las pruebas clnicas y los que se ocasionaran por el uso generalizado del medicamento. Existen mtodos estadsticos que pueden proporcionarle una buena base para tomar tan importante decisin. El Banco Comunitario ha aprendido por experiencia que existen cuatro factores que influyen en gran medida en la determinacin de si un cliente pagar a tiempo un prstamo o si se va a convertir en moroso. Tales factores son: 1) el nmero de aos que tenga viviendo en la direccin actual, 2) su antigedad en el trabajo, 3) el hecho de si el cliente es dueo o no de la casa que habita y 4) el hecho de que el cliente tenga una cuenta de cheques o de ahorros en el mismo banco. Desafortunadamente, el banco no conoce el efecto individual que cada uno de tales factores tiene sobre el resultado del prstamo. Sin embargo, posee archivos de computadora con informacin sobre los clientes (tanto de aquellos a los que se les ha concedido un prstamo como de los rechazados) y tiene conocimiento, tambin, del resultado de cada prstamo. Sarah Smith solicita un emprstito. Vive en su direccin actual desde hace cuatro aos, es duea de la casa, tiene una antigedad de slo tres meses en su trabajo actual y no es cliente del Banco Comunitario. Mediante el uso de la estadstica, el banco puede calcular la probabilidad de que Sarah pague su prstamo si ste se le otorga. La palabra estadstica significa cosas diferentes para personas diferentes. Para un aficionado al ftbol americano, se trata del nmero de carreras, pases y anotaciones; para el entrenador de los Cargadores, en el primer ejemplo, la estadstica es la posibilidad de que los Gigantes lancen un pase corto por el centro; para el administrador de una planta de energa, es la cantidad de contaminantes que se liberan a la atmsfera. Para el director del Departamento de Alimentos y Medicina, de nuestro segundo ejemplo, es el porcentaje posible de efectos secundarios no deseados con el uso generalizado de una nueva medicina para curar el cncer de prstata. En el tercer caso, para el Banco2Captulo 1Introduccin 19. Cmo mentir con la estadsticaComunitario, la estadstica es la posibilidad de que Sarah pague a tiempo el prstamo. Para el estudiante que toma este curso, se trata de la calificacin que obtenga en los tres exmenes parciales y en el final de la materia. Cada una de estas personas utiliza la palabra de manera correcta, aunque le den un uso diferente. Todos ellos recurren a la estadstica para auxiliarse en la toma de decisiones; usted para anticipar su calificacin del curso y el entrenador de los Cargadores para determinar el tipo de defensa que debe adoptar en la jugada final del partido. Escribimos este libro para ayudarle a entender la importancia de la estadstica y la manera de usarla en su vida personal y profesional. En cierta ocasin, Benjamin Disraeli hizo la siguiente aseveracin: Existen tres tipos de mentiras, las mentiras ordinarias, las grandes mentiras y la estadstica. Este severo juicio, formulado hace ya varios aos, se ha vuelto una descripcin bastante acertada de muchos de los fracasos estadsticos que encontramos en la vida diaria. Darrell Huff, en el encantador librito Cmo mentir con la Estadstica, anot que los bribones ya conocen tales trucos; los hombres honrados deben aprenderlos para defenderse. Uno de los objetivos del presente libro consiste en revisar algunas de las formas ms comunes en que se utiliza la estadstica de manera incorrecta.1.2 Historia Origen de la palabraPrimeros registros gubernamentalesUna antigua prediccin de la estadsticaEl vocablo statistik proviene de la palabra italiana statista (que significa estadista). Fue utilizada por primera vez por Gottfried Achenwall (1719-1772), un profesor de Marlborough y de Gttingen. El Dr. E. A. W. Zimmerman introdujo el trmino statistics (estadstica) a Inglaterra. Su uso fue popularizado por sir John Sinclair en su obra Statistical Account of Scotland 1791-1799 (Informe estadstico sobre Escocia 1791-1799). Sin embargo, mucho antes del siglo XVIII, la gente ya utilizaba y registraba datos. La estadstica oficial es tan vieja como la historia registrada. El Viejo Testamento contiene varios informes sobre levantamiento de censos. Los gobiernos de los antiguos Babilonia, Egipto y Roma reunieron registros detallados sobre poblacin y recursos. En la Edad Media, los gobernantes empezaron a registrar la propiedad de la tierra. En el ao 762 de nuestra era, Carlomagno pidi una descripcin detallada de las propiedades de la Iglesia. A principios del siglo IX termin la enumeracin estadstica de los siervos que habitaban los feudos. Por el ao 1806, Guillermo el Conquistador orden que se escribiera el Domesday Book, un registro de la propiedad, extensin y valor de las tierras de Inglaterra. Este trabajo fue el primer resumen estadstico de Inglaterra. Debido al temor que Enrique VII senta por la peste, Inglaterra empez a registrar sus muertos en 1532. Aproximadamente por esta misma poca, la ley francesa requiri al clero que registrara bautismos, defunciones y matrimonios. Durante un brote de peste, a finales del siglo XVI, el gobierno ingls empez a publicar semanalmente las estadsticas de mortalidad. Esta prctica continu y por el ao 1632, estos Bills of Mortality (Listas de Mortalidad) contenan listados de nacimientos y muertes clasificados segn el gnero. En 1662, el capitn John Graunt utiliz 30 aos de dichos listados para hacer predicciones sobre el nmero de personas que moriran a causa de diferentes enfermedades, y sobre la proporcin de nacimientos, de ambos sexos, que poda esperarse. Resumido en su trabajo, Natural and Political Observations. . . Made upon the Bills of Mortality (Observaciones Naturales y Polticas. . . Hechas con las Listas de Mortalidad), el estudio de Graunt fue uno de los primeros anlisis estadsticos. Por el xito conseguido al usar registros anteriores para predecir sucesos futuros, Graunt fue nombrado miembro de la Royal Society original. La historia del desarrollo de la teora estadstica y su prctica es larga; slo hemos empezado a nombrar a las personas que hicieron contribuciones significativas al campo. Ms adelante encontraremos a otras cuyos nombres estn relacionados con leyes y mtodos especficos. Mucha gente ha contribuido al estudio de la estadstica con refinamientos e innovaciones que, en conjunto, constituyen la base terica de lo que el presente libro analiza.1.2Historia3 20. 1.3 Subdivisiones de la estadsticaEstadstica descriptivaEstadstica inferencialTeora de decisionesLos administradores aplican alguna tcnica estadstica a prcticamente todas las ramas de las empresas pblicas y privadas. Estas tcnicas son tan diversas que los estadsticos, por lo general, las dividen en dos grandes categoras: estadstica descriptiva y estadstica inferencial. Algunos ejemplos nos sern de ayuda para entender la diferencia entre las dos. Suponga que un profesor de Historia calcula la calificacin promedio de uno de sus grupos. Como la estadstica describe el desempeo del grupo, pero no hace ninguna generalizacin acerca de los diferentes grupos, podemos decir que el profesor est utilizando estadstica descriptiva. Las grficas, tablas y diagramas que muestran los datos de manera ms clara y elocuente son ejemplos de estadstica descriptiva. Suponga ahora que el profesor de Historia decide utilizar el promedio de calificacin obtenido por uno de sus grupos en una unidad para estimar la calificacin promedio del grupo en las diez unidades del curso. El proceso de estimacin de tal promedio sera un problema concerniente a la estadstica inferencial. Los estadsticos se refieren tambin a esta rama como inferencia estadstica. Obviamente, cualquier conclusin a la que llegue el profesor sobre el promedio del grupo en las diez unidades del curso estar basada en una generalizacin que va ms all de los datos de la unidad evaluada, y sta puede no ser completamente vlida, de modo que el profesor debe establecer qu posibilidad hay de que sea cierta. De manera similar, la inferencia estadstica implica generalizaciones y afirmaciones con respecto a la probabilidad de su validez. Los mtodos y las tcnicas de la inferencia estadstica se pueden utilizar tambin en una rama de la estadstica conocida como teora de decisiones. El conocimiento de la teora de decisiones es muy til para los administradores, ya que se le usa para tomar decisiones en condiciones de incertidumbre, cuando, por ejemplo, un fabricante de aparatos de sonido no puede especificar precisamente la demanda de sus productos, o en una escuela se deben asignar grupos y definir horarios sin tener el conocimiento preciso del nmero de estudiantes que entrarn al primer grado.1.4 Un enfoque simple y fcil de entender Para estudiantes, no para estadsticosLos smbolos son sencillos y tienen explicacinNo se requieren matemticas que vayan ms all del lgebra bsica4Captulo 1Este libro fue diseado para ayudar a captar el sentido de la estadstica, es decir, cmo y cundo aplicar las tcnicas de la estadstica a situaciones en las que haya que tomar decisiones, y cmo interpretar los resultados obtenidos. Puesto que no escribimos para estadsticos profesionales, nuestro texto est adaptado a los conocimientos y las necesidades de estudiantes universitarios que, quiz, acepten el hecho de que la estadstica puede serles de considerable utilidad en su desempeo profesional, pero que se muestren reacios a estudiar la materia. Descartamos las demostraciones matemticas en favor de las pruebas intuitivas. El estudiante ser guiado a lo largo del proceso de aprendizaje mediante recordatorios de lo que ya debera saber, a travs de ejemplos con los que puede identificarse y con procesos desarrollados paso a paso, en lugar de afirmaciones como se puede mostrar o por tanto tenemos. A medida que el lector recorra el libro y lo compare con otros textos bsicos sobre estadstica para administracin, notar que hay un mnimo de notacin matemtica. En el pasado, la complejidad de la notacin intimidaba a muchos estudiantes, que se perdan con los smbolos incluso en los casos en que se hallaran motivados y fueran intelectualmente capaces de entender las ideas. Cada smbolo y frmula empleado se explica a detalle, no slo en el punto en que se les introduce, sino tambin en una seccin especial que se encuentra al final del captulo. Si aprendi razonablemente bien lo enseado en su curso de lgebra de la preparatoria, entonces tiene bases suficientes para entender todo el contenido de este libro. No se asume ni se utiliza nada que vaya ms all del lgebra elemental. Nuestros objetivos son que usted se sienta cmodo a medida que aprenda la materia y que adquiera una buena nocin de los conceptos y mtodos de la estadstica. Como futuro administrador, necesitar saber cundo la estadstica puede serle de utilidad en Introduccin 21. Ejercicios que abarcan una amplia variedad de situacionesObjetivosel proceso de toma de decisiones y qu herramientas puede usar. Si necesita ayuda estadstica, puede encontrar un experto en la materia que se encargue de los detalles. Los problemas empleados para introducir material en los captulos, los ejercicios que se encuentran al final de cada seccin y tambin los de repaso provienen de una amplia variedad de situaciones con las cuales usted ya est familiarizado o que deber enfrentar pronto. Ver problemas que implican todos los aspectos del sector privado de la economa: contabilidad, finanzas, comportamiento individual y grupal, mercadotecnia y produccin. Adems, hallar casos de administradores de la esfera pblica que se enfrentan a problemas ambientales, de educacin pblica, servicios sociales, defensa del consumidor y sistemas de salud. En cada situacin problemtica, un administrador intenta emplear la estadstica de manera creativa y productiva; ayudarle a que usted pueda actuar de la misma forma es, precisamente, nuestro objetivo.1.5 Caractersticas que facilitan el aprendizaje y cmo usarlas En el prefacio mencionamos brevemente una lista de auxiliares para el aprendizaje que forman parte del libro. Cada uno de ellos desempea un papel particular asistindole en el estudio y el entendimiento de la estadstica; por ello dedicamos unos cuantos minutos aqu para explicarle la manera ms efectiva de utilizarlos, con el fin de que los emplee adecuadamente para obtener una comprensin cabal de la estadstica para tomar decisiones administrativas. Notas al margen Cada una de las ms de 1,500 notas al margen resalta el material de uno o varios prrafos. Gracias a que describen brevemente las ideas principales, usted puede encontrar lo que requiera sin tener que leer toda la pgina. A medida que vaya leyendo el texto, acostmbrese a leer primero la columna de la izquierda; de ese modo obtendr una buena nocin del flujo de temas y del significado de lo que el texto explica. Aplicaciones Las aplicaciones del captulo incluyen ejercicios del mundo real que fueron tomados directamente de situaciones de negocios y economa. Muchos de esos ejercicios provienen de la prensa financiera; otros, de las publicaciones gubernamentales. Esta caracterstica le permitir practicar el planteamiento y la resolucin de problemas del tipo de los que enfrentan a diario los profesionales en administracin. En esta edicin se duplic el nmero de ejercicios de aplicaciones. Repaso de trminos Cada captulo concluye con un glosario que contiene todos los trminos nuevos introducidos en l. El tener definidos todos los trminos nuevos en un lugar adecuado puede ser de gran ayuda. Conforme estudie un captulo, use el glosario para reforzar su entendimiento del significado de los trminos. Hacer esto es ms fcil que retroceder en la lectura, intentando encontrar la definicin de un trmino en particular. Cuando termine de estudiar un captulo, utilice el glosario para cerciorarse de haber entendido el significado de cada trmino introducido en l. Repaso de ecuaciones Todas las ecuaciones introducidas en un captulo se encuentran al final del mismo. El uso de esta caracterstica del libro es una manera bastante efectiva de asegurar que ha entendido el significado de cada ecuacin y la forma en que se utiliza. Prueba de conceptos del captulo El uso de estas pruebas es una buena forma de ver qu tan bien ha entendido el material del captulo. Como parte de su estudio, asegrese de responder tales pruebas y despus compare sus respuestas con las que se proporcionan al final del libro. Este ejercicio le sealar las reas en las que necesita trabajar ms, en especial antes de un examen. Estadstica en el trabajo En este conjunto de casos, un empleado de la empresa Loveland Computers aplica la estadstica a problemas de administracin. Lo importante de stos no son los nmeros; de hecho, es difcil encontrar nmeros en estos casos. Conforme vaya leyendo cada uno de ellos, concntrese en el problema y en encontrar el planteamiento estadstico ms conveniente para resolver1.5Caractersticas que facilitan el aprendizaje y cmo usarlas5 22. lo. Olvdese por un rato de los nmeros. De esta manera, usted desarrollar criterios para la identificacin de problemas y de los mtodos de solucin adecuados, sin que se vea agobiado por las matemticas. Diagramas de flujo Los diagramas de flujo que se encuentran en el CD, le permitirn desarrollar un acercamiento sistemtico a la aplicacin de mtodos estadsticos a los problemas. Su uso le ayudar a entender dnde empez, cmo se desplaz y dnde terminar; si los emplea con aptitud, no se perder en los problemas ms complejos que los profesores acostumbran a poner en los exmenes. Del libro de texto al mundo real Toma no ms de tres minutos leer cada uno de estos ejemplos, y hacerlo le mostrar cmo se utilizan los conceptos desarrollados en este libro para resolver problemas del mundo real. Conforme avance en el estudio de cada captulo, asegrese de repasar el ejemplo que se encuentra al inicio; vea cul es el problema, cmo lo resuelve la estadstica y qu es lo que la solucin aporta. Estas situaciones generan tambin buen material de discusin en el saln de clases. Ejercicio de base de datos computacional Este ejercicio sigue los pasos de una joven analista en el proceso de ayudar a la empresa HH Industries a resolver importantes problemas. En cada caso, la cantidad de datos que se tienen hace necesaria la utilizacin de una computadora como parte del anlisis. Use esta caracterstica para familiarizarse con las diferentes rutinas estadsticas disponibles para la computadora personal, con los formatos de entrada que requieren y con los formatos de salida que proporcionan. Hacer esto le facilitar trabajar con la enorme cantidad de datos con los que se enfrentar en casi todos los problemas del mundo real. Clasificacin de ejercicios sta es una nueva caracterstica de esta edicin. Los ejercicios proporcionados al final de cada seccin se dividen en tres categoras: conceptos bsicos para comenzar a trabajar, ejercicios de aplicaciones para mostrar cmo se usa la estadstica y ejercicios de verificacin con soluciones completas para que pruebe, por s mismo, su comprensin. Ejercicios de verificacin con soluciones Una caracterstica ms de esta edicin. Al principio de casi todos los conjuntos de ejercicios hay uno o dos ejercicios de verificacin para que pruebe sus conocimientos. Las soluciones completas de estos ejercicios aparecen al final de cada conjunto. Sugerencias y suposiciones Otra novedad que le proporciona ayuda y direccin, y le previene en contra de errores comunes a evitar antes de comenzar a trabajar en los ejercicios al final de cada seccin. Dedicar un minuto a su lectura ahorra mucho tiempo, frustracin y fallas al resolver los ejercicios. Propsitos de los autores6Captulo 1Nuestra propia experiencia de trabajo nos ha puesto en contacto con miles de situaciones en las que la estadstica es til para la toma de decisiones. Participamos personalmente en la formulacin y aplicacin de muchas de las soluciones a problemas. Fue algo estimulante, desafiante y, al final, muy satisfactorio, pues vimos que la aplicacin sensible de esas ideas fue de gran valor para tal o cual organizacin. Aunque muy pocos de nuestros lectores sern analistas estadsticos, creemos que usted tambin puede aprender a desarrollar y divertirse con el estudio de la estadstica, y sa es la razn por la cual escribimos este libro. Buena suerte!Introduccin 23. 2captuloAGRUPACIN Y PRESENTACIN DE DATOS PARA EXPRESAR SIGNIFICADOS: TABLAS Y GRFICASObjetivos Mostrar la diferencia entre muestras y poblaciones Convertir los datos sin procesar en informacin til Construir y utilizar datos ordenados Construir y utilizar distribuciones de frecuenciasRepresentar grficamente distribuciones de frecuencias con histogramas, polgonos y ojivas Utilizar distribuciones de frecuencias para tomar decisionesContenido del captulo 2.1 Cmo podemos ordenar los datos? 8 2.2 Ejemplos de datos sin procesar 11 2.3 Ordenamiento de datos en arreglos de datos y distribuciones de frecuencias 12 2.4 Construccin de una distribucin de frecuencias 20 2.5 Representacin grfica de distribuciones de frecuencias 29 Estadstica en el trabajo 42 Ejercicio de base de datos computacional 43 Trminos introducidos en el captulo 2 45 Ecuaciones introducidas en el captulo 2 46 Ejercicios de repaso 467 24. l gerente de produccin de la Dalmon Carpet Company es responsable de la fabricacin de alfombras en ms de 500 telares. Para no tener que medir la produccin diaria (en yardas) de cada telar, toma una muestra de 30 telares cada da, con lo que llega a una conclusin respecto a la produccin promedio de alfombras de las 500 mquinas. La tabla que se presenta ms adelante exhibe la produccin de cada uno de los 30 telares de la muestra. Estas cantidades son los datos sin procesar a partir de los cuales el director de produccin puede sacar conclusiones acerca de la toda la poblacin de telares en su desempeo del da anterior.EProduccin en yardas de 30 telares para alfombra 16.2 15.7 16.415.4 16.4 15.816.0 15.2 15.716.6 15.8 16.215.9 15.9 15.615.8 16.1 15.916.0 15.6 16.316.8 15.9 16.316.9 15.6 16.016.8 16.0 16.3Mediante los mtodos introducidos en este captulo, podemos ayudar al director de produccin a llegar a la conclusin correcta. Algunas definicionesLos datos son colecciones de cualquier cantidad de observaciones relacionadas. Podemos recopilar el nmero de telfonos que diferentes empleados instalan en un da dado o el nmero de telfonos que instala un trabajador dado durante un da en un periodo de varios das, y podemos llamar datos a estos resultados. Una coleccin de datos se conoce como conjunto de datos; una sola observacin es un dato puntual.2.1 Cmo podemos ordenar los datos? Para que los datos sean tiles, necesitamos organizar nuestras observaciones de modo que podamos distinguir patrones y llegar a conclusiones lgicas. Este captulo presenta las tcnicas tabular y grfica para organizacin de datos; en el captulo 3 mostraremos cmo usar nmeros para describir datos.Recoleccin de datos Represente todos los gruposEncuentre datos a partir de observaciones o de registrosUse los datos del pasado para tomar decisiones del futuro8Captulo 2Los especialistas en estadstica seleccionan sus observaciones de manera que todos los grupos relevantes estn representados en los datos. Para determinar el mercado potencial de un nuevo producto, por ejemplo, los analistas podran estudiar cien consumidores de cierta rea geogrfica. Dichos analistas deben tener la certeza de que este grupo incluya personas que representan distintas variables como nivel de ingresos, raza, nivel educativo y vecindario. Los datos pueden provenir de observaciones reales o de registros elaborados con otros propsitos. Por ejemplo, con fines de facturacin e informes mdicos, un hospital registra el nmero de pacientes que utilizan los servicios de rayos X. Esta informacin puede organizarse para producir datos que los especialistas en estadstica puedan describir e interpretar. Los datos pueden ayudar a los responsables de tomar decisiones a hacer suposiciones razonadas acerca de las causas y, por tanto, de los efectos probables de ciertas caractersticas en situaciones dadas. El conocimiento de tendencias derivado de la experiencia previa puede, tambin, permitir a los ciudadanos conscientes anticipar resultados posibles y actuar en consecuencia. Una investigacin de mercado puede revelar que determinado producto es preferido por amas de casa de origen afroamericano de las comunidades suburbanas, con ingresos y educacin promedios. Los textos publicitarios del producto debern, por tanto, estar dirigidos a esta audiencia. Y si los registros del hospital muesAgrupacin y presentacin de datos para expresar significados: tablas y grficas 25. tran que un nmero mayor de pacientes ha utilizado el aparato de rayos X en junio que en enero, el departamento de personal del hospital deber determinar si esto sucedi slo ese ao o es indicativo de una tendencia y, tal vez, debera ajustar su programa de contratacin y asignacin de vacaciones de acuerdo con la informacin. Cuando los datos se ordenan de manera compacta y til, los responsables de tomar decisiones pueden obtener informacin confiable sobre el entorno y usarla para tomar decisiones inteligentes. En la actualidad, las computadoras permiten a los especialistas en estadstica recolectar enormes volmenes de observaciones y comprimirlas en tablas, grficas y cifras instantneamente. stas son formas compactas y tiles, pero son confiables? Recuerde que los datos producidos por una computadora son tan precisos como los datos que entraron en ella. Como dicen los programadores, BEBS! o basura entra, basura sale!. Los administradores deben tener mucho cuidado y cerciorarse que los datos empleados estn basados en suposiciones e interpretaciones correctas. Antes de depositar nuestra confianza en cualquier conjunto de datos interpretados, vengan de una computadora o no, pngalos a prueba mediante las siguientes preguntas: Pruebas para datosEjemplo de conteo doble1. De dnde vienen los datos? La fuente es tendenciosa?, es decir, es posible que exista inters en proporcionar datos que conduzcan a cierta conclusin ms que a otras? 2. Los datos apoyan o contradicen otras evidencias que se tienen? 3. Hace falta alguna evidencia cuya ausencia podra ocasionar que se llegue a una conclusin diferente? 4. Cuntas observaciones se tienen? Representan a todos los grupos que se desea estudiar? 5. La conclusin es lgica? Se ha llegado a conclusiones que los datos no confirman? Estudie las respuestas que d a estas preguntas. Vale la pena usar los datos o debemos esperar y recabar ms informacin antes de actuar? Si el hospital se queda corto de personal porque contrat pocos tcnicos para operar las instalaciones de rayos X, quiere decir que su administrador confi en datos insuficientes. Si la agencia de publicidad dirigi su propaganda slo a las amas de casa afroamericanas de los suburbios cuando pudo haber triplicado sus ventas al incluir tambin a amas de casa blancas, quiere decir que tambin en este caso hubo confianza en datos insuficientes. En ambos casos, probar los datos disponibles podra haber ayudado a los administradores a tomar mejores decisiones. El efecto de emplear datos incompletos o tendenciosos puede ilustrarse con el siguiente ejemplo: una asociacin nacional de lneas de transporte afirma, en un comercial, que el 75% de todo lo que uno utiliza se transporta en camin. Esta afirmacin podra conducir a creer que automviles, ferrocarriles, aeroplanos, barcos y otras formas de transporte slo trasladan el 25% de lo que utilizamos. Es fcil llegar a tal conclusin, pero sta no es completamente ilustrativa. En la afirmacin no se toma en cuenta la cuestin del conteo doble. Qu pasa cuando algo es llevado hasta su ciudad por ferrocarril y luego en camin hasta su casa? O cmo se considera la paquetera si se transporta por correo areo y luego en motocicleta? Cuando se resuelve la cuestin del conteo doble (algo bastante complicado de manejar), resulta que los camiones transportan una proporcin mucho menor de bienes que la afirmada por los transportistas. Aunque los camiones estn involucrados en la entrega de una proporcin relativamente alta de lo que utilizamos, el ferrocarril y los barcos llevan ms bienes a lo largo de ms kilmetros.Diferencia entre muestras y poblaciones Definicin de muestra y poblacin Funcin de las muestrasLos expertos en estadstica recogen datos de una muestra y utilizan esta informacin para hacer inferencias sobre la poblacin que representa esa muestra. As, una poblacin es un todo y una muestra es una fraccin o segmento de ese todo. Se estudiarn las muestras para poder describir las poblaciones. El hospital del ejemplo puede estudiar un grupo pequeo y representativo de los registros de rayos X, en lugar de examinar cada uno de los registros de los ltimos 50 aos. La Gallup Poll puede entrevistar una muestra de slo 2,500 2.1Cmo podemos ordenar los datos?9 26. Ventajas de las muestrasFuncin de las poblacionesNecesidad de una muestra representativaestadounidenses adultos con el fin de predecir la opinin de todos los adultos que viven en Estados Unidos. El estudio de una muestra es ms sencillo que el de la poblacin completa, cuesta menos y lleva menos tiempo. A menudo, probar la resistencia de una parte de avin implica destruirla; en consecuencia, es deseable probar la menor cantidad de partes. En algunas ocasiones, la prueba implica un riesgo humano; el uso de muestras disminuye ese riesgo a un nivel aceptable. Por ltimo, se ha probado que incluso el examen de una poblacin entera deja pasar algunos elementos defectuosos. Por tanto, en algunos casos, el muestreo puede elevar el nivel de calidad. Si usted se pregunta cmo puede suceder esto, piense en lo cansado y poco animoso que estara si tuviera que observar de manera continua miles y miles de productos en una banda continua. Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones. Debemos definir esa poblacin de modo que quede claro cundo cierto elemento pertenece o no a la poblacin. Para el estudio de mercado mencionado, la poblacin puede estar constituida por todas las mujeres residentes dentro de un radio de 25 kilmetros con centro en la ciudad de Cincinnati, que tengan un ingreso familiar anual entre $20,000 y $45,000 y hayan cursado por lo menos 11 aos de educacin formal. Una mujer que viva en el centro de Cincinnati, con ingresos familiares de $25,000 y estudios universitarios completos podra ser parte de esa poblacin, mientras que una mujer residente de San Francisco, o que tenga ingresos familiares de $7,000 o con cinco aos de estudios profesionales, no se considerara miembro de nuestra poblacin. Una muestra es una coleccin de algunos elementos de la poblacin, no de todos. La poblacin de nuestra investigacin de mercado son todas las mujeres que cumplen con los requisitos anteriores. Cualquier grupo de mujeres que cumpla con tales requisitos puede constituir una muestra, siempre y cuando el grupo sea una fraccin de la poblacin completa. Una porcin grande de relleno de frambuesas con slo algunas migajas de corteza es una muestra de tarta, pero no es una muestra representativa debido a que las proporciones de los ingredientes no son las mismas en la muestra que en el todo. Una muestra representativa contiene las caractersticas relevantes de la poblacin en las mismas proporciones en que estn incluidas en tal poblacin. Si la poblacin de mujeres del ejemplo es un tercio de afroamericanas, entonces una muestra representativa en trminos de raza tendr tambin un tercio de afroamericanas. En el captulo 6 se analizan con ms detalle los mtodos especficos para realizar muestreos.Bsqueda de un patrn significativo en los datos Los datos pueden organizarse de muchas manerasPor qu debemos organizar los datos?10Los datos pueden organizarse de muchas maneras. Podemos, simplemente recolectarlos y mantenerlos en orden. O, si las observaciones estn hechas con nmeros, podemos hacer una lista de los datos puntuales de menor a mayor segn su valor numrico. Pero si los datos consisten en trabajadores especializados (como carpinteros, albailes o soldadores) de una construccin, o en los distintos tipos de automviles que ensamblan todos los fabricantes, o en los diferentes colores de suteres fabricados por una empresa dada, debemos organizarlos de manera distinta. Necesitaremos presentar los datos puntuales en orden alfabtico o mediante algn principio de organizacin. Una forma comn de organizar los datos consiste en dividirlos en categoras o clases parecidas y luego contar el nmero de observaciones que quedan dentro de cada categora. Este mtodo produce una distribucin de frecuencias, que se estudiar ms adelante, en este mismo captulo. Organizar los datos tiene como fin permitirnos ver rpidamente algunas de las caractersticas de los datos recogidos. Buscamos cosas como el alcance (los valores mayor y menor), patrones evidentes, alrededor de qu valores tienden a agruparse los datos, qu valores aparecen con ms frecuencia, etc. Cuanta ms informacin de este tipo podamos obtener de una muestra, mejor entenderemos la poblacin de la cual proviene, y mejor ser nuestra toma de decisiones.Captulo 2Agrupacin y presentacin de datos para expresar significados: tablas y grficas 27. Ejercicios 2.1 Aplicaciones 2-12-22-32-42-5Cuando se les pregunta qu medicamento tomaran si estuvieran en una isla abandonada y slo pudieran elegir un analgsico, la mayora de los mdicos prefiere Bayer, en lugar de Tylenol, Bufferin o Advil. Se lleg a esta conclusin a partir de una muestra o de una poblacin? El 25% de los automviles vendidos en Estados Unidos en 1992 fue armado en Japn. Se lleg a esta conclusin a partir de una muestra o de una poblacin? Hace poco, una fbrica de aparatos electrnicos introdujo al mercado un nuevo amplificador, y en la garanta se indica que se han vendido 10,000 de esos amplificadores. El presidente de la empresa, bastante preocupado despus de recibir tres cartas de quejas con respecto a los nuevos amplificadores, inform al gerente de produccin que se implantaran costosas medidas de control para asegurar que los defectos no aparecieran de nuevo. Haga un comentario sobre la reaccin del gerente desde la perspectiva de las cinco pruebas para datos que se dieron en la pgina 9. Alemania permanecer siempre dividida, afirm Walter Ulbricht despus de la construccin del Muro de Berln en 1961. Sin embargo, hacia finales de 1969, el gobierno de Alemania del Este empez a permitir el libre trnsito entre la parte oriental y la occidental, y veinte aos despus, el muro fue destruido por completo. Mencione algunas razones por las cuales Ulbricht hizo una prediccin incorrecta. Analice los datos dados en el problema planteado al inicio del captulo en trminos de las cinco pruebas para datos dados en la pgina 9.2.2 Ejemplos de datos sin procesar Problema que enfrenta el personal de admisinProblema de construccin de un puenteLa informacin obtenida, antes de ser organizada y analizada, se conoce como datos sin procesar. Son sin procesar puesto que an no han sido manejados mediante un mtodo estadstico. Los datos de los telares proporcionados al inicio del captulo son un ejemplo de datos sin procesar. Consideremos un segundo ejemplo. Suponga que el personal de admisin de una universidad, preocupado por el xito de los estudiantes que escogen para ser admitidos, desea comparar el desempeo de los estudiantes universitarios con otros logros, como calificaciones en el nivel anterior, resultados de exmenes y actividades extracurriculares. En lugar de estudiar a todos los alumnos de todos los aos, el personal puede tomar una muestra de la poblacin de estudiantes en un periodo dado y estudiar slo ese grupo, para llegar a conclusiones sobre qu caractersticas parecen predecir el xito. Por ejemplo, puede comparar las calificaciones del nivel educativo anterior con el promedio de calificaciones universitarias de los estudiantes de la muestra. El personal puede sumar las calificaciones y dividir el resultado entre el nmero total de ellas para obtener un promedio, o media, para cada estudiante. En la tabla 2-1 se presentan tabulados estos datos sin procesar: 20 pares de calificaciones promedio en el bachillerato y en la universidad. Cuando se disea un puente, los ingenieros deben determinar la tensin que un material dado, digamos el concreto, puede soportar. En lugar de probar cada pulgada cbica de concreto para determinar su capacidad de resistencia, los ingenieros toman una muestra, la prueban y llegan a la conclusin sobre qu tanta tensin, en promedio, puede resistir ese tipo de concreto. En la tabla 2-2 se presentan los datos sin procesar obtenidos de una muestra de 40 bloques de concreto que se utilizarn para construir un puente.Tabla 2-1 Promedios de calificaciones en bachillerato y universidad de 20 estudiantes universitarios del ltimo aoBach.Univ.Bach.Univ.Bach.Univ.Bach.Univ.3.6 2.6 2.7 3.7 4.02.5 2.7 2.2 3.2 3.83.5 3.5 2.2 3.9 4.03.6 3.8 3.5 3.7 3.93.4 2.9 3.9 3.2 2.13.6 3.0 4.0 3.5 2.52.2 3.4 3.6 2.6 2.42.8 3.4 3.0 1.9 3.22.2Ejemplos de datos sin procesar11 28. Tabla 2-2 Presin en libras por pulgada cuadrada que puede resistir el concreto2500.2 2500.8 2490.5 2499.2 2506.42497.8 2502.5 2504.1 2498.3 2499.92496.9 2503.2 2508.2 2496.7 2508.4Los datos no necesariamente son informacin; tener ms datos no necesariamente produce mejores decisiones. La meta es resumir y presentar los datos de manera til para apoyar la toma de decisiones efectiva y gil. La razn por la que los datos deben organizarse es ver si existe un patrn en ellos, patrones como el valor ms grande y el SUGERENCIAS Y SUPOSICIONES2500.8 2496.9 2500.8 2490.4 2502.32491.6 2495.3 2502.2 2493.4 2491.32503.7 2497.1 2508.1 2500.7 2509.52501.3 2499.7 2493.8 2502.0 2498.42500.0 2505.0 2497.8 2502.5 2498.1ms pequeo, o el valor alrededor del cual parecen agruparse. Si los datos provienen de una muestra, se suponen representativos de la poblacin de la que se tomaron. Todos los buenos estadsticos (y usuarios de datos) reconocen que usar datos sesgados o incompletos conduce a malas decisiones.Ejercicios 2.2 Aplicaciones 2-62-72-8Observe los datos de la tabla 2-1. Por qu los datos necesitan organizarse ms? Puede usted llegar a una conclusin partiendo de los datos tal como se presentan? El gerente de mercadotecnia de una compaa grande recibe un informe mensual de las ventas de uno de los productos de la compaa. El informe consiste en una lista de las ventas del producto por estado durante el mes anterior. Es ste un ejemplo de datos sin procesar? El gerente de produccin de una compaa grande recibe un informe mensual de su departamento de control de calidad. El informe presenta el ndice de rechazo de la lnea de produccin (nmero de rechazos por cada 100 unidades producidas), la mquina que ocasiona el mayor nmero de productos defectuosos y el costo promedio de reparacin de las unidades rechazadas. Es ste un ejemplo de datos sin procesar?2.3 Ordenamiento de datos en arreglos de datos y distribuciones de frecuencias Definicin de ordenacin de datosVentajas de la ordenacin de datosUna ordenacin de datos es una de las formas ms sencillas de presentarlos: organiza los valores en orden ascendente o descendente. En la tabla 2-3 repetimos los datos de la produccin de alfombras del problema presentado al inicio del captulo, y en la tabla 2-4 reordenamos los nmeros en un orden ascendente. La ordenacin de datos ofrece varias ventajas con respecto a los datos sin procesar: 1. Podemos identificar los valores mayor y menor rpidamente. En el ejemplo de las alfombras, los datos van de las 15.2 a las 16.9 yardas. Tabla 2-3 Muestra de la produccin diaria de 30 telares para alfombra (en yardas)12Captulo 216.2 15.7 16.4 15.4 16.415.8 16.0 15.2 15.7 16.615.8 16.2 15.9 15.9 15.615.8 16.1 15.9 16.0 15.616.3 16.8 15.9 16.3 16.915.6 16.0 16.8 16.0 16.3Agrupacin y presentacin de datos para expresar significados: tablas y grficas 29. Tabla 2-4 Ordenamiento de los datos de la produccin diaria de 30 telares para alfombra (en yardas)15.2 15.4 15.6 15.6 15.615.7 15.7 15.8 15.8 15.815.9 15.9 15.9 15.9 16.016.0 16.0 16.0 16.1 16.216.2 16.3 16.3 16.3 16.416.4 16.6 16.8 16.8 16.92. Es fcil dividir los datos en secciones. En la tabla 2-4, los primeros 15 valores (la mitad inferior de los datos) estn entre 15.2 y 16.0 yardas, y los ltimos 15 (la mitad superior) entre 16.0 y 16.9 yardas. De manera similar, el tercio ms bajo de los datos est entre 15.2 y 15.8 yardas, el tercio de en medio est entre 15.9 y 16.2 yardas, y el tercio ms alto entre 16.2 y 16.9 yardas. 3. Podemos ver si algunos valores aparecen ms de una vez en el arreglo. Los valores iguales quedan juntos. En la tabla 2-4 se muestra que nueve niveles ocurren ms de una vez cuando se toma una muestra de 30 telares. 4. Podemos observar la distancia entre valores sucesivos de los datos. En la tabla 2-4, 16.6 y 16.8 son valores sucesivos. La distancia entre ellos es de 0.2 yardas (16.8 16.6). Desventajas de la ordenacin de datosA pesar de las ventajas, en algunas ocasiones un ordenamiento de datos no resulta til. Como da una lista de todos los valores, es una forma incmoda de mostrar grandes cantidades de datos. Suele ser necesario comprimir la informacin sin que pierda su utilidad para la interpretacin y la toma de decisiones. Cmo podemos hacerlo?Una mejor forma de organizar datos: la distribucin de frecuencias Las distribuciones de frecuencias permiten manejar ms datosUna manera de compactar datos es mediante una tabla de frecuencias o distribucin de frecuencias. Para entender la diferencia entre sta y el ordenamiento de datos, tome como ejemplo las existencias promedio (en das) para 20 tiendas de autoservicio: Tabla 2-5 Ordenamiento de datos para las existencias promedio (en das) para 20 tiendas de autoservicioPierden algo de informacin Pero se obtiene otro tipo de informacin2.0 3.4 3.4 3.83.8 4.0 4.1 4.14.1 4.2 4.3 4.74.7 4.8 4.9 4.95.5 5.5 5.5 5.5En las tablas 2-5 y 2-6, hemos tomado los mismos datos concernientes a las existencias promedio y los hemos organizado, primero, como un arreglo ascendente y luego como una distribucin de frecuencias. Para obtener la tabla 2-6 tuvimos que dividir los datos en grupos de valores parecidos. Despus registramos el nmero de datos puntuales que caen en cada grupo. Observe que perdimos algo de informacin al construir la distribucin de frecuencias. Ya no podemos saber, por ejemplo, que el valor 5.5 aparece cuatro veces y que el valor 5.1 no aparece. Sin embargo, ganamos informacin acerca del patrn de existencias promedio. En la tabla 2-6, podemos ver que las existencias promedio caen con ms frecuencia en el intervalo de 3.8 a 4.3 das. No es usual encontrar existencias Tabla 2-6 Distribucin de frecuencias para las existencias promedio (en das) en 20 tiendas de autoservicio (6 clases)2.3Clase (grupo de valores parecidos de datos puntuales)Frecuencia (nmero de observaciones que hay en cada clase)2.0 a 2.5 2.6 a 3.1 3.2 a 3.7 3.8 a 4.3 4.4 a 4.9 5.0 a 5.51 0 2 8 5 4Ordenamiento de datos en arreglos de datos y distribuciones de frecuencias13 30. Funcin de las clases en una distribucin de frecuenciasPor qu se le conoce como distribucin de frecuencias?promedio en el intervalo de 2.0 a 2.5 das o en el que va de 2.6 a 3.1 das. Las existencias que estn entre 4.4 y 4.9 das y entre 5.0 y 5.5 das no son las que prevalecen, pero ocurren con ms frecuencia que algunas otras. As pues, las distribuciones de frecuencias sacrifican algunos detalles pero nos ofrecen nuevas perspectivas sobre los patrones de los datos. Una distribucin de frecuencias es una tabla en la que organizamos los datos en clases, es decir, en grupos de valores que describen una caracterstica de los datos. El inventario promedio es una caracterstica de las 20 tiendas de autoservicio. En la tabla 2-5, esta caracterstica tiene once valores diferentes. Pero estos mismos datos podran dividirse en cualquier nmero de clases. En la tabla 2-6, por ejemplo, utilizamos seis. Podramos comprimir todava ms los datos y utilizar slo dos clases: menores que 3.8 y mayores o iguales que 3.8. O podramos aumentar el nmero de clases utilizando intervalos ms pequeos, como se hace en la tabla 2-7. Una distribucin de frecuencias muestra el nmero de observaciones del conjunto de datos que caen en cada una de las clases. Si se puede determinar la frecuencia con la que se presentan los valores en cada clase de un conjunto de datos, se puede construir una distribucin de frecuencias.Definicin de distribucin de frecuencias relativas Caractersticas de las distribuciones de frecuencias relativasLas clases son completamente incluyentes Son mutuamente excluyentesHasta aqu hemos considerado la frecuencia con que aparecen los valores en cada clase como el nmero total de datos puntuales u observaciones que caen en cada clase. Podemos expresar la frecuencia de cada valor tambin como una fraccin o un porcentaje del nmero total de observaciones. La frecuencia de un inventario promedio de 4.4 a 4.9 das, por ejemplo, es 5 en la tabla 2-6, pero 0.25 en la tabla 2-8. Para obtener este valor de 0.25, dividimos la frecuencia de esa clase (5) entre el nmero total de observaciones del conjunto de datos (20). La respuesta se puede expresar como una fraccin (5/20), un nmero decimal (0.25) o un porcentaje (25%). En una distribucin de frecuencias relativas se presentan las frecuencias en trminos de fracciones o porcentajes. Observe, en la tabla 2-8, que la suma de todas las frecuencias relativas es igual a 1.00, o 100%. Esto se debe a que una distribucin de frecuencias relativas da una correspondencia de cada clase con su fraccin o porcentaje del total de los datos. Por consiguiente, las clases que aparecen en cualquier distribucin de frecuencias, sean relativas o simples, son completamente incluyentes. Todos los datos caen en una u otra categora. Note tambin que las clases de la tabla 2-8 son mutuamente excluyentes, es decir, ningn dato puntual cae en ms de una categora. En la tabla 2-9 se ilustra este concepto mediante la comparacin de clases mutuamente excluyentes con clases que se traslapan. En las distribuciones de frecuencias no existen clases que se traslapen. Tabla 2-7 Distribucin de frecuencias para las existencias promedio (en das) en 20 tiendas de autoservicio (12 clases)ClaseFrecuenciaClaseFrecuencia2.0 a 2.2 2.3 a 2.5 2.6 a 2.8 2.9 a 3.1 3.2 a 3.4 3.5 a 3.71 0 0 0 2 03.8 a 4.0 4.1 a 4.3 4.4 a 4.6 4.7 a 4.9 5.0 a 5.2 5.3 a 5.53 5 0 5 0 4Tabla 2-8 Distribucin de frecuencias relativas del inventario promedio (en das) para 20 tiendas de autoservicio14Captulo 2ClaseFrecuencia2.0 a 2.5 2.6 a 3.1 3.2 a 3.7 3.8 a 4.3 4.4 a 4.9 5.0 a 5.51 0 2 8 5 4 20Frecuencia relativa: fraccin de observaciones en cada clase 0.05 0.00 0.10 0.40 0.25 0.20 1.00(suma de frecuencias relativas de todas las clases)Agrupacin y presentacin de datos para expresar significados: tablas y grficas 31. Tabla 2-9 Clases mutuamente excluyentes y clases que se traslapan Clases de datos cualitativosClases de extremo abierto para listas que no son exhaustivasMutuamente excluyentes No mutuamente excluyentes1a4 1a45a8 3a69 a 12 5 a 8013 a 16 7 a 10Hasta ahora, las clases han consistido en nmeros y describen algn atributo cuantitativo de los elementos de la muestra. Podemos, tambin, clasificar la informacin de acuerdo con caractersticas cualitativas, como raza, religin y sexo, que no entran de manera natural en categoras numricas. Igual que las clases de atributos cuantitativos, stas deben ser completamente incluyentes y mutuamente excluyentes. En la tabla 2-10 se muestra cmo construir distribuciones de frecuencias simples o absolutas y distribuciones de frecuencias relativas usando el atributo cualitativo de ocupacin. Aunque en la tabla 2-10 no se enumeran todas las ocupaciones de los graduados del Central College, sigue siendo completamente incluyente. Por qu? La clase otros cubre a todas las observaciones que no entran en las categoras mencionadas. Utilizaremos algo parecido siempre que nuestra lista no incluya especficamente todas las posibilidades. Por ejemplo, si la caracterstica puede presentarse durante cualquier mes del ao, una lista completa debera incluir 12 categoras. Pero si deseamos enumerar slo los ocho primeros meses, de enero a agosto, podemos utilizar el trmino otros para referirnos a las observaciones correspondientes a los restantes cuatro meses, septiembre, octubre, noviembre y diciembre. Aunque nuestra lista no incluye especficamente todas las posibilidades, sigue siendo completamente incluyente. La categora otros se conoce como clase de extremo abierto cuando permite que el extremo inferior o el superior de una clasificacin cuantitativa no est limitado. La ltima clase de la tabla 2-11 (72 o ms) es de extremo abierto. Tabla 2-10 Ocupacin de los integrantes de una muestra de 100 graduados del Central CollegeTabla 2-11Clase ocupacional Actor Banquero Empresario Qumico Mdico Agente de seguros Periodista Abogado Maestro OtrosClase: edad (1)Edades de los habitantes del condado de Bunder2.3Nacimiento a 7 8 a 15 16 a 23 24 a 31 32 a 39 40 a 47 48 a 55 56 a 63 64 a 71 72 o msDistribucin de frecuencias (1) 5 8 22 7 10 6 2 14 9 17 100Distribucin de frecuencias relativas (1) 100 0.05 0.08 0.22 0.07 0.10 0.06 0.02 0.14 0.09 0.17 1.00Frecuencia (2)Frecuencia relativa (2) 295,98 8,873 9,246 12,060 11,949 9,853 8,439 8,267 7,430 7,283 6,192 89,5920.0990 0.1032 0.1346 0.1334 0.1100 0.0942 0.0923 0.0829 0.0813 0.0691 1.0000Ordenamiento de datos en arreglos de datos y distribuciones de frecuencias15 32. Los esquemas de clasificacin pueden ser tanto cuantitativos como cualitativos y tanto discretos como continuos. Las clases discretas son entidades separadas que no pasan de una clase a la siguiente sin que haya un rompimiento. Clases como el nmero de nios de cada familia, el nmero de camiones de una compaa de transportistas o las ocupaciones de los graduados del Central College son discretas. Los datos discretos son aquellos que pueden tomar slo un nmero limitado de valores o un nmero infinito numerable de valores. Los graduados del Central College pueden clasificarse como doctores o qumicos, pero no como algo intermedio. El precio de cierre de las acciones de AT&T puede ser 391 2 o 397 8 (pero no 39.43), o su equipo de bsquetbol favorito puede ganar por / / 5 o 27 puntos (pero no por 17.6 puntos). Los datos continuos pasan de una clase a otra sin que haya un rompimiento. Implican mediciones numricas como el peso de las latas de tomates, la presin sobre el concreto o las calificaciones de bachillerato de los estudiantes del ltimo ao en la universidad, por ejemplo. Los datos continuos pueden expresarse con nmeros fraccionarios o con enteros.Clases discretasClases continuasExisten muchas maneras de presentar datos. Para empezar, puede elaborar un ordenamiento de datos de manera descendente o ascendente. Mostrar cuntas veces aparece un valor usando una distribucin de frecuen-cias es an ms efectivo; convertir estas frecuencias en decimales (que se conocen como frecuencias relativas) puede ayudar todava ms. Sugerencia: debe recordar que las variables discretas son cosas que se pueden contar y las variables continuas aparecen en algn punto de una escala.SUGERENCIAS Y SUPOSICIONESEjercicios 2.3 Ejercicios de autoevaluacin EA2-1Las edades de los 50 integrantes de un programa de servicio social del gobierno son: 83 65 44 38 91EA2-251 87 55 88 7166 68 78 76 8361 64 69 99 8082 51 98 84 6865 70 67 47 6554 75 82 60 5156 66 77 42 5692 74 79 66 7360 68 62 74 55Use estos datos para construir las distribuciones de frecuencia relativa con 7 y 13 intervalos iguales. La poltica del estado para los programas de servicio social requiere que alrededor de 50% de los participantes tengan ms de 50 aos. a) Cumple el programa con la poltica? b) La distribucin de frecuencias relativas de 13 intervalos ayuda a responder el inciso a) mejor que la distribucin de 7 intervalos? c) Suponga que el director de servicios sociales desea saber la proporcin de participantes en el programa que tienen entre 45 y 50 aos de edad. A partir de cul distribucin de frecuencias relativas, de 7 o de 13 intervalos, puede estimar mejor la respuesta? Use los datos de la tabla 2-1 para elaborar un ordenamiento de mayor a menor del promedio general en bachillerato. Despus haga un ordenamiento de mayor a menor del promedio general en la universidad. A partir de los dos ordenamientos, qu puede concluir que no poda a partir de los datos originales?Aplicaciones 162-9Los talleres Transmissions Fix-It registran el nmero de comprobantes de servicio extendidos el mes anterior en cada una de sus 20 sucursales de la forma siguiente:Captulo 2Agrupacin y presentacin de datos para expresar significados: tablas y grficas 33. 823 669 722 2172-102-112-122-132-14634 904 847 308752 586 641 7662.7 4.5 2.0 6.73.8 2.6 4.4 5.92.2 5.5 2.1 4.13.4 3.2 3.3 3.7A partir de estos datos, elabore una distribucin de frecuencias con intervalos de una hora. A qu conclusiones puede llegar acerca de la productividad de los mecnicos si toma en cuenta la distribucin de frecuencias? Si el gerente de la Transmissions Fix-It cree que ms de 6.0 horas es evidencia de un desempeo insatisfactorio, de qu magnitud es el problema del desempeo de los mecnicos en este taller en particular? El comisionado de transporte del condado de Orange est preocupado por la velocidad a la que los conductores manejan en un tramo de la carretera principal. Los datos de velocidad de 45 conductores son los siguientes: 15 31 44 56 38321 555 468 349La compaa tiene la creencia de que una sucursal no puede mantenerse financieramente con menos de 475 servicios mensuales. Es tambin poltica de la compaa otorgar una bonificacin econmica al gerente de la sucursal que genere ms de 725 servicios mensuales. Ordene los datos de la tabla e indique cuntas sucursales no pueden mantenerse y cuntas recibirn bonificacin. Utilice los datos de la empresa Transmissions Fix-It del ejercicio 2-9. La vicepresidente financiera de la compaa ha establecido lo que llama una lista de observacin de sucursales que contiene las sucursales cuya actividad en cuanto a servicios prestados es lo suficientemente baja como para que la casa matriz le preste atencin especial. Esta categora incluye a las sucursales cuya actividad est entre 550 y 650 servicios mensuales. Cuntos talleres debern estar en dicha lista si nos basamos en la actividad del mes anterior? El nmero de horas que les toma a los mecnicos retirar, reparar y reinstalar una transmisin en uno de los talleres de Transmissions Fix-It, durante un da de la semana anterior, se registra de la manera siguiente: 4.3 3.1 6.6 6.3648 427 360 58832 48 42 58 2945 49 38 48 6246 56 52 47 4942 52 55 52 6939 39 58 37 1868 48 62 64 6147 69 58 29 5518 61 48 55 49Use estos datos para elaborar distribuciones de frecuencias relativas con 5 y 11 intervalos iguales. El Departamento de Transporte informa que, a nivel nacional, no ms de 10% de los conductores excede 55 mph. a) Se comportan los conductores del condado de Orange de acuerdo con las afirmaciones del informe del Departamento de Transporte acerca de los patrones de manejo? b) Qu distribucin us para responder el inciso a)? c) El Departamento de Transporte ha determinado que la velocidad ms segura para esta carretera es ms de 36 y menos de 59 mph. Qu proporcin de conductores maneja dentro de este intervalo? Qu distribucin ayuda a responder a esta pregunta? Ordene los datos de la tabla 2-2, en un arreglo de mayor a menor. a) Suponga que la ley estatal requiere que los puentes de concreto puedan soportar al menos 2,500 lb/pulg2. Cuntas muestras no pasarn esta prueba? b) Cuntas muestras podran soportar una presin de al menos 2,497 lb/pulg2 pero no una de 2,504 lb/pulg2? c) Si examina con cuidado el arreglo, se dar cuenta de que algunas muestras pueden soportar cantidades iguales de presin. Proporcione una lista de tales presiones y el nmero de muestras que pueden soportar cada cantidad de presin. Un estudio reciente sobre los hbitos de los consumidores de televisin por cable en Estados Unidos proporcion los siguientes datos: Nmero de canales compradosNmero de horas que ven televisin por semana25 1814 16 Contina2.3Ordenamiento de datos en arreglos de datos y distribuciones de frecuencias17 34. Nmero de canales comprados 42 96 28 43 39 29 17 84 76 22 1042-15Nmero de horas que ven televisin por semana 12 6 13 16 9 7 19 4 8 13 6Ordene los datos. Qu conclusin puede deducir de estos datos? La agencia de proteccin ambiental estadounidense tom muestras de agua de 12 ros y arroyos que desembocan en el lago Erie. Las muestras se probaron en los laboratorios de la agencia y clasificadas segn la cantidad de contaminantes slidos suspendidos en cada muestra. Los resultados de la prueba se dan en la tabla siguiente: Muestra Contaminantes (ppm)2-162 51.73 68.44 54.25 49.96 33.4Muestra Contaminantes (ppm)1 37.2 7 39.88 52.79 60.010 46.111 38.512 49.1a) Ordene los datos en un arreglo descendente. b) Determine el nmero de muestras con un contenido de contaminantes entre 30.0 y 39.9, 40.0 y 49.9, 50.0 y 59.9 y entre 60.0 y 69.9. c) Si 45.0 es el nmero que utiliza la agencia de proteccin ambiental para indicar una contaminacin excesiva, cuntas muestras sern clasificadas como excesivamente contaminadas? d) Cul es la distancia ms grande entre dos muestras consecutivas cualesquiera? Suponga que el personal de admisiones al que nos referimos al analizar la tabla 2-1 de la pgina 12 desea examinar la relacin entre la diferencial de un estudiante que realiza el examen de admisin (la diferencia entre el resultado real del examen y el esperado segn el promedio general del nivel anterior) y la dispersin de los promedios generales del estudiante en el bachillerato y la universidad (la diferencia entre el promedio general de la universidad y el del nivel anterior). El personal de admisiones utiliza los datos siguientes: Prom. bach.Prom. univ.Resultado examenProm. bach.Prom. univ.Resultado examen3.6 2.6 2.7 3.7 4.0 3.5 3.5 2.2 3.9 4.02.5 2.7 2.2 3.2 3.8 3.6 3.8 3.5 3.7 3.91,100 940 950 1,160 1,340 1,180 1,250 1,040 1,310 1,3303.4 2.9 3.9 3.2 2.1 2.2 3.4 3.6 2.6 2.43.6 3.0 4.0 3.5 2.5 2.8 3.4 3.0 1.9 3.21,180 1,010 1,330 1,150 940 960 1,170 1,100 860 1,070Adems, el personal de admisiones ha recibido la siguiente informacin del servicio de pruebas educativas: Prom. bach.Resultado examenProm. bach.Resultado examen4.0 3.9 3.8 3.71,340 1,310 1,280 1,2502.9 2.8 2.7 2.61,020 1,000 980 960Contina18Captulo 2Agrupacin y presentacin de datos para expresar significados: tablas y grficas 35. Prom. bach.Resultado examenProm. bach.3.6 3.5 3.4 3.3 3.2 3.1 3.01,220 1,190 1,160 1,130 1,100 1,070 1,040Resultado examen2.5 2.4 2.3 2.2 2.1 2.0940 920 910 900 880 860a) Ordene estos datos en un arreglo descendente de las dispersiones. (Considere positivo un aumento en el promedio general de universidad respecto al de bachillerato y como negativo el caso contrario.) Incluya con cada dispersin la diferencial de admisin correspondiente. (Considere negativo un resultado de admisin que est por debajo del esperado y positivo uno que est por arriba.) b) Cul es la dispersin ms comn? c) Para la dispersin del inciso b), cul es la diferencial de admisin ms comn? d) A qu conclusiones llega, partiendo del anlisis que ha hecho?Soluciones a los ejercicios de autoevaluacin EA2-17 intervalos Frecuencia relativaClase 30-39 40-49 50-59 60-69 70-79 80-89 90-99EA2-213 intervalosClase 35-39 40-44 45-49 50-54 55-59 60-64 65-690.02 0.06 0.16 0.32 0.20 0.16 0.08 1.00Frecuencia relativa 0.02 0.04 0.02 0.08 0.08 0.10 0.22Clase 70-74 75-79 80-84 85-89 90-94 95-99Frecuencia relativa 0.10 0.10 0.12 0.04 0.04 0.04 1.00a) Como se puede saber a partir de cualquiera de las distribuciones, cerca de 90% de los participantes tiene ms de 50 aos, por lo que el programa no cumple la poltica. b) En este caso, es igualmente sencillo usar las dos. c) La distribucin de 13 intervalos da una mejor estimacin porque tiene una clase de 45-49, mientras que la distribucin de 7 intervalos agrupa todas las observaciones entre 40 y 49. Ordenamiento de datos segn el promedio general de bachillerato: Prom. bach.Prom. univ.Prom. bach.Prom. univ.4.0 4.0 3.9 3.9 3.7 3.6 3.6 3.5 3.5 3.43.9 3.8 4.0 3.7 3.2 3.0 2.5 3.8 3.6 3.63.4 3.2 2.9 2.7 2.6 2.6 2.4 2.2 2.2 2.13.4 3.5 3.0 2.2 2.7 1.9 3.2 3.5 2.8 2.5Ordenamiento de datos segn el promedio general en la universidad: Prom. bach.Prom. bach.4.0 3.92.3Prom. univ. 3.9 4.03.2 3.2Prom. univ. 3.7 2.4 ContinaOrdenamiento de datos en arreglos de datos y distribuciones de frecuencias19 36. Prom. bach.Prom. univ.Prom. bach.Prom. univ.3.8 3.8 3.7 3.6 3.6 3.5 3.5 3.44.0 3.5 3.9 3.5 3.4 3.2 2.2 3.43.0 3.0 2.8 2.7 2.5 2.5 2.2 1.93.6 2.9 2.2 2.6 3.6 2.1 2.7 2.6De estos ordenamientos se puede ver que los promedios generales altos en un nivel tienden a relacionarse con promedios generales altos en el otro, aunque hay algunas excepciones.2.4 Construccin de una distribucin de fre