PROBABILIDAD Y ESTADÍSTICA MAT - 325

124

Transcript of PROBABILIDAD Y ESTADÍSTICA MAT - 325

Page 1: PROBABILIDAD Y ESTADÍSTICA MAT - 325
Page 2: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

1

CUADERNO DE APUNTES DEL ESTUDIANTE

Probabilidad y Estadística

«Todo conocimiento conlleva el riesgo del error y de la ilusión». (Morin).

PRESENTACIÓN Este cuaderno corresponde al módulo “Probabilidad y estadística”, que debe llevar al estudiante a desarrollar capacidades para:

Organizar, presentar, analizar e interpretar información cuantitativa proveniente del ámbito informático, demostrando capacidades para operar con métodos estadísticos básicos y cálculo de probabilidades, con ayuda de calculadora científica.

El cuaderno está organizado en 14 CLASES. En cada una de ella se trata un tema relevante del programa y por eso, todas se inician con la descripción de los aprendizajes esperados que debe lograr el estudiante. Cada se clase se estructura en las siguientes secciones:

1º: Síntesis: es un resumen de los conceptos centrales involucrados en los aprendizajes de la clase. Asimismo, se encuentran las principales fórmulas y relaciones numéricas que sustentan la Estadística. 2º: Ejercicios resueltos: en esta sección se plantean ejercicios, problemas y casos representativos de la clase y se resuelven en detalle. 3º: Ejercicios propuestos: se plantean problemas aplicados en forma de preguntas de selección múltiple. A final de cada clase se encuentran las claves correctas. Esta sección le permitirá al estudiante ejercitar los aprendizajes de la clase y podrá autoevaluar su desempeño. Los casos se ubican en diversos contextos en que suelen desempeñarse los especialistas en informática. 4º: Fuentes complementarias: en esta parte se sugieren fuentes de información alternativos, donde el estudiante podrá encontrar información y ejercicios. En esta misma, además, se sugieren actividades de aprendizaje complementarias para quienes se interesen.

Problemas de recapitulación: Al final del cuaderno se presenta una batería de casos para su resolución, orientados a la preparación del examen de módulo. Los casos pertenecen a una diversidad de ámbitos con que regularmente se encuentran los especialistas en informática. Uso de calculadora: Para trabajar con el presente cuaderno, el o la estudiante debe usar calculadora científica. En este apunte se considera una calculadora Casio fx-350MS, cuyo uso debe serle familiar.

Page 3: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

2

Índice PRESENTACIÓN 1

ÍNDICE 2

PROGRAMA 3

CLASE 1: Introducción a la estadística descriptiva 5

CLASE 2: Estadísticas de variables cualitativas 15 CLASE 3: Estadísticas de variables discretas 24

CLASE 4: Estadísticas de variable continua 33

CLASE 5: Organización de datos 42

CLASE 6: La media aritmética 48

CLASE 7: Mediana y moda: cálculo e interpretación 56

CLASE 8: Cuartiles: cálculo e interpretación 63

CLASE 9: Deciles y percentiles: cálculo e interpretación 72

CLASE 10: Estadígrafos de dispersión 80

CLASE 11: Fundamentos de análisis combinatorio 88

CLASE 12: Introducción al cálculo de probabilidades 94

CLASE 13: Axiomas, teoremas y álgebra de sucesos 103

CLASE 14: Probabilidad de sucesos condicionales 109

Ejercicios de recapitulación 117

Page 4: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

3

I: IDENTIFICACIÓN NOMBRE DEL MÓDULO: PROBABILIDAD Y ESTADÍSTICA UNIDAD DE COMPETENCIA: al finalizar el módulo los participantes serán capaces de:

Organizar, presentar, analizar e interpretar información cuantitativa proveniente del ámbito informático, demostrando capacidades para operar con métodos estadísticos básicos y cálculo de probabilidades, con ayuda de calculadora científica.

DURACIÓN: 72 horas pedagógicas II: DESCRIPCIÓN POR ÁREA DE FORMACIÓN Y PRERREQUISITO Área de formación: general diferenciada Ubicación: En carreras de Programación y Análisis de Sistemas e Ingeniería en Informática: 6º semestre. Prerrequisito: En carreras de Programación y Análisis de Sistemas e Ingeniería en Informática: Cálculo III: UNIDADES DE APRENDIZAJE 1ª UNIDAD: Presentación de datos DURACIÓN: 16 Horas Pedagógicas

Aprendizajes Esperados Contenidos -Identifican y dan ejemplos de fenómenos determinísticos y no determinísticos. -Identifican el ámbito de acción de la Estadística, sus aplicaciones y método. -Identifican y caracterizan los distintos tipos de variable. -Construyen tablas de frecuencia y gráficos para variables cualitativas y los interpretan. -Construyen tablas de frecuencia y gráficos para variable numérica discreta y los interpretan. -Construyen tablas de frecuencia y gráficos para variable numérica continua y los interpretan. -Organizan datos cuantitativos provenientes del ámbito social, económico, comercial o financiero, en tablas, grafican e interpretan la información según contexto.

-Fenómenos determinísticos y no determinísticos. -La Estadística, sus aplicaciones y método. -Tipos de variable. -Tablas de frecuencia y gráficos para variables cualitativas y su interpretación. -Tablas de frecuencia y gráficos para variable discreta y su interpretación. -Tablas de frecuencia y gráficos para variable continua y su interpretación. -Organización, presentación e interpretación de datos.

2ª UNIDAD: Estadísticos básicos DURACIÓN: 28 horas pedagógicas

Aprendizajes Esperados Contenidos -Explican el concepto de estadígrafo y su valor en la caracterización de series de datos. -Calculan e interpretan media aritmética con datos no agrupados y datos agrupados, con uso de la función estadística de la calculadora. -Calculan e interpretan la Mediana con datos no agrupados y datos agrupados, con uso de calculadora. -Calculan e interpretan la Moda. -Resuelven problemas aplicando las diferentes medidas de tendencia central. -Calculan e interpretan los cuartiles. -Grafican cuartiles mediante gráfico de caja. -Calculan e interpretan deciles y percentiles -Calculan los estadígrafos de dispersión: varianza, desviación estándar y coeficiente de variación, con uso de la función estadística de la

-Concepto de estadígrafo y su valor en la caracterización de series de datos. -Cálculo de la media aritmética con datos no agrupados y datos agrupados, con uso de calculadora. -Cálculo e interpretación de la Mediana con datos agrupados y no agrupados. -Calculan e interpretan la Moda. -Problemas aplicando las diferentes medidas de tendencia central. -Cálculo e interpretación de los cuartiles. -Gráfico de caja y bigotes. -Cálculo e interpretación de deciles y percentiles.

Page 5: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

4

calculadora. -Analizan datos cuantitativos provenientes del ámbito social, económico, comercial o financiero, calculando estadígrafos de posición y dispersión.

-Cálculo de varianza, desviación estándar y coeficiente de variación, con ayuda de calculadora.

3ª UNIDAD: Cálculo de probabilidades DURACIÓN: 28 horas pedagógicas

Aprendizajes Esperados Contenidos -Operan con análisis combinatorio, resolviendo problemas de combinatoria y permutaciones. -Identifican el concepto de probabilidad y su importancia en la concepción de mundo. - Aplican conceptos y definiciones para diferenciar experimentos aleatorios y no aleatorios. -Identifican, en casos dados, experimento aleatorio, espacio muestral, suceso, su correspondiente nomenclatura y notación. -Resuelven problemas de cálculo de probabilidad de sucesos simples, aplicando el concepto básico de probabilidad de Laplace. -Operan con axiomas y álgebra de sucesos. - Utilizan conceptos, definiciones y axiomas de probabilidad para describir experimentos, eventos, espacio muestral y calcular probabilidades simples de problemas relacionados con la especialidad.

-Introducción al análisis combinatorio: permutaciones y combinaciones. - Concepto de Probabilidad - Definición de experimento aleatorio, evento, espacio muestral. -Probabilidad de sucesos simples (Laplace) -Axiomas y álgebra de sucesos. -Problemas aplicados

-Utilizan las reglas de la adición para calcular probabilidades de eventos, resolviendo problemas relacionados con la especialidad. -Utilizan las reglas de la multiplicación para calcular probabilidad de eventos, resolviendo problemas relacionados con la especialidad - Utilizan diagrama de árbol para organizar y evaluar probabilidades de sucesos condicionales. -Calculan probabilidades utilizando el teorema de Bayes. -Utilizan diagrama de árbol, probabilidad total y teorema de Bayes para resolver, interpretar y resolver problemas relacionados con la especialidad.

-Reglas de la adición: Eventos mutuamente excluyentes. -Probabilidad del complemento. -Probabilidad conjunta -Regla para la adición -Reglas para la multiplicación -Eventos independientes -Regla especial de la multiplicación para eventos independientes. -Probabilidad condicional -Regla general de la multiplicación -Diagramas de árbol y teorema de Bayes -Probabilidad total -Teorema de Bayes

VI: BIBLIOGRAFÍA - Spiegel, Murray. Probabilidad y Estadística. Editorial: Mc Graw Hill. 2004. ISBN: 970104231X. ISBN-13: 9789701042311 -Mendelhall, W. Beaver, R. Beave, B. Introducción a la probabilidad y estadística. Editorial Thomson, 2002. ISBN: 970-686-195-5.

Page 6: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

5

PRIMERA UNIDAD: PRESENTACIÓN DE DATOS CLASE 1

INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA «El sol cada día es nuevo».

Heráclito.

APRENDIZAJES ESPERADOS CONTENIDOS -Identifican y dan ejemplos de fenómenos determinísticos y no determinísticos. -Identifican el ámbito de acción de la Estadística, sus aplicaciones y método. -Identifican y caracterizan los distintos tipos de variable.

-fenómenos determinísticos y no determinísticos. -La Estadística, sus aplicaciones y método. -Tipos de variable.

II. DESARROLLO 1. Fenómeno estadístico Son aquellos que se caracterizan por la aleatoriedad o azar de su comportamiento. Un fenómeno estadístico tiene un comportamiento más o menos estable, o al menos, posible de delinear cuando se le considera como un todo, pero, la multiplicidad de eventos particulares que lo componen son imposibles de predecir. Vemos en un supermercado a cientos de personas en el proceso de comprar. Eligen productos, comparan precios, marcas, contenidos, envases. Para los administradores del local es imposible determinar la compra, por ejemplo, de la señora Juanita, pero, podrían determinar, a nivel general qué, cuándo y cuánto compra el conjunto de todos sus clientes, por ejemplo, en una semana. Aun así, pueden darse diferencias y cambios en los hábitos de consumo de los clientes, atribuibles a factores políticos, policiales, climáticos, etc. Las técnicas y métodos estadísticos nos acercan a delinear la realidad disminuyendo la incertidumbre que la caracteriza, pero nunca llegará a predecirla sino es con cierto grado de incertidumbre. En resumen, los fenómenos estadísticos, llamados también aleatorios, estocásticos o no determinísticos, se caracterizan porque:

• Constituyen un todo con un perfil general o patrón cognoscible, cuando se cuenta con una gran cantidad de observaciones.

• Sus resultados particulares no son predecibles. 2. La Estadística Ciencia que estudia los métodos y técnicas para obtener datos provenientes de fenómenos aleatorios, para organizarlos, presentarlos e interpretarlos en el contexto donde surgen, con el objeto de construir una comprensión del fenómeno que les dio origen. Muchas veces el propósito de un estudio estadístico es construir conocimiento con un interés científico explicativo, mientras que otras veces es para tomar decisiones en el ámbito económico, político, comercial, etc. Por ejemplo, cuando surgió la influenza humana en Chile, poco se sabía de ella. Las primeras investigaciones se dirigieron a caracterizar las personas enfermas en cuanto sexo, edad y otros aspectos biológicos, sicosociales y culturales, que ayudaron a construir un perfil de la población susceptible de ser atacada por el virus. Una vez hecho esto, se procedió a la toma de decisiones para controlar la enfermedad y evitar su expansión. En resumen, la Estadística provee las técnicas y métodos para:

• Generar y organizar datos de un fenómeno de interés • Presentar los datos en tablas y gráficos • Interpretar los datos en su contexto • Construir una comprensión del fenómeno

Page 7: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

6

3. Tipos de Estadística

3.1. Estadística descriptiva: rama de la Estadística que se ocupa de describir y caracterizar muestras de datos, respecto de características cuyo estudio interesa. Por esta razón también se le llama estadística de muestras. 3.2. Estadística inferencial: rama de la Estadística cuyo objetivo es obtener conclusiones generales acerca de una población en estudio, a partir de los resultados de una muestra. Por esta razón también se le llama estadística de poblaciones. Por ejemplo, sobre la base de los resultados de una encuesta a 2.350 personas, se puede inferir lo que puede ocurrir en una población de quince millones y medio de personas.1

4. Población: Conjunto de todos los sujetos cuyo estudio interesa. También se puede comprender una población como el conjunto de todas las medidas o datos a estudiar. El tamaño de la población se simboliza N. Ejemplos:

• Usuarios de Internet en Chile • Accidentes de tránsito en la región Metropolitana • Microempresas del sector agroindustrial • Sandías producidas en Paine

5. Censo: Estudio estadístico que abarca el 100% de una población. Muchas veces, realizar un estudio así resulta imposible o antieconómico. Por ejemplo, estudiar las preferencias presidenciales de la población de votantes es prácticamente imposible, tanto como lo es medir la cantidad de madera que puede rendir un bosque de 350 mil árboles de 15 años de edad. En Chile se realiza un censo de población y vivienda cada diez años. El último de ellos se realizó el año 2002. 6. Muestra: Subconjunto de la población que se extrae con el objeto de estudiar las características poblacionales.

6.1. Algunas ventajas de trabajar con muestras: • Es más rápido, ya que se estudian menos sujetos. • Es más barato, ya que al ser menos sujetos en estudio, se requieren menos recursos. • Si la muestra es representativa, se obtienen resultados muy cercanos a la realidad poblacional. • Al ser menos sujetos involucrados, se les puede estudiar detalladamente.

6.2. Algunas desventajas de trabajar con muestras:

• Todo trabajo con muestras está sujeto a incertidumbre (error). Es imposible escapar de este fenómeno. • El trabajo con muestras requiere personal especializado. • Si la muestra no está bien seleccionada, se puede llegar a resultados erróneos. • El trabajo con muestras requiere técnicas estadísticas muy especializadas.

7. Tamaño de la muestra: es el número de elementos de la población que se seleccionan para estudiar. Se representa por la letra n minúscula. El tamaño de la muestra varía desde un individuo, hasta la población total. Sin embargo, un estudio se encarece al aumentar el tamaño de la muestra. Por esta razón, siempre ha de tratarse de trabajar con la menor muestra posible, con la consideración de que, a menor tamaño de muestra, mayor es el error o incertidumbre de los resultados. Existen métodos para el cálculo del tamaño óptimo de la muestra.

1 La inferencia estadística utiliza, como se puede advertir, el razonamiento inductivo, que es aquel que va desde lo particular a lo general.

Page 8: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

7

8. Muestreo: Comprende los métodos y técnicas para calcular el tamaño de la muestra y para seleccionar los individuos que la conformarán. El muestreo más elemental es el muestreo aleatorio simple (mas), que consiste en asignar a cada individuo de la población un número. La muestra se selecciona por sorteo, con ayuda de algún mecanismo como tómbola, programas computacionales (RANDOM) o tablas de números al azar. 9. Variable: Característica de los sujetos en estudio, que adopta distintas medidas, valores o categorías entre los componentes de una muestra. Ejemplos:

• Color de automóvil preferido por las mujeres • Número de hijos por familia • Sistema de previsión social de las personas • Grado de acuerdo de los ciudadanos con la reforma a la Constitución Política de Chile

10. Tipos de variable La posibilidad de distinguir muchos tipos de variables ha hecho necesario clasificarlas. Existen varios criterios de clasificación, de los cuales solo se verá el más difundido. En un primer nivel, las variables pueden ser en cualitativas o cuantitativas.

10.1. Variable cualitativa: son aquellas en las que las características de los sujetos u objetos estudiados se expresan en términos cualitativos. El trabajo estadístico con estas variables implica asignar o ubicar a cada individuo estudiado en una categoría dentro de un conjunto de dos a más categorías posibles. Ejemplo: medio de transporte para llegar a su trabajo de los trabajadores del sector comercio. Los valores de la variable pueden ser Metro, bus, taxi, bicicleta, etc. 10.2. Variable cuantitativa: son aquellas en las que las características de los sujetos u objetos en estudio se expresan en términos numéricos. El trabajo estadístico con este tipo de variables implica asignar a cada individuo estudiado un número dentro de un conjunto de valores numéricos posibles. Ejemplo: Precio de la bencina en distintas bencineras en un día determinado. Los valores posibles de la variable van desde $542 hasta $580 (por ejemplo).

La distinción entre variable cualitativa y cuantitativa es relevante a la hora de decidir los procedimientos estadísticos que se aplicarán a los datos. Los cualitativos no aceptan operaciones matemáticas, mientras cuantitativos sí. 11. Escalas de medición de las variables En un segundo nivel, es posible distinguir distintos tipos de variable, según el tipo de datos que originan. Pueden ser nominales, ordinales, discretas y continuas.

11.1. Variable nominal: la variable nominal corresponde a una mera clasificación de los sujetos u objetos en estudio en categorías cualitativas mutuamente excluyentes.

11.1.1. Variable binomial: clasificación en una de dos categorías posibles, mutuamente excluyentes. Por ejemplo: sector geográfico de residencia: Urbano – Rural. Definida así, las personas pueden ser clasificadas

como “urbano” o como “rural”. No hay otra posibilidad. 11.1.2. Variable multinomial: clasificación en una de más de dos categorías posibles, mutuamente excluyentes. Por ejemplo: Sabor preferido de helado: frutilla, bocado, vainilla, chocolate. Definida así, la preferencia de las

personas pueden ser clasificadas en una de las cuatro posibilidades. No hay otra.

Page 9: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

8

11.2. Variable ordinal: corresponde a una clasificación de los sujetos u objetos en estudio en categorías cualitativas mutuamente excluyentes. Estas categorías presentan distintos grados de presencia o intensidad de la variable, desde un nivel nulo o muy leve hasta un nivel muy fuerte o máximo. Por ejemplo: Estado general de salud: Bueno, regular, malo. Es una escala ordinal de tres valores. Cuando se trabaja con este tipo de variable, es frecuente asignarle a los valores un número que sirve para codificar y manipular los datos. Por ejemplo, en la escala ordinal de cuatro valores: Estado general de salud:

4 = Muy Bueno; 3 = Bueno; 2 = Regular; 1 = Malo.

El asignar números a las categorías, sin embargo, no hace de la variable una característica numérica. Lo que se ha hecho es solamente reemplazar una categoría semántica por un número. La variable sigue siendo cualitativa, ordinal. 11.3. Variable discreta: En este tipo de variable, la escala de medición da origen a números enteros: -1, 0, 1, 2, etc. En la variable discreta, no pueden darse números decimales. Solo enteros. Ejemplo: Nº de hijos por familia: 0, 1, 2, 3, … 11.4. Variable continua: En este tipo de variable, la escala de medición da origen a números reales. Esto significa que se pueden dar números decimales, lo que implica que existen infinitos valores posibles de la variable. Ejemplo: Temperatura corporal de los pacientes atendidos en un centro de urgencia: 36,8ºC; 37,5ºC; 39,5ºC, etc.

12. Esquema de los tipos de variable Muy importante: Lo que se puede y lo que no se puede hacer estadísticamente con los datos, depende del tipo de variable. La definición clara de las variables en estudio y su correcta y oportuna clasificación es central en el trabajo estadístico, ya que los procedimientos y técnicas que se empleen para su manipulación, presentación y análisis dependen de ello.

Variables

Cualitativas (alfanuméricas)

Cuantitativas (numéricas)

Nominales

Ordinales

Discretas

Continuas

Binomiales

Multinomiales

Page 10: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

9

13. Características de las escalas de medición de las variables: Hay dos características esenciales:

13.1. Exhaustivas: esto es, los valores de la escala deben dejar la posibilidad de encasillar a todos y cada uno de los sujetos estudiados. Por ejemplo, si se ha de estudiar el sistema de previsión de los chilenos:

¿Cuál es su sistema de salud? 1: Fonasa 2: Isapre

Esta escala no es exhaustiva, porque deja fuera las personas que tienen otro sistema previsional y los que no tienen ningún sistema. Mejor:

¿Cuál es su sistema de salud? 1: Fonasa 2: Isapre 3: Otro 4: Ninguno 5: No sabe, no responde

13.2. Mutuamente excluyentes: Esto significa que cada individuo debe ser clasificado en una y solo una categoría o valor. Por ejemplo, si se ha de estudiar el nivel educacional de las personas:

¿Qué estudios ha tenido? 1: Sin estudios 2: Estudios básicos 3: Estudios medios

Esta escala puede generar problemas, ya que la persona que estudió educación media también estudió educación básica. Además, tal como está planteada, la escala tampoco es exhaustiva. Se evita este problema definiendo correctamente la variable y, sobre todo, haciendo correctamente la pregunta: Mejor:

¿Cuál es su último nivel de estudios aprobados? 1: Sin estudios 2: Educación Básica 3: Educación Media 4: Educación Superior

14. Nomenclatura de las variables Las variables en estudio se suelen nominar mediante las últimas letras del alfabeto, o con una sola letra con subíndices, o bien, con una cadena de caracteres que la recuerda. Por ejemplo:

X = Tasa de desempleo; Y = Sector de residencia

1X = Tasa de desempleo; 2X = Sector de residencia TDES = Tasa de desempleo; SRES = Sector de residencia

Page 11: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

10

15. Aplicaciones de la Estadística La Estadística no es una ciencia exacta. Muy por el contrario, es la ciencia de lo incierto, de todo aquello que se nos presenta en forma difusa, cambiante, azarosa. Las técnicas y métodos estadísticos nos ayudan a configurar un perfil de aquellos fenómenos, disminuyendo así la incertidumbre que los cubre. Es por ello que la enorme herramienta representada por la Estadística tiene aplicaciones en los más variados campos de la investigación, pasando de las ciencias “duras” como la física y la química, hasta llegar a las ciencias sociales. También tiene amplias aplicaciones en la tecnología (conocimiento aplicado), tales como los estudios de opinión, estudios de mercado, mejoramiento de sistemas, sistemas de gestión industrial, etc. He aquí algunos ejemplos de aplicaciones:

-Las empresas, antes de lanzar un nuevo producto al mercado, lo testea con una muestra de personas, que ayudan a decidir el color, sabor, envase, etc, etc. -Los canales de TV deciden sus rostros, horarios, contenidos y otras variables, a través de sondeo estadístico realizado a los televidentes. -Los gobiernos encargan encuestas de opinión para ciertos tópicos, con el fin de tener una idea de la opinión de los ciudadanos acerca de temas específicos, como por ejemplo, sobre la píldora del día después, etc. -Las empresas industriales, cuál más, cuál menos, tienen implementado un sistema de control de calidad, que se basa en métodos estadísticos. En este ámbito es destacable el llamado Control Estadístico de Procesos (CEP), que es un sistema de gestión de la calidad a través de todos los procesos y operaciones que llevan al producto final. -Algunos hallazgos arqueológicos y paleoantropológicos han sido sometido a técnicas estadísticas sofisticadas, que ayudan, por ejemplo, a decidir el origen de ciertos utensilios. -Terminada la segunda guerra mundial, Japón implementó una innovación en el sistema educacional, haciendo obligatorio el estudio de la Estadística en parte de la educación básica, en toda la educación media y en la universitaria de pregrado. La idea fue empapar a todas las personas del concepto de variabilidad e incertidumbre y dotarlas de herramientas para controlarla. -Algo que caracterizan al entrenador de la selección nacional de fútbol Marcelo Bielsa, es el estudio estadístico de los partidos de fúlbol, como herramienta de planificación de partidos.

III. EJERCICIOS Y PROBLEMAS RESUELTOS 1. Encuesta La siguiente es la pregunta 36, que forma parte del cuestionario de una encuesta nacional de salud aplicada en España.

Page 12: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

11

Al respecto, se afirma que esta pregunta: A) Es una sola variable medida a escala polinómica B) Es una sola variable medida a escala numérica C) Es una variable de tipo discreta D) Son cinco variables dicotómicas E) Son cinco variables numéricas Solución: La pregunta 36 de este cuestionario es, en verdad, un conjunto de 5 preguntas, cada una de las cuales tiene dos valores binomiales. Por lo tanto la alternativa correcta es: D. 2. Crecimiento y desarrollo de recién nacidos en el primer año de vida Para describir y caracterizar el crecimiento y desarrollo en el primer año de vida de los niños atendidos por el sistema público de salud en Chile, se efectuó un estudio con 723 recién nacidos seleccionados al azar en hospitales públicos de la región Metropolitana y se siguió su evolución clínica durante el primer año de vida. Se analizaron datos de nacimiento: sexo (masculino, femenino), peso (en gramos), talla (en cm.), circunferencia cefálica (en cm.), valoración del peso (Sobrepeso, Peso normal, Bajo peso), número de hermanos y edad de la madre (años). Los datos fueron recogidos de las historias clínicas individuales de los niños. A partir de esta información: 2.1. Identifique el objetivo general del estudio. 2.2. Identifique la población objeto de estudio. 2.3. Identifique la muestra estudiada y su tamaño. 2.4. Identifique cada una de las variables consideradas en el estudio y clasifíquelas según su tipo. Solución: 2.1. Objetivo: describir y caracterizar el crecimiento y desarrollo en el primer año de vida de los niños atendidos por el sistema público de salud en Chile. 2.2. Población: niños atendidos por el sistema público de salud en Chile. 2.3. Muestra: 723 recién nacidos seleccionados al azar en hospitales públicos de la región Metropolitana. 2.4. Variables:

Sexo: variable dicotómica Peso: variable continua Talla: variable continua Circunferencia cefálica: variable continua Valoración del peso: variable ordinal Número de hermanos: variable discreta Edad de la madre: variable continua

3. Muestra aleatoria de personas Para la realización de un estudio de opinión a nivel nacional, se debe seleccionar una muestra aleatoria de 2.450 personas, desagregada por sexo y región de acuerdo al siguiente criterio: El 20% debe ser de la región Norte, el 36% del Sur y el restante, de la Región Metropolitana. En el Norte, la submuestra debe tener el 46,5% mujeres y 48,4% en el Sur, mientras que en la Región Metropolitana, debe haber un 47,4% hombres. 3.1. Construya una tabla que muestre la composición de la muestra por sexo y región.

Page 13: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

12

Solución: Del total de 2.450, se deben repartir, por región, en 20%, 36% y 44%.

Zona Norte: 20% de 2.450 = 490 Zona Sur: 36% de 2.450 = 882 Región Metropolitana: 44% de 2.450 = 1.078

Llevando estas cifras a una tabla, queda:

REGIÓN SEXO

Norte Metropolitana Sur Total

Hombre

Mujer

Total 490 1.078 882 2.450

Ahora, la muestra de cada región se debe dividir entre hombres y mujeres, de acuerdo a lo establecido:

Zona Norte: 46,5% de 490 = 228 mujeres. Zona Sur: 48,4% de 882 = 427 mujeres Región Metropolitana: 47,4% de 1.078 = 511 hombres.

Completando la tabla:

REGIÓN SEXO

Norte Metropolitana Sur Total

Hombre 262 511 455 1.228

Mujer 228 567 427 1.222

Total 490 1.078 882 2.450

IV. EJERCICIOS Y PROBLEMAS PROPUESTOS 1. De las siguientes afirmaciones respecto de la Estadística: I: Es la ciencia de los hechos aleatorios II: Trabaja con datos numéricos y alfanuméricos III: Trabaja con fenómenos predecibles Es (son) correcta(s): A) Solo I B) Solo I y II C) Solo II y III D) Solo I y III E) I, II y III 2. De las siguientes escalas de medición de una variable: I: Dicotómica II: Ordinal III: Discreta ¿Cuál(es) de ellas permite ordenar los valores de la variable de menor a mayor? A) Solo I B) Solo II C) Solo III D) Solo I y II E) Solo II y III

Page 14: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

13

3. Consumo de verduras Se requiere construir preguntas para una encuesta sobre hábitos alimenticios en la población, para lo cual se proponen las siguientes preguntas:

Pregunta I: ¿Consume verduras en la semana? 1 = Sí; 0 = No Pregunta II: Indique la frecuencia de consumo de verduras en la semana: 3 = Todos los días; 2 = Algunos días; 1 = Nunca Pregunta III: Indique cuántos días a la semana consume verduras: 0 – 1 – 2 – 3 – 4 – 5 – 6 – 7

3.1. De las tres preguntas, ¿cuál(es) de ellas mide el consumo de verduras en forma cualitativa? A) Ninguna B) Solo I C) Solo II D) Solo I y II E) I, II y III 3.2. De las tres preguntas, ¿cuál(es) de ellas mide el consumo de verduras en escala ordinal? A) Ninguna B) Solo I C) Solo II D) Solo I y II E) I, II y III 4. Hábitos de estudio Con el objeto de estudiar los hábitos de estudio de los estudiantes de Educación General Básica (EGB), se selecciona una muestra de 1.347 estudiantes hombres y 1.058 estudiantes mujeres, de un total de 2.294.567 estudiantes de EGB del año escolar 2007. La información se obtiene mediante encuesta a los seleccionados. En el estudio se incluyeron las siguientes variables, con la escala señalada:

1X : Tipo de establecimiento: Particular pagado; Particular subvencionado; Municipal; Otro.

2X : Número de hermanos que estudian EGB: 0, 1, 2, …

3X : Horas de estudio autónomo: horas semanales dedicadas a estudio autónomo.

4X : Asistencia a clases: grado de asistencia a clases: 3 = Buena; 2 = Regular; 1 = Mala

5X : Género: 1 = Masculino; 2 = Femenino

4.1. De acuerdo a lo planteado, la población en estudio es: A) Los colegios de Educación General Básica B) Los estudiantes de Educación General Básica C) Los hábitos de estudio de los estudiantes de EGB D) El nivel de curso de los estudiantes de EGB E) Los estudiantes de Chile 4.2. De la muestra, ¿qué % representa el segmento de estudiantes mujeres? A) 5,8% B) 27,3%º C) 44,0% D) 56,0% E) 78,5% 4.3. De acuerdo a los datos, aproximadamente, ¿qué proporción representa la muestra seleccionada respecto de la población? A) 0,105% B) 5,92% C) 4,63% D) 7,85% E) 1,04% 4.4. De las siguientes variables estudiadas:

I: Número de hermanos que estudian EGB II: Horas de estudio autónomo III: Asistencia a clases

Page 15: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

14

¿Cuál(es) es (son) numérica(s)? A) Solo I B) Solo II C) Solo II y III D) Solo I y II E) I, II y III 4.5. De las siguientes variables consideradas en el estudio: I: Género II: Asistencia a clases III: Tipo de establecimiento ¿Cuál(es) es (son) nominal(es)? A) Solo I B) Solo II C) Solo I y II D) Solo II y III E) Solo I y III 4.6. De las siguientes variables estudiadas: I: Género II: Horas de estudio autónomo III: Número de hermanos que estudian EGB ¿Cuál(es) es (son) discreta(s)? A) Solo I B) Solo II C) Solo III D) Solo II y III E) Ninguna 4.7. En este caso, estudiar una muestra en vez de toda la población, tiene como desventaja:

I: Existe un error o incertidumbre respecto de los resultados II: En el trabajo con muestras los resultados no son confiables III: Los resultados tardan mucho en obtenerse

Es (son), efectivamente, desventaja(s): A) Solo I B) Solo II C) Solo I y II D) Solo I y III E) I, II y III Solución a problemas propuestos 1. B 2. E 3.1. D 3.2. C 4.1. B 4.2. C 4.3. A 4.4. D 4.5. E 4.6. C 4.7. A V. RECURSOS COMPLEMENTARIOS Se Sugiere: 1. Visitas al sitio del Instituto Nacional de Estadísticas (INE): se sugiere curiosear qué hace el INE, cuál es su misión, visión y principios institucionales; qué estudios realiza y qué publica. http://www.ine.cl/ 2. Visitar el sitio con explicación y ejemplos de estadística descriptiva básica y glosario. Apropiado para quienes se inician en el ámbito de la estadística. http://www.cortland.edu/flteach/stats/stat-sp.html 3. Visitar el sitio de Fundación Futuro: http://www.fundacionfuturo.cl Descargar algún estudio de opinión pública e identificar en él, los conceptos básicos de esta clase.

Page 16: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

15

PRIMERA UNIDAD: PRESENTACIÓN DE DATOS CLASE 2 ESTADÍSTICAS DE VARIABLES CUALITATIVAS

«Mi optimismo se funda en lo improbable».

(Morin)

APRENDIZAJES ESPERADOS CONTENIDOS -Construyen tablas de frecuencia y gráficos para variables cualitativas y los interpretan.

-Tablas de frecuencia para variables cualitativas. -Gráficos para variables cualitativas. -Interpretación de tablas y gráficos.

II. DESARROLLO 1. Generalidades metodológicas Una estadística descriptiva básica tiene por objeto describir y caracterizar la muestra en estudio. Para los efectos, organiza los datos observados y genera, al menos los siguientes productos:

• Tablas de frecuencia • Gráficos • Estadígrafos • Descripciones y conclusiones

2. Tablas de frecuencia para variables cualitativas Estas tablas son muy elementales. Constan de tres columnas.

• Primera columna: aquí se ubican los valores de la variable. Si la variable es nominal, no requiere un orden determinado. Si es ordinal, se ordena de mayor a menor o viceversa.

• Segunda columna: se ubica la frecuencia absoluta. Esto es, el número de veces que aparece cada valor de la

variable en los datos observados.

• Tercera columna: Porcentaje. Se calcula qué % representa cada frecuencia absoluta respecto de la frecuencia total o tamaño de la muestra n.

X Nº casos %

Categoría A Categoría B Categoría C Categoría D

Total n 100

Page 17: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

16

Ejemplo: Deporte que practican 40 personas

Deporte Nº casos % Atletismo 12 30,0 Fútbol 16 40,0 Ciclismo 7 17,5 Golf 5 12,5

Total 40 100 2. Gráficos para variables cualitativas Tres son los gráficos más indicados para representar la variable cualitativa.

2.1. Gráfico de barras: Es el más conocido y fácil de elaborar. Cada valor de la variable se representa por rectángulos de igual base y de altura proporcional a la frecuencia, ya sea absoluta o porcentuada. Aunque frecuentemente se construye con barras verticales, también puede hacerse con rectángulos horizontales.2

Especificaciones para el gráfico de barras:

• Cada barra debe tener el mismo ancho • La separación entre barras debe ser constante, sin que necesariamente sea igual al ancho de barras. • Cada barra debe llevar el rótulo que la identifica. Si fuera necesario, se agrega una leyenda explicativa. • Es conveniente que el color de las barras sea el mismo. No se debe dar a sensación de estar destacando a

una de ellas. • El eje de las frecuencias debe especificar claramente si se trata de Nº o %. • Rotular el gráfico, especificando qué muestra. Asimismo, si fuera posible indicar la fuente de los datos. • Evitar trazados en 3D, que suelen distorsionar la información.

2.2. Gráfico circular: También conocido como gráfico de torta. En este, cada valor de la variable queda representado por un sector circular cuyo ángulo es proporcional a su frecuencia. Este gráfico es muy útil cuando se desea mostrar la división del todo en sus partes componentes.

2 Excel llama “gráfico de barras” al de barras horizontales, y “gráfico de columnas” al de barras verticales.

Deporte que practican 40 personas

02468

1012141618

A B C D

Deporte

A: Atletismo B: Fútbol C: Ciclismo D: Golf

Page 18: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

17

Deporte que practica

A30,0%

B40,0%

C17,5%

D12,5%

Especificaciones para el gráfico circular:

• Cada sector debe llevar el rótulo que la identifica. Si fuera necesario, se agrega una leyenda explicativa. • Es conveniente que el color de los sectores sea el mismo. No se debe dar a sensación de estar destacando a

uno de ellos. • En cada sector circular se debe especificar claramente, si se trata de Nº o %. • Rotular el gráfico, especificando qué muestra. Asimismo, si fuera posible indicar la fuente de los datos. • Evitar trazados en 3D, que suelen interferir la información.

2.3. Pictograma: Se caracteriza este gráfico por figuritas que representan cierta cantidad (por ejemplo 1%). Cada valor de la variable lleva tantas figuritas como sea su frecuencia.

Deporte que practican 40 personas

Atletismo Fútbol

Ciclismo Golf

= 1 persona Especificaciones para el pictograma:

• Cada fila de figuritas, debe llevar el rótulo que la identifica. Si fuera necesario, se agrega una leyenda explicativa.

• Se debe usar la misma figurita para todo el gráfico. • El tamaño y el color de las figuritas debe ser el mismo en todo el gráfico. • Debe indicarse claramente cuánto representa cada figurita, y en qué unidades. • Rotular el gráfico, especificando qué muestra. Asimismo, si fuera posible indicar la fuente de los datos. • Evitar trazados en 3D, que suelen interferir la información.

3. Descripciones y conclusiones Consiste en describir en lenguaje corriente los aspectos más relevantes observados. La organización y presentación de datos en tablas de frecuencias y gráficos es una de las formas más recurrentes y útiles en la estadística. A partir de ellas se realiza el análisis de las características que presenta la muestra con relación a la variable estudiada. Resulta de interés el énfasis en las regularidades y en las irregularidades que se observan, así como en las

A: Atletismo B: Fútbol C: Ciclismo D: Golf

Page 19: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

18

acumulaciones de frecuencias, anomalías, posibles patrones, etc. Es decir, en todo aquello que llame la atención del investigador.

3.1. Afirmaciones: Son enunciados acerca de la realidad. Deben ser verificables con los datos empíricos. Ejemplo: El 40% de las personas encuestadas practica el fútbol. Esta afirmación se puede demostrar con los datos de la tabla. Se debe evitar la emisión de opiniones y de juicios de valor, ya que estos no son demostrables. Ejemplo: Al 40% de las personas le gusta más el fútbol. Esta es una opinión del observador, que no se puede verificar con los datos de la tabla. El hecho de que la mayor proporción de la muestra practique este deporte no significa, necesariamente, que es el que más les gusta. 3.2. Conclusiones: Son descripciones que engloban y resumen los resultados más relevantes que presenta la muestra estudiada. En el ejemplo que se está desarrollando:

Conclusiones: Se advierte poca diversidad de deportes practicados por la muestra, ya que, según los datos, se practican solo cuatro. En la muestra, el deporte más practicado es el fútbol, con el 40,0% de las preferencias, mientras que el que menos se practica es el golf, con solo el 12,5% de las observaciones.

III. EJERCICIOS Y PROBLEMAS RESUELTOS 1. Encuesta de salud La siguiente es la pregunta 40 del cuestionario de una encuesta nacional de salud aplicada en España. En esta, se le pregunta al padre o madre del niño(a) acerca de la hospitalización de este(a).

1.1. ¿Cuál es la variable estudiada? 1.2. Identifique el tipo de variable 1.3. ¿Qué tipo de gráfico aconsejaría usted para presentar los resultados de esta pregunta? Solución: 1.1. La variable es: Motivo del último ingreso hospitalario del niño(a). 1.2. La variable es nominal. Más específicamente, es multinomial. 1.3. Los resultados pueden presentarse mediante un gráfico de barras (horizontales o verticales) o un gráfico circular.

Page 20: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

19

2. Accidentes laborales Cierta investigación contempló el estudio de los accidentes de trabajo ocurridos en España durante el año 2002. Uno de los resultados se revela en el siguiente gráfico, sobre una muestra de 1.580 accidentes mortales: 2.1. Identifique población, muestra, variable y tipo de la variable del estudio. 2.2. Construya una tabla de frecuencias absolutas y porcentuadas, que muestre la distribución de accidentes según sector de la actividad donde se produjeron. 2.3. Construya tres afirmaciones acerca del fenómeno estudiado. Solución: 2.1. Población: accidentes de trabajo ocurridos en España durante el año 2002. Muestra: 1.580 accidentes de trabajo mortales ocurridos en España durante el año 2002. Variable: Sector de actividad económica de los accidentes mortales Tipo de variable: nominal 2.2. Tabla de frecuencias. Calculando el % de cada actividad sobre el total de 1.580 accidentes, se tiene: Accidentes mortales según sector de actividad económica.

Sector de actividad Nº de casos %

Servicios 332 21,0

Agrario 142 9,0

Industria 379 24,0

Construcción 727 46,0

TOTAL 1.580 100

2.3. Afirmaciones -El 21,0% de los accidentes mortales se produjo en el sector servicios. -El 24,0% de los accidentes mortales se produjo en el sector industria. -La menor cantidad de accidentes laborales mortales se produjo en el sector agrario, con un total de 142, lo que representa el 9,0% del total de casos mortales. -La mayor cantidad de accidentes laborales mortales se produjo en el sector construcción, con un total de 727, lo que representa el 46,0% del total de accidentes con resultado de muerte. -En el sector construcción se producen dos accidentes fatales por cada uno del sector industria. -Etc.

Distribución porcentual de los accidentes laborales mortales, por sector de actividad.

Año 2002.

AGRARIO 9%

INDUSTRIA 24%

CONSTRUCCIÓN 46%

SERVICIOS 21%

Page 21: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

20

3. Veracidad de la información de TV Una encuesta indagó acerca de la veracidad de la información entregada por la TV, según la opinión de una muestra aleatoria de 1.800 personas mayores de 18 años. Según sexo, la encuesta generó los siguientes datos, en %.

% casos ¿Cree usted que es veraz la información entregada por la TV? hombres mujeres

TOTAL (%)

Sí, siempre es veraz 8,5

Solo a veces es veraz 52,5

No, no es veraz 15,5 25,0

TOTAL (%) 45,5 100

3.1. Identifique las variables en estudio y su escala de medición. 3.2. Complete la tabla de frecuencias con los % faltantes. 3.3. Construya una tabla de frecuencias absolutas. 3.4. De los que creen que la información entregada por la TV siempre es veraz, ¿qué % corresponde a mujeres? 3.5. De los hombres, ¿Qué % cree que la información entregada por la TV solo a veces es veraz? 3.6. ¿Qué % de las muestra son mujeres que opinan que la información entregada por la TV no es veraz? 3.7. Construya un gráfico que muestre los resultados totalizados. Solución: 3.1. Variables

Variable 1: Sexo. Variable dicotómica Variable 2: Opinión de la veracidad de la información entregada por la TV. Variable ordinal.

3.2. Aplicando diferencias, se obtiene la siguiente tabla:

% casos ¿Cree usted que es veraz la información entregada por la TV? hombres mujeres

TOTAL (%)

Sí, siempre es veraz 14,0 8,5 22,5

Solo a veces es veraz 16,0 36,5 52,5

No, no es veraz 15,5 9,5 25,0

TOTAL (%) 45,5 54,5 100

Los valores en negrita son los calculados en base a diferencias. 3.3. Tabla de frecuencias absolutas. Aplicando los % de cada celda al total de la muestra n = 1.800, se obtiene la siguiente tabla:

Nº de casos ¿Cree usted que es veraz la información entregada por la TV? hombres mujeres

TOTAL (%)

Sí, siempre es veraz 252 153 405

Solo a veces es veraz 288 657 945

No, no es veraz 279 171 450

TOTAL (%) 819 981 1.800

3.4. Los que creen que la información entregada por la TV siempre es veraz suman 405, de los cuales 153 son mujeres.

Llevando a %, queda: =100405153 · 37,8%

R: De los que creen que la información entregada por la TV siempre es veraz, el 37,8% corresponde a mujeres.

Page 22: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

21

3.5. El total de hombres es 819. De estos, 288 creen que la información entregada por la TV solo a veces es veraz.

Llevando a %, queda: =100819288· 35,2%

R: De los hombres, el 35,2% cree que la información entregada por la TV solo a veces es veraz. 3.6. De la tabla de frecuencias se obtiene que ese % es el 9,5%. R: El 9,5 % de las muestra son mujeres que opinan que la información entregada por la TV no es veraz. 3.7. Gráfico Hombres según creencia en la veracidad de la información entregada por la TV.

¿Cree usted que es veraz la información entregada por la TV?

%

Sí, siempre es veraz 252 30,8 Solo a veces es veraz 288 35,2

No, no es veraz 279 34,0

TOTAL 819 100

Este gráfico es una variante del gráfico de barras horizontales, incorporando datos de la tabla de frecuencias. IV. EJERCICIOS Y PROBLEMAS PROPUESTOS 1. Estudio del mercado de la cerveza Se realiza un estudio de mercado sobre el consumo de cerveza en Chile. Respecto de la marca que consume preferentemente, se recabó la siguiente información en una muestra de 187 personas mayores de 18 años, de ambos sexos:

Marca Nº CRISTAL BÁLTICA ROYAL BECKER ESCUDO OTRAS

54 27 42 37 15 12

1.1. La variable en estudio es de tipo: A) Dicotómica B) Multinomial C) Ordinal D) Discreta E) Continua 1.2. ¿Qué % de la muestra consume preferentemente cerveza Becker? A) 37,0% B) 21,4% C) 19,8% D) 16,5% E) 13,6% 1.3. ¿Qué % de la muestra prefiere la cerveza Báltica o Royal? A) 14,4% B) 19,4% C) 22,4% D) 32,5% E) 36,9%

Page 23: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

22

1.4. Según los datos de la tabla: A) La marca más preferida por la muestra es Cristal, con el 28,9% de las preferencias. B) La marca más preferida por la muestra es Cristal, con el 32,5% de las preferencias. C) La marca más preferida por la muestra es Royal, con el 22,5% de las preferencias. D) La marca menos preferida por la muestra es Escudo, con el 12,5% de las preferencias. E) La mayoría prefiere la marca Cristal 2. Evaluación del servicio En cierta comuna se realiza una encuesta para evaluar e servicio de extracción de basura. Para los efectos se selecciona aleatoriamente a 473 jefes de hogar y se les aplicó una encuesta. Con los resultados se construyó la siguiente tabla de frecuencia, que se encuentra incompleta.

Evaluación del servicio de extracción de basura domiciliaria por parte de 473 vecinos.

Evaluación No de casos %

Muy bueno 121 25,6 Bueno 186 Ni bueno ni malo 20,7 Malo 45 Muy malo

TOTAL

Complete la tabla de frecuencia y responda: 2.1. La variable en estudio es de tipo: A) Multinomial B) Ordinal C) Discreta D) Continua E) Dicotómica 2.2. ¿Qué % de la muestra opina que el servicio es bueno? A) 39,3% B) 47,4% C) 29,8% D) 26,5% E) 23,6% 2.3. ¿Qué % de la muestra opina que el servicio es malo o muy malo? A) 4,9% B) 8,3% C) 9,5% D) 14,4% E) 12,5% 2.4. De acuerdo a la tabla, se puede afirmar que: I: El 25,6% de los encuestados opina que el servicio de extracción de basura es muy bueno. II: De los encuestados, el 20,7% opina que el servicio de extracción de basura no es ni bueno ni malo. II: De la muestra, el 64,9% opina que el servicio de extracción de basura es bueno o muy bueno. Es (son) correcta(s): A) Solo I B) Solo I y II C) Solo I y III D) Solo II y III E) I, II y III

Page 24: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

23

3. Televidentes Se realiza, a cierta hora del día, una encuesta a 235 televidentes, para determinar el canal de televisión abierta que sintonizan. Con los datos obtenidos se construyó el siguiente gráfico. 3.1. De acuerdo al gráfico, aproximadamente, ¿cuántos televidentes de la muestra sintonizan Chilevisión? A) 42% B) 35% C) 18% D) 15% E) 12% 3.2. Aproximadamente, ¿qué % de los televidentes encuestados suman los dos canales de mayor sintonía? A) 65% B) 60% C) 55% D) 50% E) 45% Solución a problemas propuestos 1.1. B 1.2. C 1.3. E 1.4. A 2.1. B 2.2. A 2.3. D 2.4. E 3.1. D 3.2. C V. RECURSOS COMPLEMENTARIOS 1. Explore las alternativas gráficas del MS Excel. Puede ingresar los mismos datos entregados aquí. Sobre la base de las especificaciones generales dadas, determine cuáles gráficos de Excel son adecuados para la variable alfanumérica. 2. Ver uso de tablas, gráficos y descripciones en los informes de investigaciones publicados en sitios tales como http://www.fundacionfuturo.cl 3. INSTITUTO NACIONAL DE ESTADÍSTICAS DE CHILE http://www.ine.cl/ -Microdatos: lleva a Censos de población, Encuestas.

TVN CHV 13 MEG UCV

80 70 60 50 40 30 20 10 0 Canal

Distribución de televidentes según canal de televisión abierta que sintonizan

TVN: Televisión Nacional de Chile CHV: Chilevisión 13: Canal 13 de la UC MEG: Megavisión UCV: U. Católica de Valparaíso

Page 25: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

24

PRIMERA UNIDAD: PRESENTACIÓN DE DATOS CLASE 3 ESTADÍSTICAS DE VARIABLES DISCRETAS

«Es el azar, no la prudencia lo que rige la vida».

(Cicerón).

APRENDIZAJES ESPERADOS CONTENIDOS -Construyen tablas de frecuencia y gráficos para variable numérica discreta y los interpretan.

-Tablas de frecuencia para variables discretas. -Gráficos para variables discretas. -Interpretación de tablas y gráficos.

II. DESARROLLO 1. Tablas de frecuencia para variables discretas Estas tablas constan de tres o más columnas, según requerimientos y necesidades derivadas del estudio que se realiza.

iX if iF ifr iFr if% iF%

1x 1f 1F 1fr 1Fr 1f% 1F%

2x 2f 2F

3x

... …

mx mf mF mfr mFr mf% mF% Total n - 1 - 100 -

• i = número de orden. i = 1, 2, 3, …, m . • iX = columna con los distintos valores de la variable: 1x , 2x , …, hasta mx , ordenados de menor a mayor.

• if = frecuencia absoluta. Es el número de casos para cada valor de la variable.

• iF = frecuencia acumulada. Es la suma de las frecuencias absolutas hasta cualquier valor de la variable.

Por ejemplo: 2F = 1f + 2f ; 3F = 1f + 2f + 3f ; etc.

• ifr = frecuencia relativa: es el cuociente entre la frecuencia absoluta y la frecuencia total.

Esto es: nffr i

i = . Se suele expresar con tres decimales.

Por ejemplo: nffr 3

3 =

• iFr = frecuencia relativa acumulada. Es la suma de las frecuencias relativas hasta cualquier valor de la variable.

Por ejemplo: 2Fr = 1fr + 2fr ; etc.

Page 26: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

25

También puede expresarse como el cuociente entre la frecuencia absoluta acumulada y el tamaño de la muestra.

Esto es: nFFr i

i = . Se suele expresar con tres decimales.

Por ejemplo: nFFr 3

3 =

• if% = frecuencia porcentuada. Es el % que representa cada frecuencia absoluta respecto de la frecuencia total.

Esto es: 100nff i

i ·% = . Se suele expresar con un decimal.

También puede expresarse como el producto de la frecuencia relativa por 100.

Esto es: 100frf ii ·% = .

Por ejemplo: 44

4 fr100100nff ··% ==

• iF% = frecuencia porcentuada acumulada. Es la suma de las frecuencias porcentuadas hasta cualquier valor de la

variable. Por ejemplo: 3F% = 1f% + 2f% + 3f% ; etc.

También puede expresarse como el producto de la frecuencia relativa acumulada por 100.

Esto es: 100FrF ii ·% = .

Por ejemplo: 3F% = 100Fr3· Importante: Se debe cautelar el uso de la letra minúscula y mayúscula. Las f minúsculas son para frecuencias simples, mientras que las F mayúscula es para frecuencia acumuladas. Las frecuencias acumuladas son muy útiles para la interpretación de datos y también para el cálculo de algunos estadígrafos, como se verá más adelante. 2. Propiedades importantes de las frecuencias:

• ifΣ = n. Esto es, que la suma de las frecuencias absolutas es igual al tamaño de la muestra.

• mF = n. Esto significa que la última frecuencia absoluta acumulada es igual al tamaño de la muestra.

• ifrΣ = 1. Esto es, que la suma de las frecuencias relativas es igual a 1.

• 1fr0 i ≤≤ . Esto es, que la frecuencia relativa siempre es un número mayor igual que cero, pero menor igual que uno.

• mFr =1. Esto significa que la última frecuencia relativa acumulada es igual a 1.

• if%Σ = 100. Esto es, que la suma de las frecuencias porcentuadas es igual a 100.

• mF% = 100. La última frecuencia porcentuada acumulada es igual a 100.

Page 27: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

26

Ejemplo: La siguiente tabla muestra la distribución de 40 familias según número de integrantes.

Integrantes casos 3 4 5 6

9 11 13 7

Total 40

Se calculará la tabla de frecuencias:

iX if iF ifr iFr if% iF%

3 4 5 6

9 11 13 7

9 20 33

0,225 0,275

0,225 0,500

22,5 22,5

Total 40 - 1 - 100 -

En la tabla: =1x 3; =2x 4; etc.

=1f 9; =2f 11; etc.

1F = 9; 2F = 9 + 11= 20; 3F = 9 + 11+13= 33; etc.

409

1fr = = 0,225; 4011fr2 = = 0,275; etc.

1Fr = 0,225; 2Fr = 0,225 + 0,275= 0,5; etc.

100409

1f ·% = = 22,5; etc.

Completando la tabla, queda así:

Familias según número de integrantes

iX if iF ifr iFr if% iF%

3 4 5 6

9 11 13 7

9 20 33 40

0,225 0,275 0,325 0,175

0,225 0,500 0,825

1

22,5 27,5 32,5 17,5

22,5 50,0 82,5 100

Total 40 - 1 - 100 -

Nótese el cumplimiento de las propiedades:

ifΣ = 40. La suma de las frecuencias absolutas es igual al tamaño de la muestra.

4F = 40. La última frecuencia absoluta acumulada es igual al tamaño de la muestra.

ifrΣ = 1. La suma de las frecuencias relativas es igual a 1.

1fr0 i ≤≤ . Todas las frecuencias relativas están entre cero y uno.

4Fr =1. La última frecuencia relativa acumulada es igual a 1.

if%Σ = 100. La suma de las frecuencias porcentuadas es igual a 100.

4F% = 100. La última frecuencia porcentuada acumulada es igual a 100.

Page 28: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

27

3. Gráficos para variables discretas Hablar de variable discreta es hablar de una variable con valores numéricos. Por lo tanto, su graficación debe seguir el rigor matemático correspondiente. Por eso es que solo se mencionarán dos gráficos adecuados para este tipo de variable.

3.1. Gráfico de segmentos: Eje X: se ubica en el eje X los valores de la variable. Eje Y: se ubica la frecuencia absoluta o la porcentuada. La frecuencia relativa también se puede representar, pero, en general, es poco utilizada. La representación consiste en trazos (segmentos) verticales que nacen del eje x y suben hasta una longitud proporcional a la frecuencia observada, sea esta absoluta, porcentuada o relativa.

Graficando la tabla anterior: Precauciones y recomendaciones:

• Escalas: tanto la escala del eje x como la del eje y deben estar correctamente trazadas y enumeradas según situación. En este caso el eje x enumera del 3 al 6 y la escala del eje y va de cero a 35%, dividiendo la escala de 5 en 5.

• Rótulos: ambos ejes deben llevar claramente escritas las unidades que están representando. En este caso el eje x son Nº (de integrantes) y el eje y es %. Ambos datos deben estar claramente consignados.

• Título o rótulo del gráfico: todo gráfico debe llevar un título o rótulo que exprese con claridad qué es lo que está mostrando. Sin el rótulo no puede haber una interpretación del gráfico. En este caso: “Distribución de familias según número de integrantes”.

• Fuente: si es posible, un gráfico debe llevar la fuente de los datos o su origen. En este caso, la fuente es un trabajo hecho por la empresa ALKA-Stat en el año 2010.

3.2. Gráfico de tallo y hojas Consiste en una representación que se asemeja a un pictograma. El tallo: corresponde a un eje vertical que muestra los distintos valores de la variable, ordenados en forma creciente, de arriba abajo. Las hojas: corresponden a la frecuencia de cada valor de la variable. En variable discreta, esta frecuencia se representa con una serie de ceros.

Distribución de familias según número de integrantes

3 4 5 6

35302520151050

%

Fuente: ALKA-Stat-2010

Page 29: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

28

Familias según integrantes

integrantes casos

3 4 5 6

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

Ancho tallo = 1; Hoja = 1

Observaciones: El ancho del tallo 1 indica que el tallo representa unidades. Si fuera Ancho tallo = 10, significaría que representa decenas, y así sucesivamente. Hoja = 1 indica que cada cero equivale a 1 observación. Si fuera Hoja = 2, significaría que cada cero representa dos observaciones, y así sucesivamente. 4. Interpretación de resultados Consiste en describir en lenguaje corriente los aspectos más relevantes observados. La organización y presentación de datos en tablas de frecuencias y gráficos es una de las formas más recurrentes y útiles en la estadística. A partir de ellas se realiza el análisis de las características que presenta la muestra con relación a la variable estudiada. Resulta de interés el énfasis en las regularidades e irregularidades que se observan, así como en las acumulaciones de frecuencias, anomalías, posibles patrones, etc. Es decir, en todo aquello que llame la atención del investigador y se relacionan con los objetivos del estudio. La forma más directa de interpretar y describir el contenido de tablas y gráficos es a través de afirmaciones. Una afirmación es un enunciado verificable acerca de un fenómeno de la realidad sensible. Por ejemplo:

“El 17,5% de las familias se compone de cinco integrantes, constituyendo el segmento de familias más numerosas en la muestra estudiada”.

IMPORTANTE:

• Afirmar solo lo que pueda ser verificado en la tabla o gráfico. • No debe afirmarse nada que no se pueda demostrar a través de los datos de la tabla o del gráfico. • Debe evitarse la emisión de opiniones y juicios de valor, ya que estos no son demostrables en cuanto poder determinar

su verdad o falsedad. Por ejemplo:

“El 17,5% de las familias se compone de muchos integrantes”. “Muchos” es un juicio de valor, no demostrable. Otras conclusiones derivadas de los datos de la tabla son:

• El 22,5% de las familias tiene tres integrantes. • El 27,5% de las familias tiene cuatro integrantes. • El 77,5% de las familias tiene más de 3 integrantes. • El 60% de las familias tiene cuatro o cinco integrantes. • La mitad de las familias tiene al menos cinco integrantes.

Page 30: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

29

III. EJERCICIOS Y PROBLEMAS RESUELTOS 1. Práctica deportiva Se realiza una encuesta a una muestra de hombres mayores de 18 años, preguntando, entre otras cosas, ¿cuántos días a la semana practica deporte? Los resultados se muestran en la tabla siguiente:

Días a la semana de práctica deportiva Días Nº casos

0 1 2 3 4 5 6 7

17 9 5 8 4 2 5 3

Total 53

1.1. Construya una tabla de frecuencias. 1.2. Construya un gráfico de tallo y hojas que muestre estos resultados. 1.3. Construya un gráfico de segmentos con frecuencias porcentuadas. 1.4. Sobre la base de los resultados, responda:

1.4.1. ¿Qué % de la muestra practica deporte al menos 3 veces a la semana? 1.4.2. ¿Qué % de la muestra practica deporte a lo más 2 veces a la semana? 1.4.3. ¿Qué % de la muestra no practica deporte en la semana? 1.4.4. ¿Qué % de la muestra practica deporte más de 5 veces a la semana?

Solución: 1.1. Tabla de frecuencias

Días a la semana de práctica deportiva

Días Nº F ac fr Fr % %Ac 0 1 2 3 4 5 6 7

17 9 5 8 4 2 5 3

17 26 31 39 43 45 50 53

0,321 0,170 0,094 0,151 0,075 0,038 0,094 0,057

0,321 0,491 0,585 0,736 0,811 0,849 0,943

1

32,1 17,0 9,4 15,1 7,5 3,8 9,4 5,7

32,1 49,1 58,5 73,6 81,1 84,9 94,3 100

Total 53 - 1 - 100 -

Page 31: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

30

1.2. Gráfico de tallo y hojas Días a la semana de práctica deportiva

Nº Veces 0 1 2 3 4 5 6 7

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

Tallo = 1; Hoja = 1

1.3. Gráfico de segmentos 1.4. Cálculos

1.4.1. ¿Qué % de la muestra practica deporte al menos 3 veces a la semana? Al menos 3 significa 3, 4, 5, 6 o 7. Estas frecuencias suman 22. Entonces:

== 1005322·% 41,5%

R: El 41,5% de la muestra practica deporte al menos 3 veces a la semana 1.4.2. ¿Qué % de la muestra practica deporte a lo más 2 veces a la semana? A lo más 2 significa 0, 1 o 2. Estas frecuencias suman 31. Entonces:

== 1005331·% 58,5%

R: El 58,5% de la muestra practica deporte a lo más 2 veces a la semana. 1.4.3. ¿Qué % de la muestra no practica deporte en la semana? Estos corresponden a x = 0. Es decir, 17.

== 1005317·% 32,1%

R: El 32,1% de la muestra no practica deporte en la semana 1.4.4. ¿Qué % de la muestra practica deporte más de 5 veces a la semana?

Más de 5 veces es 6 o 7. Las frecuencias suman 8.

== 100538 ·% 15,1%

R: El 15,1% de la muestra practica deporte más de 5 veces a la semana.

0 1 2 3 4 5 6 7

35 30 25 20 25 20 15 10 5 0

%

Personas según días a la semana de práctica deportiva

Page 32: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

31

IV. EJERCICIOS Y PROBLEMAS PROPUESTOS 1. Número de empleos El siguiente gráfico muestra el resultado de una pequeña encuesta realizada con trabajadores del sector comercio. 1.1. La variable estudiada es: A) La duración de los empleos en los últimos dos años B) El tipo de empleo en los últimos dos años C) Personas que ha tenido empleo en los últimos dos años D) El número de empleos en los últimos dos años E) Las veces que una persona ha trabajado 1.2. La variable estudiada en este caso es de tipo: A) Dicotómica B) Multinomial C) Ordinal D) Discreta E) Continua 1.3. El tamaño de la muestra alcanza a: A) 125 B) 60 C) 15 D) 12 E) 5 1.4. ¿Cuántas personas de la muestra han tenido más de 3 empleos en los últimos 2 años? A) 35 B) 20 C) 15 D) 12 E) 10 1.5. ¿Qué % de la muestra ha tenido solo 1 empleo en los últimos 2 años? A) 60% B) 48% C) 36% D) 12,5% E) 8,3% 1.6. ¿Qué % de la muestra ha tenido 2 ó 3 empleos en los últimos 2 años? A) 40% B) 30% C) 20% D) 24% E) 16% 1.7. Entre los que han tenido más de un empleo en los últimos dos años, ¿qué % ha tenido más de tres? A) 52% B) 12% C) 23,1% D) 15,2% E) 17,6% 1.8. De las afirmaciones siguientes:

I: El 48% de la muestra ha tenido los mejores empleos en los últimos dos años.. II: El 24% de la muestra ha durado un año en su empleo en los últimos dos años. III: El 4% de la muestra ha tenido 5 empleos en los últimos dos años.

1 2 3 4 5¿CUÁNTOS EMPLEOS HA TENIDO EN LOS

ÚLTIMOS 2 AÑOS?

60 55 50 45 40 35 30 25 20 15 10 5 0

empleos

Page 33: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

32

¿Cuál (es) es (son) verificable)s) en el gráfico dado? A) Ninguna B) Solo III C) Solo I y II D) Solo I y III E) Solo II y III 2. Números de televisores por hogar Se investiga el número de televisores por hogar en una muestra de hogares de la Región Metropolitana, encontrando la siguiente tabla:

Nº casos % 0 1 2 3 4

3 18 13 7 2

7,0 41,9 30,2 16,3 4,7

Total 43 100

2.1. De las afirmaciones siguientes: I: El 93% de los hogares investigados tiene al menos un televisor II: El 4,7% de los hogares tiene dos televisores III: El 72,1% de los hogares tiene uno o dos televisores Es (son) correcta(s): A) Solo I B) Solo I y II C) Solo I y III D) Solo II y III E) I, II y III 2.2. De las siguientes afirmaciones, ¿cuál es falsa? A) El 20,9% de la muestra tiene tres o cuatro televisores B) El 48,9% de la muestra tiene a lo más un televisor C) El 20,9% de la muestra tiene al menos tres televisores D) El 46,5% de la muestra tiene dos o tres televisores E) El 41,9% de la muestra tiene al menos un televisor Solución a problemas propuestos 1.1. D 1.2. D 1.3. A 1.4. C 1.5. B 1.6. A 1.7. C 1.8. B 2.1. E 2.2. E V. RECURSOS COMPLEMENTARIOS 1. Se sugiere complementar el estudio, visitando la página: http://www.uaq.mx/matematicas/estadisticas/xstad02.html Curso de estadística muy bien explicado y desarrollado con ejemplos. Se recomienda para este nivel la Unidad Nº3 “Estadística Descriptiva”. 2. Lectura de informes estadísticos de investigación social en: CENTRO DE ESTUDIOS PÚBLICOS CEP http://www.cepchile.cl/ Ver: Encuesta CEP

Page 34: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

33

PRIMERA UNIDAD: PRESENTACIÓN DE DATOS CLASE 4

ESTADÍSTICAS DE VARIABLE CONTINUA

«Si es preciso sucumbir, enfrentémonos antes con el azar». (Tácito).

APRENDIZAJES ESPERADOS CONTENIDOS -Construyen tablas de frecuencia y gráficos para variable numérica continua y los interpretan.

-Tablas de frecuencia para variables continuas. -Gráficos para variables continuas. -Interpretación de tablas y gráficos.

II. DESARROLLO 1. Intervalos reales La variable continua es numérica y tiene infinitos valores reales entre su valor mínimo y máximo. Por este motivo, para tabularla debe ser dividida en intervalos. Un intervalo tiene los siguientes componentes:

• LR inf = Límite Real inferior • LR sup = Límite Real superior • c = amplitud del intervalo.

Además:

c = LR sup – LR inf Importante:

Los intervalos son abiertos a la derecha. Esto significa que el intervalo excluye el valor de intervalo superior. 2. Tabulación de la variable continua

2.1. Tabla básica: Una tabla de variable continua requiere de las siguientes columnas iniciales:

LR Xm fi

infLR supLR

C

Page 35: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

34

En la tabla: • LR: Límites reales. Estos son los intervalos propiamente tales. • Xm: marca de clase de cada intervalo. Es el punto medio de cada intervalo.

• 2

LRLRXm infsup+= . Este valor es muy importante para algunos procedimientos estadísticos.

• if : frecuencia absoluta de cada intervalo. La tabla puede llevar, además, todas las frecuencias que se requieran, especialmente %.

2.2. Criterios generales para fijar el número de intervalos de una tabla (m) • Muchos intervalos: se desagregan mucho las observaciones y no contribuyen a configurar un patrón perceptible. • Pocos intervalos: agrupan mucho las observaciones y no se logra configurar un patrón. • Dependiendo de la cantidad de observaciones y objetivos del estudio, una tabla debe tener entre 5 y 12

intervalos. • Fórmula para el cálculo aproximado del número de intervalos se puede usar la siguiente fórmula:

m = [ ]n331 log,+ Nota: se toma como número de intervalos la parte entera del número resultante. Ver problema resuelto Nº1.

2.3. Amplitud de intervalos: Llamando: Rg(x) = rango de la variable (Diferencia entre el mayor y menor valor)

Rg(x) = mínmáx xx − m = número de intervalos de la tabla. c = amplitud de los intervalos Se establece la siguiente relación entre ellos:

m

xRgc )(=

Esto significa que, teniendo el rango de la variable y el número de intervalos, se puede calcular la amplitud de cada intervalo. Este valor c se debe calcular y luego aproximar a un número cómodo de manejar e interpretar. Recordar que la estadística pretende esclarecer los hechos que se ven azarosos. Ver problema resuelto Nº1.

3. Gráficos de variable continua

3.1. Histograma: Eje X: se ubica en el eje X los límites reales de cada intervalo. Eje Y: se ubica la frecuencia absoluta o la porcentuada. Menos frecuente es representar la frecuencia relativa. La representación consiste en rectángulos adyacentes que nacen del eje x, con una altura proporcional a la frecuencia observada, sea esta absoluta, porcentuada o relativa.

Page 36: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

35

Precauciones y recomendaciones:

• Escalas: tanto la escala del eje x como la del eje y deben estar correctamente trazadas y enumeradas según situación.

• Rótulos: ambos ejes deben llevar claramente escritas las unidades que están representando. • Título o rótulo del gráfico: todo gráfico debe llevar un título o rótulo que exprese con claridad qué es lo que está

mostrando. Sin el rótulo no puede haber una interpretación del gráfico. • Fuente: si es posible, un gráfico debe llevar la fuente de los datos o su origen.

Ejemplo de histograma:

Propiedad: El área total del histograma representa a toda la muestra. Por lo tanto, es igual a 100%, a n o a 1, si se ha representado en el eje y las frecuencias porcentuadas, las absolutas o las relativas, respectivamente. 3.2. Polígono de frecuencias

Eje X: se ubica en el eje X las marcas de clase de cada intervalo. Eje Y: se ubica la frecuencia absoluta o la porcentuada. Menos frecuente es representar la frecuencia relativa. La representación consiste en un polígono cuyos vértices son los puntos trazados a una altura proporcional a la frecuencia observada, sea esta absoluta, porcentuada o relativa.

Precauciones y recomendaciones: • Eje X: se debe agregar una marca de clase anterior a la menor y una después de la mayor. • Cierre: para cerrar el polígono, se toman las marcas de clase agregadas con frecuencia cero. • Escalas: tanto la escala del eje x como la del eje y deben estar correctamente trazadas y enumeradas según

caso. • Rótulos: ambos ejes deben llevar claramente escritas las unidades que están representando. • Título del gráfico: todo gráfico debe llevar un título o rótulo que exprese con claridad qué es lo que está

mostrando. • Fuente: si es posible, un gráfico debe llevar la fuente de los datos o su origen.

4 6 8 10 12 14

22201816141210

86420

Tiempo de espera en la fila de un banco (min). Fuente: ALKA-Stat-2010

min

Page 37: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

36

Ejemplo de polígono de frecuencias: Propiedad: El área total del polígono es igual a 100%, a “n” o a 1, según se ha representado en el eje y las frecuencias porcentuadas, las absolutas o las relativas, respectivamente.

3.3. Gráfico de tallo y hojas En algunos casos es posible traza un gráfico de tallo y hojas.

Peso de archivos digitales (Kb) Kb casos 3. 2235 4 4. 0367899 7 5. 113556777889 12 6. 1223334556666777 16 7. 445567778 9 8. 135 3 Ancho tallo: 10 Cada hoja: 1 caso

El ancho del tallo = 10 indica que sus valores son decenas, es decir, 30, 40, etc. El dígito correspondiente a las unidades sale de las hojas. De este modo, el valor menor observado es 32 Kb y el mayor 85 Kb.

III. EJERCICIOS Y PROBLEMAS RESUELTOS 1. Talla y peso de estudiantes Se ha medido la talla y peso de los 863 estudiantes de una escuela básica. 1.1. ¿Cuántos intervalos puede tener la tabla de frecuencias? 1.2. Si el valor mínimo y máximo de la variable son 20 y 57 Kg, ¿cuál será la amplitud adecuada de los intervalos? Solución: 1.1. Aplicando la fórmula m = [ ]n331 log,+ m = 1 + 3,3 · log 863 = 10,7. m = 10

3 5 7 9 11 13 15

22201816141210

86420

Tiempo de espera en la fila de un banco (min). Fuente: ALKA-Stat-2010

min

Page 38: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

37

R: Se requiere una tabla con 10 intervalos 1.2. Se tiene que Rg(x) = 57 – 20 = 37 Kg. Además, m = 10. Entonces: c = 37/10 = 3,7. Se redondea a 4, que es un número más cómodo para la amplitud que el 3,7. R: La amplitud de los intervalos debe ser 4. 2. Peso de estudiantes El peso de 863 estudiantes de educación básica se muestra en la siguiente tabla:

Peso (Kg) Xm fi Fi %fi %Fi 20 – 24 113 24 – 28 22,6 28 – 35 65,1 35 – 50 193 50 – 60

2.1. Complete la tabla de frecuencias. 2.2. A partir de la tabla, indique:

2.2.1. ¿Qué % de escolares pesan, a lo menos 35 Kg? 2.2.2. ¿Qué % de escolares pesan entre 28 y 50 Kg? 2.2.3. ¿Qué % de escolares pesan menos de 28 Kg?

Solución: 2.1. Tabla de frecuencias:

Peso (Kg) Xm fi Fi %fi %Fi 20 – 24 22 113 113 13,1 13,1 24 – 28 26 195 308 22,6 35,7 28 – 35 31,5 254 562 29,4 65,1 35 – 50 42,5 193 755 22,4 87,5 50 – 60 55 108 863 12,5 100 Σ - 863 100

2.2. 2.2.1. Son 301, de un total de 863.

En %: P = 100863301

· = 34,9%

O bien, sumando 22,4% + 12,5% = 34,9% R: El 34,9% de los escolares pesan, a lo menos, 35 Kg. 2.2.2. Entre 28 y 50 Kg hay 29,4% + 22,4% = 51,8%. R: El 51,8% de los escolares pesan entre 28 y 50 Kg.

Page 39: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

38

2.2.3. Menos de 28 Kg son: 13,1% + 22,6% = 35,7% (que también está en la acumulada %Fi) R: El 35,7% de los escolares pesan menos de 28 Kg. 3. Talla de estudiantes La talla de 863 estudiantes de educación básica se muestra en la siguiente tabla:

Talla (cm) Xm fi Fi %fi %Fi 90 – 100 96 11,1 100 – 110 183 21,2 110 – 120 235 27,2 120 – 130 201 23,3 130 – 140 111 12,9 140 – 150 37 4,3

3.1. Grafique mediante histograma. 3.2. Grafique mediante polígono de frecuencias %. 3.3. A partir de los datos dados, determine:

3.3.1. ¿Qué % de los escolares mide menos de un metro? 3.3.2. ¿Qué % de los escolares tienen una talla de 120 o más cm? 3.3.3. ¿Qué % de los estudiantes mide a lo menos 1,3 m?

Solución: Previamente se calcula la tabla de frecuencias, con las columnas que se requieren:

Talla (cm) Xm fi %fi 90 – 100 95 96 11,1 100 – 110 105 183 21,2 110 – 120 115 235 27,2 120 – 130 125 201 23,3 130 – 140 135 111 12,9 140 – 150 145 37 4,3

Σ - 863 100 3.1. Histograma: Tomando los límites reales para el eje horizontal y los % para el vertical.

90 100 110 120 130 140 150

302826242220181614121086420

Talla de 863 estudiantes de educación básica (cm)

cm

%

Page 40: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

39

3.2. Polígono de frecuencias: Tomando las marcas de clase para el eje horizontal y los % para el vertical. Se debe recordar que se agrega una marca de clase antes de la menor. En este caso se agregó el 85. Además se agregó el 155 como marca de clase que va después de la mayor. Además, ambas marcas de clase llevan frecuencia cero, cerrándose así el polígono. 3.3. 3.3.1. Según tabla, hay 96 escolares que miden menos de 1 m. Llevando a %:

P = =10086396 · 11,1%

R: El 11,1% de los escolares mide menos de un metro. 3.3.1. Según tabla, hay 201 + 111 + 37 = 349 estudiantes que miden 120 cm o más. Llevando a %:

P = =100863349· 40,4%

R: El 40,4% de los escolares tienen una talla de 120cm. o más. 3.3.1. Según tabla, hay 111 + 37 = 148 estudiantes que miden al menos 130 cm. Llevando a %:

P = =100863148· 17,1%

R: El 17,1%% de los estudiantes mide a lo menos 1,3 m.

85 95 105 115 125 135 145 155

302826242220181614121086420 cm

Talla de 863 estudiantes de educación básica (cm)

%

Page 41: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

40

IV. EJERCICIOS Y PROBLEMAS PROPUESTOS 1. Compresión de archivos Se registra el % de compresión que experimenta una muestra de archivos digitales:

Compresión de archivos (%) %

5. 4 4 5 7 9 9 6. 0 1 3 3 5 8 8 8 7. 2 3 5 5 5 9 9 9 9 8. 0 2 2 3 5

Ancho tallo: 10 Cada hoja: 1 caso

1.1. ¿Cuántos archivos fueron comprimidos? A) 26 B) 27 C) 28 D) 30 E) 32 1.2. La mayor compresión fue de: A) 85% B) 82% C) 80% D) 78% E) 8% 1.3. ¿Qué % de los archivos tuvieron una compresión mayor al 60%? A) 0% B) 10% C) 25% D) 65% E) 75% 2. Velocidad de transferencia Se mide la velocidad de transferencia de archivos con una muestra de 50 servidores, encontrando la tabla adjunta

Vel (Kbps) Xm fi %fi Fi %Fi 30 – 50 5 50 – 100 18,0 100 – 150 70,0 150 – 250 43 250 – 400

Σ - Complete la tabla y responda: 2.1. La marca de clase del intervalo de mayor frecuencia es igual a: A) 150 B) 125 C) 100 D) 50 E) 21 2.2. El valor numérico de 4F es igual a: A) 8 B) 16 C) 43 D) 86 E) 200 2.3. ¿Qué % de los servidores transfería a 150 o más Kbps? A) 8% B) 10% C) 15% D) 30% E) 43% 2.4. ¿Qué % de la muestra transfería a menos de 150 Kbps, pero no menos de 50 Kbps? A) 10% B) 18% C) 42% D) 52% E) 60%

Page 42: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

41

3. Biometría de machas Se investiga la biometría de las machas de cierta playa, con el fin de determinar la población en condiciones de explotar. Con los datos reunidos con una muestra de 2.458 machas seleccionadas al azar, se construyó el siguiente gráfico de la talla (longitud mayor de la concha, en cm): De acuerdo al gráfico: 3.1. El rango de la talla es igual a: A) 10 mm. B) 30 mm. C) 40 mm. D) 50 mm. E) 80 mm. 3.2. ¿Cuántas machas de la muestra midieron, a lo más, 40 mm? A) 100 B) 246 C) 367 D) 737 E) 983 3.3. ¿Qué porcentaje de la muestra midió más de 60 mm. de talla? A) 45% B) 25% B) 20% C) 15% D) 10% Solución a problemas propuestos 1.1. C 1.2. A 1.3. E 2.1. B 2.2. C 2.3. D 2.4. E 3.1. D 3.2. B 3.3. A V. RECURSOS COMPLEMENTARIOS 1. Ver organización y graficación de datos. http://www.uaq.mx/matematicas/estadisticas/xstad02.html Unidad 3. Estadística Descriptiva Organización y representación tabular y gráfica de los datos, sean agrupados o no. 2. Ver organización y graficación de datos. http://www.bioestadistica.freeservers.com/temas.html Tema 3. Presentación de datos: Informes de laboratorio. Informes estadísticos. Métodos: textual, tabular, gráfico y mixtos. Gráficos: circular, de barras, Pictogramas, cronológicos, diagrama de saldos. Histogramas. Polígono de frecuencias acumuladas. Pirámides de población. Ejemplos.

Page 43: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

42

PRIMERA UNIDAD: PRESENTACIÓN DE DATOS CLASE 5

ORGANIZACIÓN DE DATOS

«El momento elegido por el azar vale siempre más que el momento elegido por nosotros mismos». (Proverbio chino).

APRENDIZAJES ESPERADOS CONTENIDOS -Organizan datos cuantitativos provenientes del ámbito social, económico, comercial o financiero, en tablas, grafican e interpretan la información según contexto.

-Tablas de frecuencia para variables continuas. -Gráficos para variables continuas. -Interpretación de tablas y gráficos.

II. DESARROLLO 1. Esquema general de la organización de datos Para la organización de datos de una sola variable es importante establecer un esquema como el siguiente: 2. Desarrollo

1º: Identificar tipos de datos: Es importante primero que todo, determinar el tipo de datos de que se trata, ya que lo que se puede o no se puede hacer depende de esto. Tipos de datos:

• Cualitativos nominales (dicotómicos – multinomiales) • Cualitativos ordinales • Numéricos discretos • Numéricos continuos

TIPO DE DATOS

TABLAS GRÁFICOS ANÁLISIS

CONCLUSIONES

DATOS (Observaciones) empíricas)

Page 44: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

43

2º: Determinar tablas • Datos cualitativos: tablas simples, con casos y frecuencia porcentuada • Datos numéricos discretos: tablas con frecuencias absolutas, relativas, porcentuales y acumuladas • Datos numéricos continuos: Tablas en intervalos, frecuencias absolutas, relativas, porcentuales y

acumuladas.

3º: Determinar gráficos • Datos cualitativos: gráfico de barras, gráfico circular, pictograma. • Datos numéricos discretos: Gráfico de segmentos, gráfico de tallo y hojas. • Datos numéricos continuos; Histograma, polígono de frecuencias, gráfico de tallo y hojas.

4º: Análisis de datos

• Casos anómalos: en % o número de casos. • Concentración de casos: en % o número de casos. • Relaciones entre resultados y entre estos e información complementaria. • Comparaciones entre resultados y entre estos e información complementaria.

5º: Conclusiones • Afirmaciones demostrables. • Síntesis de resultados. • Relaciones entre resultados. • Posibles patrones.

III. EJERCICIOS Y PROBLEMAS RESUELTOS Caso: Ingreso familiar per cápita Con el objeto caracterizar a 35 familias según variables socioeconómicas, se encarga a la empresa Alka-Stat un estudio, que fue realizado en febrero de 2010. Una de las variables estudiadas es el Ingreso Per cápita por familia, encontrándose los siguientes datos, expresados en $miles.

26,1 26,8 27,3 28,8 30,0 32,7 33,6 35,1 35,6 37,3

38,5 38,6 39,1 39,9 40,0 41,3 42,2 42,8 43,2 43,8

44,6 44,8 44,8 44,8 45,2 45,3 46,6 47,1 47,5 48,7

51,0 51,6 52,2 53,3 54,7 Se pide: realizar una estadística que caracterice la muestra en relación a su ingreso. Solución: 1. Tipo de variable: La variable es numérica continua. .2. Construcción de la tabla de frecuencias: 2.1. Cálculo del número de intervalos (m)

Número de intervalos: m = 1 + 3,3, log (35) = 6,1. Entonces, m = 6 intervalos.

Page 45: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

44

2.2. Cálculo de la amplitud de los intervalos (c)

Rango de la variable: Rg(x) = 54,7 – 26,1 = 28,6 Amplitud de los intervalos: c = 28,6/6 = 4,77 ≈ 5

2.3. Organización de los intervalos en la tabla Se harán dos ajustes:

1: Se redondea la amplitud a 5. 2: Se baja el límite real inferior a 25.

De este modo, los intervalos tienen límites 25, 30, 35, etc. Estos números son muy cómodos de manejar y de interpretar. Nota: Estos ajustes suelen hacerse con el objeto de cumplir con los fines de la Estadística, que es, presentar la información en forma simple y comprensible. La Estadística no dicta ni se somete a reglas fijas, sino a criterios generales que el operador debe manejar en forma inteligente. 2.4. Tabulación de datos Tabulación: para este efecto, se cuentan para el primer intervalo todos los valores que están entre 25 y 29,9, ya que el 30 pertenece al intervalo siguiente. Entonces, la frecuencia del primer intervalo es 4. Y así, sucesivamente, queda la tabla:

$miles casos 25 - 30 30 - 35 35 - 40 40 - 45 45 - 50 50 - 55

4 3 7

10 6 5

Total 35 2.5. Cálculo de frecuencias En este caso, se calcularán solo las que se especifican, pudiendo agregarse las relativas. Ingreso per cápita mensual en 35 familias ($miles).

$miles casos % F acum % acum 25 - 30 4 11,4 4 11,4 30 - 35 3 8,6 7 20,0 35 - 40 7 20,0 14 40,0 40 - 45 10 28,6 24 68,6 45 - 50 6 17,1 30 85,7 50 - 55 5 14,3 35 100 Total 35 100 - -

3. Construcción del histograma: 3.1. Construcción de ejes Eje X: se toman los límites reales, desde 25 a 55. Se expresan las unidades en M$. Eje Y: Se hará con frecuencias absolutas. Por lo tanto, se construye una escala de 0 a 10, creciendo de 1 en 1. Se rotula en número de casos.

Page 46: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

45

3.2. Trazado del gráfico Para el primer intervalo la frecuencia es 4. Se levanta un rectángulo hasta Y = 4. Para el segundo intervalo la frecuencia es 3. Se levanta un rectángulo hasta Y = 3. Y así sucesivamente. 3.3. Rotulación del gráfico

Eje X: Se expresan las unidades en M$. Eje Y: Se rotula en número de casos. Gráfico: Ingreso per cápita mensual de 35 familias (M$). Fuente: Fuente: ALKA-Stat-2010.

3.4. Gráfico 4. Análisis e interpretación

• El ingreso per cápita de las familias fluctúa entre $25 mil y $55 mil al mes. • El 20% de las familias tienen un ingreso per cápita de $35 mil o menos. Este segmento constituye un grupo de familias

con los menores ingresos per cápita. • Existen 4 familias, las que constituyen un 11,4% del total, con un ingreso per cápita inferior a $30 mil al mes. Este

ingreso no alcanza a 2 dólares por persona3, por lo que este segmento quedaría catalogado como “bajo el límite de la pobreza”.

• El 28,6% de las familias tienen un ingreso per cápita que fluctúa entre $40 mil y $45 mil al mes, siendo este el ingreso con mayor frecuencia en la muestra estudiada.

• El 14,3% de las familias tiene un ingreso sobre los $50 mil al mes, siendo este segmento el de mayor ingreso. 5. Conclusiones

• El ingreso per cápita de las familias fluctúa entre $25 mil y $55 mil al mes. • De acuerdo a los criterios de la UNESCO, el 11,4% de las familias viven bajo la línea de pobreza, ya que su ingreso

per cápita no alcanza a los 2 dólares diarios. • El 14,3% de las familias tiene un ingreso sobre los $50 mil al mes, siendo este segmento el de mayor ingreso.

3 Considerando 1 dólar = $540 (16 de febrero de 2010).

M$

25 30 35 40 45 50 55 Ingreso per cápita mensual de 35 familias (M$). Fuente: ALKA-Stat-2010

543210

109876

Page 47: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

46

IV. EJERCICIOS Y PROBLEMAS PROPUESTOS 1. Velocidad en autopista Se realiza una recolección de 336 datos producto de la medición de la velocidad de vehículos en una autopista urbana. Se observó una velocidad mínima de 63 Km/hr y una máxima de 148 Km/hr. A partir de esta información se desea tabular los datos. 1.1. La variable en estudio es de tipo: A) Continua B) discreta C) ordinal D) multinomial E) multinomial 1.2. El rango de la variable es igual a: A) 63 Km/hr. B) 85 Km/hr. C) 148 Km/hr. D) 105,5 Km/hr. E) 336 Km/hr. 1.3. El número óptimo de intervalos para tabular los datos es: A) 6 B) 7 C) 8 D) 9 E) 10 1.4. La amplitud de intervalo más conveniente para tabular en el número óptimo de intervalos es: A) 8 B) 8,5 C) 9 D) 8,5 E) 10 1.5. El límite inferior del primer intervalo es conveniente que sea: A) 10 B) 50 C) 60 D) 62 E) 53 2. Tiempo de estacionamiento Se mide el tiempo que emplea una muestra de conductores en una maniobra de estacionar un vehículo. Los tiempos, que fueron medidos en segundos con un cronómetro, son los siguientes:

10 11 8 11 12 10 10 9 11 10

11 9 12 8 11 10 10 9 10 11

10 9 10 11 8 11 10 12 10 10

11 12 9 9 10 11 13 11 10 12

10 11 11 9 12 10

2.1. La variable en estudio es de tipo: A) Continua B) discreta C) ordinal D) multinomial E) multinomial 2.2. El rango de la variable es igual a: A) 21 B) 13 C) 8 D) 6 E) 5 2.3. Para tabular la variable, ¿cuál de las siguientes es la que cumple mejor los requisitos técnicos?

A) B) C) D) E) 8 - 9

9 - 10 10 - 11 11 - 12 12 - 13

8 - 9 9 - 10 10 - 11 11 - 12 12 - 13 13 - 14

7 - 8 8 - 9

9 - 10 10 - 11 11 - 12 12 - 13

6 - 8 8 - 9

9 - 10 10 - 11 11 - 12 12 - 13

8 - 10 10 - 12 12 - 14

Page 48: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

47

2.4. De los siguientes gráficos:

I: Tallo y hojas II: Histograma III: Polígono de frecuencias Se prestan para representar a variable en estudio: A) Solo II B) Solo I y II C) Solo II y III D) Solo I y III E) I, II y III 2.5. El análisis de los datos permite afirmar que: A) El 6,5% de la muestra de conductores emplea más de 8 segundos en estacionar. B) El 15% de los conductores se demora mucho, ya que emplea más de 12 segundos. C) El 63% de la muestra emplea 10 o más segundos en la maniobra, pero menos de 12. D) La maniobra es fácil, ya que todos emplearon, cuando más, 13 segundos en completarla. E) Más de la mitad de los conductores emplean, cuando menos, 11 segundos en la maniobra. Solución a problemas propuestos 1.1. A 1.2. B 1.3. D 1.4. E 1.5. C 2.1. A 2.2. E 2.3. B 2.4. E 2.5. C V. RECURSOS COMPLEMENTARIOS 1. Ver organización y graficación de datos. http://www.uaq.mx/matematicas/estadisticas/xstad02.html Unidad 3. Estadística Descriptiva Organización y representación tabular y gráfica de los datos, sean agrupados o no. 2. Ver organización y graficación de datos. http://www.bioestadistica.freeservers.com/temas.html Tema 3. Presentación de datos: Informes de laboratorio. Informes estadísticos. Métodos: textual, tabular, gráfico y mixtos. Gráficos: circular, de barras, Pictogramas, cronológicos, diagrama de saldos. Histogramas. Polígono de frecuencias acumuladas.

Page 49: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

48

SEGUNDA UNIDAD: ESTADÍSTICOS BÁSICOS CLASE 6

LA MEDIA ARITMÉTICA

«Los dioses nos dan muchas sorpresas: lo esperado no se cumple y para lo inesperado un dios abre la puerta».

(Eurípides).

APRENDIZAJES ESPERADOS CONTENIDOS -Explican el concepto de estadígrafo y su valor en la caracterización de series de datos. -Calculan e interpretan media aritmética con datos no agrupados y datos agrupados, con uso de la función estadística de la calculadora.

-Concepto de estadígrafo y su valor en la caracterización de series de datos. -Cálculo de la media aritmética con datos no agrupados y datos agrupados, con uso de calculadora.

II. DESARROLLO 1. Concepto de estadígrafo Un estadígrafo o estadístico, es un número real o valor de la variable que, calculado sobre la base de los datos observados, sirve para caracterizar la muestra que originó los datos. Ejemplos: el promedio común y corriente, un tanto por ciento, el rango, el IPC, etc. Todos ellos responden a la idea general de estadígrafo.

• Son valores de la variable o un número real • Se calculan con los datos observados • Caracterizan la muestra en estudio

Existen muchos tipos de estadígrafos, siendo, sin embargo, usual comenzar el estudio de los siguientes:

1.1. Estadígrafos de tendencia central: se refieren a la media aritmética, a la mediana y a la moda. Todos ellos muestran, de distintas perspectivas, el valor en torno al cual se agrupan mayoritariamente los valores observados. 1.2. Estadígrafos de dispersión: estos estadígrafos cuantifican la variabilidad o dispersión de los datos. Son ejemplos de estos estadígrafos, el rango, la varianza, la desviación estándar y el coeficiente de variación.

2. La media aritmética: Por definición, la media aritmética es igual a la suma de todos los valores observados, dividida por el número de datos.

Definición: nxx iΣ

=

La sola definición indica que la media aritmética es calculable solo en distribuciones de variable numérica, puesto que los valores se deben poder sumar y dividir. 3. Cálculo de la media en datos no agrupados

3.1. Concepto Cuando los datos observados no están agrupados, el cálculo de la media es sencillo. Solo basta sumarlos y dividirlos por la cantidad de datos. La media aritmética (o media, simplemente), se simboliza mediante x .

Page 50: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

49

Ejemplo: Sea X la variable numérica: Edad de 5 personas:

X = 23, 21, 11, 8, 34 años

5

348112123x ++++= = 19,4 años

Se verifica que la media conserva las unidades en que está expresada la variable, en este caso, años.

3.2. En la calculadora: Para hacer el cálculo en la calculadora científica, se siguen los siguientes pasos, tomando como referencia una calculadora Casio fx-350. 1º: Ya encendida la calculadora, se pone en el modo estadístico, mediante: MODO 2 (SD) Se activan las funciones estadísticas, señaladas en la calculadora con color AZUL. 2º: Como precaución, siempre que se ingresan datos nuevos, se deben limpiar las memorias estadísticas. Esto es: SHIFT CLR 1 (Cls) =

(Ahora se puede limpiar la pantalla mediante AC, aunque no es necesario) 3º: Se ingresan, uno a uno, los datos: 23 DT (La tecla DT está, generalmente, en azul, en M+) Al presionar DT aparece en pantalla n = 1, que indica el número de datos ya ingresados. Sigue el ingreso de datos, no siendo necesario borrar nada entre un ingreso y otro. 21 DT 11 DT 8 DT 34 DT Ya están ingresados todos los datos. En la pantalla aparece n = 5. Estos datos permanecerán en la calculadora hasta que se limpien las memorias. 4º: Se recuperan, de los estadísticos que entrega la calculadora, los que interesen:

• Con SHIFT S-SUM se tiene acceso a los estadísticos siguientes:

Si se presiona 3 =, aparece el tamaño de la muestra. Si se presiona 2 =, aparece la suma de todos los valores ingresados. Si se presiona 1 =, aparece la suma de los cuadrados de todos los valores ingresados.

2xΣ xΣ n 1 2 3

Page 51: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

50

• Con SHIFT S-VAR se tiene acceso a los siguientes estadísticos:

Si se presiona 1 = aparece la media aritmética.

Entonces: SHIFT S-VAR 1 = Los estadísticos con el número 2 y 3, corresponden a la desviación estándar, de los cuales nos ocuparemos más adelante. 4. Cálculo de la media en datos agrupados como variable discreta

4.1. Situación: La situación es la siguiente: Si 1x , 2x , 3x , …, mx son los valores de la variable, y 1f , 2f , 3f , …, mf sus respectivas frecuencias absolutas, entonces, la media aritmética es igual a:

i

iif

fxxΣΣ

= m

mmfff

fxfxfx++++++

...·...··

21

2211 = n

fxfxfx mm·...·· +++ 2211

Ejemplo: Calcular la media aritmética en la siguiente distribución de frecuencias:

X f 7 18 8 21 9 13

4.2. Operación en la calculadora: 1º: Preparación de la calculadora: MODO 2 (modo estadístico) SHIFT CLR 1 = (limpia memorias estadísticas) 2º: Ingreso de datos: 7 SHIFT ; 18 DT

Entre el 7 y el 18 va punto y coma. Se deben ingresar las cifras en el orden especificado.

Después de presionar DT aparece en pantalla: n = 18, que indica la cantidad de datos ingresados.

x nxσ 1−σnx

1 2 3

x 19,4

Page 52: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

51

Sigue el ingreso de datos: 8 SHIFT ; 21 DT Aparece en pantalla: n = 39, que indica los datos ya ingresados (18 + 21) Sigue el ingreso de datos: 9 SHIFT ; 13 DT Aparece en pantalla: n = 52. Ya están ingresados todos los datos. 3º: Se recuperan los estadísticos que interesen, en este caso, la media: SHIFT S-VAR 1 = Entonces, la media aritmética es =x 7,9

5. Cálculo de la media en datos agrupados como variable continua:

5.1. La situación es la siguiente: Si 1mx , 2mx , 3mx , …, mix son las marcas de clase de la variable, y 1f , 2f , 3f , …, mf sus respectivas frecuencias absolutas, entonces, la media aritmética es igual a:

i

imif

fxxΣ

Σ=

·=

m

mimimmfff

fxfxfx++++++

...·...··

21

2211 = n

fxfxfx mimimm ·...·· +++ 2211

Ejemplo: Calcular la media aritmética en la siguiente distribución de frecuencias:

X f 10 – 12 7 12 – 15 6 15 – 30 9

5.2. Operación en la calculadora: Se calcula primero la marca de clase de los intervalos. La tabla queda así:

X Xm f 10 – 12 11 7 12 – 15 13,5 6 15 – 30 22,5 9

1º: Preparación de la calculadora MODO 2 (modo estadístico) SHIFT CLR 1 = (limpia memorias estadísticas)

x 7,903846154

Page 53: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

52

2º: Ingreso de datos. Es similar al caso anterior. Se diferencia en que se ingresa la marca de clase: 11 SHIFT ; 7 DT 13.5 SHIFT ; 6 DT 22.5 SHIFT ; 9 DT 3º: Se recuperan los estadísticos que interesen. En este caso, la media aritmética. SHIFT S-VAR 1 = =x 16,38636364

III. EJERCICIOS Y PROBLEMAS RESUELTOS 1. Los siguientes son los tiempos que están dispuesto a esperar la descarga de un sitio Web, una muestra de personas. El tiempo de mide en segundos: Tiempo: 10 – 8 – 6 – 15 – 11 – 5 – 8 – 6 seg. Calcule el tiempo medio de disposición a esperar. Solución: =x 8,625 segundos

2. Accidentes laborales La siguiente tabla muestra el número de accidentes que ha tenido una muestra de trabajadores del rubro confección, en el curso del último año.

X f 1 35 2 11 3 2 4 5

2.1. ¿Qué % de los atendidos ha tenido más de un accidente? 2.2. ¿Cuál es el promedio de accidentes en la muestra? Solución: 2.1. Han tenido más de un accidente: 11 + 2 + 5 = 18, de un total de 53.

Llevando a %: =1005318· 33,96%.

R: El 33,96% de los atendidos ha tenido más de un accidente. 2.2. Llevando los datos a la calculadora: =x 1,57 accidentes.

Page 54: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

53

3. Ascensor En el primer piso de un edificio suben al ascensor cinco personas, con un peso promedio de 64 kilos. En el cuarto piso bajó una persona de 76 kilos. ¿Cuál es el peso promedio de las personas que siguen? Solución: Peso total de las 5 personas: 5 · 64 = 320 Kg. Peso total de las 4 personas que siguen: 320 – 76 = 244 Kg. Peso promedio de las 4 personas que siguen: 244/4 = 61 Kg. R: El peso promedio de las personas que siguen en el ascensor es 61 Kg. 4. Peso de recién nacidos La siguiente tabla muestra el peso de 137 recién nacidos en hospitales públicos de la Región Metropolitana.

Peso (Kg) casos 1,5 – 2,0 2,0 – 2,5 2,5 – 3,0 3,0 – 3,5 3,5 – 4,0 4,0 – 5,0 5,0 – 6,0

7 19 35 42 18 11 5

4.1. Calcule el peso promedio de los recién nacidos de la muestra. 4.2. Entre los que pesan 3 o más Kg al nacer, ¿cuál es el peso promedio? Solución: 4.1. En cada intervalo se calcula la marca de clase.

Peso (Kg) casos 1,75 7 2,25 19 2,75 35 3,25 42 3,75 18 4,5 11 5,5 5

Ingresando los valores a la calculadora, resulta: =x 3,155 Kg.

Page 55: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

54

4.2. Separando la tabla aquellos de 3 o más Kg:

Peso (Kg) casos 3,25 42 3,75 18 4,5 11 5,5 5

Ingresando los valores a la calculadora, resulta: =x 3,697 Kg. R: El peso promedio de los recién nacidos que 3 o más Kg al nacer es 3,697 Kg. IV. EJERCICIOS Y PROBLEMAS PROPUESTOS 1. Tiempo de operación En una industria de confecciones, se mide en una muestra de operarias el tiempo que emplean en cierta operación con la máquina recta.

Tiempo (seg) casos 10 – 12 3 12 – 14 9 14 – 16 17 16 – 18 11

1.1. ¿Qué % de las operarias emplea menos de 14 segundos en realizar la operación? A) 7,5% B) 12% C) 22,5% D) 30% E) 70% 1.2. ¿Qué % emplea, cuando menos, 16 segundos en realizar la operación? A) 27,5% B) 11% C) 42,5% D) 72,5% E) faltan datos 1.3. El tiempo medio de operación es igual a: A) 13,5 seg B) 14,0 seg C) 14,8 seg D) 10,0 seg E) 13,0 seg 2. Consumo diario de calorías Se mide el consumo diario de calorías de una muestra de estudiantes de educación media, encontrándose los datos de la tabla siguiente, en kilocalorías (Kcal):

Consumo diario (Kcal)

casos

0,5 – 1,0 5 1,0 – 1,5 13 1,5 – 2,0 8 2,0 – 2,5 4 2,5 – 3,5 2

Page 56: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

55

2.1. ¿Qué % de la muestra consume menos de 1.500 calorías al día? A) 56,3% B) 43,8% C) 40,6% D) 34,6% E) 15,6% 2.2. De los que consumen al menos mil calorías ¿qué % de la muestra consume 2 o más Kcal al día? A) 15,6% B) 18,8% C) 22,2% D) 77,8% E) 84,4% 2.3. El consumo medio de calorías al día es, en la muestra: A) 1.516 cal. B) 1.531 cal. C) 1.750 cal. D) 2 Kcal. E) 6,4 Kcal. 2.4. ¿Cuántas Kcal suman entre todos los sujetos de la muestra? A) 1,53 Kcal. B) 18 Kcal. C) 32 Kcal. D) 36,5 Kcal. E) 49 Kcal. 3. En un grupo de jóvenes, hay 3 que tienen 17 años, 4 que tienen 19, dos de 21 y uno de 24 años. ¿Cuál es la edad media del grupo? A) 8,1 años B) 20 años C) 18,5 años D) 19,3 años E) 20,25 años 4. Un grupo de 6 amigos y amigas tiene una edad promedio de 19,5 años. Si se agrega otro amigo al grupo, el promedio baja a 19 años. ¿Qué edad tiene el que llegó? A) 15 años B) 16 años C) 17 años D) 18 años E) 30 años 5. Se tienen 5 números enteros distintos, mayores que cero. El promedio entre ellos es 27,2. Si el promedio de los dos menores es 11, ¿cuál es el promedio de los tres mayores? A) 16 B) 16,2 C) 28 D) 32 E) 38 Solución a problemas propuestos 1.1. D 1.2. A 1.3. C 2.1. A 2.2. C 2.3. B 2.4. E 3. D 4. B 5. E V. RECURSOS COMPLEMENTARIOS 1. Concepto y cálculo de estadígrafos http://www.bioestadistica.freeservers.com/temas.html Tema 4. Estadígrafos: 2. Cálculo de estadígrafos: teoría y problemas http://ftp.medprev.uma.es/libro/html.htm 2. Medidas descriptivas 3. Ejercicios SECTOR MATEMÁTICA http://www.sectormatematica.cl/educmedia.htm Medida Posición Central

Page 57: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

56

SEGUNDA UNIDAD: ESTADÍSTICOS BÁSICOS CLASE 7 MEDIANA Y MODA: CÁLCULO E INTERPRETACIÓN

«Ningún dispositivo cerebral permite distinguir la alucinación de la percepción, el sueño de la vigilia, lo imaginario de lo real, lo subjetivo de lo objetivo».

(Morin).

APRENDIZAJES ESPERADOS CONTENIDOS -Calculan e interpretan la Mediana con datos no agrupados y datos agrupados, con uso de calculadora. -Calculan e interpretan la Moda. -Resuelven problemas aplicando las diferentes medidas de tendencia central.

-Cálculo e interpretación de la Mediana con datos agrupados y no agrupados. -Calculan e interpretan la Moda. -Problemas aplicando las diferentes medidas de tendencia central.

II. DESARROLLO 1. La mediana (Me)

1.1. Definición: Se denomina Mediana de una serie de datos, al valor de la variable que, una vez ordenadas las observaciones de menor a mayor, divide la distribución en dos segmentos tales que:

• A lo menos, el 50% de las observaciones son iguales o menores que la mediana • A lo menos, el 50% de las observaciones son iguales o mayores que la mediana.

2. Cálculo de la mediana con datos no agrupados

2.1. Tipos de datos Como la mediana exige ordenar los datos de menor a mayor (o viceversa), el cálculo de este estadígrafo requiere que la variable sea ordinal o numérica, no pudiéndose calcular en datos nominales. 2.2. Ubicación de la mediana

La mediana se ubica en el lugar dado por la relación: 2

1n + , siendo n el tamaño de la muestra.

mínx máxxMe

50% 50%x

Fig.: 7.1. Esquema de la mediana

Page 58: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

57

Por ejemplo:

Para n = 13, la mediana se ubica en el lugar: 2

113 + = 7. Es decir, en el 7º lugar.

Para n = 10, la mediana se ubica en el lugar: 2

110 + = 5,5. Es decir, entre el 5º y 6º lugar.

2.3. Determinación de la mediana en datos no agrupados Se requiere seguir los siguientes pasos: 1º: Ordenar los datos de menor a mayor, o viceversa.

2º: Encontrar la ubicación de la mediana, mediante: 2

1n +

3º: Determinar el valor que se encuentra en el lugar señalado.

2.3.1. Cuando n es impar: Cuando la muestra es impar, queda un solo valor en el centro de la distribución. La mediana es ese valor. Ejemplo: Los siguientes son el número de menores de edad por familia: 3, 2, 0, 0, 1, 2, 0. Calcular la mediana.

1º: Ordenando: 0, 0, 0, 1, 2, 2, 3. En este caso n = 7.

2º: Ubicación: 2

17 + = 4. Es la cuarta observación.

3º: El cuarto valor es 1. Por lo tanto, la mediana de la distribución es 1 menor. 2.3.2. Cuando n es par: Cuando la muestra es par, quedan dos valores en el centro de la distribución. La mediana es el promedio entre esos dos valores. Ejemplo: Los siguientes son el número de menores de edad por familia: 3, 2, 0, 0, 1, 2, 0, 4. Calcular la mediana.

1º: Ordenando: 0, 0, 0, 1, 2, 2, 3, 4. En este caso n = 8.

2º: Ubicación: 2

18 + = 4,5. La mediana está entre la 4ª y 5ª observación.

3º: La 4ª y 5ª observación son el 1 y el 2, respectivamente. El criterio es considerar la mediana como el promedio entre esos dos valores.

Entonces: Me = 2

21+ = 1,5 menores.

3. Cálculo de la mediana con datos en intervalos Para calcular la mediana en distribuciones de variable continua organizada en intervalos, se siguen los siguientes pasos:

1º: Acumular frecuencias en la tabla. Esto es, calcular iF .

2º: Calcular la fracción de n correspondiente al 50% de n. Es decir: n502n ,=

3º: Encontrar, en la tabla, el intervalo “j”. Este es el intervalo cuya frecuencia acumulada es la menor de todas las mayores a n/2.

Page 59: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

58

4º: Se aplica la fórmula siguiente:

j

1j21

jj fFn

cxMe)(

· −−+=

Siendo:

jx = límite real inferior del intervalo “j”.

jc = amplitud del intervalo “j”.

=n Tamaño de la muestra

1jF− = frecuencia acumulada del intervalo anterior al “j”.

jf = frecuencia absoluta del intervalo “j”.

4. La moda (Mo) 4.1. Concepto: En una serie de datos, la moda (Mo) es el valor de la variable que más se repite. El cálculo de la moda es sencillo en distribuciones de variable cualitativa y de variable discreta. Para el caso de la variable continua, hay textos que proponen algunas fórmulas, pero una buena aproximación está dada por la marca de clase del intervalo con mayor frecuencia. Con eso basta.4 Una distribución puede que no tenga moda, o que tenga más de una. 4.2. Cálculo de la moda: Determinación de la moda:

• Variable nominal: El valor con mayor frecuencia, si lo hubiera. • Variable ordinal: El valor con mayor frecuencia, si lo hubiera. • Variable discreta: El valor con mayor frecuencia, si lo hubiera. • Variable continua: La marca de clase del intervalo con mayor frecuencia.

III. EJERCICIOS Y PROBLEMAS RESUELTOS 1. Recién nacidos Calcule la moda, la mediana y la media en los siguientes datos, que corresponden al peso de 12 recién nacidos, en Kg. Peso; 2,340; 3,450; 4,560; 2,350; 1,860; 6,120;

3,570; 3,450; 4,250; 3,580; 2,560; 5,110. Solución: 1.1. Mo = 3,450Kg. El peso más frecuente de encontrar en la muestra es 3,450Kg. 1.2. Mediana: Ordenando de menos a mayor:

1,860; 2,340; 2,350; 2,560; 3,450; 3,450; 3,570; 3,580; 4,250; 4,560; 5,110: 6,120. Por ser n, par, quedan dos valores al centro de la distribución. Por lo tanto:

4 Cuando se trabaja con variable continua, existen otros estadísticos mucho mejores que la Moda. Por esa razón, no es necesario introducir mucho rigor en su cálculo.

Page 60: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

59

2

57034503Me ,, += = 3,510 Kg.

Esto es: la mitad de los recién nacidos pesan más de 3,510 Kg. 1.3. Media: =x 3,600 Kg. Esto es: el peso promedio de los recién nacidos es de 3,600 Kg. 2. Clima laboral Calcule la moda, la mediana y la media en los siguientes datos, que corresponden a opinión de trabajadores acerca del clima laboral en la empresa, siendo: B = Bueno; R = regular; M = Malo Los datos son: M; R; R; B; M; R; B; M; M Solución: 2.1. Moda: Malo La opinión más generalizada es que el clima laboral en la empresa es Malo. 2.2. Mediana: Ordenando: M; M; M; M; R; R; R; B; B; con n = 9 Ubicación: (9 + 1)/2 = 5. La mediana es el 5º valor. Mediana: Me = Regular A menos el 50% de los encuestados opina que el clima laboral en la empresa es de malo a regular. 2.3. Media: No se puede calcular, ya que las observaciones no son valores numéricos. 3. Precio de carne de vacuno El precio de venta al detalle del kilo de lomo de vacuno en una muestra de establecimientos, se distribuye de acuerdo a la siguiente tabla, con los precios expresados en miles:

M$ casos 3,9 – 4,1 4,1 – 4,3 4,3 – 4,5 4,5 – 4,7 4,7 – 4,9 4,9 – 5,1 5,1 – 5,3

4 11 18 23 32 21 8

3.1. Moda: Marca de clase el intervalo modal; 4,8 Moda = $4.800 el kilo. El precio del lomo de vacuno más frecuente de encontrar en el mercado es $4.800 el kilo. 3.2. Mediana:

M$ Xm casos F 3,9 – 4,1 4,1 – 4,3 4,3 – 4,5 4,5 – 4,7 4,7 – 4,9 4,9 – 5,1 5,1 – 5,3

4,0 4,2 4,4 4,6 4,8 5,0 5,2

4 11 18 23 32 21 8

4 15 33 56 88 109 117

117

Page 61: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

60

2n = 117/2 = 58,5

32565582074Me ),(·,, −

+= = 4,716

Mediana = $4.716. En el 50% de los establecimientos el valor de la carne es mayor a $4.716 el Kg. En el 50% de los establecimientos el valor de la carne es menor a $4.716 el Kg. 3.3. Media: $4.679 Ingresando los datos a la calculadora: El precio promedio de un Kg de lomo en el mercado es $4.679. IV. EJERCICIOS Y PROBLEMAS PROPUESTOS 1. Peso de recién nacidos La siguiente tabla muestra el peso de 137 recién nacidos en hospitales públicos de la Región Metropolitana.

Peso (Kg) casos 1,5 – 2,0 2,0 – 2,5 2,5 – 3,0 3,0 – 3,5 3,5 – 4,0 4,0 – 5,0 5,0 – 6,0

7 17 33 58 41 23 11

1.1. ¿Qué % de la muestra pesa menos de 3 Kg? A) 70,0% B) 60,5% C) 30,0% D) 17,4% E) 12,6% 1.2. ¿Qué % de la muestra pesa al menos 4 Kg? A) 5,8% B) 39,5% C) 12,1% D) 21,6% E) 17,9% 1.3. El peso medio de los recién nacidos de la muestra es: A) 3,41 Kg. B) 3,32 Kg. C) 3,25 Kg D) 2,83 Kg E) 3,47 Kg 1.4. El peso mediano de los recién nacidos de la muestra es: A) 3,000 Kg B) 3,250 Kg C) 3,350 Kg. D) 3,328 Kg. E) 3,833 Kg 1.5. La moda del peso de los recién nacidos de la muestra es: A) 3,00 Kg B) 3,35 Kg. C) 3,25 Kg. D) 3,33 Kg. E) 3,50 Kg

Page 62: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

61

2. Precio de la bencina Se investiga en un día el precio de la bencina de 95 octanos en una muestra de 280 bencineras, encontrando los siguientes precios: Precio mínimo: $615; Precio máximo: $648 Precio medio: $625; Precio mediano: $632; Precio modal: $636. 2.1. El rango del precio es igual a: A) $33 B) $615 C) $625 D) $632 E) $648 2.2. Con los datos se puede hacer la siguiente afirmación respecto de la bencina: A) La mayoría de las bencineras estudiadas tienen la bencina a $636 B) La mitad de las bencineras estudiadas tienen la bencina a $632. C) El 50% de las bencinera estudiadas tienen la bencina a $625. D) El 50% de las bencinera estudiadas tienen la bencina a $632 o más. E) El precio más frecuente de encontrar la bencina es $625. 3. Números Se tienen tres números enteros mayores que cero, de los cuales se sabe lo siguiente:

• La media aritmética entre ellos es 38, su mediana es 30 y no tienen moda. • El promedio entre los dos mayores es 45.

Entonces, el promedio entre los dos menores es: A) 24 B) 27 C) 30 D) 54 E) 60 4. Uso de Internet Las siguientes son las respuestas de una muestra de personas a la pregunta ¿Usa usted Internet?

USA INTERNET casos Siempre 2 Frecuentemente 4 A veces 4 Rara vez 8 Nunca 7

4.1. La opinión modal es: A) 25 B) 8 C) A veces D) Rara vez E) No se puede calcular 4.2. La opinión mediana es: A) A veces B) Rara vez C) Nunca D) 12,5 E) No se puede determinar Solución a problemas propuestos 1.1. C 1.2. E 1.3. A 1.4. D 1.5. C 2.1. A 2.2. D 3. B 4.1. D 4.2. B

Page 63: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

62

V. RECURSOS COMPLEMENTARIOS 1. Concepto y cálculo de estadígrafos http://www.bioestadistica.freeservers.com/temas.html Tema 4. Estadígrafos: 2. Cálculo de estadígrafos: teoría y problemas http://ftp.medprev.uma.es/libro/html.htm 2. Medidas descriptivas 3. Ejercicios SECTOR MATEMÁTICA http://www.sectormatematica.cl/educmedia.htm Medida Posición Central

Page 64: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

63

SEGUNDA UNIDAD: ESTADÍSTICOS BÁSICOS CLASE 8

CUARTILES: CÁLCULO E INTERPRETACIÓN

«Son distintas las aguas que cubren a los que entran en el mismo río». (Heráclito).

APRENDIZAJES ESPERADOS CONTENIDOS -Calculan e interpretan los cuartiles. -Grafican cuartiles mediante gráfico de caja.

-Cálculo e interpretación de los cuartiles. -Gráfico de caja y bigotes.

II. DESARROLLO 1. Concepto de cuartil Los cuartiles, al igual que la media, la mediana y la moda, son estadígrafos. Los cuartiles (Q) son valores de la variable que dividen la distribución de observaciones, ordenadas de menor a mayor, en cuatro segmentos de un 25% de esta cada uno. Estos estadígrafos son tres 1Q , 2Q y 3Q .

1.1. Cuartil 1 ( 1Q ): Divide la distribución en dos partes. El 25% de las observaciones son iguales o menores que el cuartil 1, mientras que el 75% restante son iguales o mayores que este. Gráficamente se puede representar así:

1.2. Cuartil 2 ( 2Q ): Divide la distribución en dos partes. El 50% de las observaciones son iguales o menores que el cuartil 2, mientras que el otro 50% son iguales o mayores que este. Gráficamente se puede representar así:

De acuerdo a la definición y al esquema gráfico, el cuartil 2 equivale a la mediana.

mínx máxx1Q

25% 75%x

mínx máxx2Q

50% 50%x

Fig.: 8.1. Esquema del cuartil 1

Fig.: 8.2. Esquema del cuartil 2

Page 65: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

64

1.3. Cuartil 3 ( 3Q ): Divide la distribución en dos partes. El 75% de las observaciones son iguales o menores que el cuartil 3, mientras que el 25% restante son iguales o mayores que este. Gráficamente se puede representar así:

2. Cálculo de los cuartiles Para calcular los cuartiles en distribuciones de variable continua organizada en intervalos, se siguen los siguientes pasos:

1º: Acumular frecuencias en la tabla. Esto es, calcular iF 2º: Calcular la fracción de n correspondiente.

Para el cuartil 1: n2504n ,=

Para el cuartil 2: n502n ,=

Para el cuartil 3: n7504n3 ,=

3º: Encontrar, en la tabla, el intervalo “j”. Este es el intervalo cuya frecuencia acumulada es la menor de todas las que superan el valor de la fracción de n calculada en el punto 2º. 4º: Se aplica la fórmula correspondiente:

Cuartil 1: j

1j41

jj1 fFn

cxQ)(

· −−+=

Cuartil 2: j

1j21

jj2 fFn

cxQ)(

· −−+=

Cuartil 3: j

1j43

jj3 fFn

cxQ)(

· −−+=

Siendo:

jx = límite real inferior del intervalo “j”.

jc = amplitud del intervalo “j”.

=n Tamaño de la muestra

1−jF = frecuencia acumulada del intervalo anterior al “j”.

jf = frecuencia absoluta del intervalo “j”.

Como puede observarse, la única diferencia entre las fórmulas es la fracción de n que corresponde a cada cuartil.

mínx máxx3Q

75% 25%x

Fig.: 8.3. Esquema del cuartil 3

Page 66: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

65

3. Interpretación de los cuartiles: Representando los tres cuartiles en un solo esquema se aprecia lo siguiente: La definición y los conceptos implicados en los cuartiles son fundamentales en su interpretación, en el contexto de los datos, puesto que gráficamente se aprecia que:

• El 25% de las observaciones están entre el mínimo y el cuartil 1. • El 25% de las observaciones están entre el cuartil 1 y el cuartil 2. • El 25% de las observaciones están entre el cuartil 2 y el cuartil 3. • El 25% de las observaciones están entre el cuartil 3 y el máximo.

4. Gráfico de caja y bigotes: Con el valor máximo y mínimo de la variable, más los valores de los tres cuartiles, se construye el gráfico de caja y bigotes. Ver figura siguiente. En el gráfico:

• El eje x se construye cautelando que la escala elegida cubra desde el valor mínimo de la variable al valor máximo. La división de este eje debe hacerse en intervalos de igual amplitud.

• La “caja” se construye como un rectángulo cuya base va desde el cuartil 1 al 3. La altura es arbitraria. • Esta “caja” constituye o concentra el 50% de la distribución. • La “caja” queda dividida por el trazado del valor del cuartil 2 (mediana). • Los “bigotes” constituyen, cada uno, el 25% menor y el 25% mayor, respectivamente. • Como todo gráfico, debe quedar debidamente rotulado, tanto en el eje X, como en gráfico mismo.

La interpretación de un gráfico de caja y bigotes surge de la definición misma de los estadígrafos que participan. Como se puede apreciar, el 25% de la muestra se encuentra entre el valor mínimo de la variable y el valor del cuartil 1; El 50% se encuentra entre el cuartil 1 y el 3; el 75% entre el cuartil 1 y el valor máximo, etc. Cualidades del gráfico de caja y bigotes:

• Entrega una visión general de la amplitud o rango de variación de la variable.

mínx máxx3Q

25%

x

1Q 2Q

25%25%25%

Fig.: 8.5. Gráfico de caja y bigotes

mínx máxx3Q

x

1Q 2Q

Fig.: 8.4. Esquema de los cuartiles

Page 67: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

66

• Muestra la división de la muestra en cuatro segmentos del 25% cada uno. • Muestras la concentración del 50% central • Entrega una idea gráfica de la dispersión de los valores observados. • Es de fácil construcción

III. EJERCICIOS Y PROBLEMAS RESUELTOS 1. Gasto en telefonía móvil Se realiza un estudio con 820 personas propietarias de teléfono celular, acerca del monto de gasto mensual en telefonía móvil. El estudio permitió calcular los siguientes estadígrafos: Gasto mínimo: $4.500 Rango del gasto: $62.500 Gasto primer cuartil = $8.300 Gasto mediano = $18.500 Gasto mínimo del 25% superior = $25.000

1.1. Construya un gráfico de caja y bigotes para representar estos resultados. 1.2. Construya 3 afirmaciones respecto de la muestra estudiada.

Solución: 1.1. Gráfico El gasto máximo se obtiene con el mínimo y el rango, puesto que Rg(x) = Xmáx – Xmín. X máximo = 62.500 + 4.500 = $67.000 El gasto mínimo del 25% superior corresponde al cuartil 3. Con estos cinco estadígrafos se procede a construir el gráfico:

• Primero se construye el eje x. Para los efectos se expresará la variable en $miles, quedando una escala entre cero y 70.

• Como segundo paso, se ubican los 5 estadígrafos y se marcan con una línea de segmentos:

• Enseguida, se traza la caja, entre el cuartil 1 y 3 y los bigotes en el 25% inferior y superior, respectivamente.

0 10 20 30 40 50 60 70 M$

0 10 20 30 40 50 60 70 M$

0 10 20 30 40 50 60 70 M$

Page 68: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

67

• Finalmente, se marcan con línea llena los límites de los valores mínimo, máximo y mediana. También se rotula adecuadamente.

1.2. Afirmaciones:

• El 25% de los encuestados gasta entre $4.500 y $8.300 mensuales en telefonía móvil. • El 100% de los encuestados gasta entre $4.500 y $67.000 mensuales en telefonía móvil. • El 50% de los encuestados gasta más de $18.500 en telefonía móvil al mes. • La mitad de los encuestados gastan entre $8.300 y $25.000 • Tres de cada 4 usuarios encuestados gasta a lo menos $8.300 mensuales en telefonía móvil. • Etc.

2. Ingreso mensual Una encuesta investigó el ingreso mensual de trabajadores del sector comercio, llegando a los siguientes resultados:

Ingreso ($miles) Nº de casos

150 – 200 200 – 300 300 – 500 500 – 700

700 – 1.000

34 58 25 11 4

2.1. Calcule el ingreso del cuartil 1 e interprete su valor. 2.2. Calcule el ingreso mediano e interprete su valor. 2.3. Calcule el ingreso del tercer cuartil e interprete su valor. Solución: Para resolver el problema planteado, se construirá una tabla con frecuencia acumuladas:

X fi Fi 150 – 200 34 34 200 – 300 59 93 300 – 500 26 119 500 – 700 11 130 700 – 1.000 4 134

Σ 134

0 10 20 30 40 50 60 70

Gasto mensual en telefonía móvil ($miles)

M$

Page 69: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

68

2.1. Cuartil 1:

=4n 33,5 ⇒ El intervalo j queda en el primer intervalo, porque la menor frecuencia acumulada mayor a 33,5 se ubica

en el primer intervalo. Entonces:

jx = 150; jc = 50; 1−jF = 0; jf = 34

=1Q34

053350150 ),(· −+ = 199,265

El ingreso del primer cuartil es $199.265.

• El 25% de los encuestados tienen un ingreso entre $150.000 y $199.265. • El 75% de los encuestados tienen un ingreso mayor a $199.265.

2.2. Mediana:

=2n 67 ⇒ El intervalo j queda en el segundo intervalo

=Me59

3467100200 )(· −+ = 255,932

El ingreso mediano es $255.932.

• El 50% de los encuestados tienen un ingreso sobre $255.932. • El 50% de los encuestados tienen un ingreso bajo $255.932.

2.3. Cuartil 3:

=4n3 100,5 ⇒ El intervalo j queda en el tercer intervalo.

=3Q26

935100200300 ),(· −+ = 357,692

El ingreso del tercer cuartil es $357.692.

• El 25% de los encuestados tiene un ingreso mayor a $357.692. • El 75% de los encuestados tiene un ingreso menor a $357.692.

3. Tiempo de espera El departamento de Atención al Cliente de un hotel de turismo, ha estudiado, en una muestra de 168 pasajeros, el tiempo transcurrido (tiempo de espera) desde que el cliente llega al hotel hasta que ingresa a su habitación. El resultado se representa en el siguiente gráfico:

10 12 14 16 18 20 22 24

Tiempo de espera de clientes (minutos)

min

Page 70: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

69

3.1. ¿Que % de los pasajeros estudiados esperó más de 18 minutos? 3.2. ¿Cuántos pasajeros esperaron, cuando más, 14 minutos? 3.3. ¿Cuántos pasajeros esperaron entre 10 y 18 minutos? 3.4. Complete: El 75% de los pasajeros estudiados esperó a lo menos . . . . . . . . . . minutos. 3.5. Complete: El 25% de los pasajeros de la muestra esperó a lo menos,. . . . . . . . . . minutos. 3.6. Complete: El . . . . . . . . . . . . % de los pasajeros de la muestra esperó entre 14 y 23 minutos. Solución: 3.1. De acuerdo al gráfico, más de 18 minutos corresponde al 25% del bigote superior. Por lo tanto, el 25 % de los pasajeros estudiados esperó más de 18 minutos. 3.2. De acuerdo al gráfico, cuando más, 14 minutos, corresponde al 25% del bigote inferior. El 25% de 168 es 42. Por lo tanto, 42 pasajeros esperaron, cuando más, 14 minutos. 3.3. De acuerdo al gráfico, entre 10 y 18 minutos se acumula el 75% inferior de las observaciones. El 75% de 168 es 126. Por lo tanto, 126 pasajeros esperaron entre 10 y 18 minutos. 3.4. “A lo menos” significa “como mínimo”. De acuerdo al gráfico el valor que deja el 75% sobre sí es el 14. Por lo tanto, El 75% de los pasajeros estudiados esperó, a lo menos, . . .14. . . minutos. 3.5. “A lo menos” significa “como mínimo”. De acuerdo al gráfico el valor que deja el 25% sobre sí es el 18. Por lo tanto, El 25% de los pasajeros de la muestra esperaron a lo menos . . .18 . . . minutos. 3.6. De acuerdo al gráfico entre 14 y 23 minutos se acumula el 75% superior de las observaciones. Entonces, el . .75%. . . de los pasajeros de la muestra esperó entre 14 y 23 minutos. IV. EJERCICIOS Y PROBLEMAS PROPUESTOS 1. Tiempo de descarga Se ha elegido una muestra aleatoria de sitios Web, para medir el tiempo de descarga en el navegador. Se encontraron los datos de la siguiente tabla:

Tiempo de descarga de sitios Web Tiempo (seg) Nº de casos

0 – 4 4 – 8 8 – 12

12 – 16 16 – 20 20 – 24

14 36 53 15 7 3

1.1. La variable en estudio es de tipo: A) Continua B) Discreta C) Ordinal D) Multinomial E) Dicotómica 1.2. ¿Que % de los sitios estudiados emplearon 8 o más segundos en descargarse? A) 41,4% B) 60,9% C) 39,1% D) 72,3% E) 80,5%

Page 71: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

70

1.3. El tiempo de descarga del primer cuartil es: A) 34 seg. B) 32 seg. C) 24 seg. D) 8 seg. E) 6 seg. 1.4. ¿Qué valor de la variable deja bajo sí al 50% de las observaciones? A) 8 seg. B) 8,3 seg. C) 9,1 seg. D) 9,8 seg. E) 11,4 seg. 1.5. De acuerdo al cuartil 3: A) El 25% de los sitios descargan en 10,5 seg. B) El 75% de los sitios descargan en 11,5 seg. C) El 50% de los sitios descargan en 8,5 seg. D) El 75% de los sitios descargan en menos de 11,5 seg. E) El 25% de los sitios descargan en menos de 11,5 seg. 2. Archivos de audio Cierto DJ tiene almacenados en disco duro un total de 1.480 archivos de audio en formato mp3. El peso de los archivos tiene los siguientes estadísticos: Peso máximo = 15,6 Mb; Rango del peso = 11,4 Mb Peso cuartil 1 = 6,4 Mb; Peso mediano = 7,3 Mb; Peso cuartil 3 = 9,2 Mb; 2.1. De acuerdo a estos datos, ¿qué % de los archivos pesa más de 6,4 Mb? A) 95% B) 75% C) 50% D) 25% E) 15% 2.2. De acuerdo a estos datos, ¿cuántos archivos pesan entre 6,4 y 9,2 Mb? A) 25 B) 50 C) 370 D) 740 E) 1.110 2.3. De acuerdo al cuartil 3: A) El 25% de los archivos pesa 9,2 Mb. B) El 75% de los archivos pesa 9,2 Mb. C) El 75% de los archivos pesa más de 9,2 Mb. D) El 50% de los archivos pesa entre 4,2 y 9,2 Mb. E) El 25% de los archivos pesa más de 9,2 Mb. 2.4. De acuerdo a los datos dados: A) Un total de 370 archivos pesan 6,4 Mb. B) La mitad de los archivos de audio pesan 7,3 Mb. C) Hay 1.110 archivos con un peso entre 6,4 y 15,6 Mb. D) El 50% de los archivos pesan entre 6,4 y 15,6 Mb. E) El 25% de los archivos pesan más de 6,4 Mb 2.5. De los siguientes gráficos: I: Gráfico de tallo y hojas II: Gráfico de caja y bigotes III: Pictograma ¿Cuál(es) sirve(n) para representar los datos dados? A) Solo II B) Solo I y II C) Solo II y III D) Solo I y III E) Ninguno de ellos

Page 72: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

71

Solución a problemas propuestos 1.1. A 1.2. B 1.3. E 1.4. C 1.5. D 2.1. B 2.2. D 2.3. E 2.4. C 2.5. A V. RECURSOS COMPLEMENTARIOS Se sugiere complementar el estudio, visitando la página: 1. Concepto y cálculo de estadígrafos http://www.bioestadistica.freeservers.com/temas.html Tema 4. Estadígrafos: 2. Cálculo de estadígrafos: teoría y problemas http://ftp.medprev.uma.es/libro/html.htm 2. Medidas descriptivas 3. http://www.uaq.mx/matematicas/estadisticas/xstad02.html Curso de estadística muy bien explicado y desarrollado con ejemplos. Se recomienda para este nivel la Unidad Nº3 “Estadística Descriptiva”.

Page 73: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

72

SEGUNDA UNIDAD: ESTADÍSTICOS BÁSICOS CLASE 9

DECILES Y PERCENTILES: CÁLCULO E INTERPRETACIÓN

«El mayor error sería subestimar el problema del error; la mayor ilusión sería subestimar el problema de la ilusión». (Morin).

APRENDIZAJES ESPERADOS CONTENIDOS -Calculan e interpretan deciles y percentiles.

-Cálculo e interpretación de deciles y percentiles.

II. DESARROLLO 1. Concepto de Decil Los deciles, al igual que la mediana y los cuartiles, son estadígrafos que dividen la distribución de observaciones y pertenecen, por lo tanto a la misma familia de estadígrafos. Los deciles (D) son valores de la variable que dividen la distribución de observaciones, ordenadas de menor a mayor, en diez segmentos de un 10% de estas cada uno. Estos estadígrafos son nueve 1D , 2D , 3D , etc.

1.1. Decil 1 ( 1D ): Divide la distribución en dos partes. El 10% de las observaciones son iguales o menores que el decil 1, mientras que el 90% restante son iguales o mayores que este. Gráficamente se puede representar así:

1.2. Decil 2 ( 2D ): Divide la distribución en dos partes. El 20% de las observaciones son iguales o menores que el decil 2, mientras que el 80% restante son iguales o mayores que este.

1.3. Decil 3 ( 3D ): Etc.

mínx máxx1D

10% 90%x

Fig.: 9.1. Esquema del decil 1

Page 74: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

73

2. Percentiles Los Percentiles son otros de los integrantes de la familia denominada “separatrices”, que se inicia con la mediana, sigue con los cuartiles, quintiles, deciles y termina en los percentiles. Los Percentiles (P) son valores de la variable que dividen la distribución de observaciones, ordenadas de menor a mayor, en cien segmentos de un 1% cada uno. Estos estadígrafos son, en verdad, más de cien (en realidad, son infinitos), ya que aceptan percentiles con decimales tales como 52P , , 597P , , etc.

2.1. Percentil 1 ( 1P ): Divide la distribución en dos partes. El 1% de las observaciones son iguales o menores que el Percentil 1, mientras que el otro 99% son iguales o mayores que este.

2.2. Percentil 2,5 ( 52P , ): Divide la distribución en dos partes. El 2,5% de las observaciones son iguales o menores que el Percentil 2,5, mientras que el otro 97,5% son iguales o mayores que este. 2.3. Percentil 85,5 ( 585P , ): Divide la distribución en dos partes. El 85,5% de las observaciones son iguales o menores que el Percentil 85,5, mientras que el restante 14,5% son iguales o mayores que este. Figura 9.2.

3. Equivalencia entre separatrices: La mediana equivale al Cuartil 2, al Decil 5 y al Percentil 50. El cuartil 1 equivale al percentil 25. El Decil 1 equivale al percentil 10. Etc. 4. Cálculo de los percentiles Para calcular los percentiles en distribuciones de variable continua organizada en intervalos, se siguen los siguientes pasos:

1º: Acumular frecuencias en la tabla. Esto es, calcular iF

2º: Calcular la fracción de n correspondiente al percentil P deseado.

Para el percentil 1→ 0,01 · n Para el percentil 4→ 0,04 · n Para el percentil 35→ 0,35 · n Para el percentil 99,5→ 0,995 · n Etc.

mínx máxx585P ,

14,5%85,5%

x

Fig.: 9.2. Esquema del Percentil 85,5

Page 75: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

74

3º: Encontrar en la tabla, mirando la columna Fi, el intervalo “j”. Este es el intervalo cuya frecuencia acumulada es la menor de todas las que superan el valor de la fracción de n calculada en el punto 2º. 4º: Se aplica la fórmula correspondiente:

Percentil P: j

1jjjP f

FnPcxP

)%(· −−

+=

Siendo:

jx = límite real inferior del intervalo “j”.

jc = amplitud del intervalo “j”.

=n tamaño de la muestra

1−jF = frecuencia acumulada del intervalo anterior al “j”.

jf = frecuencia absoluta del intervalo “j”.

5. Interpretación de deciles y percentiles Representando algunos percentiles en un solo esquema, se aprecia lo siguiente: La definición y los conceptos implicados en los percentiles son fundamentales para su interpretación. Se observa en la figura, lo siguiente:

• El 10% de la distribución es menor que el D1, mientras que el 90% restante es mayor que D1. • El 55% de la distribución es menor que el P55, mientras que el 45% restante es mayor que este. • El 93% de las observaciones es menor que el P93, mientras que el 7% restante es mayor que este.

En el diagrama se aprecia, a su vez, los segmentos que quedan entre los estadígrafos:

• El 45% está entre D1 y P55. • El 38% está entre P55 y P93. • El 83% está entre D1 y P93. • Etc.

mínx máxx93P

7%

x

1D 55P

38%45%10%

Fig.: 9.3. Esquema de separatrices varias

Page 76: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

75

III. EJERCICIOS Y PROBLEMAS RESUELTOS 1. Gasto en medicamentos Se realiza un estudio con personas de ambos sexos con enfermedades crónicas, acerca del monto del gasto mensual en medicamentos. El estudio permitió calcular los siguientes estadígrafos, en $miles: Gasto mínimo = M$ 5,8 Gasto máximo = M$ 124,6 Gasto decil 2 = M$ 15,7 Gasto percentil 45 = M$ 38,4 Gasto cuartil 3 = M$ 75,6 Gasto percentil 95 = M$ 115,2 1.1. Construya 5 afirmaciones respecto de la muestra estudiada. Solución: 1.1. Afirmaciones: En primer lugar conviene construir un diagrama como el siguiente: Los valores de X y los %, se deducen de las definiciones de los estadígrafos dados. Con este diagrama ya es posible construir muchas afirmaciones, tales como las siguientes:

• El 20% de las personas encuestadas gasta, a lo más, $15.700 mensuales en medicamentos. • El 25% de las personas encuestadas gasta mensualmente entre $15.700 y $38.400 en medicamentos. • El 55% de las personas estudiadas gasta mensualmente entre $15.700 y $75.600 en medicamentos. • El 55% de las personas de la muestra gasta, al mes, a lo menos, $38.400 en medicamentos. • Etc.

2. Antigüedad en la empresa Una encuesta investigó la antigüedad en la empresa de una muestra de trabajadores de una empresa de comercio exterior, llegando a los siguientes resultados:

Antigüedad (años) Nº de casos

0 – 2 2 – 5 5 – 8 8 – 15 15 – 25

25 o más

14 38 45 21 12 4

5,8 124,6115,2

5%M$

15,7 38,4

30%25%20%

75,6

20%

Fig.: 9.4. Gasto en medicamentos

Page 77: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

76

2.1. Calcule el valor numérico del decil 1 e interprete su valor. 2.2. Calcule el percentil 65 e interprete su valor. 2.3. Calcule el percentil 92,5 e interprete su valor. 2.4. ¿Qué % de la muestra tiene menos de 7 años de antigüedad en la empresa? Solución: Para resolver el problema planteado, se construirá una tabla con frecuencia acumuladas:

X fi Fi 0 – 2 14 14 2 – 5 38 52 5 – 8 45 97

8 – 15 21 118 15 – 25 12 130

25 o más 4 134 Σ 134 -

2.1. Decil 1: (D1 ⇒ 0,1 · n)

0,1 · 134 = 13,4. El intervalo j es el primer intervalo.

14

041320D1),(· −

+= = 1,9 años

• El 10% de los trabajadores tienen menos de 1,9 años de antigüedad en la empresa. • El 90% de los trabajadores tienen más de 1,9 años de antigüedad en la empresa.

2.2. Percentil 65: (P65 ⇒ 0,65 · n)

0,65 · 134 = 87,1. El intervalo j es el tercero.

45

5218735P65),(· −

+= = 7,3 años

• El 65% de los trabajadores tienen menos de 7,3 años de antigüedad en la empresa. • El 35% de los trabajadores tienen más de 7,3 años de antigüedad en la empresa.

2.3. Percentil 92,5: (P92,5 ⇒ 0,925 · n)

0,925 · 134 = 123,95. El intervalo j es el penúltimo.

12118951231015P 592

),(·,

−+= = 19,96 ≈ 20,0 años

• El 92,5% de los trabajadores tienen menos de 20 años de antigüedad en la empresa. • El 7,5% de los trabajadores tienen más de 20 años de antigüedad en la empresa.

Page 78: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

77

2.4. ¿Qué % de la muestra tiene menos de 10 años de antigüedad en la empresa? En este caso, se da un cierto percentil P = 10 años y hay que calcular el % que queda bajo ese valor, tal como lo ilustra la figura 9.5: Este percentil queda en el cuarto intervalo, que va de 8 a 15 años. Reemplazando:

2197F7810 )(· −

+=

Despejando la frecuencia acumulada F:

97F7

81021−=

− )(·

F976 =+ F103 =

Esta es una frecuencia acumulada inferior. Es decir hay 103 trabajadores, de un total de 134, que tienen menos de 10 años de antigüedad. Llevando a %:

%,· 976100134103

=

R: El 76,9% de los trabajadores tienen menos de 10 años de antigüedad. IV. EJERCICIOS Y PROBLEMAS PROPUESTOS 1. Ingreso por hora Se ha seleccionado una muestra aleatoria de empleados dependientes del sector comercio, para conocer su ingreso por hora trabajada. Se encontraron los datos de la siguiente tabla, en $miles/hora:

Ingreso (M$/hr) Casos 1,5 – 2,5 16 2,5 – 3,5 28 3,5 – 4,5 35 4,5 – 5,5 12 5,5, – 6,5 5

Σ

1.1. El valor numérico del percentil cinco del ingreso por hora es: A) $1.500 B) $1.675 C) $1.706 D) $1.740 E) $1.800

0 máxaños

10

%?Fig.: 9.5.

Page 79: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

78

1.2. El ingreso mediano por hora es: A) $3.614 B) $3.774 E) $4.257 C) $4.804 D) $5.040 1.3. El valor numérico del cuartil 3 del ingreso por hora es: A) $5.280 B) $4.300 C) $4.541 D) $4.120 E) $4.780 1.4. El valor numérico del decil 9 del ingreso por hora es: A) $6.523 B) $6.180 C) $5.740 D) $5.425 E) $5.117 1.5. El ingreso medio por hora es: A) $4.834 B) $4.787 C) $3.604 D) $3.524 E) $3.614 2. Diámetro de árboles Con el fin de decidir acerca de la explotación de un bosque maderero, se procede a medir el diámetro de una muestra aleatoria de 540 árboles, encontrando los siguientes estadígrafos:

• Diámetro decil 2: 42 cm. • Diámetro percentil 32: 46 cm. • Diámetro mediano: 50 cm. • Diámetro cuartil 3: 60 cm. • Diámetro máximo: 76 cm.

2.1. ¿Qué % de los árboles de la muestra miden entre 46 y 50 cm de diámetro? A) 12% B) 18% C) 30% D) 32% E) 50% 2.2. ¿Cuántos árboles de la muestra miden más de 60 cm de diámetro? A) 405 B) 270 C) 135 D) 105 E) 75 2.3. ¿Qué % de los árboles de la muestra miden entre 42 y 60 cm de diámetro? A) 55% B) 45% C) 75% D) 35% E) 20% 2.4. A partir de los datos dados, se puede afirmar que, en la muestra: A) El 20% de los árboles tienen un diámetro de 42 cm. B) El 75% de los árboles miden a lo menos 60 cm de diámetro. C) El 42% de los árboles miden entre 46 y 60 cm de diámetro. D) El 68% de los árboles miden más de 46 cm de diámetro. E) La mitad de los árboles miden 50 cm de diámetro. 2.5. De las siguientes afirmaciones ¿cuál es FALSA? A) Las tres cuartas partes de los árboles miden menos de 60 cm de diámetro. B) Las cuatro quintas partes de la muestra mide más de 42 cm de diámetro. C) El 12% de los árboles miden entre 42 y 46 cm de diámetro. D) La mitad de los árboles miden menos de 50 cm de diámetro. E) El 35% de los árboles mide menos de 46 cm de diámetro.

Page 80: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

79

Solución a problemas propuestos 1.1. E 1.2. A 1.3. B 1.4. E 1.5. C 2.1. B 2.2. C 2.3. A 2.4. D 2.5. E V. RECURSOS COMPLEMENTARIOS 1. Concepto y cálculo de estadígrafos AULAFACIL http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm CLASE 5. Medidas de posición no central 2. Cálculo de estadígrafos: teoría y problemas http://ftp.medprev.uma.es/libro/html.htm 2. Medidas descriptivas 3. Ejercicios SECTOR MATEMÁTICA http://www.sectormatematica.cl/educmedia.htm Medidas de Posición

Page 81: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

80

SEGUNDA UNIDAD: ESTADÍSTICOS BÁSICOS CLASE 10 ESTADÍGRAFOS DE DISPERSIÓN

«No ha de maravillarnos que el azar pueda tanto sobre nosotros partiendo de que vivimos por azar».

(Novalis).

APRENDIZAJES ESPERADOS CONTENIDOS -Calculan los estadígrafos de dispersión: varianza, desviación estándar y coeficiente de variación, con uso de la función estadística de la calculadora. -Analizan datos cuantitativos provenientes del ámbito social, económico, comercial o financiero, calculando estadígrafos de posición y dispersión.

-Cálculo de varianza, desviación estándar y coeficiente de variación, con ayuda de calculadora. -Análisis de datos

II. DESARROLLO 1. Concepto de dispersión En una serie de datos, la dispersión es la separación de unos con otros. Ambas distribuciones de frecuencia tienen igual media, pero distinta dispersión. Mientras que en B los valores están más cercanos del centro, en la distribución A, tienen mayor dispersión, al encontrarse, en promedio, más separados del centro. Se dice, entonces, que A tiene mayor dispersión o variabilidad que la distribución B. Para medir y cuantificar la variabilidad se usan varios estadígrafos, de los cuales en este cuaderno solo se verán los más básicos y utilizados. 2. Rango (Rg) El Rango de la variable es uno de los estadígrafos de variabilidad más sencillos. Describe la diferencia entre el mayor y menor valor de la variable. En los histogramas de la figura, Rg(A) = 14, mientras que Rg(B) = 10. Cuantitativamente se aprecia el concepto de dispersión, que es mayor en A que en B.

Fig. 10.1.Distribución AMayor dispersión que B

4 6 8 10 12 14 16 18

22201816141210

86420 x

6 8 10 12 14 16

22201816141210

86420 x

Fig. 10.2.Distribución B Menor dispersión que A

Page 82: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

81

3. Varianza ( 2σ )

Definición: n

xx 2i2 )( −Σ

Esto significa que, para cada valor ix , se calcula su distancia a la media x . Estas distancias se elevan al cuadrado, se suman y finalmente se dividen por n. El cálculo manual de la varianza es engorroso, cosa que se resolvió con las calculadores electrónicas. Unidades de 2σ La varianza tiene unidades cuadráticas, lo que hace difícil su interpretación, ya que muchas veces resultan unidades que no tienen sentido en el mundo cotidiano, como por ejemplo 2$ , 6m , etc. Esta desventaja hizo que se popularizada más su raíz cuadrada, a la que se llamó desviación estándar o típica. 4. Desviación estándar (σ ) La desviación estándar o típica es la raíz cuadrada positiva de la varianza.

Definición: n

xx 2i )( −Σ

Unidades de σ : La desviación estándar se expresa en las mismas unidades de la variable. Así, si la variable está en minutos, la desviación estándar también. 5. Coeficiente de variación (CV) El coeficiente de variación compara la desviación estándar respecto de la media, y convierte ese cuociente en %.

Definición: 100x

CV ·σ= (%)

6. Cálculos con calculadora La calculadora científica del modelo Casio fx-350MS, entrega directamente el valor de la desviación estándar, pero no el de la varianza ni el del coeficiente de variación, pero están los recursos para calcularlos. Ejemplo: Los siguientes valores corresponden a la edad de los integrantes de una familia: 22; 58; 55; 40; 27; 29 años. Calcule la media, la desviación estándar, la varianza y el coeficiente de variación de las edades.

1º: Activar el modo estadístico 2º: Limpiar las memorias estadísticas 3º: Ingresar datos 4º: Recuperar resultados:

Page 83: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

82

La media aritmética: SHIFT S-VAR 1 =

La desviación estándar: SHIFT S-VAR 2 =

La varianza: SHIFT S-VAR 2 2x =

El coeficiente de variación: SHIFT S-VAR 2 ÷ SHIFT S-VAR 1 x 100 =

Resumen: Media: =x 38,5 años Desviación estándar: σ = 13,84 años

Varianza: 2σ = 191,58 años 2 Coeficiente de variación: CV = 35,95% Para el cálculo de estos estadígrafos con variable agrupada como variable discreta o como variable continua, se siguen las mismas instrucciones que para el cálculo de la media. Ver clase 6. 7. Interpretación de la desviación estándar: La desviación estándar tiene valiosas aplicaciones como estadígrafo que cuantifica la dispersión de los valores en torno de la media.

7.1. Comparación: las distribuciones con mayor desviación estándar (o varianza) tienen una mayor dispersión, los datos son más heterogéneos. Las distribuciones con menor desviación estándar son más homogéneas. 7.2. Normalidad: En una serie de datos, se le llama intervalo “normal” a aquel definido por:

Intervalo normal = σ±x

x 38,5

nxσ

13,84136313

2nxσ 191,5833333

100xxnx ÷σ 35,95159255

Page 84: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

83

Al segmento que queda sobre el límite superior se le llama “sobre lo normal” y al que queda por debajo del límite inferior, se le llama “bajo lo normal”. Esta denominación no tiene connotación valórica, y solo es una medida descriptiva. En una distribución simétrica, el intervalo de normalidad representa, aproximadamente, el 68% de la distribución, quedando, entonces, un 16% sobre lo normal y un 16% bajo lo normal.

Cabe insistir que esta denominación no tiene significado valórico, y solo es una medida descriptiva.

7.3. Teorema de Chebyshev: El teorema de Chebyshev, en su forma más simple y particular, dice que, independientemente de la forma de la distribución de la variable numérica x, al menos el 75% de las observaciones quedan comprendidas en el intervalo:

σ± 2x .

El teorema es más complejo, y describe el % mínimo que queda comprendido en el intervalo σ± kx . El 75% mencionado más arriba es el caso particular para k = 2.

Xmín σ− 2x x σ+ 2x Xmáx

1110

9876543210 x

Fig. 10.4. Teorema de Chebyshev

75%Al menos

Xmín σ−x x σ+x Xmáx

1110

9876543210 x

68%16% 16%

Normal

Fig. 10.3. Concepto de normalidad

Bajo lo normal

Sobre lonormal

Page 85: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

84

III. EJERCICIOS Y PROBLEMAS RESUELTOS 1. Tiempo de espera del Transantiago Los siguientes son los tiempos de espera del Transantiago, de una muestra de personas: Tiempo: 23; 42; 32; 14; 8; 22; 12; 5 minutos 1.1. Calcule el tiempo medio de espera 1.2. Calcule la desviación estándar del tiempo de espera 1.3. Calcule el coeficiente de variación del tiempo de espera 1.4. Calcule el tiempo normal de espera Solución: Ingresando los datos en la calculadora, resulta: 1.1. 7519x ,= min. 1.2. 7811x ,)( =σ min.

1.3. == 10075197811CV ·,, 59,6%

1.4. El tiempo normal de espera se da en 19,75 ± 11,78 minutos. Esto es, entre 7,97 minutos y 31,53 minutos. 2. Tiempo antes de un accidente En una muestra de accidentes laborales se estudió el tiempo trascurrido desde que el trabajador entra a su jornada de trabajo hasta que sufre el accidente. El resultado se muestra en la siguiente tabla:

Tiempo (horas) casos 0 – 2 2 – 4 4 – 6 6 – 8 8 – 12

3 5 11 7 4

2.1. Calcule el tiempo medio transcurrido hasta la ocurrencia de un accidente. 2.2. Calcule la varianza del tiempo transcurrido hasta la ocurrencia de un accidente. 2.3. Calcule el coeficiente de variación del tiempo transcurrido hasta la ocurrencia de un accidente. 2.4. De acuerdo al teorema de Chebyshev, entre qué límites estaría al menos el 75% de las observaciones? Solución: Primero se calculan las marcas de clase de cada intervalo y luego se ingresan los valores a la calculadora:

Tiempo (hr) Xmi casos 0 – 2 1 3 2 – 4 3 5 4 – 6 5 11 6 – 8 7 7 8 – 12 10 4 Σ -

Page 86: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

85

Resultados: 45x ,= horas; =σ 2,52 horas 2.1. Media: Tiempo medio = 5,4 horas En promedio, trascurren 5,4 horas desde que el trabajador entra a su jornada de trabajo hasta que sufre un accidente laboral. 2.2. Varianza La varianza es el cuadrado de la desviación estándar. Entonces:

22 522,=σ = 6,35 2horas 2.3. CV

== 10045522CV ·,, 46,7%

2.4. Chebyshev: Resultados: 45x ,= horas; =σ 2,52 horas

Límite inferior: σ− 2x = 5,4 – 2 · 2,52 = 0,36 horas Límite superior: σ+ 2x = 5,4 + 2 · 2,52 = 10,44 horas

R: Entre 0,36 y 10,44 horas se encuentra, al menos, el 75% de las observaciones. IV. EJERCICIOS Y PROBLEMAS PROPUESTOS 1. Peso de chirimoyas Se mide el peso de una muestra de chirimoyas, llegando a establecer los siguientes estadísticos:

• Peso mínimo: 280 gr. • Peso máximo: 565 gr. • Peso medio: 390 gr. • Peso mediano: 370 gr. • Desviación estándar del peso: 42 gr.

1.1. El rango del peso es igual a: A) 845 gr. B) 422,5 gr. C) 285 gr. D) 280 gr. E) 42 gr. 1.2. El coeficiente de variación del peso es igual a: A) 7,4$ B) 10,8% C) 11,4% D) 12,4% E) 92,8% 1.3. El peso normal de las chirimoyas de la muestra tiene como límite superior: A) 432 gr. B) 348 gr. C) 322 gr. D) 312 gr. E) 222 gr.

Page 87: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

86

1.4. La varianza de los pesos es igual a: E) 42 2gr B) 280 2gr C) 565 2gr D) 285 2gr E) 1.764 2gr 2. Longitud de peces Se realiza un muestreo de peces en cierto sector de un lago, para determinar, entre otras variables biométricas, su longitud. La tabla siguiente corresponde a las longitudes, medidas en cm.

Longitud (cm) fi 5 – 10 17 10 – 20 38 20 – 35 57 35 – 55 34 55 – 80 22 Σ 168

2.1. La longitud mediana de la muestra es: A) 25,0 cm. B) 26,5 cm. C) 27,6 cm. D) 31,4 cm. E) 32,6 cm. 2.2. La longitud media de los peces de la muestra es: A) 31,4 cm. B) 31,2 cm. C) 28,6 cm. D) 27,6 cm. E) 27,3 cm. 2.3. La desviación estándar de la longitud de los peces es: A) 21,2 cm. B) 18,2 cm. C) 17,3 cm. D) 16,4 cm. E) 15,9 cm. 2.4. El coeficiente de variación de la longitud es: A) 18,0% B) 23,5% C) 32,0% D) 58,0% E) 63,2% 2.5. La longitud normal de estos peces se da entre: A) 9,4 y 45,8 cm. B) 9,6 y 44,5 cm. C) 13,2 y 42,1 gr. D) 12,1 y 49,2 gr. E) 13,2 y 49,6 cm. 2.6. Al comparar la media con la mediana, se puede afirmar que: I: Más del 50% de la muestra mide menos que el promedio. II: Un 34,5% de los peces están entre la media y la mediana. III: Menos de la mitad de la muestra mide más de 30 cm. Es (son) correcta(s): A) Ninguna B) Solo I C) Solo III D) Solo I y III E) Solo II y III Solución a problemas propuestos 1.1. C 1.2. B 1.3. A 1.4. E 2.1. C 2.2. A 2.3. B 2.4. D 2.5. E 2.6. D

Page 88: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

87

V. RECURSOS COMPLEMENTARIOS 1. Concepto y cálculo de estadígrafos http://www.bioestadistica.freeservers.com/temas.html Tema 4. Estadígrafos: 2. SECTOR MATEMÁTICA http://www.sectormatematica.cl/educmedia.htm Medida de Dispersión 3. AULAFACIL http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm CLASE 6. Medidas de dispersión - rango, varianza, desviación típica y coeficiente de variación

Page 89: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

88

TERCERA UNIDAD: CÁLCULO DE PROBABILIDADES CLASE 11

FUNDAMENTOS DE ANÁLISIS COMBINATORIO

«El hombre tiene mil planes para sí mismo. El azar, solo uno para cada uno». (Mencio).

APRENDIZAJES ESPERADOS CONTENIDOS

-Operan con análisis combinatorio, resolviendo problemas de combinatoria y permutaciones.

-Factorial de n -Ordenaciones -Permutaciones -Combinaciones

II. DESARROLLO 1. Primero, un cuento de piratas

Un barco, en pleno siglo XVI, navega en alta mar cuando ocurre un motín a bordo. Ya sofocado el intento y apresados los diez culpables, estos son presentados al capitán, quien les lee la sentencia de muerte y el cúmplase de inmediato. Uno de los condenados, sin embargo, se dirige al Capitán, diciéndole: -Capitán, hemos cometido un error y debemos morir. Pero, le solicito una última gracia. -Dime qué deseas. -Queremos que aplace nuestra ejecución. Nosotros diez, nos formaremos en cubierta, en fila, de distintas maneras, tres veces al día. Cuando ya las formas se agoten podrá cumplir la sentencia.

El Capitán piensa un rato. Se pasea, parece sacar cuentas. -Está bien – dice – que sea así. El tiempo pasó y nunca se cumplió la sentencia. Los condenados murieron, al igual que el Capitán y toda la tripulación, de viejos.

2. Principio fundamental Si un suceso A ocurre de n1 maneras distintas y un suceso B ocurre de n2 maneras distintas, entonces, ambos sucesos, A y B, ocurren, de n1 · n2 maneras distintas. Ejemplo: Para obtener un producto, cierto sistema debe realizar dos procesos consecutivos. El proceso A puede realizarse de 3 maneras diferentes, mientras que el proceso B que le sigue, puede realizarse de 5 maneras distintas. ¿De cuántas maneras diferentes es posible obtener el producto? N = 3 x 5 = 15 maneras distintas.

Page 90: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

89

En general, para los sucesos A y B y C y... ocurren de An · Bn · ... · in maneras distintas. Este principio también es llamado regla del producto. 2. Factorial de un número Definición 1: n! = 1 · 2 · 3 · .... · (n – 1) · n n! se lee “n factorial” o “factorial de n” Definición 2: 0! = 1 Ejemplo: 5! = 5 x 4 x 3 x 2 x 1 = 120 Este valor resulta directamente de la calculadora, mediante la tecla SHIFT !x

SHIFT !x 5 = 120

3. Ordenaciones Un conjunto de n elementos pueden ordenarse de n! maneras distintas. Ejemplo: las letras a, b, c y d puede ordenarse de:

4! = 24 maneras distintas: (a, b, c, d); (a, c, b, d); (a, c, d, b); etc. Esta es la solución del cuento de los amotinados. Los 10 pueden formarse en fila de:

10! = 3.628.800 maneras distintas. (Solo es cosa de sacar la cuenta cuánto tiempo les toma, formándose tres veces al día) 4. Permutaciones Las distintas ordenaciones de r elementos tomados desde un conjunto de n elementos, con rn≥ , es:

rnP = )!(

!rn

n−

Ejemplo: ¿Cuántas ordenaciones distintas es posible obtener de un conjunto de 5 elementos, si se toman de tres en tres? 35P = 60 maneras distintas.

Page 91: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

90

Este valor resulta directamente de la calculadora, usando la tecla SHIFT nPr. En el ejemplo: 5 SHIFT nPr 3 = 60 5. Combinaciones Las distintas combinaciones (grupos) de r elementos tomados desde un conjunto de n elementos, con rn≥ , son:

rnC = )!(!

!)(rnr

nrn

−=

La expresión )(rn

se lee “n sobre r”.

Ejemplo: ¿Cuántas grupos distintos es posible obtener de un conjunto de 5 elementos, si se toman de tres en tres?

35 C =)!(!

!)(353

535

−= =

!!!23

5 = 10 grupos distintos.

Este valor resulta directamente de la calculadora, usando la tecla nCr. En el ejemplo: 5 nCr 3 = 10 6. Resumiendo

• En una permutación importa el orden. • En una combinación no importa el orden, sino los elementos que participan.

Las tríadas (a, b, c) y (a, c, b) corresponden a distintas permutaciones, pero a una misma combinación.

III. EJERCICIOS Y PROBLEMAS RESUELTOS 1. Ordenando libros Un estudiante tiene 4 libros de Economía, 3 de Estadística y 6 de Literatura, los que debe ordenar en una repisa o librero. ¿De cuántas maneras puede efectuar este trabajo, si: 1.1. No importa el orden en que queden las materias? 1.2. Los libros del mismo tema deben quedar juntos? 1.3. Los libros de Economía deben quedar juntos? Solución: 1.1. No importa el orden en que queden las materias. En este caso, tenemos las distintas ordenaciones de 4 + 3 + 6 = 13 elementos: Estas son: 13! = 6.227.020.800 maneras distintas.

Page 92: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

91

1.2. Los libros del mismo tema deben quedar juntos.

Los 4 libros de Economía pueden ordenarse de: 4! maneras distintas Los 3 libros de Estadística pueden ordenarse de: 3! maneras distintas Los 6 libros de Literatura pueden ordenarse de: 6! maneras distintas Los 3 grupos de libros pueden ordenarse de: 3! maneras distintas

Luego, por el principio fundamental (regla del producto), los libros del mismo tema pueden ordenarse de: 4! · 3! · 6! · 3! = 622.080 maneras distintas. 1.3. Los libros de Economía deben quedar juntos.

Los libros de Economía pueden ordenarse de: 6! maneras distintas. Los restantes 7 libros + el grupo de libros de Economía pueden ordenarse de 8! maneras distintas. Obsérvese que en este razonamiento los 6 libros de Economía se comportan como uno solo, ya que deben quedar juntos.

Entonces: 6! · 8! = 29.030.400 son las distintas formas de ordenación. 2. Grupo a capacitación Una fábrica tiene 8, 4 y 5 trabajadores en las secciones A, B y C, respectivamente. Enviará a 6 de ellos a una capacitación. Si la elección se hace en forma aleatoria, ¿Cuántos grupos distintos podrían enviarse si el grupo debe quedar conformado por: 2.1. Trabajadores de cualquier sección? 2.2. Dos de cada sección? 2.3. A lo menos 2 de la sección B? Solución: 2.1. Trabajadores de cualquier sección: Este caso corresponde a extraer un grupo de 6 trabajadores desde un conjunto de 17.

El número de grupos posibles es: )(6

17= 12.376

2.2. Dos de cada sección:

Los dos trabajadores de la sección A pueden ser seleccionados de: )(28

= 28 maneras diferentes,

Los dos trabajadores de la sección B pueden ser seleccionados de: )(24

= 6 maneras diferentes,

Los dos trabajadores de la sección C pueden ser seleccionados de: )(25

= 10 maneras diferentes;

Entonces, por el principio fundamental (regla del producto), dos trabajadores de cada sección pueden ser seleccionados de:

)(28

· )(24

· )(25

= 1.680 maneras distintas.

Page 93: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

92

2.3. A lo menos 2 de la sección B. A lo menos 2 de la sección B significa 2 ó 3 ó 4 de B (y el resto de las otras secciones):

Dos trabajadores de B y 4 de las otras secciones es: )(24

· )(4

13 = 4.290

Tres trabajadores de B y 3 de las otras secciones es: )(34

· )(3

13 = 1.144

Cuatro trabajadores de B y 2 de las otras secciones es: )(44

· )(2

13 = 78

Luego, a lo menos 2 trabajadores de la sección B es: 4.290 + 1.144 + 78 = 5.512 maneras distintas. IV. EJERCICIOS Y PROBLEMAS PROPUESTOS 1. Cálculos numéricos

1.1. El valor numérico de la expresión: )()·(4

15511

=

A) 630.630 B) 1.827 C) 1.733 D) 1.365 E) 462

1.2. El valor numérico de la expresión: )(·)()·(04

613

57

=

A) 0 B) 2.496.144 C) 36.036 D) 45.040 E) 54.360

1.3. El valor numérico de la expresión: )(

)()·(

1220

814

46

=

A) 0,1245 B) 0,2687 C) 0,3096 D) 0,3576 E) 0,4591 2. Problemas varios 2.1. ¿Cuántos grupos distintos de 4 personas puede formarse a partir de un conjunto de 15 personas? A) 3 B) 4 C) 1.365 D) 4.564 E) 32.760 2.2. Con los números del 1 al 9, ¿cuántos números distintos de 5 dígitos pueden formarse, si no se puede repetir los dígitos en un mismo número? A) 126 B) 45 C) 3.024 D) 15.120 E) 20.510 2.3. Un grupo musical tiene 17 canciones. Si desea grabar un disco con una selección de 8 canciones, ¿cuántos posibles discos podrían resultar, si la selección se hace al azar? A) 26.320 B) 24.310 C) 15.680 D) 12.360 E) 10.450

Page 94: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

93

3. Proveedores Una empresa tiene 11 proveedores norteamericanos, 7 europeos y 15 asiáticos. Entre ellos, debe seleccionar 7 para realizar una auditoría de gestión de proveedores. ¿Cuántas muestras son posibles de formar si esta debe quedar conformada por: 3.1. Cuatro proveedores asiáticos, 2 norteamericanos y 1 europeo? A) 525.525 B) 475.075 C) 427.204 D) 75.075 E) 65.540 3.2. Proveedores del mismo origen? A) 427.204 B) 6.766 C) 6.435 D) 212.355 E) 14.550 3.3. Tres norteamericanos? A) 165 B) 330 C) 7.315 D) 525.525 E) 1.206.975 3.4. A lo más dos asiáticos? A) 31.824 B) 278.460 C) 62.370 D) 899.640 E) 1.209.924 Solución a problemas propuestos 1.1. A 1.2. C 1.3. D 2.1. C 2.2. D 2.3. B 3.1. A 3.2. B 3.3. E 3.4. E V. RECURSOS COMPLEMENTARIOS 1. Visite el sitio SECTOR MATEMÁTICA http://www.sectormatematica.cl/educmedia.htm Para descargar teoría y ejercicios de combinatoria. 2. Visite el sitio AULAFACIL http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm CLASE 18. Combinaciones, Variaciones y Permutaciones (I)

Page 95: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

94

TERCERA UNIDAD: CÁLCULO DE PROBABILIDADES CLASE 12

INTRODUCCIÓN AL CÁLCULO DE PROBABILIDADES «...si agita hoy, con su aleteo, el aire de Pekín,

una mariposa puede modificar los sistemas climáticos de Nueva York el mes que viene».

APRENDIZAJES ESPERADOS CONTENIDOS -Identifican el concepto de probabilidad y su importancia en la concepción de mundo. -Aplican conceptos y definiciones para diferenciar experimentos aleatorios y no aleatorios. -Identifican, en casos dados, experimento aleatorio, espacio muestral, suceso, su correspondiente nomenclatura y notación. -Resuelven problemas de cálculo de probabilidad de sucesos simples, aplicando el concepto básico de probabilidad de Laplace.

-Concepto de probabilidad y su importancia. -Experimento aleatorio, espacio muestral, suceso, su correspondiente nomenclatura y notación. -Cálculo de probabilidad de sucesos simples, aplicando el concepto básico de probabilidad de Laplace.

II. DESARROLLO 1. Origen de la teoría de la probabilidad Probabilidad es el grado de verosimilitud que se le atribuye a un enunciado, o el grado de certeza o confianza que pueden tener nuestras creencias acerca de sucesos futuros. La probabilidad puede expresarse mediante un valor numérico y, en este caso, la probabilidad es una medida de la posibilidad de ocurrencia de un acontecimiento, expresada mediante un número. Aunque la percepción del azar es un elemento presente en toda la historia humana, la probabilidad, como teoría matemática, recién nace en el siglo XVII, a instancias de los señores jugadores de la época, que pidieron a los matemáticos que estudiaran las posibilidades de ganar en los juegos de azar. Se destacan en este período fundacional de la teoría, Gerolamo (1501-1576), Galileo Galilei (1564-1642), Christian Huygens (1629-1695), considerado el iniciador de la teoría de las probabilidades, y sobre todo Blaise Pascal (1623-1662) y Pierre Fermat (1601-1665). ¿Qué ocurre, que parecemos disfrutar de lo estable y permanente, en contra de aquello que se nos aparece difuso, cambiante y huidizo? La respuesta a esta interrogante no es sencilla. Tiene que ver con los conceptos de mundo que se fueron tejiendo y enraizando en nuestra sociedad desde muy antiguo. Tiene que ver con la filosofía, con la religión, con las ideas. En resumen, con la historia de nuestra sociedad y de su cultura. Hoy, cuando muchos autores, desde los más diversos ámbitos proclaman la sociedad informática, la sociedad de flujos, la sociedad líquida, una sociedad cambiante y veloz, parecen cobrar sentido las palabras de Heráclito: “Son distintas las aguas que cubren a los que entran en el mismo río”. Si el mundo contemporáneo es transformación, cambio veloz, azar e incertidumbre, debemos al menos generar mecanismos que nos permitan operar en él. Y he aquí que la teoría de la probabilidad nos viene a proveer esa herramienta. 2. Conceptos básicos de probabilidades

2.1. Experimento aleatorio: Un experimento aleatorio es una acción que da origen a un fenómeno en cuyos resultados interviene el azar. En estos fenómenos, se pueden conocer todos los resultados posibles, pero no se puede predecir cuál de ellos ocurrirá. Un experimento aleatorio se puede repetir todas las veces que se desee, pero sus resultados particulares no se pueden predecir. Por ejemplo, en el lanzamiento de un dado para observar qué número resulta, se puede determinar el conjunto de resultados posibles (1, 2, 3, 4, 5, 6), pero no es posible predecir ninguno de ellos. Suele representarse por la letra E.

Page 96: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

95

2.2. Espacio muestral (Ω): Es el conjunto de todos los resultados posibles de un experimento aleatorio. Se representa por Ω. Ejemplo: Experimento: E = lanzamiento de un dado Espacio muestral: Ω = {1, 2, 3, 4, 5, 6}

2.3. Suceso o evento: Es cualquier subconjunto del espacio muestral Ω. Generalmente se representan mediante las primeras letras mayúsculas: A, B, C, etc. Ejemplo:

Experimento: E = lanzamiento de un dado. Espacio muestral: Ω = {1, 2, 3, 4, 5, 6} Suceso A: A = se obtiene número par. A = {2, 4, 6}

3. Tipos de sucesos

3.1. Sucesos simples y compuestos: 3.1.1. Sucesos simples: Cuando un evento puede ocurrir de una sola forma. 3.1.2. Sucesos compuestos: Cuando un resultado puede ocurrir de diversas formas. Un suceso compuesto, a su vez, puede dividirse en varios eventos simples.

Ejemplo: Lanzar un dado y observar si “resulta un número par”:

Este suceso está compuesto por los siguientes sucesos simples: Resulta el 2. Resulta el 4. Resulta el 6. Entonces: Resulta número par = Resulta el 2 o resulta el 4 o resulta el 6. 3.2. Suceso seguro: Es aquel que siempre se verifica como resultado de un experimento aleatorio. A = Obtener un número entero del 1 al 6 al lanzar un dado normal. A es un suceso seguro.

3.3. Suceso imposible: Es aquel que nunca se verifica como resultado de un experimento aleatorio. A = Obtener un número mayor que 6 al lanzar un dado normal. A es un suceso imposible.

3.4. Suceso complementario o contrario: Dos sucesos son contrarios si uno es la negación lógica del otro. A = Obtener Nº6 al lanzar un dado. B = No obtener Nº6 al lanzar un dado. Ay B son sucesos contrarios. Suelen representarse por A y A’, respectivamente.

3.5. Sucesos mutuamente excluyentes: Dos o más sucesos son mutuamente excluyentes si no pueden ocurrir en forma simultánea. A = Se obtiene Nº3 al lanzar un dado. B = Se obtiene Nº4 al lanzar un dado. A y B son sucesos mutuamente excluyentes. No pueden ocurrir ambos a la vez.

Page 97: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

96

OBSERVACIÓN: Los sucesos contrarios son mutuamente excluyentes, pero, no todos los sucesos mutuamente excluyentes son contrarios. 3.6. Sucesos independientes: Dos o más sucesos son independientes si la ocurrencia de uno de ellos no afecta la probabilidad de ocurrencia del otro. A = Se obtiene Nº3 al lanzar un dado. B = Se obtiene sello al lanzar una moneda. A y B son sucesos independientes. 3.7. Sucesos condicionales: Dos sucesos A y B son condicionales si la probabilidad de ocurrencia del suceso B está condicionada a la ocurrencia de un suceso anterior A.

4. Probabilidad de sucesos

4.1. Probabilidad de Laplace: La probabilidad de que ocurra un suceso A se cuantifica a través de la razón entre el número de casos favorables al suceso A y el número total de casos posibles. Numéricamente puede expresarse como fracción, como decimal o como tanto por ciento.

posiblescasosdeN

AsucesoalfavorablescasosdeN)A(P°

°=

4.2. Enfoque de la probabilidad a priori: Consiste en determinar la probabilidad de un suceso que aún no ha sucedido. Ejemplo: ¿Cuál es la probabilidad de obtener un número impar al lanzar una vez un dado normal?

Casos favorables: 3. Casos totales: 6.

Entonces, P(Nº impar) = 21

63= .

4.3. Enfoque de la probabilidad empírica: Consiste en determinar la probabilidad de un suceso con los datos históricos de casos sucedidos. Es decir, se cuenta con antecedentes empíricos. Ejemplo: Se han lanzado dos monedas 25 veces, registrando los siguientes resultados:

Suceso Nº de observaciones

Cara – Cara Sello – Cara Cara – Sello Sello – Sello

4 7 8 6

Total 25

Page 98: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

97

¿Cuál es la probabilidad de obtener dos sellos? Casos favorables: 6 Casos totales: 25

Entonces: P(2 sellos) = 256 = 0,24.

5. Álgebra de sucesos

5.1. Notación: Si A y B son sucesos en el espacio muestral Ω. Entonces:

Suceso Significado

A Ocurre el suceso A.

A’ No ocurre A.

(A o B) Ocurre A o B.

(A y B) Ocurren A y B, ambos.

(A – B) Ocurre A y no ocurre B.

(B / A) Ocurre B, dado que ocurrió A

5.2. Diagramas de sucesos: Si A y B son sucesos en el espacio muestral Ω. Con el espacio muestral representado por un rectángulo y los sucesos por círculos. Entonces, la representación gráfica de los sucesos básicos es:

Lo sombreado Significado

A Ocurre el suceso A.

Lo sombreado Significado

A’ NO ocurre el suceso A.

Lo sombreado Significado

A o B Ocurre el suceso A o el B

Lo sombreado Significado

A y B Ocurren A y B, ambos a la vez.

B Ω

B A B

Ω

A

B Ω

B A B

Ω

A

Page 99: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

98

III. EJERCICIOS Y PROBLEMAS RESUELTOS 1. Trabajo y estudio Interesa estudiar la actividad de los jóvenes egresados de Educación Media, en cuanto su estudio y su trabajo. Se definen los sucesos E y T como:

E = estudia. T = trabaja.

1.1. Indique en lenguaje corriente el significado del suceso: (T – E) 1.2. Escriba algebraicamente el suceso: “trabaja, dado que no estudia”. 1.3. Dibuje un diagrama para el suceso: “Ni trabaja, ni estudia”. 1.4. Indique, en lenguaje corriente y en lenguaje algebraico el suceso representado en el diagrama siguiente: Solución: 1.1. Del diagrama de álgebra de sucesos, se deduce que: (T – E) = trabaja, pero no estudia 1.2. Del cuadro de álgebra de sucesos, se deduce que: “Trabaja, dado que no estudia” = (T / E’) 1.3. Diagrama para el suceso: “Ni trabaja, ni estudia”. 1.4. Lo sombreado corresponde a:

(E – T) = Estudia, pero no trabaja. O bien: (E y T’) = Estudia y no trabaja.

Lo sombreado Significado

A - B Ocurre A, pero no ocurre B B

Ω

B A B A

B Ω

B E T

Ω

T E E

Page 100: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

99

2. Focus group Se tiene un grupo a investigar conformado por 11 personas de zonas urbanas y 7 de zonas rurales con los cuales se realizó un focus group para testear su opinión respecto de un producto del mercado. Con el objeto de realizar entrevistas en profundidad, se deben seleccionar al azar un total de 5 personas de este grupo. 2.1. ¿Cuál es la probabilidad de que resulten 5 personas de sectores urbanos? 2.2. ¿Cuál es la probabilidad de que resulten 3 rurales? Solución: Se trata de una situación en la que están implicados procesos combinatorios. 2.1. ¿Cuál es la probabilidad de que resulten 5 urbanos? Casos favorables: es la combinatoria de 5 sujetos tomados de un grupo de 11 urbanos. Total de casos: es la combinatoria de 5 sujetos tomados de un grupo de 18. Aplicando la fórmula de Laplace:

P(5 urbanos) = )(

)(

518511

= 0,054

2.2. ¿Cuál es la probabilidad de que resulten 3 rurales? Casos favorables: es la combinatoria de 3 sujetos tomados de un grupo de 7 rurales con la combinatoria de 2 sujetos tomados de un grupo de 11 urbanos. Total de casos: es la combinatoria de 5 sujetos tomados de un grupo de 18. Aplicando la fórmula de Laplace:

P(3 rurales) = )(

)(·)(

518

37

211

= 0,225

3. Número de hijos El siguiente gráfico muestra la distribución de una muestra de mujeres según número de hijos vivos al momento de la encuesta.

Nº de hijos vivos

0 1 2 3

32

28

24

20

16

12

8

4

0

Nº casos

32

1612

8

Page 101: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

100

3.1. De acuerdo al gráfico, ¿cuál es la probabilidad de que una mujer de la muestra tenga hijos vivos? 3.2. De acuerdo al gráfico, ¿cuál es la probabilidad de que una mujer de la muestra tenga más de 1 hijo vivo? 3.3. De acuerdo al gráfico, ¿cuál es la probabilidad de que una mujer de la muestra tenga a lo más 1 hijo vivo? Solución: 3.1.

Casos favorables: 16 + 12 + 8 = 36 Casos totales: 32 + 16 + 12 + 8 = 68

Probabilidad = 6836 = 0,529

3.2.

Casos favorables: 12 + 8 = 20 Casos totales: 32 + 16 + 12 + 8 = 68

Probabilidad = 6820 = 0,294

3.3.

Casos favorables: 32 + 16 = 48 Casos totales: 32 + 16 + 12 + 8 = 68

Probabilidad = 6848 = 0,706

IV. EJERCICIOS Y PROBLEMAS PROPUESTOS 1. Isla Negra En la localidad de Isla Negra, son dos las atracciones principales para los turistas: N = visitar la Casa de Neruda; P = ir a la playa. 1.1. El suceso “El turista va a la playa, pero no visita la casa de Neruda”, algebraicamente se escribe: A) P y N’ B) P y N C) N y P’ D) P o N’ E) N o P 1.2. El suceso (N o P)’, representa a los turistas que: A) Solo hacen una de las dos actividades B) No realizan ninguna de las dos actividades C) Realizan a lo más una de las actividades D) Realizan ambas actividades E) Realizan a lo menos una de las dos actividades

Page 102: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

101

1.3. El suceso representado en el diagrama se refiere a los turistas que: A) Solo hacen una de las dos actividades B) Realizan a lo más una de las actividades C) Realizan a lo menos una de las dos actividades D) Realizan ambas actividades E) No realizan ambas actividades 2. En el espacio muestral Ω de la figura, se han definido los sucesos A y B. 2.1. Respecto del suceso A y el suceso B, se dice que son: A) Complementarios B) Contrarios C) Imposibles D) Seguros E) Mutuamente excluyentes 3. En el espacio muestral Ω de la figura, se han definido los sucesos S y T. 3.1. El suceso sombreado es: A) Ocurre T y no S B) Ocurren S y T C) Ocurre S, pero no T D) No ocurre S, pero sí ocurre T E) No ocurre S

A

S Ω

T

B Ω

B P N

Page 103: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

102

3.2. El suceso sombreado se escribe: A) T y S B) S y T’ C) T – S D) (S o T)’ E) S’ o T 4. Lanzamiento de dados Se lanzan simultáneamente dos dados normales para ver qué números resultan en su cara superior. 4.1. ¿Cuántos elementos tiene el espacio muestral de este experimento? A) 6 B) 12 C) 18 D) 21 E) 36 4.2. La probabilidad de que resulte suma 7 es: A) 0,857 B) 0,667 C) 0,333 D) 0,167 E) 0,194 5. Tómbola En una tómbola hay un total de 10 bolitas, de las cuales 3 son azules y 7 son blancas. 5.1. Si se extraen al azar dos bolitas en forma simultánea, ¿cuál es la probabilidad de que resulten ambas azules? A) 0,067 B) 0,309 C) 0,667 D) 0,3 E) 0,2 5.2. Si se extraen al azar dos bolitas en forma simultánea, ¿cuál es la probabilidad de que las dos resulten blancas? A) 0,286 B) 0, 143 C) 0, 467 D) 0,2 E) 0,7 Solución a problemas propuestos 1.1. A 1.2. B 1.3. D 2.1. E 3.1. C 3.2. B 4.1. E 4.2. D 5.1. A 5.2. C V. RECURSOS COMPLEMENTARIOS 1. Conceptos básicos de probabilidad: -Spiegel, Murray. Probabilidad y Estadística. McGraw Hill, 2003. ISBN: 9584101331. Capítulo I. 2. Fisterra http://www.fisterra.com/mbe/investiga/index.asp Breve desarrollo teórico + ejemplo. Documentos en pdf descargables. Ver tema Nº5: Cálculo de probabilidades: nociones básicas 3. AULAFACIL http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm CLASE 14. Probabilidad: Introducción

Page 104: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

103

TERCERA UNIDAD: CÁLCULO DE PROBABILIDADES CLASE 13

AXIOMAS, TEOREMAS Y ÁLGEBRA DE SUCESOS

«Dios juega a los dados y...¡además los tiene trucados!» (Prigogine).

APRENDIZAJES ESPERADOS CONTENIDOS

-Operan con axiomas y álgebra de sucesos. -Utilizan conceptos, definiciones y axiomas de probabilidad para describir experimentos, eventos, espacio muestral y calcular probabilidades simples de problemas relacionados con la especialidad. -Utilizan las reglas de la adición para calcular probabilidades de eventos, resolviendo problemas relacionados con la especialidad. -Utilizan las reglas de la multiplicación para calcular probabilidad de eventos, resolviendo problemas relacionados con la especialidad

-Reglas de la adición: Eventos mutuamente excluyentes. -Probabilidad del complemento. -Probabilidad conjunta -Regla para la adición -Reglas para la multiplicación -Eventos independientes -Regla especial de la multiplicación para eventos independientes.

II. DESARROLLO TEOREMAS DE LA PROBABILIDAD Si A y B son sucesos en el espacio muestral Ω y P(A) y P(B) sus respectivas probabilidades, entonces se verifican las siguientes propiedades: 1. Valores extremos de P

10 ≤≤ )A(P La probabilidad de un suceso es un número real con un valor entre cero y 1, ambos valores inclusive. 2. Probabilidad del suceso imposible y del suceso seguro

P(A) = 0 ⇔ A = suceso imposible P(A) = 1 ⇔ A = suceso seguro

• Mientas más cercana a 1 es la probabilidad de un suceso, mayor grado de confianza de que ocurrirá. • Mientas más cercana a 0 es la probabilidad de un suceso, mayor grado de confianza de que NO ocurrirá.

3. Probabilidad de dos sucesos contrarios

P(A')= 1 – P(A) ⇒ P(A) + P(A') = 1 Donde A y A’ son sucesos contrarios. Se suele llamar p a la probabilidad de un suceso y q a la probabilidad del suceso contrario, entonces: q = 1 – p ⇒ p + q = 1

Page 105: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

104

Ejemplo: Cierto día, la probabilidad de que llueva es 0,35. Por lo tanto, la probabilidad de que no llueva es: P(No lluvia) = 1 – P(Lluvia) = 1 – 0,35 = 0,65. p = probabilidad de lluvia; q = probabilidad de NO lluvia. p = 0,35; q = 0,65; p + q = 0,35 + 0,65 = 1 4. Probabilidad de sucesos mutuamente excluyentes P(A o B) = p(A) + p(B) ⇒ A y B son sucesos mutuamente excluyentes. Esta propiedad es llamada también “regla de la suma de probabilidades”. Solo es válida para sucesos mutuamente excluyentes. Ejemplo: En una empresa trabajan 3 ejecutivos, 4 administrativos y 6 operarios. Si se selecciona una persona al azar, la probabilidad de que sea un operario o un administrativo es:

P(O o A) = p(O) + P(A) = 136 +

134 =

1310 = 0,7692

5. Probabilidad de sucesos independientes

P(A y B) = P(A) · P(B) ⇒ A y B son sucesos independientes.

Esta propiedad es llamada también “regla del producto de probabilidades”. Solo es válida para sucesos independientes.

Ejemplo: Si la probabilidad de lluvia es P(L) = 0,4 y la probabilidad de que corra viento es P(V) = 0,15, entonces, si ambos fenómenos son independientes, la probabilidad de que llueva con viento es:

P(V y L) = 0,15 · 0,4 = 0,06.

6. Probabilidad de diferencia de sucesos P(A – B) = P(A) – P(A y B)

Lo siguiente, es equivalente: P(A – B) = P(A y B’)

Ejemplo: Si la probabilidad de lluvia es P(L) = 0,4 y la probabilidad de que corra viento es P(V) = 0,15, entonces, si ambos fenómenos son independientes, ¿cuál es la probabilidad de que llueva, pero no corra viento? P(L – V) = P(L) – P(L y V) = 0,4 – 0,06 = 0,34

Page 106: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

105

III. EJERCICIOS Y PROBLEMAS RESUELTOS 1. Accidentes laborales: Para el estudio de ciertos accidentes laborales, se definen los sucesos siguientes: A = el accidente se produce por acción insegura por parte del trabajador. C = el accidente se produce por condición insegura en el lugar de trabajo. Se sabe que: P(A) = 0,56; P(C) = 0,48 y P(A y C) = 0,12 1.1. Calcule P(A – C) 1.2. Calcule la probabilidad de accidente por Condición insegura, pero no por Acción insegura. Solución: Es conveniente trazar un diagrama, indicando en él las probabilidades dadas: 1.1. P(A – C) Esta es la probabilidad de accidente por Acción insegura, pero no por Condición insegura. En el diagrama esta probabilidad es 0,44. Aplicando el teorema correspondiente: P(A – C) = P(A) – P(A y C) P(A – C) = 0,56 – 0,12 = 0,44 1.2. P(C – A) Aplicando el teorema correspondiente: P(C – A) = P(C) – P(A y C) = 0,48 – 0,12 = 0,36 Este resultado es consistente con la cifra del diagrama. 2. Lanzamiento de un dado Una persona lanza un dado normal varias veces hasta que logra obtener el número 5. ¿Cuál es la probabilidad de que logre su objetivo en el cuarto lanzamiento? Solución: Si A = obtener 5, entonces: P(A) = 1/6 y P(A’) = 5/6 El suceso que debe ocurrir es: A’ y A’ y A’ y A Aplicando la propiedad multiplicativa, tenemos:

=61

65

65

65 ··· 125/1296 = 0,09645

B Ω

0,120,44

0,36

A C

0,08

Page 107: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

106

3. Compra de medicamento Se sabe que el 70% de los clientes que consultan por cierto medicamento en una farmacia, lo compran. 3.1. Si 3 clientes preguntan por el medicamento, ¿cuál es la probabilidad de que los tres lo compren? 3.2. Si 2 clientes preguntan por el medicamento, ¿cuál es la probabilidad que solo uno de ellos lo compre? Solución: 3.1. C = compra; P(C) = 0,7. Luego, P(C’) = 0,3 Debe ocurrir el siguiente suceso: C y C y C Aplicando la regla del producto, tenemos que: P(los 3 compran) = 0,7 x 0,7 x 0,7 = 0,343 3.2. Debe ocurrir el siguiente suceso: C y C’ o C’ y C Aplicando la regla del producto y de la suma, tenemos que: P(solo uno compra) = 0,7 x 0,3 + 0,3 x 0,7 = 0,42 IV. EJERCICIOS Y PROBLEMAS PROPUESTOS 1. Sean A y B dos sucesos en el mismo espacio muestral Ω y p(A) y p(B) sus respectivas probabilidades de ocurrencia. Si p(A) + p(B) = 1, entonces se puede concluir que los sucesos A y B son: A) Condicionales B) Equiprobables C) Imposibles D) Seguros E) Complementarios 2. Si p representa la probabilidad de un suceso A y q la probabilidad del suceso contrario, entonces, siempre: A) p + q = 1 B) p ⋅ q = 1 C) p – q > 0 D) 1 – p < 0 E) q < 0 3. Declaraciones de renta Según datos entregados por el Servicio de Impuestos Internos (SII), el año 2005, en Chile, el 96% de las declaraciones de renta fueron realizadas a través de Internet. Si se seleccionan al azar dos declaraciones de renta de ese año, ¿cuál es la probabilidad de que solo una de ellas haya sido realizada por Internet? A) 0,96 B) 0,92 C) 0,0768 D) 0,04 E) 0, 0384

Page 108: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

107

4. Venta de automóviles En la tabla adjunta, la variable aleatoria X = Nº de automóviles mensuales vendidos por vendedor (con x ≥ 3) y P(x) su probabilidad:

X 3 4 5 6 7 8 o más

P(x) 0,07 0,21 p 0,19 0,11 0,09

La probabilidad de que un vendedor venda más de 4 automóviles en un mes es: A) 0,33 B) 0,72 C) 0,28 D) 0,39 E) Faltan datos 5. Virus informático Se ha constatado que el 32% de los computadores PC están infectados con virus del tipo Spyware, que el 20% está infectado con Spyware y Troyano y que el 14% tiene Troyano, pero no Spyware, siendo estas dos infecciones independientes una de otra. Si S representa el suceso “Tiene Spyware” y T el suceso “Tiene Troyano”, entonces: 5.1. P(T – S) = A) 0,14 B) 0,18 C) 0,46 D) 0,54 E) 0,72 5.2. La probabilidad de que un computador no tenga ninguno de estos dos tipos de virus es: A) 0,86 B) 0,54 C) 0,14 D) 0,46 E) 0, 68 5.3. La probabilidad de que un computador esté infectado de Troyano, pero no de Spyware, se escribe: A) P(T’ y S’) B) P(T – S’) C) P(S y T’) D) P(T y S’) E) P(T o S’) 6. Microempresa de PC Una microempresa se dedica a comprar computadores en uso, los refacciona y vuelve a vender, con 2 meses de garantía. Por experiencia se sabe que durante el período de garantía, la probabilidad de que un equipo vendido tenga fallas de hardware es 0,36 y que tenga fallas de software es 0,15. Ambos tipos de fallas son las únicas que se pueden dar y son independientes entre sí. 6.1. La probabilidad de que, en el período de garantía, un equipo presente ambos tipos de falla es: A) 0,25 B) 0,48 C) 0,51 D) 0,065 E) 0,054 6.2. La probabilidad de que, en el período de garantía, un equipo presente fallas de software, pero no de hardware es: A) 0,21 B) 0,152 C) 0,54 D) 0,096 E) 0,51 6.3. ¿Cuál es la probabilidad de que, en el período de garantía, un equipo no presente ninguno de estos dos tipos de fallas? A) 0,85 B) 0,64 C) 0,544 D) 0,49 E) 0,21 Solución a problemas propuestos 1. E 2. A 3. C 4. B 5.1. A 5.2. B 5.3. D 6.1. E 6.2. D 6.3. C

Page 109: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

108

V. RECURSOS COMPLEMENTARIOS 1. Conceptos básicos de probabilidad: -Spiegel, Murray. Probabilidad y Estadística. McGraw Hill, 2003. ISBN: 9584101331. Capítulo I. 2. AULAFACIL http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm CLASE 16. Cálculo de probabilidades CLASE 17. Probabilidad de sucesos 3. SECTOR MATEMÁTICA http://www.sectormatematica.cl/educmedia.htm Para descargar teoría y ejercicios de Probabilidades

Page 110: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

109

TERCERA UNIDAD: CÁLCULO DE PROBABILIDADES CLASE 14 PROBABILIDAD DE SUCESOS CONDICIONALES

«Tampoco es inescrutable el azar, también está regido por un orden».

(Novalis).

APRENDIZAJES ESPERADOS CONTENIDOS

-Utilizan diagrama de árbol para organizar y evaluar probabilidades de sucesos condicionales. -Calculan probabilidades utilizando el teorema de Bayes. -Utilizan diagrama de árbol, probabilidad total y teorema de Bayes para resolver, interpretar y resolver problemas relacionados con la especialidad.

-Probabilidad condicional -Teorema de Bayes. -Probabilidad total -Diagrama de árbol.

II. DESARROLLO 1. Sucesos independientes Si A y B son sucesos en el espacio muestral Ω y P(A) y P(B) sus respectivas probabilidades, entonces se pueden definir los siguientes conceptos: Se dice que el suceso A es independiente de suceso B, si:

P(A / B) = P(A) Esto es, que la probabilidad de que ocurra A, dado que ocurrió B, es simplemente P(A). En otras palabras, la ocurrencia de B no interviene en la probabilidad de ocurrencia de A. En otro caso, se dirá que A y B son condicionales o dependientes. De acuerdo a clases anteriores, para dos sucesos A y B, independientes, se verifica que: P(A y B) = P(A) · P(B) (Ver teorema y ejemplos en la clase 13). 2. Probabilidad de sucesos condicionales Sean A y B dos sucesos en el espacio muestral Ω y P(A) y P(B) sus respectivas probabilidades. Si la ocurrencia de A está condicionada por la ocurrencia del suceso B, entonces, la probabilidad de que ocurra B, dado que ocurrió A está dada por:

P(B / A) = )(

)(AP

ByAP (1)

Ejemplo: Si P(A) = 0,4; P(B) = 0,3 y P(A y B) = 0,14; entonces:

P(A / B) = 30

140,, = 0,4667

También:

P(B / A) = 40

140,, = 0,35

Page 111: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

110

De la relación (1), despejando, se obtiene que:

(P y B) = P(A) ⋅ P(B / A). (2) Esta es la regla del producto para dos sucesos condicionales. 3. Teorema de la probabilidad total Si un suceso A debe resultar en uno de los sucesos mutuamente excluyentes 1A , 2A , etc, entonces, la probabilidad de A es igual a: P(A) = P( 1A ) · P(A / 1A ) + P( 2A ) · P(A / 2A ) + … = )/(·)( ii AAPAPΣ ; con i = 1, 2, … Este es el llamado teorema de la probabilidad total. 4. Teorema de Bayes De la relación de la probabilidad condicional (1):

P(B / A) = )(

)(AP

ByAP

Es posible hacerse la pregunta: ¿Cuál es la probabilidad de que haya ocurrido A, dado que ya ocurrió B? Esta probabilidad está dado por:

P(A / B) = )(

)/(·)(BP

ABPAP

Este es el caso particular del teorema de Bayes, válido para dos sucesos A y B. En general: Si 1A , 2A , etc, son sucesos mutuamente excluyentes cuya unión es el espacio muestral Ω , entonces, si B es cualquier suceso, es posible calcular la probabilidad de los sucesos 1A , 2A , etc, que pueden causar la ocurrencia de B, mediante:

P( iA / B) = )/(·)()/(·)(

AiBPAPABPAP

i

iiΣ

; con i = 1, 2, …

Este es el llamado teorema de Bayes. Toda vez que el teorema de Bayes calcula la probabilidad de un suceso dado que ya ocurrió algo, se dice que “apunta hacia el futuro”. Por este motivo, este teorema tiene hoy en día gran aplicación en la toma de decisiones.

Page 112: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

111

5. Diagrama de árbol Un diagrama de árbol es un esquema gráfico que ayuda a analizar una situación de probabilidad condicional, cuando se deben producir dos o más sucesos, uno después del otro. Este diagrama se desarrolla de izquierda a derecha (árbol horizontal), siguiendo las siguientes directrices:

1º: Cada suceso se representa por una rama, con bifurcaciones señaladas por las distintas posibilidades del suceso. En el diagrama, se definen dos ramas, pero pueden ser más. 2º: Cada rama parcial lleva especificada su respectiva probabilidad. En cada suceso, la suma de las probabilidades de sus ramas es 1. En el esquema, P(A) + P(B) = 1; P(C) + P(D) = 1; etc. 3º: El final de cada rama parcial se constituye en un nudo del cual parten nuevas ramas, según las posibilidades del siguiente suceso. 4º: Cada secuencia de ramas constituye un suceso. Su probabilidad está dada por la regla del producto. 5º: La suma de las probabilidades al final de cada secuencia de ramas es 1 (probabilidad total). En el diagrama, P(A y C) + P(A y D) + (B y E) + P(B y F)= 1

III. EJERCICIOS Y PROBLEMAS RESUELTOS 1. Accidentes laborales: Para el estudio de ciertos accidentes laborales, se definen los sucesos siguientes: A = el accidente se produce por acción insegura por parte del trabajador. C = el accidente se produce por condición insegura en el lugar de trabajo. Se sabe que: P(A) = 0,56; P(C) = 0,48 y P(A y C) = 0,12

1.1. Calcule P(A / C) 1.2. Calcule la probabilidad de accidente por Condición insegura, dado que hubo Acción insegura. 1.3. ¿Son A y C, sucesos independientes?

Solución: 1.1. P(A / C). Esta es la probabilidad de accidente por Acción insegura, dado que hubo Condición insegura. Aplicando el teorema correspondiente:

A

C

D

B

E

F

P(A)

P(B)

P(C)

P(D)

P(E)

P(F)

P(A y C) = P(A) · P(C/A)

P(B y E) = P(B) · P(E/B)

P(A y D) = P(A) · P(D/A)

P(B y F) = P(B) · P(F/B)

SUCESO 1 SUCESO 2

Page 113: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

112

P(A / C) = )(

)(CP

CyAP = 480120,, = 0,25

1.2. P(C / A): Esta es la probabilidad de accidente por Condición insegura, dado que hubo Acción insegura. Aplicando el teorema correspondiente:

P(C / A) = )(

)(AP

CyAP = 560120,, = 0,2143

1.3. Para que A y C sean independientes debe verificarse lo siguiente: P(A) · P(C) = P(A y C) Remplazando los valores dados: P(A) = 0,56; P(C) = 0,48 y P(A y C) = 0,12 0,56 · 0,48 = 0,12 ≠26880, 0,12 Por lo tanto, A y C no son independientes. 2. Extracción sin reposición En una urna hay 4 fichas blancas y 5 negras de igual peso y tamaño. De esta caja, se extrae al azar y sin reposición, dos fichas. ¿Cuál es la probabilidad de que ambas resulten negras? Solución: Método 1: Se trata de una situación de sucesos condicionales. Al no haber reposición, una vez que se extrae la primera ficha, para la segunda extracción el espacio muestral se ha modificado, dependiendo del resultado de la primera. En la primera extracción hay 5 negras de un total de 9. Por lo tanto:

P( 1N ) = 95

Para la segunda extracción hay solo 8 fichas (ya se extrajo una), de las cuales 4 son negras (ya salió una negra en la primera extracción). Entonces:

P( 2N / 1N ) = 84 =

21

Para que ocurran ambos sucesos, se usa la regla del producto:

P( 1N y 2N / 1N ) = 95 ·

21 =

185 = 0,2778

Método 2: Extraer s una a una dos fichas sin reposición, equivale a extraer dos fichas simultáneamente. Entonces, es posible aplicar el concepto de combinatoria.

Las dos fichas negras se pueden combinar de )(25

maneras distintas, de un total de )(29

casos posibles.

Page 114: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

113

Aplicando la ecuación de Laplace:

)

29

(

)25

(P(2N) = = 0,2778

3. Faltas a la calidad Una empresa que arma lavadoras automáticas tiene dos plantas A y B, que producen el 40% y el 60% de estos artefactos, respectivamente. Suponga que el 8% de los artefactos de la planta A y el 12% de los de la planta B presentan la misma falta de calidad (falla). Si se está frente a una lavadora con esta falla, interesa calcular la probabilidad de que el artefacto haya sido armado en la planta B.

3.1. ¿Cuál es la probabilidad de que esta empresa produzca artefactos con falla? 3.2. Si se está frente a una lavadora con esta falla, ¿cuál es la probabilidad de que el artefacto haya sido armado en la planta B?

Solución: Para comprender mejor la situación, de realizará un diagrama de árbol. 3.1. Se pide P(F): Sumando los resultados del diagrama de árbol, de las secuencias que terminan en (1) y (3::

P(F) = 0,032 + 0,072 = 0,104 (Esto es, el 10,8% de los artefactos). Aplicando directamente el teorema de la probabilidad total: P(F) = P(A)· P(F/A) + P(B)· P(F/B) = 0,4 · 0,08 + 0,6 · 0,12 = 0,104 3.2. Si se está frente a una lavadora con esta falla, ¿cuál es la probabilidad de que el artefacto haya sido armado en la planta B? Se pide determinar: P(B / F) Aplicando el teorema de la probabilidad condicional, y sacando los valores de las respectivas ramas del árbol y el resultado anterior:

P(B / F) = P(F)

F)yP(B = 0,1040,072 = 0,6923

A = Planta A

F = Con falla

F’ =Sin falla

B = Planta B

F =Con falla

F’ =Sin falla

0,4

0,6

0,08

0,92

0,12

0,88

P(F/A) = 0,4 · 0,08 = 0,032

P(F/B) = 0,6 · 0,12 = 0,072

P(F’/A) = 0,4 · 0,92 = 0,368

P(F’/B) = 0,6· 0,88 = 0,528

(1)

(2)

(3)

(4)

Page 115: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

114

Aplicando directamente el teorema de Bayes:

P(B / F) = )(

)/(·)(FP

BFPBP = 0,104

0,12 ·0,6 = 0,6923

4. Casados, urbanos y rurales En cierta región, el 35% de los hombres mayores de 18 años vive en zonas rurales y el 65% en zonas urbanas. En las zonas rurales, el 80% de los hombres mayores de 18 años están casados, mientras que en las zonas urbanas ese % es solo del 60%.

4.1. ¿Cuál es a probabilidad de que en esta región un hombre de esta población esté casado? 4.2. Si se encuentra un hombre casado, ¿cuál es la probabilidad de que provenga de la zona rural?

Solución: Sean los siguientes sucesos: R = hombre mayor de 18 años de zonas rurales. U = hombre mayor de 18 años de zonas urbanas. Nótese que, tal como está planteado el problema, U y R son complementarios o mutuamente excluyentes.

C/R = casado, dado que es de zona rural C/U = casado, dado que es de zona urbana C = hombre de la región, mayor de 18 años, casado.

Nótese que el suceso C es condicional, ya que este estado civil depende de la zona U o R de donde provenga el hombre. Trasladando los datos dados en %, a probabilidad, se tiene:

P(R) = 0,35 y P(U) = 0,65 P(C/R) = 0,8 y P(C/U) = 0,6

Para una mejor comprensión y cálculo, es posible trazar un diagrama de árbol como el siguiente: 3.1. Los casados pueden ser de la zona R o de la zona U, siendo aplicable la regla de la suma de probabilidades: Entonces, con los datos del diagrama:

P(C) = P(C/R) + P(C/U) = 0,28 + 0,39 = 0,67.

También puede ser calculada esta probabilidad, aplicando directamente el teorema de la probabilidad total. 3.2. Se pide: P(R / C’) =

Desarrollando, con los datos del diagrama: P(R / C’) =)P(C'

)CyP(R ' = 0,67-1

0,2·0,35 = 0,2121

También puede ser calculada esta probabilidad, aplicando directamente el teorema de Bayes.

Rural y Casado =

Urbana

Rural Casado / R

NO casado / R

Casado / U

NO casado / U

0,35

0,65

0,8

0,2

0,6

0,4

⇒ Urbano y Casado =

0,35 x 0,8 = 0,28

0,65 x 0,6 = 0,39

Page 116: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

115

IV. EJERCICIOS Y PROBLEMAS PROPUESTOS 1. Agricultores En cierto sector agrícola, el 60% de los agricultores siembra trigo. De estos, el 75% usa semilla seleccionada. Si se selecciona al azar un agricultor de este sector, ¿cuál es la probabilidad de que haya sembrado trigo sin semilla seleccionada? A) 0,125 B) 0,15 C) 0,25 D) 0,40 E) 0,45 2. Gripe En una comuna donde el 60% de sus habitantes son mujeres, se produce una epidemia de gripe que afecta al 15% de los hombres y al 5% de las mujeres. ¿Cuál es la probabilidad de que un habitante de esta comuna tenga gripe? A) 0,40 B) 0,20 C) 0,24 D) 0,09 E) 0,06 3. Estudio del mercado de refrescos Según un estudio, se prueban tres sabores de refresco A, B y C, entre hombres (H) y mujeres (M). El estudio permitió construir la siguiente tabla de probabilidades de preferencias:

REFRESCO SEXO

A B C

HOMBRE 0,1 0,05 0,25

MUJER 0,15 0,3 0,15

De acuerdo a estos datos: 3.1. Calcule P(B o C) A) 0,75 B) 0,4 C) 0,35 D) 0,3 E) 0,25 3.2. La probabilidad P(H – A’) = A) 0,4 B) 0,3 C) 0,2 D) 0,05 E) 0,1 3.3. Calcule P(B / H) = A) 0,4 B) 0,125 C) 0,05 D) 0,15 E) 0,25 3.4. Si se selecciona a una persona que gusta del refresco B, ¿cuál es la probabilidad de que sea mujer? A) 0,35 B) 0,3 C) 0,857 D) 0,782 E) 0,627 4. Parceleros Se ha comprobado que en la región de Aysén, el 75% de los parceleros son propietarios de las tierras que habitan. De ellos, el 60% son mujeres. Entre los no propietarios, el 55% son hombres. Si esto es así: 4.1. La probabilidad de que un parcelero de esta región sea mujer es: A) 0,5625 B) 0,525 C) 0,6 D) 0,135 E) 0,45 4.2. La probabilidad de que un parcelero de esta región sea hombre y propietario, es: A) 0,125 B) 0,47 C) 0,135 D) 0,3 E) 0,45

Page 117: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

116

4.3. ¿Cuál es la probabilidad de que un parcelero de esta región sea propietario, dado que es mujer? A) 0,75 B) 0,45 C) 0,656 D) 0,812 E) 0,8 4.4. ¿Cuál es la probabilidad de que un parcelero de esta región sea hombre, dado que es no es propietario? A) 0,435 B) 0,565 C) 0,55 D) 0,75 E) 0,25 Solución a problemas propuestos 1. B 2. D 3.1. A 3.2. E 3.3. B 3.4. C 4.1. A 4.4. D 4.3. E 4.4. C V. RECURSOS COMPLEMENTARIOS 1. Conceptos básicos de probabilidad: -Spiegel, Murray. Probabilidad y Estadística. McGraw Hill, 2003. ISBN: 9584101331. Capítulo I. 2. AULAFACIL http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm CLASE 24. Teorema de la probabilidad total CLASE 25. Teorema de Bayes 3. Web: Busque en un buscador para responder la pregunta: ¿Cuáles son las grandes aplicaciones del Teorema de Bayes? 4. Documentos de interés. http://www.edustatspr.com/documentos/probabilidad/1.3.probcond.pdf http://ftp.medprev.uma.es/libro/node44.htm http://usuarios.lycos.es/manuelnando/practicacalculoprobabilidades1con.htm http://www.bioestadistica.com.ar/temas.html

Page 118: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

117

Ejercicios de recapitulación CON AYUDA DE FORMULARIO Y CALCULADORA, CONSTRUYA UNA RESPUESTA A LAS PREGUNTAS FORMULADAS SOBRE LA BASE DE LOS SIGUIENTES CASOS.

«Las ciencias nos han hecho adquirir muchas certezas, pero de la misma manera nos han revelado, en el siglo XX,

innumerables campos de incertidumbre». (Morin).

Caso 1: Accidentes laborales y antigüedad En cierta empresa, el 36% de los trabajadores tiene más de 5 años de experiencia laboral. La probabilidad de accidente laboral en el curso de un año en la empresa es de 0,04. Si estos fenómenos son independientes: 1.1. ¿Cuál es la probabilidad de que se accidente un trabajador con menos de 5 años de experiencia laboral? 1.2. Si ocurre un accidente laboral, ¿cuál es la probabilidad de que sea de un trabajador con más de 5 años de experiencia? ¿Puede explicar el porqué del resultado? 1.3. Si se accidentan dos trabajadores, ¿cuál es la probabilidad de que ambos tengan más de5 años de experiencia laboral? Caso 2: Población bilingüe en Québec Canadá tiene dos lenguas oficiales: el inglés y el francés. Sin embargo, en la provincia de Québec la lengua predominante es el francés, ya que el 45% de la población habla inglés y francés, el 20% habla inglés pero no francés, y el 5% no habla ninguna de estas dos lenguas, sino otras, producto de la inmigración y la existencia de grupos autóctonos. 2.1. ¿Cuál es la probabilidad de que un sujeto de esta provincia hable francés? 2.2. ¿Cuál es la probabilidad de que un sujeto de esta provincia hable francés, pero no inglés? 2.3. ¿Cuál es la probabilidad de que un sujeto de esta provincia hable inglés ya que no habla francés? Caso 3: El “Loco Bielsa” En una reciente publicación se cita el siguiente dato estadístico, que ha servido de base para la estrategia de Bielsa con la selección chilena de fútbol: Refiriéndose a los goles, dice:

“De cada diez, uno se hace desde media distancia, tres de pelota detenida, dos de jugadas que parten del centro del campo y cuatro de avances que parten por los costados que finalizan en el medio del área.”5

Si esto es así: 3.1. Si se seleccionan al azar dos goles de las eliminatorias para el mundial de Sudáfrica, ¿cuál es la probabilidad de que ambos hayan sido por avances que parten por los costados que finalizan en el medio del área? 3.2. Si se eligen al azar dos goles de las eliminatorias para el mundial de Sudáfrica, ¿cuál es la probabilidad de que solo uno de ellos haya sido desde media distancia? 3.3. Si se eligen al azar dos goles de las eliminatorias para el mundial de Sudáfrica, ¿cuál es la probabilidad de que uno de ellos haya sido desde media distancia y el otro de pelota detenida? 5 Carcuro, Pedro – Abarzúa, Esteban. “Me pongo de pie”. Aguilar, 2009.

Page 119: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

118

Caso 4: Probabilidad El siguiente diagrama muestra los sucesos R y S definidos en el espacio muestral Ω , con sus correspondientes probabilidades de ocurrencia: Calcule las siguientes probabilidades: 4.1. P(S’) = 4.2. P(R’– S) = 4.3. P(S y R’) = 4.4. P(R o S) = 4.5. P(S/R) = 4.6. P(R’/S) = Caso 5: Trastorno del aprendizaje Una investigación determinó que en las escuelas municipales de cierta comuna, en el primer ciclo de educación básica, el 14% de los estudiantes presentan algún trastorno del aprendizaje. Si se seleccionan, uno a uno, estudiantes de esta población hasta encontrar un estudiante con trastorno del aprendizaje, calcular la probabilidad de que este resulte: 5.1. En la primera extracción 5.2. Solo a la segunda extracción 5.3. Solo a la tercera extracción Caso 6: Población en el tiempo El siguiente gráfico muestra la población de cierta región geográfica:

De acuerdo al gráfico, aproximadamente: 6.1. ¿Cuántos habitantes había en la región en el año 1930? 6.2. ¿En qué % creció la población entre 1950 y 1970? 6.3. En el año 1990, en cuántos habitantes había crecido la población respecto de 1950? 6.4. ¿Qué % representa la población de 1930 respecto de la de 1990?

R S

Ω

0,23

0,18

0,45

Page 120: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

119

Caso 7: Uso de Internet por profesionales Un estudio consultó a una muestra de profesionales acerca de sus hábitos de uso de la Internet. Dentro del estudio se consideró la frecuencia de uso de Internet en asuntos comerciales y bancarios. La siguiente tabla muestra los resultados de la pregunta: ¿Realiza por Internet operaciones comerciales o bancarias tales como pago de servicios, transferencia de fondos o compras?, desagregados por sexo. Profesionales según sexo y por frecuencia de uso de Internet en asuntos comerciales y bancarios

Nº de casos Frecuencia de uso hombres mujeres

1 = Siempre, todas las veces 26 18 2 = Frecuentemente, pero no siempre 50 45 3 = Algunas veces 72 37 4 = Rara vez, casi nunca 25 22 5 = Nunca 7 5

7.1. Identifique las variables en estudio y escala de medición de cada una de ellas. 7.2. Calcule:

7.2.1.¿Qué % de la muestra realiza operaciones comerciales y bancarias por Internet solo algunas veces? 7.2.2. ¿Qué % de las mujeres realiza gestiones comerciales y bancarias por Internet rara vez, casi nunca? 7.2.3. De los que nunca realizan operaciones comerciales y bancarias por Internet ¿qué % son hombres?

7.3. Construya una tabla que muestre los profesionales hombres según frecuencia de uso de Internet en asuntos comerciales y bancarios. 7.4. Construya un gráfico que muestre los profesionales mujeres según frecuencia de uso de Internet en asuntos comerciales y bancarios. Caso 8: peso corporal y estado general de salud El gráfico de la figura presenta, en N° de casos, la evaluación del estado general de salud de una muestra de sujetos estudiados, según si presentan peso normal o sobrepeso. Indique el % en lo que se afirma acerca de la muestra: 8.1. De la muestra con Mal estado general de salud, el . . . . . . . . % presenta Sobrepeso. 8.2. De los que tienen un Buen estado general de salud, el . . . . . . % tiene un peso Normal. 8.3. De las personas de peso Normal, sólo un . . . . . .% presenta Mal estado general de salud. 8.4. De la muestra, el . . . . . . . % presenta un buen estado general de salud. 8.5. De la muestra, el . . . . . . . % presenta un peso normal.

18151209060300

Bueno Malo

ESTADO

Nº de casos

Peso normal Sobrepeso

Estado general de salud, según peso

Page 121: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

120

CASO 9: Salario por hora de trabajo El siguiente gráfico muestra la distribución de una muestra de trabajadores por valor que perciben cada hora de trabajo. 9.1. Construya 5 afirmaciones acerca de la muestra estudiada en relación con la variable de interés. Caso 10: Edad de personas en estudio El siguiente gráfico de Tallo y hojas presenta la distribución de la edad de una muestra de personas. A partir del gráfico, determine: 10.1. Tamaño de la muestra. 10.2. ¿Qué edad tiene la persona mayor encuestada? 10.3. ¿Cuántas personas de la muestra tienen 39 años? 10.4. ¿Qué % de la muestra tiene a lo más 49 años? 10.5. ¿Qué % de la muestra tiene a lo menos 60 años? 10.6. La edad modal, edad mediana y edad media de la muestra. Caso 11: Edad de accidentados En cierto sector industrial, se ha constatado que la edad de los trabajadores afectados por accidentes de trabajo, se distribuye en forma más o menos simétrica, con media 32,3 años y desviación estándar 5,7 años. Si esto es así: 11.1. Calcule el coeficiente de variación de la edad de los accidentados. 11.2. Calcule la edad normal de los accidentados. 11.3. Según el teorema de Chebyshev, ¿cuál es el intervalo que abarca al menos el 75% de las observaciones?

Edad Stem-and-Leaf Plot Frequency Stem & Leaf 2 1 . 89 9 2 . 022335889 24 3 . 113444555556666777889999 16 4 . 0011234466678888 12 5 . 112344566799 7 6 . 0111356 1 7 . 2 Stem width: 10 Each leaf: 1 case(s)

1,0 1,5 2,0 2,5 3,0 3,5 4,0 $miles

Valor percibido por hora de trabajo ($miles)

Fuente: Alka-Stat-2010

Page 122: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

121

Caso 12. Contaminación de aguas de un lago Se realiza un muestreo de las aguas en un lago tras la búsqueda de ciertas bacterias que se reproducen cuando hay contaminación por productos derivados del petróleo. Se hace un conteo del número de bacterias por muestra de 100 ml de agua en un total de 72 ensayos, arrojando el siguiente resultado:

Bacterias (/100 ml) Nº de casos 30 – 35 35 – 40 40 – 45 45 – 50 50 – 55 55 – 60

4 8 14 10 6 8

12.1. Calcule el número medio de bacterias por cada 100 ml de agua, su desviación estándar y coeficiente de variación. 12.2. Trace un gráfico de caja y bigotes para el número de bacterias por cada 100 ml de agua. 12.3. Calcule, para el número de bacterias por cada 100 ml de agua el decil 4 y el percentil 65 e interprete su valor. 12.4. Trace un histograma porcentuado para el número de bacterias por cada 100 ml de agua. CASO 13: Número de empleos según edad Se ha investigado en una muestra aleatoria de trabajadores, su edad y el número de empleos dependientes en los últimos 2 años, llegándose a la siguiente tabla: Edad y número de empleos. Nº de casos.

Nº de EMPLEOS EDAD (años) 0 1 2 3

Total

20 – 30 30 – 40 40 – 50 50 – 60 60 – 70

0 3 6 8 5

3 11 9 2 3

8 9 4 3 1

7 5 4 1 2

18 28 23 14 11

Total 22 28 25 19 94 13.1. Construya un gráfico para la edad de los trabajadores que han tenido solo un empleo en los últimos dos años. 13.2. Construya un gráfico de tallo y hojas para el número de empleos en los dos últimos años de los trabajadores entre 30 y 40 años de edad. 13.3. Calcule el número medio y desviación estándar de los empleos de los trabajadores menores de 30 años, y su coeficiente de variación. 13.4. Calcule la edad media de los trabajadores que no han tenido empleo en los dos últimos años. 13.5. Calcule:

13.5.1. % de la muestra que, teniendo entre 40 y 60 años, ha tenido 1 ó 2 empleos en los dos últimos años. 13.5.2. De los que han tenido 1 empleo, ¿Qué % tiene entre 30 y 50 años? 13.5.3. ¿Cuál es la probabilidad de que un encuestado haya tenido más de un empleo en los dos últimos años? 13.5.4. ¿Cuál es la probabilidad de que un encuestado haya tenido más de dos empleos en los últimos dos años y tenga menos de 40 años?

Page 123: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

122

CASO 14: Consumo de combustible La siguiente información corresponde al consumo mensual de combustible destinado a calefacción por hogar, expresado en miles de $, en una muestra aleatoria de hogares de un barrio popular de Santiago en los meses de invierno: Hogares por consumo mensual de combustible.

Consumo ($miles)

Nº de casos

6 – 12 27 12 – 16 46 16 – 20 34 20 – 25 15 25 – 35 7

14.1. Calcule el consumo medio, su desviación estándar y su coeficiente de variación. 14.2. Calcule Q1, D3 y P85 e interprete su valor en el marco del caso. 14.3. Trace un gráfico de caja y bigotes. 14.4. Construya cinco conclusiones respecto del caso. Caso 15: Percepción de la seguridad ciudadana Una encuesta de seguridad ciudadana realizada en Argentina a una muestra de 890 mayores de 15 años, generó la siguiente tabla de frecuencias:

SEXO GRUPOS DE EDAD En general, en toda la ciudad se siente usted: TOTAL

HOMBRES MUJERES 15-29 30-59 60-89 1 Seguro 259 163 96 74 104 81 2 Relativamente seguro 346 225 121 103 156 87 3 Inseguro 188 83 105 73 78 37 4 Muy inseguro 97 27 70 39 30 28

TOTAL 890 498 392 289 368 233

15.1. Sobre la base de estos datos, calcule en la muestra:

15.1.1. Entre las mujeres, ¿qué % se siente segura o relativamente segura? 15.1.2. La probabilidad de encontrar una persona que se sienta Muy insegura. 15.1.3. ¿Qué % son hombres que se siente relativamente seguro en toda la ciudad? 15.1.4. Entre los que se sienten muy inseguros, ¿qué % son hombres? 15.1.5. Entre los que se sienten seguros, ¿qué % tiene entre 15 y 59 años de edad?

15.2. Sobre la base de estos datos, calcule los siguientes estadígrafos e interprete su valor.

15.2.1. La mediana en la percepción de seguridad en las mujeres. 15.2.2. La edad mediana de las personas que se sienten seguras en la ciudad. 15.2.3. La edad decil 3 de las personas que se sienten inseguras en la ciudad. 15.2.4. La edad percentil 65 de las personas que se sienten muy insegura en la ciudad.

15.3. Sobre la base de estos datos, calcule los siguientes estadígrafos:

15.3.1. La edad media de las personas que se sienten muy inseguras en la ciudad. 15.3.2. La desviación estándar de la edad de las personas que se sienten muy inseguras en la ciudad. 15.3.3. La edad media de las personas que se sienten muy seguras en la ciudad. 15.3.4. El coeficiente de variación de la edad de las personas que se sienten muy seguras en la ciudad.

Page 124: PROBABILIDAD Y ESTADÍSTICA MAT - 325

Vicerrectoría Académica Cuaderno de Apuntes – 2010

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproducción. Derechos reservados AIEP.

123

CASO 16: Escolaridad Se ha estudiado la variable X = número de años de estudios formales aprobados en una muestra de personas, siendo posible calcular los estadígrafos siguientes:

Xmín = 1 año; Rg(X) = 15 años Q1(x) = 6 años; Me(x) = 10 años; P75(x) = 13 años; P85(x) = 14 años; D6 = 11 años =x 10, 5 años

A partir de esta información: 16.1. Construya un gráfico de caja. 16.2. Construya 5 afirmaciones cuantitativas en el marco del caso. CASO 17: Tabla de población Población chilena de 15 años o más, por estado civil o conyugal, según sexo y grupos de edad.

ESTADO CIVIL O CONYUGAL Población de 15

años o más. Casado(a) Conviviente, pareja

Soltero(a) Anulado(a) Separado(a) Viudo(a)

TOTAL PAÍS Ambos sexos 11.226.309 5.181.855 994.762 3.883.266 50.255 531.805 584.366 15 a 29 años 3.674.239 653.785 337.066 2.632.195 2.487 44.061 4.645 30 a 44 años 3.566.949 2.162.293 414.873 737.587 18.011 207.309 26.876 45 a 59 años 2.267.643 1.475.212 181.192 306.089 19.391 186.382 99.377 60 a 74 años 1.247.307 720.011 52.568 152.018 8.464 78.346 235.900 75 años o más 470.171 170.554 9.063 55.377 1.902 15.707 217.568 Mujeres 5.760.651 2.583.511 505.097 1.853.923 34.559 319.636 463.925 Hombres 5.465.658 2.598.344 489.665 2.029.343 15.696 212.169 120.441

17.1. Identifique las variables incluidas en el estudio, indicando su tipo. 17.2. Sobre la base de la tabla, calcule:

17.2.1. En la población de solteros(as), ¿qué % tiene 60 años o más? 17.2.2. En la población menor de 45 años, ¿qué % son separados? 17.2.3. En la población de mujeres, ¿qué % son anuladas? 17.2.4. En la población de casados, ¿qué % son mujeres? 17.2.5. En la población de 75 años o más, ¿qué % son viudos(as)?

17.3. Para la población entre 30 y 44 años: 17.3.1. Construya una tabla de frecuencias que muestre la distribución de este segmento según estado civil o conyugal. 17.3.2. Calcule, si fuera posible, el estado civil o conyugal modal y mediano.

17.4. En la población de anulados(as):

17.4.1. Calcule el percentil 15 de la edad de la población e interprete su valor. 17.4.2. Calcule la edad media, su desviación estándar y coeficiente de variación. Utilice los supuestos que estime convenientes.