Apuntes IGE (1).docx

129
INSTITUTO TECNOLÓGICO DE MÉRIDA DEPARTAMENTO DE CIENCIAS ECONOMICO-ADMINISTRATIVAS CAMPUS PONIENTE. INGENIERIA EN GESTIÓN EMPRESARIAL ESTADÍSTICA ENFERENCIAL I 1

Transcript of Apuntes IGE (1).docx

Page 1: Apuntes IGE (1).docx

INSTITUTO TECNOLÓGICO DE MÉRIDADEPARTAMENTO DE CIENCIAS ECONOMICO-ADMINISTRATIVAS

CAMPUS PONIENTE.

INGENIERIA EN GESTIÓN EMPRESARIALESTADÍSTICA ENFERENCIAL I

1

Page 2: Apuntes IGE (1).docx

Estadística Inferencial I

Índice

Índice..................................................................................................................................i

Prefacio............................................................................................................................iii

Estadística Inferencial 1................................................................................................vi

Unidad 1. Introducción a la estadística Inferencial...........................................................7

Subtema 1.1 Breve historia de la Estadística.................................................................7

Subtema 1.2 Concepto de estadística............................................................................8

Subtema 1.3 Estadística descriptiva...............................................................................9

Subtema 1.4 Estadística inferencial...............................................................................9

Subtema 1.5 Breve introducción a la inferencia estadística.........................................9

Subtema 1.6 Teoría de decisión en estadística............................................................10

Subtema 1.7 Componentes de una investigación estadística.......................................11

Subtema 1.8 Recolección de datos..............................................................................11

Subtema 1.9 Estadística paramétrica (población y muestra aleatoria)........................12

Subtema 1.10 Aplicaciones..........................................................................................12

Unidad 2. Inferencia estadística: Estimación..................................................................16

Subtema 2.1 Conceptos básicos...................................................................................16

Subtema 2.2 Distribuciones de muestreo.....................................................................16

Subtema 2.3 Estimación puntual.................................................................................18

Subtema 2.4 Estimación de intervalo..........................................................................18

Subtema 2.5 Intervalos de confianza para medias.......................................................21

Subtema 2.6 Intervalos de confianza para diferencia entre medias.............................22

Subtema 2.7 Intervalos de confianza para proporciones.............................................25

Subtema 2.8 Intervalos de confianza para diferencias entre proporciones..................26

Subtema 2.9 Intervalos de confianza para varianzas...................................................28

Subtema 2.10 Intervalos de confianza para razones de dos varianzas.........................29

Unidad 3. Pruebas de hipótesis con una muestra............................................................31

Subtema 3.1 Metodología para la prueba de hipótesis................................................31

Subtema 3.2 Hipótesis nula y alternativa.....................................................................32

Subtema 3.3 Error tipo I y error tipo II........................................................................34

Subtema 3.4 Pruebas de hipótesis Z para la media (desviación estándar poblacional conocida)......................................................................................................................35

i

Page 3: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 1

Subtema 3.5 Pruebas para proporciones......................................................................38

Subtema 3.6 Selección del tamaño de muestra (para estimar la media poblacional).. 41

Subtema 3.7 Selección del tamaño de muestra (para estimar la proporción poblacional).................................................................................................................43

Unidad 4. Pruebas de Hipótesis con dos muestras y varias muestras de datos numéricos..........................................................................................................................................52

Subtema 4.1 Introducción............................................................................................52

Subtema 4.2 Distribuciones normal y t de Student......................................................52

Subtema 4.3 Pruebas de significancia..........................................................................53

Subtema 4.4 Comparación de dos muestras independientes: Pruebas t para las diferencias entre dos medias........................................................................................54

Subtema 4.5 Prueba de Fisher para varianzas y de igualdad de las varianzas de dos poblaciones normales...................................................................................................56

Subtema 4.6 Comparaciones de dos muestras pareadas..............................................59

Subtema 4.7 Modelo totalmente aleatorio: análisis de varianza de un factor..............61

Subtema 4.8 Selección del tamaño de muestra para estimar la diferencia de dos medias..........................................................................................................................66

Subtema 4.9 Aplicaciones............................................................................................67

Unidad 5. Pruebas de hipótesis con dos muestras y varias muestras con datos categóricos.......................................................................................................................68

Subtema 5.1 Prueba Z para la diferencia entre dos proporciones................................68

Subtema 5.2 Prueba para la diferencia entre dos proporciones...................................71

Subtema 5.3 Prueba para la diferencia en n proporciones Z.......................................73

Subtema 5.4 Prueba de independencia (ji-cuadrada)...................................................76

Subtema 5.5 Pruebas de contingencia (ji-cuadrada)....................................................79

Subtema 5.6 Pruebas de bondad de ajuste...................................................................81

Subtema 5.7 Aplicaciones............................................................................................83

Bibliografía......................................................................................................................85

ii

Page 4: Apuntes IGE (1).docx

Estadística Inferencial I

Prefacio

El propósito de este libro es proporcionar a los estudiantes de la carrera de Ingeniería en Gestión Empresarial, los conocimientos, habilidades, actitudes y valores que correspondan a la asignatura Estadística Inferencial 1, por medio del desarrollo de las competencias tan necesarias en el campo profesional. Para el logro de lo anterior se sustentará el desarrollo en el Modelo Didáctico para los Tecnológicos (Moditec). Herrera Méndez, Carlos (2014). Modelo Didáctico para los Tecnológicos, MODITEC. Guanajuato, México: ICYTEG.

Metodología. 1.- Formación de equipos de trabajo de 4 a 5 alumnos, los equipos así formados permanecerán durante todo el curso escolar.

2.- Cada miembro del equipo tendrá una libreta exclusiva para las tareas escritas del curso de Estadística Inferencial 1, perfectamente identificada con nombre y fotografía.

3.- Las tareas escritas seguirán un formato, con el objeto de regularizar el desarrollo de las mismas.

4.- Los alumnos resolverán en equipo los ejercicios indicados, cada alumno escribirá en su propia libreta el desarrollo de la tarea.

5.- El profesor seleccionará en forma aleatoria un equipo. Así mismo seleccionará en forma aleatoria a un alumno del equipo, quien a su vez presentará la tarea terminada al profesor, en su propia libreta.

6.- El profesor revisará la tarea tanto en contenido como en formato, así mismo el profesor hará preguntas al alumno para que explique los resultados y las conclusiones.

7.- Dependiendo del contenido, el formato y las respuestas del alumno, el profesor asignará la calificación de dos puntos si todo está bien, un punto si sólo está bien una parte de la tarea, y cero puntos si todo estuvo mal. Esta calificación será extensiva a todos los miembros del equipo. Con lo cual se busca que los todos los miembros del equipo trabajen en cooperación, conscientemente, y con responsabilidad, pues no saben de antemano a que alumno le tocará dar la respuesta, pero todos son responsables. Si faltare algún alumno el día de la clase, este recibirá cero de calificación.

8.- El procedimiento anterior se seguirá con todos los demás equipos, obviamente evitando seleccionar más de una vez al mismo equipo.

9.- El formato que seguirán las tareas escritas será el siguiente: identificación de la tarea, por ejemplo T1, T2, T3, etc. Enunciado de la tarea, se escribirá con excelente letra manuscrita y sin faltas de ortografía. Llevar un orden en formulas, gráficas, tablas, cálculos, resultados y conclusión, todo perfectamente limpio sin tachaduras, pues de esta manera aprenderán a presentar trabajos escritos en forma correcta.

10.- Para las tareas de investigación, al inicio de la unidad, el profesor dará una lista de temas a investigar, dicha investigación la podrán hacer en cualquier fuente bibliográfica, con la salvedad de que citen dicha fuente. Esta tarea también será por equipo.

iii

Page 5: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 1

11.- La presentación de las tareas de investigación será por una parte por escrito a computadora, (también siguiendo un formato dado), por otra parte la presentación será oral, con duración de 4 a 5 minutos o más si así se requiere.

12.- El profesor seleccionará al azar un equipo, seleccionará en forma aleatoria a un alumno del equipo y seleccionará en forma aleatoria un tema de los previamente asignados, el alumno así seleccionado expondrá apropiadamente el tema en un lapso de 4 a 5 minutos. El profesor podrá hacer preguntas relativas al tema, si así lo requiere.

13.- La calificación obtenida para la tarea de investigación se divide en dos partes. Para la parte escrita será de 2, 1 o cero puntos dependiendo del contenido, y el formato. Para la parte expositiva también será de 2, 1 o cero puntos, dependiendo del contenido y de la presentación. En ambos casos la calificación obtenida será extensiva a todos los miembros del equipo, con la salvedad que si alguno no asiste su calificación será cero.

14.- Al finalizar cada unidad se hará una tarea integradora, esta también será por equipo, se entregará por escrito a computadora y el profesor seleccionará al azar a un alumno del equipo para que explique los resultados y conclusiones de la tarea, la calificación máxima de esta tarea será de 5 puntos, dependiendo del contenido y el formato.

15.- El formato para las tareas escritas por computadora será: Portada con los nombres de los miembros del equipo, datos generales del Tecnológico, del campus, la asignatura, la unidad, fecha, en las siguientes hojas el planteamiento del problema o caso, el procedimiento, cálculos, formulas, gráficas, tablas, resultados, conclusión y fuente bibliográfica consultada. Todo perfectamente limpio sin faltas de ortografía y entregado en folder.

16.- Al finalizar la unidad se hará una tarea individual, equivalente al examen, el cual tendrá una valoración de 30 puntos.

17.- Todas las tareas por equipo equivalen al 70% de la calificación y la tarea individual al 30%.

18.- Con respecto a las tareas por equipo, al finalizar la unidad se hará el computo de puntos, el alumno que obtenga la máxima puntuación corresponderá al 70% y de ahí en adelante se calculará para los demás alumnos, los cuales podrán obtener 70% o menos, dependiendo de cuantos puntos acumularon en la unidad respectiva.

19.- La calificación final de la unidad, será la suma de los puntos obtenidos en las tareas por equipo más los puntos obtenidos en la tarea individual, que en el mejor de los casos será 70 + 30 = 100

Todo lo anterior contribuye al desarrollo de las siguientes competencias instrumentales:

Capacidad de análisis y síntesis.- Los puntos anteriores, 4, 6, 9, 12, 14 y 16 contribuyen al logro de esta competencia.

Capacidad de organizar y planificar.- Los puntos 1, 2, 3, 9 y 15 contribuyen.

Comunicación oral y escrita.- Los puntos 3, 6, 9, 11, 12, 14 y 15 contribuyen.

Habilidades básicas de manejo de la computadora.- Los puntos 11 y 15 contribuyen.

iv

Page 6: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 1

Habilidad para buscar y analizar información proveniente de fuentes diversas.- Los puntos 10 y 15 contribuyen.

Solución de problemas.- Los puntos 4, 6, 14 y 16 contribuyen.

Toma de decisiones.- Los puntos 4, 6, 9, 12, 14 y 16 contribuyen.

Con respecto al desarrollo de las competencias interpersonales:

Trabajo en equipo.- Los puntos 1, 2, 4, 5, 7, 8. 10 y 12 contribuyen.

Habilidades interpersonales.- 7 y 13 contribuyen.

Con respecto al desarrollo de las competencias sistémicas:

Capacidad de aplicar los conocimientos en la práctica.- El punto 14 contribuye.

Habilidades de investigación.- El punto 10 contribuye.

Capacidad de aprender.- En general todos puntos del 1 al 19 contribuyen a la capacidad de aprender.

Con respecto al desarrollo de los valores:

Compromiso.- Los puntos 1, 7, 8 y 13 contribuyen al desarrollo de los valores.

Responsabilidad.- Los puntos 2, 3, 4, 6, 7 y 8 contribuyen.

Cooperación.- Los puntos 4, 7, 8, 10 y 14 contribuyen.

Con todo lo anterior se pretende que los estudiantes de la carrera de Ingeniería en Gestión Empresarial, desarrollen los conocimientos, habilidades, actitudes y valores que les serán necesarios para el buen desempeño de su gestión como profesionistas.

v

Page 7: Apuntes IGE (1).docx

Estadística Inferencial I

Estadística Inferencial 1

Ingeniería en Gestión Empresarial.

Clave GEG-0910 créditos 3 – 3 - 6

Esta asignatura, aporta al perfil del Ingeniero en Gestión Empresarial, la capacidad para explicar fenómenos involucrados con los procesos de la toma de decisiones en los negocios y, la sensibilidad y conocimientos para hacer uso eficiente de las pruebas de hipótesis, en el ámbito donde se sitúe su desempeño profesional. Para el estudio de la Estadística Inferencial, se identifican temas experimentales paramétricos de comparación simple y múltiple, concentrando su aplicación a la Gestión Empresarial.

De manera particular, el contenido de esta asignatura se aplica en el estudio de los temas: metodología de la investigación científica, toma de decisiones bajo riesgos financieros, toma de decisiones en los contratos que amparan control de calidad de proveeduría, ventas, compras de bienes y servicios, control de la calidad en la planta de producción, simulación de negocios, entre otros más.

Competencias específicas del curso a desarrollar:

Explicar los principios de la inferencia estadística que son la teoría de la estimación y la teoría de pruebas de hipótesis que permitan la aplicación y empleo de estas herramientas para la toma de decisiones acerca de los parámetros poblacionales en base al análisis del muestreo aleatorio.

Explicar, desde un punto de vista Estadístico, los fenómenos involucrados en los procesos de Gestión Empresarial como: Apertura de una Empresa, Comercialización de bienes competitivos en volumen, en precio, en calidad, Contratos de compra venta al mayoreo de bienes de producción.

Para el logro de las competencias específicas anteriores el contenido del libro se distribuye en 5 unidades.

Unidad 1: Introducción a la estadística Inferencial.

Unidad 2: Inferencia estadística: estimación.

Unidad 3: Pruebas de hipótesis con una muestra.

Unidad 4: Pruebas de hipótesis con dos muestras y varias muestras de datos numéricos.

Unidad 5: Pruebas de hipótesis con dos muestras y varias muestras con datos categóricos.

vi

Page 8: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 1

Unidad 1. Introducción a la estadística Inferencial.

Competencia especifica de la unidad: Entender los conceptos fundamentales de la inferencia estadística.

Subtemas:

1.1 Breve historia de la estadística.

1.2 Concepto de estadística.

1.3 Estadística descriptiva.

1.4 Estadística inferencial.

1.5 Breve introducción a la inferencia estadística.

1.6 Teoría de decisión en estadística.

1.7 Componentes de una investigación estadística.

1.8 Recolección de datos.

1.9 Estadística paramétrica (población y muestra aleatoria).

1.10 Aplicaciones

Subtema 1.1 Breve historia de la Estadística

Desde los comienzos de la civilización han existido formas sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales o cosas.Hacia el año 3000 a.C. los babilonios usaban pequeñas tablillas de arcilla para recopilar datos sobre la producción agrícola y sobre los géneros vendidos o cambiados mediante trueque. En el siglo XXXI a.C., mucho antes de construir las pirámides, los egipcios analizaban los datos de la población y la renta del país.Los libros bíblicos de Números y Crónicas incluyen, en algunas partes, trabajos de estadística. El primero contiene dos censos de la población de Israel y el segundo describe el bienestar material de las diversas tribus judías.En China existían registros numéricos similares con anterioridad al año 2000 a.C. Los griegos clásicos realizaban censos cuya información se utilizaba hacia el 594 a.C. para cobrar impuestos. El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la población, superficie y renta de todos los territorios bajo su control. Durante la edad media sólo se realizaron algunos censos exhaustivos en Europa. Los reyes carolingios Pipino el Breve y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los años 758 y 762 respectivamente. Después de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encargó la realización de un censo. La información obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday Book. El registro de nacimientos y defunciones comenzó en Inglaterra a principios del siglo XVI, y en 1662

7

Page 9: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 1

apareció el primer estudio estadístico notable de población, titulado Comentarios sobre las partidas de defunción en Londres.

Subtema 1.2 Concepto de estadística.

Se designa con el nombre de estadística a aquella ciencia que ostenta en sus bases una fuerte presencia y acción de las matemáticas y que principalmente se ocupa de la recolección, análisis e interpretación de datos que buscan explicar las condiciones en aquellos fenómenos de tipo aleatorio.

Por lo que la estadística agrupa un conjunto de técnicas mediante las cuales se recopilan, agrupan, organizan y estructuran datos, para posteriormente analizarlos. El propósito de la estadística es darle un sentido entendible a esos datos, en otras palabras que nos puedan dar una información clara de la situación, para así poder tomar decisiones correctas.

Por ejemplo un Ingeniero en Gestión Empresarial, IGE, recibe una caja con un listado de computadora que contiene 2000 hojas de información de clientes, conteniendo nombre del cliente, productos vendidos, importe de la operación, forma de pago, etc. de las ventas de un gran almacén

8

Uno de los rasgos salientes de la estadística es que se trata de una ciencia transversal y funcional a una amplia variedad de disciplinas que echan mano de ella para entender e interpretar algunas cuestiones que hacen a sus objetos de estudio. La física, la mayoría de las ciencias sociales, las ciencias vinculadas a la salud y áreas como el control de calidad y los negocios y también algunas instituciones gubernamentales, suelen muy recurrentemente ayudarse con la estadística para comprender algunos fenómenos que se dan entre sus filas.

Page 10: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 1

Subtema 1.3 Estadística descriptiva.

La estadística descriptiva es una gran parte de la estadística que se dedica a recolectar, ordenar, analizar y representar un conjunto de datos, con el fin de describir apropiadamente las características de este, como por ejemplo la edad, peso, estatura de las personas. Este análisis es muy básico. Aunque hay tendencia a generalizar a toda la población, las primeras conclusiones obtenidas tras un análisis descriptivo, es un estudio calculando una serie de medidas de tendencia central, para ver en qué medida los datos se agrupan o dispersan en torno a un valor central.

Subtema 1.4 Estadística inferencial.

Parte muy importante de la estadística que se basa obtener conclusiones a partir de muestreos, para lo cual aplica métodos y procedimientos que por medio de la inducción determina propiedades de una población, a partir de una pequeña parte de la misma. La estadística inferencial comprende como aspectos importantes: La toma de muestras o muestreo, que se refiere a la forma adecuada de considerar una muestra que permita obtener conclusiones estadísticamente válidas y significativas. La estimación de parámetros o variables estadísticas, que permite estimar valores poblacionales a partir de muestras de mucho menor tamaño. El contraste de hipótesis, que permite decidir si dos muestras son estadísticamente diferentes, si un determinado procedimiento tiene un efecto estadístico significativo.

Subtema 1.5 Breve introducción a la inferencia estadística.

La Inferencia Estadística es aquella rama de la Estadística mediante la cual se trata de

sacar conclusiones de una población en estudio, a partir de la información que

proporciona una muestra representativa de la misma. También es denominada

9

Los datos así como están difícilmente serían utilices para la toma de decisiones. El ingeniero tendrá que ordenarlos, clasificarlos y concentrarlos de tal manera que sean de utilidad. Las técnicas que permiten ese ordenamiento, clasificación y organización, son precisamente las técnicas estadísticas.

Page 11: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 1

Estadística Inductiva o Inferencia Inductiva ya que es un procedimiento para generar nuevo conocimiento científico.

La muestra se obtiene por observación o experimentación. La necesidad de obtener un

subconjunto reducido de la población es obvia si tenemos en cuenta los costes económicos de la experimentación o el hecho de que muchos de los métodos de medida son destructivos.

Toda inferencia inductiva exacta es imposible ya que disponemos de información parcial, sin embargo es posible realizar inferencias inseguras y medir el grado de confiabilidad si el experimento se ha realizado de acuerdo con determinados principios. Uno de los propósitos de la inferencia Estadística es el de conseguir técnicas para hacer inferencias inductivas y medir el grado de incertidumbre de tales inferencias. La medida de la incertidumbre se realiza en términos de probabilidad.

Muestra: x1 x2 x3 . . .

Inferencia

Población

T1: Tarea 1.- Investiga en fuentes bibliográfica los siguientes temas: a) Breve historia de la estadística, estadística descriptiva, estadística inferencial y su aplicación a los negocios, econometría, demografía.

T2.- Investiga en fuentes bibliográficas los siguientes temas: (1) Medidas de tendencia central, (2) Medidas de variabilidad, (3) Distribución Normal, (4) Variable numérica y ejemplos, (5) Variable categórica y ejemplos, (6) Variable jerarquizada y ejemplos.

Subtema 1.6 Teoría de decisión en estadística.

En la práctica, se tienen que tomar decisiones sobre poblaciones, partiendo de la información muestral de las mismas. Tales decisiones se llaman  decisiones estadísticas. Por ejemplo, se puede querer decidir a partir de los datos del muestreo, si un medicamento nuevo es realmente efectivo para la cura de una enfermedad, si un sistema educacional es mejor que otro, si un producto es mejor que otro similar, etc.

Para llegar a tomar decisiones, conviene hacer determinados supuestos o conjeturas acerca de las poblaciones que se estudian. Tales supuestos que pueden ser o no ciertos

10

Page 12: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 1

se llaman hipótesis estadísticas y, en general, lo son sobre las distribuciones de  probabilidad de las poblaciones.

Tales hipótesis se llaman también hipótesis nulas y se denotan por Ho.

Cualquier hipótesis que difiera de una hipótesis dada se llama hipótesis alternativa. Una hipótesis alternativa de la hipótesis nula se denota por H 1.

Si en el supuesto de que una hipótesis determinada es cierta, se encuentra que los resultados observados en una muestra al azar difieren marcadamente de aquellos que cabía esperar con la hipótesis y con la variación propia del muestreo, se diría que las diferencias observadas son significativas y se estaría en condiciones de rechazar la hipótesis (o al menos no aceptarla de acuerdo con la evidencia obtenida). Los procedimientos que facilitan el decidir si una hipótesis se acepta o se rechaza o el determinar si las muestras observadas difieren significativamente de los resultados esperados se llaman ensayos de hipótesis, ensayos de significación o reglas de decisión.

Subtema 1.7 Componentes de una investigación estadística.

Subtema 1.8 Recolección de datos.

11

Si se quiere decidir sobre si un procedimiento es mejor que otro, se formula la hipótesis de que no hay diferencia entre los procedimientos (es decir, cualquier diferencia observada se debe meramente a fluctuaciones en el muestreo de la misma población).

T3: Investiga en fuentes bibliográficas los siguientes temas: (1) Población o universo, (2) Muestra, (3) Formulación del problema. (4) Diseño del experimento. (5) Recolección de datos, (6) Inferencia estadística y conclusiones.

La recolección de datos se refiere al uso de una gran diversidad de técnicas y herramientas que pueden ser utilizadas por el analista para desarrollar los  sistemas de información, los cuales pueden ser

Page 13: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 1

T4: Investiga en fuentes bibliográficas los siguientes temas: (1) La entrevista, (2) La encuesta, (3) El cuestionario, (4) La observación, (5) Registros de información.

Subtema 1.9 Estadística paramétrica (población y muestra aleatoria).

La estadística paramétrica es una rama de la estadística inferencial que comprende los procedimientos estadísticos y de decisión que están basados en las distribuciones de los datos reales. Por lo que los datos en la población se supone que siguen una distribución normal. La media y la desviación típica son los dos parámetros que se quieren estimar. La población, también llamada universo comprende todos los datos de un conjunto definido. Por ejemplo las edades de los trabajadores de una empresa. El sueldo de las empleadas obreras, etc.

t

12

La recolección de datos se refiere al uso de una gran diversidad de técnicas y herramientas que pueden ser utilizadas por el analista para desarrollar los  sistemas de información, los cuales pueden ser

T5.- investiga en fuentes bibliográficas por lo menos 10 parámetros referidos a la actividad empresarial, obtenidos del Instituto Nacional de Estadística y Geografía. INEGI.

Page 14: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 1

Subtema 1.10 Aplicaciones

T6.- Empleando la calculadora científica, calcula la media aritmética o promedio, mediana, moda, desviación estándar muestral, varianza muestral, coeficiente de variación de los siguientes datos, los cuales representan el coeficiente intelectual de una pequeña muestra de estudiantes, interpreta los resultados.

98 105 105 109 109 93 95 105 109 120

104 91 105 105 95 113 120 105 113 122

T7.- Los siguientes datos representan las calificaciones de Estadística Inferencial I del primer examen parcial. Calcula la media aritmética, desviación estándar de la muestra, varianza, coeficiente de variación, índice de aprobación considerando 70 como calificación mínima aprobatoria: 65, 60, 84, 91, 100, 100, 76, 80, 93, 45, 51, 100, 90, 85, 77, 84, 72, 70, 60, 55, 93, 82, 80, 75, 100.

T8.- Empleando el programa Excel, o cualquier otro programa estadístico de computadora, calcula la media aritmética o promedio, mediana, moda, desviación estándar muestral, varianza muestral, coeficiente de variación de los siguientes datos, los cuales representan una muestra del número de horas trabajadas al mes por los empleados de una empresa.

103 93 109 93 120 120 105 109 121 109

97 113 105 113 105 122 105 105 97 95

T9.- Una empresa acepta las siguientes tarjetas de crédito: Bancomer (Bmer), Banamex (Bmex), American Express (Amex), Banorte (Bnort), calcula la moda, la proporción de cada una, traza un diagrama circular (pastel), interpreta los resultados.

//// 0 1 2 3 4 5 6 7 8 9

0 Bmer Bmer Amex Bmer Bmex Bmer Bmer Amex Bmer Amex

13

Page 15: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 1

1 Bmer Bmex Bnort Bmex Bmex Bmex Bmex Bmer Bmex Bmer

2 Bmer Amex Bmex Bmex Bnort Amex Bmer Bnort Bmex Bmex

3 Bmer Bmer Bmex Amex Amex Bmer Bmex Bnort Amex Amex

4 Bnort Bmex Bmer Amex Amex Bmex Bnort Bmer Amex Bmer

5 Bmex Bmex Bnort Amex Bmer Bnort Amex Amex Amex Bmex

6 Amex Bmer Amex Bmer Bmex Bmer Bnort Amex Bmer Bmex

7 Amex Amex Bnort Bmex Amex Bmex Bmex Bmer Bmex Bmer

8 Bnort Amex Bmex Amex Amex Bmer Amex Bmex Amex Bmex

9 Bmer Bmer Bnort Bmer Bnort Amex Bnort Amex Bmer Bmer

10 Bmex Bmex Amex Amex Amex Amex Bmex Bmer Bmex Bmex

11 Bnort Bmer Bnort Amex Bnort Bmer Bnort Bnort Bnort Bnort

12 Bmer Bmex Bmer Bmer Bmex Bmex Amex Bmer Bmer Bmex

13 Bmex Bmex Bnort Bmex Bnort Bmer Bnort Bmex Bnort Bmex

14 Bmex Amex Amex Bmer Bmer Bmex Bmer Bmex Bmex Amex

15 Bmer Amex Bmer Bmex Bmex Bmex Bnort Amex Bmer Bnort

16 Amex Bnort Bnort Bmex Bnort Amex Bnort Bmer Bmex Bmex

17 Amex Bmer Bmex Amex Bmer Bmer Bmex Bmex Bmex Bmex

18 Bmer Bnort Bmer Bmer Bnort Bmex Bnort Amex Amex Bmer

19 Bmex Amex Bmex Bmex Bmex Bmex Bnort Amex Bmer Bnort

Distribución de frecuencias, datos ordenados.

T10.- El gerente de una empresa aplica un instrumento para medir la productividad de sus empleados y obtiene los resultados mostrados a continuación, calcula la media, s, s2, coeficiente de variación, frecuencia relativa o porcentual, histograma.

Puntajes de Productividad Fr50 355 5

14

Page 16: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 1

60 765 870 1275 1180 985 790 695 5100 8

T11.- Los siguientes datos representan el Cociente Intelectual, de un grupo de obreros en una fábrica calcula: la media aritmética, mediana, moda, desviación estándar poblacional, varianza poblacional, coeficiente de variación.

15

///// 0 1 2 3 4 5 6 7 8 9

0 98 105 105 109 109 93 95 105 109 120

1 104 91 105 105 95 113 120 105 113 122

2 103 93 109 93 120 120 105 109 121 109

3 97 113 105 113 105 122 105 105 97 95

4 109 120 91 120 105 91 109 91 109 120

5 95 122 93 122 109 109 105 93 95 105

6 120 91 113 109 105 113 91 109 120 105

7 105 109 120 95 91 121 93 105 105 109

8 105 113 122 120 109 113 122 120 105 105

9 109 121 109 105 113 121 109 105 109 91

10 105 97 95 105 121 97 95 105 105 93

11 91 109 120 109 97 109 120 109 91 109

12 93 95 105 105 109 95 105 105 93 105

13 113 120 105 91 95 120 105 91 105 105

14 120 105 109 109 105 105 109 109 109 109

15 122 105 105 113 109 109 109 105 105 105

16 91 109 91 121 105 105 113 109 91 91

17 109 105 93 97 91 91 121 105 93 93

18 113 91 109 109 93 93 97 91 112 93

19 121 93 105 95 112 93 114 120 121 115

Page 17: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 2

Unidad 2. Inferencia estadística: Estimación.

Competencia específica de la unidad: Explicar los diferentes métodos de estimación que permitirían definir un buen estimador para los diferentes parámetros de una población y nos permitan aplicarlos a situaciones reales. Así como su aplicación a los métodos estadísticos para inferir a la población.

Subtemas:

2.1 Conceptos básicos.

2.2 Distribuciones de muestreo.

2.3 Estimación puntual.

2.4 Estimación de intervalo.

2.5 Intervalos de confianza para medias.

2.6 Intervalos de confianza para diferencia entre medias.

2.7 Intervalos de confianza para proporciones.

2.8 Intervalos de confianza para diferencias entre proporciones.

2.9 Intervalos de confianza para varianzas.

2.10 Intervalos de confianza para razones de dos varianzas.

Subtema 2.1 Conceptos básicos.

En estadística inferencial se llama estimación al conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a partir de los datos proporcionados por una muestra. Por ejemplo, una estimación de la calificación promedio de una población de alumnos de tamaño N, podría ser la media de esa misma característica para una muestra de tamaño n.

La estimación se divide en dos grandes bloques, cada uno de los cuales tiene distintos métodos que se usan en función de las características y propósitos del estudio: La estimación puntual, y la estimación por intervalos.

Subtema 2.2 Distribuciones de muestreo.

La distribución de muestreo es la distribución de probabilidad de la muestra de una población en lugar de toda la población.

En otras palabras, supongamos que de una determinada  población se toman todas las muestras posibles de tamaño n y se calcula una estadística (por ejemplo, media aritmética) de todas las muestras. Si luego se prepara una distribución de probabilidad de esta estadística, obtendrás una distribución de muestreo.

Ejemplo: Consideremos una pequeña población de 5 datos (1, 2, 3, 4, 5), a los cuales obtenemos su media poblacional y desviación estándar poblacional: µ = 3, σ = 1.4142,

16

Page 18: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 2

así también consideremos todas las muestras posibles sin reemplazamiento de tamaño tres tomadas de esta población, como se muestra en la tabla adjunta, a cada muestra se obtiene su media aritmética.

Muestras Medias1 2 3 2.001 2 4 2.331 2 5 2.671 3 4 2.671 3 5 3.001 4 5 3.332 3 4 3.002 3 5 3.332 4 5 3.673 4 5 4.00

A continuación resumimos los resultados en una gráfica y una tabla.

2 2.33 2.67 3 3.33 3.67 40

0.20.40.60.81

1.21.41.61.82

Distribución del muestreo

De la tabla anterior se puede concluir lo siguiente: si tomamos una muestra aleatoria de tres datos de la población indicada en el ejemplo, la probabilidad de que la media muestral sea igual a 2 es de 10%, de que sea 2.67 es 20%, de que sea 3 es de 20% y así de la misma manera con las demás medias muestrales.

Las propiedades de la distribución de muestreo pueden variar dependiendo de cuán pequeña sea la muestra en comparación con la población. Se supone que la población

17

Esta tabla indica la distribución de todas las medias muestrales. Se obtiene a continuación la media de todas medias y la desviación estándar poblacional de las medias. Dando como resultado:

Media de medias = 3

Desviación estándar poblacional de la distribución muestral demedias = 0.5773

Media frecprobabilidad

2.00 1 10%

2.33 1 10%

2.67 2 20%

3.00 2 20%

3.33 2 20%

3.67 1 10%

4.00 1 10%

Page 19: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 2

se distribuye normalmente como generalmente sucede. Si el tamaño de la muestra es lo suficientemente grande, la distribución de muestreo también estará cerca de lo normal.

Si éste es el caso, entonces la distribución de muestreo puede ser totalmente determinada por dos valores: la media y la desviación estándar. Estos dos parámetros son importantes para calcular la distribución de muestreo si se nos da la distribución normal de toda la población.

Subtema 2.3 Estimación puntual.

Consiste en la estimación del valor del parámetro mediante un sólo valor muestral, obtenido de una fórmula determinada. Por ejemplo, si se pretende estimar la talla media de un determinado grupo de individuos, puede extraerse una muestra y obtener como estimación puntual la talla media de los individuos. Lo más importante de un estimador, es que sea un estimador eficiente. Es decir, que sea Insesgado (ausencia de sesgos) y estable en el muestreo o eficiente (varianza mínima).

Subtema 2.4 Estimación de intervalo.

Todas las personas hacen estimaciones. Cuando vamos a cruzar la calle, hacemos una estimación (o cálculo aproximado) de la velocidad con que se acercan los automóviles, de la distancia a la que nos encontramos entre el automóvil, para saber si nos arriesgamos a cruzar o esperamos. Los ingenieros en Gestión Empresarial (I.G.E) también deben hacer estimaciones rápidas, el resultado de la estimación puede afectar positiva o negativamente la decisión que se tome al respecto. Por ejemplo el I.G.E. de una empresa debe preparar el presupuesto para la adquisición de materia prima para todo el año siguiente, el año pasado estuvo a punto de quedarse sin materia prima y no desea que esto vuelva a ocurrir. Por lo que toma una muestra de 20 semanas de operación de la planta durante los últimos 4 años, y encuentra una media de consumo de materia prima de 8,500 toneladas por semana con desviación estándar de 350. Con estos datos el I.G.E. puede estimar cual será el consumo semanal e inferirlo a todo el próximo año, con lo cual asegura con un alto grado de confiabilidad que no le faltará materia prima.

T12.- Investiga en diversas fuentes bibliográficas lo siguiente: Parámetro, estimadores, estimación de punto (o puntual), estimación por intervalo.

T13.- Discute con tu equipo y expresa por escrito cada una de las siguientes cuestiones.

¿Cuál es la razón por la que los que toman decisiones a menudo valoran muestras en lugar de poblaciones completas? Ventajas y desventajas.

¿Cuál es la limitante que ocurre al hacer una estimación punto? ¿Cuál es la ventaja de hacer una estimación por intervalo?

18

Page 20: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 2

T14.- Investiga en diversas fuentes bibliográficas lo siguiente con respecto a un buen estimador: Insesgado, Eficiente, Consistente, Suficiente. Error estándar y aplicación del error estándar en el muestreo, margen de error.

Distribución de muestreo de la media y la desviación estándar

La distribución de muestreo de la media se obtiene tomando la estadística bajo estudio de la muestra como la media. Calcular esto significa tomar todas las muestras posibles de tamaño n de la población de tamaño N y luego trazar la distribución de probabilidad. Se puede demostrar que la media de la distribución de muestreo es, de hecho, la media de la población.

Sin embargo, la desviación estándar es diferente para la distribución de muestreo en comparación con la población. Si la población es lo suficientemente grande, esto está

dado por: σ x = σ

√n √ (N−n)

N−1 donde σ es la desviación estándar poblacional, σx se

denomina error estándar, n es el tamaño de la muestra, y N es el tamaño de la población si sustituimos convenientemente los datos en la fórmula tendremos:

σ x = 1.4142

√3 √ (5−3)

5−1 = 0.5773 lo cual corresponde exactamente a la desviación

estándar de la distribución muestral de medias = 0.5773.

T15.- Considerar los mismos 5 datos de la población del ejemplo anterior y tomar todas las muestras aleatoria posibles de tamaño dos con repetición o reemplazamiento. Y hacer los cálculos, tablas y gráficas como en el ejercicio anterior, luego aplicar la fórmula dada a continuación para corroborar el valor de la desviación estándar de la distribución muestral de medias.

Ejemplo.- En una muestra de 25 galones de cierto producto tomada de una población con distribución normal, media de 98.6 y desviación estándar de 17.2.

¿Cuál es la probabilidad de que la media muestral esté entre 92 y 102?

Primero se calcula el error estándar, ya que el problema tiene que ver con el muestreo y con la distribución muestral de medias. Como no nos dan el tamaño de la población, el caso se considera como población infinita. Y la fórmula a aplicar es la siguiente:

Aplicando convenientemente los datos a la fórmula anterior, tenemos: σx = 17.2

√25 =

3.44

19

Page 21: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 2

92 102

Calculamos el puntaje Z para el extremo 92 aplicando la siguiente fórmula:

Z = (xi−media)

σx sustituyendo queda así: Z =

(92−98.6)3.44

= - 1.92, este valor se busca

en la tabla correspondiente al puntaje Z obteniendo un área de 0.4726. En forma similar se procede con el valor de 102 obteniendo un puntaje Z = 0.99 y un área de 0.3389. Se suman las dos áreas obtenidas, dando como resultado 0.8115. El cual se interpreta de la siguiente manera: la probabilidad de que la media muestral de los 25 galones esté entre 92 y 102 es 0.8115

T16.- Repetir el problema anterior, únicamente cambiando el tamaño de la muestra a 36 en lugar de 25, aparte de interpretar el resultado, hacer un análisis comparativo del resultado de este ejercicio con el del ejemplo anterior.

T17.- La auditora de una compañía de tarjetas de crédito, encuentra que el saldo promedio mensual de los clientes es $112 y la desviación estándar es de $56. Si la auditora revisa 50 cuentas al azar calcula la probabilidad de que el saldo promedio mensual de la muestra sea.

a) Menor de $100 b) Entre $100 y $130

T18.- En la empresa de paquetería Estafeta Express, el peso de sus paquetes grandes tiene una distribución normal con media de 150 Kgs. y varianza de 256, en una muestra de 16 paquetes grandes

¿Cuál es la probabilidad de que la media muestral sea menor de160?

b) ¿Cuál es la probabilidad de la media muestral sea mayor de 142?, si la muestra es de 9 en vez de 16.

T19.- Un agricultor posee 60 hectáreas de campos de trigo. Basándose en su experiencia sabe que la producción de cada hectárea está normalmente distribuida con una media de 120 toneladas y desviación estándar de 12 toneladas.

a) Calcula la media esperada de la cosecha de las 60 hectáreas.

b) La probabilidad de que la cosecha media por hectárea exceda de 123.8 toneladas.

c) La probabilidad de que la cosecha media por hectárea esté entre 117 y122 toneladas.

20

Page 22: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 2

T20.- Los pesos de los paquetes recibidos en el departamento de almacenamiento tienen una media de 300 Kgs. y desviación estándar de 50 Kgs. ¿Cuál es la probabilidad de que el peso de 25 paquetes recibidos al azar y cargados en el ascensor, supere el límite de seguridad del mismo que es de 7800 Kgs.?

Subtema 2.5 Intervalos de confianza para medias.

Ejemplo.-En una encuesta se les pidió a una muestra de 250 alumnos de IGE, que registrasen la cantidad de tiempo diario que emplean en estudiar, la muestra dio una media de 45 min. Por experiencia se sabe que la desviación estándar es de 20 min. Para un nivel de confianza de 95% determina la estimación puntual y por intervalo.

La estimación puntual como ya se vio anteriormente corresponde a la media de la muestra, por lo tanto es igual a 45 min.

El siguiente paso consiste en obtener el error estándar de la estimación, para lo cual

aplicamos la siguiente fórmula: Sx = s

√n = =

20

√250 = 1.2649,

El siguiente paso consiste en obtener los límites del intervalo de acuerdo al nivel de confiabilidad indicado, (en este caso para una confiabilidad de 95% el puntaje “z” obtenido en la tabla correspondiente es de 1.96), aplicando las siguientes fórmulas:

Para el límite superior: Ls = x + 1.96(Sx) y para el límite inferior: Li = x - 1.96(Sx), por lo que al sustituir los datos adecuados tenemos: Ls = 45 + 1.96(1.2649) = 47.48

Li = 45 – 1.96 (1.2649) = 42.52, lo que puede interpretarse de la siguiente manera: el tiempo promedio que dedican los estudiantes al estudio diario está entre 47.48 y 42.52 minutos, con una confiabilidad de 95%.

T21.- La oficina de recursos humanos de una empresa desea hacer una estimación de la capacidad en comunicación verbal en inglés que tienen 5,500 empleados. Una muestra aleatoria de 250 de estas personas arrojó los datos que se dan a continuación. x = 65, σ = 15, C = 95%, determina la estimación puntual y por intervalo. Nota: deberá tomarse

en cuenta la siguiente fórmula para el cálculo del error estándar: σx = σ

√n √ (N−n)

N−1

T22.- El gerente de negocio de productos alimenticios para perros vende paquetes de croquetas de diversas presentaciones, por las especificaciones del proveedor la desviación estándar en los paquetes de 2 kgs es de 0.02 kgs. Se selecciona una muestra aleatoria de 30 paquetes de 2 kgs. y la cantidad promedio por paquete indica 1.994 kgs. Determina una estimación por intervalo de confianza del 99%, para la cantidad real de croquetas en los paquetes.

T23.- Investiga la estimación por intervalos de confianza de la media con desviación estándar poblacional desconocida. Así también la distribución t de Student, sus propiedades, los grados de libertad, y la tabla de puntaje t de student.

21

Page 23: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 2

T24.- El administrador del parque zoológico Animaya, desea calcular el tiempo promedio de recorrido peatonal en dicho parque, para lo cual selecciona al azar una muestra de 25 visitantes y encuentra lo siguiente. x = 160 min. S = 5 min. C = 99%, determina la estimación puntual y por intervalo.

T25.- Un proceso manufacturero usado por una fábrica durante los últimos 10 años, tiene una distribución normal. Se desea estimar un intervalo de confianza del 90% para el promedio de unidades por hora producido con dicho proceso. Para tal efecto, se toma una muestra aleatoria de la producción por hora durante 25 horas y se obtiene un promedio de 160 unidades y desviación estándar de 8 unidades.

T26.- El I. G. E. de una empresa eléctrica desea hacer una estimación puntual y por intervalo de 95%, del espesor de la cubierta de hule aplicada al alambre eléctrico, medido en milímetros. Para lo cual toma una muestra aleatoria de 30 datos reportados por el departamento de control de calidad, misma que se muestra a continuación:

1.2 0.96 1.06 1.26 1.2 1.07 1.03 0.89 1.09 1.11

1.1 1.27 0.99 0.95 1.14 0.99 1.29 1.3 1.12 1.07

1.19 1.1 0.92 1.01 1.24 1.18 1.25 0.99 1.33 1.13

Subtema 2.6 Intervalos de confianza para diferencia entre medias.

a) Con distribuciones normales y varianzas desconocidas.

Se tienen dos poblaciones con medias y varianzas desconocidas, y se desea obtener un intervalo de confianza para la diferencia de dos medias: µ1 - µ2. Si los tamaños de las muestras n1 y n2 son mayores de 30, podrá emplearse el intervalo de confianza de la distribución normal y se emplea el puntaje “z”, pero si las muestras son pequeñas (menores de 30), y se supone que las poblaciones están distribuidas normalmente, los intervalos de confianza se basan en la distribución “t de Student”

Si tenemos dos muestras (n1 y n2) y si x1, x2, s1, s2, son las medias y las varianzas de las dos muestras aleatorias, tomadas de dos poblaciones normales e independientes con varianzas desconocidas entonces el intervalo de confianza para la diferencia entre

medias es: µ1 – µ2 = (x1 – x2) + t sp √ 1n1

+ 1n 2

donde sp2 = s1 (n 1−1¿¿2 )+

s2( n2−1¿¿2)

n 1+n 2−2¿¿

Ejemplo: Un artículo publicado dio a conocer los resultados de un análisis del peso de calcio en cemento estándar y en cemento contaminado con plomo. Los niveles bajos de calcio indican que el mecanismo de hidratación del cemento queda bloqueado y esto permite que el agua ataque varias partes de una estructura de cemento. Al tomar diez muestras de cemento estándar, se encontró que el peso promedio de calcio es de 90 con una desviación estándar de 5; los resultados obtenidos con 15 muestras de cemento contaminado con plomo fueron de 87 en promedio con una desviación estándar de 4. Supóngase que el porcentaje de peso de calcio está distribuido de manera normal.

22

Page 24: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 2

Encuéntrese un intervalo de confianza del 95% para la diferencia entre medias de los dos tipos de cementos. Por otra parte, supóngase que las dos poblaciones normales tienen la misma desviación estándar.

Cemento n x S

Estándar 10 90 5

Contaminado c/plomo 15 87 4

El estimador combinado de la desviación estándar es:

Al calcularle raíz cuadrada a este valor nos queda que sp = 4.41, el puntaje “t Student” correspondiente a un nivel de confianza de 95% y 23 grados de libertad es de: 2.069

Límites: 3 ± 3.73, por lo que la expresión se reduce a -0.73 < (µ1 - µ2) < 6.73

T27.- El oficina de control de calidad del Departamento de Hidrología llevó a cabo un estudio para estimar la diferencia en la cantidad de orto fósforo químico medido en dos estaciones diferentes del río Usumacinta. El orto fósforo se mide en miligramos por litro. Se reunieron 15 muestras de la estación A y se obtuvo una media de 3.84 con una desviación estándar de 3.07 miligramos por litro, mientras que 12 muestras de la estación B tuvieron un contenido promedio de 1.49 con una desviación estándar 0.80 miligramos por litro. Encuentre un intervalo de confianza de 95% para la diferencia del contenido promedio real de ortofósforo en estas dos estaciones, suponga que las observaciones vienen de poblaciones normales con varianzas diferentes.

T28.-El departamento de tránsito del estado quiere estimar la diferencia de velocidad de los conductores en la carretera Mérida-Progreso, en temporada veraniega y en temporada normal, para lo cual toma una muestra aleatoria 22 conductores durante un domingo de verano y posteriormente toma una muestra de 22 conductores en el mes de septiembre, también en día domingo. Encuentra un intervalo de confianza de 99% para la diferencia de velocidades. Los datos se muestran a continuación están en Km/hr.

23

Page 25: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 2

Verano

147 120 125 90 137 125 129 90 82 139 118

117 103 141 78 143 99 123 98 99 66 144

Septiembre

73 145 107 68 75 68 143 66 140 102 117

136 81 67 146 96 83 87 100 87 63 145

T29.- En un estudio realizado sobre el tipo de sedimentos hallados en dos lugares de

Perforación distintos, se han anotado los siguientes datos acerca del porcentaje en volumen de arcilla presente en las muestras de sondeo:

A: 31 18 17 16 37 16 32 13 14 49 25 19 13 32 27

B: 15 17 13 25 22 20 24 12 23 15 20 18

Siendo A = “% de arcilla en el lugar A” y B = “% de arcilla en el lugar B”

Calcular un intervalo del 95% de confianza para la diferencia de los valores medios de A y B

Con distribución normal y varianzas conocidas.

Ejemplo: Se comparan dos tipos de rosca de tornillo para ver su resistencia a la tensión. Se prueban 50 piezas de cada tipo de cuerda bajo condiciones similares, la marca A tuvo una resistencia promedio a la tensión de 78.3 Kg, mientras que la marca B tuvo una resistencia promedio de 87.2 Kg. Se sabe de antemano que las desviaciones poblacionales son de 6.5 Kg para la marca A y 6.3 Kg para la B. Determine el intervalo de confianza del 95% para la diferencia de las dos medias poblacionales.

La fórmula a utilizar cuando las varianzas son conocidas es:

μ1−μ2 = (x1−x2) ± Z α2 √ σ 1

2

n1+

σ22

n 2 = μ1−μ2 = (87.2–78.3) ±1.96√ 6.52

50+ 6.32

50

Límites del intervalo de confianza de 95%: 8.9 ± 2.5 = 11.4 y 6.4, por lo que se concluye que la resistencia a la tensión de tornillos de la marca B es superior a la marca A.

T30.- Se llevan a cabo pruebas de resistencia a la tensión sobre dos diferentes clases de

24

Page 26: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 2

largueros de aluminio utilizados en la fabricación de alas de aeroplanos comerciales. De la experiencia pasada con el proceso de fabricación de largueros y del procedimiento de prueba, se supone que las desviaciones estándar de las resistencias a la tensión son conocidas. Los datos obtenidos se presentan en la siguiente tabla:

Tipo de larguero Tamaño de muestra Media muestral de la resistencia a la tensión.

Desviación estándar

1 n1 = 10 x1 = 87.6 σ1 =1

2 n2 = 15 x2 = 74.5 σ2 =1.5

Si µ1 y µ2 indican los verdaderos promedios de las resistencias a la tensión para las dos clases de largueros, hallar un intervalo del 90% de confianza para la diferencia de las medias µ1 - µ2

T31.- Cierto metal se produce, por lo común, mediante un proceso estándar. Se desarrolla un nuevo proceso en el que se añade una aleación a la producción del metal. Los fabricantes desean saber la diferencia entre las tensiones de ruptura de los metales producidos por los dos procesos. Para cada metal se selecciona 12 ejemplares y cada uno de estos se somete a una tensión hasta que se rompe. La siguiente tabla muestra las tensiones de ruptura de las piezas en Kg/cm2. Si se supone que el muestreo se llevo a cabo sobre dos distribuciones normales e independientes, obtener el intervalo de confianza del 95% para la diferencia entre los dos procesos.

proceso estándar

446

401

476

421

459

438

481

411

456

427

459

445

Proceso nuevo

462

448

435

465

429

472

453

450

427

469

452

457

Subtema 2.7 Intervalos de confianza para proporciones.

El estimador puntual de la proporción P, en un experimento binomial está dado por la

estadística P = XN

donde x representa el número de éxitos en N pruebas, por lo tanto la

proporción de la muestra p = xn

se utiliza como estimador puntual del parámetro P, para

estimar el intervalo de confianza de una proporción se emplea la siguiente fórmula:

P = p ± z √ p(1−p)n

25

Page 27: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 2

Ejemplo: Un fabricante de reproductores de discos compactos realiza varias pruebas para verificar el buen funcionamiento de sus productos, todos los reproductores de discos compactos deben pasar todas las pruebas antes de venderse. Una muestra aleatoria de 250 reproductores dio como resultado que 12 de ellos fallaron en una o más pruebas, encuentra la estimación puntual y por intervalo de confianza del 95% para la proporción real de reproductores de discos compactos de la población que no pasarían la prueba.

Estimación puntual: p = xn

= p = 12

250 = 0.048. Esto significa que el 4.8% ≈ 5% de los

reproductores de discos compactos de la población fallarían.

La estimación por intervalo: P = 0.048 ± 1.96 √ 0.048(1−0.048)250

= 0.048 ± 0.02649 =

0.0745 < P < 0.0215 ≈ 7% < P < 2% esto quiere decir que la proporción de reproductores de discos compactos que podrían fallar esta dentro del intervalo de 7% al 2%, con una confiabilidad de 95%

T32.- En un reporte del Departamento de Tránsito de la ciudad de Mérida, de una muestra de 400 accidentes de automóvil, 80 tuvieron consecuencias fatales. Con base en estos datos determina la estimación puntual y por intervalo de confianza de 90% para la proporción de todos los accidentes automovilísticos, que tuvieron consecuencias fatales.

T33.- En una muestra aleatoria de 100 clientes que realizan sus compras al medio día en el supermercado Soriana, 90 de ellas incluyen la leche en sus compras. Establece la estimación puntual y por intervalo de confianza del 95% para la proporción real de clientes que compran leche.

T34.- De una población de 5,000 clientes se tomó una muestra aleatoria de 150 que compran pasta de dientes en un supermercado Chedraui, al norte de la ciudad, 53 de ellos adquieren la marca “Colgate”, establece la estimación puntual y por intervalo para la proporción real de clientes que compran la pasta de dientes entes mencionada con un nivel de confianza de 90%.

Subtema 2.8 Intervalos de confianza para diferencias entre proporciones.

 Los límites para el intervalo de una diferencia de proporciones correspondientes a dos muestras independientes son:

26

Page 28: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 2

Ejemplo.- En una muestra aleatoria de 85 soportes para el cigüeñal de un motor de automóvil, 10 tienen un terminado que es más rugoso de los que las especificaciones permiten. Supóngase que se hace una modificación al proceso de acabado de la superficie y que, de manera subsecuente, se toma una segunda muestra de 85 ejes. El número de ejes defectuosos en esta segunda muestra es de 8. Obténgase un intervalo de confianza del 95% para la diferencia en la proporción de los soportes defectuosos producidos por ambos procesos.

Soporte n x p̂ q̂

Primera muestra 85 10 0.1176 0.8823

Segunda muestra 85 8 0.09411 0.9058

Límites del intervalo: (0.1176 – 0.09411) ± 1.96

√ (0.1176∗0.8823)85

+(0.09411∗0.9058)

85

Límites = - 0.06893 a 0.11598, Este intervalo de confianza incluye al cero, así que, con base en los datos muestrales, parece poco probable que los cambios hechos en el proceso de acabado de la superficie hayan reducido el número de soportes defectuosos para cigüeñal producidos por el proceso.

T35.- En la ciudad de Monterrey se toma una muestra aleatoria de 98 empresarios de los cuales 48 han sido poseedores de acciones de Teléfonos. En la ciudad de Mérida se selecciona otra muestra aleatoria de 127 empresarios, de los cuales 21 han sido poseedores de acciones de Teléfonos.

a) Obtener un intervalo del 95% de confianza para la diferencia entre las proporciones de empresarios que han sido poseedores de este tipo de acciones en ambas ciudades.

b) ¿Qué conclusión puede obtener del intervalo hallado?

T36.- Se desea determinar si un cambio en el proceso de fabricación de cierto tipo de piezas ha sido efectivo o no. Para probar lo anterior se toma una muestra aleatoria de 1500 piezas antes de hacer el cambio y se encontró que 75 estaban defectuosas. Después de hacer el cambio se tomó otra prueba de 2000 piezas y se encontró que 80 estaban defectuosas. Construir un intervalo de confianza de 95% para la diferencia de las proporciones poblacionales.

27

Page 29: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 2

T37.- En dos empresas similares se tomaron muestras de sus productos, cada muestra era de 200 artículos, en la empresa “A” 144 artículos pasaron la prueba con éxito, en la empresa “B” sólo 135 lo hicieron. Construye un intervalo de confianza de 95% para la diferencia entre las proporciones.

Subtema 2.9 Intervalos de confianza para varianzas.

Así como la media o la proporción obtenida a partir de una muestra, tiene variación, de la misma manera la desviación estándar o la varianza obtenida a partir de una muestra también tiene variación. La varianza de la muestra (s2) es la estimación puntual de la varianza de la población (σ2). Por lo que se puede obtener la estimación por intervalo de la varianza poblacional. La expresión matemática para obtener el intervalo de confianza para la varianza viene dado por la siguiente fórmula:

(n−1 ) s2

xα /22 < σ2 <

(n−1)s2

x(1−α /2)2 , que es el intervalo de confianza del (1 – α) 100% de σ2, la

varianza de la población. Así mismo si se calcula la raíz cuadrada de cada uno de los tres términos de la doble desigualdad, se obtiene el intervalo de confianza del (1 – α) 100% para σ, que es la desviación estándar de la población.

Ejemplo: Una muestra aleatoria de n = 5 ejemplares de cierto tipo de helado tiene un contenido de grasa promedio de 11% y una desviación estándar muestral de s = 0.38%, Construye un intervalo de confianza del 95% para la desviación estándar de la población donde se tomó la muestra.

Solución: los grados de libertad (n – 1) son = 4, el puntaje x0.9752 = 0.484 se obtiene en la

tabla de puntaje respectiva, así mismo el puntaje x0.0252 = 11.143. Al sustituir estos

valores en la fórmula antes mencionada con n = 5, s = 0.38 y los valores respectivos de

x2, se obtiene: (5−1 ) 0.382

11.143 < σ2 <

(5−1)0.382

0.484 -- 0.05053 < σ2 < 1.193, por lo que

extrayendo la raíz cuadrada a ambos miembros de la desigualdad, se obtiene 0.22% < σ < 1.09%, lo cual se interpreta de la siguiente manera: el intervalo de confianza del 95% para la desviación estándar poblacional está entre 0.22% a 1.09%, dentro de ese rango se encuentra el verdadero valor de la desviación estándar poblacional.

T38.- El voltaje de ruptura de circuitos eléctricamente cargados, tomada de una muestra de 17 datos indicó una varianza muestral de 137,324.3, obtener la estimación puntual y por intervalo de confianza de 95% para la varianza poblacional así como para la desviación estándar poblacional.

28

Page 30: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 2

T39.- Se tomó una muestra de 22 datos de resistencia a la fractura de placas de base 18% de acero combinado con níquel, dando como resultado una media de 77.33 y desviación estándar de 5.03, obtener un intervalo de confianza de 99% para la desviación estándar de la resistencia a la fractura.

T40.-El salario promedio diario para una muestra de 30 trabajadores, empleados por horas en una empresa grande de $ 180.00 con una desviación estándar de s = $14.00. Se sabe que los montos de los salarios están normalmente distribuidos, obtener un intervalo de confianza de 95% para estimar la desviación estándar de los salarios diarios de la población.

Subtema 2.10 Intervalos de confianza para razones de dos varianzas.

Surge la necesidad de disponer de métodos estadísticos para comparar las varianzas de dos poblaciones. Por ejemplo si se desea comparar la precisión de medición de un instrumento con la de otro, o la eficacia de un proceso de manufactura con la de otro. Entonces se recurre a la estimación de la razón o cociente de dos varianzas.

Intuitivamente podríamos compara las varianzas de dos poblaciones σ 12 y σ 2

2 utilizando

la razón de las varianzas muestrales s1

2

s22 , si el cociente es uno o casi igual a uno se

podrá decir que son prácticamente iguales, pero si hay un valor muy grande o muy pequeño, proporcionará evidencia de que hay diferencia significativa entre las varianzas de las poblaciones. Supóngase que se tienen dos poblaciones normales e independientes

con varianzas desconocidas σ 12 y σ 2

2 respectivamente y sean s12 y s2

2, las dos varianzas

muestrales. Si se desea conocer un intervalo de confianza de 95% para el cociente de las

dos varianzas σ 12 / σ 2

2 se empleará la siguiente expresión matemática: s1

2

s22 Fα /2

< σ1

2

σ22 <

s12

s22 F

(1−α2) para construir correctamente el intervalo de confianza para el cociente de dos

varianzas poblacionales, se deberá colocar la varianza muestral mayor en el numerador de la expresión. En este caso se requiere calcular los grados de libertad del numerador que son n1 – 1 (recordando que se toma como n1 al tamaño de la muestra de la varianza más grande) y los grados de libertad del denominador n2 – 1.

Ejemplo: Un fabricante de automóviles pone a prueba dos nuevos métodos de ensamblaje de motores respecto al tiempo en minutos. Los datos se muestran a

continuación: método 1: n1 = 31, s12 = 50; método 2: n2 = 25, s2

2 = 24 construir un

intervalo de confianza de 90% para σ 12 / σ 2

2

Tomamos s12 = 50 porque es el valor más grande. Los valores de F requieren los grados

de libertad del numerador (n1 – 1) = 30 y del denominador (n2 – 1) = 24, los puntajes F

29

Page 31: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 2

respectivamente son: para α/2 = 0.05 F = 1.9389; y para (1 – α/2) = 0.95 F = 0.5298, sustituyendo estas cantidades en la expresión dada:

Tenemos: 50

24(1.9389) < σ 12 / σ 2

2 < 50

24(0.5298) ; 1.074 < σ 12 / σ 2

2 < 3.93 y el intervalo

de Confianza para el cociente de las desviaciones estándar sería: 1.036 < σ1

σ2 < 1.98

Nota: si el intervalo de confianza para la desviación estándar está cercano y alrededor de UNO, se considera no se puede concluir que exista alguna diferencia entre la variabilidad de las dos poblaciones, por lo que se puede concluir que las dos desviaciones estándar sean iguales.

T41.- Una empresa que se encarga de fabricar botellas de plástico por inyección, emplea dos métodos diferentes para la producción. A los I.G.E. les gustaría saber cuál de los dos procesos tiene menor rugosidad en la superficie. Para lo cual toma muestras aleatorias de cada proceso.

Datos

Proceso 1: n1 = 16, s1 = 4.7; Proceso 2: n2 = 12, s2 = 5.1.

Obtener un intervalo de confianza de 90% para el cociente de varianzas y para las

T42.- Se obtuvieron las varianzas de dos muestras para los volúmenes de flujo en dos tipos de tubos del mismo diámetro pero de diferente material. Los resultados se observan a continuación: Tipo 1: n1 = 9; s

30

Page 32: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 2

1 = 35; Tipo 2: n2 = 7, s2 = 20; construir un intervalo de confianza del 90% para el cociente de las varianzas poblacionales.

T43.- Los puntajes de una prueba de aptitud para obreros de una empresa X y para obreros de una empresa Y se muestran a continuación, suponer que las muestras son independientes y que los puntajes de cada población están normalmente distribuidos.

Construir un intervalo de confianza del 95% para σ 12 / σ 2

2

Empresa X: nx = 21, sx = 13.26; empresa Y: ny = 16, sy = 10.5

31

Page 33: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 3

Unidad 3. Pruebas de hipótesis con una muestra.

Competencia especifica de la unidad: Realizar aplicaciones en el uso de las pruebas de hipótesis y reconocer la potencia de dichas pruebas para inferir características poblacionales.

Subtemas.

3.1 Metodología para la prueba de hipótesis.

3.2 Hipótesis nula y alternativa.

3.3 Error tipo I y error tipo II.

3.4 Pruebas de hipótesis Z para la media (desviación estándar poblacional conocida).

3.5 Pruebas para proporciones.

3.6 Selección del tamaño de muestra (para estimar la media poblacional).

3.7 Selección del tamaño de muestra (para estimar la proporción poblacional).

Subtema 3.1 Metodología para la prueba de hipótesis.

Etapa 1.- Planear la hipótesis nula y la hipótesis alternativa. La hipótesis nula (H0) es el valor hipotético del parámetro que se compra con el resultado muestral resulta muy poco probable cuando la hipótesis es cierta.

Etapa 2.- Especificar el nivel de significancia que se va a utilizar. El nivel de significancia puede ser del 1%, 5% o 10%, según sea, entonces se rechaza la hipótesis nula solamente si el resultado muestral es tan diferente del valor hipotético que una diferencia de esa magnitud o mayor.

Etapa 3.- Elegir la estadística de prueba. La estadística de prueba puede ser la estadística muestral (el estimador no segado del parámetro que se prueba). Por ejemplo, para probar el valor hipotético de una media poblacional, se toma la media de una muestra aleatoria de esa distribución normal, entonces es común que se transforme la media en un valor “Z” el cual, a su vez, sirve como estadística de prueba.

Etapa 4.- Establecer el valor o valores críticos de la estadística de prueba. Habiendo especificado la hipótesis nula, el nivel de significancia y la estadística de prueba que se van a utilizar, se procede a establecer el o los valores críticos de estadística de prueba. Puede haber uno o más de esos valores, dependiendo de si se va a realizar una prueba de uno o dos colas.

Page 34: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

Etapa 5.- Determinar el valor real de la estadística de prueba. Por ejemplo, al probar un valor hipotético de la media poblacional, se toma una muestra aleatoria y se determina el valor de la media muestral. Si el valor crítico que se establece es un valor de z, entonces se transforma la media muestral en un valor de z.

Etapa 6.- Tomar la decisión. Se compara el valor observado de la estadística muestral con el valor (o valores) críticos de la estadística de prueba. Después se acepta o se rechaza la hipótesis nula. Si se rechaza ésta, se acepta la alternativa; a su vez, esta decisión tendrá efecto sobre otras decisiones de los administradores operativos, como por ejemplo, mantener o no un estándar de desempeño o cuál de dos estrategias de mercadotecnia utilizar.La distribución apropiada de la prueba estadística se divide en dos regiones: una región de rechazo y una de no rechazo. Si la prueba estadística cae en esta última región no se puede rechazar la hipótesis nula y se llega a la conclusión de que el proceso funciona correctamente.Al tomar la decisión con respecto a la hipótesis nula, se debe determinar el valor crítico en la distribución estadística que divide la región del rechazo (en la cual la hipótesis nula no se puede rechazar) de la región de rechazo. A hora bien el valor crítico depende del tamaño de la región de rechazo.

Resumen de la metodología para la prueba de hipótesis:1. Expresar la hipótesis nula2. Expresar la hipótesis alternativa3. Especificar el nivel de significancia4. Determinar el tamaño de la muestra5. Establecer los valores críticos que establecen las regiones de rechazo de las de no

rechazo.6. Determinar la prueba estadística.7. Coleccionar los datos y calcular el valor de la muestra de la prueba estadística

apropiada.8. Determinar si la prueba estadística ha sido en la zona de rechazo a una de no rechazo.9. Determinar la decisión estadística.10. Expresar la decisión estadística en términos del problema.

Subtema 3.2 Hipótesis nula y alternativa.

La inferencia estadística, como ya se mencionó, está relacionada con los métodos para obtener conclusiones o generalizaciones acerca de una población. Estas conclusiones sobre la población pueden estar relacionadas ó con la forma de la distribución de una variable aleatoria, ó con los valores de uno o varios parámetros de la misma.

33

Page 35: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

En las pruebas de hipótesis se trata de decidir entre aceptar o rechazar un valor especificado (por ejemplo, si el nivel de concentración de un líquido en un proceso es normal o no lo es).

El campo de las pruebas de hipótesis se pueden considerar dos áreas: Pruebas de hipótesis sobre parámetros, para determinar si un parámetro de una distribución toma o no un determinado valor, y Pruebas de Bondad de Ajuste, para definir si un conjunto de datos se puede modelar mediante una determinada distribución.

Si sobre la base de una muestra se tiene que decidir si un proceso está produciendo una determinada media, digamos m = 100, o si hay que decidir si una determinada droga sirve a un grupo específico de pacientes, lo anterior, puede traducirse en el lenguaje de “Pruebas de Hipótesis”.

Una hipótesis estadística es una proposición o conjetura con respecto a una o más poblaciones. Estas aseveraciones o suposiciones pueden ser con respecto a uno o varios parámetros, ó con respecto a la forma de las respectivas distribuciones de probabilidad.

En esta unidad nos concentraremos en la prueba de hipótesis, otro aspecto de la inferencia estadística que al igual que la estimación del intervalo de confianza, se basa en la información de la muestra. Se desarrolla una metodología paso a paso que le permita hacer inferencias sobre un parámetro poblacional mediante el análisis diferencial entre los resultados observados (estadístico de la muestra) y los resultados de la muestra esperados, si la hipótesis subyacente es realmente cierta. En el problema de estimación se trata de elegir el valor de un parámetro de la población, mientras que en las pruebas de hipótesis se trata de decidir entre aceptar o rechazar un valor especificado. Prueba de hipótesis: Estadísticamente una prueba de hipótesis es cualquier afirmación acerca de una población y/o sus parámetros.

Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal contraste involucra la toma de decisión acerca de las hipótesis. La decisión consiste en rechazar o no una hipótesis en favor de la otra. Una hipótesis estadística se denota por “H” y son dos: - Ho: hipótesis nula - H1: hipótesis alternativa.

Concepto: Una prueba de hipótesis estadística es una conjetura de una o más poblaciones. Nunca se sabe con absoluta certeza la verdad o falsedad de una hipótesis estadística, a no ser que se examine la población entera. Esto por su puesto sería impráctico en la mayoría de las situaciones. En su lugar, se toma una muestra aleatoria de la población de interés y se utilizan los datos que contiene tal muestra para proporcionar evidencia que confirme o no la hipótesis. La evidencia de la muestra que es un constante con la hipótesis planteada conduce a un rechazo de la misma mientras que la evidencia que apoya la hipótesis conduce a su aceptación.

La distribución apropiada de la prueba estadística se divide en dos regiones: una región de rechazo y una de no rechazo. Si la prueba estadística cae en esta última región no se puede rechazar la hipótesis nula y se llega a la conclusión de que el proceso funciona correctamente.

34

Page 36: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

Al tomar la decisión con respecto a la hipótesis nula, se debe determinar el valor crítico en la distribución estadística que divide la región del rechazo (en la cual la hipótesis nula no se puede rechazar) de la región de rechazo.

Subtema 3.3 Error tipo I y error tipo II.

En un estudio de investigación, el error de tipo I también denominado error de tipo alfa (α) o falso positivo, es el error que se comete cuando el investigador no acepta

la hipótesis nula ( ) siendo esta verdadera en la población. Es equivalente a encontrar un resultado falso positivo, porque el investigador llega a la conclusión de que existe una diferencia entre las hipótesis cuando en realidad no existe. Se relaciona con el nivel de significancia estadística.

Representación de los valores posibles de la probabilidad de un error tipo II (rojo) en el ejemplo de un test de significancia estadística para el parámetro μ. El error tipo II depende del parámetro μ. Mientras más cerca se encuentre este del valor supuesto bajo la hipótesis nula, mayor es la probabilidad de ocurrencia del error tipo II. Debido a que el verdadero valor de μ es desconocido al hacer la presunción de la hipótesis alternativa, la probabilidad del error tipo II, en contraste con el error tipo I (azul), no se puede calcular.

La hipótesis de la que se parte   aquí es el supuesto de que la situación experimental presentaría un «estado normal». Si no se advierte este «estado normal», aunque en realidad existe, se trata de un error estadístico tipo I. Algunos ejemplos para el error tipo I serían:

Se considera que el paciente está enfermo, a pesar de que en realidad está sano; hipótesis nula: El paciente está sano.

Se declara culpable al acusado, a pesar de que en realidad es inocente; hipótesis nula: El acusado es inocente.

En un estudio de investigación, el error de tipo II, también llamado error de tipo beta (β) (β es la probabilidad de que exista este error) o falso negativo, se comete cuando el

35

Page 37: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

investigador no rechaza la hipótesis nula siendo esta falsa en la población. Es equivalente a la probabilidad de un resultado falso negativo, ya que el investigador llega a la conclusión de que ha sido incapaz de encontrar una diferencia que existe en la realidad.

Se acepta en un estudio que el valor del error beta esté entre el 5 y el 20%.

Contrariamente al error tipo I, en la mayoría de los casos no es posible calcular la probabilidad del error tipo II. La razón de esto se encuentra en la manera en que se formulan las hipótesis en una prueba estadística. Mientras que la hipótesis nula

representa siempre una afirmación enérgica (como por ejemplo   «Promedio μ = 0») la hipótesis alternativa, debido a que engloba todas las otras posibilidades, es

generalmente de naturaleza global (por ejemplo   «Promedio μ ≠ 0» ).

T44.- Investiga ampliamente el error tipo 1 y tipo 2.

Subtema 3.4 Pruebas de hipótesis Z para la media (desviación estándar poblacional conocida).

Ejemplo 1: Un problema basado en un estudio en una fábrica de llantas. En este problema la fábrica de llantas tiene dos turnos de operarios, turno de día y turno mixto. Se selecciona una muestra aleatoria de 100 llantas producidas por cada turno para ayudar al gerente a sacar conclusiones de la siguiente pregunta: ¿Es la duración promedio de las llantas producidas en el turno de día igual a 25 000 Millas?

En la fábrica de llantas la hipótesis nula y alternativa para el problema se plantearon como sigue:

Ho: μ = 25 000 H1: μ ≠ 25 000

Por estudios anteriores se sabe que la σ = 4000 millas.

Si el tamaño de la región α de rechazo se estableciera en 5% entonces se podrían determinar los valores críticos de la distribución. Dado que la región de rechazo está dividida en las dos colas de la distribución, el 5% se divide en dos partes iguales de 2.5%.

Si se considera la desviación estándar σ las llantas producidas en el turno de día, entonces, con base en el teorema de limite central, la distribución en el muestreo de la media seguiría la distribución normal, y la prueba estadística que está basada en la diferencia entre la media de la muestra y la media μ hipotética se encontrara como sigue:

Por tanto, la regla para decisión sería: Rechazar Ho si Z > + 1.96 o si Z < - 1.96 De lo contrario, no rechazar Ho.

36

Page 38: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

Para obtener el error estándar de la población σx = σ

√n , σx =

4000

√100 = 400,

Los resultados de la muestra para el turno de día fueron =25 430 millas, y Puesto que se está probando si la media es diferente a 25 000 millas, el estadístico de prueba se tiene

con la ecuación: Zep = (x−µ)

σx , Zep =

(25430−25000)400

= 1.075

Dado que Zep = 1.075, se ve que −1.96 < 1.075 < 1.96, entonces no se rechaza Ho.

Por ello, la decisión de no rechazar la hipótesis nula Ho. En conclusión es que la duración promedio de las llantas es 25 000 millas. A fin de tener en cuenta la posibilidad de un error de tipo II, este enunciado se puede redactar como “no hay pruebas de que la duración promedio de las llantas sea diferente a 25 000 millas en las llantas producidas en el turno de día”.

Las pruebas de hipótesis pueden ser de dos colas, como el ejemplo anterior, o de una cola (izquierda o derecha). ¿Cómo saber si la prueba es de una o dos colas? Es muy sencillo, si lo que se quiere probar tiene que ver en el planteamiento del problema con igualdad o diferencia, entonces se debe seleccionar una prueba de dos colas, pero si lo que se quiere probar tiene que ver con “mayor que” o algo similar se deberá emplear prueba de una cola “derecha”, ahora bien si lo que se quiere probar tiene que ver con “menor que” o algo similar, la prueba indicada será de una cola “izquierda”.

Con tamaño de muestra pequeño y desviación estándar desconocida.

En el ejemplo 1 anterior el tamaño de la muestra fue mayor de 30 y la desviación estándar no fue la de la muestra. En la mayoría de los casos la desviación estándar no es conocida y se recurre al muestreo para obtener la estimación de la desviación estándar, a esta se le conoce como desviación estándar muestral y se identifica con la letra S. Si el tamaño de la muestra es menor o igual a 30 y la desviación estándar muestral, se emplea el puntaje “t – student” con n – 1 grados de libertad, en lugar del puntaje Z.

Ejemplo 2.- La Comisión Federal de Comercio lleva a cabo estudios periódicos para probar la afirmación que hacen los fabricantes acerca de sus productos. En el caso de la empresa Nescafé en uno de sus productos la etiqueta dice que contiene cuando menos 3 libras. La CFC desea contrastar la afirmación contra la alternativa de que sea menos de 3 libras. Para lo cual toma una muestra de 30 latas de café de esta marca y de la presentación indicada y obtiene una media 2.92 con desviación estándar 0.18, probar la afirmación de la CFC a un nivel de significación de 5 %.

37

Page 39: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

1º Paso: Plantear la Hipótesis de Investigación: “El peso de las latas de Nescafé es menor de 3 libras”.

2º Paso: Plantear las Hipótesis Nula a Alterna:

Nula Ho: > 3 Alterna Hi: < 3

3º Paso: Nivel de significancia y tamaño de la muestra.

α = nivel de significación de 5 %. Tamaño de muestra: n = 30

4º Paso: Error estándar: Sx = s

√n ; Sx =

0.18

√30 = 0.03286

5º Paso: Valores críticos que dividen las zonas de rechazo y aceptación.

región de rechazo Ho. región de aceptación de Ho

En este caso se emplea el puntaje t – student, con n-1 grados de libertad = 29, α = 0.05 unilateral el cual se busca en la tabla respectiva, dando un valor de – 1.699

6º Paso: Estadístico de Prueba: Ep = (2.92 – 3) / 0.03286 Ep = - 2.43

7º Paso: Regla de decisión: si el estadístico de prueba es menor que el valor crítico se rechaza la hipótesis nula y se acepta como verdadera la hipótesis alterna. Resultado: dado que el estadístico de prueba (-2.43) es menor que el valor crítico (-1.699) se acepta como verdadera la hipótesis alterna (Hi) y en consecuencia se rechaza la hipótesis nula.

Conclusión: Con base en lo anterior se concluye que las latas de café que supuestamente tienen cuando menos 3 libras es falsa, demostrando que en realidad el contenido es menor de esa cantidad.

T45.- Una compañía que vende tiras repelentes contra insectos asegura que su producto es eficaz más de 400 hrs. Un análisis sobre 9 tiras seleccionadas aleatoriamente indicó un promedio de 380 hrs. y una desviación estándar de 60 hrs. Prueba la aseveración de la compañía a un nivel de significación de 1 %

T46.- La media y la desviación estándar de la estancia de los turistas extranjeros en hoteles de 4 estrellas el año anterior fue de 4 noches y 1.5 noches respectivamente. El gerente de reservaciones de un hotel desea saber con una confiabilidad de 95 % si la estancia de turistas extranjeros en hoteles de 4 estrellas será diferente este año. Para lo cual selecciona una muestra aleatoria de 35 turistas extranjeros y determina que la estancia promedio es de 3.6 noches

38

Page 40: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

T47.- El tiempo promedio en realizar determinada tarea por el personal de cuartos de un hotel es de 65 min. y S = 15 min. El administrador cree que si el personal antes mencionado recibiese entrenamiento especial, el tiempo en realizar la tarea disminuiría. Para lo cual toma al azar una muestra de 32 empleados de esa área, reciben entrenamiento, posteriormente se mide el tiempo promedio en que dichos trabajadores realizan la tarea y se encuentra que es de 55.5 min. ¿Sirve de base estos datos para apoyar la opinión del administrador? α = 5 %

T48.- El coordinador de la carera de IGE, desea verificar con un nivel de significación de 5 % la hipótesis de que el promedio de calificaciones en la asignatura Estadística Inferencial 1 en un determinado grupo es de 65. Una muestra aleatoria de 25 sujetos dio los siguientes resultados: x = 67, s = 12.

T49.- El tiempo promedio para atender a los clientes que solicitan los servicios de tour a Uxmál en una determinada agencia de viajes es de 15 min. con desviación estándar = 4 min. El gerente cree que si el personal recibe entrenamiento, el tiempo de atención a los clientes se reduciría. El personal recibe un curso de eficiencia en el trabajo y posteriormente se selecciona una muestra aleatoria de 20 servicios, dando una media de 10 min. Sea α =5%

Subtema 3.5 Pruebas para proporciones.

Las pruebas de proporciones son adecuadas cuando los datos que se están analizando constan de cuentas o frecuencias de elementos de dos o más clases. El objetivo de estas pruebas es evaluar las afirmaciones con respecto a una proporción (o Porcentaje) de población. Las pruebas se basan en la premisa de que una proporción muestral (es decir, x ocurrencias en n observaciones, o x/n) será igual a la proporción verdadera de la población si se toman márgenes o tolerancias para la variabilidad muestral. Las pruebas suelen enfocarse en la diferencia entre un número esperado de ocurrencias, suponiendo que una afirmación es verdadera, y el número observado realmente. La diferencia se compara con la variabilidad prescrita mediante una distribución de muestreo que tiene como base el supuesto de que H0  es realmente verdadera.

En muchos aspectos, las pruebas de proporciones se parecen a las pruebas de medias, excepto que, en el caso de las primeras, los datos muestrales se consideran como frecuencias en lugar de como mediciones.

Cuando el objetivo del muestreo es evaluar la validez de una afirmación con respecto a la proporción de una población, es adecuado utilizar una prueba de una muestra. La metodología de prueba depende de si el número de observaciones de la muestra es grande o pequeño. Esta prueba comprende el cálculo del valor estadístico de prueba Z.

39

Page 41: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

Z prueba =

x /n−p0

√ p0 q0

n

donde x significa el número de ocurrencias o frecuencias, n

cantidad total de observaciones, xn

proporción de la muestra, p0 proporción

poblacional o parámetro, √ p0q0

n desviación estándar de la proporción, q0 = 1 – p0,

complemento de la proporción. La fórmula anterior de Zprueba se aplica a muestreos con población infinita o desconocida. Pero si se toma una muestra a partir de una población finita o conocida, (n/N * 100) % > 5% se debe emplear un factor de

corrección para la desviación estándar de la proporción √ p0q0

n √ (N−n)

(N−1)

Posteriormente este valor es comparado con el valor de Z, obtenido a partir de una tabla de distribución normal a un nivel de significación seleccionado. Como ocurrió con la prueba de medias de una muestra, las pruebas de proporciones pueden ser de una o dos colas.

La hipótesis nula se plantea Ho: p =po, en tanto que para la hipótesis alterna hay tres posibilidades: H1: p < po ; p > po, p ≠ po , dependiendo del planteamiento del problema, en el primer caso será de cola izquierda, en el segundo caso de cola derecha, en el tercer caso de dos colas o bilateral.

Ejemplo

Una encuesta realizada por Bancomer a 35 clientes indicó que un poco más del 74 % tenían un ingreso familiar de más de $200,000 al año. Si esto es cierto, el banco desarrollará un paquete especial de servicios para este grupo. La administración quiere determinar si el porcentaje verdadero es mayor del 60 % antes de desarrollar e introducir este nuevo paquete de servicios. Los resultados mostraron que 74.29 % de los clientes encuestados reportaron ingresos de $200,000 o más al año.

El procedimiento para la prueba de hipótesis de proporciones es el siguiente:

Especifica la hipótesis nula y alternativa.

Hipótesis Nula: H0 : P=0 .60

Hipótesis Alternativa Ha : P>0 .60

donde P = la proporción de clientes con ingresos familiares anuales de $200,000 o más.

Específica el nivel de significación, α permitido. Para una α=0.05, el valor de tabla de Z para una prueba de una sola cola es igual a 1.645.

Calcula el error estándar de la proporción especificada en la hipótesis nula.

40

Page 42: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

sp=√ p (1−p )n

donde: p = proporción especificada en la hipótesis nula. n = tamaño de la muestra.

Por consiguiente:

sp=√ 0 .60 (1−0 . 60)35

=. 0828

Calcula la estadística de prueba:

z=( proporciónobservada)−( proporción¿ )

s p

z=0 .7429−0 . 600 . 0828

=1. 73

Valor crítico 1.645 Z prueba = 1.73

La hipótesis nula se rechaza porque el valor de la Z calculada es mayor que el valor crítico Z, queda a la derecha del valor crítico (1.645). El banco puede concluir con un

95 % de confianza (1−α=. 95 ) que más de un 60 % de sus clientes tienen ingresos familiares de $200,000 o más. La administración puede introducir el nuevo paquete de servicios orientado a este grupo.

T50.- El profesor de Estadística Inferencial I de la carrera de I. G.E., cree que más del 50% de los alumnos aprueba el examen de la primera unidad. Para verificar lo anterior el profesor toma una muestra aleatoria de 150 alumnos que han presentado la unidad 1, de los cuales 90 alumnos aprobaron esta unidad. Prueba lo anterior con = 5 %

T51.- Un promotor de turismo del Estado de Yucatán cree que el 25 % de los turistas que vienen a Yucatán, visitan la zona arqueológica de Kabáh, el promotor selecciona una muestra aleatoria de 120 turistas y se les pregunta si piensan visitar o si ya han

41

Page 43: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

visitado la zona arqueológica antes mencionada, 20 de los cuales contestaron afirmativamente, verificar la hipótesis del promotor. Sea α = 1 %

T52.- En un estudio se afirma que 9 de cada 10 médicos recomiendan la aspirina a sus pacientes, probar esta afirmación con respecto a la alternativa de que la proporción real de médicos que hacen esto es menor del 90 %. Una muestra aleatoria de 100 médicos revela que 80 de ellos recomiendan la aspirina a sus pacientes. Sea a = 5 %

T53.- En un estudio se afirma que 3 de 10 estudiantes universitarios de I. G. E., trabajan. Pruebe esta aseveración, a un nivel de significación de 0,025, respecto a la alternativa de que la proporción real de los estudiantes universitarios trabajan es mayor de lo que se afirma, si una muestra aleatoria de 600 estudiantes universitarios revela que 200 de ellos trabajan. La muestra fue tomada de 10000 estudiantes.

T54.- Un fabricante afirma que por lo menos el 90 por ciento de las piezas de una maquinaria que suministra a una fábrica guardan las formas especificadas. Un examen de 200 de esas piezas reveló que 160 de ellas no eran defectuosas. Pruebe si lo que afirma el fabricante es cierto a un nivel de significancia de 5%

Subtema 3.6 Selección del tamaño de muestra (para estimar la media poblacional).

A la hora de determinar el tamaño que debe alcanzar una muestra hay que tomar en cuenta varios factores: el tipo de muestreo, el parámetro a estimar, el error muestral admisible, la varianza poblacional y el nivel de confianza. Por ello antes de presentar algunos casos sencillos de cálculo del tamaño muestral delimitemos estos factores.

Parámetro. Son las medidas o datos que se obtienen sobre la población, por ejemplo: la edad, el peso, el sueldo, el tiempo, etc.

Estadístico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimación de los parámetros.

Error Muestral (e), de estimación o estándar. Es la diferencia entre un estadístico y su parámetro correspondiente (µ - x). Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al valor de la población, nos da una noción clara de hasta dónde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo. Un estadístico será más preciso en cuanto y tanto su error es más pequeño.

42

Page 44: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

Nivel de Confianza. Probabilidad de que la estimación efectuada se ajuste a la realidad. Cualquier información que queremos recoger está distribuida según una ley de probabilidad, así llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un estadístico capte el verdadero valor del parámetro, si queremos que el muestreo sea más confiable, deberemos tomar una muestra más grande, o sea, a mayor confiabilidad mayor es el tamaño de la muestra.

Varianza Poblacional. Cuando una población es más homogénea la varianza es menor y el número de entrevistas necesarias para construir un modelo reducido del universo, o de la población, será más pequeño. Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios previos, hay una relación directa entre la varianza y el tamaño de la muestra, mientras los datos sean más homogéneos menor será el tamaño de la muestra.

Fórmula para determinar el tamaño de muestra.

Veamos los pasos necesarios para determinar el tamaño de una muestra empleando el muestreo aleatorio simple. Para ello es necesario partir de dos supuestos: en primer lugar el nivel de confianza al que queremos trabajar; en segundo lugar, cual es el error máximo que estamos dispuestos a admitir en nuestra estimación. Así pues los pasos a seguir son:

 1.- Obtener el tamaño muestral suponiendo que la población es infinita. N∞

n∞ = (Z2σ 2)

e2 donde: 

Z2 : Z corresponde al nivel de confianza elegido.

σ 2: Varianza poblacional 

e: error máximo

Este es el tamaño adecuado que debemos muestrear.

Si la población es finita o sea conocida la cantidad (N) pasamos a modificar el tamaño de la muestra anteriormente calculada, debido a la población finita. 

Obtener el tamaño de la muestra con población finita, (n f ¿ según la siguiente fórmula: 

n f = (N∗n∞)(N+n∞)

Ejemplo: Un investigador a cuyo cargo está el departamento de educación física, desea hacer una estimación del consumo de oxígeno (lt/min.) de los estudiantes de la carrera de IGE, entre los 18 y 24 años de edad, después de hacer un tipo especial de ejercicio. Desea que su estimación se encuentre cuando mucho a 0.10 de la media verdadera (poblacional) con una confiabilidad de 95%, estudios anteriores indican una varianza en el consumo de oxígeno de 0.99, ¿Qué tamaño debe tener la muestra?

43

Page 45: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

Datos: e = 0.10, confiabilidad 95% Z = 1.96, σ2 = 0.99, aplicando la fórmula respectiva y dado que la población es infinita, o sea desconocida, tenemos: n∞

= (1.9620.99)

0.102 = 380.318, dado que el tamaño de la muestra debe ser un número entero,

no puede tomarse una fracción de la muestra, se aconseja redondear el resultado al entero que sigue, o sea en este caso sería 380.318 ≈ 381.

T55.- El coordinador de la carrera de IGE, desea hacer una estimación del tiempo promedio que emplean los alumnos en hacer el recorrido entre la casa y la escuela, desea que su estudio tenga una confiabilidad de 99% y una precisión de un minuto, una prueba piloto dio una varianza de 25, ¿Qué tamaño debe tener la muestra, si la población es de 2,500 alumnos?

T56.- El departamento de Recursos Humanos de una empresa planea hacer un estudio con el objeto de conocer el promedio de horas semanales trabajadas por las mujeres del servicio doméstico. La muestra será extraída de una población de 10,000 mujeres que figuran en los registros de la Seguridad Social y de las cuales se conoce a través de un estudio piloto que su varianza es de 9.648. Trabajando con un nivel de confianza de 0.95 y estando dispuestos a admitir un error máximo de 0,1, ¿cuál debe ser el tamaño muestral que empleemos?

T57.- Se desea conocer el promedio de la glucemia basal de una población, con una confiabilidad de 95% y un margen de error de ± 3 mg/dl y se tiene información de un estudio piloto que la varianza es de 250 mg/dl, que tamaño debe tener la muestra si:

La población es infinita.

La población es finita de 10,000 personas.

Subtema 3.7 Selección del tamaño de muestra (para estimar la proporción poblacional).

Para calcular el tamaño de muestra para la estimación de proporciones poblacionales hemos de tener en cuenta los mismos factores que en el caso de la media. La fórmula que nos permitirá determinar el tamaño muestral es la siguiente:

n∞ = ( p∗q∗Z2)

e2 , donde p representa la proporción, q = (1-p) representa el

complemento de la proporción. Observación: en el caso de que no se conozca la

proporción la fórmula se modifica a la siguiente: n∞ = (0.25∗Z2)

e2 , donde 0.25 es el

producto de p*q, suponiendo que estos tienen los valores de 0.5 y 0.5

Ahora bien si el tamaño de la muestra proviene de una población finita, (n f ¿ se

complementa con la siguiente fórmula:  n f = (N∗n∞)(N+n∞)

44

Page 46: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

Ejemplo: Una maestra desea hacer una investigación acerca de la actitud de los alumnos hacia el estudio, de que tamaño debe ser la muestra si quiere que su investigación difiera cuando mucho en 2.5% del valor verdadero, con una confiabilidad de 95%. Investigaciones similares que se llevaron a cabo en otro Tecnológico dio como resultado que el 60% de los alumnos tenían buena disposición hacia el estudio.

Datos: p = 0.60, q=0.40, (1 – α) = 0.95 z = 1.96, e = 0.025¸ sustituyendo estas

cantidades convenientemente en la fórmula obtenemos n∞ = (0.60∗0.40∗1.962)

0.0252

=1,475.17 el tamaño de la muestra debe ser un número entero por lo que se redondea al entero inmediato, o sea 1,476.

T58.- ¿Qué tamaño de muestra sería necesario para obtener un intervalo de confianza de 95% para estimar la proporción verdadera de la población, si el error permitido es de 8%?

T59.- El I. G. E. de un centro comercial recién abierto, contrata a una compañía publicitaria en televisión para que lo promueva en la ciudad, para lo cual desea calcular el tamaño de la muestra que va a tomar de dicha comunidad, el profesional desea que su estimación se encuentre a 0.04 de la proporción verdadera con un 90% de confiabilidad, en una encuesta piloto de 15 hogares el 35% de los entrevistados dijeron que había al menos alguien su casa que ve regularmente los programas de T. V.

T60.- Con los datos del problema anterior, calcula el tamaño de la muestra suponiendo que en la ciudad hay 6000 hogares con T. V.

Ejercicios integradores.

El significado de las variables es:

ASISTENCIA: Número de asistencias por cada alumno durante un semestre.

PARTICIPACIONES: Número de participaciones por cada alumno durante un semestre.

APROVECHAMIENTO: Calificación promedio final del curso de Estadística 2

UAPO: Unidades aprobadas en prueba ordinaria (primera oportunidad)

EDAD: Edad del estudiante al momento de cursar Estadística 1

CI.- Cociente intelectual de los alumnos en el momento de cursas Estadística 1.

LIBRAS.- Peso de los alumnos en libras.

CAL. MATEMATICAS. Calificación obtenida en la primera unidad de matemáticas.

CAL. ESTADÍSTICA. Calificación obtenida en la primera unidad de estadística.

45

Page 47: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

PESO DE LOS ALUMNOS EN KGS.

CALIFICACIÓN DE LA UNIDAD 2.

Instrucciones: se asignará una tarea a cada equipo, el cual deberá desarrollar lo siguiente de acuerdo al formato dado. Emplear la base de datos de las páginas 47 a la 52.

a.- Calcular el tamaño adecuado de la muestra, considerando que la población es finita.

b.- Escoger los números aleatorios utilizando la función correspondiente de la calculadora, o bien utilizando tabla de números aleatorios.

c.- Seleccionar los datos de acuerdo a los números aleatorios.

d.- Calcular la estimación puntual de la media poblacional.

e.- Calcular la estimación por intervalo de la media poblacional.

f.- Plantear una hipótesis con los datos del ejercicio y con los resultados obtenidos, probarla.

g- Incluye en cada caso interpretaciones y gráfica.

1.- Se desea hacer una estimación puntual y por intervalo del promedio de ASISTENCIAS por semestre, para lo cual acude al muestreo aleatorio, se desea que la estimación esté cuando mucho a 1.5 unidades de la media verdadera, con una confiabilidad de 95%, Para determinar la desviación estándar referencial toma una muestra piloto con los 10 primeros datos de esta variable. Por otra parte calcula mediante probabilidad (áreas) que proporción de alumnos tienen 10 o más asistencias al año.

2.- Se desea hacer una estimación puntual y por intervalo del promedio de PARTICIPACIONES por semestre, para lo cual acude al muestreo aleatorio, se desea que la estimación esté cuando mucho a 2 unidades de la media verdadera, con una confiabilidad de 95%. Para determinar la desviación estándar referencial toma una muestra piloto con los 10 primeros datos de esta variable. Por otra parte calcula mediante probabilidad (áreas) que proporción de alumnos tienen 10 o más participaciones al año.

3.- Se desea hacer una estimación puntual y por intervalo del promedio de APROVECHAMIENTO por semestre, para lo cual acude al muestreo aleatorio, se desea que la estimación esté cuando mucho a 5 unidades de la media verdadera, con una confiabilidad de 90%, Para determinar la desviación estándar referencial toma una muestra piloto con los 10 primeros datos de esta variable. Por otra parte calcula mediante probabilidad (áreas) que proporción de alumnos tienen calificación de 70 o más.

4.- Se desea hacer una estimación puntual y por intervalo del promedio de U. A. P. O. por semestre, para lo cual acude al muestreo aleatorio, se desea que la estimación esté cuando mucho a 0.3 unidades de la media verdadera, con una confiabilidad de 90%, para determinar la desviación estándar referencial toma una muestra piloto con los 10

46

Page 48: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

primeros datos de esta variable. Por otra parte calcula mediante probabilidad (áreas) que proporción de alumnos tienen 3 o más U. A. P. O.

5.- Se desea hacer una estimación puntual y por intervalo de la EDAD promedio de los alumnos, para lo cual se acude al muestreo aleatorio, se desea que la estimación esté cuando mucho a 0.5 unidades de la media verdadera, con una confiabilidad de 95%, Para determinar la desviación estándar referencial toma una muestra piloto con los 10 primeros datos de esta variable. Por otra parte calcula mediante probabilidad (áreas) que proporción de alumnos tienen 22 o más años.

6.- Se desea hacer una estimación puntual y por intervalo de la CI promedio de los alumnos, para lo cual se acude al muestreo aleatorio, se desea que la estimación esté cuando mucho a 3 unidades de la media verdadera, con una confiabilidad de 99%, Para determinar la desviación estándar referencial toma una muestra piloto con los 10 primeros datos de esta variable. Por otra parte calcula mediante probabilidad (áreas) que proporción de alumnos tienen CI entre 100 y 110.

7.- Se desea hacer una estimación puntual y por intervalo del peso promedio en LIBRAS de los alumnos, para lo cual se acude al muestreo aleatorio, se desea que la estimación esté cuando mucho a 3.8 libras de la media verdadera, con una confiabilidad de 98%, Para determinar la desviación estándar referencial toma una muestra piloto con los 10 primeros datos de esta variable. Por otra parte calcula mediante probabilidad (áreas) que proporción de alumnos pesa más de 140 libras.

8.- Se desea hacer una estimación puntual y por intervalo de la calificación de Matemáticas de los alumnos, para lo cual se acude al muestreo aleatorio, se desea que la estimación esté cuando mucho a 4 unidades de la media verdadera, con una confiabilidad de 90%, Para determinar la desviación estándar referencial toma una muestra piloto con los 10 primeros datos de esta variable. Por otra parte calcula mediante probabilidad (áreas) que proporción de alumnos tiene calificación menor de 90.

9.- Se desea hacer una estimación puntual y por intervalo de la calificación de Estadística Unidad 1 de los alumnos, para lo cual se acude al muestreo aleatorio, se desea que la estimación esté cuando mucho a 4 unidades de la media verdadera, con una confiabilidad de 90%, Para determinar la desviación estándar referencial toma una muestra piloto con los 10 primeros datos de esta variable. Por otra parte calcula mediante probabilidad (áreas) que proporción de alumnos tiene calificación menor de 90.

10.- Se desea hacer una estimación puntual y por intervalo del peso promedio en Kilogramos de los alumnos, para lo cual se acude al muestreo aleatorio, se desea que la estimación esté cuando mucho a 1.5 Kgs. de la media verdadera, con una confiabilidad de 95%, Para determinar la desviación estándar referencial toma una muestra piloto con los 10 primeros datos de esta variable. Por otra parte calcula mediante probabilidad (áreas) que proporción de alumnos pesa más de 80 Kgs.

47

Page 49: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

11.- Se desea hacer una estimación puntual y por intervalo de la calificación de Estadística Unidad 2 de los alumnos, para lo cual se acude al muestreo aleatorio, se desea que la estimación esté cuando mucho a 6 unidades de la media verdadera, con una confiabilidad de 90%, Para determinar la desviación estándar referencial toma una muestra piloto con los 10 primeros datos de esta variable. Por otra parte calcula mediante probabilidad (áreas) que proporción de alumnos tiene calificación menor de 70.

BASE DE DATOS:

NUM. CAL ASIS. PART. APROV. UAPO EDAD CI PESO CAL PESO califc.MAT LIBRAS Unid. 1 KG Unid. 2

1 55 16 13 80 1 22 98 179 55 98.45 37

2 83 11 6 61 2 23104 158 83 86.9 80

3 93 9 6 62 3 21103 158 93 86.9 95

4 88 14 21 86 1 24 97 175 88 96.25 87

5 56 16 8 52 2 23109 171 56 94.05 40

6 76 16 11 75 3 20 95 178 76 97.9 69

7 54 17 16 77 0 20120 189 54 103.95 36

8 80 2 3 26 1 21105 164 80 90.2 76

9 80 11 7 56 1 23105 180 80 99 76

10 81 13 10 69 0 21109 171 81 94.05 77

11 97 15 9 36 1 22105 176 97 96.8 100

12 94 16 5 48 0 22 91 177 94 97.35 9713 89 9 1 33 1 23 93 180 89 99 89

14 73 10 8 50 4 21113 168 73 92.4 65

15 80 16 16 95 1 23120 176 80 96.8 75

16 96 2 1 33 2 21122 174 96 95.7 99

17 71 11 6 46 2 20 91 171 71 94.05 62

18 94 12 3 50 1 23109 185 94 101.75 96

19 92 9 4 45 3 20113 172 92 94.6 93

20 76 14 8 98 4 20121 181 76 99.55 69

21 64 14 19 94 3 21105 165 64 90.75 52

22 82 16 19 85 4 22 91 178 82 97.9 7923 82 18 21 93 2 23 93 181 82 99.55 78

24 80 13 7 73 3 21113 177 80 97.35 75

25 90 16 19 87 2 24 12 189 90 103.95 90

48

Page 50: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

0

26 94 12 7 67 3 23122 181 94 99.55 96

27 77 13 11 74 1 20 91 177 77 97.35 71

28 72 7 3 54 4 20109 179 72 98.45 63

29 81 18 24 97 2 21113 188 81 103.4 77

30 67 13 8 48 1 23121 190 67 104.5 55

31 84 12 8 44 2 21 97 179 84 98.45 81

32 74 13 7 72 4 22109 175 74 96.25 66

33 74 13 4 84 3 22 95 160 74 88 66

34 89 11 12 72 2 23120 176 89 96.8 88

35 82 16 11 51 1 21105 178 82 97.9 78

36 83 10 8 43 3 23105 163 83 89.65 80

37 91 11 9 82 4 21109 166 91 91.3 91

38 74 12 15 84 4 20105 178 74 97.9 65

39 77 17 11 89 2 23 91 165 77 90.75 7040 88 5 1 73 0 20 93 172 88 94.6 88

41 83 14 6 27 0 20105 168 83 92.4 80

42 63 4 2 20 4 21105 176 63 96.8 50

43 82 18 6 88 3 22109 176 82 96.8 78

44 81 16 18 86 2 23105 176 81 96.8 76

45 86 10 7 61 2 21 93 182 86 100.1 84

46 76 12 12 71 1 24113 184 76 101.2 69

47 90 5 8 56 3 23120 176 90 96.8 90

48 73 17 12 82 1 20122 179 73 98.45 65

49 88 7 6 47 1 20109 165 88 90.75 86

50 98 11 6 47 3 21 95 159 98 87.45 100

51 82 10 6 74 2 21120 174 82 95.7 78

52 72 7 7 49 1 22105 171 72 94.05 63

53 79 7 6 62 2 22105 178 79 97.9 74

54 88 14 12 86 4 23109 183 88 100.65 87

55 67 12 9 68 3 21105 177 67 97.35 56

56 72 16 15 79 3 23 91 189 72 103.95 6257 92 7 6 50 2 21 93 176 92 96.8 92

58 69 4 6 83 4 20109 184 69 101.2 58

49

Page 51: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

59 81 5 4 40 2 23105 193 81 106.15 76

60 77 13 6 71 3 20109 179 77 98.45 70

61 86 14 12 27 0 20105 173 86 95.15 84

62 80 14 12 79 3 21 93 179 80 98.45 75

63 82 14 12 79 3 22113 169 82 92.95 78

64 70 3 3 65 3 23120 175 70 96.25 60

65 65 11 12 61 2 21122 165 65 90.75 52

66 77 16 13 64 2 24109 175 77 96.25 70

67 78 12 7 67 3 23 95 186 78 102.3 71

68 100 9 10 57 2 20120 186 100 102.3 100

69 60 11 8 82 3 20105 162 60 89.1 45

70 80 16 10 84 4 21105 184 80 101.2 76

71 88 14 14 29 0 23109 160 88 88 88

72 82 18 21 82 3 21105 176 82 96.8 77

73 73 16 18 63 2 22 91 171 73 94.05 65

74 74 10 5 80 2 22109 176 74 96.8 67

75 77 9 2 55 1 23113 183 77 100.65 70

76 82 12 5 46 3 21121 171 82 94.05 78

77 88 16 18 76 4 23 97 187 88 102.85 87

78 81 12 14 92 2 21109 176 81 96.8 76

79 63 14 7 66 2 20 95 191 63 105.05 50

80 80 16 19 62 1 23109 163 80 89.65 75

81 59 7 2 42 4 20 95 186 59 102.3 44

82 81 7 8 82 4 20120 171 81 94.05 77

83 66 18 14 97 3 21105 186 66 102.3 53

84 75 4 3 79 2 22105 180 75 99 67

85 74 14 4 51 2 23109 176 74 96.8 65

86 89 16 17 47 4 21105 170 89 93.5 88

87 77 15 15 94 3 24 91 168 77 92.4 71

88 100 12 10 90 4 23109 179 100 98.45 100

89 86 24 25 100 4 20121 175 86 96.25 84

90 85 23 16 100 3 20 97 187 85 102.85 82

91 70 24 27 100 0 21109 177 70 97.35 59

50

Page 52: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

92 80 11 4 23 3 23 95 181 80 99.55 75

93 83 22 14 97 4 21105 175 83 96.25

8

0

94 99 20 13 100 4 22109 167 99 91.85 100

95 82 16 8 95 3 22105 184 82 101.2 79

96 100 23 18 98 4 23 91 174 100 95.7 8097 84 20 21 100 3 21 93 178 84 97.9 81

98 83 16 12 81 3 23112 184 83 101.2 79

99 87 23 13 100 4 21 93 177 87 97.35 86

100 64 23 8 61 2 20113 189 64 103.95 51

101 73 24 24 100 3 23120 166 73 91.3 64

102 71 21 12 91 3 20122 177 71 97.35 61

103 76 13 6 87 3 21 91 176 76 96.8 69

104 93 19 15 100 4 22109 173 93 95.15 95

105 74 16 9 79 3 23113 177 74 97.35 67

106 85 18 13 100 4 21121 178 85 97.9 82

107 76 18 25 100 3 24113 180 76 99 69

108 70 23 29 100 4 23121 172 70 94.6 59

109 58 22 25 100 3 20 97 168 58 92.4 43

110 67 20 10 84 3 20109 179 67 98.45 56

111 79 15 7 89 3 21 95 179 79 98.45 74

112 89 24 14 100 4 23120 182 89 100.1 89

113 87 11 5 75 3 21105 175 87 96.25 85

114 78 17 7 88 3 22109 163 78 89.65 72

115 77 17 9 94 4 22105 170 77 93.5 71

116 91 23 36 100 4 23 91 162 91 89.1 91117 93 19 13 100 3 21 93 168 93 92.4 95118 78 22 17 100 4 23 93 188 78 103.4 72119 76 20 17 79 2 21 95 188 76 103.4 69

120 74 23 18 79 3 20120 176 74 96.8 66

121 77 14 6 96 3 23105 188 77 103.4 71

122 95 17 8 100 4 20105 186 95 102.3 97

123 79 19 7 88 4 20109 169 79 92.95 74

124 73 15 11 87 3 21105 179 73 98.45 65

125 80 22 17 100 3 22 91 175 80 96.25 75126 59 18 19 100 4 23 93 178 59 97.9 44

51

Page 53: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

127 78 5 2 85 3 21122 186 78 102.3 72

128 86 22 19 75 3 24109 181 86 99.55 83

129 78 9 6 75 2 23 95 185 78 101.75 72

130 86 17 12 94 3 20120 180 86 99 85

131 74 21 8 89 3 20105 186 74 102.3 67

132 70 18 15 97 4 21105 173 70 95.15 59

133 87 16 16 85 3 23109 173 87 95.15 85

134 86 20 18 100 4 21113 188 86 103.4 84

135 90 11 3 72 3 22121 174 90 95.7 91

136 82 17 11 84 4 22 97 177 82 97.35 79

137 87 26 25 98 4 23114 178 87 97.9 85

138 81 15 13 95 3 21105 183 81 100.65 76

139 90 6 2 85 4 23105 170 90 93.5 89

140 79 16 11 71 3 21109 170 79 93.5 74

141 94 16 11 93 4 20105 168 94 92.4 95

142 88 26 33 94 4 23 91 181 88 99.55 87143 74 25 16 90 3 20 93 165 74 90.75 66

144 62 16 10 88 3 20109 180 62 99 48

145 90 20 16 96 4 21105 175 90 96.25 90

146 74 11 7 86 3 22120 176 74 96.8 66

147 88 18 3 87 3 23105 184 88 101.2 87

148 75 6 5 92 4 21105 178 75 97.9 67

149 78 7 0 59 2 24109 179 78 98.45 72

150 89 13 7 30 1 23105 158 89 86.9 88

151 86 2 3 25 0 20 91 158 86 86.9 84

152 69 3 1 76 3 20109 175 69 96.25 59

153 90 7 4 25 1 23105 171 90 94.05 90

154 68 3 2 90 4 21109 178 68 97.9 57

155 100 7 4 83 3 22105 189 100 103.95 97

156 79 21 12 25 0 22 91 164 79 90.2 73

157 68 7 5 25 1 23120 180 68 99 57

158 81 20 11 95 3 21109 171 81 94.05 77

52

Page 54: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

159 83 14 7 84 3 23113 176 83 96.8 80

160 98 22 7 86 4 21121 177 98 97.35 100

161 87 19 16 90 4 20 97 180 87 99 85

162 91 12 5 78 3 23109 168 91 92.4 91

163 93 20 13 93 3 20 95 176 93 96.8 94

164 87 7 6 81 3 20120 174 87 95.7 86

165 77 15 3 75 3 21105 171 77 94.05 70

166 63 16 13 95 4 22105 185 63 101.75 49

167 94 26 14 78 3 23109 172 94 94.6 96

168 61 7 7 92 4 21105 181 61 99.55 47

169 84 26 7 87 4 24 91 165 84 90.75 80170 61 26 12 90 3 23 93 178 61 97.9 47

171 79 23 4 93 4 20105 181 79 99.55 74

172 99 27 12 96 4 20109 177 99 97.35 100

173 81 28 27 100 4 21105 189 81 103.95 76

174 84 21 13 85 3 23 91 181 84 99.55 81175 77 29 18 97 4 21 93 177 77 97.35 71

176 82 28 0 78 3 22112 179 82 98.45 78

177 71 28 3 84 4 22120 190 71 104.5 61

178 83 29 10 87 3 23122 179 83 98.45 79

179 91 28 13 100 4 21109 175 91 96.25 91

180 71 21 3 80 3 23 95 160 71 88 62

181 77 27 4 82 3 21120 176 77 96.8 71

182 82 24 4 83 3 20105 178 82 97.9 77

183 59 26 6 93 4 23105 163 59 89.65 43

184 76 27 13 100 4 20109 166 76 91.3 69

185 69 27 10 98 3 20105 178 69 97.9 58

186 78 27 21 95 3 21 91 165 78 90.75 72187 78 23 6 81 3 22 93 172 78 94.6 72

188 65 28 2 79 3 23109 168 65 92.4 53

189 89 28 10 92 3 21105 176 89 96.8 88

190 90 20 4 85 3 24105 176 90 96.8 91

191 80 29 10 100 4 23109 176 80 96.8 75

192 58 27 4 95 4 20 10 175 58 96.25 41

53

Page 55: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

5193 61 27 2 70 2 20 91 182 61 100.1 46194 98 29 10 95 3 21 93 184 100 101.2 100195 89 27 13 100 4 20 93 176 89 96.8 88

196 81 27 3 80 4 21115 179 81 98.45 77

197 77 27 4 82 3 23109 165 77 90.75 71

198 78 23 4 83 4 21 95 159 78 87.45 71

199 95 28 6 93 3 22120 174 95 95.7 98

200 74 28 13 100 4 22105 171 74 94.05 66

201 55 20 10 98 3 23105 178 55 97.9 37

202 75 29 21 95 4 21109 183 75 100.65 68

203 70 27 6 81 3 23105 177 70 97.35 60

204 71 27 2 79 3 21 91 189 71 103.95 61

205 79 29 10 92 3 20109 176 79 96.8 73

206 74 28 4 85 4 23113 184 74 101.2 65

207 80 28 10 100 4 20121 193 80 106.15 76

208 81 20 4 95 3 20 97 179 81 98.45 77

209 85 27 10 70 3 21109 173 85 95.15 83

210 96 23 13 95 3 22 95 179 96 98.45 99

211 78 28 3 95 3 23105 169 78 92.95 72

212 73 28 4 81 3 21109 175 73 96.25 64

213 92 20 4 79 3 24105 165 92 90.75 93

214 84 29 6 92 4 23 91 175 84 96.25 81215 80 27 13 85 4 20 93 186 80 102.3 75

216 74 27 10 100 2 20112 186 74 102.3 66

217 74 29 21 95 3 21 91 162 74 89.1 67218 92 28 6 70 4 20 93 184 92 101.2 93219 89 28 2 95 2 20 93 160 89 88 89

220 73 20 10 95 3 21115 176 73 96.8 65

54

Page 56: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

55

Page 57: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

Unidad 4. Pruebas de Hipótesis con dos muestras y varias muestras de datos numéricos.

Competencia especifica de la unidad: Realizar aplicaciones de pruebas de hipótesis con dos o más poblaciones para inferir características de las mismas.

Subtemas;

4.1 Introducción.

4.2 Distribuciones: normal y t de Student.

4.3 Pruebas de significancia.

4.4 Comparación de dos muestras independientes: Pruebas t para las diferencias entre dos medias.

4.5 Prueba de Fisher para varianzas y de igualdad de las varianzas de dos poblaciones normales.

4.6 Comparaciones de dos muestras pareadas

4.7 Modelo totalmente aleatorio: análisis de varianza de un factor.

4.8 Selección del tamaño de muestra para estimar la diferencia de dos medias.

4.9 Aplicaciones.

Subtema 4.1 Introducción

En muchas situaciones de toma de decisiones, a veces se necesita determinar si los parámetros de dos poblaciones son iguales o diferentes. Por ejemplo el director de una empresa está interesado en saber si los salarios de las empleadas son menores que la de sus empleados varones. O bien determinar si la producción de artículos empleando un método es mejor que otro método. En estos casos y otros similares se emplean pruebas de hipótesis con dos muestras o varias muestras de datos numéricos.

Subtema 4.2 Distribuciones normal y t de Student.

Investiga ampliamente en diversas fuentes bibliográficas los siguientes temas: a) Distribución de muestreo para la diferencia entre dos parámetros.b) Pruebas para diferencia entre medias. Muestras grandes.c) Pruebas para diferencia entre medias. Muestras pequeñas.d) Distribución Normal y t de Student.

56

Page 58: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

Subtema 4.3 Pruebas de significancia.

Investiga ampliamente en diversas fuentes bibliográficas los siguientes temas: a) Pruebas de significancia.

Ejemplo: En un estudio de una tienda departamental diseñado para probar si el saldo promedio de las cuentas de 30 días es el mismo en sus dos sucursales suburbanas, muestras tomadas al azar arrojaron los siguientes resultados:

Tienda Tamaño de muestra

Media Desviación estándar

A 80 64.2 16

B 100 71.41 22.13

A un nivel de significación = 0.05, probar que los saldos medios reales observados en las dos tiendas son iguales.

1º Paso: Plantear la Hipótesis de Investigación: Los saldos a 30 días en las tiendas A y B son diferentes.

2º Paso: Plantear las Hipótesis Nula a Alterna;

Hi: 1 - 2 0 Ho: 1 - 2 = 0

3º Paso: delimitar las regiones de aceptación y rechazo.

4º Paso: Determinación del valor crítico: en este caso se emplea el puntaje Z bilateral el cual se busca en la tabla respectiva, dando un valor de Z + 1.96

5º Paso: Regla de decisión: si el estadístico de prueba está entre los valores críticos se acepta como verdadera la hipótesis nula en caso contrario se acepta como verdadera la hipótesis alterna.

6º Paso: cálculo del error estándar: Sx = √(S1

2

n1

+S2

2

n2

) = √( 162

80+ 22.132

100) = 2.845

7º Paso: cálculo del Estadístico de Prueba: Ep = ((x1 – x 2) – (1−2))

sx

Ep = ((64.2 – 71.41) - 0) / 2.845 = - 2.53

57

Page 59: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

8º Paso: Resultado: dado que el estadístico de prueba (-2.53) es menor que el valor crítico (-1.96) se acepta como verdadera la hipótesis alterna (Hi) y en consecuencia se rechaza la hipótesis nula.

9º Paso: Conclusión: Con base en lo anterior se concluye que: Los saldos a 30 días en las tiendas A y B son diferentes.

T61.- Dos encuestas independientes sobre salarios, realizadas en dos áreas metropolitanas muy distantes entre sí, revelaron la siguiente información, con respecto a los sueldos promedio de operadores de equipo pesado. ¿Se puede concluir que los sueldos son diferentes en las dos localidades? Sea α = 5 %

Área n x s

A 35 650 150

B 35 700 100

T62.- El gerente de la gran cadena de tiendas Sears, afirma que la cantidad media de ventas es mayor en su local ubicado en el centro de la ciudad, que el ubicado en la Gran Plaza, probar tal afirmación. Sea α = 1 %

Sears n x s

Centro 100 45 10

Gran Plaza 100 43.5 10

T63.- Un funcionario de Sectur, afirma que el índice de ocupación hotelera en temporada alta es igual al correspondiente de temporada baja, para probar lo anterior se toma en cada caso muestras aleatorias en esta ciudad, obteniendo los resultados. Sea α = 5 %

Temporada n x s

Alta 35 51.4 20.86

Baja 35 46.11 18.65

Subtema 4.4 Comparación de dos muestras independientes: Pruebas t para las diferencias entre dos medias.

Cuando n1, n2, son pequeños y se desconocen las varianzas de las poblaciones las fórmulas para calcular el error estándar de la diferencia de medias Sx cambia a las

siguientes: Sx = sp √ 1n1

+ 1n 2

donde sp2 = s1 (n 1−1¿¿2 )+

s2( n2−1¿¿2)

n 1+n 2−2¿¿ , una vez obtenido el error

58

Page 60: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

estándar, el cálculo del estadístico de prueba es el mismo, que en el caso anterior, o sea

Ep = ((x1 – x 2) – (1−2))

sx, por otra parte para obtener el puntaje t-student en la tabla

respectiva es necesario obtener los grados de libertad aplicando la siguiente fórmula: n1 + n2 - 2

Ejemplo: Las siguientes muestras aleatorias son las mediciones de la capacidad de producción de calor (en millones de calorías por tonelada) de tipos de carbón de dos minas, utiliza un nivel de significancia de 0.01, para probar si la diferencia entre las medias de las dos muestras es significativa.

Mina 1 8,260 8,130 8,350 8,070 8,340Mina 2 7,950 7,890 7,900 8,140 7,920 7,840

Hipótesis nula: µ1 - µ2 = 0 Hipótesis alterna: µ1 - µ2 ≠ 0, α = 0.01 gl = 5 + 6 – 2 = 9, puntaje obtenido en la tabla para una prueba de dos colas ± 3.250, criterio para rechazar la Hipótesis Nula: si Ep < - 3.250 o Ep > 3.250. Las medias y las varianzas de las dos muestras son:

sp2 = 13,066.66, Sp = 114.3, Sx = 69.21 Ep = 4.19¸ dado que estadístico

de prueba es mayor al valor crítico 3.250, se rechaza la hipótesis nula en consecuencia se acepta la hipótesis alterna y se concluye que la capacidad de producción de calor promedio del carbón de las dos minas es diferente.

T64.- Para probar la afirmación de que la estadía promedio de los turistas en la ciudad de Mérida es mayor en el mes de agosto que en junio, se tomaron muestras aleatorias en ambos meses de varios años. ¿Proporcionan estos datos evidencia suficiente como para aprobar la afirmación? Sea α= 5 %

Mes n x S

Junio 16 3.125 1.4

Agosto 16 3.68 0.94

59

Muestra x S2

n1 = 5 8,230 15,750n2 = 6 7,940 10,920

Page 61: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

T65.- Un promotor de eventos turísticos cree que la afluencia de personas al espectáculo de luz y sonido de la zona arqueológica de Uxmal en la versión en español es superior a los que asisten en la versión en inglés por más de 1000 personas. Para verificar lo anterior el promotor toma una muestra aleatoria de 12 meses, obteniendo los resultados siguientes. Sea α = 10 %

Versión n x S

Español 12 3482 2143

Inglés 12 1235 613

T66.- En muestras de fibras de nylon tomadas de dos máquinas de hilar se encontró que 8 de la primera máquina tenían una media en denier de 9.67 con una desviación estándar de 1.81, mientras que 10 de la segunda máquina tienen una media en denier de 7.43 con una desviación estándar de 1.48. Suponiendo que las poblaciones muestreadas son normales y tengan la misma varianza, prueba la hipótesis nula de que µ1 - µ2 = 1.5 contra la hipótesis alterna de que µ1 - µ2 > 1.5, con un nivel de significancia de 0.05

Subtema 4.5 Prueba de Fisher para varianzas y de igualdad de las varianzas de dos poblaciones normales.

Muchas veces tenemos la necesidad de disponer de métodos estadísticos para comparar las varianzas de dos poblaciones a partir del análisis de una sola población. Por ejemplo se desea comparar la precisión de un instrumento de medición con la de otro, o la estabilidad de un proceso de manufactura con la de otro a partir del análisis de sus varianzas. Podríamos comparar las varianzas de dos poblaciones, σ 1

2  y σ 22 utilizando la

razón de las varianzas muestrales s21/s2

2. Si s21/s2

2 es casi igual a 1, se tendrá poca evidencia para indicar que σ 1

2  y σ 22  no son iguales. Por otra parte, un valor muy grande

o muy pequeño para s21/s2

2, proporcionará evidencia de una diferencia en las varianzas de las poblaciones.

Supóngase que se tiene interés en dos poblaciones normales independientes, donde las medias y las varianzas de la población son desconocidas. Se desea probar la igualdad de las dos varianzas, ya que para poder comparar las medias de estas dos poblaciones se utiliza la distribución t de Student, vista anteriormente, en la cual podemos tener varianzas iguales o diferentes en la población.

Para conocer esto último se requiere de la distribución Fisher, y después de utilizarla, se tomará la decisión de tener o no varianzas iguales en la población, dando pié a realizar la comparación de las dos medias según estemos hablando. Primer caso en que las varianzas de la población son desconocidas pero iguales, o en el caso dos donde se tienen varianzas desconocidas pero diferentes.

60

Page 62: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

Para el ensayo de hipótesis se utilizará la relación de varianzas, la cual puede dar tres resultados:

En base a lo que se quiera probar, el ensayo podrá ser unilateral derecho, izquierdo o bilateral.

Ejemplo: La variabilidad en la cantidad de impurezas presentes en un lote de productos químicos, utilizada para un proceso en particular, depende del tiempo que tarda el proceso. Un fabricante que emplea dos líneas de producción 1 y 2, hizo un pequeño ajuste al proceso 2, con la esperanza de reducir la variabilidad, así como la cantidad media de impurezas en los productos químicos. Muestras de n1=25 y n2=20 mediciones de dos lotes produjeron las siguientes medias y varianzas:

¿Presentan los datos evidencia suficiente para indicar que las variaciones son menores para el proceso 2? Realice una prueba con un  α = 0.05.

Línea

n x S2

1 25 3.2 1.042 20 3.0 0.51

Ensayo de hipótesis:

Estadístico de prueba:

 La sugerencia que se hace es que el numerador sea el de mayor valor.

Entonces los grados de libertad para cada caso será ν = n – 1 o sea el tamaño de la

muestra de la población menos uno. ν1= 25-1 = 24 grados de libertad del numerador,

ν 2 = 20-1=19 grados de libertad del denominador. Buscando en la tabla de puntaje F

para α = 0.05, encontramos en la tabla el valor de F24, 19, 0.05 = 2.11

61

Page 63: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

Regla de decisión:

Si el estadístico de prueba Fc  2.11 No se rechaza Ho, Si la Fc > 2.11 se rechaza Ho.

Cálculo:

Decisión y Justificación: Como 2.04 es menor que 2.11 no se rechaza Ho, y se concluye con un α = 0.05 que no existe suficiente evidencia para decir que la varianza del proceso 2 es menor que la del proceso 1, en otras palabras las varianzas poblacionales son iguales o casi iguales.

T67.- En su incansable búsqueda de un sistema de llenado adecuado, cierta empresa prueba dos máquinas. Robo-fill se usa para llenar 16 frascos y da una desviación estándar de 1.9 onzas en el llenado. Con Automat-fill se llenan 21 frascos que dan una desviación estándar de 2.1 onzas. Si la empresa tiene que elegir uno de estos sistemas en función de la uniformidad de llenado. ¿Cual deberá seleccionar? Use un α = 0.01

T68.- Las capas de óxido en las obleas semiconductoras son depositadas en una mezcla de gases para alcanzar el espesor apropiado. La variabilidad del espesor es una característica crítica de la oblea, y lo deseable para los siguientes pasos de la fabricación es tener una variabilidad baja. Para ello se estudian dos mezclas diferentes de gases con la finalidad de determinar con cuál se obtienen mejores resultados en cuanto a la reducción en la variabilidad del espesor del óxido. 21 obleas son depositadas en cada gas. Las desviaciones estándar de cada muestra del espesor del óxido son s1 = 1.96 angstroms y s2 = 2.13 angstroms. ¿Existe evidencia que indique una diferencia en las desviaciones? Utilice α = 0.05.

T69.- Una muestra aleatoria de (n1) de 10 focos ahorradores dio una vida útil promedio de x1 = 4,000 horas con una desviación estándar s1 = 200, otra muestra de (n2) 8 focos

del mismo tipo pero de otra marca, dio una vida útil promedio de x2 = 4,300 horas con una desviación estándar s2 = 250, probar a un nivel de significancia de 1% que: No existe diferencia entre la vida útil de operación de las dos marcas de focos.

62

Page 64: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

Subtema 4.6 Comparaciones de dos muestras pareadas

En los subtemas anteriores: 4.4 Comparación de dos muestras independientes: Pruebas t para las diferencias entre dos medias. y 4.5 Prueba de Fisher para varianzas y de igualdad de las varianzas de dos poblaciones normales, las muestras fueron escogidas de manera independiente una de la otra. En otras situaciones tiene sentido tomar muestras que no sean independientes entre sí. El empleo de muestras dependientes o pareadas permite llevar a cabo un análisis más preciso, porque permite controlar factores externos. Tenemos muestras pareadas o correlacionadas cuando sabemos de antemano que una observación está relacionada con la otra. Pueden ser observaciones tomadas al mismo tiempo, o medidas tomadas en un mismo sujeto o unidad en dos oportunidades o tiempo distintos.

Ejemplo. El profesor de Estadística Inferencial I, cree que si los alumnos desarrollan trabajos de investigación obtendrán mejores resultados en sus calificaciones, para probar lo anterior escoge a 13 alumnos en forma aleatoria y les asigna trabajos de investigación, al final de la unidad presentan examen y selecciona en forma aleatoria a otros 13 que no hicieron trabajos de investigación y forma parejas, prueban los datos a continuación que los que realizaron trabajos de investigación obtienen mejores calificaciones que los demás? Sea a = 5 %

Con trabajos

de investigación

80 89 76

87 88 90

100 96 96

100 89 95

70

Sin trabajos de I.

78 80 70

100 75 60

70 95 96

80 70 70

72

1º Paso: Plantear la Hipótesis de Investigación: “Los alumnos que desarrollan trabajos de Investigación obtienen mejores calificaciones que los que no hacen trabajos de Investigación.”

2º Paso: Plantear las Hipótesis Nula a Alterna: Nula Ho: d < 0 Alterna Hi: d > 0

3º Paso: delimitar las regiones de aceptación y rechazo.

Ho Hi

63

Page 65: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

4º Paso: Determinación del valor crítico: en este caso se emplea el puntaje “t” unilateral con (n-1) grados de libertad, α= 5%, el cual se busca en la tabla respectiva, dando un valor de t = 1.782

5º Paso: Regla de decisión: si el estadístico de prueba es menor que el valor crítico se acepta como verdadera la hipótesis nula en caso contrario se acepta como verdadera la hipótesis alterna.

6º Paso: Se obtiene las diferencias en el mismo orden que se planteo la hipótesis de investigación, (calificación de alumnos que realizaron trabajos de investigación menos calificación de alumnos que no realizaron trabajos de investigación) luego se obtiene la media de las diferencias y la desviación estándar de las diferencias. Dando los siguientes resultados: xd= 10.7692; Sd = 13.3613, donde xd y Sd representan la media y la desviación estándar muestral de las diferencias.

7º Paso: cálculo del error estándar: Sx = sd

√n ; Sx = =

13.3613

√13 = 3.70577

8º Paso: cálculo del Estadístico de Prueba: Ep = (x−μ)

sx

Ep = (10.7692-0) / 3.70577

Ep = 2.90607

9º Paso: Resultado: dado que el estadístico de prueba (2.90607) es mayor que el valor crítico (1.782) se acepta como verdadera la hipótesis alterna (Hi) y en consecuencia se rechaza la hipótesis nula.

10º Paso: Conclusión: Con base en lo anterior se concluye que los alumnos que desarrollan trabajos de investigación en el área de estadística obtienen mejores resultados en sus calificaciones que aquellos que no realizaron trabajos de investigación.

En este tipo de pruebas se puede presentar los siguientes casos: unilateral derecha, unilateral izquierda, bilateral, el parámetro de comparación puede ser “cero” u otra cantidad, eso dependerá del planteamiento del problema.

T70.- Los siguientes datos representan las horas hombre que semanalmente se pierden en promedio por accidentes de trabajo en 10 empresas antes y después de que se implantara un programa de seguridad. Utiliza un nivel de significación de 5 % para verificar si el programa de seguridad es eficaz.

Antes 45 73 46 124 33 57 83 34 26 17

Después 36 60 44 119 35 51 77 29 24 11

T71.- Un promotor seleccionó al azar a 15 parejas (hombre y mujer) y les solicitó que completaran un cuestionario para medir el nivel de satisfacción con los servicios que presta un centro recreativo. La tabla adjunta muestra los resultados de una encuesta. Proporcionan estos datos una indicación de que los ¿hombres están más satisfechos con dichos servicios, que sus respectivas parejas? Sea α = 5 %

64

Page 66: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

hombres: 44 60 55 68 40 48 57 49 47 52 58 51 66 60 68

mujeres: 33 57 32 54 52 34 60 40 59 39 40 59 44 32 55

T72.- Un profesor de Estadística inferencial I desea comparar un nuevo método de enseñanza basado en métodos audiovisuales e investigación de campo en contraste con el método tradicional basado en exposición verbal. Forma 12 pares de estudiantes y asigna un elemento de cada par al grupo tradicional y otro al grupo del nuevo método. Al final del curso aplica exámenes similares ambos grupos, cuyos resultados se muestran en la tabla adjunta. Sirven estos datos para probar con un nivel de significación de 5 % que ¿ambos métodos son iguales?

Método

Nuevo: 94 91 68 88 75 66 94 88 96 88 95 87

Tradicional: 89 87 70 83 67 71 92 81 97 78 94 79

T73.- El gerente del departamento de producción de una empresa desarrolló un curso de capacitación para el personal de determinada área con el fin de que se incrementara la productividad en dicho sector, se puede concluir que como resultado de este curso , la productividad aumentó en promedio de dos unidades por persona ? Sea α= 5 %

Antes: 15 30 49 47 50 52 74 62 49 70 72

Después: 20 38 47 52 56 60 72 79 50 75 79

T74.- La directora de relaciones públicas del Hotel Americano, desea verificar la eficacia de un nuevo método de promoción basado en videos, en contraste con la forma tradicional de proporcionar pósters y folletos. Hasta el año pasado se utilizó el método tradicional, por lo que tomó una muestra de 10 semanas de la temporada alta. A partir del presente año se aplica el nuevo método de promoción, por lo que se toma una muestra de 10 semanas de temporada alta. Estos datos se muestran en la tabla adjunta. Verificar que el nuevo método es mejor que el tradicional. Sea α= 5 %

Método

Nuevo 120 95 135 89 93 98 100 94 102 115

Tradicional 99 88 97 71 91 79 87 73 96 97

Subtema 4.7 Modelo totalmente aleatorio: análisis de varianza de un factor.

El análisis de la varianza permite contrastar la hipótesis nula de que las medias de K poblaciones (K >2) son iguales, frente a la hipótesis alternativa de que por lo menos una

65

Page 67: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

de las poblaciones difiere de las demás en cuanto a su valor esperado. Este contraste es fundamental en el análisis de resultados experimentales, en los que interesa comparar los resultados de K 'tratamientos' o 'factores' con respecto a la variable dependiente o de interés.

Ho: µ1 = µ2 =. . . µk Hi: Ho: µ1 ≠ µ2 ≠. . . µk, por lo menos una es diferente.

El Anova requiere el cumplimiento los siguientes supuestos:

Las poblaciones (distribuciones de probabilidad de la variable dependiente correspondiente a cada factor) son normales.

Las K muestras sobre las que se aplican los tratamientos son independientes. Las poblaciones tienen todas igual varianza (homoscedasticidad).

Ejemplo: El profesor de Estadística Inferencial I, imparte clase a tres grupos los cuales se muestran a continuación verificar si los tres grupos son iguales en cuanto a aprovechamiento. Sea a = 5 %

Observación 4G1 4G2 4G3

1 85 71 59

2 75 75 64

3 82 73 62

4 76 74 69

5 71 69 75

6 85 82 67

x 79 74 66

s 5.83 4.47 5.66

s2 34 20 32

Hipótesis de Investigación: Los tres grupos son diferentes en cuanto al aprovechamiento

Ho: 1 = 2 = 3 Hi: 1 2 3 Por lo menos uno es diferente

Calculo de la media de medias:

mdm = (x1+ x2 + x3 + x4 + xk)/k mdm = (79 + 74 + 66)/3 = 73

ni: tamaño de muestra de cada grupo. nt : suma de los tamaños de muestra

Calculo de la varianza sb2 =

∑ [nt ( x i−mdm )2 ]k−1

66

Page 68: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

sb2 =

[6 (79−73 )2+6 (74−73 )2+6 (66−73 )2 ]3−1

= 258

Calculo de la varianza sw2 =

∑ [ (n t−1 ) si2 ]

(n t−k ) =

(5∗34+5∗20+5∗32 )18−3

= 28.66

Calculo del estadístico de prueba: Ep = sb

2

sw2 Ep = 258 / 28.66 = 9

Calculo del puntaje o valor critico: en este caso se emplea el puntaje “F” con (k-1) grados de libertad en el numerador y (nt – k) grados de libertad en el denominador.

gln = (k-1) = (3-1) = 2

gld = (18 – 3) = 15 α= 5 %

Buscando en la tabla respectiva encontramos el siguiente valor de F0.05 = 3.68

F0.05 = 3.68 EP = 9

Resultado y conclusión: Dado que el estadístico de prueba (9) es mayor que el valor crítico (3.68) se acepta como verdadera la Hipótesis alterna. En conclusión se puede decir que el aprovechamiento en los tres grupos es diferente. Siendo el grupo 4G1 el más alto con media de 79, 4G2 intermedio con media de 74 y 4G3 el más bajo con media de 66.

En el caso de que las muestras sean de tamaño diferentes, lo único que cambia es la media de medias y todas las demás fórmulas quedan igual.

Por ejemplo, supongamos que tenemos tres grupos.

Grupo n media

A 6 58 B 5 57 C 4 59

mdm =

∑ ( xi∗ni )nt mdm = (58*6 + 57*5 + 59*4)/15 = 57.93

T75.- Considera los datos siguientes sobre crecimiento de plantas después de la aplicación de diferentes tipos de hormonas de crecimiento. Plantea una hipótesis de investigación y pruébala Sea α = 0.05

67

Page 69: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

HormonaCrecimiento de las

plantas

A1 13 17 7 14

B2 21 13 20 17

C3 18 15 20 17

D4 7 11 18 10

E5 6 11 15 8

T76.- En un estudio de las propiedades de las vigas metálicas ensambladas con placas, empleadas para soporte de techos, produjo las siguientes observaciones sobre el índice de rigidez axial (kilo libras/ pulgada), para longitudes de placa de 4, 6, 8, 10, 12 pulgadas. ¿Tiene algún efecto la variación de la longitud de placa sobre el promedio de rigidez axial? Sea α = 0.01

Long. Placa índice de rigidez

Cuatro 309.2 409.5 311 326.5 316.8 349.8 309.7

Seis 402.1 347.2 361 404.5 331 348.9 381.7

Ocho 392.4 362.2 351 357.1 409.9 367.3 382

Diez 346.7 452.9 461.4 433.1 410.6 384.2 362.6

Doce 407.4 441.8 419.9 410.7 473.4 441.2 465.8

T77.- A continuación se presentan los datos de un experimento en el que varios tipos diferentes de cajas se compararon con respecto a la resistencia a la compresión. ¿La resistencia a la compresión depende del tipo de caja? Sea α = 0.05

Tipo caja Resistencia a la compresión

1655.

5 788.3 734.3 721.4 679.1 699.4

2789.

2 772.5 786.9 686.1 732.1 774.8

3737.

1 639 696.3 671.7 717.2 772.1

4535.

1 628.7 542.4 559 586.9 520

68

Page 70: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

T78.- Los siguientes datos resultaron de un experimento que compara los grados de manchas de tejido co polimerizado con tres mezclas diferentes de acido metacrilico ¿Influye de alguna manera los tipos de mezcla en el grado de manchas? Sea α = 0.01

Mezcla Grados de mancha de tejido

1 0.56 1.12 0.9 1.07 0.94

2 0.72 0.69 0.87 0.78 0.91

3 0.62 1.08 1.07 0.99 0.93

T79.- Se analizaron seis muestras de cada uno de los cuatro tipos de cereales producidos en cierta región para determinar el contenido de tiamina, resultando los siguientes datos. ¿Sugiere esta información que por lo menos dos de tipos de granos difieren con respecto al verdadero promedio de contenido de tiamina?. Sea α = 0.05

Contenido de tiamina.

Trigo 5.2 4.5 6 6.7 5.8 6.1

Cebada 6.5 8 6.1 5.9 5.6 7.5

Maíz 5.8 4.7 6.4 6 5.2 4.9

Avena 8.3 6.1 7.8 5.5 7.2 7

T80.- Un biólogo desea estudiar los efectos del etanol en el tiempo del sueño, se selecciona una muestra de 20 ratas igualadas por edad y otras características, y a cada una se administró una inyección oral con una concentración diferente de etanol. El rápido movimiento ocular (REM) en el tiempo del sueño de cada rata se registró durante un periodo de 24 horas. ¿Indican los datos que el verdadero promedio REM en tiempo de sueño depende de la concentración de etanol? Sea α = 0.05

T81.- La frecuencia crítica de centelleo (cff) es la máxima frecuencia en ciclos/seg. A la que una persona puede detectar el centelleo de una fuente luminosa intermitente. Una

69

concentración REM

de etanol

0 (Control) 88.6 73.2 91.4 68 75.2

1 g 63 53.9 69.2 50.1 71.5

2 g 44.9 59.5 40.2 56.3 38.7

4 g 31 39.6 45.3 25.2 22.7

Page 71: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

investigación realizada para ver si el verdadero promedio de la cff, depende del color del iris dio los siguientes resultados Sea α = 0.05

color del iris frecuencia critica de centelleo

Café 26.8 27.9 23.7 25 26.3 24.8 25.7 24.5

Verde 26.4 24.2 28 26.9 29.1

Azul 25.7 27.2 29.9 28.5 29.4 28.3

Subtema 4.8 Selección del tamaño de muestra para estimar la diferencia de dos medias.

Si se recuerda a la distribución muestral de diferencia de medias se tiene que el margen

de error esta dado por: e = z√( σ 12

n1

+σ2

2

n2)

En esta ecuación se nos pueden presentar dos casos:

Los tamaños de muestra son iguales. Los tamaños de muestra son diferentes.

Para el primer caso no se tiene ningún problema, se eleva al cuadrado la ecuación y se despeja n ya que n1 es igual a n2.

n = z2 (σ1

2+σ22 )

e2

Para el segundo caso se pondrá una n en función de la otra. Este caso se utiliza cuando las poblaciones son de diferente tamaño y se sabe que una población es K veces mayor que la otra. N1 = KN2

70

Page 72: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

n2 = z2 (σ1

2+k σ22 )

k e2

Ejemplo: Un director de personal quiere comparar la efectividad de dos métodos de entrenamiento para trabajadores industriales a fin de efectuar cierta operación de montaje. Se divide un número de operarios en dos grupos iguales: el primero recibe el método de entrenamiento 1, y el segundo, el método 2. Cada uno realizará la operación de montaje y se registrará el tiempo de trabajo. Se espera que las mediciones para ambos grupos tengan una desviación estándar aproximadamente de 2 minutos. Si se desea que la estimación de la diferencia en tiempo medio de montaje sea correcta hasta por un minuto, con una probabilidad igual a 0.95, ¿cuántos trabajadores se tienen que incluir en cada grupo de entrenamiento?

n = z2 (σ1

2+σ22 )

e2 =

(1.962 ) (22+22 )12 = 30.73 ≈ 31

Cada grupo debe contener aproximadamente 31 empleados.

T82.- Los analistas quieren probar un nuevo fármaco antidiabético y consideran que sería clínicamente eficaz si lograse un descenso de 14 mg/dl respecto al tratamiento habitual con el antidiabético estándar. Por estudios previos se sabe que la desviación estándar de la glucemia en pacientes que reciben el tratamiento habitual es de 16 mg/dl. Se espera que con el nuevo tratamiento la desviación estándar sea por lo menos igual para detectar diferencias si es que existen, con un nivel de confiabilidad de 99%

T83.- Con los mismos datos del ejemplo pero considerando que el tamaño de la población del grupo 1 de trabajadores es de 300 en tanto que la población del grupo 2 es de 100.

T84.- Con los mismos datos del ejercicio T82 pero considerando que el tamaño de la población del grupo de pacientes que recibe el tratamiento habitual es de 500, en tanto que la población del otro grupo, a quienes se le va a aplicar el nuevo fármaco es de 200.

Subtema 4.9 Aplicaciones. Son las tareas distribuidas a lo largo de cada subtema.

71

Page 73: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 4

72

Page 74: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 5

Unidad 5. Pruebas de hipótesis con dos muestras y varias muestras con datos categóricos

Competencia especifica de la unidad: Realizar aplicaciones de pruebas de hipótesis con varias poblaciones empleando datos categóricos que permitan inferir el comportamiento de sus parámetros.

Subtemas:

5.1 Prueba Z para la diferencia entre dos proporciones.

5.2 Prueba para la diferencia entre dos proporciones.

5.3 Prueba para la diferencia en n proporciones Z.

5.4 Prueba de independencia (ji-cuadrada).

5.5 Pruebas de contingencia (ji-cuadrada).

5.6 Pruebas de bondad de ajuste.

5.7 Aplicaciones.

Subtema 5.1 Prueba Z para la diferencia entre dos proporciones.

Esta prueba se aplica en diseños de investigación en los que se estudia a dos grupos de individuos a quienes se ha medido una variable cualitativa, también llamada categórica, La variable tiene una escala compuesta de modalidades y se dispone de información sobre la frecuencia de individuos en cada modalidad, tanto para un grupo como para el otro. La variable cualitativa medida en ambos grupos se puede resumir en forma de proporciones. Por lo anterior, se dispone de dos proporciones que pueden ser comparadas para averiguar si existe una diferencia estadísticamente significativa entre ellas.

En la prueba se plantean las siguientes hipótesis estadísticas:

Hipótesis estadística nula: Ho: P1 = P2

Hipótesis estadística alterna: Hi: P1 ≠ P2

Donde:

P1: proporción de interés calculada en el primer grupo. Calculada dividiendo f 1 / n 1

P2: proporción de interés calculada en el segundo grupo, calculada dividiendo f 2 / n 2

El procedimiento de la prueba incluye la determinación de un valor llamado z calculado. El rechazo de Ho ocurre cuando el valor z calculado con los datos resulta mayor o

73

Page 75: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 5

menor que el valor crítico de dicha medida que está contenido en la tabla de áreas bajo la curva normal.

En el caso de que se haya podido rechazar la Hi se dice que existe una diferencia estadísticamente significativa entre ambas proporciones.

Ejemplo: Un odontólogo deseaba saber si la deserción del hábito de lavado dental era diferente en niños que usaban pasta dental con diferentes sabores. Durante tres meses proporcionó dotaciones de pasta dental sabor cereza a un grupo de 16 niños y de sabor menta a otro grupo de 15 niños. El interés del odontólogo era verificar si existía una diferencia estadísticamente significativa entre la proporción de desertores en uno y otro grupo. Sea α = 5%

Niños según sabor de la pasta dental usada y deserción del hábito de lavado.

Pasta de dientes n desertaron no desertaron P q

Sabor cereza 16 6 10 0.375 0.625

Sabor menta 15 10 5 0.666 0.333

Hipótesis de investigación: existe una diferencia estadísticamente significativa entre las proporciones de desertores en ambos grupos

Hipótesis estadística nula: Ho: P1 = P2

Hipótesis estadística alterna: Hi: P1 ≠ P2

Antes de realizar la prueba es un requisito indispensable verificar que se cumplan las siguientes cuatro condiciones: n1p1 ≥ 5, n1q1 ≥ 5, n2p2 ≥ 5, n2q2 ≥ 5

Al efectuar sus cálculos encontró lo siguiente:

(16)(0.375) = 6; (16)(0.625) = 10; (15)(0.667) = 10; (15)(0.333) = 5

En vista de que se cumplían las condiciones procede a efectuar el siguiente cálculo:

Ep=

p1−p2

√ p̂ q̂ ( 1n1

+ 1n2 )

donde p̂ = f 1+f 2

n1+n2 y q̂= 1 - p̂

74

Page 76: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 5

p̂ = 6+10

16+15 = 0.5161; q̂ = 1 – 0.5162 = 0.4838, por lo tanto el estadístico de prueba

queda: Ep =

0.375−0.666

√( 0.5161 ) (0.4838 )( 116

+ 115 ) = - 1.62, el puntaje Z obtenido en la tabla

correspondiente, al nivel de significancia de 5% es = ± 1.96

Estadístico de prueba – 1.62; dado que el estadístico de prueba está dentro del intervalo ± 1.96, o sea dentro del área de aceptación de la hipótesis nula, se concluye que no existe una diferencia estadísticamente significativa entre las proporciones de desertores en ambos grupos.

T85.- El profesor de Estadística Inferencial imparte este curso a dos grupos, él supone que ambos grupos son similares en cuanto al índice de aprobación, para verificar lo anterior toma muestras aleatorias de las calificaciones aprobatorias de ambos grupos, las cuales se presentan a continuación, ¿sirven estos datos para apoyar el supuesto del profesor? Sea α = 1 %

Grupo Muestra Aprobados

4G1 180 120

4G2 220 150

T86.- Una empresa que se especializa en venta por catalogo ideo un nuevo formato que en su concepto va a generar más ventas que el formato del catalogo anterior, el nuevo catalogo se envía a una muestra de 200 posibles compradores siendo el numero de pedidos efectuados de 120. Hace unos meses cuando se utilizó el formato anterior se hicieron 115 pedidos de 250 catálogos que se enviaron. ¿Es mejor el nuevo formato que el anterior? sea α = 5 %

T87.- El administrador encargado del departamento de turismo afirma que la proporción de vuelos tipo charter provenientes de Europa ha disminuido. Para verificar lo anterior toma al azar una muestra de 120 vuelos charter del año pasado y nota que 35 provienen

75

Page 77: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 5

de Europa. Así mismo toma una muestra de 100 vuelos charter del presente año y observa que 23 provienen de Europa, ¿prueban estos datos la afirmación del administrador? Sea α = 5 %

T88.- Un funcionario del Departamento de Turismo afirma que la proporción de turistas norteamericanos que gestionan su viaje a Yucatán por medio de la agencia de viajes “Turyuc” es mayor que la proporción de turistas norteamericanos que gestionan su viaje por medio de la agencia “Merimex”, los datos muestrales se indican en la tabla adjunta. Probar la afirmación del funcionario con un α = 5 %

Agencia de Viajes.

Procedencia Turyuc Merimex.

Norteamericana 130 100

Otros. 20 80

T89.- Una muestra aleatoria de 32 amas de casa, indica que 22 prefieren la marca de pasta de dientes Colgate y 10 prefieren la marca Crest, ¿reflejan estos datos una verdadera preferencia por la marca Colgate? Sea α = 2 %

T90.- Un especialista en política de una universidad cree que la proporción de electores del distrito 1 excede en 5 % a la proporción de electores del distrito 2. Con el fin de ver si los hechos corroboran esta hipótesis, el profesor hace una encuesta entre los electores de ambos distritos, con los siguientes resultados: Sea α = 5 %

Distrito muestra electores

I 150 113

II 160 104

Subtema 5.2 Prueba para la diferencia entre dos proporciones.

Utilizando la prueba ji-cuadrada.

Ejemplo: Determinar si hay alguna diferencia entre las pantas de procesamiento A y B, en la proporción de cajas de cereal que necesitan ser reprocesadas, de cada planta se seleccionaron muestras de 200 cajas con los siguientes resultados. Estas se conocen como frecuencias observadas.

76

Page 78: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 5

Reprocesamiento Planta A Planta B Totales

Si necesitan 19 21 40

No necesitan 181 179 360

Totales 200 200 400

El método consiste en plantear la hipótesis nula de que la proporción de éxitos es la misma en las dos poblaciones. (p1 = p2). Si esta hipótesis nula es cierta se podría calcular las frecuencias que teóricamente se encontraría en cada celda. Por ejemplo de acuerdo con la hipótesis nula se puede determinar cuántas cajas defectuosas que necesitan reproceso se pueden esperar. Se puede observar que de un total de 40 de las 400 en las muestras combinadas, 10% necesitan reprocesamiento. Esto significa una frecuencia teórica de 0.10 x 200 = 20 para la planta A y 0.10 x 200 = 20 para la planta B. el número de cajas que teóricamente no necesitan reproceso se obtiene restando el número teórico que necesita reproceso del tamaño demuestra de cada planta. A continuación se muestran las frecuencias teóricas.

20 20

180 180

Las frecuencias teóricas ft para cada celda se puede calcular mediante la siguiente

fórmula: ft = nR nC

nt donde nR es el número total en el renglón (40), nC es el número

total en la columna (200) y nt es el tamaño total de la muestra en este caso sería 400.

ft = 40(200)

400 = 20, ft =

360(200)400

= 180, el método de análisis mediante ji-

cuadrado usa la diferencia entre la frecuencia observada y la frecuencia teórica elevada al cuadrado, esta diferencia al cuadrado entre la frecuencia teórica, y el estadístico de

prueba se obtiene mediante la siguiente fórmula: x (r−1 )(c−1)2 = ∑ ( fo− ft )2

ft (sumatoria de

todas las celdas), donde fo es la frecuencia observada de cada celda, ft es la frecuencia teórica de cada celda, R es el número de renglones en la tabla de contingencia, C es el número de columnas en la tabla de contingencia. Este estadístico sigue una distribución ji-cuadrada aproximadamente con grados de libertad: gl = (R – 1)(C – 1),

Fo ft (fo – ft) (fo – ft)2

∑ ( fo−ft )2

ft

19 20 -1 1 0.05

77

Page 79: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 5

21 20 1 1 0.05

181 180 1 1 0.0055

179 180 -1 1 0.0055

Ep = 0.1111

Para un nivel de significancia de 10% y (2-1)(2-1) = 1 grado de libertad, se encuentra en la tabla respectiva el puntaje ji-cuadrado = 2.706,

Ep = 0.1111 2.706

Dado que el estadístico de prueba es menor que el valor crítico 2.706 se acepta como verdadera la hipótesis nula, por lo que se concluye que no existe evidencia de una diferencia entre las plantas A y B en la proporción de cajas de cereal que necesitan reprocesamiento.

Para los siguientes ejercicios resolver los problemas aplicando la prueba ji-cuadrada.

T91.- Considerar los datos del ejercicio T85

T92.- Considerar los datos del ejercicio T86

T93.- Considerar los datos del ejercicio T87

T94.- Considerar los datos del ejercicio T88

T95.- Considerar los datos del ejercicio T89

Subtema 5.3 Prueba para la diferencia en n proporciones Z.

El método de prueba de ji-cuadrada para la diferencia de dos proporciones se puede aplicar al caso ampliado en el que existen N poblaciones independientes a compara. Siendo las hipótesis nula y alterna de la siguiente manera:

Ho: p1 = p2 = p3 =. . . . pn

78

Page 80: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 5

Hi: por lo menos una proporción es diferente a las otras.

La tabla de contingencias tendría dos renglones y C columnas, por lo tanto habrían C – 1 grados de libertad para la prueba ji-cuadrada.

Ejemplo: En una encuesta de bienes raíces, una de las preguntas era para saber si había diferencia en las proporciones de casa con alberca con base a su ubicación geográfica en la ciudad de Mérida, se desea probar la hipótesis de que las casa con alberca tienen relación con su ubicación geográfica, Sea α = 1 %

Ubicación geográfica

con Alberca Brisas C. México Country Totales

No 61 45 48 154

Si 13 15 51 79

totales 74 60 99 233

Ho: pB = pcmex = pcountry Hi: pB ≠ pcmex ≠ pcountry

Las frecuencias teóricas ft para cada celda se puede calcular mediante la siguiente

fórmula: ft = nR nC

nt , de la misma manera que en el caso de la diferencia de dos

proporciones visto en el subtema anterior. El método de análisis mediante ji-cuadrado usa la diferencia entre la frecuencia observada y la frecuencia teórica elevada al cuadrado, esta diferencia al cuadrado entre la frecuencia teórica, y el estadístico de

prueba se obtiene mediante la siguiente fórmula: x(c−1)2 = ∑ ( fo− ft )2

ft (sumatoria de

todas las celdas), donde fo es la frecuencia observada de cada celda, ft es la frecuencia teórica de cada celda, R es el número de renglones en la tabla de contingencia, C es el número de columnas en la tabla de contingencia. Este estadístico sigue una distribución ji-cuadrada aproximadamente con grados de libertad: gl = (C – 1).

Fo ft (fo – ft) (fo – ft)2

∑ ( fo−ft )2

ft

61 48.91 12.09 146.18 2.9885

45 39.66 5.34 28.51 0.7190

48 65.43 -17.43 303.8 4.64

79

Page 81: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 5

13 25.09 -12.09 146.16 5.82

15 20.34 -5.34 28.51 1.40

51 33.57 17.43 303.8 9.05

24.6175

Para un nivel de significancia de 1 % y (2-1) = 1 grado de libertad, se encuentra en la tabla respectiva el puntaje ji-cuadrado = 9.21

9.21 Ep =24.6175

Dado que el estadístico de prueba es mayor que el valor crítico 9.21 se acepta como verdadera la hipótesis alterna, por lo que se concluye que si hay relación entre la existencia de alberca en la casa y su ubicación geográfica en la ciudad de Mérida.

La proporción de casas con alberca según su ubicación es la siguiente.

Brisas: 17.56% Col. México: 25% Country: 51.5 %

T96.- La cervecería Modelo S. A. fabrica y distribuye tres tipos de cerveza: ligera, clara y obscura. En un análisis de segmentación de mercado para las tres cervezas, el grupo de investigación encargado ha planteado la posibilidad de si la preferencia es independiente del género del consumidor. Sea α = 5 %

Cerveza preferida.

Género Ligera Clara Oscura Total

Hombre

20 40 20 80

Mujer 30 30 10 70

Total 50 70 30 150

80

Page 82: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 5

T97.- El departamento de mercadotecnia de una compañía refresquera, quiere determinar si el sabor de una nueva bebida que piensa lanzar al mercado, influirá en las ventas. A 50 clientes se les da a probar bebidas de cada uno de los nuevos sabores y se les pide su opinión, verificar si existe alguna preferencia por el sabor, Sea α = 5 %

s a b o r e s

Uva Fresa Manzana

Gustó 20 26 41

No gustó 30 24 09

T98.- Los puestos iníciales de los egresados en administración e ingeniería se clasifican por industria, probar si hay independencia entre el tipo de carrera y el tipo de empresa donde laboran. Sea a = 1 %

T i p o d e e m p r e s a

Tipo de carrera Petróleo Química. Eléctrica. Computación

Administración 30 15 15 40

Ingeniería 30 30 20 20

Subtema 5.4 Prueba de independencia (ji-cuadrada).

La prueba ji-cuadrada se puede usar para determinar diferencias entre la proporción de éxitos en cualquier número de poblaciones. Para una tabla de contingencias que tiene R renglones y C columnas, la prueba ji-cuadrada se puede generalizar como una prueba de independencia.

Ejemplo: La tabla adjunta muestra la cantidad de turistas que rentaron automóviles en una agencia respectiva, según su procedencia y marca de vehículo preferido. Verifica si existe alguna relación entre la procedencia de los turistas y la marca de vehículo rentado. Sea α = 1 %

81

Page 83: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 5

marca procedencia de los turistas

México USA Europa Japón total

Honda 20 80 30 10 140

Wolkwagen 130 60 20 10 220

Toyota 70 60 90 60 280

total 220 200 140 80 640

Calculo de la frecuencia teórica de cada celda de la manera acostumbrada:

Fo ft (fo – ft) (fo – ft)2

20 48.125 -28.125 791.01563 16.4366883

80 43.75 36.25 1314.0625 30.0357143

30 30.625 -0.625 0.390625 0.0127551

10 17.5 -7.5 56.25 3.21428571

130 76.625 53.375 2848.8906 37.1796493

60 68.75 -8.75 76.5625 1.11363636

20 48.125 -28.125 791.01563 16.4366883

10 27.5 -17.5 306.25 11.1363636

70 96.25 -26.25 689.0625 7.15909091

60 87.5 -27.5 756.25 8.64285714

90 61.25 28.75 826.5625 13.494898

60 35 25 625 17.8571429

 Estadístico de prueba 162.71977

Hi: por lo menos una proporción es diferente. Si hay relación, son dependientes.

Ho: las proporciones son iguales, no hay relación, son independientes.

Grados de libertad: (R – 1)(C – 1) = (3 – 1)(4 – 1) = 6 y α = 0.01, en la tabla respectiva de ji-cuadrada encontramos el valor de 16.812.

Dado que el estadístico de prueba es 162.71777 se rechaza la hipótesis nula y se acepta en consecuencia la hipótesis alterna, lo cual indica que si hay relación entre la procedencia de los turistas y la marca del vehículo rentado. Siendo las preferencias de la siguiente manera:

82

Page 84: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 5

Para los turistas de México la frecuencia observada más alta es de 130 con relación a la marca de vehículo Wolkswagen; para los norteamericanos la preferencia es por la marca Honda; para los turistas europeos y japoneses la marca preferida es Toyota.

16.812 162.71977

T99.- Los resultados de una encuesta hecha para determinar si la edad de los turistas tiene alguna relación con su estadía en noches en la ciudad de Mérida, se muestra en la tabla adjunta. ¿Será la estadía independiente de la edad? Sea α = 5 %

Edad de los turistas en años

Estadía 21 a 30 31 a 40 41 a 50 51 o más

1 noche 748 821 786 720

2 noches 174 160 151 166

3 noches 31 25 22 16

4 noches o mas 9 10 6 5

T100.- Los resultados de una encuesta realizada para determinar si la procedencia de los turistas tiene alguna relación con su estadía en noches en la ciudad de Mérida, se muestra en la tabla adjunta. ¿Será la estadía independiente del lugar de origen de los turistas? Sea α = 1 %

Procedencia de los turistas

Estadía en noches México USA Europa Japón

1 150 40 20 6

2 40 100 60 30

3 10 20 20 20

4 o mas 5 30 50 10

83

Page 85: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 5

Subtema 5.5 Pruebas de contingencia (ji-cuadrada).

La prueba ji-cuadrado de contingencia sirve para comprobar la independencia de frecuencias entre dos variables aleatorias, X e Y.

Las hipótesis contrastadas en la prueba son:

Hipótesis nula: X e Y son independientes.

Hipótesis alternativa: X e Y no son independientes (No importa cuál sea la relación que mantengan ni el grado de esta.

Ejemplo: Vamos a presentar un ejemplo de dos caracteres binarios, que tienen que ver con enfermos, para los cuales se ha observado si tienen o no una tendencia al suicidio (carácter X). Las enfermedades han sido clasificadas como ''psicosis'' y ''neurosis'' (carácter Y). Se quiere saber si existe una dependencia entre las tendencias al suicidio y la clasificación de los enfermos. Probar lo anterior con un nivel de significancia de 5%. Supongamos que la tabla de contingencias observada es:

Frecuencias observadas.

Tendencia Sin tendencia Total

Psicosis 20 180 200

Neurosis 60 140 200

Total 80 320 400

Debemos obtener las frecuencias teóricas del modo ya visto con anterioridad. Por lo que estas frecuencias teóricas serían:

Tendencia Sin tendencia Total

Psicosis 40 160 200

Neurosis 40 160 200

Total 80 320 400

84

Page 86: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 5

Calculo del estadístico de prueba

Fo Ft (fo – ft) (fo – ft)2

∑ ( fo− ft )2

ft

20 40 - 20 400 10

60 40 20 400 10

180 160 20 400 2.5

140 160 - 20 400 2.5

estadístico de prueba 25

Hipótesis nula: la variable tendencia al suicidio y la clasificación de los enfermos son independientes.

Hipótesis alternativa: la variable tendencia al suicidio y la clasificación de los enfermos no son independientes.

Para obtener los grados de libertad (r – 1) (c – 1) = (2 – 1) (2 – 1) = 1, consultando en la tabla respectiva de puntajes de x2, un grado de libertad y 5% de novel de significancia obtenemos x2 = 7.88.

Rechazamos la hipótesis nula y concluimos que hay una dependencia entre la tendencia al suicidio y la clasificación de las enfermedades.

El test no precisa el sentido de esta dependencia. Para describirla hay que comparar las proporciones de los suicidas entre los neuróticos (60/200) y entre los sicóticos (20/200).

T101.- Para estudiar la dependencia entre la práctica de algún deporte y la depresión, se seleccionó una muestra aleatoria de 100 jóvenes con los siguientes resultados:

Sin depresión Con depresión

Deportista 38 9

No deportista 31 22

Nivel de significancia 5 %

85

Page 87: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 5

T102.- Un estudio que se realizó con 81 personas referente a la relación entre la cantidad de violencia vista en la televisión y la edad del televidente produjo los siguientes resultados.

Edades de los televidentes

16 a 34 34 a 55 55 o mas

Poca violencia 8 12 21

Mucha violencia 18 15 7

¿Indican los datos que ver violencia en la televisión depende de la edad del televidente, a un nivel de significación del 5%?

Subtema 5.6 Pruebas de bondad de ajuste.

La prueba de bondad de ajuste es un modelo estadístico que describe lo bien que se ajusta un conjunto de observaciones, en el cual se compara una distribución de frecuencias observadas con la distribución que podríamos esperar en el modelo de estudio. Tales medidas se pueden emplear en el contraste de hipótesis, y comprobar si las frecuencias siguen una distribución específica.

Ejemplo: En un análisis de mercado que elaboró Tecno Marketing (TM), para investigar las participaciones en el mercado de tres compañías (A, B, C). La compañía C introdujo innovación en su producto que reemplazará su participación actual en el mercado. El gerente de la compañía C pidió a TM determinar si el nuevo producto causará alguna alteración en las participaciones de los tres competidores en el mercado. Las participaciones antes de la innovación de C eran: A: 30%; B: 50%; C: 20%. Para determinar la petición del gerente de C, TM lleva a cabo una encuesta entre 200 clientes, a cada persona se le pidió especificar su preferencia de compra entre las tres alternativas, los datos observados se muestran a continuación. Sea a = 5 %

Hipótesis de investigación: La introducción de la innovación en la compañía C, produce variación en las participaciones de las tres empresas.

Hi: pA pB pC

Ho: pA = pB = pC

86

Page 88: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 5

Frecuencias observadas (f)

Producto

compañía A

Producto

compañía B

Nuevo producto

compañía C

Suma

48 98 54 200

Calculo de las frecuencias esperada (e)

Estadístico de prueba: EP = (fi – ei)2 / ei = (48-60)2 / 60 + (98-100)2 /100 + (54-40)2

/40 Ep = 7.34

El estadístico de prueba tiene distribución ji-cuadrada con K-1 grados de libertad, donde K es el número de grupos, en este caso son 3 grupos, y los grados de libertad son 2, con

a = 0.05, consultando en la tabla respectiva obtenemos el puntaje 2 = 5.99

Como 7.34 > 5.99 se rechaza Ho y se acepta Hi.

Por lo que se puede concluir que la innovación en el producto presentada por la compañía C si causa variación en las participaciones de las tres empresas.

Ejercicios.

T103.- Una radiodifusora quiere determinar qué tipo de programación prefieren los jóvenes entre 18 y 22 años. Para lo cual se entrevista a 50 personas entre estas edades y se les pide su opinión, la tabla adjunta muestra los resultados, verificar si existe preferencia por algún tipo de programa. Sea a = 5 %

t i p o d e p r o g r a m a

Cultural Noticias Deportivo.

18 15 17

T104.- Una empresa encargada de la certificación del tiraje de los medios de comunicación (periódicos) registró durante el mes de enero los siguientes porcentajes:

87

Producto

compañía A

Producto

compañía B

Producto

compañía C

200(0.30) = 60 200(0.50) = 100

200(0.20) = 40

Page 89: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 5

Diario de Yucatán 30%, Por Esto 28%, Mundo al Día, 25 %, otros 17%. Dos meses después una muestra de 300 suscriptores arrojó los siguientes resultados.

Diario de Yucatán: 95

Por Esto: 70

Mundo al Día: 89

Otros 46

T105.- La empresa M&M/Mars, fabricante de los chocolates M&M patrocinó una encuesta nacional en la que mas de 10 millones de personas indicaron su preferencia por un color nuevo. El conteo de esta encuesta dio como resultado el reemplazo del color chocolate por un nuevo color azul. En el folleto “Colors” que publicó el Departamento de Asuntos del Consumidor de M&M, la distribución de colores de los chocolates es como sigue:

Café Amarillo Rojo Naranja Verde

Azul

30% 20% 20% 10% 10% 10%

En un estudio que apareció en Chance (No. 4 1996) se usaron muestras de 1 lb. Para determinar si eran válidos los porcentajes publicados. Se obtuvieron los siguientes resultados de una muestra de 506 chocolates.

Café Amarillo Rojo Naranja Verde

Azul

177 135 79 41 36 38

Use a = 5 % para determinar si estos datos respaldan lo que publicó la empresa.

Subtema 5.7 Aplicaciones.

T106.- A continuación se presentan las preferencias de grupos de consumidores hacia tres marcas de ropa casual de tienda. Use a = 5 % para probar si hay alguna diferencia de preferencias hacia las diferentes marcas.

Marca

88

Pruebe, con α = 5 %, si han cambiado las proporciones en los diferentes medios de comunicación.

Page 90: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 5

Arabia

Betania Capernaum

43 53 39

T107.- La distribución normativa de las calificaciones para un curso de Estadística en una Universidad es:

A B C D E

10%

30% 40% 15%

5%

En una muestra de 120 calificaciones de Estadística al final de semestre se encontraron:

A B C D E

18 30 40 22 10

Use α = 5 % para probar si las calificaciones reales ¿se desvían mucho de la norma?

T108.- Un cirujano desarrollo una nueva técnica quirúrgica para el reemplazo de la cabeza del fémur, que consideraba mejor a la tradicional en cuanto a complicaciones postoperatorias, luego de intervenir a 106 adultos con edades comprendidas entre 55 y 65 años observó la siguiente distribución de frecuencias de complicaciones.

Nueva técnica: distribución de frecuencias de complicaciones observadas.

Daño nervioso Hemorragia desplazamiento ninguna Total

28 16 4 58 106

Tabla de referencia de frecuencias de complicaciones en porcentajes.

Daño nervioso Hemorragia desplazamiento ninguna Total

50% 29.4% 5.36% 15.24% 100%

¿Es mejor la nueva técnica que la anterior? a un nivel de significancia de 5%

89

Page 91: Apuntes IGE (1).docx

Estadística Inferencial I Unidad 5

90

Page 92: Apuntes IGE (1).docx

Estadística Inferencial I

Bibliografía

Levin, Rubin, Balderas, Del Valle, Gómez, séptima edición.

Estadística para administración y economía. Pearson, México, 2004.

Freund, Williams, Perles, quinta edición.

Estadística para la Administración. Con enfoque moderno. Prentice Hall, México. 2005.

Berenson, Levine, cuarta edición.

Estadística básica en Administración. Prentice Hall. México 2006.

María Teresa González M, primera edición.

Estadística aplicada, una visión instrumental. Ed. Díaz de Santos, S. A. Madrid, 2012.

Miguel Ángel Gómez V. primera edición.

Inferencia Estadística. Ed. Díaz de Santos, S. A. Madrid, 2005.

91