Unidad3 Inf Estadistica

63
Profesor: Celso Gonzales Email:[email protected] INFERENCIA ESTADISTICA INFERENCIA ESTADISTICA

description

INFERENCIA ESTADISTICA

Transcript of Unidad3 Inf Estadistica

  • INFERENCIA ESTADISTICA

    Profesor: Celso GonzalesEmail:[email protected]

  • ObjetivosEntender los conceptos de estimacin puntual y estimacin por intervalos. Calcular e interpretar intervalos de confianza para una media poblacional con varianza conocida.Calcular e interpretar intervalos de confianza para una media poblacional con varianza desconocida.Calcular e interpretar intervalos de confianza para una proporcin poblacional.Calcular e interpretar intervalos de confianza para una varianza poblacional .

  • INFERENCIA ESTADSTICAAnlisis, interpretacin de resultados y conclusiones a partir de una muestra aleatoriaEstimadorFuncin de las observaciones muestralesEstimacin de ParmetrosAproximacin de los valores de los parmetros.

  • COMPRENDE:Prueba de hiptesisEstimacin de ParmetrosEstimacin PuntualEstimacin por intervalo

  • TIPOS DE ESTIMACIONEstimacin Puntualnico valorInsesgadoConsistenteEficienteSuficientePropiedades

  • ESTIMACIN DE PARMETROS.Puntual.

  • PROPIEDADES DE LOS ESTIMADORESInsesgadoSuficienciaConsistenciaEficiencia

  • TIPOS DE ESTIMACION

  • Estimacin por intervalos.Consiste en la determinacin de un intervalo, que contendr el parmetro con una confianza 1- , nmero entre 0 y 1, fijado. Se requiere: Una muestra aleatoria X1, X2 ,..., Xn de tamao nUn estimador del parmetro poblacional , con distribucin o funcin de probabilidad conocida. El nivel de confianza 1-

  • INTERVALO DE CONFIANZA DE LA MEDIA POBLACIONALVarianza conocida

  • Para calibrar un instrumento de medicin, se mide repetidas veces un patrn cuyo peso sabemos igual a 10 gramos. Los valores medidos siguen una distribucin normal de media desconocida. En cambio, por estudios anteriores sabemos que podemos considerar la desviacin estndar igual a 0.0002 gramos. Se mide el patrn cinco veces, la media de las cinco mediciones es igual a 10.0023 gramos. Hallar e interpretar un intervalo de confianza del 98 % para el peso medio del patrn.Cuntas mediciones debemos realizar para conseguir con la media muestral un margen de error de 0.0001 con 95% de confianza?

    Ejercicio 1

  • Un comprador est interesado en la resistencia a la tensin de una fibra que se usa en la manufactura de telas. La experiencia indica que la desviacin estndar de la resistencia es de 2 psi. Se selecciona una muestra aleatoria de ocho piezas de fibras y la resistencia media a la tensin resulta ser de 127 psi. Calcule e interprete con 95% de confianza para la verdadera resistencia media a la tensinEjercicio 2

  • Un fabricante de pilas alcalinas sabe que el tiempo de duracin, en horas, de las pilas que fabrica sigue una distribucin Normal de media desconocida y varianza 3600. Con una muestra de su produccin, elegida al azar, y un nivel de confianza del 95% ha obtenido para la media el intervalo de confianza (372.6; 392.2). a) Calcula el valor que obtuvo para la media de la muestra y el tamao muestral utilizado. b) Cul sera el error de estimacin, si hubiese utilizado una muestra de tamao 225 y un nivel de confianza del 90%?

  • INTERVALO DE CONFIANZA DE LA MEDIA POBLACIONALVarianza Desconocida

  • El peso de los paquetes enviados por una determinada empresa de transportes se distribuye segn una distribucin normal. En un estudio realizado con una muestra aleatoria de 9 paquetes, se obtuvieron los siguientes pesos en kilos: 9.5, 10, 8.5, 10.5, 12.5, 10.5, 12.5, 13, 12 a) Halla un intervalo de confianza, al 95%, para el peso medio de los paquetes enviados por esa empresa. b) Calcula el tamao mnimo que debera tener una muestra, en el caso de admitir un error de estimacin de 0.3 kg, con un nivel de confianza del 90%?

  • Se usa una mquina para llenar envases con cierto producto lquido. Es posible suponer que el volumen de llenado tiene distribucin normal. Se selecciona una muestra aleatoria de 5 envases y se miden los contenidos netos, con los resultados que se muestran. Estimar e interpretar un intervalo de confianza del 95 % para el volumen medio de llenado.Ejercicio 3

    Hoja1

    025.526.824.22527.3

    25,5

    26,8

    24,2

    25,0

    27,3

    Hoja2

    Hoja3

  • INTERVALO DE CONFIANZA DE UNA PROPORCINUn Intervalo de confianza aproximado del 100(1- )% para la proporcin poblacional ser:

  • Un fabricante asegura a una empresa que le compra un producto en forma regular, que el porcentaje de productos defectuosos no es mayor del 5%. La empresa decide comprobar la afirmacin del comerciante seleccionando al azar de su inventario 200 unidades de este producto y probndolas. En la muestra encuentran 19 unidades defectuosas.Construya e interprete un intervalo del 95% de confianza para la verdadera proporcin de unidades defectuosas. Tiene razones la compaa para sospechar de la afirmacin del fabricante?. Justifique.

  • Se desea realizar un estudio para estimar la proporcin la fuerza laboral que tiene dos o ms empleos. Se quiere un nivel de confianza de 95 % y que el error de estimacin del 2 %. En un estudio piloto se encontr que 5 de los 50 entrevistados tenan ms de dos empleos. Cuntas personas de la fuerza laboral debern entrevistarse para satisfacer los requerimientos?

  • Una empresa quiere introducir un nuevo producto al mercado local, por tanto quiere estimar la proporcin de clientes potenciales (dispuestos a adquirir el producto al precio que se ofrece), para tal efecto se entrevist a 200 personas de las cuales 68 mostraron ser potenciales clientes. Encuentre el porcentaje de personas dispuestas a adquirir el producto mnimo y mximo al 95% de confianza. Ejercicio 4

  • INTERVALO DE CONFIANZA DE UNA VARIANZA POBLACIONAL

  • Una de las preocupaciones de los usuarios de sistemas interactivos es la magnitud de la varianza del tiempo de respuesta. Necesitamos comprar uno de estos sistemas y, en una versin de evaluacin hemos obtenido las siguientes medidas de dicho tiempo, en ms:20.1 22.9 18.8 20.9 22.7 21.4 20 25.8 32.1 33Suponiendo que los tiempos de respuesta tienen distribucin normal, obtener un intervalo de confianza para la varianza, con un nivel de confianza del 95%Ejercicio 5

  • PRUEBA DE HIPTESIS

  • Objetivos

    Diferenciar entre hiptesis nula y alternativaDefinir los errores de tipo I y de tipo IIDescribir el procedimiento para realizar una prueba de hiptesisRealizar una prueba de hiptesis para la media poblacionalRealizar una prueba de hiptesis para la proporcin poblacionalRealizar una prueba de hiptesis para la varianza poblacionalRealizar una prueba de hiptesis para la razn de varianzas poblacionalesRealizar una prueba de hiptesis para la diferencia de medias poblacionales.Realizar una prueba de hiptesis para la diferencia de proporciones poblacionales.

  • Qu es una hiptesis?Una creencia sobre la Poblacin, principalmente sus parmetros:MediaVarianzaProporcinNOTA: debe establecerse antes del anlisis.

  • HIPTESIS ESTADSTICAEs una afirmacin que se hace acerca de un parmetro poblacional.Hiptesis nula es una afirmacin que est establecida y que se espera sea rechazada despus de aplicar una prueba estadstica. Se representa por Ho.Hiptesis alternante, es la afirmacin que se espera sea aceptada despus de aplicar una prueba estadstica y se representa por Ha.

    PRUEBA DE HIPTESISProcedimiento estadstico basado en la evidencia muestral y la teora de probabilidad.

  • TIPOS DE ERRORESError tipo I, que se comete cuando se rechaza una hiptesis nula que realmente es cierta.Error tipo II, que se comete cuando se acepta una hiptesis nula que realmente es falsa.

  • TIPOS DE ERROR AL PROBAR HIPTESIS

  • Para un tamao de muestra fijo, no se pueden reducir a la vez ambos tipos de error.Para reducir b, hay que aumentar el tamao de la muestra.El nivel de significacin, representada por , es la probabilidad de cometer error tipo I, y por lo general se asume que tiene un valor de 0.05 0.01. La probabilidad de cometer error tipo II, representado por y al valor 1- se le llama la potencia de la prueba. Una buena prueba estadstica es aquella que tiene una potencia de prueba alta.

  • IDENTIFICACIN DE HIPTESISHiptesis nula HoLa que probamos

    Los datos pueden refutarla

    No debera ser rechazada sin una buena razn.Hiptesis Alternante H1Niega a H0

    Los datos pueden mostrar evidencia a favor

    No debera ser aceptada sin una gran evidencia a favor.

  • PRUEBA DE HIPTESIS PARA UNA MEDIA POBLACIONAL conocido

  • Un inspector de pesos y medidas visita una planta de empacado para verificar que el peso neto de las cajas sea el indicado en la etiqueta. El gerente de la planta asegura al inspector que el peso promedio de cada caja es de 750 gramos con una desviacin estndar de 5 gr. El inspector selecciona, al azar, 100 cajas y encuentra que el peso promedio es de 748 gr. Bajo estas condiciones y usando un nivel de significancia de 0.05,Qu actitud debe tomar el inspector?.

  • En una fbrica de conservas de frutas desea verificar de que si las latas tiene un peso promedio inferior a 1 kg. Se sabe que el tamao de la fruta puede introducir una variacin en los pesos de las latas de manera que estos se distribuyan normalmente con una desviacin estndar de 0,08. Se toma una muestra de 100 latas en la que se determina los pesos, resultando un promedio de 980 gr. Deseamos saber si la muestra comprueba tal afirmacin. Utilizar un nivel de significacin igual al 2,5%.

    Ejercicio 6

  • PRUEBA DE HIPTESIS PARA UNA MEDIA POBLACIONAL desconocido

  • Un modelo fsico sugiere que el aumento medio de temperatura en el agua usada como enfriador en una cmara de un compresor no debera ser mayor de 5C. Los aumentos de temperatura en el refrigerante medidos en 8 perodos de funcionamiento del compresor fueron de: 6,4; 4,3; 5,7; 4,9; 6,5; 5,9; 6,4 y 5,1 grados centgrados. Con un nivel de significancia del 5%, cree Usted que los datos contradicen la informacin del modelo fsico?

  • Un informe publicado en el New England Journal of Medicine volvi a sembrar dudas al sealar que la peor de las grasas era la margarina. Esta revista norteamericana la acusaba de disminuir el llamado colesterol bueno o HDL propiciando la aparicin de enfermedades cardiacas. El departamento mdico de la USMP decide tomar una muestra de estudiantes (hombres y mujeres) consumidores habituales de margarina para medir su nivel de colesterol en la sangre. Los valores (en miligramos) se muestran a continuacin:Descriptive Statistics: Hombres, Mujeres Ejercicio 7

    Variable N Mean Median TrMean StDev SE Mean Hombres 272002002001.150.22Mujeres 31199.33199.15199.311.080.19

  • El departamento mdico de la USMP afirma que en promedio una persona con un nivel de colesterol menor de 200 miligramos es considerada como una con bajo riesgo de tener complicaciones cardiacas. Se puede afirmar que las mujeres poseen un bajo riesgo de poseer este tipo de complicaciones?. Use = 0.01.

    Ejercicio 8

  • PRUEBA DE HIPTESIS PARA UNA PROPORCION POBLACIONAL

  • En una poblacin se asegura que la proporcin de personas con problemas de obesidad es mayor que 0,37. Para verificar tal afirmacin se selecciona una muestra aleatoria de 1500 personas y se obtiene que 600 de ellas presentan problemas de obesidad. Se puede asegurar que se cumple tal afirmacin para un nivel de significacin del 2,5 %?

  • Un peridico local de la ciudad de Lima, ha publicado recientemente una noticia con el siguiente titular: Crece el porcentaje de ciudadanos que no tienen confianza en el sistema poltico del pas. Ms adelante en la noticia, se explicaba que la informacin proceda de una encuesta de opinin hecha por una prestigiosa empresa investigadora, y que los resultados mostraban un aumento con respecto a la realizada el ao pasado en el cual el 35% de ciudadanos declararon no tener confianza con el sistema poltico del pas. Suponiendo que la reciente encuesta fue aplicada a 3000 personas de las cuales 1100 manifestaron no tener confianza con el sistema poltico del pas.Es posible refutar el titular publicado por el peridico? Use = 0.05Ejercicio 9

  • Un estudio realizado sobre la duracin de los circuitos, se recogi una muestra de 225 circuitos electrnicos para estudiar la proporcin de circuitos que salan del mercado. Se sabe que de esos 225 circuitos 38 no superaron el control de calidad del cliente. Calcular:a. Un intervalo de confianza del 95% de la proporcin de circuitos que superan el control de calidad.b. Se puede afirmar que la proporcin de circuitos que no supera el control de calidad es superior al 20%? (=0,05).

    Ejercicio 10

  • PRUEBA DE HIPTESIS PARA UNA VARIANZA POBLACIONAL

  • En una organizacin farmacutica, la variacin en el peso de un antibitico de un lote a otro es importante. Con el proceso actual, la desviacin estndar es de 0,11 g. El departamento de investigacin ha desarrollado un nuevo proceso que considera podr producir una variacin menor. Con el nuevo proceso se obtuvieron las siguientes mediciones de peso( en gramos):7,47; 7,49; 7,64; 7,59; 7,55 El nuevo proceso tiene menos variacin que el anterior?

  • EJERCICIO 11La empresa CONTAMINA S.A., dedicada a la fabricacin de insumos qumicos, tiene su planta industrial en el distrito de Comas. El Ministerio de Salud ha recibido una queja de los pobladores ya que esta empresa despide una gran cantidad de gases txicos y han notado la presencia de Mercurio en sus viviendas. La empresa decide detener su produccin y tomar una muestra aleatoria de 35 pobladores (15 hombres y 20 mujeres) y someterlos a una serie de exmenes. El contenido de Mercurio (en miligramos) presente en la sangre de estos pobladores se muestra a continuacin:

    Se puede afirmar que la variancia del contenido neto de Mercurio presente en la sangre de los hombres es mayor a 0.95?. Use = 0.05.

  • PRUEBA DE HIPTESIS PARA UNA RAZON DE VARIANZAS POBLACIONALES

  • El encargado del proceso de purificacin del agua para consumo de la poblacin sostiene que el agua procesada en la planta B tiene mayor pureza que el de la Planta A. Para verificar esta afirmacin con nivel de significacin de 5%, toma muestras de las dos planta obtenindose los siguientes datos en porcentaje de pureza.(TABLA 1)Realizar la prueba de homogeneidad de varianzas. Use un nivel de significacin del 10 %

  • Del ejercicio de la empresa CONTAMINA:Probar si existe homogeneidad de varianzas?. Usar un nivel de significacin del 10 %Ejercicio 13

  • Mediante dos procesos se fabrican alambres galvanizados lisos para alambrados rurales. Los tcnicos de la fbrica desean determinar si los dos procesos poseen diferentes efectos en la resistencia de la media de ruptura del alambre. Se someten varias muestras a los dos procesos dando los siguientes resultados: Proceso 1 = 9 4 10 7 9 10Proceso 2 = 14 9 13 12 13 8 10Probar si existe homogeneidad de varianzas en los procesos con un a = 0,10.Ejercicio 14

  • PRUEBA DE HIPTESIS PARA UNA DIFERENCIA DE MEDIAS POBLACIONALES

  • Un empresario desea comparar la productividad de dos tipos de obreros industriales de una regin, supone que la productividad de ambos tipos de trabajadores es similar pero con mayor variabilidad en uno de ellos; desviacin estndar 0,9 por hora en la industria A, con solo 0,3 en la industria B. Para comprobar esta suposicin controla durante un cierto tiempo la produccin de 200 obreros de A y 350 obreros de B obteniendo una productividad media por hora de 1 y 0,89 respectivamente. Puede concluirse en base a estos resultados que la suposicin del empresario era correcta? (a = 0,05)

    EJERCICIO 15

  • PRUEBA DE HIPTESIS PARA UNA DIFERENCIA DE MEDIAS POBLACIONALES CON VARIANZAS POBLACIONALES DESCONOCIDAS

  • El encargado del proceso de purificacin del agua para consumo de la poblacin sostiene que el agua procesada en la planta B tiene mayor pureza que el de la Planta A. Para verificar esta afirmacin con nivel de significacin de 5%, toma muestras de las dos planta obtenindose los siguientes datos en porcentaje de pureza.(TABLA 1)

  • Un fabricante de productos de plstico est tratando de decidir que receta usar para una mezcla en particular. Se desea una alta capacidad de extensin. La receta 1 es ms barata de mezclar, pero no est seguro de si tiene aproximadamente la misma fuerza que la receta 2. Se han fabricado cinco lotes de plsticos con cada receta y sometido a prueba para ver su capacidad de extensin. stos son los resultados obtenidos ( en psi)Qu receta recomendara usted? Usar un nivel de significacin del 10 %

  • Del ejercicio de Colesterol:El informe publicado en el New England Journal of Medicine menciona adems que en las universidades Americanas el nivel promedio de colesterol en los hombres es un miligramo mayor que el nivel promedio de colesterol en las mujeres. Se puede afirmar lo mismo en la USMP?. Use = 0.02.Suponga que al siguiente ciclo al momento de la matricula se midi el nivel de colesterol de todos los estudiantes de la USMP encontrndose como valores promedio 201 y 198 miligramos para los hombres y las mujeres respectivamente. Asumiendo que no hubo cambios en el nivel de colesterol de los estudiantes. Se cometi algn error?.

    Ejercicio 16

  • H0 :Ha :R.R.:HIPTESIS PARA COMPARAR DOS MEDIAS POBLACIONALES ( Varianzas heterogneas)

  • Se realiza un estudio con la finalidad de evaluar los costos de desperdicio de insumo en dos plantas de produccin A y B de una empresa. Se seleccionaron muestras aleatorias de unidades producidas, obtenindose la siguiente informacin:

    Existe evidencia estadstica para afirmar que la proporcin de unidades con costo mayor a 140 u.m. en la empresa A es mayor que su correspondiente proporcin en la empresa B?. Usar = 0.05

  • Del ejemplo de la empresa CONTAMINAEl Ministerio de Salud ha recomendado a la empresa iniciar un tratamiento para purificar la sangre de estos pobladores. Para esto es necesario aplicar una dosis de PURIFICOL durante un mes a cada una de las personas afectadas. La dosis diaria es 50 mg ms 0.25 mg por cada miligramo de Mercurio presente en la sangre. El costo de PURIFICOL es de 1 nuevo sol por miligramo. Se puede afirmar que en promedio el gasto diario en PURIFICOL por persona es el mismo para los hombres y las mujeres?. Use = 0.10 .

    Ejercicio 17

  • H0 :Ha :R.R.PRUEBA DE HIPTESIS DE UNA DIFERENCIA DE PROPORCIONES POBLACIONALES

  • De una muestra de 450 votantes hombres, 105 se declararon simpatizantes del candidato A. De una muestra de 550 votantes mujeres 120 se declararon simpatizantes del mismo candidato. Proporcionan estos datos evidencia suficiente como para considera que las proporciones de los simpatizantes hombres y mujeres son iguales? = 0,05

    Ejercicio 18

  • H0 :Ha :R.R.PRUEBA DE HIPTESIS DE UNA DIFERENCIA PROPORCIONES POBLACIONALES

  • Consiste en tomar la decisin a partir de la probabilidad del error Tipo I. Suponer que Ho es cierta.El P-value representara la probabilidad de cometer un error cuando se toma la decisin de rechazar Ho.Si P entonces la decisin es Rechazamos HoSi P > la decisin es No hay evidencia suficiente para rechazar HoPROCEDIMIENTO GENERAL DE UN TEST DE HIPTESIS BASADO EN EL P-VALUE

  • Test and CI for Two Proportions

    Sample X N Sample p1 105 450 0.2333332 120 550 0.218182Estimate for p(1) - p(2): 0.015151595% CI for p(1) - p(2): (-0.0369877, 0.0672907)Test for p(1) - p(2) = 0 (vs not = 0): Z = 0.57 P-Value = 0.568