Estadística Inferencial 1

146
ESTADÍSTICA INFERENCIAL I INGENIERÍA EN GESTIÓN EMPRESARIAL LNI. BENITO RODRÍGUEZ CABRERA PABELLÓN DE ARTEAGA ABRIL 2015

description

temario de estadistica inferencial 1 tecnologico

Transcript of Estadística Inferencial 1

ESTADSTICA INFERENCIAL I INGENIERA EN GESTIN EMPRESARIAL

ESTADSTICA INFERENCIAL I

INGENIERA EN GESTIN EMPRESARIALLNI. BENITO RODRGUEZ CABRERAPABELLN DE ARTEAGAABRIL 2015

FECHAS11 DE ABRIL: UNIDAD 118 DE ABRIL: UNIDAD 202 DE MAYO: UNIDAD 309 DE MAYO: UNIDAD 416 DE MAYO: UNIDAD 5FORMAS DE CALIFICARTAREAS: 30%TRABAJO EN CLASE:20%EXAMEN ESCRITO: 50%TOTAL 100%UNIDAD 1Introduccin a la estadstica inferencial.

1.1 Breve historia de la estadstica. 1.2 Concepto de estadstica. 1.3 Estadstica descriptiva. 1.4 Estadstica inferencial. 1.5 Breve introduccin a la inferencia estadstica. 1.6 Teora de decisin en estadstica. 1.7 Componentes de una investigacin estadstica. 1.8 Recoleccin de datos. 1.9 Estadstica parametrica (poblacin y muestra aleatoria). 1.10 Aplicaciones. UNIDAD 2Inferencia estadstica: estimacin.

2.1 Conceptos bsicos. 2.2 Distribuciones de muestreo. 2.3 Estimacin puntual. 2.4 Estimacin de intervalo. 2.5 Intervalos de confianza para medias. 2.6 Intervalos de confianza para diferencia entre medias. 2.7 Intervalos de confianza para proporciones. 2.8 Intervalos de confianza para diferencias entre proporciones. 2.9 Intervalos de confianza para varianzas. 2.10 Intervalos de confianza para razones de dos varianzas. UNIDAD 3Pruebas de hiptesis con una muestra.

3.1 Metodologa para la prueba de hiptesis. 3.2 Hiptesis nula y alternativa. 3.3 Error tipo I y error tipo II. 3.4 Pruebas de hiptesis Z para la media (desviacin estndar poblacional conocida). 3.5 Pruebas para proporciones. 3.6 Seleccin del tamao de muestra ( para estimar la media poblacional). 3.7 Seleccin del tamao de muestra (para estimar la proporcin poblacional). UNIDAD 4Pruebas de hiptesis con dos muestras y varias muestras de datos numricos.

4.1 Introduccin. 4.2 Distribuciones normal y t de Student. 4.3 Pruebas de significancia. 4.4 Comparacin de dos muestras independientes: Pruebas t para las diferencias entre dos medias. 4.5 Prueba de Fisher para varianzas y de igualdad de las varianzas de dos poblaciones normales. 4.6 Comparaciones de dos muestras pareadas 4.7 Modelo totalmente aleatorio: anlisis de varianza de un factor. 4.8 Seleccin del tamao de muestra para estimar la diferencia de dos medias. 4.9 AplicacionesUNIDAD 5Pruebas de hiptesis con dos muestras y varias muestras con datos categricos.

5.1 Prueba Z para la diferencia entre dos proporciones. 5.2 Prueba para la diferencia entre dos proporciones. 5.3 Prueba para la diferencia en n proporciones Z. 5.4 Prueba de independencia (ji-cuadrada). 5.5 Pruebas de contingencia (ji-cuadrada). 5.6 Pruebas de bondad de ajuste. 5.7 Aplicaciones. Unidad 1Introduccin a la estadstica inferencial.

INTRODUCCINQU ES LA ESTADSTICAINTERPRETACIN DE LA ESTADSTICALa palabra tiene su sentido ms amplio para aquellas personas cuyo trabajo requiere un conocimiento de los aspectos ms tcnicos de la estadstica.

Para estas personas, la palabra tiene relacin con aquellos conceptos y tcnicas que se utilizan en la recopilacin, organizacin, resumen, anlisis, interpretacin y comunicacin de informacin numrica. QU HACE LA ESTADSTICA?ESTADSTICA1.1 HISTORIA DE LA ESTADSTICAAl igual que ha ocurrido con otras muchas disciplinas, a lo largo del tiempo se ha pensado que la estadstica es un procedimiento extraordinariamente complicado.

Desde los comienzos de la civilizacin han existido formas sencillas de estadstica, pues ya se utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el nmero de personas, animales o ciertas cosas.EVOLUCINDesde que los pueblos se organizaron en Estados, sus gobernantes necesitaron estar informados sobre aspectos relativos a la cantidad o distribucin de la poblacin, nacimientos, defunciones, produccin agrcola y ganadera, bienes muebles e inmuebles, efectivos militares, etc.

Si bien la Estadstica no fue considerada como ciencia hasta los siglos XVII o XVIII en Alemania (atribuida a Achenwall, profesor de la Universidad de gtinger- Baja Sajonia); quien la identific como la ciencia de las cosas del Estado; sus orgenes datan de pocas remotas, pues existen constancias de que los chinos (2.300 AC); los hebreos, los atenienses y los romanos formaron censos, principalmente por razones tributarias y militares.

1.2 CONCEPTO DE ESTADSTICAEn el lenguaje comn, la palabra se emplea para denotar un conjunto de calificaciones o de nmeros. La palabra estadstica ha sido frecuentemente referida a la informacin cuantitativa o numrica. Tambin ha sido referida ampliamente a los mtodos que tratan con la informacin. Sin embargo, esto debera aclararse y llamar a la informacin datos estadsticos y a los mtodos estadsticos.

ESTADSTICA = DISCIPLINAEste significado de estadstica en realidad est relacionado de manera muy cercano con el empleo analizado anteriormente, debido a que las estadsticas, consideradas como datos numricos son la materia prima de la estadstica como disciplina.

DEFINICIN La estadstica se refiere a un conjunto de mtodos para manejar la obtencin, presentacin y anlisis de observaciones numricas. Sus fines son describir al conjunto de datos obtenidos y tomar decisiones o realizar generalizaciones acerca de las caractersticas de todas las posibles observaciones bajo consideracin.TIPOS DE ESTADSTICAEn resumen, la estadstica como disciplina o rea de estudio incluye tanto tcnicas descriptivas como inferenciales. Incluye la obtencin y tratamiento de datos numricos y el empleo de mtodos estadsticos con fines inferenciales. Ms especficamente1.3 ESTADSTICA DESCRIPTIVA La estadstica descriptiva se refiere a aquella parte del estudio que incluye la obtencin, organizacin, presentacin y descripcin de informacin numrica.

La estadstica descriptiva o deductiva trata del recuento, ordenacin y clasificacin de los datos obtenidos por las observaciones. Se construyen tablas y se representan grficos que permiten simplificar la complejidad de los datos que intervienen en la distribucin.

Asimismo, se calculan parmetros estadsticos que caracterizan la distribucin. No se hace uso del clculo de probabilidades y nicamente se limita a realizar deducciones directamente a partir de los datos parmetros obtenidos. Debido a que el objetivo de este tipo de manejo de datos es describir las caractersticas importantes de la informacin obtenida, generalmente se le denomina estadstica descriptiva. En otras palabras.

1.4 ESTADSTICA INFERENCIALLa estadstica inferencial o inferencia estadstica es una tcnica mediante la cual se obtienen generalizaciones o se toman decisiones en base a una informacin parcial o incompleta obtenida mediante tcnicas descriptivas.

El arte de obtener con confianza conclusiones sobre el modo de proceder del fenmeno que se estudia es el objeto de las diversas tcnicas existentes de inferencia estadstica. La estadstica inferencial o inductiva plantea y resuelve el problema de establecer previsiones y conclusiones generales sobre una poblacin a partir de los resultados obtenidos de una muestra. Los modelos estadsticos actan de puente entre lo observado (muestra) y lo desconocido (poblacin). Su construccin y estudio estn basados en el clculo de probabilidades.

As pues, la inferencia estadstica es la metodologa tendente a hacer:DescripcionesPrediccionesComparaciones Generalizaciones de una poblacin estadstica A partir de la informacin contenida en una muestra. Utiliza resultados obtenidos mediante la estadstica descriptiva y se apoya fuertemente en el clculo de probabilidades1.5 INTRODUCCIN A LA ESTADSTICA INFERENCIALEJEMPLOEl investigador se encuentra estudiando una gran poblacin (personas, o tornillos, o palomas, o automviles, o lo que sea) y quiere disponer de algunos valores (promedios, desvos, tendencias, forma de la distribucin, etctera) que sean vlidos en forma general, para toda la poblacin en estudio. Sin embargo, le resulta imposible acceder a toda la informacin, medir la variable analizada en todos y cada uno de los integrantes de la poblacin.

Qu hace?. Estudia toda la poblacin?inventa los datos?

SACA MUESTRA DE LA POBLACIN

MUESTRAModelo reducido a escala de la poblacin

Importante:Al tomar la muestra siempre se producen errores y se pierden detalles, pero es mucho ms lo que se gana respecto a la informacin que ella puede proporcionarCONTENIDO DE LA MUESTRAExisten numerosas tcnicas para seleccionar muestras. Este paso es de importancia vital en un estudio estadstico, porque las conclusiones que se obtienen dependen muy esencialmente de las muestras analizadas. Las tcnicas que proporcionan las mejores muestras son las aleatorias, en las que cualquier integrante de la poblacin tiene la misma probabilidad de ser elegido.

FORMULAS TAMAO MUESTRADESCONOCIENDO TAMAO DE LA POBLACIN

CONOCIENO TAMAO DE LAPOBLACIN

Algunos valores estandarizados (z) en funcin de grado de confiabilidad asumido (para dos colas):99 % ------------- z = 2, 58 (Empleado con frecuencia)95 % ------------- z = 1, 96 (El ms empleado) 90 % ------------- z = 1, 64 EJERCICIOSCONOCIENDO LA POBLACINEjemplo No. 1: A cuntas familias tendramos que estudiar para conocer la preferencia del mercado en cuanto a las marcas de shampoo para beb, si se conoce que el nmero de familias con bebs en el sector de inters es de 15,000? Seguridad = 95%; Precisin = 3%; Proporcin esperada = asumamos que puede ser prxima al 5%; si no tuviese ninguna idea de dicha proporcin utilizaramos el valor p = 0.5 (50%) que maximiza el tamao muestral. SUSTITUYENDO

RESULTADO200 FAMILIASPROGRAMAS ESTADSTICOS

EJERCICIOS DESCONOCIENDO LA POBLACINEjemplo No. 2: A cuntas familias tendramos que estudiar para conocer la preferencia del mercado en cuanto a las marcas de shampoo para beb, si se desconoce la poblacin total? Seguridad = 95%;Precisin = 3%; Proporcin esperada = asumamos que puede ser prxima al 5%; si no tuvisemos ninguna idea de dicha proporcin utilizaramos el valor p = 0.5 (50%) que maximiza el tamao muestralSUSTITUYENDO

RESULTADO203 FAMILIASFACTORES INFLUYENTESLa cantidad de elementos que integran la muestra (el tamao de la muestra) depende de mltiples factores, como: El dinero y el tiempo disponibles para el estudio, La importancia del tema analizado, La confiabilidad que se espera de los resultados, Las caractersticas propias del fenmeno analizado.

A partir de la muestra seleccionada se realizan algunos clculos y se estima el valor de los parmetros de la poblacin tales como: la media, la varianza, la desviacin estndar, la forma de la distribucin, etctera.ESTIMACIN DE PARMETROS

1.6 Teora de decisin en estadstica.TIPOS DE DECISIONES1.- Decisin sin riesgo entre mercancas inconmensurables (mercancas que no pueden ser medidas bajo las mismas unidades). Toneladas / mantequilla

2.- Eleccin bajo impredecibilidad. (datos no predecibles)

3.- Eleccin intemporal: estudio del valor relativo que la gente asigna a dos o ms bienes en diferentes momentos del tiempo.

4.- Decisiones sociales: decisiones tomadas en grupo o bajo una estructura organizativa.

PASOS PARA TOMAR UNA DECISINProblema. Necesidad de mejora. Decisin. Alternativas. Mejor alternativa.

1.7 Componentes de una investigacin estadstica.1.8 Recoleccin de datos.

PASOS PARA LA RECOLECCIN DE DATOS1. Definir los objetivos de la investigacin o del experimento.

2. Definir la variable y la poblacin de inters.

3. Definir los esquemas para recolectar y medir los datos. (forma de recolectar datos)

4. Determinar las tcnicas idneas para realizar el anlisis de datos: descriptivas o inferenciales.

1.9 Estadstica paramtrica (poblacin y muestra aleatoria).Condiciones que debe reunir una muestra:

Homogeneidad: debe ser extrada de la misma poblacin. Independencia: las observaciones no deben estar mutuamente condicionadas entre s.Representatividad: la muestra debe ser el mejor reflejo posible del conjunto del cual proviene.Estadsticas y parmetros Cuando estos trminos describen las caractersticas de una poblacin, se llaman parmetros. Cuando describen las caractersticas de la muestra, se llaman estadsticos. Una estadstica es una caracterstica de una muestra y un parmetro es una caracterstica de la poblacin.

Poblacin (finitas / Infinitas)Muestra AleatoriaMuestreo aleatorio simple (datos sin secuencia)Muestreo sistemtico (datos con secuencia)Muestreo estratificado (divisin por grupos) (pequea variacin grupos diferentes)Muestreo racimo (Divisin por grupos) (variacin considerable grupos iguales) geogrficamente igualesUNIDAD 2INFERENCIA ESTADSTICA: ESTIMACINUNIDAD 2Inferencia estadstica: estimacin.

2.1 Conceptos bsicos. 2.2 Distribuciones de muestreo. 2.3 Estimacin puntual. 2.4 Estimacin de intervalo. 2.5 Intervalos de confianza para medias. 2.6 Intervalos de confianza para diferencia entre medias. 2.7 Intervalos de confianza para proporciones. 2.8 Intervalos de confianza para diferencias entre proporciones. 2.9 Intervalos de confianza para varianzas. 2.10 Intervalos de confianza para razones de dos varianzas. INTRODUCCINLa Estadstica descriptiva y la teora de la Probabilidad van a ser los pilares de un nuevo procedimiento (Estadstica Inferencial) con los que se va a estudiar el comportamiento global de un fenmeno. La probabilidad y los modelos de distribucin junto con las tcnicas descriptivas, constituyen la base de una nueva forma de interpretar la informacin suministrada por una parcela de la realidad que interesa investigar.INFERENCIA ESTADSTICALos mtodos bsicos de la estadstica inferencial son la estimacin y el contraste de hiptesis, que juegan un papel fundamental en la investigacin.

OBJETIVO DE LA ESTIMACINCalcular los parmetros de la distribucin de medias o proporciones mustrales de tamao n, extradas de una poblacin de media y varianza conocidas. Estimar la media o la proporcin de una poblacin a partir de la media o proporcin muestral. Utilizar distintos tamaos mustrales para controlar la confianza y el error admitido. Contrastar los resultados obtenidos a partir de muestras.Visualizar grficamente, mediante las respectivas curvas normales, las estimaciones realizadas. En la mayora de las investigaciones resulta imposible estudiar a todos y cada uno de los individuos de la poblacin ya sea por el coste que supondra, o por la imposibilidad de acceder a ello. Mediante la tcnica inferencial obtendremos conclusiones para una poblacin no observada en su totalidad, a partir de estimaciones o resmenes numricos efectuados sobre la base informativa extrada de una muestra de dicha poblacin.ESQUEMA GENERAL

ESTIMACIN DE PARMETROSIMPORTANTESi el objetivo del tratamiento estadstico inferencial, es efectuar generalizaciones acerca de la estructura, composicin o comportamiento de las poblaciones no observadas, a partir de una parte de la poblacin, ser necesario que la parcela de poblacin examinada sea representativa del total. Por ello, la seleccin de la muestra requiere unos requisitos que lo garanticen, debe ser representativa y aleatoria.Adems, la cantidad de elementos que integran la muestra (el tamao de la muestra) depende de mltiples factores, como el dinero y el tiempo disponibles para el estudio, la importancia del tema analizado, la confiabilidad que se espera de los resultados, las caractersticas propias del fenmeno analizado, etctera. As, a partir de la muestra seleccionada se realizan algunos clculos y se estima el valor de los parmetros de la poblacin tales como la media, la varianza, la desviacin estndar, o la forma de la distribucin, etc.2.1 CONCEPTOS BSICOSPOBLACIN: Conjunto de elementos sobre los que se observa un carcter comn. Se representa con la letra N. MUESTRA: Conjunto de unidades de una poblacin. Cuanto ms significativa sea, mejor ser la muestra. Se representa con la letra n. UNIDAD DE MUESTREO: Est formada por uno o ms elementos de la poblacin. El total de unidades de muestreo constituyen la poblacin. Estas unidades son disjuntas entre s y cada elemento de la poblacin pertenece a una unidad de muestreo.PARMETRO: Es un resumen numrico de alguna variable observada de la poblacin. Los parmetros normales que se estudian son:

ESTIMADOR: Un estimador * de un parmetro , es un estadstico que se emplea para conocer el parmetro desconocido. ESTADSTICO: Es una funcin de los valores de la muestra. Es una variable aleatoria, cuyos valores dependen de la muestra seleccionada. Su distribucin de probabilidad, se conoce como Distribucin muestral del estadstico.

ESTIMACIN: Este trmino indica que a partir de lo observado en una muestra (un resumen estadstico con las medidas que conocemos de Descriptiva) se extrapola o generaliza dicho resultado muestral a la poblacin total, de modo que lo estimado es el valor generalizado a la poblacin. Consiste en la bsqueda del valor de los parmetros poblacionales objeto de estudio. Puede ser puntual o por intervalo de confianza:Puntual: cuando buscamos un valor concreto.Intervalo de confianza: cuando determinamos un intervalo, dentro del cual se supone que va a estar el valor del parmetro que se busca con una cierta probabilidadCONTRATE DE HIPTESIS: Consiste en determinar si es aceptable, partiendo de datos mustrales, que la caracterstica o el parmetro poblacional estudiado tome un determinado valor o est dentro de unos determinados valores. NIVEL DE CONFIANZA: Indica la proporcin de veces que acertaramos al afirmar que el parmetro est dentro del intervalo al seleccionar muchas muestras2.2 DISTRIBUCIONES DE MUESTREOLa tarea que nos ocupa ahora es conocer las distribuciones de la probabilidad de ciertas funciones de la muestra, es decir, variables aleatorias asociadas al muestreo o estadsticos mustrales. stos sern tiles para hacer inferencia respecto a los parmetros desconocidos de una poblacin. Por ello se habla de distribuciones mustrales, ya que estn basados en el comportamiento de las muestras.Distribucin muestral: su comportamiento probabilstico depender del que tenga la variable X y del tamao de las muestras. Sea una poblacin donde se observa la variable aleatoria X. Esta variable X, tendr una distribucin de probabilidad, que puede ser conocida o desconocida, y ciertas caractersticas o parmetros poblacionales. El problema ser encontrar una funcin que proporcione el mejor estimador de . El estimador, T, del parmetro debe tener una distribucin concentrada alrededor de y la varianza debe ser lo menor posible.Unidad 2Inferencia estadstica: estimacin.

UNIDAD 2Inferencia estadstica: estimacin.

2.1 Conceptos bsicos. 2.2 Distribuciones de muestreo. 2.3 Estimacin puntual. 2.4 Estimacin de intervalo. 2.5 Intervalos de confianza para medias. 2.6 Intervalos de confianza para diferencia entre medias. 2.7 Intervalos de confianza para proporciones. 2.8 Intervalos de confianza para diferencias entre proporciones. 2.9 Intervalos de confianza para varianzas. 2.10 Intervalos de confianza para razones de dos varianzas. OBJETIVO UNIDADEl objetivo de esta unidad es mostrar como a travs de las distribuciones de muestreo es posible hacer inferencias acerca de la poblacin, a partir de valores observados de las estadsticas mustrales. 2.1 CONCEPTOS BSICOSESTIMACINPuntualPor intervalos

Suponga que un vendedor de computadoras quiere estimar la ganancia promedio en la venta de cierto modelo de la marca X. La estimacin se podra efectuar a travs de un solo numero, por ejemplo 18%, o estimar una ganancia entre el 12 y 20% dependiendo del cliente y el volumen de compraPROCEDIMIENTOEl procedimiento de estimacin puntual utiliza la informacin de la muestra para obtener un solo nmero o punto que estima el parmetro objetivo. El procedimiento de estimacin por intervalo hace uso de la informacin de la muestra para obtener dos nmeros que se supone van a incluir el parmetro de estudio. En cada caso la estimacin real se hace mediante un estimador que es una regla que establece como utilizar los datos de la muestra, para determinar el valor (o valores) que utilizamos como estimacin puntual (o por intervalo).

ESTIMADOR = MEDIA MUESTRALSi se desea obtener una estimacin por intervalo de un parmetro, se tiene que utilizar los datos de la muestra para calcular dos puntos. Con los cuales se espera con una probabilidad alta que el parmetro objetivo se encuentre en el intervalo que forman dichos puntos.

2.2. DISTRIBUCIONES DE MUESTREODistribucin de Muestreo: todos los valores posibles que puede asumir un estadstico muestral, calculados apartir de muestras del mismo tamao y extrado en forma aleatoria de la misma poblacinDistribucin de Muestreo de la Media.(teorema del lmite central) Conoce la varianza = distribucion normal estandarDesconoce la varianza = distribucion t student

Distribucin de Muestreo de la Varianza. Ji-cuadradaVarianzas de dos poblaciones Distribucin FGrados de libertadEstimacin Puntual y por Intervalos.

2.3 ESTIMACIN PUNTUAL (PROBLEMA 1) 2.1. La agencia para la Proteccin Ambiental (EPA) y la Universidad de Florida cooperaron recientemente en cierto estudio de los posibles efectos de oligoelementos en agua potable con respecto a la forma de clculos renales. Enseguida se indican datos con respecto a la edad, la concentracin de calcio en el agua potable para consumo casero (medida por partes por milln), y, el habito de fumar. Se obtuvieron datos de individuos con problemas recurrentes de clculos renales que viven en los estados de ambas Carolinas y en los estados de las Montaas RocallosasTABLA OBTENIDA(a) Estimar la concentracin media de calcio en el agua potable para los pacientes con clculos en las Carolinas. Establecer un lmite para el error de estimacin

b) Estimar la diferencia en el promedio de las edades de los pacientes con clculos renales en las Carolinas y en las Rocallosas. Establecer un lmite de error de estimacin

(c) Estimar y establecer un lmite de dos desviaciones estndar para la diferencia en las proporciones de los pacientes con clculos renales en las Carolinas y en las Rocallosas que eran fumadores al momento del estudio

PROBLEMA 22.2 Un auditor se encuentra interesado en conocer el importe de las cuentas por cobrar en cierta empresa. Para estimar est deuda obtiene una muestra aleatoria de 20 cuentas por cobrar de las 500 cuentas de dicha empresa. Los datos se presentan de la manera siguiente (cantidades en dlares).

TABLA OBTENIDA

2.4 ESTIMACIN POR INTERVALOS Y PROPIEDADESUn estimador puntual es con frecuencia inadecuado como estimacin de un parmetro, ya que raramente coincide con el parmetro. Una situacin alternativa es la estimacin por intervalos de la forma [Li, Ls], donde Li es el limite inferior y Ls es el limite superior. Un estimador por intervalo es una regla que especifica el mtodo que utiliza las mediciones de la muestra para calcular los nmeros que forman los extremos del intervalo. En el caso ideal seria conveniente que el intervalo tuviera dos propiedadesPROPIEDADES

2.4 Intervalos de confianza para m.La construccin de intervalos de confianza permite estimar el valor de un parmetro ante la imposibilidad de calcular el valor real. Mediante el uso de las funciones de distribucin derivadas del muestreo efectuaremos la estimacin cuando se muestrea de una poblacin que se distribuye normal, ya sea que se conozca o no la varianza poblacional. 2.4.1 Intervalo de confianza para m con varianza conocida (s2)Se X1, X2,...Xn una muestra aleatoria de una distribucin normal con media desconocida m. El inters es construir un intervalo de confianza de 100 ( 1 - a ) % para m con varianza conocida s2. La construccin de dicho intervalo se hace con base al mejor estimador de m, explcitamente la media muestral .

Se midi la resistencia a la ruptura por torcimiento de un cierto tipo de tela en un lote con los siguientes resultados (en psi): 182, 172, 176, 178. La desviacin estndar basada en la experiencia previa es de 5 psi, Encuentre un intervalo de confianza del 99% para la resistencia promedio de la ruptura por torcimiento del lote.

Un fabricante de fibras sintticas que desea estimar la tensin de ruptura media de una fibra. Disea un experimento para observar las tensiones de ruptura en libras, de 1 6 hilos del proceso seleccionados azar. Las tensiones son 20.8, 20.6, 21.0, 20.9, 19.9, 20.2, 19.8, 19.6, 20.9,.21.1, 20.4, 20.6, 19.7, 19.6, 20.3 v 20.7. Supngase que la tensin de ruptura de una fibra se encuentra modelada por una distribucin normal con desviacin estndar de 0.45 Libras. Construir un intervalo de confianza estimado del 98% para la tensin de ruptura promedio de la fibra.Respuesta [20.1196,20.6427]

2.4.2 Intervalos de confianza para m con varianza desconocida (s2) En esta seccin tratamos la forma de construir un intervalo de confianza para la media de una distribucin normal con varianza desconocida. Es necesario que el supuesto de normalidad es una restriccin que debe cumplirse para que las inferencias que realicemos sean vlidas. Es decir la calidad de nuestras inferencias ser funcin del tamao de muestra y de la semejanza de la distribucin de la poblacin de la cual se muestrea a la distribucin normal. Encontramos la distribucin de muestreo cuando la media m y la varianza s2 son desconocidos, la variable aleatoria tiene una distribucin t de Student con n - 1 grados de libertad. Si se toman valores ta/2,(n-1) y -t a/2,(n-1) en la distribucin t, con t(n-1) grados de libertad puede escribirse:

PASOSLos pasos para construir un intervalo de confianza para la media m de cuando no se conoce la varianza s2X, son: 1. Elegir el nivel de confianza (1 - a) al cual se desea realizar la inferencia, considerando que a mayor confianza elegida, mayor longitud de intervalo y por lo tanto menor precisin en la estimacin.2. Obtener el valor t a/2,(n-1) de las tablas de la distribucin t de Student.3. Efectuar el clculo de la media y desviacin estndar muestral.4. Calcular los extremos del intervalo. La interpretacin asociada al intervalo nos indica que con una confianza del 100 (1 - a)%, el intervalo calculado contendr al parmetro. Es decir a la media poblacional m.

Debido a la variabilidad en los descuentos por los automviles entregados a cambio, la ganancia por auto nuevo vendido por un distribuidor de automviles varia de uno a otro. Las ganancias por ventas (en cientos de dlares); registradas la semana pasada, fueron 2.1, 3.0, 1.2, 6.2, 4.5 y 5.1. Obtener un intervalo de confianza de 95% para la ganancia media por venta.Respuesta (1.684, 5.6825)

En un proceso qumico se han producido, en promedio 800 toneladas de cierto producto por da. Las producciones diarias para la semana pasada fueron 785, 805, 790, 793 y 802 toneladas. Estimar a partir de los datos la media de la produccin diaria con un coeficiente de confianza de 90 %.

Respuesta (787.0528, 802.947)

2.4.3 Intervalo de confianza para el parmetro de proporcin p cuando se muestrea una distribucin binomialSe menciono que una aplicacin importante del teorema del lmite central, es la aproximacin de distribuciones discretas a la normal cuando el tamao de muestra es suficientemente, grande. Entonces es posible construir un intervalo de confianza para una proporcin a travs de la variable aleatoria.

En trminos generales, un intervalo de 100(1-a) de confianza para p estara dado por

Si deseamos corregir por continuidad el intervalo de 100(1 a)% de confianza para p est dada por (pocos datos) pero recomendable

EJERCICIOSSe hizo un estudio en relacin con la ratificacin de un dirigente sindical. En respuesta a la pregunta "Si Votara por ratificar al dirigente?", hubo 250 respuestas si"; 125 , "no", y 75 respuestas indecisas. Halle una estimacin para la proporcin poblacional que votar por ratificar al dirigente utilizando un intervalo de confianza de 95%. Respuesta (0.5096,0.6014)

El departamento de anlisis de mercados de una compaa productora de caf instantneo realiz un estudio entre hombres casados para determinar la proporcin de stos que prefieren su marca. Veinte de 100 entrevistados contestaron afirmativamente. Utilice un intervalo de confianza del 95% para estimar la proporcin de todas los varones casados que prefieren la marca de caf instantneo. Respuesta (0.107,0.293)

CONTINUEN CON LOS EJERCICIOSUNIDAD 3 PRUEBAS DE HIPTESIS CON UNA MUESTRA

UNIDAD 3Pruebas de hiptesis con una muestra.

3.1 Metodologa para la prueba de hiptesis. 3.2 Hiptesis nula y alternativa. 3.3 Error tipo I y error tipo II. 3.4 Pruebas de hiptesis Z para la media (desviacin estndar poblacional conocida). 3.5 Pruebas para proporciones. 3.6 Seleccin del tamao de muestra ( para estimar la media poblacional). 3.7 Seleccin del tamao de muestra (para estimar la proporcin poblacional). HIPTESISHiptesis: es una aseveracin de una poblacin elaborado con el propsito de poner a prueba, para verificar si la afirmacin es razonable se usan datos.

Por tanto, la prueba de hiptesis es un procedimiento basado en la evidencia muestral y la teora de probabilidad; se emplea para determinar si la hiptesis es una afirmacin razonable.

3.1 METODOLOGA PARA LA PRUEBA DE HIPTESIS

3.2 HIPTESIS NULA Y ALTERNATIVA En estadstica, una hiptesis nula (Ho) es una hiptesis construida para anular o refutar, con el objetivo de apoyar una hiptesis alternativa. El planteamiento de la hiptesis nula siempre contiene un signo de igualdad con respecto al valor especificado del parmetro. Cuando se la utiliza, la hiptesis nula se presume verdadera hasta que una evidencia estadstica en la forma de una prueba de hiptesis indique lo contrario. El uso de la hiptesis nula es polmico.

PRUEBA DE HIPTESISEs un procedimiento, basado en la evidencia de la muestra y en la teora de las probabilidades, usado para determinar si la hiptesis es una afirmacin razonable y debera no ser rechazada o si no es razonable debera ser rechazadaHIPTESIS ALTERNATIVALa hiptesis alternativa (H1) es cualquier hiptesis que difiera de la hiptesis nula. El planteamiento de la hiptesis alternativa nunca contiene un signo de igualdad con respecto al valor especificado del parmetro.

3.3 ERROR DE TIPO I Y ERROR DE TIPO II Si rechazamos una hiptesis cuando debiera ser aceptada diremos que se ha cometido un error de tipo I, la probabilidad de cometer un error tipo I se denota por el smbolo . Por otra parte, si aceptamos una hiptesis que debiera ser rechazada, diremos que se ha cometido un error de tipo II, la probabilidad de cometer un error tipo II se denota por el smbolo . En ambos casos se ha producido un juicio errneo

PROBLEMAUna muestra aleatoria de 100 muertes registradas en Estados Unidos el ao pasado muestra una vida promedio de 71.8 aos. Suponga una desviacin estndar poblacional de 8.9 aos, esto parece indicar que la vida media de hoy en da es mayor que70 aos? Utilice un nivel de significancia de 0.05

SOLUCIN1.Se trata de una distribucin muestral de medias con desviacin estndar conocida.

Una empresa elctrica fabrica focos que tienen una duracin que se distribuye de forma aproximadamente normal con una media de 800 horas y una desviacin estndar de 40 horas. Si una muestra aleatoria de 30 focos tiene una duracin promedio de 788 horas, muestran los datos suficiente evidencia para decir que la duracin media ha cambiado?Utilice un nivel de significancia del 0.04. 1- /2Solucin:1. Se trata de una distribucin muestral de medias con desviacin estndar conocida.2. Datos: = 800 horas; = 40 horas; x = 788 horas; n = 30; = 0.04 3. Ensayo de hiptesisHo; = 800 horasH1; 800 horas

4. Regla de Decisin:Si 2.052 ZR 2.052 No se rechaza HoSi ZR < -2.052 si ZR > 2.052 Se rechaza Ho5. Clculos:

4. Regla de Decisin:Si 2.052 ZR 2.052 No se rechaza HoSi ZR < -2.052 si ZR > 2.052 Se rechaza Ho5. Clculos:

3.4 PRUEBAS DE HIPTESIS Z PARA LA MEDIDA (DESVIACIN ESTNDAR POBLACIONAL CONOCIDA) El Instituto Elctrico Edison publica cifras del nmero anual de Kilowatt-hora que gastan varios aparatos electrodomsticos. Se afirma que una aspiradora gasta un promedio mnimo de 46 kilowatt-hora al ao. Si una muestra aleatoria de 12 hogares que se incluye en un estudio planeado indica que las aspiradoras gastan un promedio de 42 kilowatt-hora al ao con una desviacin estndar de11.9 kilowatt-hora, esto sugiere con un nivel de significancia de 0.05 que las aspiradoras gastan, en promedio, menos de 46 kilowatt-hora anualmente? Suponga que la poblacin de kilowatt-hora es normal.

SOLUCIN1. Datos:m0 = 46 kilowatt-hora, s= 11.9 kilowatt-horax = 42 kilowatt-horan = 12, a= 0.05

2. Hiptesis:Ho: m 46 H1: m < 463. Estadstico de Prueba: Como la varianza de la poblacin es desconocida y el tamao de muestra es menor de 30 utilizaremos la distribucin t de Student en el clculo del estadstico.

2. Percentil: (11) t 0.95 1.7965.- Justificacin y decisin:Como 1.16 > -1.796, no se rechaza Ho y se concluye con un nivel de significancia del 0.05 que no existen suficientes evidencias para afirmar que el nmero promedio de kilowatt-hora que gastan al ao las aspiradoras sea menor de 46 KW la hora.t = ALFA, n-1

3.5 PRUEBAS PARA PROPORCIONES El MuestreoMuestreo es tomar una porcin de una poblacin como subconjunto representativo de dicha poblacin. Para que la muestra, al menos tericamente, sea representativa de la poblacin, debe seleccionarse siguiendo un procedimiento que permita a cualquiera de todas las posibles muestras del mismo tamao contenidas en la poblacin, tener igual oportunidad de ser seleccionada. Este procedimiento es el muestreo aleatorio

EJEMPLO El expendio Pollos Deliciosos asegura que 90% de sus rdenes se entregan en menos de 10 minutos. En una muestra de 100 rdenes, 82 se entregaron dentro de ese lapso. Puede concluirse en el nivel de significancia 0,01, que menos de 90% de las rdenes se entregan en menos de 10 minutos

3.6 SELECCIN DEL TAMAO DE MUESTRA (PARA ESTIMAR LA MEDIDA DE POBLACIN) Una empresa que se dedica a hacer en cuestas se queja de que un agente realiza en promedio 53 encuestas por semana. Se ha introducido una forma ms moderna de realizar las encuetas y la empresa quiere evaluar su efectividad. Los nmeros de encuestas realizadas en una semana por una muestra aleatoria de agentes son:53 57 50 55 58 54 60 52 59 62 60 60 51 59 En el nivel de significancia 0,05, puede concluirse que la cantidad media de entrevistas realizadas por los agentes es superior a 53 por semana? Evale el valor p.

UNIDAD 4Pruebas de hiptesis con dos muestras y varias muestras de datos numricos. UNIDAD 4Pruebas de hiptesis con dos muestras y varias muestras de datos numricos.

4.1 Introduccin. 4.2 Distribuciones normal y t de Student. 4.3 Pruebas de significancia. 4.4 Comparacin de dos muestras independientes: Pruebas t para las diferencias entre dos medias. 4.5 Prueba de Fisher para varianzas y de igualdad de las varianzas de dos poblaciones normales. 4.6 Comparaciones de dos muestras pareadas 4.7 Modelo totalmente aleatorio: anlisis de varianza de un factor. 4.8 Seleccin del tamao de muestra para estimar la diferencia de dos medias. 4.9 Aplicaciones4.2 DISTRIBUCIN NORMAL Y DISTRIBUCIN T DE STUDENTEn estadstica y probabilidad se llama distribucin normal, distribucin de Gauss o distribucin gaussiana, a una de las distribuciones de probabilidad de variable continua que con ms frecuencia aparece en fenmenos reales.La grfica de su funcin de densidad tiene una forma acampanada y es simtrica respecto de un determinado parmetro. Esta curva se conoce como campana de Gauss

En probabilidad y estadstica, la distribucin t (de Student) es una distribucin de probabilidad que surge del problema de estimar la media de una poblacin normalmente distribuida cuando el tamao de la muestra es pequeo.Aparece de manera natural al realizar la prueba t de Student para la determinacin de las diferencias entre dos medias muestrales y para la construccin del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviacin tpica de una poblacin y sta debe ser estimada a partir de los datos de una muestra.

La distribucin t de Student es la distribucin de probabilidad del cociente

DondeZ tiene una distribucin normal de media nula y varianza 1V tiene una distribucin chi-cuadrado con grados de libertadZ y V son independientes

Si es una constante no nula, el cociente es una variable aleatoria que sigue la distribucin t de Student no central con parmetro de no-centralidad .

4.3 PRUEBAS DE SIGNIFICANCIALas pruebas de significancia estadstica son un procedimiento que brinda un criterio objetivo para calificar las diferencias que se presentan al comparar los resultados de dos muestras, con el objetivo de explicar si dichas diferencias se mantienen dentro de los lmites previstos por el diseo estadstico (un error y una confianza esperados) o si, por el contrario, la diferencia entre ellas resulta lo suficientemente grande como para inferir que ha ocurrido un cambio real en el indicador

4.4 COMPARACIN DE DOS MUESTRAS INDEPENDIENTES: PRUEBAS T PARA LAS DIFERENCIAS ENTRE NORMALES.Para comparar las medias de dos muestras aleatorias procedentes de dos poblaciones normales e independientes, se utiliza el procedimiento Prueba T para muestras independientes, y para ello, se selecciona:

ANALIZARCOMPARAR MEDIASPRUEBA T PARA MUESTRAS INDEPENDIENTES

T student para 2 muestras independientesEJEMPLO DE 2 MUESTRAS SOBRE EL USO DE DIETA.H0: La media de peso inicial es igual en ambos gruposSe denotar por {X1, X2,...,Xn} e {Y1,Y2,...,Ym} al peso observado en cada uno de los sujetos sometidos a la dieta A y a la dieta B respectivamente. En general no se exigir que coincida el nmero de observaciones en cada uno de los grupos que se comparan, de modo que en el ejemplo n=40 y m=35.El t test para dos muestras independientes se basa en el estadstico:

Usualmente se toma como referencia el rango de datos en el que se concentra el 95% de la probabilidadOTRO METODO POR RANGOS

4.5 PRUEBA DE FISHER PARA VARIANZAS Y DE IGUALDAD DE LAS VARIANZAS DE DOS POBLACIONES NORMALES.