TemaI PlanCEMII

download TemaI PlanCEMII

of 64

Transcript of TemaI PlanCEMII

Autores: MSc. Daisy Espallargas y Jorge DEspauxINTRODUCCIONEl objeto de estudio de esta asignatura es desarrollar mtodos de Inferencia Estadstica, queservirnal alumnoparaenfrentarseensufuturocomo profesionales a situaciones que as lo requieran.Tal es el caso como: estimar parmetros poblacionales; Someter a pruebas supuestos hiptesis estadsticas; Hacer predicciones sobre el comportamiento de variables econmicas.Esta asignatura es eminentemente prctica, al igual que la Estadstica Matemtica I, sin embargo requiere del alumno conocimientos de la teora que la sustenta para la correcta aplicacin de los mtodos que la integran.Los requisitos necesarios para el estudio de esta asignatura estn contenidos en las asignaturas Anlisis Matemtico I y II, lgebra y Estadstica Matemtica I fundamentalmente, por lo que deben saber que les harn falta los conocimientos recibidos devariable aleatoria, valor esperado, las distribuciones: normal, t'student y Chi-cuadrado; muestreo aleatorio simple, estimadores, distribuciones muestrales e intervalos de confianza entre otros de mayor utilizacin.Objetivos de la Asignatura.En general los objetivos de la asignatura son los de desarrollar en el alumno habilidades en la aplicacin de mtodos estadsticos que servirn de herramientas ensuvida profesional, para lograr anlisis, modelacin y pronsticos de fenmenos econmicos. Plan Temtico de la Asignatura. Se ha realizado una distribucin en 15 semanas de la materia correspondiente a esta asignatura:Semana I .... Tema I. Prueba de Hiptesis: Conceptos Bsicos. Error Tipo I y II. Prueba de Hiptesis de media( ) , con Varianza( 2)conocida y desconocida.Pgina 4SemanaII...TamaoError TipoI yII. FuncindePotenciayTamaode Muestra Pgina 13SemanaIII.... Prueba deHiptesis de varianza( 2)yde proporciones (P). Pgina 26Semana IV...Prueba de Hiptesis de Diferencia de medias y diferencias de proporciones. Pgina 312Autores: MSc. Daisy Espallargas y Jorge DEspauxSemana V ....Bondad de Ajuste.PruebaJi-Cuadrado y Jarque-Bera.Pgina 45Semana VI...Dcima Ji-Cuadrado para verificar supuesto de independencia . Tablas de Contingencias. Pgina 59Semana VII .... Tema II. Anlisis de Varianza. Conceptos bsicos. Modelo de clasificacin Simple. Supuestos. Anlisis estadstico. Pgina 63Semana VIII.... Prueba ParcialSemana IXDcima de Barttlet. Construccin de la Prueba. Pgina 73Semana X .... Tema III. Anlisis de Regresin . Modelo de Regresin Lineal Clsico. Supuestos. Diagrama de Dispersin. Determinacin de la Ecuacin de Regresin. Pgina 78Semana XI.... Correlacin Lineal Simple. Prueba de significacin. Coeficiente de Determinacin. Pgina 89Semana XII....TemaIV. Anlisis deRegresinMltiple.Modelo de Regresin Lineal Mltiple con 2 variables independientes. Va Matricial. Pgina 105Semana XIII ...Intervalo de confianza de Yk y j . Pgina 113SemanaXIV.... UtilidaddelaEcuacindeRegresin. Pruebas Parciales. Pgina 121 SemanaXV....TemaVSeriesCronolgicas.ComponentesdelaSerie Cronolgica. Determinacin de la tendencia. Mtodo de los mnimos cuadrados y Medias Mviles. Pgina 130Semana XVI ....Determinacin de la componenteEstacional. Determinacin patrn de variacin esttica. Pgina 143Bibliografa Bsica de la asignatura. EstadsticaDra. Caridad Bustillo y otros Estadstica II Arstides Calero Anlisis de Regresin y SeriesLic. Juana Pupo y otros Cronolgicas. Econometra BsicaDamodar N. Gujarati Laboratorio de EstadsticaDra. Ermida Gonzalez y otros Matemtica II.3Autores: MSc. Daisy Espallargas y Jorge DEspaux Seleccin de tablas estadsticas Tema I Pruebas de Hiptesis.ConceptosBsicos.Errortipo IyII. Pruebadehiptesisdemedia( ) convarianza( 2) conociday desconocida.Bibliografa: Estadstica de Caridad Bustillo y otros. Capitulo 7 pginas 157/175La prueba de Hiptesis es parte de la toma de decisiones sobre la distribucin de una poblacin o sobre sus parmetros. Cuando se dice que se refiere a la distribucin de una poblacin de lo que se trata es de comprobar si realmente la distribucin que se tiene sigue una distribucin de Poisson, Normal, Binomial etc. y esto est dentro de las llamadas pruebas de hiptesisnoparamtricas, comotambinseencuentracomprobar si dos variables analizadas pueden considerarse sison independientes o no. Y la otra parte que se refierea la toma de decisiones sobre sus parmetros y es conocidacomoPruebadeHiptesisParamtricaloqueserefiereesal estudiodelosparmetrosdelapoblacincomoson: ,2, , y , entre otros, y es por donde comenzaremos el estudio de este Tema.Pruebas de Hiptesis Paramtricas.Dnde puede ser utilizada y para que? En la agricultura cuando se quiere conocer si un nuevo fertilizante aumenta el rendimiento o no. Enlaeducacincuandosequiereconocersi unmtododeenseanza determinado, aumenta la promocin o no. En el deporte cuando se quiere conocer si un estilo de juego mejora o no los resultados. En medicina cuando se quiere conocer si un medicamento disminuye o no el tiempo de restablecimiento de un paciente.En fin esta tcnica puede ser utilizada en cualquier rama de las ciencias.Cuando se trata de verificar si un conjunto de datos muestrales concuerda conunahiptesisH, secalcularel estadstico quemejor estimeelparmetro y por medio de la distribucin en el muestreo del estimador, se determinar entonces un valor crticoa partir delculla hiptesis Hser rechazada.4Autores: MSc. Daisy Espallargas y Jorge DEspauxEl procedimientoparadeterminar estevalor crtico, el cul generauna regin de rechazo que denotaremos por W se explicar posteriormente.Conceptos BsicosEn el proceso de someter a prueba una hiptesis siempre se plantearn dos hiptesis: Una hiptesis nula (Ho) y otra alternativa (H1)Hiptesis nula (Ho)es una hiptesis de diferencias nulas. En otras palabras es la hiptesis que contiene la igualdad, esto es:Ho: = o si fuera una dcima sobre la media poblacional, seraHo: o La prueba se construir de forma tal que permitir directamente aceptar o rechazar Ho.Hiptesis alternativa (H1)es la hiptesis que deber ser aceptada si Hoes rechazaday puede tomar cualesquiera de estas 3 formas:H1 : > o H1: < oH1: oPor lo general la hiptesis alternativa, representa la hiptesis de investigacin, laquesevaacontrastar; ylahiptesisnulalasituacin actual, la que existe, por lo tanto es donde siempre est la igualdad, nunca se puede presentar la igualdad en la hiptesis alternativa.De todo lo visto anteriormente se puede plantear que Hose formula con la intencin expresa de ser rechazada, ya que si Ho se rechaza, ello implica que H1 se acepta.Regin Crtica Regin de Rechazo(W).Se llama regin de rechazo al conjunto de valores del estadstico de prueba a partirde los cuales se rechaza la hiptesis nula.La distribucin del estadstico de prueba se divide en dos partes la regin de rechazoylaregindenorechazo, estandoseparadasestasporunvalor crtico (C), y su determinacin depender del tamao de la regin de rechazo y sta a su vez de la probabilidad de cometer el error tipo IUbicacin de la Regin crtica.La ubicacin en el grfico depende de H1, Y las mismas pueden ser unilateral (a la derecha o a la izquierda) o bilateral (a ambos lados).123 Si H1: > oSi H1:< o Si H1:o ///// \\\\\\\\\ ////------------------------------------------------------ ----------------------------C C C1 C2SiendoW: paracuando esconocidaenlas3situacionesanteriores respectivamente.(Deben fijarse que la Regin Crtica se corresponde con la hiptesis alternativa.)5Autores: MSc. Daisy Espallargas y Jorge DEspaux W = {(X1, X2, ...Xn /x>o + Z1 - / n}

W = {(X1, X2, ...Xn /x< o - Z1 - / n}

W = {(X1, X2, ...Xn /x>o + Z1 - /2 / nx o + t1- (n-1) S/n }

W = { (X1, X2, ...Xn ) / x < o - t1- (n-1) S/n} W = { (X1, X2, ...Xn ) / x > o + t1-/2 (n-1) S/ n x < o - t1-/2 (n-1) S/n }Errores a cometerAl tomar una decisin corremos el riesgo de cometer un error, es decir:Podemos rechazar Ho, siendo cierta Podemos aceptar Ho siendo falsa, puesbien, el 1ererrorseledenominaErrortipoI yal otroErrortipoII . La probabilidad de un error de tipo I, se conoce como y la probabilidad de un error de tipo II, se conoce como .Luego interesa medir las magnitudes de esos errores y tratar de que estas sean lo ms pequea posible o sea que la probabilidad de cometerlos sea lo suficientemente pequea.

(Rechazar Ho / o) ( W /o ) ( Aceptar Ho siendo falsa )( W/ R )Suponga que: Ho : 10 Y Suponga que: Ho : 10H1 : >10 H1 : < 10 _si R = 9 y W =[ X < 8 ]

6 Autores: MSc. Daisy Espallargas y Jorge DEspaux = 10 = 0.05 8 9 10Se plante que era inters reducir la magnitud de los errores, pero reducir la magnitud de ambos errores es imposible pues una disminucin en uno de ellos, provoca en general un aumento del otro. Observando la figura anterior se podr dar cuenta de lo planteado.Lasolucinestdadaenfijar laprobabilidaddecometer unodeellos, preferiblementelaprobabilidaddecometer el error deconnotacinms grave a un nivel aceptablemente bajo y tratar de hacer mnimo el otro.Generalmente se conoce como error ms grave, al error de tipo I. Se debe sealar que a estos dos tipos de errores se les llaman riesgo de los Productores () ydelos consumidores ( ). El riesgoderechazar una hiptesis verdadera, se le llaman riesgo de los productores, puesto que si la hiptesisserechaza, losartculosnosevendenyel productortieneuna perdida injustificada. Y la probabilidad de que artculos de mala calidad sean aceptados para la venta, es una probabilidad de perdida para el consumidorEl error tipo I se fija con un valor suficientemente pequeo,(de forma tal que si el estimador cae en esa zona, es porque realmente se debe rechazar H0 ; 0.05, 0.01) aceptableparael investigador. Aesteerrorselellamaenla pruebadehiptesis, Nivel designificacinyel cual seprefijaantesde construir laprueba. Yseledenominaas,nivel designificacinal valor mximo de la probabilidad de cometer el error tipo I cuando o, el cual se prefija antes de construir la prueba.El trmino de significacin se utiliza dado que conociendo el valor de , se podr determinar cul es el valor del estadstico de prueba a partir del cul la diferencia entre este y el parmetro se considera significativa.Regla de decisin:Es la reglaenqueseformula, loquese vaahacer partiendo del valor crtico (C) calculado. Esto es:para el primer caso de H1 Se rechaza Ho, para todo valor del estadstico de prueba que sea mayor que C y se acepta Ho , para todo valor del estadstico de prueba que sea menor o igual que C.En el segundo caso de H1 Se rechaza Ho, para todo valor del estadstico de prueba que sea menor que C y se acepta Ho, para todo valor del estadstico de prueba que sea mayor o igual que C.En el tercer caso de H1 (Bilateral, dos colas)Se rechaza Ho, para todo valor del estadstico de prueba que sea menor que C1 mayor que C2 y se acepta Ho para todo valor del estadstico de prueba que est comprendido entre C1 y C2.Debemossealarqueenel casoqueseacepteHo,nosedebeplantear categricamente que se acepta Ho sino no hay elementos para rechazar Ho ya que es ms aconsejable, si el estadstico de prueba cae en la regin de no rechazo (regin de aceptacin) plantear que no hay elementos para rechazar Ho, debido a que es mas factible refutar hiptesis que aceptarlasRecuerde que tal como se formulan las hiptesis y se realiza la prueba, se hace con la condicin expresa de rechazar Ho.7Autores: MSc. Daisy Espallargas y Jorge DEspauxToma de DecisinLadecisinsetomautilizandoel estadsticodeprueba quenosfacilitla muestra y si el mismo cae en la R.C. se rechaza Ho y por tanto se acepta H1; si cae en la Regin de no rechazo (de aceptacin) no existen elementos para rechazar Ho. Pasos a seguir en la construccin de una prueba de hiptesis Formulacin de la hiptesis nula y alternativa Eleccin del nivel de significacin ( ) Seleccin del estadstico de prueba (segn parmetro a realizar la prueba) Determinacin del Valor Crtico (C) Formulacin de la regla de decisin Toma de decisinVeamos un ejemplo: (Ejercicio 50 pgina 44 del Laboratorio)Enunafbricaseproducencuerdascuyaresistenciapromedioesde500 kgs. Con una desviacin tpica de 40kgs. El jefe de produccin plantea que conotramateriaprima, laresistenciapromediopuedeaumentarse. Para probar su planteamiento, se utiliz de forma experimental la nueva materia prima, tomndose una muestra de las cuerdas producidas, siendo el ama{o de la misma igual a 64, obtenindose kgs x 510 . Se pide realizar la prueba de hiptesis correspondiente para un 5% de significacin.Al enfrentarnosaunproblemadeestetipo, loprimeroquehacemosesanalizaraque parmetrolevamosahacerlaprueba, yestoestendependenciadeloquesevaa investigar.Enestecasoseplantea que conuna nueva materiaprima, laresistencia promedioPUEDEAUMENTARSE, esevidente quesetratade unaprueba dehiptesis de media ( ) pero... es con conocida o desconocida? Para ello lo segundo que hacemos es sacar la informacin que nos brinda el problema. =500 = 40n= 64 x = 510 = 0.05Apartirdelainformacin,2esconocida, portantodeacuerdoaun Teorema, vistoenlaEstadsticaMatemticaI quedicesi xN(;) entonces x N ( ; /n ).Luego sabemos que las frmulas para el clculo de la R.C. que utilizaremos sern las de la normal.Ya podemos comenzar con el 1er paso:Formulacin de las hiptesis nula y alternativa.Recordar que en H0 se plantea la situacin actual, la que existe, que es que la resistencia media es de 500 kgs.Y que en la H1 se plantea la situacin que se va a investigar que en este caso es que, con un cambio en la materia prima la resistencia promedio puede aumentar.H0 : = 500 esta hiptesis nos indica que laresistencia ser 500kgsaunque se pone la igualdad implica menor o igualH1: > 500 nos dice que con la nueva materia prima la resistencia pro-8Autores: MSc. Daisy Espallargas y Jorge DEspauxmedio aumenta.Nivel de significacin: = 0.05nos lo dice el problema, si no nos lo dan, nosotros lo ponemos, los que ms se utilizan son o 0.01 0.05. Estadstico de prueba: x = 510y sabemos que x N(500, 40/64)(que solo se utilizar para tomar la decisin)Regin crticaW = {(X1, X2, ...Xn /x > o + Z1 - / n}x = 500 + 1.64 (40 /64 ) = 500 + 1.64 (5)= 500 + 8.20 = 508.2 por lo tantoW = { x>508.2 }Se recomienda hacer el grfico y ubicar la R.C.Queremos sealar que el valor de Z, lo pueden buscar en la tabla que est en la pagina 17 de la seleccin de tablas estadsticas, donde aparecen dos distribucionesnormales, unaparaR.C. unilaterales(tienesombreadasolo una cola) y la otra para R.C. bilaterales (tiene sombreada dos colas).Se busca el nivel de significacin y tiene en la misma lnea el valor de Z que lecorresponde. Nosedebetomarel signoquetienelatabla, yaquela frmula tiene el signo, slo se toma el valor que le corresponde a Z.Regla de decisinSe formula de acuerdo al resultado de la R.C.Se rechaza Ho x > 508.2Se acepta H1 x 508.2Toma de la decisinComox= 510 que es > 508.2 cae en la R.C. por tanto Rechazo Ho lo que nos indica queaceptamos H1ypor tantollegamos alaconclusin que con la nueva materia prima la resistencia promedio puede aumentarse a un nivelde significacin del 5%.Al tomar esta decisin podemos cometerel error tipo I,rechazar algo que puede ser cierto. Es bueno significar que la R.C., no slo se pueden expresar basndose en el estadstico de prueba, sino tambin en funcin de la variable estandarizada Z (en este caso por supuesto, ya que la media sigue una distribucin normal) y as es como est desarrollada en la Bibliografa bsica de esta asignatura. Es convenientequeel alumnoseacapaz derealizar estas pruebas por cualquiera de las dos vas.Para tomar la decisin en funcin del estadstico Z, hay una pequea variacin a partir del 4to paso.Regin crticaSe determina buscando el valor de Z que corresponde segn tablaW = {.../Z > Z1 } W ={ .../Z> 1.64}9Autores: MSc. Daisy Espallargas y Jorge DEspauxRegla de decisinSe formula a partir del Valor Crtico determinado, y por tanto de ZRechazo Ho Z > 1.64Acepto Ho Z 1.64DecisinPara tomar la decisin se calcula el valor del estadstico Z utilizando el valor de xobtenido en la muestra. Zo = ( 510 - 500 ) / (40 /64)= 10 / 5= 2As el valor de Zo= 2 es> 1.64 por tanto caemos en la R.C. y se rechaza Ho, por lo que se acepta H1 a un nivel de significacin del 5% y se llega a las mismas conclusiones:que el cambio de materia prima puede aumentar la resistencia promedio de las cuerdas.Vamos a ver otro ejercicio, el que estudiamos anteriormente ilustra la situacin cuando la varianza de la poblacin es conocida, veamos un ejercicio que ilustra cuando la es desconocida.Debemos recordar de los Teoremas vistos en la Estadstica Matemtica Ique cuando: X N( , ?) si n >30 x N( , S/ n ) , en este caso se estima a travs de,ya que la muestra es grande. X N(, ?) si n < 30xt'student con (n-1) g.l.Ejemplo #2Laproduccinpromediodelechediariapor vacaenlaprovinciaenlos meses de verano ha sido en los aos anteriores de 10.1 litro. Este ao en una muestra simple aleatoria de 16 das de los meses de verano se obtuvo una produccin media diaria por vaca de 9.8 litros con una varianza muestral de1.21. Hayraznparaafirmarquehavariadolaproduccindeleche diaria promedio por vaca?. Considere distribucin normal y = 0.05Esta es una prueba paramtrica sobre media, ya que de lo que se trata es de verificar si ha tenido variacin la produccin diaria promedio de leche por vaca.La informacin que nos brinda el problema es la siguiente:= 10.1 = ? n = 16 x = 9.8 S2 = 1.21 S = 1.1Estamos en el caso en que se desconocela varianza poblacional(2 ) y n < 30, luego tenemos que trabajar con la distribucin t'student, para el clculo de la R.C.1.- Formulacin de las hiptesisHo: = 10.1H1: 10.1Aqu Honos expresa que la produccin promedio de leche es de 10.1 y H1 quelaproduccinpromediodelechevari, esdecir puedeser mayor menor.2.- Nivel de significacin = 0,053.- Estadstico de prueba. 10Autores: MSc. Daisy Espallargas y Jorge DEspaux x = 9.8, ya que es el mejor estimador de , la distribucin con la que vamos a trabajar es t'student, segn vimos anteriormente.4.- Determinacin del Valor Crtico de la Regin CrticaRecuerde que la misma est en correspondencia con la hiptesis alternativa. W = { (X1, X2, ...Xn ) / x > o + t1- /2 (n-1) S/n x < o - t1- /2 (n-1) S/n }Para buscar el valor de t, en la tabla primero tenemos que buscar( 1 - /2) esto es: si = 0.05 entonces /2 = 0.025 lo que implica que( 1 - /2) = 1 - 0.025 = 0.975 por lo tanto tenemos que buscar una t en: - t /2 (n-1) = t1- /2 (n-1)=t0.97515 = 2.13(-t0.02515 = -2.13)El manejo de la tabla est explicado en laEstadstica Matemtica IAs :x = 10.1 + 2.13 (1.1/16) = 10.1 + 2.13 (0.275)=10.1 t0.5858 x =10.6858;x= 9.5142 por lo tanto W=(9.5142 > x > 10.6858)5.- Regla de decisin Rechazo Hox < 9.5142 y> 10.6858 No Rechazo Ho (9.5142 x 10.6858)6.- Decisin x = 9.8> 9.51 y < 10.68 lo que hace que caiga en la regin de norechazo(regindeaceptacin), por lotantoconcluyoquenotengo elementos para rechazar Ho a un = 0,05, lo que implica que no ha variado la produccin de leche diaria promedio por vaca.El error que se pudo haber cometido es error tipo IIUtilizando el estadstico t'student., cambia a partir del paso 4.4.- Regin CrticaW = { t > 2.13 t < -2.13 }5.- Regla de Decisin RechazarHo t>2.13 t < -2.13No Rechazo Ho - 2.13 t 2.136.- Decisin Calculamos el estadstico t, a partir de los datos muestrales

to = ( x - ) /(S/ n )to = (9.8 - 10.1)/(1.1/16 )= - 0.3/0.275 = - 1.09to = - 1.09 > -2.13 y< 2.13 luego cae en la regin de no rechazo (regin de aceptacin), por tanto podemos concluirque no hay elementos para rechazarHoaunnivel designificacindel 5% loqueimplicaquenoha variado la produccinde leche diaria promedio por vaca. Observeque por los dos mtodos el resultado es el mismo. Los autores de esta Gua prefieren el primer mtodo.11Autores: MSc. Daisy Espallargas y Jorge DEspaux

Hastaaqu lamateriaplanteada, puedenestudiar enel librodetexto, (Estadstica) los ejercicios resueltos en l capitulo 7,ejercicios 7.4, 7.5, 7.6, 7.8y7.11enlas paginas desde164/173. Tambinpuedenhacer los ejercicios 19, 20, y 22Del LaboratoriodeEstadsticaMatemticaII, puedenhacerlosejercicios: 47(b), 49, 50, 51(a, b, c), 52(a, b, c, d), Desde la pgina 39 a 45, ejercicios de media con varianza conocida y el71(a), 72(a), 73(a), 74 y 75(a) desde la pgina 58 a la 61, ejercicios de media con varianza desconocida.A continuacin plantearemos un autoexamen de esta materia.AUTOEXAMEN1.- Explique,con sus palabras que significan los trminoshiptesis nula e hiptesis alternativa. 2.- Explique que nos indica el error tipo I y el error tipo II3.- Cul es la relacin decon el error de tipo I?4.- Cul es la relacin de con el error de tipo II?5.-Supngase que se conocen los resultados de una prueba de aptitud para la admisin a estudios de grado en Administracin de Empresas, los cuales tienen una distribucin normal con media de 500 y una desviacin tpicade 100. Si una muestra aleatoria de 12 solicitantes del Stephan College tiene una media muestral de 537 existe evidencia de que su resultado medio sea diferente de la media esperada de todos lossolicitantes? Use= 0.016.- La compaa Acero Valle Verde fabrica barras de acero. Entrega barras de acero con una longitud promedio de por lo menos 2.8 pies cuando el proceso funciona correctamente. De la lnea de produccin se selecciona una muestra de 25 barras. La muestra seala una longitud promedio de 2,43 pies y una desviacintpica de 0.20 pies. La compaa desea determinar sise necesita ajustar el equipo de produccin. Utilice un = 0.05 y diga que error pudo estar cometiendo con la decisin tomada.7.-Ladivisindeinspeccindel departamentodepesasymediasdela provincia Habana est interesada en confirmar la cantidad real de refrescos que se envasa en botellas de 2 litros, se conoce que = 2.02. La planta embotelladora ha informado a la divisin de inspeccin que se desconoce la desviacin tpica de la poblacin, y que al tomar una muestra aleatoria de 100 botellas, mostr un promedio de 1.99 litros y una desviacin tpica de 0.05litros. Esposibleconcluir quelacantidadpromedioenlasbotellas fuera menos de 2 litros? Utilice un = 0.018.- Una gran cadena nacional de electrodomsticos tiene una venta especial por fin de temporada de podadoras de csped. A continuacin se presentael nmerodepodadorasvendidasduranteestaventaenuna muestra de 10 tiendas:8 11 0 4 7 8 10 5 8 3Aun = 0.05Se puedellegar alaconclusin quesehaya vendidoun promedio de ms de 5 podadoras por tienda durante esta venta?Que suposiciones se requiere para realizar esta prueba?12Autores: MSc. Daisy Espallargas y Jorge DEspauxQue error se pudiera estar cometiendo con la decisin tomada? TemaI PruebasdeHiptesis. Tamaodel error tipoI ytipoII. Tamao de la muestra. Funcin de potencia.Bibliografa: EstadsticaII deArstidesCaleropaginas6ala30. Introduccin al Anlisis Estadstico. Dixon y Massey. Paginas desde 87 a 98 y de 240 a 250.Y en Teora y Problemas de Estadstica de M. R.Spiegel captulo 10 Paginas 168 a 171.Errores Tipo I y II, Funcin de Potencia.Error Tipo I Error Tipo I Tradicionalmente el estadstico de prueba controla al Error Tipo I, estableciendo el nivel de riesgo que est dispuesto a tolerar en trminos de rechazar una hiptesis nula verdadera.Unavezespecificadoel valorpara ,seconoceel tamaodela Regin Crtica o de Rechazo, puesto que es la probabilidad de rechazo de acuerdo a la hiptesis nula.Para el clculo del Error Tipo I, tenemos que partir de los valores de la regin de rechazo, es decir, el valor crtico, que es el que nos indica el inicio de esta regin de rechazo; y tambin el valor hipottico de la media poblacional. A partir de la siguiente frmula: ()oW x Para ver una aplicacin y el clculo de los Errores Tipo I y II, partiremos de una situacin determinada.El gerente de Distribucin de determinada fbrica, sabe que la oficina local de proteccin a los consumidores hace inspecciones peridicas para conocer si los pesos de los paquetes de cereal, producidos por su fbrica tienen el peso adecuado(el que establece los parmetros). El sabe que el empaque del proceso de llenado de los paquetes de cereales, est ajustado de forma tal que la cantidad de cereal por paquete sigue una distribucin normal con media de 368 gramos y la desviacin tpica de la poblacin es de 15 gramos. Parahacer los anlisis pertinentes, seseleccionunamuestraaleatoria tamao 25,calculndose el peso promedio el queresult igual a 367.6 ( x ).13Autores: MSc. Daisy Espallargas y Jorge DEspauxa) Haga la prueba correspondiente a un = 0.05, si se desea conocer si ha disminuido el peso promedio de los paquetes. Y diga que error pudo haber cometido y cul es su tamao.b) El gerente plantea que le interesa conocer de antemano, cual sera el riesgoquesepodracometeral rechazarHosi seconsideraqueel valor dec x 363.08)= 1 - P(x< 363.08) = 1 - P

,_

33 6 7 0 8 . 3 6 3Z = 1 - P

,_

39 2 . 3Z = 1 P( Z < - 1.306) = 1 FZ(-1.31) = 1 0.0951= 0.9049Este error nos est indicando que existe una probabilidad alta de considerar que el peso promedio no vara, cuando en realidad est variando. Loquenos indicaquecuandoel valor real estmuyprximoal valor hipottico, el tamao del error tipo II, va a ser muy grande y en consecuencia el error tipo I es bajo y eso es lo que al gerente le interesa que ocurra, ya que tomar la decisin de hacer un cambio en la lnea de llenado, 15Autores: MSc. Daisy Espallargas y Jorge DEspauxdebe hacerse cuandorealmenteseest seguro que esecambionosvaa proporcionar beneficios, por lo costosa que pudiera ser esta decisin, y slo se estar seguro de ello cuando el tamao del error tipo I es pequeo. b) Ahora vamos a ver cual ser el riesgo que cometeramos si pensamos qu podra haber un cambio en la media hipottica.. Consideraremos para ello que nuestra R. C.es para valores menores que 367. Cmosecalculael ErrorTipoI ( )?Cul serael tamaode ?Si el punto crtico W: { x < 367}que es el que suministr el Gerente de Produccin, partiendo del conocimiento que tiene de su planta, tendramos: (x R.C./ o) = P( x< 367/368)= P(Z < )3 368 367 = P(Z < - 1/3)= Fz (-0.33) = 0.3707 = 0.3707En este caso se obtiene una probabilidad alta del error tipo I, y el quisiera queestoocurracuandolomsimportanteparael Gerentefueraestar seguro de detectar los cambios que se podran producir en la media hipottica,que de hecho traera por consecuencia que disminuye el error tipo II, que mide que la media hipottica no ha cambiado, cuando en realidad si lo ha hecho.En muchas aplicaciones estadsticas el segundo tipo de error (error tipo II),no est controlado,peroaunentonces el que realiza el experimento debe estarenterado dela existencia deesteerror y tener una idea de lo grande que puede ser, ya que como dijimos, la probabilidad de que artculos de mala clase sean aceptados para la venta, es una probabilidad de perdida para el consumidor.EsteerrorsepuedegraficaryseobtienelaCurvaCaractersticade Operacin(curvas OC, corresponde a las iniciales de Operation Characteristic) de gran utilidad en tcnicas estadsticas.Este error es ms difcil de determinar su probabilidad, ya que la media de la poblacin puede tomar muchos valores, tantos como los que contenga la hiptesis alternativa, para lograr la curva caracterstica deben elegirse varios valores representativos, y la curva dar la posibilidad de evaluarlos riesgos que se derivan deno rechazar una hiptesis nula falsa, esdecirmuestralaprobabilidaddenorechazarunahiptesis nula falsa para cada valor posible del parmetro poblacional verdadero.Algunas consideraciones sobre los Errores Tipo I y IIPara un determinado tamao de muestra, quien deba tomar la decisin tiene que equilibrar los dos tipos de errores.16Autores: MSc. Daisy Espallargas y Jorge DEspauxYa sabemos que si se disminuye aumenta , esto grficamente es muy fcil de ver. 367 368 363.08Los valores para y dependen de la importancia de cada riesgo en un problemaenparticular. El riesgodeunerrortipoI,enel problemade llenadode los paquetesde cereales implica llegar a la conclusinque la cantidad promedio ha cambiado cuando en realidad no es as.El riesgodeunerror tipoIIimplicallegar alaconclusindequela cantidad promedio de llenado no ha cambiado, cuando en realidad si ha cambiado.As laseleccindelosnivelesquedebentenery dependedelos costos inherentes a cada tipo de error.Por ejemplo si fuera muy costoso hacer cambiar la lnea de llenado, entonces se querra estar muy seguro de que un cambio resultara beneficioso por lo que un error tipo I, pudiera ser lo ms importante y se mantendra muy bajo. Porotrapartesi sequiereestarsegurodedetectarloscambiosdeuna media hipottica, el riesgo de un error tipo II, sera lo ms importante y se seleccionara un nivel ms alto de .Claro que al aumentar el tamao de la muestra se podran controlar tanto como , pero siempre hay lmites en los recursos disponibles, de ah la necesidad de tomar en cuenta los pro y contra de cometer errores de tipo I y II.A estos dos tipos de errores se les llaman riesgos de los productores al error tipo I (y se considera el ms grave) y riesgos de los consumidores al error tipo II.Sin embargo considero que hoy por hoy dado el desarrollo de la Ciencia y la Tcnica ambos errores deben, con ms razn controlarse, y la nica forman de controlar los dos errores, es a travs del tamao de la muestra.Sin embargo decidir el tamao del error tipo I, no es muy difcil, teniendo en cuenta que la prueba de hiptesis se hace utilizando este error como significacindelaprueba, yquehabamos dichoquegeneralmentese 17Autores: MSc. Daisy Espallargas y Jorge DEspauxplantea que los valores que se le debe asignar son 0.05 y 0.01. Pero cmo elegir el tamao que debe tener el error tipo II?Esto sin embargo estar en funcin de la Potencia que queramos que tenga nuestra prueba y que de hecho siempre ser que la potencia de la prueba sea lo ms grande que se pueda ( que tambin se mide en probabilidad); y que veremos ms adelanteEs por ello que vamos a determinar que tamao debe tener la muestra para dos valores fijos de errores a cometer.Determinacin del tamao de la muestra basada en los errores y Al estudiar la Estimacin, concretamente en el caso de intervalos de confianzavimos comoeraposibledeterminar el tamaodelamuestra deseada para un nivel de confianza y error de muestreo especificado.Sinembargoenlatomadedecisiones comopor ejemplolapruebade hiptesis,suponiendo una prueba de una cola, se puede determinar en la forma siguiente el tamao necesario de la muestra: para un nivel de significacin deseado (0.05 0.01) pero cul ser el valor que se le debe dar a , esoestarendependenciadelaPotenciadelaPruebaque deseamos y que como ya se ha sealado debe ser lo ms grande posible, digamos que queremos que sea del 80%; y como la Potencia de la Prueba es igual a (1 - ), entonces esto nos estara marcando el valor que debe tener , que en este caso sera de 0.20.Por lo tanto consideraremos un = 0.05, un = 0.20, porque la potencia de la prueba sera la Probabilidad de rechazar Ho, cuando la media poblacional realmente es igual a 360 (es falsa).x = 150 = 368y1 = 360

( )( )2122 oxZ ZnDonde 2x = varianza de la poblacinZ = A la Z para un determinado nivel de significacin Z= A la Z que le corresponde a un determinado nivel de o = valor de la media poblacional bajo la hiptesis nula1 = valor de la media poblacional bajo la hiptesis alternativa(R)18Autores: MSc. Daisy Espallargas y Jorge DEspaux ( )( ) ( )22 622 . 216484 . 138381504 . 6 225848 . 2 225360 368) 84 . 0 64 . 1 ( 2252 2222 nEstoesserequieredeunamuestrade22paquetes, si el gerenteest dispuestoacorrerunriesgode0.05decometerel error TipoI yuna probabilidad del 80% de rechazar la Hiptesis nula de 368 gramos y detectar que la media verdadera se ha desplazado, realmente a 360 gramos. 360 363.08368 x - 1.64 para Zya que est en la cola izquierda de = 368 + 0.84 para Zya que esta es la cola derecha de = 360Nota:Esta frmula planteada para la determinacin del tamao de la muestra para controlar los dos tipos de errores se utiliza solamente para cuando se est trabajando, la determinacin del tamao de la muestra en pruebas de una cola a la izquierda. Y es necesario graficar los dos errores para conocer el signo que tendra la Z de ambos errores.Para no hacer esto se pudieran utilizar las siguientes formulas,que en su formulacin conllevaran el signo que le corresponde a la Z de cada error y son las siguientes:Para una cola a la derecha: H1: >( )21202) ( Z Z nRPara una cola a la izquierda: H1: Po H1: P< Po H1: PPo 1 W = { x1, x2, ...xn / p > Po + Z1 - p q n o o /}

2 W = { x1, x2, ...xn / p < Po - Z1- p q n o o / }

3 W = { x1, x2, ...xn / p > Po + Z1 - /2p q n o o / p < Po - Z1- /2 p q n o o / }Veamos un ejemplo:Se afirma que un lote de piezas contiene menos del 30%de piezas defectuosas. Paracomprobarloserevisan50piezasseleccionadasal azar del lote, entrelas cuales sedetectan10defectuosas. Hayraznpara mantener la afirmacin a un = 0.05?De que es esta prueba?Evidentemente es de proporciones, ya que lo que se est investigando es sobre la proporcin de piezas defectuosas.Cul es la informacin que nos proporciona el problema? El lote contiene menos del 30% de piezas defectuosas < de 0.3027Autores: MSc. Daisy Espallargas y Jorge DEspauxn = 50 piezasx= 10 piezas defectuosas = 0.05 por lo tanto p = x/n = 10/50 = 0.2yPo = 0.30Se considera una muestra grande siempre que n > 301.-Ho : P 0.30H1 : P < 0.302.-= 0.05

3.- p = 0.2 N(P,p q n o o / )

4.- W = { x1, x2, ...xn / p < Po - Z 1- p q n o o /} p = 0.30 - 1.64[ . ( . )] / 0 30 0 70 50 = 0.30 - 1.64 0 0042 . = 0.30 - 1.64(0.064) = 0.30 - 0.10496 = 0.19504 W = { ..../ p < 0.19504}Se les recomienda hacer el grfico para ver mejor la regin crtica y de aceptacin no rechazo. 5.- R.D. Rechazar Ho p < 0.19504 Acepto H0 p 0.19504

6.- D/ como p=0.2>0.19504(seaceptaHo) Nohayelementopara rechazar Ho que no se puede afirmar que el lote contiene menos del 30% de piezas defectuosas a un = 0.05 (contiene al menos 30% de piezas defectuosas)Utilizando el estadstico ZTendramos que Z0.95= 1.64 (Recordar usar la tabla de la pagina 17 para una sola cola)W = { .../ Z < -1.64} Siempre que sea < el valor de Z lleva signo negativo si fuera > el valor de Z lleva el signo + .R.D./ Rechazar Ho Z < - 1.64Aceptar Ho Z - 1. 64 D/ Z = ( p - P )/p q n o o / = (0.20 - 0.30)/0.064 = -0.10/0.064 = -1.5625 Z = - 1.5625 >-1.64 por tanto (acepto Ho) no se tienen elementos para rechazar Ho que la afirmacin no es cierta, el lote contiene al menos un 30% de piezas defectuosas a un = 0.05 28Autores: MSc. Daisy Espallargas y Jorge DEspauxDcimaparalavarianza( 2 ) deunapoblacincondistribucinnormal, y media desconocida.Yaestudiamosdcimaopruebadehiptesisdelamediaylaproporcin poblacional, ahora se va a estudiar la dcima de la varianza, ya que tambin es de intersdeterminar si la variabilidad del valor de una magnitud medida con determinado mtodo no supera ciertos lmites o si la varianza de esas medidas difieren o no de cierto valor dado, con lo que el problema se reduce a realizar una prueba de hiptesis de la varianza poblacional.Esta prueba se har bajo el supuesto de que se tiene una muestra aleatoria de tamao n procedente de una distribucin normal donde como vimos en la Estadstica I que (n - 1)S2/2 tiene una distribucin 2 (n - 1) .Por tanto y siguiendo el mismo anlisis anterior tendremos que:Estadstico de Prueba. En este caso ser S2 por ser el mejor estimador de2 ya travs de la distribucin 2 (n - 1).Regiones crticas.De la mismaforma secorresponde conlas hiptesis alternativas:1 2 3H1: 2 > 2 0 H1: 2 < 2 0H1: 2201 W = { x1, x2, ... xn/ S2 >(2o 2 (n - 1)1- )/n - 1}2 W ={ x1, x2, ... xn/ S2 (2 o2 (n - 1)1- /2)/n - 1 S2 < (2o 2 (n - 1) /2)/n - 1}Veamos un ejemplo:El precio en el mercado mundial de cierto producto A, durante el quinquenio 70-75 exhibi una variabilidad expresada en = 0.4 dlares. Una muestra aleatoriade30das correspondienteal quinquenio75-80recientemente publicada, mostr una desviacin tpica S =0.5 dlares. Hay razn suficienteparacreerqueel preciodedichoproductofuemenosestable durante el quinquenio 75-80 que durante el quinquenio 70-75?. Considere un = 0.05.Sobre que parmetro se va a realizar la prueba?La prueba se refiere ala varianza de la poblacin, ya que lo que se quiere investigar es laestabilidaddel precio, es decir lavariabilidadqueste present.Es bueno significar tambin que si esmenos estable mayor varianza29Autores: MSc. Daisy Espallargas y Jorge DEspaux ms estable menor varianzainformacin que nos da el problema:= 0.4S = 0.5 n = 30= 0.05.

1.- Ho : 2 = 0.16 H1 : 2>0.16 Ho nos indica que el precio del quinquenio 70-75 se mantiene en el 75-80 y H1nos indica que el precio del quinquenio 75-80 fue menos estable que eldel quinquenio 70-75.2.- = 0.05.3.- S2 utilizando para ello la distribucin 2 (n - 1)4.- W = { x1, x2, ... xn / S2 >(21-2 0)/(n-1)} Si= 0.05. entonces 1- = 0.95 por tanto tendr que buscar un 20.95(29) = 42.6luegoS2 = [42.6(0.16)]/29= 6.816/29= 0.235 por tanto W = { .../ S2> 0.235}Serecomiendagraficar lacurvaymarcar lasregionesderechazoyno rechazo a partir del valor crtico determinado.5.- R.D. Rechazo Ho S2 >0.235 Acepto Ho S2 0.2356.- S2 = 0.25>0.235 por tanto rechazo Ho a un = 0.05. Lo que implica queaceptoH1estoes, el preciodeProductoAesmenosestableenel quinquenio 75-80 que en el quinquenio 70-75.O tambin, utilizando el estadstico2 (n - 1)4.- W ={ .../ 2 > 20.95(29) }W = { 2 > 42.6}5.- R.D. Rechazo Ho 2 >42.6Acepto Ho 2 42.66.- 2 = [(n-1)S2]/ 2 = [29(0.25)]/0.16 = 7.25/0.16 = 45.3 > 42.6 por tanto se rechaza Ho, igual que por el desarrollo anterior, llegndose a las mismas conclusionesPueden hacer del laboratorio los sgtes ejercicios:30Autores: MSc. Daisy Espallargas y Jorge DEspaux 79/81, 83/87 a,b89/90 desde la pgina 63 a 68 correspondiente a dcima de proporciones; y 96a/99, 101 a,b /104 a ,105 y 116 a,b,c,y d; qu estn a partirdelapagina68yhastalapagina79correspondienteadcimade varianza.Autoexmen1.- A que es igual la proporcin muestral?2.- Enmuestra menor que 30se puede considerar que la proporcin muestral sigue una distribucin normal?3.- Se conoce que en una ciudad, la proporcin de hombres es de 0.40. Se supone que despus de la construccin de una gran industria, la proporcin de hombres aument. Para verificar este supuesto, se extrajo una muestra aleatoriadetamao100, resultandoquelamismaestintegradapor45 hombres y 55 mujeres. Se pide hacer la prueba para un = 0.054.- La cadena de tiendas Gaviota, recibe de una firma un embarque de cierta marca de bolgrafos baratos. El gerente comercial de la cadena desea estimar la proporcin de bolgrafos defectuosos; se toma una muestra aleatoria de 300 bolgrafos y se encuentran que 30 estn defectuosas. Se puede devolver el embarque si ms del 5%estn defectuosas. Sera probable que la proporcin de plumas defectuosas fuera superior a 0.05, y que pudiera devolverse el embarque?. Utilice un = 0.055.- Un fabricante de aparatos de televisin ha afirmado en su garanta que enel pasadosoloel 10%desusaparatosnecesitaronalgunareparacin durante sus dos primeros aos de funcionamiento. Para comprobar la validez deestaafirmacin, el Dpto. deControl delacalidaddel Ministeriodela Industria Ligera selecciona una muestra de 100 aparatos y encuentra que 14 deellosrequirieronalgunareparacindurantesusprimerosdosaosde funcionamiento. Utilizando un =0.01. Es vlida la afirmacin del fabricante o es probable que no lo sea?Tema I Prueba de Hiptesis. Prueba de hiptesis de diferencia de media con varianza conocida o no.31Autores: MSc. Daisy Espallargas y Jorge DEspauxBibliografa: Estadstica. Caridad Bustillo y otros. Capitulo 7 epgrafe 7.7 y 7.8 pagina desde la 186 a 191. y Teora y Problemas de Estadstica de M.R. Spiegel desde la pagina 171 a 172Prueba de hiptesis de diferencia de media con varianza conocida.Hasta ahora hemos venido desarrollando pruebas de hiptesis con relacin a si una media, una proporcin o una varianza eran iguales o no a un valor especfico, y los mismos se hacen a partir de una muestra de una poblacin y se comparan con el estadstico calculado correspondiente, sin embargo, no siempre estos procedimientos pueden resolver todos los problemas que se pueden presentar como por ejemplo si nos interesara: Conocer si existen algunas diferencias en la cantidad promedio de dos tipos de envases. Si quisiramossabersi existediferenciaenel consumodegasolina promedio de dos clases de automviles Osi querremosdecidir sobrelabasedemuestrassi loshombres pueden realizar cierta tarea con mayor rapidez que las mujeres. Si la dieta promedio de una pas es ms nutritiva que la de otro O si queremos decidir si una diferencia observada entre dos medias muestrales se puede atribuir al azarSupngase que se tienen dos poblaciones independientes cada una de ellas con una media y una desviacin tpica esto es:Poblacin A: A A Poblacin B:B B y por tanto la media y la desviacin estndar tpica, en la comparacin de dos medias vendr dada por: B A x x =A -B B A x x =BBAAn n2 2 +donde A, B, A y B son las medias y las desviaciones estndares tpicas de las dos poblaciones de las queseefectael muestreo, aladesviacintpicadeestadistribucin muestral seacostumbraadenominrselecomoelerror estndar de la diferencia entre dos medias. La prueba tambin puede ser de dos colas o de una cola, en dependencia de lo quesise estprobandoesquelasdos medias delaspoblaciones son diferentes o si una media es mayor, menor que la otra. As las hiptesis sern: H0: A = B A - B = 0 H1: A >B A - B > 0

H0: A B A - B 0 H1: A < B A - B < 032Autores: MSc. Daisy Espallargas y Jorge DEspaux H0: A B A - B 0 H1: A B A - B 0As podemos decir que cuando se realiza una prueba sobre la igualdad de las medias de dos poblaciones, en la hiptesis nula lo que se hace es afirmar quelas medias delas dos poblaciones soniguales, yel propsitoque persigue la prueba es reunir suficientes evidencias para descartar esta afirmacin y rechazar la hiptesis con una probabilidad pequea de error, de ah que la hiptesis alternativa tome las formas tal como se han planteado en dependencia de lo que se va a investigar sobre las poblaciones.Constituir el estadstico de prueba la diferencia entre las medias de las dos poblaciones calculadas, como sabemos para determinarsi esta diferencia es grande o pequea se calcula la distribucin muestral para este estadstico y as tomar la decisin.Ladistribucinmuestral paraladiferenciadelasmediasparamuestras grandes, nAynBmayor oigual que30, corresponde aladistribucin Normal, bajo los supuestos:1.- Las observaciones de las dos muestras son independientes2.- Los tamaos de las muestras son ambas 30 o mayor.Las regiones crticas estarn en correspondencia con las hiptesis alternativas planteadas es decir:W: { .../BBAAB An nZ x x2 21) ( + }W: { .../BBAAB An nZ x x2 21) ( + }W: { .../( )BBAAB ABBAAB An nZ x x n nZ x x2 22 / 12 22 / 1) ( + + }33Autores: MSc. Daisy Espallargas y Jorge DEspauxEl estadsticousadoparadeterminarladiferenciaentrelasmediasdela poblacin est basado en la diferencia entre las medias de las muestras (B A x x ) . Siendo el estadstico:BBAAB An nx xZ2 2 +En la mayora de las situaciones prcticas en que se desconocen, ( )2 2B A y , se debe hacer la estimacin,sustituyndolas por las varianzas muestrales( )2 2B AS y S .Queremos sealar que la desviacin tpica de la diferencia de medias:( )BBAAx xn nB A2 2 + es conocida como error estndarVeamos algunos ejemplos:1. En un estudio se quiere probar si existe alguna diferencia entre las alturas promedio de las mujeres adultas nacidas en dos pases distintos, muestras aleatorias dieron los resultados siguientes: 62 . 2 8 . 61 15050 . 2 7 . 62 120 BBBAAAS x nS x nDonde las medidas se dan en pulgadas. Use un nivel de significacin del 5% para probar la hiptesis nula de que las medias de la poblacin correspondientes son iguales contra las hiptesis alternativas de que no son iguales.1. H0:A = BH1:A B 2. = 0.053. (B A x x ) =62.7- 61.8=0.9Comolas muestras songrandes, se considera que ambas poblaciones son normales y se estiman las varianzas de las poblaciones a travs de las varianzas muestrales. Adems consideramos que las muestras son independientes4. W:{..../ (B A x x ) > Z1- /2BBAAnSnS2 2+ (B A x x ) < - Z1- /2BBAAnSnS2 2+Z1-/2 = 1.96 para un = 0.05 para 2 colas segn tabla de la pagina 173138 . 0 0985 . 0 0457 . 0 0528 . 015086 . 612025 . 6 + + por tanto Z1- /2BBAAnSnS2 2+= 1.96(0.3138)= 0.6150 y - Z1- /2BBAAnSnS2 2+= - 0.615034Autores: MSc. Daisy Espallargas y Jorge DEspauxW:{ (B A x x ) > 0.6150 (B A x x ) < - 0.6150}5. Rechazo H0 para todo valor de (B A x x ) > 0.6150 < - 0.61506. Decisin como (B A x x )= 0.9 > 0.6150 se rechaza H0 que aceptamos H1 es decir que las medias de las poblaciones son diferentes a un = 0.05. Por lo que la estatura de las mujeres adultas, nacidas en dos ciudades son diferentes.Tambin podramos aprender ahallar la probabilidad para tomar la decisin a partir de las probabilidades, para ello retomemos el clculo de Z88 . 215062 . 21205 . 28 . 61 7 . 622 2 2 2+ B AAB aB AnSnSx xZB As el rea bajo la curva normal a la derecha de z =2.88 es decirP(z > 2.88) = 1 - 0.9980 = 0.0020 y a la izquierda z = -2.88 seraP(z < 2.88) = 0.0020 de modo que el valor de la probabilidad es 0.0040 por lo que se puede decir que como P t1- /2B An nS1 10+ (B A x x ) < -t1- /2B An nS1 10+t1- /2( ) ( )21 12 2 + + B AB B A An nS n S nB An n1 1+=40Autores: MSc. Daisy Espallargas y Jorge DEspaux( ) ( )( )( ) 5234 . 336 6325 . 0 3259 . 230 31 . 24 . 0 53050 31 . 2 4 . 0842440031 . 2 4 . 08600 , 170 800 , 25331 . 251518650 , 42 4 450 , 63 431 . 2 + ++Este mismo valor se obtiene para una t = -2.31; resultando -336.5234Por lo tanto la regin crtica ser:W:{(B A x x )>336.5234(B A x x ) 336.5234 o (B A x x ) < -336.5234No rechazo H0 -336.5234 < (B A x x )< 336.5234Decisin: como (B A x x ) = 430 > 336.5234 rechazo H0 que acepto H1 por tanto se puede concluir que existen diferencias entre las dos minas = 0.05 Ejerciciosquepuedenhacer: del LaboratoriodeEstadsticaMatemticaII del 119 al 122 y del 124 al 126 que estn en las paginas desde la 80 a la 83.Autoexamen1.- Enunestudioparaprobarsi existe algunadiferenciaentrelasalturas promedio de las mujeres adultas nacidas en dos pases distintos, muestras aleatorias dieron los resultados siguientes:nA = 1205 . 2 7 . 62 AA S xnB =150 62 . 2 8 . 61 BB S xdondelasmediassedanenpulgadas. Useel nivel 0.05paraprobar la hiptesis nuladequelas medias delapoblacincorrespondientes son iguales contra la hiptesis alternativa de que no son iguales.2.- Enunainvestigacindelostiemposdereparacindedosclasesde equipo de fotocopiado obtuvieron estos valores de los datos:Tipo de equipo Nmero de trabajos de reparacinTiempos de reparacinMedia Desviacin estndard1 60 84.2 19.42 60 91.6 18.841Autores: MSc. Daisy Espallargas y Jorge DEspauxTodos los tiempos se dan en minutos. Pruebe en el nivel 0.01 de significacin si la diferencia entre estas dos medias muestrales es significativa.3.- Lassiguientessonlascalificacionesenel examenestatal deciencias socialesparamuestrasaleatoriasindependientesdeadolescentesdedos preparatorias.Escuela A: 78848178768379758581Escuela B: 85758387807988948782Use el nivel de significacin igual a 0.05 para probar la aseveracin de que losestudiantesdelaescuelaAtienenunmejor promedioquelosdela escuela B. 4.- Para aprobar la aseveracin de que la resistencia de un cable elctrico se puedereducir alosumo0.050ohms mediantelaaleacin., 35valores obtenidosparauncableestndardieron ohms S y ohms x 004 . 0 135 . 011 y 35 valores obtenidos para un cable aleado dieron ohms S y ohms x 005 . 0 082 . 022 Qu podemosconcluir acercade la aseveracin,sila probabilidad de un error tipo I debe ser como mximo 0.01?5.- En la comparacin de dos clases de pintura, un servicio de pruebas de consumo encontr que cuatro latas de un galn de una marca cubrieron en promedio 514 pies cuadrados con una desviacin estndar de 32pies cuadrados, mientras que cuatro latas de un galn de otra marca cubrieron enpromedio487piescuadradosconunadesviacinestndarde27pies cuadrados. Useel nivel 0.05designificacinparaprobar si ladiferencia entre las dos medias muestrales es significativas.Tema I Prueba de Hiptesis. Prueba de hiptesis de comparacin de proporciones.Bibliografa: Estadstica II de Arstides Calero pagina 81 a 86.Teora y Problemas de Estadstica de M.R. Spiegel pagina 172Al igual que vimos en las medias, hay ocasiones que nos interesa conocer si una diferencia observada entre dos proporciones muestrales se puede atribuir al azar o si es que nos est indicando que las proporciones de las poblaciones correspondientes no son iguales. Supongamos que nos interesa decidir,con base a datosmuestrales, siexistealguna diferencia entrelas personas vacunadas o no contra la Hepatitis B, de las que contraen esta enfermedad.42Autores: MSc. Daisy Espallargas y Jorge DEspauxParaellopartiremos detomar las muestras(estapruebaes vlidapara muestras grandes) de dos poblaciones de la siguiente forma: suponga que xA y xB son los nmeros de xitos obtenidos en nA intentos de una clase y nB de otra clase, todos los intentos son independientes y las probabilidades correspondientessonrespectivamentepAypBentoncesladistribucindel muestreo de( )B Ap p tiene la media PA - PB y la desviacin estndarigual a:

( )( )

,_

+ B Ap pn nP PB A1 11 donde P es la proporcin combinada de la muestra, y que es igual a:B AB AB AB B A An nx xn np n p nP++++ Generalmente a esta expresin se le conoce como el error estndar de la diferencia entre dos proporciones.La prueba puede ser tambin de dos colas de una cola, en dependencia de loqueseestprobandosi lasdosproporcionesdelaspoblacionesson diferentes o si una proporcin es mayor que la otra o viceversa.Esto es:H0: PA = PB H1: PA > PBH0: PA = PB H1: PA < PBH0: PA = PB H1: PA PB Las regiones crticas estarn en correspondencia con la hiptesis alternativa planteadas:W: ( ))'

,_

+ B AB An nP P Z p p1 11 /1 43Autores: MSc. Daisy Espallargas y Jorge DEspauxW: ( ))'

,_

+ B AB An nP P Z p p1 11 /1 W:( ) ( ))'

,_

+ + B AB AB AB An nP P Z p p n nP P Z p p1 11 1 11 /2 /12 /1 Siendo P: B AB AB AB B A An nx xn np n p nP++++ El estadsticode pruebaparala diferencia de las proporciones dedos poblaciones est basado enla diferencia entre las proporciones delas muestras( )B Ap p y su determinacin es a partir de:BBBAAAnxp ynxp Y el estadstico Z vendr dado por la siguiente expresin:

( )B AB An nP Pp pZ1 11 + Por lo general no es til comparar dos proporciones poblacionales, usando muestras pequeas, ya que esta prueba no es lo suficientemente sensible como para detectar una diferencia cuando se usan muestras pequeas.Ahora veamos un ejemplo:Paraprobar laefectividaddeunnuevoanalgsico, seadministra80 pacientes de una clnica una pldora que contena el analgsico y a otros 80 se les dio una tableta que slo contena azcar. Si 56 de los pacientes del primer grupoy38del segundogruposintieronunefectobenfico, qu podemos concluir, a un nivel de significacin de 0.01, acerca de la efectividad del nuevo medicamento?Solucin:44Autores: MSc. Daisy Espallargas y Jorge DEspauxPudiera considerarse el primer grupo como A y el segundo grupo como BDe acuerdo a las caractersticas del problema se denota que es una prueba de diferencia de proporciones, por lo tanto el parmetro que se va a someter a prueba es el de diferencia de proporciones.1.- H0 : PA = PB H1 : PA > PB Planteamos mayor porque consideramos que la efectividad debe encontrarse en el Grupo A que son los tratados con el nuevomedicamento, yaquelosdel segundogrupo fueron tratados con pldoras de azcar.1. = 0.012. ( )B Ap p = 225 . 0801880388056 sigue una distribucin normal4. W:( ))'

,_

+ B AB An nP P Z p p1 11 /1 Determinemos P:475 . 08038 7 . 08056 BBBAAAnxp ynxp5875 . 01609416038 56 +++++B AB AB AB B A An nx xn np n p nP( )( )025 . 0640016080 8080 80 1 1 ++

,_

+B AB AB An nn nn nEl valor de Z, segn la tabla de la pagina 17, para una cola es: Z = 2.33Ya estamos en condiciones de sustituir los valores en la frmula de la Regin crtica para determinar el valor crtico. ( )B Ap p ( ) ( )( ) 1812 . 0 778 . 0 33 . 2 0060 . 0 33 . 2025 . 0 ) 41 . 0 59 . 0 33 . 2 w:{ ( )B Ap p > 0.1812}5.- RD/ Rechazo H0 ( )B Ap p > 0.1812No rechazo H0 ( )B Ap p 0.18126.-D/ ( )B Ap p = 0.225 >0.1812 Rechazar H0lo que que aceptamos H1 por lo que podemos concluir que las tabletas que contienen el analgsico es 45Autores: MSc. Daisy Espallargas y Jorge DEspauxms efectiva que las que contienen el azcar a un nivel de significacin del 1%.Pueden hacer los siguientes ejercicios del Laboratorio: desde el ejercicio 132 al 135, 137 y 138. que estn en las paginas desde la 86 a la89Autoexmen1.- Un mtodo de generacin de nubes tuvoxito en 57 de 150intentos, mientras que otro mtodo tuvo xitos en 33 de 100 intentos. Podemosconcluir, enel nivel designificacin0.05, queel primer mtodo es mejor que el segundo?2.-Enunamuestraaleatoriade250personasquenotomarondesayuno, 102 reportaron que experimentaron fatiga a media maana y en una muestraaleatoriade250personasquedesayunaron, 73informaronque experimentaronfatigaamediamaana. Useunnivel designificacinde 0.01paraprobarlahiptesisdequenohayningunadiferenciaentrelas proporciones de la poblacin correspondiente contra la hiptesis alternativa dequelafatigaamediamaanaesmscomnentrepersonasqueno desayunan.3.- Un estudio demostr que 74 de 200 personas que vieron un desodorante anunciado durante la transmisin de un partido de bisbol y 86 de otras 200 personas que lo vieron anunciado en un programa de variedades recordaban el nombredel desodorantedoshorasmstarde. Useel nivel 0.05de significacin para probar si la diferencia entre las dos proporciones de muestra, 43 . 02008637 . 020074 y, es significativa.4.- Auna muestra aleatoria de 100 estudiantes de preparatoria se le pregunt si recurrira a sus padres en busca de ayuda para hacer una tarea de matemticas y a otra muestra aleatoria de 100 estudiantes de preparatoriaseleshizolamismapreguntaenrelacinconunatareade ingls. Si 62estudiantes delaprimeramuestray44estudiantes dela segunda recurriesen a sus padres en busca de ayuda, pruebe en el nivel de significacin0.05si sepuedeatribuir al azar ladiferenciaentrelasdos proporciones muestrales.5.-El propietario de un taller de reparaciones automotrices debe decidir cul de dos mquinas vendedoras de refrescos debe instalar en su sala de espera paraclientes. Seprobcadamquina200ylaprimerafall(nosirviel refresco ni devolvi el dinero) 11 veces, mientras que la segunda mquina 46Autores: MSc. Daisy Espallargas y Jorge DEspauxfall 6 veces. Pruebe en el nivel de significacin 0.05 si la diferencia entre las proporciones de la muestra correspondientes es significativa. 6.-Entre500 solicitantes dematrimonio,seleccionadas alazarhacedoce aos, 48 de las mujeres eran por lo menos un ao mayores que los hombres y entre 500 solicitudes de matrimonio seleccionadas despus, 85 de las mujeres eran por lo menos un ao mayores que los hombres. Use el nivel de significacin 0.05 para probar si hay un incrementoreal enlaproporcindemujeresdelassolicitudesde matrimonios que por lo menos tenan un ao ms de edad que los hombres.7.- Un investigador mdico desea estudiar como reaccionan ratas machos y hembras a la inyeccin de cierta sustanciatxica. Si 72 de 200 ratas machos y 49 de 200 ratas hembras tuvieron una reaccin aguda a la inyeccin, pruebe aun nivel de significacin de 0.01, si el porcentaje real perteneciente para las ratas machos excede el de las ratas hembras.Pruebas no ParamtricasTema I Prueba de Hiptesis. Dcima dela Bondad de Ajuste para verificar supuesto de Normalidad.Bibliografa: Estadstica de Caridad Bustillo y otros. Capitulo 7 epgrafe 7.10 paginas 201/208.Dentro del Tema Prueba de Hiptesis, la prueba que se explicar a continuacin, es la nica no paramtrica.Existenmuchosproblemasdondeel intersdel investigadorsecentraen contrastar hiptesissobrecomosedistribuyeel nmerodesucesosque pertenecen a ciertas categoras. Tiene gran importancia el poder conocer si ungrupodedatossigueonounadistribucinnormal. Laprueba2es adecuadaparadar solucinaestetipodeproblema, peronolanica, existen otros estadsticos, como son Kolmogorov-Smirnov y el Jarque y Bera entre otros.Vamos a comenzar por estudiar la prueba 2Por ejemplo, considresequeexistenk categoras yqueseplanteala hiptesis dequeencadacategora, los sucesos sepresentanconuna determinada frecuencia ei con una determinada probabilidad Pipara i = 1,2, ...k .Para probar esta hiptesis, se toma una muestra aleatoria de tamao "n" y en dicha muestra se obtiene para cada categora, las frecuencias observadas Oi .47Autores: MSc. Daisy Espallargas y Jorge DEspauxLa prueba persigue el contraste entre las frecuencias esperadas (ei) planteadasenlahiptesisnulaylasobservadasenlamuestra(Oi). Si la hiptesis nula es cierta entonces se debe esperar que no existe diferencias significativas entre ei y Oi .Suponiendo que existen k categoras y que se obtenga una muestra aleatoria de tamao n, tal que, cada observacin pertenezca a una y solo una categora, entonces el estadstico de prueba se define cmo:2 = (Oi - ei )2 / eiel que2 (k-1) siempre que Oi =ei = nLa hiptesis nula a verificar:Ho: P1, P2, ...Pkaparecenexplcitamenteparacadacategoralas probabilidades con que se espera aparezca cada resultado

kei = npi y W = { (Oi - ei )2 / ei > 2 (k-1)1- }

i=1Deser ciertoHoel estadsticodepruebadeberestar cercanoacero, mientrasquesi Hoesfalsael estadsticodepruebacrecer, alejndose significativamente de cero.Una aplicacin muy importante de la prueba Chi-Cuadrado es la de verificar si en una muestra aleatoria, la variable observada se ajusta a una distribucin de probabilidad especifica, por ejemplo si la variable se distribuye segn la ley Normal, de Poisson, Binomial, Exponencial etc. Esta prueba recibe el nombre de Prueba de Bondad de Ajuste.Y en la misma la hiptesis nula se planteara:Ho: x ( , )etc.H1 : x no sigue una distribucin...El estadstico de prueba sera: 2 0 = (Oi - ei )2 / ei 2 (k-1-m)donde m = al nmero de parmetros que son necesarios estimar para poder calcular las pi , En Poisson lo que se estima es un solo parmetro ( ) y en la normal dos parmetros( , ).Las frecuencias observadas (Oi ) se obtienen de la organizacin de los datos en tablas de frecuencias, Oi ni(frecuencias absolutas simples) mientras que ei = npi siendo pi la probabilidad de ocurrencias para cada valor posible de x, bajo el supuesto de que Ho sea cierta y debindose cumplir que :

k pi =1

i=1Condicin necesaria para poder utilizar estas probabilidades. ( k el nmero posible de valores de x, esto es clases o categoras)Para realizar esta prueba deben cumplirse las siguientes restricciones:Si k = 2, ninguna frecuencia esperada (ei) debe ser < 5Si k > 2, solo el 20% de las frecuencias esperadas (ei ) debe ser < 548Autores: MSc. Daisy Espallargas y Jorge DEspauxNinguna frecuencia esperada (ei ) debe ser < 1En tales casos, esta situacin se resuelve agrupando categoras adyacentes, cuando las agrupacionestienen sentido.Veamos un ejemplo A partir de la muestra siguiente, verifique para un nivel de significacin del 5% si la misma procede de una poblacin normal.10 12 13 14 15 22 28 30 30 2910 11 15 10 15 26 26 28 27 2916 16 20 17 18 30 28 27 26 3019 20 17 18 20 29 26 26 28 2920 19 19 18 17 27 27 26 26 2817 16 23 24 23 27 31 32 33 3321 22 22 21 22 29 33 33 32 3124 23 24 23 21 35 32 31 38 3924 23 20 21 21 34 37 41 39 4124 24 23 21 22 31 38 36 36 40YaconocemosdelaEstadsticaMatemticaI queladistribucinnormal tiene dos parmetros que son y2,Por tanto tenemos que estimarlos a travs de x y de S2, que son los dos mejores estimadores que tenemos de esos parmetros poblacionales.Comolosdatosestnensuformaprimaria, ynopodemosdefinirsi son discretoscontinuosynoinformanquetipodevariableses;perosi son muchos datos (100), entonces debo formar intervalos de clases para organizar la informacin y me sea ms fcil realizar cualquier tipo de clculo.Ya sabemos como se forman los intervalos, pero para estos casos, donde se va a probar normalidad, es aconsejable hacer los intervalos de una forma especifica.La distribucin normal tiene propiedades donde para cualquier valor de y2 , se cumple que: ----0.6826---- ------------0.9544------------- ---------------------0.9998----------------------_\______\______\_____|_____/______/______/_ -3 -2 - + +2 +3 Estoesqueel reabajolacurvadesde -3 hasta+3 ocupaun 99.98%; queel reabajolacurvadesde -2 hasta +2 ocupaun 49Autores: MSc. Daisy Espallargas y Jorge DEspaux95.44%yqueel reabajolacurvadesde - hasta + ocupaun 68.26%.

Por lo que se sugiere, que los intervalos en que se agrupen los datos cuando sevaaprobar si losmismossiguenunadistribucinnormal seanestos mismos, ya que esto facilitara el clculo de las pi.Para ello debemos siempre primero estimar y que son los parmetros que definen esta distribucinEn este ejercicio: xi = 2500; (xi -x )2 = 5420 Y sabemos quex= xi/ n yS2 = (xi -x )2/n-1por tanto la media y varianza poblacional estimada estar dada por: x = 2500/100 = 25 y S2 = 5420/99 = 54.75 S = 7.4As entonces tendremos: ______\______\_____|_____/______/______ x-2s x-sx

x+s x+2s 10.217.62532.4 39.8Z -2 -1 0 12 ZBuscando la probabilidad a partir dela funcin de distribucin y a partir de sus propiedades, que recordamos son:P (x xk) = F(x) P( x >xk) = 1 - F(x) P(xo 39.8) = 1 - P{ x 39.8} = 1 - P{ z 2} = 1 - Fz (2) = 1 - 0.9772 = 0.0228quedando entonces:0.0228 0.1359 0.3413 0.34130.1359 0.0228______\______\______|______/______/______

x-2s x-sx x+s x+2s Ventajasdeestecriteriodeagrupacin: queparacualquier conjuntode datos, las pi para los 6 intervalos que se definen siempre sern las mismas.Estoquieredecir quenohayquecalcular estasreas, siemprequelos intervalosquehagamosseanlamediamenos2desviacionestpicas, la media menos una desviacin tpica, la media, la media mas una desviacin tpica y la media ms dos desviaciones tpicas.Queremos recordar adems que en este caso que le hemos dado tratamiento de variable continua, no importa que se ponga menor menor igual o mayor mayor igual para el clculo de la funcin de distribucin.IntervalosOi pi ei x 10.23 0.02282.2810.2 17.614 0.1359 13.59 17.6 25 34 0.3413 34.132532.433 0.3413 34.1332.4 39.814 0.1359 13.59x > 39.82 0.02282.28 Ahora debemos comprobar todas las restricciones que deben cumplirse: pi = 1se cumple 0i = ei en este caso 0i = ei = 100 tambin se cumpleNinguna frecuencia esperada debe ser 39.8 22.28Despus de agrupar, para hacer cumplir las restricciones tenemos que:51Autores: MSc. Daisy Espallargas y Jorge DEspauxk=5; m=2(nmerodeparmetrosqueseestiman, enel casodela distribucin normal siempre hay que estimar la media y la desviacin tpica poblacional).Ya estamos en condiciones de calcular 2 020 = (17 - 15.87)2/25.87 + (34 - 34.13)2/34.13 + (33 - 34.13)2/34.13 + (14 - 13.59)2/13.59 + (2 - 2.28)2/2.28 = 0.13743(est muy prximo a cero)Planteemos las hiptesis:Ho : x N ( ,)H1 : xno sigue N ( ,)Estadstico de Prueba:20 = 0.13743La regin crtica quedar: W = { 2 > 2 1-(k-1-m) } = { 2 > 2 0.99(2)} = { 2 > 9.21}La Regla decisin:Rechazar Ho 2 > 9.21 AceptarHo 2 9.21Decisin:20 = 0.13743 quees ( ) 2 21 No Rechazar H0 JB( ) 2 21 Si el valor de p computado es > no se rechaza H0Asimetra(Skeroness) y ynSnii

,_

131

( )3311niiy ynSen esta formula representa el estimador sesgado de la desviacin estndar poblacional, es decir:

( )n y ySi2Se debe sealar que este estadgrafo mide la deformacin de una distribucin, seplanteaquesi es igual acero, es simtrica, tieneuna distribucinnormal, perosi da positivo, nos est indicandoquetieneuna cola o deformacin a la derecha, y si nos da negativo, entonces la deformacin o cola est a la izquierda.Kurtosis

,_

niiy ynK141 ( )4411niiy ynKEn lo que respecta a este estadgrafo,elmismo mide el apuntamiento de una distribucin, generalmente se plantea que si K =3, entonces la distribucinesapuntadacomolanormal, yselepuededenominarcomo mesocrtica, si K >3, entonces se dice que es ms apuntada que la normal o sencillamente apuntada y se le denomina leptocrtica , y si K < 3, entonces 53Autores: MSc. Daisy Espallargas y Jorge DEspauxse dice que es menos apuntada que la normal o sencillamente achatada y se le denomina platicrtica.Debe sealarse que el Damodar, Texto de Econometra, muy conocido por los estudiantes, utiliza como frmula del estadstico de prueba la expresin siguiente:JB = ( )1]1

+24362 2K SnA continuacin vamos a ver un ejercicio:A partir de los siguientes datos, utilizando la prueba de Jarque Bera, determine si los mismos siguen una distribucin Normaly ( ) y yi( )2y yi( ) / y yi( ) [ ]3 / y yi ( ) [ ]4 / y yi2 -6.1 37.21 -1.1469 -1.5086 1.73023 -5.1 26.01 -0.9589 -0.8817 0.84553 -5.1 26.01 0.9589 -0.8817 0.84554 -4.1 16.81 0.7709 -0.4581 0.35316 -2.1 4.41 0.3948 -0.0615 0.02438 -0.1 0.01 0.0188 0.0000 0.000010 1.9 3.61 0.3572 0.0455 0.016312 3.9 15.21 0.7332 0.3942 0.289014 5.9 34.81 1.1093 1.3650 1.514219 10.9 118.81 2.0493 8.6063 17.636981 0 282.90 6.6141 23.2550Comencemos hacer los clculos necesarios:( )3188 . 5 29 . 281090 . 2821 . 81081.2 n y yS ynxxii(Estimador sesgado de )Ahora determinemos la Asimetra:( ) 66194 . 0 6194 . 6101113

,_

niiy ynS, lo que no est indicando que tiene una ligeradeformacinaladerecha, si fueraautilizar esteestadgrafopara analizar simetra, sin formar parte del estadstico Jarque-Bera de Normalidad.Determinemos ahora la curtosis o apuntamiento:( ) 3255 . 2 2550 . 23101114

,_

niiy ynKlo que nos indica que est ligeramente ms achatada que la distribucin normal, esto es si lo estuviera determinando a el slo y no para ser utilizado en Jarque Bera.Ahora sustituiremos en el Estadstico de Prueba, correspondiente: JB=( ) ( ) ( ) ,_

+ ,_

+ ,_

+2 2 2 2 26745 . 0414382 . 0 6667 . 1 3 3255 . 24166194 . 06103416K Sk n54Autores: MSc. Daisy Espallargas y Jorge DEspauxJB=( ) ( ) ( ) 55194 . 0 6667 . 1 11374 . 0 4382 . 0 6667 . 1 4550 . 0414382 . 0 6667 . 1 + ,_

+JB = 0.9199183H0 : yi NH1:yi no sigue una normal= 0.05JB = 0.9199183( ){ }2 21: J B Westo es 2 en 0.95 con 2 grados de libertad = 5.99, por tanto W: {JB > 5.99} RA

RC5.99RD/Rechazo H0 JB > 5.99No Rechazo H0 JB 5.99D/ JB = 0.9199183 < 5.99 No tengo elementos para rechazar H0 que la variable sigue una distribucin normal a un = 0.05A continuacin vamos a mostrar este ejercicio resuelto a travs del programa de cmputo Eview, y comparemos los resultados:012340.0 2.5 5.0 7.5 10.0 12.5 15.0 17.5 20.0Series: PRUEBASample 1 10Observations 10Mean8.100000Median 7.000000Maximum 19.00000Minimum 2.000000Std. Dev.5.606544Skewness0.662006Kurtosis2.325505Jarque-Bera0.919981Probability0.63129055Autores: MSc. Daisy Espallargas y Jorge DEspauxComovenenel mismoseobtienelosvaloresdelamedia, ladesviacin tpica(insesgada), laasimetra, lacurtosis, yel estadsticoJarque-Bera, y todos coinciden con los clculos que acabamos de ver.Solo debemos agregar, y que ya fue planteado, la decisin tambin se puede tomar utilizando la Probabilidad, que proporciona el resultado anterior, y se debe cumplir que: Si la probabilidad es mayor que el valor de designado, entonces no se rechaza H0, lo que implica que la muestra sigue una distribucin normal.Veamos algunos ejemplos donde se presentarn las salidas de mquina para su interpretacin(Ejercicios de este tipo no estn en el Laboratorio).1. Las cuotas anuales de una muestra de 40 compaas para un seguro de $25000 para hombres de 35 aos de edad son las siguientes:82 85 86 87 87 89 89 90 91 9192 93 94 95 95 95 95 95 97 9899 99 100 100 101 101 103 103 103 104105 105 106 107 107 107 109 110 110 111Pruebe si la variable anterior se distribuye normalmente. Use un = 0.052. Los ingresos netos por cosecha para 50 estados de una nacin en 1996, fueron los siguientes:5952 13647 8681 11771 4963 10207 8043 4626 5119 289263855 10630 5332 9378 4543 7627 8972 4845 8621 540539362 6644 2304 5992 11177 8992 6480 10452 2290 27899692 4438 6859 7000 12292 23811 6824 9922 4973 930027611 19106 8441 12543 6695 7657 9554 7683 3904 241Rechazara Ud. al nivel de significacin del 1% que la muestra anterior proviene de una poblacin normal?3. Dada la muestra siguiente:10 12 13 14 15 22 28 30 30 2910 11 15 10 15 26 26 28 27 2916 16 20 17 18 30 28 27 26 3019 20 17 18 20 29 26 26 28 2920 19 19 18 17 27 27 26 26 2817 16 23 24 23 27 31 32 33 3321 22 22 21 22 29 33 33 32 3125 23 24 23 21 35 32 31 38 3925 25 20 21 21 34 37 40 39 4024 24 23 21 22 31 38 36 36 40Verifique para un 5% si la misma procede de una poblacin normal.56Autores: MSc. Daisy Espallargas y Jorge DEspaux4. Los siguientes datos son los lapsos en minutos, necesarios para que 50 clientes(seleccionados aleatoriamente) de un banco comercial, lleven a cabo una transaccin bancaria:2.3 2.4 3.3 1.8 7.8 3.1 2.4 0.4 4.2 6.30.2 4.4 9.7 4.7 0.8 3.7 4.6 1.3 1.2 7.62.9 5.8 2.5 0.7 0.9 7.2 3.8 1.1 0.5 1.40.4 2.8 5.6 6.2 0.4 1.6 1.5 5.5 6.8 0.52.8 3.3 9.5 1.2 1.3 1.9 2.7 3.4 5.2 1.4Pruebe para un = 0.01 si la variable Xi se distribuye segn la ley normal.5. La demanda diaria, en unidades de un producto, durante 30 das de trabajo seleccionados aleatoriamente es:38 35 76 58 48 5967 63 33 69 53 5128 25 36 32 61 5749 78 48 42 72 5247 66 58 44 44 56Al nivel de significacin del 5% Rechazara Ud. el supuesto de normalidad para la variable Xin?6. Los pesos(en libras) de 40 estudiantes de una Universidad seleccionados aleatoriamente aparecen a continuacin:138 164 150 132 144 125 149 157 146 158140 147 136 148 152 144 168 126 138 176163 119 154 165 146 173 142 147 135 153140 135 161 145 135 142 150 156 145 128Aceptara UD. al nivel del 1% que los pesos de los estudiantes de dicha universidad se distribuyen normalmente?57Autores: MSc. Daisy Espallargas y Jorge DEspauxSalidas del Programa EVIEW para probar normalidad a travs del estadstico Jarque-Bera.1.0246880 85 90 95 100 105 110Series: SEGUROSample 1 40Observations 40Mean97.90000Median 98.50000Maximum 111.0000Minimum 82.00000Std. Dev.7.811235Skewness -0.116275Kurtosis2.008609Jarque-Bera1.728224Probability0.4214262.010203040500 50000 100000 150000 200000 250000Series: INGRESOSSample 1 50Observations 50Mean14282.74Median 7670.000Maximum 238111.0Minimum 241.0000Std. Dev.33811.32Skewness6.042449Kurtosis40.10034Jarque-Bera3171.834Probability0.0000003. 0246810120 130 140 150 160 170 180Series: ESTUDIANTESSample 1 40Observations 40Mean146.8000Median 146.0000Maximum 176.0000Minimum 119.0000Std. Dev.13.05059Skewness0.181406Kurtosis2.736333Jarque-Bera0.335255Probability0.84566958Autores: MSc. Daisy Espallargas y Jorge DEspaux4.0246810 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40Series: YSample 1 100Observations 100Mean25.00000Median 25.00000Maximum 40.00000Minimum 10.00000Std. Dev.7.399154Skewness0.071274Kurtosis2.457714Jarque-Bera1.309973Probability0.5194495.024680 1 2 3 4 5 6 7 8 9 10Series: CLIENTESSample 1 50Observations 50Mean3.260000Median 2.750000Maximum 9.700000Minimum 0.200000Std. Dev.2.481935Skewness0.863321Kurtosis2.935511Jarque-Bera6.219685Probability0.0446086.012345625 30 35 40 45 50 55 60 65 70 75 80Series: DEMANDASample 1 30Observations 30Mean51.50000Median 51.50000Maximum 78.00000Minimum 25.00000Std. Dev.14.16832Skewness -0.002849Kurtosis2.212712Jarque-Bera0.774818Probability0.67881359Autores: MSc. Daisy Espallargas y Jorge DEspauxAUTOEXAMEN1.- Para que se utiliza la dcima de bondad de ajuste.?2.- Cualessonlasrestricciones quesetieneencuentaparaaplicar la distribucin2 a esta prueba no paramtrica?3.- Cmo se plantearan las hiptesis en este tipo de prueba?4.-Cmo se calculan las frecuencias esperadas?5.- Es necesario al calcular las pi que estas sumen 1? Por que?6.- Una muestra aleatoria de 500 acumuladores para automviles mostr la siguiente distribucin: de la duracin en aos de los acumuladores.Intervalos ni0a 2122a 4944a 61706a 81888a10 2810a12 8Pruebe a un = 0.05, si dicha distribucin sigue una distribucin normal. Utilice la prueba de 2.7.- La corporacin SIMEX, tiene varios miles de trabajadores por horas. La analistadelacorporacin, quieredeterminarsi ladistribucinnormal se puede utilizar para describir la escala de salarios por hora de la corporacin. Selecciona una muestra aleatoria de trabajadores por hora y se registran sus salarios. La analista encontr que la media y la desviacin tpica muestral son $8.00 y $0.78 respectivamente. Para un = 0.05, determine si la escala de salario por horas de la corporacin sigue una distribucin normal, a partir de la prueba de 2.Intervalosni 10.3413 5608.- No es necesario plantear ejercicio para probar la normalidad por Jarque-Bera, ya que se presentaron 6 anteriormente.60Autores: MSc. Daisy Espallargas y Jorge DEspauxDcima Ji-Cuadrado para verificar supuesto de Independencia. Tablas de Contingencia.Bibliografa. Estadstica de C. Bustillo. capitulo 7 epgrafe 7.10 pgina 208Otro problema que requiere de una prueba estadstica, es el de contrastar el supuesto de independencia estadstica entre dos variables aleatorias (x,y).Esta prueba puede ser aplicada para variables cualitativas cuantitativas. Las dos variables sobre las que se plantea la hiptesis de independencia se clasificarn en categoras o clases.Se denotar por "k" a la cantidad de categoras en que se clasifica la variable "Y" y por "r" a la cantidad de categoras de la variable "x"As en una muestra de "n" observaciones, los datos sern clasificados en "k x r" grupos, tal como aparece en la tabla que mostramos a continuacin y que en estadstica se denominaTabla de contingencia de r filas y k columnas. FRECUENCIAS OBSERVADAS (Oi j ) X \ YY1Y2. . . . . . . . . . . . . . YkTotales ni . X1O11 O12. . . . . . . . . . . . . .O1kn1 . X2O21 O22. . . . . . . . . . . . . .O2kn2 .. . .. . . . . . . . . . . . . . .. . .. . . . . . . . . . . . . ... . .. . . . . . . . . . . . . .. XrOr1 Or2 .. . . . . . . . . . . . . Ork nr .Totales n. jn.1n. 2. . . . . . . . . . . . . . n . knComo se observa, se denota por:X : tiene "r" categoras (X1, X2, .....Xr )Y : tiene "k" categoras (Y1, Y2, .....Yk)Oi j : # de veces que se observa la combinacin Xi con Yj donde : i : indica las filas ( i = 1, 2 ... r) j : indica las columnas (j = 1, 2, ... k)n i . : # de veces que se observa X (sin interesar la clasificacin de Y)n . j : # de veces que se observa Y (sin interesar la clasificacin de X)

r kdonde ni . = Oi j y n. j= Oi j

i = 1j = 1Debe sealarse, que al igual que en el caso de la Bondad de Ajuste, en este caso de la verificacin del supuesto de independencia, existe la restriccin quesedebe considerar quenadamssepuede admitirceldasdondelas frecuencias esperadas sean menores que 5, en el orden del 20%, situacin que se puede resolver uniendo celdas adyacentes, ya que de no cumplirse esta restriccin este 20no se podra considerar una buena aproximacin del ( )( ) ( ) 1 1 21 k rLas hiptesis nula y alternativa podran ser:61Autores: MSc. Daisy Espallargas y Jorge DEspauxHo : X, Y son estadsticamente independientesH1 :X, Y estn relacionadaso tambin:Ho : Pi j = PiPj

H1 : Pi jPi PjdondePi j: representalaprobabilidaddequeel elementoobservado pertenezca a la clase (i, j)Pi : que el elemento observado pertenezca a la clase "i" de la variable XPj : que el elemento observado pertenezca a la clase "j" de la variable YLas frecuencias esperadas se calcularn:eijn Pijn PiPjPininPjn jneijn ninn jneijnin jn ( ) ( )..(.)(.)(.)(.)y comoEl estadstico de Prueba) 1 )( 1 ( 2) 1 (1j2)j j(12 r kkjieieiori Regin Crtica:W:{ } o21 -2 (k- 1)(r- 1) Veamos un ejemplo: Una muestra aleatoria simple de 300 estudiantes UniversitariosqueestudianEstadstica, arrojlossiguientesresultadosen las evaluaciones de esta asignatura. Evaluacin (Y)X (Sexo)2 34 5TotalHembra 27\30.685\77.4 50 \54 18\18180Varones 24\20.444\51.6 40 \36 12\12120 Total 51 129 90 30300Podemos afirmar basndonos en estos datos, que en la poblacin de los estudiantes universitarios que estudian Estadstica la evaluacin no depende del sexo? Utilice un nivel de significacin de 0.05.Solucin:r = 2 nmero de filas (sexo)k = 4 nmero de columnas (evaluaciones)n = 300Ho: La evaluacin es independiente del sexo62Autores: MSc. Daisy Espallargas y Jorge DEspauxH1: La evaluacin depende del sexo6 . 30300) 180 ( 51 . . 1 . .. 111 nnen jninijeneeeeeeen nnn nnn nnn nnn nnn nnn nn211122 1133 1144 1222 2233 2244 22 51 12030020 4129 18030077 490 1803005430 18030018129 12030051690 1203003630 12030012 .. .. .. .. .. .. .. ( ).( ).( )( )( ).( )( )El valor queseencuentradespus deladiagonal es el valor esperado calculadoPor tanto el valor de o ser:o2+++++++ ( . ).( . ).( ) ( ) ( . ).( . ).( ) ( ) 27 30 630 685 77 477 450 545418 181824 20 420 444 51651640 363612 12122 2 2 2 2 2 2 220 = 3.665R:C: W:{ 20 > 2(2-1) (4-1)0.95} = {20 > 7.81}R D./Rechazar Ho 20> 7.81AceptarHo 20 7.81D/ o= 3.67 7.81 por tanto se puede decir que no existen elementos para rechazar Ho lo que implica que hay independencia entre el sexo y las evaluacionesdelos estudiantesuniversitarios, esdecirlaevaluacines independiente del sexo a un nivel de significacin del 95%.Pueden hacer los ejercicios que estn en el laboratorio desde el 158 hasta el 165, que estn en las pginas desde la 97 hasta la 102, del Laboratorio de Estadstica Matemtica II. Autoexamen 63Autores: MSc. Daisy Espallargas y Jorge DEspaux1.- Por qu no se debe resolver la prueba Ji-cuadrado para la independencia cuando las frecuencias esperadas en algunas celdas sean menores que 5?2.- Qu accin se puede llevar a cabo en estas circunstancias que permitan analizar esos datos de la tabla de contingencia?.3.-El Directorde Mercadotecniadeunacompaade televisinpor cable est interesado en determinar si hay alguna diferencia en la proporcin de hogares que contratan el servicio de cable por televisin, sobre la base del tipoderesidencia(viviendasparaunasolafamilia, viviendaspara2o4 familias y casas de departamento). Una muestra aleatoria de 400 hogares mostr lo siguiente:Tipo de Res.TC cableUna sola familiaDe 2 a 4 familiasCasa de Apartamenton i. Si94 3977210 No56 3698190n.j 150 75175400A un = 0.01 Podra considerar que hay relacin entre la contratacin de Servicios de TV por cable y el tipo de residencia?4.- Una gran Corporacin esta interesada en determinar si existe asociacin entre el tiempo que le toma a sus empleados trasladarse al trabajo, y el nivel deproblemasrelacionadosconel Stressobservadoenlosmismos, con vistaasituarleunmnibus, si estosecomprueba. Unestudiode116 trabajadores de la lnea de montaje revel lo siguiente: Stress Tiempo Viaje Alto Moderado Bajo Ni.Menos de 15 mts 9 51832De 15 a 45 17 82853Mas de 45 18 6731n.j 441953 116 A un = 0.01 Determine si hay relacin entre el tiempo de viaje y el stress.Dentrodel TemadePruebadehiptesisqueacabamosdeestudiar, se vieron las pruebas de hiptesis de medias, varianzas, proporciones, diferenciademedias ydiferencia deproporciones tambinestnlade diferencia de varianzas de dos poblaciones que no la estudiamos, que tambin tiene una gran utilizacin prctica, pero que con los conocimientos alcanzados hasta aqu bien pudieran utilizarla en caso necesario.64