Estadistica II Cibertec

download Estadistica II Cibertec

of 213

description

El manual hecho para los alumnos sepan aprovechrlos , gracias

Transcript of Estadistica II Cibertec

Estadstica II 2CARRERAS PROFESIONALESCIBERTEC ESTADI STI CAI I 3 CIBERTECCARRERAS PROFESIONALES

ndice Presentacin05 Red de contenidos06 Sesiones de aprendizaje SEMANA 1:Definiciones bsicas: Poblacin, marco muestral, muestra, censo y muestreo: Ventajas y desventajas Diseo de la encuesta por muestreo. Tipos de muestreo Distribuciones muestrales 07 SEMANA 2:EstimacinPuntual.Propiedadesdeunestimador. Estimacin de intervalos de confianza Intervalosdeconfianzaparalamediaconvarianza conocida, muestra grande Tamao muestral para estimar una media Intervalodeconfianzaparaladiferenciademediasde dosdistribucionesconambasdesviacionesestndar conocidas, muestras grandes 19 SEMANA 3:Intervalodeconfianzaparalamediaconvarianza desconocida. Muestra pequea Intervalo de confianza para la diferencia de medias con varianzas desconocidas pero iguales, muestras pequeas 35 SEMANA 4:Intervalodeconfianzaparaunaproporcin.Muestras grandes Tamao muestral para estimar una proporcin Tamao de muestra para poblaciones finitas Intervalo de confianza para la diferencia de proporciones 45 SEMANA 5:Hiptesisestadstica.TiposdeerroresIyII,Nivelde significacin,Regincrticaoreginderechazo.Regin de aceptacin Prueba de Hiptesis para medias, muestras grandes. Prueba bilateral de una hiptesis sobre la media Prueba unilateral de una hiptesis sobre la media, caso I, caso II Prueba de Hiptesis para la diferencia de medias. Desviacin estndar conocidas, muestras grandes 55 SEMANA 6:Prueba de Hiptesis para medias, muestras pequeas Prueba bilateral de una hiptesis sobre la media Prueba unilateral de una hiptesis sobre la media, caso I, caso IIPrueba de Hiptesis para la diferencia de medias Desviacin estndar desconocidas, Muestras pequeas 73 4CARRERAS PROFESIONALESCIBERTECSEMANA 7:EXAMEN PARCIAL SEMANA 8:PruebadeHiptesisparalasproporciones,muestras grandes. Pruebabilateraldeunahiptesissobrelas proporcionesPrueba unilateral de una hiptesis sobre la media, caso I, caso II PruebadeHiptesisparaladiferenciaentredos proporciones 87 SEMANA 9:Definicin del x (Chi cuadrado). Ensayos de significacinPrueba de homogeneidad, prueba de independencia Prueba de bondad de ajuste. Tablas de contingenciaPrueba de Kolmogorov-Smirnov Correlacindeyatesparalacontinuidad.Coeficientesde contingencia 103 SEMANA 10:AnlisisdeRegresinlinealSimple.Variableindependiente, variable dependiente Diagrama de dispersin. Mtodo de mnimos cuadrados Rectademnimoscuadradosentrminosdevarianzas muestrales Rectaderegresindemnimoscuadrados.Aplicacine interpretacin 123 SEMANA 11:Anlisis de Regresin lineal mltiple Recta de regresin de mnimos cuadrados Aplicacin e interpretacin 135 SEMANA 12:Anlisis de Regresin no lineal: Cuadrtica Anlisis de Regresin no lineal: Potencial Anlisis de Regresin no lineal: Exponencial Anlisis de Regresin no lineal Logartmica 149 SEMANA 13:Correlacin entre dos variables, dependiente e independiente Coeficiente de correlacin lineal (frmula de Pearson) 163 SEMANA 14:Coeficiente de correlacin generalizado (Coeficiente de determinacin) Coeficiente de correlacin gradual (frmula de Spearman) 173 SEMANA 15:Serie de tiempo. Introduccin a la serie de tiempo Representacin y Clasificacin de la serie de tiempo Anlisis de la serie de tiempo 185 SEMANA 16:Modelos de estimacin. Mtodos de estimacin de la tendencia Prediccin mediante la serie de tiempo 199 ESTADI STI CAI I 5 CIBERTECCARRERAS PROFESIONALES

Presentacin Laglobalizacinhacreadouncampomuyextensodedesarrolloparalos nuevosprofesionales, yaseaenserviciosoenproduccin.Esporestoque tienenqueestarpreparadosparaenfrentarcualquierretoenelcampo laboral.Lascomunicacionesyelsoftwarehanhechoqueenlaactualidad todoprofesionalestenconstantecontactoconlainformacinestadstica. Msan,muchasvecesesnecesariorealizaralgunamedicinestadstica paratenerunaideaacercadelaproduccindeunaempresa,delmercado burstil a nivel mundial, del precio de los metales en el mercado Europeo, el controldeepidemias enzonasdeterminadas,elcontroldelospreciosdela canastafamiliar,etc,demaneraquesepuedatomarladecisinadecuada para que dichos estudios sean siempre favorables. Elpropsitodeestemanualesbrindarconceptosclarosdeestadstica inferencial y sus numerosas aplicaciones en el campo laboral. Por otra parte, sepretendedaralfuturoprofesionallasherramientasnecesariaspara interpretaryevaluarinformacinestadstica,paraqueadquieradestrezaen la interpretacin, y manejo de las definiciones y teoremas. Enunaprimeraetapasedesarrollarelmarcotericoyprcticodela EstadsticaInferencial. En la segunda etapa se desarrollar la aplicacin de Mtodosregresivosparapredecirsituacionesexperimentalesbasadasen datos reales. Finalmente es importante resaltar que este curso es netamente prctico. Por elloencadasesinsedesarrollarlateoranecesariaenformaconcreta, dndole mayor nfasis a la parte prctica y a la interpretacin de resultados. 6CARRERAS PROFESIONALESCIBERTECRed de contenidos Muestreo Intervalos de confianza Prueba de hiptesis Regresiones Correlaciones Serie de tiempo conocida desconocida Proporciones conocida desconocida Proporciones Simple Mltiple Lineales No Lineales ESTADI STI CAI I 7 CIBERTECCARRERAS PROFESIONALES

TEORA DE MUESTREO

TEMAS Definiciones bsicas: poblacin, marco muestral, muestra, censo y muestreo. Ventajas y desventajas del muestreo Diseo de la encuesta por muestreo. Tipos de muestreo. Determinacin del tamao de muestra OBJETIVOS ESPECFICOS Relacionar la poblacin y la muestra Estimar las diferencias entre poblacin y muestra Realizar, adecuadamente, un muestreo de una poblacin dada Aplicar distribuciones muestrales CONTENIDOS Definiciones bsicas: Poblacin, marco muestral, muestra, censo y muestreo. Ventajas y desventajas del muestreo Diseo de la encuesta por muestreo. Tipos de muestreo. Determinacin del tamao de la muestra ACTIVIDADES oDeterminan, adecuadamente, una muestra de la poblacin. oDeterminan el tamao de la muestra. S E S E S E S E MA N A MA N A MA N A MA N A1 8CARRERAS PROFESIONALESCIBERTEC TEORA DE MUESTREO Lateorademuestreoesunestudiodelasrelacionesexistentesentreuna poblacinymuestrasextradasdelamisma.Tienegranintersenmuchos aspectosdelaestadstica.Porejemplo,permiteestimarcantidades desconocidasdelapoblacin(talescomolamediapoblacional,lavarianza, etc.),frecuentementellamadasparmetrospoblacionalesobrevemente parmetros,apartirdelconocimientodelascorrespondientescantidades muestrales(talescomolamediamuestral,lavarianza,etc.),amenudo llamadas estadsticos muestrales o brevemente estadsticos. La teora de muestreo es tambin til para determinar si las diferencias que se puedanobservarentredosmuestrassondebidasalaaleatoriedaddelas mismasosiporelcontrariosonrealmentesignificativas.Talespreguntas surgen,porejemplo,alensayarunnuevosueroparaeltratamientodeuna enfermedad, o al decidir si un proceso de produccin es mejor que otro. Estas decisiones envuelven a los llamados ensayos e hiptesis de significacin, que tienen gran importancia en teora de la decisin.En general, un estudio de inferencias, realizado sobre una poblacin mediante muestrasextradasdelamisma,juntoconlasindicacionessobrelaexactitud detalesinferenciasaplicadasalateoradelaprobabilidad,seconocecomo inferencia estadstica. MUESTRAS AL AZAR. NMEROS ALEATORIOS Paraquelasconclusionesdelateoradelmuestreoeinferenciaestadstica seanvlidas,lasmuestrasdebenelegirsedeformaqueseanrepresentativas delapoblacin.Unestudiosobremtodosdemuestreoylosproblemasque tales mtodos implican se conoce como diseo de experimentos. Elprocesomedianteelcualseextraedeunapoblacinunamuestra representativa de la misma se conoce como muestreo al azar. De acuerdo con ello cada miembro de la poblacin tiene la misma posibilidad de ser incluido en la muestra. Una tcnica para obtener una muestra al azar es asignar nmeros a cada miembro de la poblacin: escritos estos nmeros en pequeos papeles, se introducen en una urna y despus se extraen nmeros de la urna, teniendo cuidado de mezclarlos bien antes de cada extraccin. MUESTREO CON Y SIN REEMPLAZOSi se extrae un nmero de una urna, se puede volver o no el nmero a la urna antes de realizar una segunda extraccin. En el primer caso, un mismo nmero puede salir variasveces, mientras que en el segundo un nmero determinado solamentepuedesalirunavez.Elmuestreo,enelquecadamiembrodela poblacinpuedeelegirsemsdeunavez,sellamamuestreoconreemplazo, mientras que si cada miembro no puede ser elegido ms de una vez se tiene el muestreo sin reemplazo. Laspoblacionespuedenserfinitasoinfinitas.Si,porejemplo,seextraen sucesivamente 10 bolas sin reemplazo de una urna que contiene 100, se est tomando una muestra de una poblacin finita, mientras que si se lanza al aire unamoneda50veces,anotndoseelnmerodecaras,seestmuestreando en una poblacin infinita. ESTADI STI CAI I 9 CIBERTECCARRERAS PROFESIONALES

Unapoblacinfinita,enlaqueserealizaunmuestreoconreemplazo,puede tericamenteserconsideradacomoinfinita,puestoquepuedeextraerse cualquiernmerodemuestrassinagotarlapoblacin.Enmuchoscasos prcticos,elmuestreodeunapoblacinfinitaqueesmuygrande,puede considerarse como muestreo de una poblacin infinita. DISTRIBUCIONES MUESTRALES Considrense todas las posibles muestras de tamao n que pueden extraerse deunapoblacindada(conosinreemplazo).Paracadamuestrasepuede calcularunestadstico,talcomolamedia,ladesviacinestndar,etc.,que variardeunamuestraaotra.Deestaforma,seobtieneunadistribucindel estadstico que se conoce como distribucin muestral. Si,porejemplo,elestadsticodequesetrataeslamediamuestral,la distribucin se conoce como distribucin muestral de medias Anlogamente se obtendranlasdistribucionesmustralesdelasdesviacionesestndar, varianzas, medianas, proporciones, etc. DISTRIBUCIN MUESTRAL DE MEDIAS Supngasequesonextradasdeunapoblacinfinitatodaslasposibles muestras sin reemplazo de tamao n, siendo el tamao de la poblacin N. Si se denota la media y la desviacin estndar de la distribucin muestral de medias por xy x , yla media y la desviacin estndar de la poblacin pory , respectivamente, se tiene =x 1 =Nn Nnx Si la poblacin es infinita, los resultados anteriores se convierten en =x nx = Paravaloresgrandesden( 30 n )ladistribucinmuestraldemediasse aproximaaunadistribucinnormalconmedia x ydesviacinestndar xindependientedelapoblacindequesetrate(siemprequelamediayla varianza poblacional sean finitas y el tamao de la poblacin sea al menos dos veces el tamao de la muestra). Este resultado en una poblacin infinita es un caso especial del teorema central del lmite de teora de probabilidad superior, que demuestra que la aproximacin es tanto mejor conforme n se hace mayor. Esto se indica diciendo que la distribucin muestral es normal. En caso de que la poblacin se distribuya normalmente, la distribucin muestral demediassedistribuyetambinnormalmente,inclusoparapequeosvalores de n (es decir, n < 30). 10CARRERAS PROFESIONALESCIBERTECDISTRIBUCIN MUESTRAL DE PROPORCIONES Supngaseunapoblacininfinitayquelaprobabilidaddeocurrenciadeun suceso(conocidocomosuxito)esp,mientrasquelaprobabilidaddeno ocurrencia del suceso es q = 1 p (conocido como su fracaso). Seconsiderantodaslasposiblesmuestrasdetamaonextradadeesta poblacin y para cada muestra se determina la proporcin p de xito. Entonces seobtieneunadistribucinmuestraldeproporcionescuya p ydesviacin estndar p vienen dadas por pp = np pp) 1 ( = Si la poblacin es infinita, los resultados anteriores se convierten en p = ) 1 ( p p = Para grandes valores de n( 30 n ) la distribucin muestral se aproxima mucho a una distribucin normal. Ntese que la poblacin se distribuye binomialmente. DISTRIBUCIN MUESTRAL DE DIFERENCIAS Y SUMAS Supngasequesetienendospoblaciones.Paracadamuestradetamaon1 extrada de la primera poblacin se calcula un estadstico s1. Esto proporciona unadistribucinmuestraldelestadsticos1conmedia 1 x ydesviacin estndar 1 x .Anlogamente,paracadamuestradetamaon2,extradadela segundapoblacin,secalculaunestadsticos2.EstoIgualmenteproporciona unadistribucinmuestraldelestadsticos2,conmedia 2 x ydesviacin estndar 2 x .Detodaslasposiblescombinacionesdeestasmuestrasdelas dospoblaciones,sepuedeobtenerunadistribucindelasdiferencias(s1-s2) que se conoce como distribucin muestral de diferencias de los estadsticos. Si s1 y s2 son las medias muestrales de las dos poblaciones, las cuales vienen dadaspor1 x y2 x ,entoncesladistribucinmuestraldelasdiferenciasde medias para poblaciones infinitas con medias y desviaciones estndar 1 ,1y 2 ,2 , respectivamente, tiene por media y desviacin estndar: 2 12 1 2 1 = = x x x x 222121 2 22 1 2 1n nx x x x + = + = El resultado se mantiene vlido para poblaciones finitas.Resultadoscorrespondientespuedendeducirseparalasdistribuciones muestralesdediferenciasdeproporcionesdedospoblacionesdistribuidas binomialmente con parmetros p1, q1 y p2, q2, respectivamente. En este caso s1 y s2 corresponden a las proporciones de xito, p1 y p2 2 12 1 2 1p pp p p p = = ESTADI STI CAI I 11 CIBERTECCARRERAS PROFESIONALES

22 211 1 2 2) 1 ( ) 1 (2 1 2 1np pnp pp p p p+= + = Sin1yn2songrandes( 301 n y302 n ),lasdistribucionesmuestralesde diferenciasdemediasoproporcionessedistribuyenmuyaproximadamente como una normal. Aveces,estilhablardeladistribucinmuestraldelasumadeestadsticos. La media y la desviacin estndar de esta distribucin vienen dadas por 2 1 2 1s s s s = 2 22 1 2 1s s s s + = suponiendo que las muestras son independientes. ERRORES TPICOS La desviacin estndar de la distribucin muestral de un estadstico se conoce tambin como su error estndar. En la tabla se han anotado los errores tpicos de distribuciones muestrales para diversos estadsticos bajo las condiciones de muestreo aleatorio sin reemplazo para una poblacin infinita (o muy grande) o con reemplazopara una poblacin finita. Tambin, se apuntan notas especia-lesqueindicanlascondicionesparalasquelosresultadossonvlidos,as como otras notas de inters. Lascantidadesrp , , , y rx p s x , , ,denotan,respectivamente,lasmedias, desviacionesestndar,proporcionesymomentosdeordenrrespectodela media en la poblacin y en la muestra. Esdenotarquesieltamaodelamuestranesbastantegrande,las distribucionesmuestralessonnormalesocasinormales.Porestarazn,los mtodosseconocencomomtodosparagrandesmuestras.Lateorade pequeasmuestras,oteorademuestreoexacto,comoavecessellama,se usa cuando n=::1 Donde oes el valor de la media poblacional. 2.Se escoge el nivel de significancia . 3.Una estadstica para la media de la poblacin es la media muestralx . Si la poblacinesnormal(osilamuestraesgrande30 n ,auncuandola poblacin no es normal). La distribucin dexes) , (2nN . Lavariablealeatoria nxZo = tieneunadistribucinnormalestndar N(0,1) 4.La regin critica (R.C.) es + Z , donde oZ es tal que[ ] = > 1Z Z P5.Se calculaxde los datos, luego se obtiene Z nxZo =6.Se compara Z con Zo. Si Z > Z 1- + 1Z Z, se rechaza la hiptesis nula Ho Si Z < Z 1- 1, Z Z , se acepta la hiptesis nula Ho 60CARRERAS PROFESIONALESCIBERTEC

Regin de Aceptacin Regin de Rechazo 0 1Z PRUEBA BILATERAL DE UNA HIPTESIS SOBRE LA MEDIA Prueba de significancia de dos colas 1.Se Se formula la hiptesis nula y la hiptesis alternativa oo oHH =::1 Donde oes el valor de la media poblacional. 2.Se escoge el nivel de significancia . 3.Una estadstica para la media de la poblacin es la media muestralx . Si la poblacinesnormal(osilamuestraesgrande30 n ,auncuandola poblacin no es normal). La distribucin dexes) , (2nN . Lavariablealeatoria nxZo = tieneunadistribucinnormalestndar N(0,1) 4.LareginAceptacin(R.A.)es b a, ,dondeaybsontalque [ ] = < < 1 b x a P . Porlasimetradelacurvanormal,losvalorescrticosdeaybson simtricos con respecto a o =(((((

1nbnxnapo o Luego, la regin de aceptacin: ESTADI STI CAI I 61 CIBERTECCARRERAS PROFESIONALES

((

+ nZnZo o 2 / 2 / , 5.Se calculaxa partir de la muestra observada,(tambin S si no se conoce la varianza2 y la muestra n es grande)6.Se compara Z con Z /2. Si 2 /,Z Z0+ + ,2 / Z Z , se rechaza la hiptesis nula Ho Si + 2 / 2 /, Z Z Z , se acepta la hiptesis nula Ho Regin de Rechazo Regin de Aceptacin Regin de Rechazo

2 / Z0 2 / Z PRUEBA DE HIPTESIS PARA DIFERENCIA DE MEDIAS En muchos ensayos de prueba de hiptesis se quiere determinar si existe o no unadiferenciasignificativaentrelasmedias x y y dedospoblacioneso variablesaleatoriasXeY.Lapruebadehiptesisquecomprendendos medias son las mismas que la de una sola media, salvo que se necesitan dos muestras, una en cada poblacin. La hiptesis nula y x oH = : o0 : = y x oH Hiptesis alternativa: a)y xH :10 :1 y xH by xH :10 :1 y xH c) y xH :10 :1 y xH Si H1 toma la forma (a) se utiliza una prueba bilateral, en otros casos se emplea una prueba unilateral. Desviaciones Estndar Conocidas, Muestras Grandes Prueba Unilateral Caso I: 1.Considrese la siguiente hiptesis: y x oH = : o0 : = y x oH y xH :10 :1 y xH 62CARRERAS PROFESIONALESCIBERTEC 2.Se escoge el nivel de significancia . 3.Laestadsticaparaladiferenciademediaspoblacionales) (y x ,esla diferenciademediasmuestrales) ( y x .Silapoblacintieneuna distribucinnormalcondesviacionesestndarconocidas x y yconocidas(osilasmuestrassongrandes30 n ,30 , m ancuandola poblacin no es normal). Ladistribucinde) ( y x esnormalconmedia) (y x yvarianza ) (22m nyx+ . Por tanto, la variable aleatoria: m ny xZyxy x22) ( ) ( + = Tiene una distribucin normal estndar. 4.EnelsupuestodequeHoesverdadero,esdecir,que0 ) ( = y x .La regin crtica (R.C.) es+ ,cx , tal que[ ] = cx y x P ) (=((((((

++m nxm ny xPyxcyx2222) ( =((((((

+m nxZ Pyxc22 Luego:m nZ xyxc221+ = 5.Secalculaladiferenciadelasmediasmuestrales) ( y x y y xSsinose conoce2 2,y x . Para muestras grandes se utiliza y xS.6.Conclusin: si) ( y x se encuentra en la regin crtica+ ,cx , se rechaza Ho, en caso contrario se acepta. ESTADI STI CAI I 63 CIBERTECCARRERAS PROFESIONALES

Regin de Aceptacin Regin de Rechazo 0 1Z Caso II: 1.Considrese la siguiente hiptesis: y x oH = : o0 : = y x oH y xH :10 :1 y xH 2.Se escoge el nivel de significancia . 3.Laestadsticaparaladiferenciademediaspoblacionales) (y x esla diferenciademediasmuestrales) ( y x .Silapoblacintieneuna distribucinnormalcondesviacionesestndarconocidas x y yconocidas(osilasmuestrassongrandes30 n ,30 , m auncuandola poblacin no es normal). Ladistribucinde) ( y x esnormalconmedia) (y x yvarianza ) (22m nyx+ . Por tanto, la variable aleatoria m ny xZyxy x22) ( ) ( + = Tiene una distribucin normal estndar.4.EnelsupuestodequeHoesverdadero,esdecir,que0 ) ( = y x .La regin crtica (R.C.) es cx , , tal que[ ] = cx y x P ) (=((((((

++m nxm ny xPyxcyx2222) ( 64CARRERAS PROFESIONALESCIBERTEC=((((((

+m nxZ Pyxc22 Luego m nZ xyxc22+ =5.Secalculaladiferenciadelasmediasmuestrales) ( y x y y xSsinose conoce2 2,y x . Para muestras grandes se utiliza y xS.6.Conclusin: si) ( y x se encuentra en la regin crtica cx , , se rechaza Ho, en caso contrario se acepta. Regin de Rechazo Regin de Aceptacin Z 0 Prueba Bilateral 1.Considrese la siguiente hiptesis: y x oH = : o0 : = y x oH y xH :1 0 :1 y xH 2.Se escoge el nivel de significancia . 3.Laestadsticaparaladiferenciademediaspoblacionales) (y x esla diferenciademediasmuestrales) ( y x .Silapoblacintieneuna distribucinnormalcondesviacionesestndarconocidas x y yconocidas(osilasmuestrassongrandes30 n ,30 , m auncuandola poblacin no es normal). Ladistribucinde) ( y x esnormalconmedia) (y x yvarianza ) (22m nyx+ . ESTADI STI CAI I 65 CIBERTECCARRERAS PROFESIONALES

Por tanto, la variable aleatoria: m ny xZyxy x22) ( ) ( + = Tiene una distribucin normal estndar. 4.EnelsupuestodequeHoesverdadero,esdecirque0 ) ( = y x .La regin de aceptacin (R.A.) es b a, , tal que[ ] = 1 ) ( b y x a P =((((((

+++1) (222222m nbm ny xm naPyxyxyx =((((((

+ +12222m nbZm naPyxyx Luego,m nZ ayx222 /+ = m nZ byx222 /+ + =5.Calclese la diferencia de las medias muestrales) ( y x . Tambin2 2,y xS Ssi no se conoce2 2,y x y las muestras son grandes.6.Conclusin:si) ( y x seencuentraenlaregindeaceptacin b a, ,se acepta Ho, en caso contrario se rechaza. Regin de Rechazo Regin de Aceptacin Regin de Rechazo

2 / Z0 2 / Z 66CARRERAS PROFESIONALESCIBERTECACTIVIDADES 1.Elfabricantedeciertamarcadecigarrillossostienequesuscigarrillos contienenenpromedio18miligramosdenicotinaporcigarrillo.Un organismo de control examina una muestra de 100 cigarrillos. Utilizando un niveldesignificacin0,01;puedeelorganismoconcluirqueelfabricante subestimaelcontenidomediodenicotinadesuscigarrillos,sielcontenido medio de la muestra es de 19,2 miligramos con una desviacin estndar de 2 miligramos? 2. El organismo de control de cierto Concejo Municipal analiza una muestra de 36paquetesdecarnemolidaqueproducelafbricadeembutidosLA NICA.Elrtuloencadapaquetedicequecontienenomsde25%de grasa.Puedeelorganismodecontrolconcluirquelacarnequeproduce dichafbricatienemsde25%degrasa,silamuestradauncontenido mediodegrasade0,265yunadesviacinestndarde0,030?Use = 0,05. 3.Un fabricante de pilas afirma que la vida media de su producto exceder las 30horas.Unacompaadeseacomprarunlotegrandedepilassila afirmacin es cierta. Se toma al azar una muestra de 36 pilas y se encuentra quela media dela muestra es 34 horas.Silapoblacin de pilas tieneuna ESTADI STI CAI I 67 CIBERTECCARRERAS PROFESIONALES

desviacin estndar de 5 horas, si Ho es < 30, para qu valores dese adquirirn las pilas? 4.Diariamente, el servicio de aduanas ha interceptado a lo largo de su historia alrededorde$28millonesdebienesdecontrabandointroducidosalpas, con una desviacin estndar de 416 millones al da. En64dasde1992,elegidosaleatoriamente,elServiciodeAduanas intercept un promedio de $30,3 millones de bienes de contrabando. Indica estamuestra(aunniveldesignificanciadel5%)queeljefedeAduanas deberapreocuparseporelincrementodecontrabandoporencimadesu nivel histrico? 5.Seinvestigaronaleatoriamente75grifosdelacadenaRepsol,yse determin que el precio promedio de la gasolina regular sin plomo fue de $1059,conunadesviacinestndarde3,9centavos.Tresmeses despus,enotrainvestigacinaleatoriade50grifos,seencontrun preciopromedioparaelmismotipodecombustiblede$1089,conuna desviacinestndarde6,8centavos.Aunnivelsignificanciade0,02 68CARRERAS PROFESIONALESCIBERTECCambisignificativamenteelpreciodelagasolinaregularsinplomo durante el periodo de tres meses considerado? 6.A pesar de la ley de sueldos de 1993, en el 2007, todava parece que los hombresgananmsquelasmujeresentrabajosparecidos.Enuna muestrade38operadoresvaronesdemquinas-herramientasse encontrqueelsalariomediopordafuedes/.45,20conuna desviacinestndardedes/.4,50.Enotramuestrade45mujeres operadoras de mquinas-herramientas se encontr que el salario medio pordafuedes/.40,50conunadesviacinestndardedes/.3,85. Basndose en estas dos muestras, Es razonable llegar a la conclusin (a un nivel = 0,01) de que los operadores ganan ms de s/.5,00 por da que las operadoras? ESTADI STI CAI I 69 CIBERTECCARRERAS PROFESIONALES

Autoevaluacin 1.Lacomisinpromedioquecarganlascompaasdecorretajedetiempo completo en una venta de valores comunes es de $144 con una desviacin estndarde$52.Setomunamuestraaleatoriade121comprasyse determinquehabanpagadounacomisinpromediode$151.Aunnivel de significancia de 0,10, puede concluirse que las comisiones son mayores que el promedio de la industria? 2.Alfanohapuestoenmarchaunapromocincomercialespecialparasu estufa de propano y siente que la promocin debe provocar un cambio en el precioalconsumidor.Alfanosabequeantesdequecomenzarala promocin,elpreciopromedioalmenudeodelaestufaerade$44,95con una desviacin estndar de $5,75. Alfano muestrea a 30 de sus minoristas despusdeiniciadalapromocinyencuentraqueelpreciomediodelas estufasesahorade$42,95.Aunniveldesignificanciade0,02,tiene Alfanorazonesparacreerqueelpreciopromedioalmenudeoparael consumidor ha disminuido? 3.Del2000al2006,latasapromediodeprecios/utilidades(p/u)delos aproximadamente 1899 valores inscritos en la Bolsa de Valores de Lima fue de14,35conunadesviacinestndarde9,73.Enunamuestrade30 valoresdelaBolsa,aleatoriamenteescogidos,latasap/upromedioenel 2006 fue de 11,77. Esta muestra presenta evidencia suficiente para concluir (al nivel de significancia de 0,05) que en el 2007 la tasa promedio para los valores de la Bolsa se habra modificado de su anterior valor. 4.EditorialNavarretesuponequelavidadesuprensamsgrandeesde 14500 horas, con una desviacin estndar conocida de 2 00 horas. De una muestra de 30 prensas, la compaa encuentra una media de muestra de 13 000 horas. A un nivel de significancia de 0,01 debera concluir la compaa quelavidapromediodelasprensasesmenorquelashipotticas14500 horas? 5.UBKsabequeunaciertapelculadexitoseexhibiunpromediode84 dasencadaciudad,yladesviacinestndarcorrespondientefuede10 das.EladministradordeldistritodeLosOlivosestabainteresadoen compararlapopularidaddelapelcula.Eligialeatoriamente75cinesdel distritoyencontrqueproyectaronlapelculaunpromediode81,5das. Establezcahiptesisapropiadasparaprobarsihubounadiferencia significativa en la duracin de la exhibicin de la pelcula entre los cines del distrito de Los Olivosylos dems de la UBK. Use un nivel de significancia del 1% y pruebe estas hiptesis. 6.Unfabricantedeautomvilesafirmaqueunmodeloenparticularrinde28 millasporgaln.LaAgenciadeProteccinalconsumidor,usandouna muestrade49automvilesdeestemodelo,encuentraquelamediade muestraes26,8millasporgaln.Deestudiosprevios,ladesviacin estndardelapoblacinsesabequeesde5millasporgaln.Sera 70CARRERAS PROFESIONALESCIBERTECrazonableesperar(en2erroresestndar)quesepudieraseleccionaruna muestrasemejantesirealmentelamediadepoblacinfuera28millaspor galn? 7.Los estatutos ambientales aplicables a una cierta planta nuclear especifican queelaguarecibidanodebe,enpromedio,excederlos28,9Cantesde puedaserlanzadaalroquecorrejuntoalaplanta.De70muestras,se encontr que el promedio de temperatura del agua reciclada era de 30,2C. Si la desviacin estndar de la poblacin es de 7,5C, debera la planta ser multadaporexcederlaslimitacionesdelestatuto?Formuleypruebelas hiptesis apropiadas con = 0,05. 8.Inspectoresdesalubridad,alinvestigarloscargoslevantadoscontrauna embotelladoradebebidasnoalcohlicas,deAncn,quenollenaban adecuadamente sus productos, han muestreado 200 botellasy encontraron queelpromediodellenadoesde930ml.Seanunciaquelasbotellas contienen 946,33 ml. Se sabe que la desviacin estndar de la poblacin es de 44,36 ml. Deberan concluir los inspectores, al nivel de significancia de 2%, que las botellas estn siendo llenadas con menos contenido? 9.En2002,latarifaareapromediocondossemanasdeanticipacinenel vuelo entre Lima Aruba era de $235. La desviacin estndar de la poblacin erade$68.Enunaencuestahechaen2003a90viajeroselegidos aleatoriamente entre estas dos ciudades se encontr que haban pagado e promedio$218,77porsusboletos.Cambisignificativamentelatarifa promedioenestarutaentre2002y2003?Culeselmayornivelde significanciaenelquepodraconcluirquelatarifapromedioobservadano es significativamente diferente de $235? 10. Unacadenaregionaldetiendasdeabarroteshainstaladocajas computarizadasparareducirlaesperadelusuarioyloscostosdetrabajo, ascomoparaayudarenelcontroldeinventarios.Los36empleados entrenadosenlasnuevasmquinaspromediaron12,4intentosantesde lograrunatransaccinlibredeerrores.Lalargaexperienciadeloscajeros paramanejarlasantiguascajasregistradorasmostrabaunpromediode 11,6intentosantesdelograrunaoperacinperfecta,conunadesviacin estndar de 2,7 intentos. Con un nivel = 0,01, debera la cadena concluir que las nuevas registradoras computarizadas son ms difciles de aprender a operar? 11. EnJuliodel2007,elMinisteriodeTrabajoconsiderunapropuestapara exigiralascompaasqueinformarandelefectopotencialdelaexistencia de opciones para los empleados sobre las ganancias por accin (GPA). Una muestrade41empresasdealtatecnologarevelquelanuevapropuesta reduciralasGPAenunmontodel13,8conunadesviacinestndarde 18,9%.Otramuestraaleatoriade35productoresdebienesdeconsumo mostrquelapropuestareduciralasGPAen9,1%enpromedio,conuna desviacin estndar del 8.7%. Con base en estas muestras, Es razonable llegar a la conclusin (a un nivel = 0,01) de que la propuesta del Ministerio ESTADI STI CAI I 71 CIBERTECCARRERAS PROFESIONALES

de Trabajo ocasionar una mayor reduccin en las GPA para las empresas de alta tecnologa o para los productores de bienes de consumo? 12. Doslaboratoriosdeinvestigacinhanproducido,independientemente, medicamentos que alivian las molestias de la artritis. El primer medicamento fue probado en un grupo de 90 personas que sufren de artritis y produjo un promedio de 8,5 horas de alivio, con una desviacin estndar de 1,8 horas. El segundo medicamento fue probado en 80 artrticosy produjo una media de 7,9 horas de alivio, con una desviacin estndar de 2,1 horas. A un nivel 0,05 de significancia, el segundo medicamento proporciona un periodo de alivio significativamente ms corto? Para recordar Para una prueba de hiptesis se debe formular adecuadamente la hiptesis nula con un nivel de significancia de acuerdo con la realidad del proceso. 72CARRERAS PROFESIONALESCIBERTEC ESTADI STI CAI I 73 CIBERTECCARRERAS PROFESIONALES

HIPTESIS ESTADSTICA HIPTESIS ESTADSTICA HIPTESIS ESTADSTICA HIPTESIS ESTADSTICAMUESTRAS PEQUEAS MUESTRAS PEQUEAS MUESTRAS PEQUEAS MUESTRAS PEQUEAS TEMAS Prueba de Hiptesis para medias. Muestras pequeas Prueba bilateral de una hiptesis sobre la media Prueba unilateral de una hiptesis sobre la media, caso I, caso II Prueba de Hiptesis para diferencia de media Desviacin estndar desconocidas. Muestras pequeas OBJETIVOS ESPECFICOS Describir la hiptesis nula y la hiptesis alternativa de un problema Determinarunaestadsticadepruebalgicayunaregladedecisinpara probar las hiptesis para muestras pequeas.CONTENIDOS Prueba de Hiptesis para medias. Muestras pequeas Prueba bilateral de una hiptesis sobre la media Prueba unilateral de una hiptesis sobre la media, caso I, caso II Prueba de Hiptesis para diferencia de media Desviacin estndar desconocidas. Muestras pequeas. ACTIVIDADES Utilizan e interpretan el concepto de prueba de hiptesisTomandecisionesdeaceptacinorechazodeunahiptesisbajo consideraciones estudiadas. S E S E S E S E MA N A MA N A MA N A MA N A6 74CARRERAS PROFESIONALESCIBERTEC PRUEBA DE HIPTESIS PARA MEDIAS, MUESTRAS PEQUEAS. Para muestras pequeas de poblaciones con distribucin aproximadamente normal, se recurre a la distribucin t para prueba de hiptesis sobre la media Prueba de significancia de una cola Caso I 1. Se formula la hiptesis nula y la hiptesis alternativa oo oHH =::1 Donde oes el valor de la media poblacional. 2. Se escoge el nivel de significancia . 3. Una estadstica de prueba esx , para muestras pequeas se usa la variable aleatoria. nSxto = Tiene una distribucin t con (n-1) grados de libertad. 4. La regin crtica (R.C.) es+ , c x , dondec x es tal que[ ] = c x x P =(((((

nsxnsxpco =(((((

nsxt pc [ ] = ct t p 5.Se calculaxde los datos, luego se obtiene 1t76CARRERAS PROFESIONALESCIBERTEC nsxto= 1 6.Se compara t con 1tSi t > 1t + , 1t t , se rechaza la hiptesis nula Ho Si t < 1t 1, t t , se acepta la hiptesis nula Ho

Regin de Aceptacin Regin de Rechazo 0 1Z PRUEBA BILATERAL DE UNA HIPTESIS SOBRE LA MEDIA Prueba de significancia de dos colas 1. Se formula la hiptesis nula y la hiptesis alternativa oo oHH =::1 Donde oes el valor de la media poblacional. 2. Se escoge el nivel de significancia . 3. Una estadstica de prueba esx , para muestras pequeas se usa la variable aleatoria. nSxto = Tiene una distribucin t con (n-1) grados de libertad. 4.LareginAceptacin(R.A.)es b a, ,dondeaybsontalque [ ] = < < 1 b x a P . Porlasimetradelacurvanormal,losvalorescrticosdeaybson simtricos con respecto a oESTADI STI CAI I 77 CIBERTECCARRERAS PROFESIONALES

=(((((

1nsbnsxnsapo o Luego, la regin de aceptacin: ((

+ nstnsto o 2 / 2 / , 7.Se calculaxa partir de la muestra observada,(tambin S si no se conoce la varianza2 y la muestra n es grande). 8.Se compara t con t /2. Si 2 /,t t0+ + ,2 / t t , se rechaza la hiptesis nula Ho Si + 2 / 2 /, t t t , se acepta la hiptesis nula Ho Regin de Rechazo Regin de Aceptacin Regin de Rechazo

2 / t 0 2 / t + PRUEBA DE HIPTESIS PARA DIFERENCIA DE MEDIAS Paraprobarhiptesissobreladiferenciademedias,bajoelsupuestoqueHo esverdadero,esdecir0 = y x ,cuandolostamaosdemuestrasson pequeosylaspoblacionestienendistribucionesnormales,condesviaciones estndar iguales se utiliza la variable aleatoria t que tiene una distribucin t con (n + m + 2) grados de libertad. m nm n nms m s ny xty x++ + + =) 2 () 1 ( ) 1 () (2 2 Desviaciones Estndar desconocidas, Muestras Pequeas Prueba Unilateral Caso I: 1.Considrese la siguiente hiptesis:78CARRERAS PROFESIONALESCIBERTEC y x oH = : o0 : = y x oH y xH :10 :1 y xH 2.EnelsupuestodequeHoesverdadero,esdecir,que0 ) ( = y x .Se calcula 1t , de tal manera que[ ] = 11t t P . La regin crtica (R.C.) es + ,1t , 3.Conclusin:sitseencuentraenlaregincrtica+ ,1t ,serechazaHo, en caso contrario se acepta.

Regin de Aceptacin Regin de Rechazo 0 1t Caso II: 1.Considrese la siguiente hiptesis: y x oH = : o0 : = y x oH y xH :10 :1 y xH 2.EnelsupuestodequeHoesverdadero,esdecirque0 ) ( = y x .Se calcula 1t ,detalmaneraque[ ] = t t P .Laregincrtica(R.C.)es t , , 3.Conclusin: si t se encuentra en la regin crtica t , , se rechaza Ho, en caso contrario se acepta. ESTADI STI CAI I 79 CIBERTECCARRERAS PROFESIONALES

Regin de Rechazo Regin de Aceptacin t 0 Prueba Bilateral 1.Considrese la siguiente hiptesis: y x oH = : o0 : = y x oH y xH :10 :1 y xH 2.EnelsupuestodequeHoesverdadero,esdecirque0 ) ( = y x .Se calcula 2 / t y 2 / t + ,detalmaneraque[ ] = 12 / 2 /t t t P .Laregin crtica (R.C.) es 2 /,tU+ + ,2 / t 3.Conclusin: si t se encuentra en la regin crtica 2 /,tU+ + ,2 / t , se rechaza Ho, en caso contrario se acepta. Regin de Rechazo Regin de Aceptacin Regin de Rechazo

2 / t 0 2 / t + 80CARRERAS PROFESIONALESCIBERTECACTIVIDADES . 1.Unamquinaproduceejesque.segnlasespecificaciones,debentener 100 mm dedimetro. Paramantenerlacalidadrequerida,todoslosdasse examina una muestra de 16 ejes para determinar si es necesario detener la produccinyreajustarlamquina.Undadeterminado,lamuestradalos siguientes resultados: 1011001029899100101102 9810010510099106102104 Tomando = 0.05 indique, mediante un anlisis estadstico, si es necesario reajustar la mquina. 2.Elfabricantedeunciertomodelodeautomvilafirmaqueelkilometraje medio de este modelo es de 12 kilmetros por litro de gasolina corriente. Un organismode defensa del consumidor piensa que ese kilometraje promedio hasidoexageradoporelfabricante.Unos18automvilesdeestemodelo sonconducidosdelmismomodoconunlitrodegasolinacorriente.Los kilmetros recorridos por los diversos automviles son los siguientes: 12,513,114,011,510,510,411,010,512,2 12,511,012,412,211,010,011,49,01,01 Si el organismo desea rechazar una afirmacin verdadera no ms de una vez en 100. Rechazar la afirmacin del fabricante? = 0,05. ESTADI STI CAI I 81 CIBERTECCARRERAS PROFESIONALES

3.Unacompaainmobiliariatomcomomuestraaleatoriade12hogaresde unaprestigiadaurbanizacindeSurcoyencontrqueelvalordemercado promedio estimado era de $780000, con una desviacin estndar de $49000. Pruebelahiptesisdequeparatodaslascasasdelrea,elvalorestimado medio es de $825000, frente a la otra opcin de que es menos de $825000. Utilice el nivel de significanca de 0,05. 4.En el taller mecnico de Jerry utilizan una sierra a motor para cortar el tubo demetalqueseutilizaenlamanufacturadedispositivosdemedicinde presin. La longitud de los segmentos de tubo est distribuida normalmente. Se cortaron 25 piezas de tubo con la sierra calibrada para cortar secciones de 5,00 pulgadas de longitud. Cuando se midieron estas piezas, se encontr quesulongitudmediaerade4,7pulgadasyconunadesviacinestndar de0,06pulgadas.Utilicevaloresprobablesparadeterminarsilamquina debeserrecalibrada,debidoaquelalongitudmediaessignificativamente diferente a 5,00 pulgadas. 5.El decano de la facultad de Ingeniera Ambiental de la Universidad Nacional de Ingeniera, se pregunta acerca de las distribuciones de calificacin en el nivel universitario. Ha escuchado rumores de que las notas de la facultad de 82CARRERAS PROFESIONALESCIBERTECIngeniera Industrial est aproximadamente 0,25 por debajo de las notas de lafacultaddeIngenierametalrgica.Unrpidomuestreoaleatorioarroj las siguientes calificaciones: Ing. Ambiental 2,862,773,182,803,142,873,193,242,913,002,83 Ing. Industrial 3,353,323,363,633,413,373,453,433,443,173,26 Estosdatosindicanqueexisteunabasefundadaparalosrumores? Establezca y pruebe hiptesis apropiadas a un nivel =0,02. 6.LacompaaNaturalacabadeconcluirunanuevacampaapublicitaria parasuproductoKivipunch,elcerealnaturalparaeldesayunoque contiene pecanas, camu camu, kiwicha atmica y frutas secas. Para probar laefectividaddelacampaa,elgerentedelamarcaencuestaonce clientesantesdelacampaayaotrosoncedespusdeesta.A continuacin,sedaelconsumosemanal(enonzas)deKivipunchpor parte de los consumidores: Antes141518183010826132924 Despus2314132933111225212624 6.1 Al nivel = 0,05, puede, el gerente, concluir que la campaa ha tenido xito en aumentar la demanda del producto? 6.2 Dadalainvestigacindelgerenteantesdelacampaa,puedeusted sugerirleunmejorprocedimientodemuestreoparadespusdela campaa? ESTADI STI CAI I 83 CIBERTECCARRERAS PROFESIONALES

6.Losmdemsondispositivosquetransmiteninformacinmediantelneas telefnicas de una computadora a otra. La velocidad de transmisin se mide enbaudios,quesedefinencomoelnmerodebitsporsegundoque puedentransmitir.Debidoalaintervencindevariosfactorestcnicos,la rapidez de transmisin real vara de un archivo a otro. Anne Evans est en procesodeadquirirunmdemnuevode14400baudios.Alprobardosde los dispositivos, con el fin de decidir cul comprar, transmiti siete archivos elegidosalazarutilizandoambosmdemyregistrlassiguientes velocidades de transmisin (en miles de baudios) En un artculo aparecido en la revista PC reports se afirma que en pruebas hechas por la misma revista se ha encontrado que el mdem PerFAXtion es significativamente ms rpido que el Haymes Ultima. A un nivel= 0,01; los resultados obtenidos por Anne confirman la conclusin de la revista? Archivo1234567 UIltima 14,4 Haynes9,5210,1710,3310,0210,729,629,17 PerFAXtion 14,4 Extel10,9211,4611,1812,2110,4211,3610,47 84CARRERAS PROFESIONALESCIBERTEC Autoevaluacin 1.Undocumentaldetelevisinacercadelaalimentacinexcesivaafirmaba quelosestadounidensestienenunsobrepesoaproximadode10lben promedio. Para probar esta afirmacin, se examin a 18 individuos elegidos aleatoriamente,yseencontrquesusobrepesopromedioerade12,4lb, conunadesviacinestndardemuestrade2,7lb.Aunnivelde significanciade0,01;hayalgunaraznparadudardelavalidezdelvalor afirmado de 10 lb? 2.Microsoft, proveedor de software de sistemas operativos para computadoras personales,estabaplaneandolaofertapblicainicialdesusexistencias para sacar el suficiente capital de trabajo para financiar el desarrollo de un sistemaintegradodesptimageneracin,radicalmentenuevo.Con utilidadesactualesde$1,61poraccin,Microsoftysussuscriptores estabanconsiderandounprecioofertade$21aproximadamente13veces lasutilidades.Paraverificarloadecuadodeesteprecio,eligieron aleatoriamente siete compaas de software comercial pblico y encontraron quesutasapromedioprecio/utilidadeserade11,6conunadesviacin estndardemuestrade1,3aunnivel=0,02.PuedeMicrosoftconcluir que las existencias en compaas de software comercial pblico tienen una tasa promedio precio/utilidades significativamente diferente de 13? 3.Unbibliotecariouniversitariosospechaqueelnmeropromediodelibros sacadosaprstamoporcadaestudianteporvisitahacambiado ltimamente.Anteriormente,sesacabaunpromediode3,4libros.Sin embargo,unamuestrarecientede23estudiantespromedi4,3librospor visita, con una desviacin estndar de 1,5 libros. Al nivel de significancia de 0,01; ha cambiado el promedio de prstamos? 4.Unacompaa,recientementecriticadapornopagarlomismoahombres queamujeresquetrabajanenlosmismospuestos,declaraqueelsueldo promediopagadoatodoslosempleadosesde$23500.Deunamuestra aleatoriade29mujeresquelaboranenlacompaa,secalculqueel salario promedio era de $23000. Si se sabe que la desviacin estndar de la poblacin es de $1250 por estos empleos, determine si puede ser razonable esperar (con dos errores estndar) que la media de la muestra sea $23000 si, en efecto, es cierto lo declarado por la compaa. 5.SeusgasolinademarcaAen9automvilessemejantesbajoidnticas condiciones.Lamuestracorrespondientede9valores(kilmetrosporlitro) tienen una media 8,565 y una desviacin estndar0,212. Bajo las mismas condiciones, la gasolina de alta potencia de marca B da una muestra de 10 valoresconmedia9,245ydesviacinestndar0,254.Pruebelahiptesis, que A y B son de igual calidad con respecto al kilometraje, contra de que B es mejor. Use= 0,05. ESTADI STI CAI I 85 CIBERTECCARRERAS PROFESIONALES

6.Unaorganizacindeconsumoseleccionademanerarutinariavarios modelosdeautomvilcadaaoyevalasueficienciaconrespectoal combustible.Enelestudiodelpresenteao,dedosmodeloscompactos fabricadospordosmarcasdistintas,elconsumopromedioparadoce automvilesdelamarcaAfuede27,2millasporgaln(mpg),conuna desviacin estndar de 3,8 mpg. Los nueve automviles de la marca B que fueronprobadostuvieronunnmeropromediode32,1mpg,conuna desviacinestndarde4,3mpg.Aunnivel=0,01,sedeberconcluir que los automviles de la marca B tienen un nmero promedio de millas por unidad de combustible mayor que los automviles de la marca A? 7.Unaempresagrandedecorretajedeaccionesdeseadeterminarqutanto xitohantenidosusnuevosejecutivosdecuentaenlaconsecucinde clientes.Despusdehaberterminadosuentrenamiento,losnuevos ejecutivospasanvariassemanashaciendollamadasaposiblesclientes, tratandodeconseguirprospectosparaabrircuentasconlaempresa.Los datossiguientesdanelnmerodecuentasnuevasquefueronabiertas durantelasprimerassemanaspordiezejecutivasyochoejecutivosde cuentaescogidosaleatoriamente.Aunnivelde=0,05,parecequelas mujeressonmsefectivasqueloshombresparaconseguirnuevas cuentas? Nmero de cuentas nuevas Ejecutivas de cuenta12111413131413121412 Ejecutivos de cuenta1310111213121012-- 8.Paracelebrarsuprimeraniversario,J.J.Prezdecidicomprarunparde aretesdediamanteparasuesposa.Leensearonnueveparesdearetes congemasquepesabanaproximadamentedosquilatesporpar.Debidoa las diferencias a la calidad y el color de las piedras, los precios variabande unajoyaaotra.Elpreciopromediofuede$2990,conunadesviacin estndar de muestra de $370. Tambin, le ensearon seis pares de aretes enformadegota,conunpesoaproximadodedosquilatesporcadapar. Estosaretestenanunpreciopromediode$3065,conunadesviacin estndar de $805. Con base en esta evidencia, puede J. J. Prez llegar a la conclusin (a un nivel de significancia de 0,05) de que los diamantes con forma de gota cuestan ms, en promedio, que el otro tipo de diamante? 9.Losdatosquesepresentanacontinuacinconstituyenunamuestra aleatoria de nueve empresas tomadas de la seccin (Resumen de Informes deIngresos)enLaBolsadeValoresdeLima,del6defebrerode2003. Fuerondiferenteslosingresosporaportacinpromedioen2002y2003? Pruebe con un nivel de significancia=0,02 Empresa123456789 20021,381,263,643,502,473,211,051,982,72 20032,451,504,593,062,112,801,590,920,47 86CARRERAS PROFESIONALESCIBERTEC10.Anuevecomercializadoresdecomponentesparacomputadorasque operanenlasprincipalesreasmetropolitanasselespidilospreciosde dos impresoras lser parecidas, con anchos estndar. Los resultados de la investigacin estn dados en la siguiente tabla. A un nivel de =0,05, es razonable afirmar que, en promedio, la impresora Apple es ms barata que la impresora Akita? Comerciante123456789 Precio Apple$350419385360405395389409375 Precio Akita$370425369375389385395425400 Para recordar Para una prueba de hiptesis se deber tener en cuenta en los datos, que tienen que ser de muestra, como la media muestral y la desviacin estndar muestral. ESTADI STI CAI I 87 CIBERTECCARRERAS PROFESIONALES

PRUEBA DE HIPTESISPRUEBA DE HIPTESISPRUEBA DE HIPTESISPRUEBA DE HIPTESISPARA LAS PROPORCIONES PARA LAS PROPORCIONES PARA LAS PROPORCIONES PARA LAS PROPORCIONES TEMAS Prueba de Hiptesis para las proporciones, muestras grandes Prueba bilateral de una hiptesis sobre las proporciones Prueba unilateral de una hiptesis sobre la media, caso I, caso II Prueba de Hiptesis para la diferencia entre dos proporciones OBJETIVOS ESPECFICOS Describir la hiptesis nula y la hiptesis alternativa de un problema Determinarunaestadsticadepruebalgicayunaregladedecisinpara probar las hiptesis para las proporciones .CONTENIDOS Prueba de Hiptesis para las proporciones, muestras grandes Prueba bilateral de una hiptesis sobre las proporciones Prueba unilateral de una hiptesis sobre la media, caso I, caso II Prueba de Hiptesis para la diferencia entre dos proporciones .ACTIVIDADES Utilizan e interpretan el concepto de prueba de hiptesis Tomandecisionesdeaceptacinorechazodeunahiptesisbajociertas consideraciones tratadas S E S E S E S E MA N A MA N A MA N A MA N A8 88CARRERAS PROFESIONALESCIBERTECPRUEBA DE HIPTESIS PARA LAS PROPORCIONES Laspruebasdehiptesisconrelacinalasproporcionessonbsicamente iguales a las medias relativas. Se ha de probar la hiptesis de la proporcin de xitos en un proceso de Bernoulli Los pasos para la prueba de hiptesis 1.Seformulalahiptesisnulaylahiptesisalternativadeacuerdoconel problema. a) oo oHH =::1b)oo oHH 1Z Z P5. Se calcula x de la muestra de tamao n, luego se obtiene Z ) 1 (o oop npnp xZ=npZo oo) 1 ( = 6. Se compara Z con Zo Si Z > Z 1- + 1Z Z, se rechaza la hiptesis nula Ho Si Z < Z 1- 1, Z Z , se acepta la hiptesis nula Ho 90CARRERAS PROFESIONALESCIBERTEC

Regin de Aceptacin Regin de Rechazo 0 1Z

PRUEBA BILATERAL DE UNA HIPTESIS SOBRE LA MEDIA Prueba de significancia de dos colas 1.Se formula la hiptesis nula y la hiptesis alternativa oo oHH =::1 2.Se escoge el nivel de significancia 3.UnaestadsticadepruebaesunavariablealeatoriabinomialXquetiene una distribucin binomial, cuando n es pequeo se utiliza esta distribucin.4.LareginAceptacin(R.A.)es b a, ,dondeaybsontalque [ ] = < < 1 b X a P . Porlasimetradelacurvanormal,losvalorescrticosdeaybson simtricos con respecto a o =(((((

1) 1 ( ) 1 ( ) 1 (0nbnpnapo ooooo oo Luego, la regin de aceptacin: ((

+nZnZo ooo oo) 1 ( ,) 1 (2 / 2 / 5. Se calcula x de la muestra de tamao n; luego, se obtiene Z ) 1 (o oop npnp xZ=npZo oo) 1 ( = ESTADI STI CAI I 91 CIBERTECCARRERAS PROFESIONALES

5.Se compara Z con Z /2 Si 2 /,Z Z0+ + ,2 / Z Z , se rechaza la hiptesis nula Ho Si + 2 / 2 /, Z Z Z , se acepta la hiptesis nula Ho Regin de Rechazo Regin de Aceptacin Regin de Rechazo

2 / Z0 2 / Z PRUEBA DE HIPTESIS PARA DIFERENCIA DE MEDIAS En este caso: La hiptesis nula toma la forma: = =2 1:oHHiptesis alternativa: a)2 1 1: H 0 :2 1 1 Hb) 2 1 1: H 0 :2 1 1 Hc) 2 1 1: H0 :2 1 1 HLos parmetros 2 1 y son las proporciones de xitos de dos poblaciones. La estadstica de prueba en la cual se basan los criterios de decisin es la variable aleatoria 1p y2p quetieneunadistribucinaproximadamentenormalcuando lasmuestrassongrandes,ylavariablealeatoriaZqueesaproximadamente normal estndar. 22 211 12 1 2 1) 1 ( ) 1 () ( ) (n np pZ + = Se seleccionan muestras aleatorias independientes de tamao n1 y n2 de cada poblacin binomial respectivamente. Se calcula la proporcin de xito 1p y2p de cada muestra. Siendo 111nxp =y 222nxp =,dondex1yx2eselnmerodexitosdela muestra n1 y n2 respectivamente, entonces: 92CARRERAS PROFESIONALESCIBERTEC 22 211 12 1) 1 ( ) 1 () (n np pZ += )1 1)( 1 () (2 11 12 1n np pZ+ = EselvalordelanormalestndarcuandoHoesverdadera,siendon1yn2 grandes. Para calcular Z se debe hallar el valor de a partir de su estimador p 2 12 1n nx xp++= Luego, el valor de verdad de la estadstica Z es: )1 1)( 1 () (2 12 1n np pp pZ+ = Desviaciones Estndar Conocidas, Muestras Grandes Prueba Unilateral Caso I: 1.Considrese la siguiente hiptesis: 2 1: =oH o0 :2 1= oH2 1 1: H 0 :2 1 1 H2.Se escoge el nivel de significancia 3.Laestadsticadepruebaeslavariablealeatoria ) (2 1 p p quetieneuna distribucin aproximadamente normal cuando n1 y n2 grandes. Es decir, la variable aleatoria: 22 211 12 1) 1 ( ) 1 () (n np pZ += Suponiendo que Ho sea verdadera. 4.La regin crtica (R.C.) es 1Z Z , para la hiptesis alternativa 2 1 1: H 5.Se calcula 111nxp = y 222nxp =, luego 2 12 1n nx xp++= Luego, se halla: )1 1)( 1 () (2 12 1n np pp pz+ = ESTADI STI CAI I 93 CIBERTECCARRERAS PROFESIONALES

6.Conclusin: si z se encuentra en la regin crtica+ ,1Z , se rechaza Ho, en caso contrario se acepta.

Regin de Aceptacin Regin de Rechazo 0 1Z Caso II: 1.Considrese la siguiente hiptesis: 2 1: =oH o0 :2 1= oH2 1 1: H 0 :2 1 1 H2. Se escoge el nivel de significancia . 3.Laestadsticadepruebaeslavariablealeatoria ) (2 1 p p quetieneuna distribucinaproximadamentenormalcuandon1yn2grandes.Esdecir,lavariable aleatoria: 22 211 12 1) 1 ( ) 1 () (n np pZ += Suponiendo que Ho sea verdadera. 3. La regin crtica (R.C.) es Z Z , para la hiptesis alternativa 2 1 1: H 4. Se calcula 111nxp = y 222nxp =, luego 2 12 1n nx xp++= Luego, se halla: )1 1)( 1 () (2 12 1n np pp pz+ = 5.Conclusin:sizseencuentraenlaregincrtica Z , ,serechazaHo, en caso contrario se acepta. 94CARRERAS PROFESIONALESCIBERTEC Regin de Rechazo Regin de Aceptacin Z 0 Prueba Bilateral 1.Considrese la siguiente hiptesis: 2 1: =oH o0 :2 1= oH 2 1 1: H0 :2 1 1 H2.Se escoge el nivel de significancia 3.Laestadsticadepruebaeslavariablealeatoria ) (2 1 p p quetieneuna distribucin aproximadamente normal cuando n1 y n2 grandes. Es decir, la variable aleatoria: 22 211 12 1) 1 ( ) 1 () (n np pZ += Suponiendo que Ho sea verdadera. 4.Laregincrtica(R.C.)es 2 / Z Z o 2 / 1 + Z Z ,paralahiptesis alternativa 2 1 1: H 5.Se calcula 111nxp = y 222nxp =, luego 2 12 1n nx xp++= Luego, se halla:)1 1)( 1 () (2 12 1n np pp pz+ = 6. Conclusin: si z se encuentra en la regin crtica Z ,o+ +,1Z , se rechaza Ho, en caso contrario se acepta. ESTADI STI CAI I 95 CIBERTECCARRERAS PROFESIONALES

Regin de Rechazo Regin de Aceptacin Regin de Rechazo

2 / Z0 2 / Z ACTIVIDADES 1.Un fabricante de lavadoras automticas produce un modelo en tres colores diferentesA,ByC.Delasprimeras1000lavadorasvendidasseobserva que400fuerondecolorA.concluirustedquemsde1/3detodoslos clientes tienen preferencia por el color A? use= 0,01. 2.El director de cierto colegio muy famoso cree que, en parte debido al estatus econmicodelospadres,elporcentajedelosquehanterminado secundariaqueasistenaestecolegioesmayorqueelpromediodela ciudad.Enelperododeloscincoaosprecedentes,el20%detodoslos que terminaron secundaria de la ciudad entraron a la Universidad, mientras que en el mismo perodo, 350 de los 1500 exalumnos de su colegio entraron a la Universidad. Se justifica que el director diga que el porcentaje de sus exalumnosqueentraronalaUniversidadessignificativamentemayorque 20%?Pruebe con el nivel de significacin del 1%. 96CARRERAS PROFESIONALESCIBERTEC 3. Un fabricante de blusas de vestir para mujer sabe que su marca se vende en 19% de las tiendas de ropa para mujer que estn en el jirn de la Unin. Se muestre,recientemente,85tiendasderopademujerenGamarray encontrque14,12%delastiendasvendanlamarca.Anivelde significancia del 0,04, Existe evidencia de se tiene una peor distribucin en Gamarra que en el jirn de la Unin? 4.Unfabricantedecigarrillosaseguraqueel20%delosfumadoresde cigarrillosprefierenA.Paraprobarestaaseveracintomaunamuestrade 20 fumadoresdecigarrillosyselepregunta porlamarcaqueprefieren.Si delos20 fumadores, 6prefierenlamarcaA,quconcluye?Useunnivel de significancia del 0.01. ESTADI STI CAI I 97 CIBERTECCARRERAS PROFESIONALES

5.Una oficina de relaciones familiares de la DEMUNA informa que el 50% de los matrimonios que viven en la cuidad de Lima llegan al juzgado de paz de Limaparainiciarsudivorciodentrodesuprimeraodecasados.Qu conclusin puede sacarse de la validez de este informe, si de una muestra aleatoriade400matrimonios,slo208fueronaljuzgadodepazdeLima para iniciar su divorcio, dentro de su primer ao de casados? Utilice un nivel de significancia igual a0.01. 6.En una conferencia de prensa, una alta autoridad anuncia que el 90% de los habitantesadultosdelaciudaddeLimaestnafavordeciertoproyecto econmicodelgobierno.Enunamuestraaleatoriade625adultosse observque540estnafavordelproyecto.Siusteddesearechazarla hiptesisverdaderanomsdeunaenvezde100.Concluiraquela popularidad del proyecto ha sido exagerada por la autoridad? 7.Unagrancadenahoteleraesttratandodedecidirsiconviertemsdesus habitacionesencuartosparanofumadores.Enunamuestraaleatoriade 400huspedestomadaelaoanterior,166 destospidieronhabitaciones paranofumadores.Esteao,205huspedesdeunamuestrade380 prefirieroncuartoparano fumadores.Recomendaraustedquelacadena dehotelesdestinemshabitacionesanofumadores?Apoyesu 98CARRERAS PROFESIONALESCIBERTECrecomendacinprobandolahiptesisapropiadaaunniveldesignificancia de 0,01. 8. Una planta de energa elctrica operada con carbn est considerando dos sistemas diferentes para abatir la contaminacin del aire. El primer sistema hareducidolaemisindecontaminantesanivelesaceptables68%del tiemposegnsedeterminde200muestrasdeaire.Elsegundosistema, queesmscaro,hareducidolaemisindecontaminantesaniveles aceptables76%delasveces,segnqueddeterminadode250muestras deaire.Sielsistemacaroessignificativamentemseficienteenla reduccindecontaminantesanivelesaceptablesqueelotrosistema, entonces el administrador de la planta deber instalar el sistema caro. Cul sistema ser instalado si la administracin utiliza un nivel de significancia de 0,02 al tomar la decisin? 9.Ungrupodefisilogosestllevandoacabopruebasenpacientespara determinarlaefectividaddeunanuevamedicinacontralahipertensin.Los pacientes con alta presin sangunea fueron escogidos al azar y luego fueron asignados,aleatoriamentetambin,aungrupodecontrol(dondeson tratados con un medicamento contra la hipertensin conocido) o al grupo de tratamiento(enelcualrecibierontratamientoconlanuevamedicina.Los mdicos registraron el porcentaje de pacientes cuya presin arterial se redujo ESTADI STI CAI I 99 CIBERTECCARRERAS PROFESIONALES

a un nivel normal despus de un ao de tratamiento. Al nivel de significancia de0,01,pruebelashiptesisapropiadasparadeterminarsilanueva medicinaessignificativamentemsefectivaparareducirlapresin sangunea que la medicina vieja. GrupoPorcin que mejorNmero de pacientes Tratamiento0,45120 Control0,36150 10. Una muestra aleatoria de 100 hombres fue tomada de la ciudad de Lima y seencontrque60semostraronafavorsobreunaleydeldivorcio.Una muestraalazarde100mujeresescogidasdelamismaciudadrevelque 40 de ellas estn a favor de dicha ley. Esigual la proporcin de hombres que de mujeres que favorecen una nueva ley sobre el divorcio? Use un nivel de significancia de 0,05. 100CARRERAS PROFESIONALESCIBERTECAutoevaluacin 1.Deuntotalde10200prstamosotorgadosporunacooperativadecrdito en los ltimos cinco aos, 350 se muestrearon para determinar qu porcin de prstamos se otorgaron a mujeres. Esta muestra indic que 39% de los crditosfuerondadosaempleadas.Uncensocompletodeprstamosde hacecincoaosmostrabaqueel41%delosprestatarioseranmujeres.A unniveldesignificanciade0,02,puedeconcluirquelaporcinde prstamosotorgadosamujereshacambiadosignificativamenteenlos ltimos cinco aos? 2.LoslaboratoriosGnovaseespecializanenelusodetcnicasde reproduccindegenesparalograrnuevoscompuestosfarmacuticos. Recientemente, desarroll un atomizador nasal que contiene interfern, con el que se cree habr de limitarse la transmisin del resfriado comn en las familias. En la poblacin general, a 15,1% les dar gripe ocasionada por el rota virus una vezque otro miembro de la familia ha contrado tal gripe. El atomizadordeinterfernfueprobadoen180personas,encuyasfamilias unodelosmiembroscontrajo,posteriormente,unagripeocasionadapor Rota Virus. Slo 17 de los sujetos de la prueba desarroll gripes similares. A un nivel de significancia de 0,05, debera concluir Gnova que el nuevo atomizador, efectivamente, reduce la transmisin de la gripe? 3.Algunostericosfinancieroscreequelospreciosdiariosdelmercadode valoresconstituyenunpaseoazarosoconrumbopositivo.Siestoes exacto,entonceselpromedioindustrialDowJonesdeberamostraruna gananciaenmsde50%detodoslosdasdeactividadfinanciera.Siel promedioseincrementen101de175dasescogidosaleatoriamente, Qu piensa de la teora sugerida? Use un nivel de significancia de 0,01. 4.El instituto de caf afirma que al menos el 40% de la poblacin de adultos tomenregularmenteunatasadecafduranteeldesayuno.Unamuestra aleatoriade450individuosrevelque200deelloserantomadores regularesdecafeneldesayuno.Culeselvalorprobableparauna pruebadehiptesisquebuscamostrarquelaafirmacindelInstitutodel Caf es correcta? (Sugerencia: Pruebe H0:p = 0,04, contra H1:p > 0,4) 5.Un fabricante de salsa de tomate est en proceso de decidir si produce una nuevamarcaextrapicante.Eldepartamentodeinvestigacindemercado de la compaa emple una encuesta telefnica nacional de 6000 hogares y encontrquedichoproductoseracompradopor335delosencuestados. Un estudio mucho ms extenso, realizado hace dos aos, mostraba que 5% deloshogareseneseentonceshabrancompradolasalsa.Aunnivelde significanciade2%,deberalacompaaconcluirqueahoraexisteun mayor inters en el nuevo producto? 6.ACEHomeCentervendepodadoras Steeleyestinteresadaen comparar lacalidaddelaspodadorasquevendeconlaspodadorasSteelequese venden a nivel nacional. La ferretera sabe que slo 15% de stas requieren ESTADI STI CAI I 101 CIBERTECCARRERAS PROFESIONALES

reparaciones durante el primer ao despus de su compra. Una muestra de 120 de los clientes de ACE revel que, exactamente, 22 de ellos requirieron reparaciones para sus podadoras en el primer ao despus de su compra. Alniveldesignificanciade0,02,existeevidenciadequelaspodadoras Steele difieren en calidad de las que se venden a nivel nacional? 7.En un da promedio, alrededor de 5% de los valores de la Bolsa de Valores deNuevaYorkmuestranunanuevaalzaparaesteao.Elviernes18de septiembre de 1992, el promedio industrial Dow Jones cerr en 3282 con un fuertevolumende,aproximadamente,136millonesdettulosnegociados. Unamuestraaleatoriade120ttulosdeterminquediecisisdeellos habanmostradonuevasalzasanualeseseda.Usandounnivelde significancia de 0,01, se debera concluir que ms ttulos de los habituales tuvieron alzas anuales ese da? 8.Enrespuestaalascrticasconcernientesalosextravosenelcorreo,el serviciopostalinicinuevosprocedimientospararesolverelproblema.Al directorgeneraldecorreosseleasegurquedichocambioreduciralos extravospordebajodelhistricondicede prdidasde0,3%.Despusde dosmesesdehabersepuestoenmarchalosnuevosprocedimientos,el servicio postal patrocin una investigacin en la que un total de 8000 piezas decorreofueronenviadasdesdediferentespartesdelpas.Dieciochode estas piezas de prueba no alcanzaron su destino. A un nivel de significancia de0,10,puedeeldirectorgeneraldecorreosconcluirquelosnuevos procedimientos consiguieron su objetivo? 9.Un jefe de personal pensaba que el 18% de los empleados de la compaa trabajaban horas extra cada semana. Si la porcin observada esta semana esde13%enunamuestrade250delos2500empleados,sepuede aceptarquesuopininesrazonableosedebeconcluirqueesms apropiado otro valor? Use =0,05. 10. Una corredora de bolsa afirma que ella puede predecir, con 85% de certeza, elascensoocada,duranteelmessiguiente,deunvalordelmercadode valores. Para probarlo, predice el resultado de 60 valores y acierta en 45 de suspredicciones.Presentanestosdatosevidenciaconcluyente(con= 0,04)dequelaexactituddesusprediccionesessignificativamentemenor que el declarado 85%? 11. Unfabricantedesuplementosvitamnicosparaneonatosincluyeuncupn para una muestra gratis de este producto en la canasta que es distribuida a los nuevos padres en las clnicas. Con regularidad, aproximadamente 18% deloscuponeshansidocanjeados.Dadalatendenciaactualdetener menos hijos e iniciar una familia ms tarde, la empresa se imagina que los padresactualesestnmejoreducadosenpromedioy,comoresultado,es msprobablequeutilicenunsuplementovitamnicoparasushijos.Una muestrade1500nuevospadrescanje295cupones.Respaldaeste hecho,aunniveldesignificanciade2%,laopinindelacompaacon respecto a los actuales nuevos padres? 102CARRERAS PROFESIONALESCIBERTEC12. Se estima que alrededor del 52% de hogares limeos son suscriptores de la televisinporcable.LoseditoresdelarevistaCableymsestaban segurosdequesuslectorestenansuscripcinporcableenunpromedio msaltoquelapoblacinengeneralyqueranusarestehechopara ayudar a vender este espacio de publicidad para los canales de estreno por cable.Paraverificaresteparecer,muestrearona250suscriptoresdela revistayencontraronque146deellostenansuscripcinatelevisinpor cable. A un nivel de significancia de 2%. los datos de la encuesta apoyan el parecer de los editores? P PP Para recordar ara recordar ara recordar ara recordar En una prueba de hiptesis de proporciones, se debe tener en claro el anlisis porcentual del problema. ESTADI STI CAI I 103 CIBERTECCARRERAS PROFESIONALES

PRUEBA DE BONDAD DE AJUSTE PRUEBA DE BONDAD DE AJUSTE PRUEBA DE BONDAD DE AJUSTE PRUEBA DE BONDAD DE AJUSTE TEMAS Definicin del x (Chi cuadrado). Ensayos de significacin Prueba de bondad de ajuste. Tablas de contingenciaPrueba de Kolmogorov-Smirnov Correlacin de yates para la continuidad. Coeficientes de contingencias OBJETIVOS ESPECFICOS Probarhiptesisquemsdedosproporcionesdepoblacinpuedenser consideradas iguales Uso de la prueba del Chi cuadrado .CONTENIDOS Definicin del x Ensayos de significacin Prueba de bondad de ajuste. Tablas de contingencia Correlacin de la continuidad. Coeficientes de contingencias Prueba de Kolmogorov-Smirnov ACTIVIDADES Identifican las diferentes definiciones existentes en estadstica. Analizan las diferentes formas de una investigacin estadstica. S E S E S E S E MA N A MA N A MA N A MA N A9 104CARRERAS PROFESIONALESCIBERTECPRUEBA DE BONDAD DE AJUSTEFRECUENCIAS OBSERVADAS y TERICAS Comoyasehavistomuchasveces,losresultadosobtenidosdemuestrasno siempre concuerdan exactamente con los resultados tericos esperados, segn lasreglasdeprobabilidad.Porejemplo,aunqueconsideracionestericas conduzcanaesperar50carasy50crucescuandoselanza100vecesuna moneda bien hecha, es raro que se obtengan exactamente estos resultados. Supngasequeenunadeterminadamuestraseobservanunaseriede posibles sucesos E1, E2, E3,..., Ekque ocurren con frecuencias O1, O2, O3,...., Okllamadasfrecuenciasobservadasyque,segnlasreglasdeprobabilidad, seesperaqueocurranconfrecuenciase1,e2,e3,...,ekllamadasfrecuencias tericas o esperadas. SucesoE1E2Es...Ek Frecuencia observadaO1O2Os...Ok Frecuencia esperadae1e2es...ek DEFINICIN DE 2 (Chi cuadrado)Unamedidadeladiscrepanciaexistenteentrelasfrecuenciasobservadasy esperadas es suministrada por el estadstico 2 , dado por ( ) ( ) ( )( )==+ ++=Kj jj jkk kee Oee Oee Oee O122222 2121 1 2... Donde si el total de frecuencias es n, = = n e Oj j Una expresin equivalente es ( )neOKj jj = =122Si02= lasfrecuenciasobservadasytericasconcuerdanexactamente; mientras que si02> , no coinciden exactamente. A valores mayores de 2 , mayores son las discrepancias entre las frecuencias observadas y esperadas. La distribucin muestral de 2 se aproxima muy estrechamente a la distribucin Chi cuadrado 221) 2 (212) ( = e Y Yo 221) 2 () (= e Y Yo Si las frecuencias esperadas son al menos iguales a 5, la aproximacin mejora para valores superiores. ESTADI STI CAI I 105 CIBERTECCARRERAS PROFESIONALES

El nmero de grados de libertad v est dado por (a)1 = k silasfrecuenciasesperadaspuedencalcularsesintenerque estimarparmetrospoblacionalesconlosestadsticosmuestrales. Advirtasequeelrestar1akesacausadelacondicinrestrictiva ( = = n e Oj j) que denota que si son conocidas k - 1 de las frecuencias esperadas, la frecuencia restante puede ser determinada. (b)m k = 1 silasfrecuenciasesperadassolamentepuedencalcularse estimandomparmetrosdelapoblacinapartirdelosestadsticos muestrales. ENSAYOS DE SIGNIFICACIN Enlaprctica,lasfrecuenciasesperadassecalculandeacuerdoconuna hiptesisHo.Sibajoestahiptesiselvalorcalculadode 2 dadopor (( )==Kj jj jee O122 o ( )neOKj jj = =122 )esmayorquealgnvalorcrtico(tal como 295 ,. 0o 299 ,. 0que son los valores crticos a los niveles de significacin de 0,05y0,01respectivamente),sededucequelasfrecuenciasobservadas difierensignificativamentedelasesperadasyserechazaHoalnivelde significacin correspondiente. En caso contrario, se aceptar o al menos no se rechazar.Esteprocedimientosellamaensayoopruebadechicuadrado de la hiptesis. Debe advertirse que en aquellas circunstancias en que 2 est muy prximo a cerodebemirarseconciertorecelo,puestoqueesraroquelasfrecuencias observadasconcuerdendemasiadobienconlasesperadas.Paraexaminar tales situaciones, se puede determinar si el valor calculado de 2 es menor que 205 , 0o 201 , 0en cuyos casos se decide que la concordancia es bastante buena a los niveles de significacin de 0,05 a 0,01 respectivamente.. PRUEBA DE BONDAD DE AJUSTE: POBLACIN MULTINOMIAL Es el caso en que cada elemento de una poblacin se asigna a una y slo una de varias clases o categoras. Esa poblacin se llama poblacin multinomial. La distribucinmultinomialdeprobabilidadessepuedeconcebircomounaam-pliacindeladistribucinbinomialparaelcasodetresomscategorasde resultados.Encadaensayo,intentoopruebadeunexperimentomultinomial slosepresentaunoyslounodelosresultados.Cadaintentodel experimento se supone independiente, y las probabilidades deben permanecer igual para cada prueba. Resumen de la prueba de bondad de ajuste para distribucin multinomial 1. Enunciar las hiptesis nula y alternativa Ho: La poblacin se apega a una distribucin normal de probabilidades con probabilidades especificadas para cada una de las k categoras. 106CARRERAS PROFESIONALESCIBERTECHa: La poblacin no se apega a una distribucin multinomial de probabilidades, con probabilidades especificadas para cada una de las k categoras. 2. Tomarunamuestraaleatoriayanotarlasfrecuenciasobservadas jO ,para cada categora 3.Suponiendoquelahiptesisnulaescierta,determinarlafrecuencia esperada. je ,encadacategora,multiplicandolaprobabilidaddela categora por el tamao de la muestra 4.Calcular el valor del estadstico de prueba ( )==Kj jj jee O1225.Regla de rechazo: Rechazar Ho si2 2 >endondeaeselniveldesignificanciaparalaprueba,ylosgradosde libertad son (k 1) EnlaspruebasdeChicuadradoparabondaddeajuste,lareginderechazo siempreestenlacolasuperior.Lasdiferenciasentrelasfrecuencias observadas y esperadas se elevan al cuadrado, y las mayores diferencias originan mayores valores de 2 . En muchas aplicaciones, la prueba de bondad de ajuste consiste en elegir una muestra y observar lacategoraalaquepertenececadaunidadmuestreada. En tales casos se debe tener cuidado de elegiruna muestraaleatoria. Sino es as, no se cumplir la hiptesis de independencia. TABLAS DE CONTINGENCIA Lastablasdeclasificacindobleotablashxk,enlasquelasfrecuencias observadasocupanhfilasykcolumnas.Talestablassellamanamenudo tablas de contingencia. SucesoE1E2Es...Ek Frecuencia observadaO1O2Os...Ok Frecuencia esperadae1e2es...ek Correspondindoseconcadafrecuenciaobservadaenunatablade contingencia h x k, hay una frecuencia terica o esperada que se calcula bajo algunahiptesisysegnlasreglasdeprobabilidad.Estasfrecuenciasque ocupanlascasillasdeunatabladecontingenciasellamanfrecuencias elementales.Lafrecuenciatotaldecadafilaocolumnaeslallamada frecuencia marginal. Paraestudiarelacuerdoentrelasfrecuenciasobservadasyesperadas,se calcula el estadstico ESTADI STI CAI I 107 CIBERTECCARRERAS PROFESIONALES

( )==Kj jj jee O122donde la suma se extiende a todas las casillas de la tabla de contingencia, los smbolos jO y je representan,respectivamente,lasfrecuenciasobservadasy esperadasenlacasillaj.Estasuma,queesanlogaa(I),contienehk trminos.Lasumadetodaslasfrecuenciasobservadassedenotapornyes igual a la suma de todas las frecuencias esperadas ( = = n e Oj j). Comoantes,elestadstico ( )==Kj jj jee O122 tieneunadistribucinmuestral muyestrechamenteaproximadaaladadapor 221) 2 () (= e Y Yo,contalde quelasfrecuenciasesperadasnoseandemasiadopequeas.Elnmerode grados de libertad de esta distribucin Chi cuadrado est dado para h > 1, k > 1 por (a)) 1 )( 1 ( = k h silasfrecuenciasesperadaspuedencalcularsesintener que estimar parmetros poblacionales con los estadsticos muestrales.(b)m k h = ) 1 )( 1 ( silasfrecuenciasobservadaspuedensolamente calcularse estimando mparmetrospoblacionalesconlosestadsticos muestrales. LasfrecuenciasesperadassonhalladasbajounadeterminadahiptesisHo. Unahiptesisnormalmentesupuestaesladequelasdosclasificacionesson independientes entre s. Lastablasdecontingenciapuedenextenderseaunnmeromayorde dimensiones.As,porejemplo,sepuedentenertablashxkx1dondeestn presentes 3 clasificaciones. FRMULAS PARA EL CLCULO DE 2SepuedenobtenerfrmulassencillasparaelclculodeXZquesebasen nicamenteenlasfrecuenciasobservadas.Enloquesiguesedanlos resultados para tablas de contingencia 2 x 2 y 2 x 3. Tablas 2 x 2 b an n n nb a b a n2 121 2 2 1 2) ( = IIITotales A 1a2aanB 1b2bbnTotales 1n2nn Tablas 2 x 3 108CARRERAS PROFESIONALESCIBERTECnnbnbnbnnnananannb a((

+ + +((

+ + =323222121323222121 2 IIIIIITotales A 1a2a3aanB 1b2b3bbnTotales 1n2n3nn COEFICIENTE DE CONTINGENCIA Unamedidadelgradoderelacin,asociacinodependenciadelas clasificaciones en una tabla de contingencia es dada por: nC+=22 Se llama coeficiente de contingencia. A mayor valor de C, mayor es el grado de asociacin.Elnmerodefilasycolumnasdelatabladecontingencia determina el valor mximo de C, que no es nunca superior a uno. Si el nmero de filas y columnas de una tabla de contingencia es igual a k, el mximo valor de C viene dado pork k / ) 1 ( CORRELACIN DE ATRIBUTOS Comolasclasificacionesdeunatabladecontingenciadescribenamenudo caractersticas de individuos u objetos, se denotan a veces como atributos y el grado de dependencia, asociacin o relacin se llama correlacin de atributos. Para tablas kxk se define ) 1 (2=k nr Comoelcoeficientedecorrelacinentreatributosoclasificaciones.Este coeficiente se encuentra entre 0 y 1 LA PRUEBA DE KOLMOGOROV-SMIRNOV La prueba de Kolmogorov-Smirnov, bautizada as en honor de los estadsticos A.N.KolmogorovyN.V.Smirnovquienesladesarrollaron,setratadeun mtodo no paramtrico sencillo para probar si existe una diferencia significativa entre una distribucin de frecuencia observada y otra de frecuencia terica. La pruebaK-Ses,porconsiguiente,otramedidadelabondaddeajustedeuna distribucindefrecuenciaterica,comoloeslapruebaChicuadrada.Sin embargo,lapruebaK-Stienevariasventajassobrelaprueba 2 :esuna prueba ms poderosa, y es ms fcil de utilizar, puesto que no requiere que los datos se agrupen de alguna manera. La estadstica K-S, Dn, es particularmente til para juzgar qu tan cerca est la distribucin de frecuencia observada de la distribucin de frecuencia esperada, ESTADI STI CAI I 109 CIBERTECCARRERAS PROFESIONALES

porque la distribucin de probabilidad de Dn depende del tamao de muestra n, peroesindependientedeladistribucindefrecuenciaesperada(Dnesuna estadstica de "distribucin libre"). Un problema que ilustra la prueba K-S SupngasequelacentraltelefnicadellaciudaddeArequipahaestadolle-vando un registro del nmero de "transmisores" (un tipo de equipo automtico queseutilizaenlascentralestelefnicas)usadosenuninstantedado.Las observacionessehicieronen3,754ocasionesdistintas.Parapropsitosde planeacindeinversindecapital,elfuncionariodepresupuestodeesta compaapiensaqueelpatrndeusosigueunadistribucindePoissoncon una5 , 8 = .Sideseaprobarestahiptesisalniveldesignificanciade0,01, puede emplear la prueba K-S: La hiptesis se formulara de la siguiente manera: Ho: Una distribucin de Poisson con5 , 8 = es una buena descripcin del patrn de uso. H1: Una distribucin de Poisson con5 , 8 = no es una buena descripcin del patrn de uso. 01 , 0 = nivel de significancia para probar estas hiptesis A continuacin, se enumeran los datos que se observan en la tabla. Luego, se enumeranlasfrecuenciasobservadasylastransformaenfrecuencias acumulativas observadas relativas. En la tabla se enumeran las frecuencias acumulativas observadas relativas Fo, frecuenciasacumulativasrelativasesperadasFeylasdesviacionesabsolutaspara22 ....., 1 , 0 = = = x x x luegolasfrecuenciasrelativasesperadas! xefex =Clculo de la estadstica K-S Para calcular la estadstica K-S, simplemente elija Dn, la desviacin absoluta mxima de Fe, desde Fo, luegoestadstica K-S o e nF F D = En este ejemplo,Dn = 0,2582 en la observacin x = 9. UnapruebaK-Ssiempredebeserunapruebadeunextremo.Losvalores crticosparaDnsehantabuladoypuedenencontrarseenlatabladeValores crticos de bondad de ajuste de Kolmogorov-Smirnov. Se busca en la fila de n = 3,754(eltamaodemuestra)ylacolumnaparaunniveldesignificanciade 0,01,seencontrarqueelvalorcrticodeDndebecalcularseusandola frmula: nDn63 , 1=0266 , 0375463 , 1= =nDEl siguiente paso es comparar el valor calculado de Dn con el valor crtico de Dn que se encuentra en la tabla. Si el valor de la tabla para el nivel de significancia 110CARRERAS PROFESIONALESCIBERTECelegidoesmayorqueelvalorcalculadodeDn,entoncesseaceptarla hiptesis nula. Obviamente, 0,0266 < 0,2582, as que se rechaza Ho y se llega a la conclusin de que una distribucin de Poisson con5 , 8 = no es una buena descripcindelpatrndelusodeltransmisorenlacentraltelefnicadela ciudad de Arequipa. Nmero ocupado Frecuencia observada Frecuencia Acumulativa Observada Frecuencia Acumulativa Observada relativa Frecuencia Acumulativa Observada esperada Desviacin absoluta OOO0,00000,00020,0002 1550,00130,00190,0006 214190,00510,00930,0042 324430,01150,03010,0186 4571000,02660,07440,0478 51112110,05620,14960,0934 61974080,10870,25620,1475 72786860,18270,38560,2029 83781,0640,28340,52310,2397 94181,4820,39480,65300,2582 104611,9430,51760,76340,2458 114332,3760,63290,84870,2158 124132,7890,74*90,90910,1662 133583,1470,83830,94860,1103 142193,3660,89660,97260,0760 151453,5110,93530,98620,0509 161093,6200,96430,99340,0291 17573,6770,97950,99700,0175 18433,7200,99090,99870,0078 19163,7360,99520,99950,0043 2073,7430,99710,99980,0027 2183,7510,99920,99990,0007 2233,7541,00001,00000,0000 ACTIVIDADES 1.Durantelasprimeras13semanasdelatemporadadetelevisin,se registraronlasaudienciasdesbadoporla noche,de8:00p.m. a9:00 p. m. como sigue: ATV 29%, Amrica televisin 28%, Panamericana televisin 25%yotros18%.Dossemanasdespus,unamuestrade300hogares arrojlossiguientesresultadosdeaudiencia:ATV95hogares,Amrica televisin89hogares,Panamericanatelevisin70hogaresyotros46 hogares.Pruebe,con=0,05,sihancambiadolasproporcionesde telespectadores. ESTADI STI CAI I 111 CIBERTECCARRERAS PROFESIONALES

2.LaempresaNegusa,fabricantesdechocolatesconito,patrocinuna encuestanacionalen laquemsde10millonesdepersonasindicaronsu preferenciaparauncolornuevo.Elconteodeestaencuestadiocomo resultado el reemplazo del color chocolate por un nuevo color. En el folleto ColoresquepublicelDepartamentodeAsuntosdelConsumidordela mencionada empresa, la distribucin de los colores de chocolates es como sigue: CafAmarilloRojoNaranjaVerdeAzul 30%20%20%10%10%10% En un estudio que apareci en El Gourmet, se usaron muestras de bolsas deunalibraparadeterminarsieranvlidos losporcentajespublicados.Se obtuvieron los siguientes resultados con una muestra de 506 chocolates. CafAmarilloRojoNaranjaVerdeAzul 17713579413638 Use=0,05paradeterminarsiestosdatosrespaldanlosquepublicla empresa. 112CARRERAS PROFESIONALESCIBERTEC3.Seconocequelasactitudesnegativassonunmtodoefectivode persuasinenlapublicidad.Unestudiorealizadoporunaconocida universidad inform los resultados de un anlisis de contenido de anuncios culpososen24revistas.Lacantidaddeanunciosconactitudesdeculpa, que aparecieron en ellas, es la siguiente: Tipo de revistaCantidad de anuncios culposos Noticias de opinin20 Editorial general15 Orientadas a la familia30 Negocios y financieras22 Orientadas hacia la mujer16 Afro americanos12 Pruebe, con = 0,10, si hay una diferencia en la proporcin de anuncios con actitudes de culpa que se publican en las 6 clases de revistas. 4.Acontinuacin,seobservaunatabladecontingenciasde2x3,con frecuenciasobservadasenunamuestrade200.Pruebelaindependencia entrelasvariablesderenglnydecolumnausandolapruebax2con= 0,05. Variable de columna Variable de renglnABC P204450 Q302630 ESTADI STI CAI I 113 CIBERTECCARRERAS PROFESIONALES

5.Los puestos iniciales de los graduados en administracin y en ingeniera se clasifican por industria, como vemos en la tabla siguiente: Industria Licenciado enPetrleoQumicaElctricaComputacin Administracin30151540 Ingeniera30302020 Use = 0,01 y pruebe si hay independencia entre licenciatura y tipo de industria. 6.LarevistaVendomspublicunestudioenelqueseinformlos resultados de un anlisis de culpa y miedo en anuncios, en 24 revistas. Las cantidades de anuncios con actitudes de culpa y miedo que aparecieron en algunas revistas son las siguientes: Tipo de actitud Tipos de revistaCantidaddeanuncios con actitudes de culpa Cantidaddeanuncios conactitudesde miedo Noticias y opinin2010 Editorial general1511 Orientadahaciala familia 3019 Comercial o financiera2217 Orientada hacia la mujer1614 Afroamericana1215 Apliquelapruebajicuadradadeindependenciaconunnivelde significanciaiguala0,01paraanalizarlosdatos.Culessu conclusin? 114CARRERAS PROFESIONALESCIBERTEC 7.Losdatosdepartesdefectuosasprocedentesdetresproveedoressonlas siguientes. Calidad de las partes ProveedorBuenaDefectos pequeosDefectos graves A3037 B170187 C13569 Use=0,05ydemuestresihayindependenciaentreproveedory calidad de partes. Qu dice el resultado de su anlisis al departamento de compras? 8.UnestudiorealizadoporlarevistaColors,indicaqupersonasseles dificultams,hombresomujeres,comprarregalos.Supongaquese obtuvieronlossiguientesdatosenunestudiodeseguimientobasadoen 100 hombres y 100 mujeres. Sexo Ms difcil comprar regalo paraHombresMujeres Consorte3725 ESTADI STI CAI I 115 CIBERTECCARRERAS PROFESIONALES

Padres2831 Hijos719 Hermanos83 Parientes polticos410 Otros parientes1612 Use=0,05ypruebesihayindependenciaentre elsexoylapersona ms difcil para regalar. Cul es su conclusin? 9.J.J.Prez,vendedordelacompaaMovilSpeak,tienesiete cuentasque visitaralasemana.SepiensaquelasventasdelseorNelsonpueden describirsemedianteladistribucinbinomial,conprobabilidaddeventaen cadacuentade0.45.Examinandoladistribucindefrecuenciaobservada delnmerodeventasporsemanadelseorPrez,determinesila distribucincorresponde,enefecto,aladistribucinsugerida.Useelnivel de significancia de 0,05. Nmero de ventas por semana01234567 Frecuencia del nmero de ventas 2532614739211812 116CARRERAS PROFESIONALESCIBERTEC10. La siguiente es una tabla de frecuencias observadas, junto con las frecuencias que se esperan bajo una distribucin normal. 10.1 Calcule la estadstica K-S. 10.2Podemosconcluirqueestosdatos,enefecto,provienendeuna distribucin normal? Use el nivel de significancia de 0,10. Resultados de la prueba 51-6061-7071-8081-9091-100 Frecuencia observada 30100440500130 Frecuencia esperada 40170500390100 Autoevaluacin 1.Acontinuacin,seobservaunatabladecontingenciasde3x3,con frecuenciasobservadasenunamuestrade240.Pruebelaindependencia entrelasvariablesderenglnydecolumnausandolapruebax2con= 0,05. Variable de columna Variable de renglnABC P203020 Q306025 R101530 2.Una de las preguntas de una encuesta fue la siguiente: Durante los ltimos 12 meses, en viajes de negocios, qu tipo de boleto de avin compr con msfrecuencia?Lasrepuestasobtenidassevenenlasiguientetablade contingencias: Usando = 0,05 pruebe la independencia del tipo de vuelo y tipo de boleto. Cul es su conclusin? Tipo de vuelo ESTADI STI CAI I 117 CIBERTECCARRERAS PROFESIONALES

Tipo de boletoNacionalInternacional Primera clase2922 Clase de negocios o ejecutiva95121 Clase econmica518135 3.Las cantidades de unidades vendidas por tres agentes de ventas durante un periodo de tres meses aparecen a continuacin. Use = 0,05 y demuestre laindependenciaentreelvendedoryeltipodeproducto.Culessu conclusin? Producto VendedorABC Abanto14124 Marini21168 Noel15510 4.Unaencuestasobreeldeportepreferidotuvolossiguientesresultadosen hombres y mujeres: Deporte preferido SexoNatacinBsquetbolFtbol Hombres191524 Mujeres161816 Use = 0,05 y pruebe si las preferencias de hombres y mujeres son iguales. Cul es su conclusin? 5.Un estudio de niveles educativos de los votantes y su afiliacin poltica tuvo los siguientes resultados: Afiliacin al partido Nivel educativoApraPPCUPP No termin secundaria402010 Secundaria completa303515 Licenciatura304525 Use=0,01ydeterminesilaafiliacinpolticaesindependientedelnivel educativo de los votantes. 6.Halley Torres y Aarn Delguiudice son crticos de cine que, con frecuencia, difierenacercadelasmejorespelculas.Enunartculodeunarevista especializada,semencionanlosresultadosde160pelculasporpartede ambos crticos. Cada resultado puede ser Buena, Regular o Mala. Calificacin de Delguiudece Calificacin de TorresMalaRegularBuena Mala24813 Regular81311 Buena10964 118CARRERAS PROFESIONALESCIBERTECAplique la prueba Chi cuadrada de independencia, con nivel de significancia igual a 0,01 para analizar los datos. 7.Secreequeelnmerodeaccidentesautomovilsticosdiariosen determinadaciudadtieneunadistribucindePoisson.Enunamuestrade 80dasdelaopasadoseobtuvieronlosdatosdelatablaadjunta. Apoyanestosdatoslahiptesisdequelacantidaddiariadeaccidentes tiene una distribucin de Poisson? Use = 0,05. Cantidad de accidentesFrecuencia observada(das) 034 125 211 37 43 8.Suponga que la cantidad de llamadas telefnicas que entran al conmutador deunaempresaduranteintervalosdeunminutotieneunadistribucinde Poisson. Use =0,10 y los siguientes datos para probar la hiptesis de que las llamadas que entran tienen una distribucin de Poisson: Cantidad de llamadas que entran durante un intervalo de un minuto Frecuencia observada 015 131 220 315 413 54 62 Total100 9.Considerequelademandasemanaldeunproductotieneunadistribucin normal.Hagaunapruebadebondaddeajusteconlosdatosdelatabla siguiente para probar esta hiptesis. Use = 0,10. La media de la muestra es 24,5 y la desviacin estndar de la muestra es 3. 1820222722 2522272524 2623202426 2725192125 2625312925 2528262824 10. El 7% de inversionistas de fondos de ahorros valorizan como muy seguras a las acciones corporativas, el 58% las define como algo seguras, el 24% ESTADI STI CAI I 119 CIBERTECCARRERAS PROFESIONALES

comonomuyseguras,el4%comodefinitivamenteinseguras,yel7% notienenopinindefinida.Enunaencuestadeunarevista,sepregunta 529 inversionistas de fondos de ahorro cmo creen que es la seguridad de los bonos corporativos. Se obtuvieron las respuestas siguientes: Concepto de seguridadFrecuencia Muy seguras48 Algo seguras323 No muy seguras79 Definitivamente inseguras16 Sin opinin definida63 Total529 Difieren los conceptos de los inversionistas en bonos respecto a los que se tienendelasaccionescorporativas?Apoyesuconclusinconunaprueba estadstica con = 0,01. 11. Se desea abrir un paseo de aguas al pblico. Se ha pedido, a una muestra de140personas,decirqudapreferiranvisitarlo.Acontinuacin observamos los resultados. Entre semanaSbadoDomingoDa feriado 20204060 Para establecer un plan de personal, debe suponer el gerente que habr la mismacantidaddevisitantestodoslosdas?Basesuconclusinenuna prueba estadstica con = 0,05. 12. A una autoridad regional de transporte colectivo le preocupa la cantidad de pasajeros que van en una de las rutas del autobs. Al definir la ruta se crea que la cantidad de pasajeros era la misma de lunes a viernes. Con los datos de la tabla, pruebe, con = 0,05 si es correcta la hiptesis de la autoridad. Da Cantidad de pasajeros Lunes13 Martes16 Mircoles28 Jueves17 Viernes16 13. Los resultados de una Encuesta Anual de satisfaccin de trabajo indic que el 28% de los gerentes de sistemas de informacin est muy satisfecho con sutrabajo,el46%medianamentesatisfecho,el12%noestsatisfechoni insatisfecho,el10%estmedianamenteinsatisfechoyel4%estmuy insatisfecho.Supongaqueenunamuestrade500programadores obtuvieron los siguientes resultados. 120CARRERAS PROFESIONALESCIBERTECCategoraCantidad Muy satisfechos105 Medianamente satisfechos235 Ni satisfechos ni insatisfechos55 Medianamente insatisfechos90 Muy insatisfechos15 Hagaunapruebacon=0,05paradeterminarsilasatisfaccindelos programadoresesdiferentedeladelosgerentesdesistemasde informacin. 14. Unamuestradepartessuministrlosdatosdelasiguientetablade contingencias, acerca de calidad de parte y de turno en que fue producida. Use=0,05ypruebelahiptesisdequelacalidaddelasparteses independiente del turno en que fueron producidas. Cul es su conclusin? TurnoCantidad de buenasCantidad de defectuosas Primero36832 Segundo28515 Tercero17624 15. ElEstudio1996desuscriptoresdeElMercurioprodujodatosacercade lasclasesdeempleodesussuscriptores.Losresultadosdelamuestra correspondientes a suscriptores a las ediciones oriental y occidental son los siguientes: Regin Clase de empleoEdicin orientalEdicin occidental Tiempo completo110531 Tiempo parcial3115 Independiente / consultor229186 Sin empleo485344 Use=0,05ypruebelahiptesisdequelaclasedeempleoes independiente de la regin. Cul es su conclusin? 17.Alniveldesignificanciade0,05,podemosconcluirquelossiguientes datos provienen de una distribucin de Poisson con3 = ? Nmero de llegadas por da 012345 6 o ms Nmero de das61830241129 18.lvaroCarreo,gerentenacionaldeventasdeunacompaade electrnica, ha recabado la siguiente estadstica de salarios de los ingresos de la fuerza de ventas en su campo. Tiene tanto las frecuencias observadas comolasfrecuenciasesperadas.Siladistribucindesalariosesnormal; ESTADI STI CAI I 121 CIBERTECCARRERAS PROFESIONALES

puedeconcluirKevinqueladistribucindelosingresosdelafuerzade ventas es normal?. Al nivel de significancia de 0,10 Ingresos en miles 25-3031-3637-4243-4849-5455-6061-66 Frecuencia observada 922253021126 Frecuencia esperada 617323518134 Para recordar Para recordar Para recordar Para recordar Se deben plantear en forma adecuada la hiptesis nula para una mejor aplicacin de la prueba de bondad de ajuste. 122CARRERAS PROFESIONALESCIBERTEC ESTADI STI CAI I 123 CIBERTECCARRERAS PROFESIONALES

REGRESIN LINEAL SIMPLE REGRESIN LINEAL SIMPLE REGRESIN LINEAL SIMPLE REGRESIN LINEAL SIMPLE TEMAS AnlisisdeRegresinlinealSimple.Variableindependiente,variable dependiente Diagrama de dispersin. Mtodo de mnimos cuadrados Recta de mnimos cuadrados en trminos de varianzas muestralesRecta de regresin de mnimos cuadrados.Aplicacin e interpretacin OBJETIVOS ESPECFICOS Conocer la ecuacin de prediccin lineal Determinar la ecuacin de regresin lineal a partir de los datos observados CONTENIDOS Anlisis de Regresin lineal Simple Variable independiente, variable dependiente Diagrama de dispersinMtodo de mnimos cuadrados Recta de mnimos cuadrados en trminos de varianzas muestralesRecta de regresin de mnimos cuadrados.Aplicacin e interpretacin ACTIVIDADES Identificanel mtodo de regresin linealAnalizan la ecuacin de regresin lineal S E S E S E S E MA N A MA N A MA N A MA N A10 124CARRERAS PROFESIONALESCIBERTECANLISIS DE REGRESIN LINEAL SIMPLEAnlisis de Regresin El objetivo del anlisis de regresin es el de establecer una relacin cuantitativa entredosomsvariablesseleccionadas.Tratadeestablecerunmodeloque permitepredecir,explicaroestimarelvalordeunavariable(dependiente)en funcin de otras variables (independientes). Elmodeloaestablecerpuedetenerlaformadelaecuacindeunarecta (modelo lineal), de la ecuacin de una parbola, de la funcin logartmica, de la funcin exponencial. Asimismo, segn el nmero de variables independientes, elmodelopuedesersimple(unavariableindependiente)omltiple(msde una variable independiente). Paraestablecerculeselmodeloautilizar,esconvenienteelaborarun Diagrama de Dispersin. Regresin lineal simple Implica que se debe establecer un modelo que permita explicar a la variable Y (dependiente)enfuncindelavariableindependienteX.Enungrficode dispersin, lo que se trata de ajustar una lnea entre los puntos observados. Supuestos del anlisis de regresin lineal simple: a)Cada valor de las variables X e Y se distribuye normalmente. b)Lasmediasdelasdistribucionesnormales(decadaXeY)seencuentran sobre la recta de regresin. c)Las desviaciones estndar correspondientes son iguales. d)Los valores de Y son estadsticamente independientes. El modelo de regresin lineal simple tiene la forma: + = x b a yDonde: a:intercepto con el eje Y o la variacin de Y que no es explicada por x b:es la pendiente de la recta o el valor que vara Y cuando x aumenta en una unidad. Paracalcularestoscoeficientesseutilizaelmtododemnimoscuadradosa partir del cual se obtienen las siguientes frmulas: + = x b na y + =2x b x a xy ( )2 22xy xSSbx x ny x xy nb == ) ( ) y - y (2 x xSSxy x = Coeficiente de correlacin r: ESTADI STI CAI I 125 CIBERTECCARRERAS PROFESIONALES

( ) ( )y xy xS SSy y n x x ny x y x nr r 2222= = AlrealizarlaestimacindelavariabledependienteYutilizandolarectade regresin es obvio esperar que el resultado no sea exacto. Hay diferencias con res