MUESTREO ESTADISTICA APLICADA

download MUESTREO ESTADISTICA APLICADA

of 50

Transcript of MUESTREO ESTADISTICA APLICADA

El MUESTREO Y SUS APLICACIONES Poblacin y muestra Cul es el objeto de estudio? Conocer la muestra o la poblacin? Muestra Poblacin Resultados Investigador Muestreo Inferencia estadstica Muestra Censo DISEO DE LA MUESTRA Qu hacer cundo el objeto de estudio es muy grande? En el campo de las ciencias sociales, el investigador no puede estudiar a toda la poblacin.

Se debe utilizar la tcnica del muestreo. PROCESO DEL DISEO DE MUESTREO DEFINIR LA POBLACINMETA DETERMINAR EL MARCO DE MUESTREO SELECCIONAR LA TECNICA DE MUESTREO DETERMINAR EL TAMAO DE LA MUESTRA LLEVAR A CABO EL PROCESO DE MUESTREO Caractersticas de una buena Muestra Representativa:Larepresentatividadenestadsticase lograconeltipodemuestreoadecuadoquesiempre incluyelaaleatoriedad(esdecircuandoacada elementodelapoblacinlecorrespondeuna probabilidaddeintegrarlamuestra)enlaseleccinde los elementos de la poblacin que formaran la muestra. Viable: De fcil aplicacin Suficiente: Permite recolectar la mayor cantidad posible de informacin al menor costo Ventajas del mtodo de Muestreo Costo reducido Mayor rapidez (Informacin oportuna) Mayor exactitud y calidad en la Informacin obtenida. DISEO DE LA MUESTRA Ejemplos : El gerente de un Hotel desea controlar un proceso de manera regular para investigar la calidad del servicio. Un investigador de mercados busca las caractersticas que distinguen su producto del de sus competidores. Objetivos del Muestreo Caracterizacin de una poblacin. Comparacin de poblaciones. Variables Cuantitativas : medias, mnimo, mximo, mediana, C.V. Variables Cualitativas :frecuencias, porcentajes o proporciones. Inferencias: estimacin puntual (media, total, proporciones) de los parmetros de inters. estimacin de intervalopruebas de hiptesis Conceptos Fundamentales MUESTRAALEATORIA(m.a).Sedefineunamuestra aleatoriacomounconjuntodevariablesaleatorias, todasconlamismadistribucindeprobabilidades, independientes entre s.

cada elemento dela poblacin tienen una probabilidad conocida, distinta de cero, de ser incluido en la muestra Conceptos Fundamentales UNIDADDEANALISIS.Tambinseledenominael elementodelapoblacinyesaquellaunidadindivisiblede laculseobtieneeldatoestadstico.Ejemplo:puedeser una persona, historia clnica, vivienda, o un animal, etc.

POBLACIN.Eselconjuntodepersonas,objetosocosas conunacaractersticaoatributoespecialcuantificable,en unperiodoylugardeterminado.Ejemplo:Estudiantesdel Ciclo Bsico de la Universidad San Martn, primer semestre del2003.Lacaractersticaaestudiareslaestaturaque permitir obtener los datos.Conceptos Fundamentales TIPO DE POBLACION Poblacin homogneaPoblacin heterognea DISEO DE LA MUESTRA Poblacin:Latotalidaddeloselementos queposeenquecompartenunconjunto comnyqueparalainvestigacinde mercado es el universo. Censo:Numeracincompletadelos elementosdelapoblacinuobjetosde estudio Muestra:Partedelapoblacinque contienetericamentelasmismas caractersticas que se desean estudiar. Conceptos Fundamentales POBLACINOBJETO:eselconjuntofinitoo infinitodeindividuossobreelcualqueremos obtenerinformacin,acotadoentiempoy espacio. Enepidemiologaparadefinirpoblacin considera criterios de inclusin y exclusin. Conceptos Fundamentales MARCODEMUESTREO:eselconjuntode unidadesdemuestreoquecomponenla poblacin,contodaslascaractersticasque permitanlalocalizacindecadaunadeellas. Puedeserunalistadepersonas,unarelacin deviviendas,unarchivo,uncroquisdeuna determinadacomunidad,etc.Elmarcodebe estarcompletamenteactualizadoporquedeel se seleccionar la muestra. Conceptos Fundamentales UNIDADDEMUESTREO.Eslaunidadseleccionada delmarcodemuestreo.Launidaddemuestreopuede coincidir con la unidad de anlisis, por ejemplo un nio menorde5aos,opuedeestarconstituidaporun conglomeradodeunidadesdeanlisis,porejemplo: Poblacin:Pacientesqueseatiendenenlos consultorios de un hospital. Unidaddeanlisis:Unpacientequeseatiendeenun consultorio externo del hospital. Unidaddemuestreo:Unconsultorioexternodel hospital(Peronointeresaelconsultorioexternosino los pacientes que se atienden en dicho consultorio) Poblacin objetivo Muestra Unidad de anlisis Inferencia estadstica Marco muestral 1 2 3 . . . N (tamao de poblacin) as un listado de lapoblacin y cada elemento es identificado por su cdigo Conceptos Fundamentales Probabilidad de seleccin.- Eslaprobabilidaddiferentedeceroquetienecadaunidaddela poblacin de ser incluida en la muestra. Parmetro.Esunvalorquedescribeunacaractersticaounatributo delapoblacin.Algunosparmetrosdelapoblacindenios menoresde5aosdeedadqueestamosinteresadosenestudiaren base del muestreo son: i).Media aritmticapoblacional: -Peso Promedio -Hemoglobina promedio. -Estatura promedio. ii).Proporcin poblacional: -Proporcin de nios que estn desnutridos. -Proporcin de nios que estn parasitados. -Proporcindeniosquetuvieronsolamentelactanciamaterna exclusiva Conceptos Fundamentales ESTADSTICO.Esunvalorquedescribeuna caractersticaoatributodeunamuestrayest en funcinde los datos muestrales. Por ejemplo se tiene la media, razn o proporcin muestral. ERROR MUESTRAL. Se refiere nicamente a la variabilidadodispersinentrelosresultadosde un estadstico de muestras sucesivas del mismo tamaoodiferente.Lamedidaapropiadapara cuantificar este errores el error estndar.As sucesivamente se pueden seleccionar otras muestras y a veces los valores dexiySicoincidirnperolasmasdelasvecestienendiferencias.Esdecirsepueden observardiferenciasentrelosestadsticosdelasdiferentesmuestras,yesa diferencia es consecuencia de los errores muestrales.Se puede cuantificar la variabilidad atribuida a los errores muestrales y su medidaeselERRORESTNDAR.Conelerrorestndarrecinsepuedenhacerlasinferencias estadsticas respectivasPoblacin depersonas de 40 a 50aos de edad cuyaFCtiene = 80 p/m yo = 2 p/mSeleccionamos 1 muestra conn = 89 x2 = 79 p/m y S2 = 3 p/mSeleccionamos 1 muestra conn = 100 x1 = 82 p/m y S1 = 1.5Seleccionamos 3 muestra conn = 102xn = 80.5 p/m y Sn = 3Tipos de Muestreo A)MUESTREONOPROBABILSTICO:No permite inferencia estadstica. M.deJuicio:Abarcaeljuiciodelexperto, opiniones de especialista M. de Cuotas: Se decide la estructura del marco muestral, sin tener en cuenta la estructura del marco poblacional. Tipos de Muestreo MUESTREOPROBABILSTICO:Permiteinferenciaestadstica.Cadaelementodel marcopoblacionaltieneunaprobabilidad conocidadiferentedecerodeconformaro ser parte de la muestra. - Muestreo aleatorio simple. - Muestreo Sistemtico. - Muestreo estratificado. - Muestreo por conglomerados. Muestreo Aleatorio Simple Todaslasunidadeselementalestienenlamismaprobabilidad de conformar la muestra.Dichode otromodo,significaquecadaunadelasposibles muestras de tamaon,tengaalamisma probabilidad de serseleccionada(muestreosin sustitucin). Laprobabilidaddeelegirunelementoser(muestreosin reemplazo): p = n (tamao de muestra) N(tamao de la poblacin) Se aplica cuando la poblacin es finita y homognea. Muestreo Aleatorio Simple Ejemplo1Procedimiento:UnapoblacinN=150yuna muestra n= 10 P = 10 / 150 = 1 / 15 Elprocedimientoconsisteenenumerarloselementosdela poblacin Seusalatabladenmerosaleatorios(tambinsepuedeusar programas informticos diseados para tal fin). SiN=150enlatabladenmerosaleatoriosseseleccionan3 columnasporquetiene3dgitos,ysebuscadesde001a 150 La muestra tomada es sin reposicin , es decir si un nmero se repite varias veces solo se tomar una sola vez). En este caso se encuentra : 102009043025142104059150092016 Muestreo Sistemtico Esusadacuandolapoblacinesfinitay heterognea PROCEDIMIENTO: Paratomarunamuestradetamaonnumerar las unidades de la poblacin de 1 hasta N. Dividir la poblacin en n bloques de k elementos cada uno k = N / n : Relacin de Muestreo Tomarunelementoalazardelprimerbloque comprendidoentre1ykllamadoarranque aleatorio (r) La muestra quedar formada por los elementos:r r + k r + 2kr + 3kr + 4k ......... r +(n-1)k Muestreo Sistemtico PorejemplosiN=150yn=10entoncesK= 150 / 10 = 15 UnavezidentificadoKseconsideraogeneraun intervalodeseleccinqueestacomprendido entre1yK(enelejemploentre1y15) incluyendo1yKyseseleccionaraenforma aleatoria,alnmeroseleccionadosele considera el arranque aleatorio (r) Y la muestra estar integrada por rr+Kr+2Kr+3Kr+4K ......r+(n-1)KAssienelejemploseeligeelarranquen8se tendr la siguiente muestra:8233853688398113128143 Muestreo por Conglomerados PROCEDIMIENTO: Sustituirloselementosdelapoblacinpor grupos Cadaunidaddemuestreoesahoraun grupo y se denomina conglomerado. Seseleccionanaleatoriamentelos conglomeradosqueformanpartedela muestra, y de ellos se realiza el estudio de lacaractersticamedianteotromtodode muestreo,porejemploconunmuestreo aleatorio simple. Tamao de Muestra Paradeterminareltamaodemuestrasetieneen cuenta el tipo de poblacin, es decir:

a.Si la poblacin es homognea se requiere pocos elementosenlamuestraysilapoblacines heterogneaserequiereunmayornmerode elementos. Paraestablecerunafrmuladeltamaode muestraserequieresabereltipodeparmetro quesedeseaestimar,esdecir,sielinterses estimarunamediaaritmticaserequiereuna frmulaespecficaysisequiereestimaruna proporcin se considera otra frmula.Frmula de tamao de muestra para estimar una media aritmtica n =Z o N E(N-1)+ZoDonde : N: Tamao de la poblacin que es objeto de estudio. Z:esunadesviacinnormalcuyovalorcorrespondealgradode confianza que se establece. Es decir: N.C.:90%95% 99% Z :1.64 1.962.57 o :Varianza poblacional de la poblacinque es objeto de estudio En la prctica, el valor de la varianza se desconoce. Paraestablecerelvaloralavarianza,hayquetenerencuentalas siguientes recomendaciones: Recurrir a estudios similares que se han realizado y obtener el valor de la varianza respectiva. Realizar un estudio piloto para estimar o. E: Error absoluto o precisin de la estimacin deseada de la media.Ejemplo Inters:Conocerelcolesterolpromediodelosestudiantesdela Facultad deMedicina.(Suponemos que son 1800 alumnos) Elestudioqueremosrealizarlomedianteunamuestraynecesitamos calculareltamaodemuestran,considerando:ungradode confianza del 95%,resultados de un estudio preliminar: _ x=210 y s=30; error relativo del6% Solucin _ _ Por definicin de error relativo. Er = E/X * 100 . Por consiguiente, E= Er* X /100. Como grado de confianza 95%, nos indica que Z=1.96 E= 6*210/100 =12.6; o= 30. Reemplazando valores en la formula se tiene: n= (1.96)(30)(1800) (12.6)(1799) + 1.96(30) Portanto,n=22(Pararealizarelestudioserequierecomomnimo22 estudiantes) Determinacin del tamao de muestra paraestimar una proporcin n=Z P (1 P) N E(N-1) + ZP(1-P) N : Tamao de la poblacin Z :Desviacin normal P :Proporcin de unidades que poseen el atributo de inters en la poblacin E :Error absoluto o precisin de la estimacin de la proporcin. Por lo general el valor que asume es de 0.05 En la prctica, el valor de la proporcin P se desconoce. Para determinar dicho valor se recurre a las siguientes recomendaciones : -Recurrir a estudios similares que se hayan realizado y extraer el valor de P. -En caso de no haber antecedentes, se recurre a un estudio piloto para conocer P. En caso contrario se recurre a la mxima varianza cuando P=0.05 Ejemplo Inters: Conocer la proporcin de estudiantes que consumen cigarrillos en la Facultad de Medicina X. Nmero de estudiantes N=1800. El estudio se realizar mediante una muestra. Calculamos el tamao de muestra, considerando: Grado de confianza del 95%, por consiguiente, Z=1.96. De un estudio preliminar se ha determinado que la proporcin de alumnos que consumen alcohol es de p=0.30. El error absoluto que se toma en cuenta es de E=0.05 Reemplazando la informacin en frmula, se tiene: n=(1.96)(0.3)(0.7)(1800) = 274 (0.05)(1799) + (1.96)(0.3)(0.7) Por lo menos se requiere para ejecutar el estudio 274 estudiantes En caso de que se desconoce el tamao de la poblacin N,las frmulas quedaranreducidas como: Para estimar una media aritmtica, n =Z o E - Para estimar una proporcin, n=Z P (1 P)E EJEMPLO: A fin de conocer el gasto mensual en medicinas por familia, el Gerente de Marketing de un laboratorio farmacutico desea determinar el tamao de la muestra que le proporcione un nivel de confianza de 0,95 (Z = 1,96). Adems conoce por estudios anteriores que las compras medias por familia eran de S/. 120 mensuales, con una desviacin estndar de 30. El Gerente busca un tamao de muestra que le permita estimar el nivel de gasto con un error de 10. 22e2S Znco=()() () 35 2 01 2 03 2 96,1 =n=n 2 Inferencia Estadstica Muestra Poblacin Objetivo Inferenciaestadstica Muestro Definicin La inferencia estadstica se ocupa del anlisis, interpretacin de resultados y de las conclusiones a las que se pueda llegar a partir de la informacin captada en una muestra aleatoria . Propsito El propsito de la inferencia estadstica es alcanzar un mayor conocimiento acerca de los parmetros de una poblacin, y a travs de este conocimiento lograr una mejor comprensin sobre el comportamiento de una variable en estudio. Problemas: a resolver mediante la Inferencia Estadstica -Conocer la proporcin de estudiantes que fuman cigarrillosde la facultad demedicina X -Un investigador est interesado en comparar la efectividad de dos medicamentos en la cura de una ETS reas de la Inferencia estadstica Estimacin de parmetros (resuelve problema 1) Prueba de hiptesis (resuelve problema 2) Estimacin de Parmetros Viene a ser la aproximacin de los valores de los parmetros que se efectan con la informacin captada en un conjunto de observaciones muestrales y de acuerdo a ciertos procedimientos establecidos por indicadores que son llamados estimadores o valores estadsticos Tipos de Estimacin Estimacin Puntual. Estimacin por intervalos. Estimacin Puntual Viene a ser la estimacin del valor de un parmetro por medio de un nico valor, el cual es obtenido mediante el clculo o evaluacin de un estimador para una muestra especfica. Estimacin Puntual ParmetrosEstadsticos _n x = E xi i=1 n n _ o2 s2 = E(xi - x)2i=1 n - 1 __ 1 - 2 x1 - x2 P p = a/n,donde a es el nmero de unidades que poseen el atributo deinters en la muestraP1 - P2p1 - p2 . Estimacin por Intervalos Viene a ser la estimacin del valor de un parmetro mediante un conjunto de valores contenidos en un intervalo, el cual se obtiene a partir de una informacin muestral de modo tal que brinde una confianza establecida de contener al valor del parmetro ConsisteendeterminardosvaloresnumricosL1yL2yque conunciertogradodeconfianzaseesperaqueelvalordel parmetro est comprendida entre dichos valores. Intervalo de confianza para la media En este caso los valores L1 y L2 seran: _ _ L1 = x -Z ES (x) _ _ L2 = x+Z ES (x) Donde: Estimacin por intervalo de la media () Z : Es un coeficiente de confianza y cuyo valor depende del grado de confianza (G.C.) que se establece, es decir: G.C. :90% 95% 99% Z: 1.64 1.962.57 __ ES (x) : es el error estndar de x y se define como: __ ES (x) = s/\n , donde s es la desviacin estndar de la muestra Nota El coeficiente Z se utiliza cuando tamao de muestra n > 30. Estimacin por intervalo de la media () En relacin al ejemplo anterior, construiremos un intervalo de confianza del 95% para la estatura promedio ( ) de los estudiantes de medicina. Grado de confianza del 95% le corresponde un Z=1.96 ___ Error estndar ES(x) = 20/\36 = 3.33 Por consiguiente: L1= 170 1.96*3.33 = 163.5 L2= 170 + 1.96*3.33 = 176.5 [163.5 , 176.5] La estatura promedio de los estudiantes de la facultad de Medicina de la USMP est comprendida entre 163.5 y 176.5 cm. con un grado de confianza del 95%. Estimacin por intervalo de la media (): ejemplo Estimacin por intervalo de la proporcin (P) Intervalo de confianza para la proporcin P ______ L1 = p - z \pq/n ____ L2 = p + z\pq/ndonde q = 1 - p. ____ \pq/n= ES(p), nos indica el estimador del error estndar de la proporcin de la muestrap Ejemplo:Inters: Estimar la proporcin de nios desnutridos menores de 5 aos de una determinada comunidad.Seleccionamos una muestra de 100 nios menores de 5 aos y se determina que 45 estn desnutridos. Se quiere estimar una proporcin de poblacinP = A/N, donde, A: n de nios menores de 5 aos desnutridos en la poblacin y N: n de nios menores de 5 aos en la poblacin. El estimador es:p = a/n donde a es el nmero de nios desnutridos en la muestra y n es el tamao de muestra. Por consiguiente, p = 45/100 = 0.45. proporcin estimada de nios desnutridos menores de 5 aos en la comunidad es de 0.45.Estimacin por intervalo de la proporcin (P) Segnlainformacinquesedispone,seconstruyeunintervalodel95% para P: Para una confianza del 95%,Z = 1.96 Reemplazando valores se tiene: ____________ L1 = 0.45 - 1.96 *\0.45(0.55)/100 = 0.352 ____________ L2 = 0.45 + 1.96 *\ 0.45(0.55)/100= 0.548. Laproporcindeniosmenoresde5aosdesnutridosendicha comunidad est entre 0.352 y 0.548 con una confianza del 95%. NotaSe utiliza el coeficiente de confianza Z/2sinp y n(1-p) >5.