Tecnicas de muestreo y analisis de datos materia de tonis.ppt

23
Técnicas de Técnicas de Muestreo Muestreo

Transcript of Tecnicas de muestreo y analisis de datos materia de tonis.ppt

  • Tcnicas de Muestreo

  • El anlisis de una muestra permite inferir conclusiones susceptibles de generalizacin a la poblacin de estudio con cierto grado de certeza (Holguin y Hayashi, 1993).El total de observaciones en las cuales se esta interesado, sea su nmero finito o infinito, constituye lo que se llama una poblacin (Walpole y Myers, 1996, p. 203). La muestra es una pequea parte de la poblacin estudiada. sta debe caracterizarse por ser representativa de la poblacin.De acuerdo con Briones (1995) una muestra es representativa cuando reproduce las distribuciones y los valores de las diferentes caractersticas de la poblacin con mrgenes de error calculables.

  • Tipos de muestreoUna muestra puede ser de dos tipos: no probabilstica

    b) probabilstica.En la muestra no probabilistica la seleccin de las unidades de anlisis dependen de las caractersticas, criterios personales, etc. del investigador por lo que no son muy confiables en una investigacin con fines cientficosEste tipo de muestra adolece de fundamentacin probabilistica, es decir, no se tiene la seguridad de que cada unidad muestral integre a la poblacin total en el proceso de seleccin de la muestra.

  • El muestreo no probabilistico comprende los procedimientos de muestreo intencional y accidental:Muestreo Intencional: Procedimiento que permite seleccionar los casos caractersticos de la poblacin limitando la muestra a estos casos. Se utiliza en situaciones en las que la poblacin es muy variable y consecuentemente la muestra es muy pequea.Muestreo Accidental: Consiste en tomar casos hasta que se completa el nmero de unidades de anlisis que indica el tamao de muestra deseado.

  • El muestreo probabilistico permite conocer la probabilidad que cada unidad de anlisis tiene de ser integrada a la muestra mediante la seleccin al azar. Este tipo de muestreo comprende los procedimientos de muestreo simple o al azar, estratificado, sistemtico y por conglomerados o racimos.Muestreo Simple: De acuerdo con Webster (1998) una muestra aleatoria simple es la que resulta de aplicar un mtodo por el cual todas las muestras posibles de un determinado tamao tengan la misma probabilidad de ser elegidas,. Esta definicin refleja que la probabilidad de seleccin de la unidad de anlisis A es independiente de la probabilidad que tienen el resto de unidades de anlisis que integran una poblacin. Esto significa que tiene implcita la condicin de equiprobabilidad (Glass y Stanley, 1994).

  • Muestreo Estratificado: Este procedimiento de muestreo determina los estratos que conforman una poblacin de estudio para seleccionar y extraer de ellos la muestra. Estrato es todo subgrupo de unidades de anlisis que difieren en las caractersticas que se van a analizar en una investigacin.La base de la estratificacin adopta diversos criterios como edad, sexo, ocupacin, etc. Una modalidad de este tipo de muestreo es el procedimiento de muestreo estratificado proporcional, que permite seleccionar a las unidades de anlisis que integrarn la muestra en proporcin exacta al tamao que tiene el estrato en la poblacin, es decir, el estrato se encuentra representado en la muestra en proporcin exacta a su frecuencia en la poblacin total, (DAry, Jacobs y Razavieh, 1982, p. 138).

  • Muestreo Sistemtico: Una muestra sistemtica se obtiene determinando cada hsima unidad o ksimos casos. Un ksimo caso representa el intervalo de seleccin de unidades de anlisis que sern integradas a la muestra.Ejemplo: Si se va a encuestar a una muestra de tamao 100 de una poblacin de 1000, el intervalo de seleccin es de tamao 10. Este intervalo de seleccin indica que se habr de formar cada dcimo caso de la poblacin para integrarlo a la muestra. El primer caso se selecciona arbitrariamente o al azar. Suponiendo que el primer caso seleccionado sea el nmero 13, el segundo ser el 23 y as sucesivamente hasta completar el tamao de muestra deseado.

  • Muestreo por Racimos: En este tipo de muestreo, las unidades de anlisis que se encuentran encapsuladas o encerradas en determinados lugares fsicos o geogrficos que se denominan racimos.

    En este tipo de muestreo es imprescindible diferenciar entre unidad de anlisis (quines va a ser medidos) y unidad muestral (racimo a travs del cual se logra el acceso a la unidad de anlisis).

    Por ejemplo: Se va a realizar una encuesta sobre las condiciones salariales en las empresas industriales, la unidad muestral son las industrias y las unidades de anlisis estan representadas por los obreros que trabajan en ellas.

  • Tamao de las muestrasPara calcular el tamao de una muestra hay que tomar en cuenta tres factores: El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la poblacin total. El porcentaje de error que se pretende aceptar al momento de hacer la generalizacin. El nivel de variabilidad que se calcula para comprobar la hiptesis.Laconfianzao elporcentaje de confianzaes el porcentaje de seguridad que existe para generalizar los resultados obtenidos. Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser prcticamente imposible el estudio de todos los casos, entonces se busca un porcentaje de confianza menor. Comnmente en las investigaciones sociales se busca un 95%.

  • Elporcentaje de errorequivale a elegir una probabilidad de aceptar una hiptesis que sea falsa como si fuera verdadera, o la inversa: rechazar a hiptesis verdadera por considerarla falsa. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del mismo tamao que la poblacin, por lo que conviene correr un cierto riesgo de equivocarse.Comnmente se aceptan entre el 4% y el 6% como error, tomando en cuenta de quenoson complementarios la confianza y el error.Lavariabilidades la probabilidad (o porcentaje) con el que se acept y se rechaz la hiptesis que se quiere investigar en alguna investigacin anterior o en un ensayo previo a la investigacin actual. El porcentaje con que se acept tal hiptesis se denominavariabilidad positivay se denota porp, y el porcentaje con el que se rechaz se la hiptesis es la variabilidad negativa, denotada porq.Hay que considerar quepyqson complementarios, es decir, que su suma es igual a la unidad:p+q=1. Adems, cuando se habla de la mxima variabilidad, en el caso de no existir antecedentes sobre la investigacin (no hay otras o no se pudo aplicar una prueba previa), entonces los valores de variabilidad esp=q=0.5.

  • Una vez que se han determinado estos tres factores, entonces se puede calcular el tamao de la muestraEn el caso de queno se conozca con precisin el tamao de la poblacin:Donde:nes el tamao de la muestra; Zes el nivel de confianza; pes la variabilidad positiva; qes la variabilidad negativa; Ees la precisin o error.La variabilidad y el error se pueden expresar por medio de porcentajes, hay que convertir todos esos valores a proporciones en el caso necesario.El nivel de confianza no es ni un porcentaje, ni la proporcin que le correspondera, a pesar de que se expresa en trminos de porcentajes. El nivel de confianza se obtiene a partir de ladistribucin normal estndar, pues la proporcin correspondiente al porcentaje de confianza es la integral de la curva normal que se toma como la confianza, y la intencin es buscar el valorZde la variable aleatoria que corresponda a tal rea.

  • En el caso de queSI se conozca el tamao de la poblacin:Donde:nes el tamao de la muestra; Zes el nivel de confianza; pes la variabilidad positiva; qes la variabilidad negativa; Nes el tamao de la poblacin; Ees la precisin o el error.

  • Se comenz con 1021 casos, de los que se lograron recontactar, manteniendo los criterios muestales, 806. Los mismos constituyen una muestra representativa de la poblacin de 18 y ms aos de edad residente en hogares particulares de localidades de todo el pas con 2000 y ms habitantes.

    La muestra fue aleatoria probabilstica con un margen de error de 3.5 para un nivel de confianza de 95%.

    Las encuestas fueron realizadas en forma telefnica, Montevideo fue dividida en 25 zonas geogrficas, coincidiendo con las divisiones de ANTEL. Superponiendo los datos del Censo de Poblacin con la zonificacin de ANTEL, manteniendo fijas las caractersticas de cada zona y sorteando las dems cifras al azar, es posible disear una muestra probabilstica de nmeros de telfono que respete la estructura de la poblacin por barrio. En el Interior se realizaron encuestas en 50 localidades, utilizando una metodologa similar de sorteo La muestra en 2004:

  • Variables e Indicadores (un pequeo repaso)

  • Una variable es un atributo o caractersticas que hacen similares a los individuos, grupos sociales entre s, objeto o fenmeno que puede adoptar diversos valores. Un indicador indica cmo se medir la variable.Tipos de variables:En cuanto al papel que tienen en la investigacin: Dependientes Independientes

    En cuanto a la posicin relativa de VD y VI:Intervinientes, de controlAntecedentes

    En cuanto a su manera de ser medidas:Univariables (nominales, ordinales, de intervalo, de razn)Multivariables (Unidimensionales/ Multidimensionales)

  • Qu se puede hacer con los datos?

  • Las tcnicas de anlisis de datos se clasifican en 2 tipos:Tcnicas de anlisis cualitativoTcnicas de anlisis cuantitativoa) Tcnicas de anlisis cualitativoObjetivo: Resumir, analizar e interpretar la informacin obtenida mediante mtodos cualitativos. (entrevistas, anlisis documental, etc.)

    Principales tcnicas: Categorizacin (Los datos se revisan y se reducen a unidades llamadas categoras)Anlisis de contenido (permite la descripcin de la informacin a travs de variables pre definidas en el estudio. Permite cuantificar datos cualitativos. Nudist)

  • b) Tcnica de anlisis cuantitativo:Objetivo: Describir, graficar, comparar, relacionar y resumir datos obtenidos (Encuestas, series histricas, otros)

    UsosDescripcinTcnicasDescribir variablesCaracterizar una muestra variable por variableDistribucin de frecuenciasPorcentajesPromedios, desviacin estndarGrficos (de barra, de sectores, histogramas)Comparar gruposSe compara la diferencia entre grupos de la muestra segn las variables seleccionadasT de studentAnlisis de varianzasKruskall-WallisGrficos de barras mltiplesAnalizar la relacin entre variablesDeterminar la relacin entre 2 o ms variablesR de PearsonR de SpearmanChi-CuadradoAnlisis de regresin (lineal, logstica, multinominal)Anlisis de correspondenciaGrafico de dispersinAnalizar la validezAnalizar la validez de constructo de los instrumentos de medicinAnlisis factorialAnlisis de Clusters o conglomeradosEscalamiento multidimensional

  • Algunos ejemplos

  • Descriptive StatisticsNMinimumMaximumMeanStd. Deviationvoto octubre 20048061,005,001,89221,16336Valid N (listwise)806

  • Momento en que decidi el voto segn medio por el que se informa de poltica (%)Medio por el que se informa de polticaFamiliaGrupo de paresMediosOtros/NingunoTotalMomento de decisin del votoDecidi antes del 20047,5%8,8%77,1%6,6%100,0%En el 2004, antes internas14,8%6,6%75,4%3,3%100,0%Despus internas4,8%9,5%85,7%100,0%Al comienzo o durante la campaa6,8%6,8%84,1%2,3%100,0%Unos das antes de las eleciones6,3%10,4%79,2%4,2%100,0%El da de las elecciones18,5%3,7%63,0%14,8%100,0%NsNc69,2%30,8%100,0%Total8,0%8,4%77,6%6,1%100,0%

  • Cunto influyeron en el voto de octubre de 2004 el voto anterior, la tradicin familiar, el medio por el que se informa de poltica el votante y su inters por la poltica?

    Model SummarybModelRR SquareAdjusted R SquareStd. Error of the Estimate1,176a,031,025,96481

    ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression20,17345,0435,418,000aResidual627,686674,931Total647,859678

    CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant)1,471,1857,967,000Voto anterior,026,056,018,463,644Voto familia,008,002,1674,395,000Medio info poltica,072,057,0481,272,204Inters por la poltica-,004,004-,041-1,066,287