Diseño de Muestreo

download Diseño de Muestreo

of 10

description

MUESTREO

Transcript of Diseño de Muestreo

CAPITULO 3 DISEO DE MUESTREOLos estudios de consumo, oferta y abastecimiento de dendrocombustibles se realizan fundamentalmente utilizando tcnicas de muestreo. Esto significa que a travs del estudio de un pequeo grupo (muestra) elegido aleatoriamente, se obtienen datos de las variables de inters de un grupo de mayor tamao (universo6), para despus inferir sobre el comportamiento de esas variables en el universo. Esto es as porque hacer estos estudios en todo el universo, con excepcin de aqullos muy pequeos, tiene altos costos.3.1 UniversoEl universo debe ser definido desde los objetivos del estudio y puede serlo en trminos geogrficos (una localidad, un municipio, un distrito, una provincia, un pas o cualquier otra categora intermedia) o en trminos sectoriales (la poblacin urbana, las industrias de cermica, los productores de lea). Tambin se debe dar lmites temporales a la definicin del universo, porque su composicin y caractersticas pueden cambiar con el correr del tiempo. Se recomienda que el universo tenga lmites espaciales coincidentes con las agrupaciones estndares, de uso comn, u oficiales de cada pas (polticas, administrativas, naturales, etc.), para que sea posible estimar sus dimensiones a partir de bases de informacin ya existentes. El universo se define en forma preliminar al inicio del diseo metodolgico de un estudio, para despus precisarlo al conocer su tamao y distribucin espacial y temporal, a travs de la revisin de informaciones existentes. La redefinicin del universo puede significar ampliarlo o reducirlo. El primer caso puede ocurrir cuando se reconoce que existe un rea con uso importante de dendrocombustibles o donde hay oferta real o potencial de ellos. La eliminacin de reas del universo puede deberse, por una parte, a que sea tal la carencia de informacin sobre la demanda o la oferta, que su incorporacin al estudio lleve a un error mayor que su eliminacin; y por otra, a que se reconozca que alguna localidad o rea no forman parte del universo por no contar con usuarios de importancia.3.2 Marco muestralUna vez definido el universo, se debe recabar informacin, lo ms exacta posible, de sus dimensiones y distribucin espacial y temporal, para con ello poder construir el marco muestral, que es la base para hacer el diseo de muestreo. El marco muestral es la informacin que ubica y dimensiona al universo y puede consistir de censos de vivienda y mapas agrupados por localidades, barrios, repartos, etc.; mapas de cobertura forestal con agrupamientos por tipos de vegetacin o usos del suelo; listados de viviendas en localidades pequeas, etc. La construccin del marco muestral se detalla en los apartados referentes a las variables generales de la demanda, oferta y abastecimiento (Captulo 2).3.3 Unidad de muestreoUn concepto bsico en la teora del muestreo, que debe definirse claramente para construir el marco muestral, es la unidad de muestreo, que es la unidad mnima de observacin de la que se obtendr informacin de las variables tiles. Por convencin estadstica, se usar "N" para referirnos al nmero de unidades de muestreo que integran el Universo y "n" para el nmero de unidades de muestreo en la muestra. Para cada sector la unidad de muestreo ms conveniente se indica en la Tabla 3.1. Otras unidades de muestreo pueden ser definidas de acuerdo a los objetivos de los estudios.Tabla 3.1 Unidad de muestreo segn el grupo temtico y sector o ramo de estudio.GrupoSector o ramoUnidad de muestreo

Demanda Residencial

- urbana- ruralVivienda

IndustrialEstablecimiento

Comercial

Institucional

OfertaDirectaParcela

IndirectaEstablecimiento

AbastecimientoProductoresProductores individuales, empresas

Transportistas

Comercializadores

Despus de haber definido el universo y la unidad muestral, y de contar con un marco muestral, el diseo del muestreo consiste de dos grandes etapas: definicin del tipo de muestreo y determinacin del tamao de muestra.3.4 Tipos de muestreoExisten diferentes tipos de muestreo, pero todos se basan en el principio de aleatoriedad. Para poder hacer inferencias vlidas de lo que ocurre en un universo a partir de una muestra es necesario que sta sea representativa de l, lo cual se logra con la aleatoriedad y con un tamao suficiente de la muestra. La base de la inferencia estadstica es la aleatoriedad. Esto significa que todos los elementos del universo tengan la misma oportunidad de ser elegidos para componer la muestra. Si no se los eligiera aleatoriamente se corre el grave riesgo de tener resultados NO representativos de toda la poblacin, sino de un sector de ella. A esto se le llama sesgo. Un ejemplo de sesgo por eleccin NO aleatoria en un inventario de recursos leeros, es elegir las parcelas cercanas a las vas de acceso. Por esa condicin, es muy probable que sean las ms explotadas y que tengan menores existencias de madera. As, hacer la extrapolacin al Universo de los resultados de esta muestra NO aleatoria, llevara a una subestimacin de las existencias. El tamao de la muestra es dependiente de la variabilidad del fenmeno a estudiar, del nivel de confianza fijado y del error admisible. Un error muy comn es la afirmacin de que, para que una muestra sea representativa de un Universo, debe ser de un tamao directamente proporcional a su tamao, es decir, que a mayor tamao del Universo debera ser mayor el tamao de la muestra. Adelante se detallar la forma de obtener el tamao de muestra.3.4.1 Muestreo aleatorio simple Consiste en elegir en forma aleatoria "n" unidades muestrales (UM) del universo. El proceso debe otorgar la misma oportunidad de seleccin a todas las UM en una sola ocasin.Se asigna un nmero a cada UM y se selecciona la muestra aleatoriamente con ayuda de tablas de nmeros aleatorios, calculadoras, sorteo, etc. Esta tcnica solo puede ser aplicada cuando se dispone de un marco muestral completo, que incluya a todas las UM, y stas puedan ser reconocidas e identificadas sin dificultad en el terreno. Por ejemplo, un listado telefnico, o una lista de domicilios con identificacin de calle y nmero, o nombre del ocupante de la vivienda. En el caso de muestreo de recursos naturales, suele ser difcil identificar o localizar exactamente a las parcelas sorteadas, ya que se necesita un mapa detallado e instrumentos de localizacin geogrfica de precisin adecuada.Muestreo aleatorio simpleUniverso 70 ladrilleras en una ciudad Todas son pequeas, con produccin entre 30 mil y 60 mil ladrillos por aoMarco Muestral Listado de establecimientos de la Oficina Municipal TributariaUnidad Muestral EstablecimientoSeleccin aleatoria Se numeran los establecimientos y por medio de un sorteo o usando nmeros aleatorios se eligen "n" establecimientos para entrevistarCundo se debe usar el muestreo aleatorio simple: Cuando se sabe que la variable de mayor inters se distribuye aleatoriamente en el universo. Para universos pequeos (no ms de 200 UMs). Para universos de poca dispersin geogrfica. Cuando no se conoce el patrn de distribucin para la variable de inters.3.4.2 Muestreo aleatorio estratificado Este tipo de muestreo se utiliza cuando el universo original, de tamao N, es fragmentado en estratos relativamente homogneos en cuanto a la variable de inters. Esto es aconsejable siempre que la variacin entre estratos sea mayor que la interna de cada estrato. Muestreo aleatorio estratificadoUniverso 15 500 ha de tierra donde se produce lea en diferentes Usos del SueloEstratos Potreros (3 000 ha) Cercos vivos (4 000 ha) Bosque natural (3 000 ha) Vegetacin secundaria (5 500 ha de manigua, acahual o capuera)Marco muestral Mapa de uso del suelo a escala 1:20 000Unidad muestral Parcela (de tamao especfico para cada uso del suelo)Seleccin aleatoria Eleccin de "n" parcelas al azar dentro de cada estrato (uso del suelo)A cada uno de estos estratos se les trata independientemente como un universo, en cuanto al mtodo de seleccin de las UM y de estimacin de parmetros. Al interior de cada estrato, las UM se pueden seleccionar en forma aleatoria, por conglomerados o sistemticamente.El muestreo estratificado permite mejorar la precisin de las estimaciones con menor esfuerzo de muestreo, caracterizar a cada estrato por separado y facilitar la coordinacin del trabajo de campo. Es muy importante considerar que las unidades de muestreo deben pertenecer a un solo estrato, que los estratos deben ser reconocibles ms all del grupo que hizo el estudio y que debe conocerse el tamao del estrato. No es recomendable formar muchos estratos, pues se complicara innecesariamente el estudio a campo y el anlisis de datos.Para tomar la decisin de hacer un muestreo estratificado existen criterios generales. En el grupo de demanda de dendrocombustibles, la saturacin y el consumo son las variables que en primera instancia deben definir la pertinencia de estratificar. En el grupo de oferta directa la estratificacin se hace por tipo de fuente, clase de cobertura o de uso del suelo. Para el grupo de oferta indirecta, y abastecedores, productores, transportistas y comercializadores) se usa el volumen de produccin o comercializacin. Como se trata de variables que se deben conocer antes de hacer el estudio, es posible obtener datos de ellas por fuentes secundarias o por variables indicadoras, lo cual se detalla en el Captulo 2.Cundo se debe usar el muestreo estratificado? Se usa principalmente en poblaciones donde se supone o se conoce que la distribucin de la(s) variable(s) de mayor inters es diferente entre subpoblaciones fcilmente identificables. Por su baja eficiencia del muestreo, NO se recomienda aplicarlo en universos pequeos, con menos de 200 UM y variables de distribucin normal .Muestreo por conglomerados Universo Localidad con 650 viviendas distribuidas dispersamente en un rea grande y con un trazado regular de calles.Conglomerados Manzanas (cuadras)Marco muestral Nmero total de viviendas en la localidad Croquis de la localidad con el trazado actualizado de calles y una estimacin promedio del nmero de viviendas por manzanaUnidad muestral ViviendasSeleccin aleatoria Se numeran las "manzanas" y se eligen al azar. En cada una de ellas se visita a todas las viviendas

3.4.3 Muestreo por conglomerados Un conglomerado es un conjunto espacialmente compacto de UM.Los conglomerados se seleccionan aleatoriamente y dentro de cada uno se estudian todas sus UM o se hace un muestreo de ellos. Cundo se debe usar el muestreo por conglomerados? Se aplica cuando existe alta dificultad para llegar a todas las UM del universo debido a una gran dispersin espacial o a tener barreras fsicas de acceso. 3.4.4 Seleccin sistemtica Este no es propiamente un tipo de muestreo y es conveniente considerarlo como un esquema de seleccin regular de muestra.

La seleccin de la primera UM es aleatoria y las siguientes se eligen con un intervalo regular de UM, distancias o tiempo. Su limitacin terica consiste en que slo el primer nmero se selecciona al azar, y los restantes no tienen la misma probabilidad de ser incluidos en la muestra. Su ventaja reside en que facilita la localizacin de UM en lugares donde hay dificultad de acceso y en que permite visitar UM que no se encuentren definidas en el marco muestral.Cundo se debe usar la seleccin sistemtica? Cuando no hay posibilidad de identificar en el marco muestral a cada una de las UM. Por ejemplo, en ciudades grandes donde no se tienen listados de viviendas Cuando se dificulta el acceso a las UM, por distancias, falta de caminos o en terrenos abruptos. Por ejemplo, en un inventario forestal. Combinacin de tipos de muestreo Seleccin sistemticaUniverso Ciudad con 3 000 viviendas distribuidas espacialmente en forma compactaMarco Muestral Croquis de las calles de la ciudad Nmero total de viviendas (actualizado)Unidad Muestral Vivienda Seleccin sistemtica Se determina el intervalo de visita a las viviendas dividiendo el nmero total de viviendas por el nmero de viviendas a muestrear. La primera vivienda se elige al azar y las restantes se visitan de acuerdo al intervalo calculado

En un mismo estudio o diagnstico, es posible combinar diferentes tipos de muestreo, segn sean las caractersticas de los sectores o ramos considerados y el grado de compromiso aceptado entre la precisin y el costo de ejecucin del estudio. Por ejemplo, en el sector residencial puede optarse por un muestreo estratificado bietpico con conglomerados, en tanto que para un ramo industrial pequeo, homogneo y compacto se elija un aleatorio simple. 3.5 Tamao de la muestraEl tamao de la muestra debe definirse independientemente para cada universo, en funcin de tres factores: la variabilidad de la variable numrica ms importante, el nivel de confianza fijado y el nivel de error aceptable. Esto se resume en la siguiente frmula7: no = (s2 . t2,)/ e2 (1) en trminos de varianza y error absolutono = (cv2 . t2,)/ e2 (2) en trminos de cv y error relativodonde:no = tamao de la muestras2 = varianza de la muestrat2 = valor crtico de la distribucin t de Student, con un nivel de significancia _ y _ grados de libertade = error aceptablecv = coeficiente de variacin = desviacin estndar de la muestra/ media muestral= grados de libertad = n - 1La varianza (s2) o el coeficiente de variacin (cv) indican el grado de heterogeneidad u homogeneidad de la variable de inters en la muestra y se los calcula -manualmente, con calculadora o con Excel- con los datos de una muestra preliminar o de algn estudio previo.El error aceptable (e) se refiere a la diferencia que se permite entre la media de la muestra y la media del universo. Se fija de acuerdo al conocimiento previo que se tiene del fenmeno y es aconsejable que se encuentre entre el 10% y el 20%, lo cual puede expresarse tambin en valores absolutos con las unidades de medicin de la variable en cuestin.El valor crtico de t se obtiene de tablas en libros de estadstica de Excel, definindose primero el nivel de significancia () o su complemento, el nivel de confianza (1-). Para este tipo de estudios es suficiente con un nivel de confianza de 0.95, que equivale a = 0.05(2). Adems, se debe fijar preliminarmente un nmero de casos de la muestra (n) para definir los grados de libertad ( = n-1). Estos dos valores son los datos de entrada de las tablas de t. Posteriormente, por medio de un proceso iterativo, en donde el valor de n obtenido con la Frmula 1 se utiliza para encontrar el valor de t, se precisa el tamao de la muestra.En esta frmula se aprecia que el nmero de elementos que componen la muestra es directamente proporcional a la varianza y al valor de t cuadrado, e inversamente proporcional al cuadrado del error. El tamao de muestra ser grande cuando: a) el fenmeno en estudio sea muy variable (varianza o coeficiente de variacin alto); b) el nivel de confianza fijado sea alto; y/o c) el error aceptable sea bajo. En cambio, el tamao de la muestra ser pequeo si encontramos un fenmeno poco variable, fijamos una confianza baja y se acepta un error alto. Con ello queda demostrado que el tamao de una muestra NO depende del tamao del universo. As, por ejemplo, partiendo de iguales niveles de confianza y error aceptado, en un bosque tropical hmedo con la misma superficie que un bosque templado de pino, el tamao de muestra ser mayor en el primero porque es sabido que tiene ms heterogeneidad en la variable existencia de madera que el bosque de pino. Hasta ahora no se ha considerado el tamao del universo para determinar el tamao de muestra. Sin embargo, para universos pequeos, menores a 120 U.M., es necesario corregir el valor de no obtenido de la Frmula 1, a travs del uso de la Frmula8:n = no / (1 + no / N) (2) donde:no = tamao de muestra obtenido en la frmula anteriorN = tamao del universon = tamao definitivo de muestraEn el Anexo III se muestra una tabla con el clculo del tamao de muestra en el sector residencial, corregido por poblacin finita, para la variable consumo especfico de lea, que por un gran nmero de estudios de caso se conoce su coeficiente de variacin.Variables para calcular el tamao de muestra Para la definicin del tamao de muestra de cualquier sector o ramo de demanda de dendrocombustibles, se recomienda utilizar la variable consumo unitario. En los sectores industrial, comercio e institucional no siempre es posible tener datos sobre consumo unitario, por lo que puede usarse el volumen de produccin por unidad de tiempo, que est muy correlacionado con el consumo unitario. Para la oferta directa (bosques, plantaciones, etc.), las variables relevantes pueden ser la existencia o la productividad, pero se recomienda el uso de la primera por haber ms informacin secundaria y ser ms fcil de medir en un muestreo preliminar. Si no hay datos sobre existencias, puede utilizarse el rea basal (G). En los sectores o ramos de oferta indirecta (aserraderos, carpinteras, etc.) se debe usar el volumen de produccin por unidad de tiempo. En los sectores de abastecimiento, con los productores es conveniente usar el volumen de produccin de dendrocombustibles, con los comercializadores el volumen de venta y con los transportistas la capacidad de transporte, todas expresadas por unidad de tiempo.La decisin final sobre el tamao de muestra depender de un compromiso entre la precisin esperada en la estimacin y la disponibilidad de recursos (monetarios, humanos y tiempo) para ejecutar el estudio a campo. Se recomienda que los sectores o ramos con mayor importancia en demanda, oferta y abastecimiento de dendrocombustibles se privilegien en la asignacin de recursos para el estudio a campo, para lograr en ellos mayor precisin en la estimacin. En aquellas situaciones en que no sea posible cubrir el tamao de muestra derivado del clculo estadstico, es forzoso estudiar un mnimo de 10 unidades de muestreo por sector, ramo o estrato, reportando en el informe del diagnstico el error de estimacin, despejando e de la Frmula 1.6 El "universo" tambin es llamado "poblacin" en estadstica. 7 Frmula usada para determinar el tamao de muestra necesario para estimar la media poblacional, pues en pruebas de hiptesis para diferencias entre medias y varianzas existen otras frmulas. Se recomienda tener como apoyo algunos libros de estadstica, como Zar 1999; Cochran 1977; y Steel y Torrie 1988.8 Llamada "correccin por poblacin finita".