Selección y Tamaño Muestral

Selección y tamaño muestral

Cuando una investigación aborda el objeto de estudio mediante la técnica de la

encuesta, tiene que tener en cuenta como elemento fundamental la población objeto de

estudio y la selección muestral de esa población.

El acotamiento preciso de la población a estudiar es uno de los aspectos fundamentales

y prioritarios de una investigación, ya que a partir de éste podremos decidir si realizar

una investigación exhaustiva o en el caso contrario, saber estrictamente de qué

población tendrá que ser representativa la muestra. Cuanto mejor conozcamos el

universo a analizar, más precisamente podremos realizar el diseño muestral, ya que el

conocimiento de las unidades que componen la población, así como su distribución y

características principales, permiten acercarnos al conocimiento de la variabilidad

poblacional, con lo cual calcularemos el tamaño muestral más exactamente

1. Población, muestra y ámbito Con el término POBLACIÓN o UNIVERSO, se designa a cualquier conjunto de

elementos que tienen unas características comunes. Cada uno de los elementos que

integran tal conjunto recibe el nombre de individuo. Cuando se pone en marcha una

investigación, generalmente, no es posible analizar todos los individuos de una

población, bien porque la población contiene muchos elementos, bien porque

económicamente es inviable –o las dos cuestiones juntas- Si tiene lugar cualquiera de

estas circunstancias –o las dos- se recurre al estudio de un subconjunto de elementos

extraídos de la población que denominamos MUESTRA.

Por lo tanto, la MUESTRA es un subconjunto de individuos pertenecientes a una

población y representativos de la misma. Existen diversas formas de seleccionar la

muestra, en función del análisis que se pretende efectuar.

2. Selección muestral

Un factor determinante para construir un diseño muestral válido se refiere al modo

cómo se seleccionen los elementos que conforman la muestra y puede decirse que

existen dos modelos fundamentales de muestreo: el muestreo probabilistico que incluye

diversos tipos como son: el muestreo aleatorio simple, aleatorio sistemático,

estratificado, por conglomerados, polietápico y de panel y el muestreo no probabilístico

que incluye el muestreo accidental, el de cuotas, el intencionado y el muestreo

conveniente.

2.1 Muestreo probabilístico o muestreo de probabilidad

El muestreo probabilístico se caracteriza porque en él "cada elemento de la población

tiene una probabilidad conocida y no nula de ser seleccionado" (Kish, 1972, 41). Tal

como afirma Rodríguez Osuna (1991), este tipo de muestreo permite la inferencia

estadística a la población de la cual ha sido extraída la muestra, siendo las estimaciones

instigadas (coincidiendo parámetros y estadísticos) y pudiéndose calcular los errores de

muestreo. En este sentido, Converse y Presser (1986), Fowler (1988), Gómez Benito

(1990) opinan que es conveniente utilizar este tipo de muestreo siempre que sea posible.

Tipos de muestreos probabilísticos

El muestreo aleatorio simple es un método por el cual todos los miembros de la

población tienen igual posibilidad de ser elegidos en la muestra. El criterio de selección

de ésta consiste en una serie de métodos que garantizan que la selección de una

determinada persona sólo se debe al azar. Existen dos métodos principales de selección

de la muestra: la urna de Bernoulli y las tablas de números aleatorios.

Una variación del muestreo aleatorio simple, es el muestreo aleatorio sistemático, que

consiste en averiguar la tasa de sondeo, esto es, la relación entre el número de miembros

de una población y el tamaño de la muestra deseada para, a partir de ella, seleccionar las

unidades que formarán parte de la muestra. Los sujetos que integran una muestra

sistemática han sido elegidos a partir de X unidades de la población.

Tanto en el muestreo aleatorio simple como el sistemático los elementos se escogen

totalmente al azar y por ello pueden tener sesgos de tipo cualitativo, ya que no tienen en

cuenta las características de la población. Para solucionar este problema se suele utilizar

el muestreo aleatorio estratificado que permite tener en cuenta la distribución de la

población en estratos a la hora de seleccionar la muestra. Los estratos se formaran en

función de al menos una variable importante para la investigación (estratificación

simple si sólo se tiene en cuenta una variable; estratificación asociada o combinada si se

tienen en cuenta al menos dos).

Otro método probabilístico de selección de la muestra es el llamado muestreo de

conglomerados (clusters o racimos) que consiste en establecer subgrupos dentro de la

población y seleccionar un número determinado de subgrupos de modo que la suma de

los individuos de los subgrupos seleccionados formen la muestra deseada. Si los

conglomerados o subgrupos se obtienen en función de criterios geográficos (secciones

censases, bloques de viviendas, ...) se suele hablar de muestreo por áreas.

El muestreo multietápico o polietápico es en realidad una variante del muestreo por

conglomerados. Si en este se elegían subgrupos y de estos se analizaba a toda su

población, en el muestreo polietápico se seleccionan conglomerados y dentro de estos se

vuelve a establecer una submuestra de alguno de los diferentes modos apuntados.

Por último, el muestreo de panel consiste en una selección de personas realizada por

cualquiera de los procedimientos anteriores (generalmente por estratificación) que se

mantiene al día para sucesivas investigaciones. Se conserva la misma muestra para

varios estudios, de modo que se puede analizar la evolución de la población.

Tiene como ventajas que es una manera de muestrear económica y rápida, a la vez que

permite, tal como hemos dicho, describir cambios, sin embargo también presenta

inconvenientes, entre los que destaca el llamado "efecto de panel" (la primera encuesta

no presenta problemas, pero en las siguientes se pierde espontaneidad en las respuestas,

ya que el elegido sabe que va a ser encuestado y sobre qué).

2.2.Muestreo no probabilístico o muestreo de no probabilidad

El muestreo no probabilístico es aquel que se utiliza cuando no se puede prever la

probabilidad que tiene cada individuo de salir elegido en la muestra. Se realiza cuando

no existe base de sondeo o cuando la utilización de esta resulta muy laboriosa y cara. El

que una muestra no sea probabilística no quiere decir que no sea representativa, ya que

si sus características coinciden con las de la población de la cual ha sido extraida,

podrán extrapolarse resultados, sin embargo no permite calcular el error muestral.

Tipos de muestreo no probabilístico

Existen diferentes tipos de muestreo no probabilístico: el muestreo accidental o

voluntario, el muestreo de cuotas, el muestreo intencionado y el muestreo conveniente.

En el muestreo accidental o voluntario se van escogiendo las personas a analizar

accidentalmente, sin ningún criterio previo de selección, hasta completar el tamaño

muestras establecido. Este tipo de muestreo suele ser muy empleado en sondeos de

opinión, sobre todo en los de carácter periodístico. Aunque se suele obtener una muestra

muy sesgada y no demasiado representativa, es útil para la realización del Pretest, es

decir para la prueba de validación del cuestionario e incluso como análisis de tipo

exploratorio previo a la redacción de las hipótesis definitivas.

Aunque algunas veces es el único muestreo que puede realizarse puede conllevar

múltiples errores, ya que hay ciertos tipos de personas que tienen más posibilidades de

ser elegidos para conformar la muestra: los que tienen buena cara, el que no tiene prisa,

etc.

El muestreo por cuotas siendo muy similar al muestreo aleatorio estratificado, parte

del principio de que no existiendo base de sondeo o habiéndola pero siendo muy caro

utilizarla, se deja en manos del entrevistador la selección última de la persona a

entrevistar. Se le dan al encuestador una serie de características (o cuotas) que debe

cumplir el entrevistado, pero se deja de su mano la elección de la persona determinada,

con esas cuotas. Este tipo de muestreo es similar al muestreo estratificado, pero no se

determina (al no utilizar base de sondeo) la persona exacta a encuestar. Por lo tanto, se

seleccionan los sujetos de forma que cumplan un porcentaje ya conocido de la

población. Al igual que en el muestreo estratificado el investigador construye estratos

de población (en función de una o varias características generales del universo), como

no existe base de sondeo en la que aparezcan consignadas las personas que forman parte

de cada estrato, se realiza un muestreo en cierto modo "accidental", pero tratando de que

la muestra se adecue a las características de la población. Una vez obtenidos los

resultados, estos se pueden ponderar de manera que la muestra se asimile lo más posible

a la población de la que ha sido extraida.

Como principal inconveniente podemos destacar el hecho de que puede esultar difícil

controlar al entrevistador, que puede escoger a todos los componentes de la muestra de

entre los componentes de un grupo social determinado, o mediante el método conocido

como "bola de nieve" (se pregunta a un seleccionado por otro que puede cumplir las

cuotas predeterminadas, y a este por otro, y así sucesivamente).

A pesar de tratarse de un tipo de muestreo no probabilístico los resultados que se

obtienen mediante este tipo de muestreo son bastante satisfactorios, sobre todo si la

selección de los componentes de la muestra es aleatoria en etapas y sólo al final se

introducen las cuotas.

Una variante la constituye el muestreo intencionado. En este la muestra se elabora

porque se tienen "buenas razones" para pensar que se trata de una muestra válida. Los

sujetos se seleccionan sobre la base de unas características específicas y se eliminan

aquellos que no cumplen tales características. Algunas veces es el único tipo de

muestreo posible y se suele utilizar para investigar una sección muy determinada de la

población de la que no se tiene base de sondeo. Si la selección de la muestra se realiza

en base a criterios suficientemente fundados suele resultar una muestra perfectamente

representativa.

Por último, el muestreo conveniente, se trata de la selección de un grupo de sujetos

fácilmente accesibles para el objeto de estudio.

Estos modelos muestrales pueden aplicarse por separado o simultáneamente e incluso

se pueden utilizar diferentes tipos de muestreo en cada fase de la investigación, con lo

que en cada estudio será necesario realizar un diseño muestral específico.

En realidad, cada situación exige un tipo de muestreo en función de la información

disponible sobre la población objeto de análisis, así como de su distribución. Sin

embargo, no cabe duda de que el proceso de investigación así como los errores

muestrales vendrán en cierta medida condicionados por esta elección metodológica, a

pesar de que resulta difícil (si no imposible) determinar la disminución o el incremento

del error que se hubiera dado en caso de haber escogido otro sistema de muestreo.

Selección muestral

Muestreo de probabilidad

Posibilidad de

generalizar los

resultados

Representatividad de la

muestra

M. Aleatorio simple

M. Aleatorio

sistemático

M. Aleatorio

estratificado

M. por conglomerados

M. multietápico o

polietápico

M. de panel

Muestreo de no probabilidad

Escasa representatividad

Establecer relación entre

las variables

M. accidental o voluntario

M. por cuotas

M. intencionado

M. conveniente

3. Tamaño muestral

Para el diseño muestral deben considerarse fundamentalmente dos aspectos de los que

depende la precisión de los datos y las posibilidades de extrapolación de los resultados.

Por un lado, es imprescindible acotar y conocer la población a investigar y por otro, hay

que tener en cuenta que la representatividad muestral depende de dos cuestiones

básicas: en primer lugar, cómo van a seleccionarse los componentes de la muestra para

representar lo más fielmente posible las características de la población de la que han

sido extraídos –como ya hemos visto en el apartado anterior-. En segundo lugar, el

tamaño óptimo que debe tener (que en el caso de muestras probabilísticas depende de

una serie de condiciones estadísticas)

Si nos fijamos en el tamaño óptimo que debe tener una muestra para ser representativa

de una población deberemos considerar el tamaño de la población de la cual se va a

extraer, su variabilidad interna, así como el nivel de confianza con el que queramos

trabajar y el margen de error que estemos dispuestos a aceptar.

En general, puede decirse que a mayor tamaño de la población, mayor deberá ser la

muestra, aunque proporcionalmente cuanto mayor sea la población menor será el

tamaño muestral requerido. No sólo tiene importancia el tamaño global de la población

a investigar, sino que en cierta medida también influyen las características

composicionales de esta. "Los objetivos de la investigación pueden requerir que los

resultados se ofrezcan globalmente o a un nivel mayor de desagregación. En este

segundo caso puede ser necesario cargar la muestra en determinadas subpoblaciones,

partes o fracciones de la población original, que interese estudiar pos separado"

(Rodríguez Osuna, 1991, p.15).

Si llevamos esto al extremo puede ser necesario crear una submuestra para cada uno de

los grupos que conforman la población original. Encontrándonos así con una muestra

general mucho más amplia que la requerida en un principio y que está determinada por

la suma de las submuestras. En este caso, a nivel general aumentará el nivel de

confianza y disminuirá el margen de error fijados de antemano.

Por muy bien seleccionada que esté una muestra y muy representativa que ésta sea, los

resultados muéstrales tenderán a diferir un poco de los resultados que obtendríamos en

caso de analizar a toda la población. Esta posible diferencia es lo que se conoce por

margen de error admitido. El error muestral hace referencia a la diferencia entre los

resultados obtenidos de una muestra (estadísticos) y los obtenidos de la población

(parámetros) de la que se ha obtenido dicha muestra (Marton, 1988; Fowier, 1988).

Cuanto mayor sea la muestra menor tenderá a ser el error muestral (menos diferencia

habrá entre muestra y población). Generalmente y hablando en términos operativos, se

establece primero el error muestral que se está dispuesto a admitir (generalmente un

máximo de 5%) y a partir de ahí el tamaño de la muestra.

Para evitar en la medida de lo posible los errores se exige que se respete la aleatoriedad

e independencia, tanto al elegir y aplicar el método de selección de las unidades

muestrales como al recoger la información, es decir, hay que evitar el recurrir

fácilmente a las sustituciones de los sujetos seleccionados para formar parte de la

muestra, así como evitar en la medida de lo posible los problemas derivados de la "no

respuesta" (Platek, 1986; Fowier 1988; Latiesa, 1995).

En realidad no podemos perder de vista que el error muestral es el error máximo

tolerado para un nivel de confianza, haciendo este concepto referencia a la probabilidad

de acertar, con una muestra determinada, lo que ocurre en la realidad. Operativamente,

el Nivel de Confianza (N.C.) se establece también previamente al tamaño de la muestra,

y suele variar entre el 90% y el 99%, siendo el N.C. más utilizado el del 95,5% (2

sigma).

Por último, otro elemento a tener en cuenta a la hora de establecer el tamaño de la

muestra es la variabilidad interna de la población a investigar. Cuanto más heterogenea

sea la población mayor deberá ser el tamaño de la muestra. Como normalmente no se

suele conocer a priori la variabilidad interna se suele contemplar el caso más extremo,

esto es, que la variabilidad sea máxima (p=q=50%).

A pesar de que existen fórmulas estadísticas para calcular exactamente el tamaño de la

muestra requerido para cada estudio determinado, existen también tablas en las que

considerando el tamaño de la población, el margen de error tolerado y el nivel de

confianza establecido por el investigador podemos encontrar de un modo fácil y rápido

el tamaño muestral requerido para obtener resultados representativos y por supuesto

fiables. En todo caso, no podemos eludir el hecho de que la definición del tamaño

muestral es un trabajo altamente estandarizado y que esencialmente depende de

conceptos estadísticos basados en la teoría de la probabilidad.

Tamaño muestral

¿Cuántas personas serán objeto de estudio?

Muestra (n)

Acotar el Universo o Población (N)

Finito (-100.000 personas)

Infinito (+ 100.000 personas)

Ley de los grandes números

Base de la muestra (base de datos)

Error muestral (e): diferencias entre los resultados

de la muestra y el resultado real que se hubiera

producido al analizar la totalidad de la población

Coste económico y temporal

Impacto social del estudio

Tamaño muestral

Nivel de confianza o coeficiente de

probabilidad (s ó sigma). Expresa el porcentaje de

casos o unidades del Universo para los que es necesariamente

cierto el margen de error citado.

2 sigma: 95,5%

3 sigma: 99,7%

Varianza poblacional o proporción del

rasgo diferenciador (p/q).

Siempre suma 100

Heterogeneidad de la muestra

Normativa: publicación de la ficha técnica

Selección y tamaño muestral

Selección y Tamaño Muestral

Documents

Transcript of Selección y Tamaño Muestral