Selección y Tamaño Muestral
-
Upload
alejandro-de-la-fuente -
Category
Documents
-
view
216 -
download
0
description
Transcript of Selección y Tamaño Muestral
Selección y tamaño muestral
Cuando una investigación aborda el objeto de estudio mediante la técnica de la
encuesta, tiene que tener en cuenta como elemento fundamental la población objeto de
estudio y la selección muestral de esa población.
El acotamiento preciso de la población a estudiar es uno de los aspectos fundamentales
y prioritarios de una investigación, ya que a partir de éste podremos decidir si realizar
una investigación exhaustiva o en el caso contrario, saber estrictamente de qué
población tendrá que ser representativa la muestra. Cuanto mejor conozcamos el
universo a analizar, más precisamente podremos realizar el diseño muestral, ya que el
conocimiento de las unidades que componen la población, así como su distribución y
características principales, permiten acercarnos al conocimiento de la variabilidad
poblacional, con lo cual calcularemos el tamaño muestral más exactamente
1. Población, muestra y ámbito Con el término POBLACIÓN o UNIVERSO, se designa a cualquier conjunto de
elementos que tienen unas características comunes. Cada uno de los elementos que
integran tal conjunto recibe el nombre de individuo. Cuando se pone en marcha una
investigación, generalmente, no es posible analizar todos los individuos de una
población, bien porque la población contiene muchos elementos, bien porque
económicamente es inviable –o las dos cuestiones juntas- Si tiene lugar cualquiera de
estas circunstancias –o las dos- se recurre al estudio de un subconjunto de elementos
extraídos de la población que denominamos MUESTRA.
Por lo tanto, la MUESTRA es un subconjunto de individuos pertenecientes a una
población y representativos de la misma. Existen diversas formas de seleccionar la
muestra, en función del análisis que se pretende efectuar.
2. Selección muestral
Un factor determinante para construir un diseño muestral válido se refiere al modo
cómo se seleccionen los elementos que conforman la muestra y puede decirse que
existen dos modelos fundamentales de muestreo: el muestreo probabilistico que incluye
diversos tipos como son: el muestreo aleatorio simple, aleatorio sistemático,
estratificado, por conglomerados, polietápico y de panel y el muestreo no probabilístico
que incluye el muestreo accidental, el de cuotas, el intencionado y el muestreo
conveniente.
2.1 Muestreo probabilístico o muestreo de probabilidad
El muestreo probabilístico se caracteriza porque en él "cada elemento de la población
tiene una probabilidad conocida y no nula de ser seleccionado" (Kish, 1972, 41). Tal
como afirma Rodríguez Osuna (1991), este tipo de muestreo permite la inferencia
estadística a la población de la cual ha sido extraída la muestra, siendo las estimaciones
instigadas (coincidiendo parámetros y estadísticos) y pudiéndose calcular los errores de
muestreo. En este sentido, Converse y Presser (1986), Fowler (1988), Gómez Benito
(1990) opinan que es conveniente utilizar este tipo de muestreo siempre que sea posible.
Tipos de muestreos probabilísticos
El muestreo aleatorio simple es un método por el cual todos los miembros de la
población tienen igual posibilidad de ser elegidos en la muestra. El criterio de selección
de ésta consiste en una serie de métodos que garantizan que la selección de una
determinada persona sólo se debe al azar. Existen dos métodos principales de selección
de la muestra: la urna de Bernoulli y las tablas de números aleatorios.
Una variación del muestreo aleatorio simple, es el muestreo aleatorio sistemático, que
consiste en averiguar la tasa de sondeo, esto es, la relación entre el número de miembros
de una población y el tamaño de la muestra deseada para, a partir de ella, seleccionar las
unidades que formarán parte de la muestra. Los sujetos que integran una muestra
sistemática han sido elegidos a partir de X unidades de la población.
Tanto en el muestreo aleatorio simple como el sistemático los elementos se escogen
totalmente al azar y por ello pueden tener sesgos de tipo cualitativo, ya que no tienen en
cuenta las características de la población. Para solucionar este problema se suele utilizar
el muestreo aleatorio estratificado que permite tener en cuenta la distribución de la
población en estratos a la hora de seleccionar la muestra. Los estratos se formaran en
función de al menos una variable importante para la investigación (estratificación
simple si sólo se tiene en cuenta una variable; estratificación asociada o combinada si se
tienen en cuenta al menos dos).
Otro método probabilístico de selección de la muestra es el llamado muestreo de
conglomerados (clusters o racimos) que consiste en establecer subgrupos dentro de la
población y seleccionar un número determinado de subgrupos de modo que la suma de
los individuos de los subgrupos seleccionados formen la muestra deseada. Si los
conglomerados o subgrupos se obtienen en función de criterios geográficos (secciones
censases, bloques de viviendas, ...) se suele hablar de muestreo por áreas.
El muestreo multietápico o polietápico es en realidad una variante del muestreo por
conglomerados. Si en este se elegían subgrupos y de estos se analizaba a toda su
población, en el muestreo polietápico se seleccionan conglomerados y dentro de estos se
vuelve a establecer una submuestra de alguno de los diferentes modos apuntados.
Por último, el muestreo de panel consiste en una selección de personas realizada por
cualquiera de los procedimientos anteriores (generalmente por estratificación) que se
mantiene al día para sucesivas investigaciones. Se conserva la misma muestra para
varios estudios, de modo que se puede analizar la evolución de la población.
Tiene como ventajas que es una manera de muestrear económica y rápida, a la vez que
permite, tal como hemos dicho, describir cambios, sin embargo también presenta
inconvenientes, entre los que destaca el llamado "efecto de panel" (la primera encuesta
no presenta problemas, pero en las siguientes se pierde espontaneidad en las respuestas,
ya que el elegido sabe que va a ser encuestado y sobre qué).
2.2.Muestreo no probabilístico o muestreo de no probabilidad
El muestreo no probabilístico es aquel que se utiliza cuando no se puede prever la
probabilidad que tiene cada individuo de salir elegido en la muestra. Se realiza cuando
no existe base de sondeo o cuando la utilización de esta resulta muy laboriosa y cara. El
que una muestra no sea probabilística no quiere decir que no sea representativa, ya que
si sus características coinciden con las de la población de la cual ha sido extraida,
podrán extrapolarse resultados, sin embargo no permite calcular el error muestral.
Tipos de muestreo no probabilístico
Existen diferentes tipos de muestreo no probabilístico: el muestreo accidental o
voluntario, el muestreo de cuotas, el muestreo intencionado y el muestreo conveniente.
En el muestreo accidental o voluntario se van escogiendo las personas a analizar
accidentalmente, sin ningún criterio previo de selección, hasta completar el tamaño
muestras establecido. Este tipo de muestreo suele ser muy empleado en sondeos de
opinión, sobre todo en los de carácter periodístico. Aunque se suele obtener una muestra
muy sesgada y no demasiado representativa, es útil para la realización del Pretest, es
decir para la prueba de validación del cuestionario e incluso como análisis de tipo
exploratorio previo a la redacción de las hipótesis definitivas.
Aunque algunas veces es el único muestreo que puede realizarse puede conllevar
múltiples errores, ya que hay ciertos tipos de personas que tienen más posibilidades de
ser elegidos para conformar la muestra: los que tienen buena cara, el que no tiene prisa,
etc.
El muestreo por cuotas siendo muy similar al muestreo aleatorio estratificado, parte
del principio de que no existiendo base de sondeo o habiéndola pero siendo muy caro
utilizarla, se deja en manos del entrevistador la selección última de la persona a
entrevistar. Se le dan al encuestador una serie de características (o cuotas) que debe
cumplir el entrevistado, pero se deja de su mano la elección de la persona determinada,
con esas cuotas. Este tipo de muestreo es similar al muestreo estratificado, pero no se
determina (al no utilizar base de sondeo) la persona exacta a encuestar. Por lo tanto, se
seleccionan los sujetos de forma que cumplan un porcentaje ya conocido de la
población. Al igual que en el muestreo estratificado el investigador construye estratos
de población (en función de una o varias características generales del universo), como
no existe base de sondeo en la que aparezcan consignadas las personas que forman parte
de cada estrato, se realiza un muestreo en cierto modo "accidental", pero tratando de que
la muestra se adecue a las características de la población. Una vez obtenidos los
resultados, estos se pueden ponderar de manera que la muestra se asimile lo más posible
a la población de la que ha sido extraida.
Como principal inconveniente podemos destacar el hecho de que puede esultar difícil
controlar al entrevistador, que puede escoger a todos los componentes de la muestra de
entre los componentes de un grupo social determinado, o mediante el método conocido
como "bola de nieve" (se pregunta a un seleccionado por otro que puede cumplir las
cuotas predeterminadas, y a este por otro, y así sucesivamente).
A pesar de tratarse de un tipo de muestreo no probabilístico los resultados que se
obtienen mediante este tipo de muestreo son bastante satisfactorios, sobre todo si la
selección de los componentes de la muestra es aleatoria en etapas y sólo al final se
introducen las cuotas.
Una variante la constituye el muestreo intencionado. En este la muestra se elabora
porque se tienen "buenas razones" para pensar que se trata de una muestra válida. Los
sujetos se seleccionan sobre la base de unas características específicas y se eliminan
aquellos que no cumplen tales características. Algunas veces es el único tipo de
muestreo posible y se suele utilizar para investigar una sección muy determinada de la
población de la que no se tiene base de sondeo. Si la selección de la muestra se realiza
en base a criterios suficientemente fundados suele resultar una muestra perfectamente
representativa.
Por último, el muestreo conveniente, se trata de la selección de un grupo de sujetos
fácilmente accesibles para el objeto de estudio.
Estos modelos muestrales pueden aplicarse por separado o simultáneamente e incluso
se pueden utilizar diferentes tipos de muestreo en cada fase de la investigación, con lo
que en cada estudio será necesario realizar un diseño muestral específico.
En realidad, cada situación exige un tipo de muestreo en función de la información
disponible sobre la población objeto de análisis, así como de su distribución. Sin
embargo, no cabe duda de que el proceso de investigación así como los errores
muestrales vendrán en cierta medida condicionados por esta elección metodológica, a
pesar de que resulta difícil (si no imposible) determinar la disminución o el incremento
del error que se hubiera dado en caso de haber escogido otro sistema de muestreo.
Selección muestral
Muestreo de probabilidad
Posibilidad de
generalizar los
resultados
Representatividad de la
muestra
M. Aleatorio simple
M. Aleatorio
sistemático
M. Aleatorio
estratificado
M. por conglomerados
M. multietápico o
polietápico
M. de panel
Muestreo de no probabilidad
Escasa representatividad
Establecer relación entre
las variables
M. accidental o voluntario
M. por cuotas
M. intencionado
M. conveniente
3. Tamaño muestral
Para el diseño muestral deben considerarse fundamentalmente dos aspectos de los que
depende la precisión de los datos y las posibilidades de extrapolación de los resultados.
Por un lado, es imprescindible acotar y conocer la población a investigar y por otro, hay
que tener en cuenta que la representatividad muestral depende de dos cuestiones
básicas: en primer lugar, cómo van a seleccionarse los componentes de la muestra para
representar lo más fielmente posible las características de la población de la que han
sido extraídos –como ya hemos visto en el apartado anterior-. En segundo lugar, el
tamaño óptimo que debe tener (que en el caso de muestras probabilísticas depende de
una serie de condiciones estadísticas)
Si nos fijamos en el tamaño óptimo que debe tener una muestra para ser representativa
de una población deberemos considerar el tamaño de la población de la cual se va a
extraer, su variabilidad interna, así como el nivel de confianza con el que queramos
trabajar y el margen de error que estemos dispuestos a aceptar.
En general, puede decirse que a mayor tamaño de la población, mayor deberá ser la
muestra, aunque proporcionalmente cuanto mayor sea la población menor será el
tamaño muestral requerido. No sólo tiene importancia el tamaño global de la población
a investigar, sino que en cierta medida también influyen las características
composicionales de esta. "Los objetivos de la investigación pueden requerir que los
resultados se ofrezcan globalmente o a un nivel mayor de desagregación. En este
segundo caso puede ser necesario cargar la muestra en determinadas subpoblaciones,
partes o fracciones de la población original, que interese estudiar pos separado"
(Rodríguez Osuna, 1991, p.15).
Si llevamos esto al extremo puede ser necesario crear una submuestra para cada uno de
los grupos que conforman la población original. Encontrándonos así con una muestra
general mucho más amplia que la requerida en un principio y que está determinada por
la suma de las submuestras. En este caso, a nivel general aumentará el nivel de
confianza y disminuirá el margen de error fijados de antemano.
Por muy bien seleccionada que esté una muestra y muy representativa que ésta sea, los
resultados muéstrales tenderán a diferir un poco de los resultados que obtendríamos en
caso de analizar a toda la población. Esta posible diferencia es lo que se conoce por
margen de error admitido. El error muestral hace referencia a la diferencia entre los
resultados obtenidos de una muestra (estadísticos) y los obtenidos de la población
(parámetros) de la que se ha obtenido dicha muestra (Marton, 1988; Fowier, 1988).
Cuanto mayor sea la muestra menor tenderá a ser el error muestral (menos diferencia
habrá entre muestra y población). Generalmente y hablando en términos operativos, se
establece primero el error muestral que se está dispuesto a admitir (generalmente un
máximo de 5%) y a partir de ahí el tamaño de la muestra.
Para evitar en la medida de lo posible los errores se exige que se respete la aleatoriedad
e independencia, tanto al elegir y aplicar el método de selección de las unidades
muestrales como al recoger la información, es decir, hay que evitar el recurrir
fácilmente a las sustituciones de los sujetos seleccionados para formar parte de la
muestra, así como evitar en la medida de lo posible los problemas derivados de la "no
respuesta" (Platek, 1986; Fowier 1988; Latiesa, 1995).
En realidad no podemos perder de vista que el error muestral es el error máximo
tolerado para un nivel de confianza, haciendo este concepto referencia a la probabilidad
de acertar, con una muestra determinada, lo que ocurre en la realidad. Operativamente,
el Nivel de Confianza (N.C.) se establece también previamente al tamaño de la muestra,
y suele variar entre el 90% y el 99%, siendo el N.C. más utilizado el del 95,5% (2
sigma).
Por último, otro elemento a tener en cuenta a la hora de establecer el tamaño de la
muestra es la variabilidad interna de la población a investigar. Cuanto más heterogenea
sea la población mayor deberá ser el tamaño de la muestra. Como normalmente no se
suele conocer a priori la variabilidad interna se suele contemplar el caso más extremo,
esto es, que la variabilidad sea máxima (p=q=50%).
A pesar de que existen fórmulas estadísticas para calcular exactamente el tamaño de la
muestra requerido para cada estudio determinado, existen también tablas en las que
considerando el tamaño de la población, el margen de error tolerado y el nivel de
confianza establecido por el investigador podemos encontrar de un modo fácil y rápido
el tamaño muestral requerido para obtener resultados representativos y por supuesto
fiables. En todo caso, no podemos eludir el hecho de que la definición del tamaño
muestral es un trabajo altamente estandarizado y que esencialmente depende de
conceptos estadísticos basados en la teoría de la probabilidad.
Tamaño muestral
¿Cuántas personas serán objeto de estudio?
Muestra (n)
Acotar el Universo o Población (N)
Finito (-100.000 personas)
Infinito (+ 100.000 personas)
Ley de los grandes números
Base de la muestra (base de datos)
Error muestral (e): diferencias entre los resultados
de la muestra y el resultado real que se hubiera
producido al analizar la totalidad de la población
Coste económico y temporal
Impacto social del estudio
Tamaño muestral
Nivel de confianza o coeficiente de
probabilidad (s ó sigma). Expresa el porcentaje de
casos o unidades del Universo para los que es necesariamente
cierto el margen de error citado.
2 sigma: 95,5%
3 sigma: 99,7%
Varianza poblacional o proporción del
rasgo diferenciador (p/q).
Siempre suma 100
Heterogeneidad de la muestra
Normativa: publicación de la ficha técnica
Selección y tamaño muestral