Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la...

34
Ms. C. Marco Vinicio Rodríguez [email protected] http://mvrurural.wordpress.com/ MÉTODOS ESTADÍSTICOS PARA INVESTIGADORES I

Transcript of Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la...

Page 1: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

Ms. C. Marco Vinicio Rodríguez

[email protected]

http://mvrurural.wordpress.com/

MÉTODOS ESTADÍSTICOS

PARA INVESTIGADORES I

Page 3: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

La característica más importante de una muestra es que debe ser representativa de la población objeto de estudio para poder extrapolar los resultados a la población total.

Las nociones de muestra representativa y de muestra probabilística suelen identificarse erróneamente como una y la misma.

Como consecuencia puede ocurrir que, al admitir que la muestra no fue seleccionada por vía del azar, el investigador sienta que su estudio carece del rigor científico necesario. La noción que mejor sintetiza la idea de representatividad es la siguiente: “Lo que debe procurarse es que la muestra tenga internamente el mismo grado de diversidad que la población”

Page 4: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

Los métodos para seleccionar una muestra representativa son numerosos, podemos clasificarlos en:

Probabilístico: Todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de la muestra (principio de equiprobabilidad),

También se conoce como muestreo aleatorio

No Probabilístico: La elección de los individuos no depende de la probabilidad, sino del proceso de toma de decisiones del investigador (las muestras seleccionadas por decisiones subjetivas tienden a estar sesgadas).

Page 5: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

Probabilístico

(Aleatorio)

Aleatorio simple.

Sistemático.

Estratificado.

Por conglomerados.

No

Probabilístico

Accidental

Por conveniencia.

Por cuotas.

Bola de Nieve.

Page 6: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo
Page 7: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

Los procedimientos probabilísticos reducen la carga subjetiva que podría influir en la elección de las unidades que se van a estudiar, y sobre todo, permiten medir el grado de precisión con que se realizan las estimación de los parámetros poblacionales.

El azar no necesariamente inyecta representatividad a cada muestra que se obtenga, sino lo que realmente asegura es la imparcialidad en la conducta del investigador.

Se considera que el método de selección de la muestra tiene un carácter estadísticamente riguroso cuando su diseño cumple las siguientes condiciones:

A cada elemento de la población, se le otorgue una probabilidad conocida de pertenecer a la muestra.

Y por supuesto, esta probabilidad no sea nula.

Page 8: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo
Page 9: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo tanto, están descritos en el marco muestral, tienen idéntica probabilidad de ser seleccionados para la muestra.

Sería algo así como hacer un sorteo justo entre los individuos del universo: asignamos a cada persona un boleto con un número correlativo, introducimos los números en una urna y empezamos a extraer al azar boletos.

Todos los individuos que tengan un número extraído de la urna formarían la muestra. Obviamente, en la práctica estos métodos pueden automatizarse mediante el uso de ordenadores.

Page 10: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

Dependiendo de si los individuos del universo pueden ser seleccionados más de una vez en la muestra, hablaremos de M.A.S. con reposición o sin reposición.

Si usamos reposición, el hecho de que seleccione un individuo al azar para mi muestra no impediría que este mismo individuo pudiese volver a ser seleccionado en una siguiente selección. Sería equivalente a decir que cada vez que extraigo un número al azar de mi urna, vuelvo a colocar el número antes de la siguiente extracción.

Si por el contrario no usamos reposición, un individuo seleccionado para la muestra una vez ya no entraría nuevamente en el sorteo.

Page 11: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

La pregunta obvia es, ¿qué es mejor, usar reposición o sin reposición?

Es un simple problema matemático. César Pérez López, en su libro "Muestreo Estadístico" (Pearson, 2005) desarrolla de forma muy clara una comparación entre ambas técnicas.

Tanto que si lo miramos desde el punto de vista de qué técnica genera estimaciones más precisas como desde el punto de vista de qué técnica me permite tener la misma precisión con menor tamaño de muestra, se puede concluir que el muestreo aleatorio simple sin reposición siempre es más eficiente.

Page 12: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

A la probabilidad que tiene cada individuo de pertenecer a la muestra se le denomina fracción de muestreo:

𝑓 =𝑛

𝑁

Para la selección de una M.A.S., se enumeran previamente las unidades de la población de 1 a N y a continuación se seleccionan n números distintos entre 1 y N utilizando algún procedimiento aleatorio (mediante una tabla de números aleatorios o un generador de números aleatorios por ordenador).

Ejemplo

Elegir una muestra aleatoria de 5 estudiantes en un grupo de estadística de 20 alumnos.

Extraer una muestra a partir de 37,488 historias clínicas de las clínicas de Consulta Externa de un Hospital.

Page 13: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo
Page 14: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

El muestreo sistemático es un proceso muy simple y que sólo requiere la elección de un individuo al azar.

El resto del proceso es trivial y rápido. Los resultados que obtenemos son representativos de la población, de forma similar al muestreo aleatorio simple, siempre y cuando no haya algún factor intrínseco en la forma en que los individuos están listados que haga que se reproduzcan ciertas características poblacionales cada cierto número de individuos. Este suceso es realmente poco frecuente.

Page 15: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

De forma concreta, el proceso que seguiríamos en un muestreo sistemático sería el siguiente:

1. Elaboramos una lista ordenada de los N individuos de la población, lo que sería el marco muestral.

2. Dividimos el marco muestral en n fragmentos, donde n es el tamaño de muestra que deseamos. El tamaño de estos fragmentos será

K=N/n

donde K recibe el nombre de intervalo o coeficiente de elevación.

3. Número de inicio: obtenemos un número aleatorio entero A, menor o igual al intervalo. Este número corresponderá al primer sujeto que seleccionaremos para la muestra dentro del primer fragmento en que hemos dividido la población.

4. Selección de los n-1 individuos restantes: Seleccionamos los siguientes individuos a partir del individuo seleccionado aleatoriamente, mediante una sucesión aritmética, seleccionando a los individuos del resto de fragmentos en que hemos dividido la muestra que ocupan la misma posición que el sujeto inicial.

Page 16: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

Ejemplo.

A continuación se presenta una tabla de la cantidad de jeringas que se empacan por caja en una línea de producción.

Se necesita tomar una muestra de 20 unidades para someterlas a estudio y encontrar el promedio de jeringas que las cajas llevan.

El primer sujeto de la muestra deberá tomarse a partir de la segunda posición.

.

42 60 60 38 60 63 35 38 40 63 48 33 21

30 35 47 53 49 50 32 21 39 39 34 45 27

81 62 64 69 68 72 83 56 65 74 67 54 65

61 67 73 57 62 67 68 63 67 71 68 76 61

Clinica A

Page 17: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

Solucion.

.

42 60 60 38 60 63 21 66 56 57 51 57 44

30 35 47 53 49 50 49 38 45 28 41 47 42

54 38 40 63 48 33 35 61 47 41 55 53 27

42 21 39 39 34 45 39 28 54 33 35 43 48

Total de población Muesta

2052

20

60 60 63 66 57 44

30 49 50 45 41 42

40 63 61 47 53

39 39 35

Promedio = 984

20= 49.2

k = = 2.6 = 3

Clinica A

52

Page 18: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo
Page 19: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

Cuando se desea asegurar la representatividad de determinados subgrupos o estratos de la población, la alternativa más sencilla es seleccionar por separado distintas submuestras dentro de cada estrato.

Los estratos han de definir subgrupos de población que sean internamente homogéneos con respecto a la característica o parámetro de interés y, por tanto, heterogéneos entre sí.

En la práctica, los estratos se definen en función de variables fáciles de medir previamente y relevantes para el tema objeto de estudio (edad, sexo, área geográfica de residencia). En general, el número de estratos L ha de ser reducido (rara vez resulta eficiente utilizar más de 5 estratos) y el tamaño por estrato no debe ser muy pequeño.

Page 20: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

Para la selección de una muestra estratificada de tamaño n, la población de N unidades se divide en L estratos de tamaños N1, N2,..., NL, cuya suma es igual a N.

En el muestreo estratificado, es necesario determinar cómo se distribuye el tamaño muestral total n entre los distintos estratos; es decir, la asignación de los tamaños muestrales n1,..., nL. El procedimiento utilizado con mayor frecuencia es la afijación proporcional: el tamaño de la muestra de cada estrato es proporcional al tamaño del estrato correspondiente con respecto a la población total.

Page 21: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

Para ello utilizaremos la siguiente formula:

Donde: N = la Población sujeta a estudio Ni = La población de cada estrato n = La muestra que se someterá a estudio ni = la muestra proporcional del estrato

En una fábrica que consta de 600 trabajadores queremos tomar una muestra de 20.

Sabemos que hay 200 trabajadores en la sección A, 150 en la B, 150 en la C y 100

en la D.

𝑛𝑖 = 𝑛 .𝑁𝑖

𝑁 = 20 .

200

600= 6.6 = 7 𝑇𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠 𝐴

𝑛𝑖 = 𝑛 .𝑁𝑖

𝑁 = 20 .

150

600= 5 𝑇𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠 𝐵

𝑛𝑖 = 𝑛 .𝑁𝑖

𝑁 = 20 .

150

600= 5 𝑇𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠 𝐶

𝑛𝑖 = 𝑛 .𝑁𝑖

𝑁 = 20 .

100

600= 3.3 = 4 𝑇𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠 𝐷

Page 22: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

Los conglomerados acostumbran a ser agrupaciones naturales de individuos como hogares, hospitales, colegios, provincias, etc.

A diferencia de la estratificación, las diferencias dentro de cada conglomerado deben ser máximas: en cada conglomerado debe haber unidades representativas de toda la población, de lo contrario se perdería información al seleccionar únicamente algunos de ellos.

Los resultados no varían si se selecciona uno u otro conglomerado. El número de conglomerados es típicamente elevado, de los cuales suele seleccionarse un número relativamente pequeño para resolver el problema de la dispersión muestral.

Page 23: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

La aplicación de los diseños muestrales anteriores requiere de la enumeración u ordenación de todos los elementos de la población. Sin embargo, a menudo no se dispone de una lista completa o, aun disponiendo de tal lista, resulta muy costoso obtener información de las unidades muestreadas.

Por ejemplo,

Si se seleccionara una muestra aleatoria simple de 1000 individuos estudiantes de 5to Semestre de la Universidad Rural de Guatemala, los individuos seleccionados estarían muy dispersos y la recogida de información sería extraordinariamente laboriosa.

En tales circunstancias, una alternativa consiste en clasificar a la población en grupos o conglomerados, para así seleccionar una muestra de estos conglomerados y después tomar a todas o a una parte de las unidades incluidas dentro de los conglomerados seleccionados.

Page 24: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

Ejemplo

Si queremos extraer una muestra para un estudio del numero de Mujeres estudiantes de 5to Semestre de la Universidad Rural de Guatemala, con edades comprendidas entre 20 y 28 años, a partir de una lista completa de las sedes que tienen este semestre activo, podemos elegir aleatoriamente un cierto número de aulas (conglomerados) de manera que la muestra estaría formada por todos los estudiantes de las aulas seleccionadas

Page 25: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

Los métodos de muestreo no probabilístico son aquellos en los que las unidades de análisis se recogen según criterios del investigador y no utilizando métodos en los que interviene el azar, de modo que no es posible estimar la probabilidad que tiene cada elemento de ser incluido en la muestra y no todos los elementos tienen posibilidad de ser incluidos.

No garantizan la representatividad de la muestra y por lo tanto no permiten realizar estimaciones inferenciales sobre la población.

Page 26: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

Es una técnica comúnmente usada. Consiste en seleccionar una muestra de la población por el hecho de que sea accesible. Es decir, los individuos empleados en la investigación se seleccionan porque están fácilmente disponibles, no porque hayan sido seleccionados mediante un criterio estadístico.

Esta conveniencia, que se suele traducir en una gran facilidad operativa y en bajos costes de muestreo, tiene como consecuencia la imposibilidad de hacer afirmaciones generales con rigor estadístico sobre la población.

Page 27: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

Ejemplo

Supongamos que queremos conocer la opinión de los estudiantes universitarios del departamento de Guatemala acerca de la política.

Una muestra probabilística requeriría acceder a un censo del total de estudiantes de todas las universidades con el fin de seleccionar al azar un grupo de individuos y encuestarlos.

Una muestra por conveniencia podría consistir en dirigirme a 3 universidades cercanas, simplemente porque están en la población en la que reside el encuestador, y encuestar a unos cuantos individuos que acepten participar al salir de las aulas por la mañana.

Page 28: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

Las limitaciones de este tipo de muestreo

son obvias.

En el ejemplo anterior, podría suceder que

diferentes tipos de universidades

correlacionen con estratos sociales y con

opiniones políticas. Es más, si selecciono

estudiantes de 3 universidades concretas y

los encuesto por la mañana, sus opiniones

podrían ser diferentes de las de estudiantes

del turno de tarde (que tal vez trabajan al

mismo tiempo que estudian).

Page 29: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

Esta técnica es la que suele usarse en investigación online a través de paneles. Podemos ver el muestreo por cuotas como la versión no probabilística del muestreo estratificado. Consta de tres fases:

1. Segmentación:

En primer lugar, dividimos la población objeto de estudio en grupos de forma exhaustiva (todos los individuos están en un grupo) y mutuamente exclusiva (un individuo sólo puede estar en un grupo), de forma similar a la división en estratos empleada en el muestreo estratificado. Normalmente esta segmentación se hace empleando alguna variable sociodemográfica como sexo, edad, región o clase social.

Page 30: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

2. Fijamos el tamaño de las cuotas: A continuación, fijamos el objetivo de individuos a encuestar para cada uno de estos grupos. Normalmente definiremos estos objetivos de forma proporcional al tamaño del grupo en la población.

Por ejemplo, si hemos definido unos segmentos por sexo en una población en la que hay un 60% de mujeres y un 40% de hombres, y queremos obtener una muestra de 1.000 personas, definiremos un objetivo de 600 mujeres y 400 hombres. Estos objetivos se conocen como cuotas. En este ejemplo, tendríamos una cuota por sexo de 600 mujeres y 400 hombres. En ocasiones se definen cuotas no proporcionales a la población, por ejemplo para poder profundizar en el análisis de un grupo específico.

Page 31: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

3. Selección de participantes y comprobación de cuotas

Por último, se buscan participantes para cubrir cada una de las cuotas definidas. En este punto es donde nos alejamos de un muestreo probabilístico: en el muestreo por cuotas aceptamos que la selección de individuos no sea aleatoria, puede ser una selección mediante muestreo por conveniencia.

Por ejemplo, en un estudio en el que hayamos definido una cuota de 100 personas menores de 25 años y 100 personas de 25 o más años, podríamos salir a la calle y abordar a las personas que encontramos a nuestro paso, preguntarles su edad y encuestarlas si no hemos cubierto nuestro objetivo.

Page 32: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

El muestreo por bola de nieve es una técnica de muestreo no probabilística en la que los individuos seleccionados para ser estudiados reclutan a nuevos participantes entre sus conocidos.

El nombre de "bola de nieve" proviene justamente de esta idea: del mismo modo que una bola de nieve al rodar por una ladera se va haciendo más y más grande, esta técnica permite que el tamaño de la muestra vaya creciendo a medida que los individuos seleccionados invitan a participar a sus conocidos.

Page 33: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

La bola de nieve se usa con frecuencia para acceder a poblaciones de baja incidencia y a individuos de difícil acceso por parte del investigador.

En estudios en los que se quiere estudiar un colectivo muy específico (por ejemplo, personas aficionadas a la filatelia o coleccionismo de sellos), puede resultar mucho más efectivo obtener una muestra a través de conocidos y amigos de los propios coleccionistas, que mediante una selección puramente aleatoria, en la que una gran cantidad de individuos candidatos a participar serían descartados..

Page 34: Métodos Estadísticos Para Investigadores I · El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo en la que todos los elementos que forman el universo y que, por lo

Diferencias entre los tipos de Muestreo