Bioestadística muestreo y diseño de experimentos

29
 Muestreo y diseño de experimentos Población: conjunto de individuos o elementos que cumplen ciertas propiedades comunes Muestra: subconjunto de una población seleccionada con el objeto de que represente las propiedades de la población Parámetro: función definida sobre los valores numéricos de características medibles de una población Estadístico: función definida sobre los valores numéricos de una muestra

Transcript of Bioestadística muestreo y diseño de experimentos

Page 1: Bioestadística muestreo y diseño de experimentos

   

Muestreo y diseño de experimentosPoblación: conjunto de individuos o elementos que cumplen ciertas propiedades comunes

Muestra: subconjunto de una población seleccionada con el objeto de que represente las propiedades de la población

Parámetro: función definida sobre los valores numéricos de características medibles de una población

Estadístico: función definida sobre los valores numéricos de una muestra

Page 2: Bioestadística muestreo y diseño de experimentos

   

El tamaño de la población no es relevante para la estadística inferencial, sino el tamaño de la muestra

Si las inferencias para la población a partir de la muestra han de ser válidas, es importante obtener muestras representativas de la población.

En este sentido, lo mejor es recoger la mayor cantidad posible de datos. Sin embargo el aumento de tamaño de muestra para acumular cada vez más resultados, termina por alcanzar un punto donde ya no da más ventajas.

Cuando se han obtenido resultados suficientes, la obtención de datos 

adicionales puede aumentar poco la posibilidad de obtener más 

conclusiones o tener conclusiones diferentes.

Page 3: Bioestadística muestreo y diseño de experimentos

   

¿Cuánta información hay que recoger?

1. Coherencia interna.

Un procedimiento burdo pero sencillo de comprobar si se han recogido suficientes datos consiste en dividir los datos de manera aleatoria en dos mitades y analizar cada mitad por separado. Si los dos grupos de datos generan conclusiones claras que son coherentes entre sí, entonces podemos considerar que se tienen resultados suficientes.

Page 4: Bioestadística muestreo y diseño de experimentos

   

¿Cuánta información hay que recoger?

2. Estimación del tamaño necesario de la muestra.

Si nos interesa estimar un parámetro de la población, podemos estimar el tamaño necesario  de la muestra para obtener un valor medio muestral que se encuentre dentro de los límites especificados del valor promedio verdadero (poblacional), siempre y cuando contemos con algunas mediciones piloto para dar una estimación de la desviación estándar de la población.

Para estimar n se requiere:

1. Estimar la desviación estándar de la población

2. Asignar el nivel de significancia estadística para la estimación

3. Asignar la diferencia máxima aceptable (D) entre la media de la muestra y la media real.

D= | x ­  |

Page 5: Bioestadística muestreo y diseño de experimentos

   

¿Cuánta información hay que recoger?

Teniendo lo anterior n se puede calcular como:

n ≥    2 z2/2

                   D2

Por el momento, vamos a considerar a z2/2

 como un indicador del porcentaje de confianza de que la media de la muestra se encuentre dentro de la diferencia D que nosotros establecimos.

Generalmente se fija un nivel de significancia   en el 5%, lo que significa que queremos una confianza del 95% de que la muestra se encuentre dentro de D del valor.

Estableciendo  se utiliza una tabla de valores críticos de la variable normal z, para encontrar z en el nivel  /2=0.025. Así el valor de z para una confianza del 95% es de  1.96

Page 6: Bioestadística muestreo y diseño de experimentos

   

¿Cuánta información hay que recoger?

Ejemplo:

Un observador desea estimar la frecuencia media con que las crías de mono rhesus de una cierta edad se acercan a sus madres.  1  9

2  123  74  155  136  4

2. Se estimó la desviación estándar de los datos.          = 4.10 h­1

3. Se asignó una D= 2 h­1 , es decir, el investigador requiere que la diferencia entre la media de la muestra y la de la población no sea mayor a dos acercamientos por hora (un poco menos de la mitad de la DE).

4. Se fijó el nivel de significancia () en al 5%.

1. Se realizó un estudio piloto: 6 períodos de 1 hora de observación. Registrando la tasa de acercamientos (número de acercamientos por hora).

Page 7: Bioestadística muestreo y diseño de experimentos

   

¿Cuánta información hay que recoger?

n≥ (4.102  x  1.962) / 22  =  16.1Entonces,

Se necesitan por menos 17 mediciones independientes de la tasa de acercamientos para tener una confianza del 95% de que la tasa media (muestral) medida se encuentra dentro de 2 acercamientos por hora del valor promedio verdadero (poblacional).

Nota: n siempre de redondea hacia arriba

Para que la muestra sea representativa no basta que sea de tamaño suficiente también debemos cuidar que no 

esté sesgada.

Page 8: Bioestadística muestreo y diseño de experimentos

   

Muestra aleatoria

Si se eligen las muestras de forma arbitraria corremos el riesgo de hacer inferencias erróneas como sobrestimar o subestimar alguna característica de la población. Para eliminar sesgos es conveniente seleccionar una muestra aleatoria con observaciones independientes y al azar.

Muestra al azar – aquella en la que todos y cada uno de los miembros de la población tienen la misma probabilidad de ser seleccionados.

Muestreo probabilístico

Tener una muestra representativa no es trivial, necesitamos realizar un adecuado diseño de muestreo 

Page 9: Bioestadística muestreo y diseño de experimentos

   

Fuentes de sesgo

Sesgo de selección –muestras con diferente probabilidad de ser consideradas.

La no respuesta ­ ejem: individuos imposibles de encontrar o que no proporcionan la información requerida.

El sesgo del observadorEfecto del orden –ejem:  tratar o someter a prueba repetidamente a los 

mismos sujetos.Efectos de grupo – por ejemplo utilizar una misma camada.

Error de medidaError de medidaError a partir de las imperfecciones 

inevitables y la variabilidad del proceso de medición.

Error de muestreoError de muestreoDivergencia entre el 

estadísitco muestral y el parámetro poblacional

AleatorioHay la misma probabilidad de estar por arriba o por debajo 

del valor real.

SistemáticoHay una mayor probabilidad de estar o por arriba o por 

abajo del valor real.

Page 10: Bioestadística muestreo y diseño de experimentos

   

Tipos de muestreo

Muestreo aleatorio simple

Es el muestreo más simple, las unidades de muestreo (elementos individuales de la población de estudio) se eligen independientemente una a la vez y cada una tiene la misma probabilidad de ser elegida.Así para elegir una muestre aleatoria simple tenemos que listar y numerar cada unidad de estudio y elegirlas al azar, es conveniente utilizar series de números aleatorios para evitar sesgos.

Ejemplo: 

Una parcela se divide en cuadrantes, se numeran y se eligen n cuadros al azar (tablas de números aleatorios).

1        2      3        4       5       6         7         8

  9      10     11      12     13      14     15       16

17     18      19     20     21     22      23        24

25     26      27     28     29      30      31      32

Page 11: Bioestadística muestreo y diseño de experimentos

   

Tipos de muestreo

Muestreo sistemático

Es semejante al muestreo aleatorio pero más fácil de aplicar en la práctica. Teniendo la lista de las posibles unidades de estudio, se puede elige un solo número aleatorio y con éste se van eligiendo de forma consecutiva las unidades de estudio. Lo importante es que la muestra se distribuye uniformemente a lo largo de la población entera.

Ejemplo: 

vSistemático rectangular de área en el centro

Page 12: Bioestadística muestreo y diseño de experimentos

   

Tipos de muestreo

v

v

Sistemático en red no rectangular

Sistemático a lo largo de una fuente lineal

Page 13: Bioestadística muestreo y diseño de experimentos

   

Tipos de muestreo

Muestreo estratificado

Este tipo de muestreo nos permite dividir a la población en H diferentes subgrupos o estatos, de forma que cada grupo tiene un tamaño n

H. 

Nos sirve cuando en la población de estudio podemos reconocer grupos con características distintivas, las cuales pueden sesgar la inferencia en un muestreo aleatorio simple.

v

v

v

Por cambios en la densidad poblacional

Por cambios en el paisaje

Page 14: Bioestadística muestreo y diseño de experimentos

   

Tipos de muestreo

El muestreo estratificado garantiza que todos los estratos estén representados. Sin embargo, esto no significa que todas las unidades de estudio tengan la misma posibilidad de elección.

Ya que ciertos grupos pequeños de la población podrían        muestrearse en exceso, en comparación con grupos más grandes.

Cuando se aplica este muestreo, la media poblacional se estima como un promedio ponderado(tamaño del estrato) de las medias de muestreo del estrato específico. La varianza se calcula como el promedio ponderado de las varianzas entre estratos.

Page 15: Bioestadística muestreo y diseño de experimentos

   

Tipos de muestreo

Muestreo de grupo

Se utiliza cuando las unidades de estudio forman grupos naturales, o si una lista adecuada de la población entera es muy difícil de compilar.

El muestreo implica la selección aleatoria de grupos y la observación de todas las unidades de estudio entre los grupos elegidos. 

Muestreo de dos etapas – se elige una muestra aleatoria de grupos y enseguida, dentro de cada grupo, se selecciona una muestra aleatoria de unidades de estudio.

Page 16: Bioestadística muestreo y diseño de experimentos

   

Tipos de muestreo

Muestreo no probabilístico

Se desconoce la probabilidad de que un individuo sea incluido en la muestra. Por ejemplo, muestras de eventos incontrolados.

Tipos de muestreo no probabilístico:

a) Muestreo por Juicio, Selección Experta o Selección IntencionalMuestreo por Juicio, Selección Experta o Selección Intencional: El investigador toma la muestra seleccionado los elementos que a él le parecen representativos. Depende del criterio del investigados.

b) Muestreo casual o fortuitoMuestreo casual o fortuito: cuando no es posible seleccionar los elementos, y deben sacarse conclusiones con los elementos que estén disponibles. 

c) Muestreo de cuota:Muestreo de cuota: Se utiliza en estudios de opinión de mercado. Los enumeradores, reciben instrucciones de obtener cuotas especificas a partir de las cuales se constituye una muestra relativamente proporcional a la población.

d) Muestreo de poblaciones móvilesMuestreo de poblaciones móviles

Page 17: Bioestadística muestreo y diseño de experimentos

   

¿Qué tipo de muestreo elegir?

Los OBJETIVOS del estudio, la información preliminar y las condiciones del sitio son los que determinan:

­ La posición y densidad de los puntos de muestreo­ Tiempo de muestreo­ Tipo de muestreo­ Tratamiento subsecuente de las muestras­ Requerimientos analíticos

Muchas veces es necesario un muestreo preliminar para poder planificar un adecuado diseño de muestreo

Además de lo anterior, es necesario considerar que para muchos estudios se tiene que tomar en cuenta la variabilidad TEMPORAL

épocas de muestreo

Page 18: Bioestadística muestreo y diseño de experimentos

   

Más tipos de muestreo....

Estudios de etología

1) Muestreo ad libitum.­ el observador decide que registra, cuando y por cuanto tiempo. Generalmente se usa cuando se ve por primera vez una población o una cierta pauta conductual (unidad de estudio).

2) Muestreo focal.­ Se observa a un solo individuo, o a una sola nidada, camada o grupo durante un determinado período de tiempo. Es útil cuando se observan poblaciones muy grandes.

3) Muestreo de barrido.­ A intervalos regulares de tiempo se explora o censa rápidamente a un grupo completo de individuos, registrando la conducta de cada individuo al instante de la medición.

4) Muestreo por conducta.­ el investigador observa el grupo completo y registra cada ocasión en que se produce un tipo concreto de comportamiento o pauta conductual.

Page 19: Bioestadística muestreo y diseño de experimentos

   

Más tipos de muestreo....

Tipos de medidas:

a) Latencia.­ tiempo que transcurre entre la aparición de un determinado suceso y el momento en que se produce la primera aparición de la pauta conductual.

b) Frecuencia.­ número de veces que aparece la pauta conductual por unidad de tiempo.

c) Duración.­ Cantidad de tiempo durante el cual se prolonga la aparición del comportamiento.

d) Intensidad.­ A diferencias de las anteriores no tiene una definición universal, depende del tipo de comportamiento que se estudie. Una medida de intensidad muy utiliada es la TASA LOCAL: número de actos discretos componentes de una pauta conductual por unidad de tiempo. Ejemplo: comer – componente discreto= mordidas

Page 20: Bioestadística muestreo y diseño de experimentos

   

Diseño de experimentos

ExperimentoExperimento (base de los estudios prospectivos, longitudinales, comparativos):Prueba o serie de pruebas en las que se hacen cambios deliberados en las variables de entrada de un proceso o sistema para observar e identificar las razones de los cambios que pudieran observarse en la respuesta de salida.

En cualquier experimento, los resultados y las conclusiones que puedan sacarse dependen de la manera en que se recabaron los datos.

Por ejemplo, se quiere determinar la relación existente entre la tasa de forrajeo y la temperatura en peces de acuario. Para lo cual, se hacen mediciones de 20 peces a 5 diferentes temperaturas. 

Se observa cada uno de los 10 peces y se regresan a una pecera juntos.NO se identifican.

Se observa cada uno de los 10 peces y se mantienen seprados para poder IDENTIFICARLOS.

Se debe considerar el cambio en cada pez para que su propia variabilidad no sesgue los resultados.

Diseño de experimentos

Page 21: Bioestadística muestreo y diseño de experimentos

   

Diseño de experimentos

En general, los experimentos se usan para estudiar el desempeño de procesos o sistemas.

Proceso

Factores controlablesx1, x2, x3,...............Xn

Z1, z2, z3, .............znFactores no controlables

Salida  yEntradas

Objetivos del experimentador:

1) Determinar variables de mayor influencia2) Determinar relaciones o correlaciones entre las variables

En muchos casos, los experimentos incluyen 

muchos factores, además cada factor puede tener varios 

niveles.

Page 22: Bioestadística muestreo y diseño de experimentos

   

Diseño de experimentos

Hay muchos factores que podrían considerarse y hay diferentes enfoques para considerarlos.

Por ejemplo:

Un jugador de golf, quiere bajar su puntuación y busca la forma más sencilla para hacerlo sin tener que practicar demasiado. Algunos de los factores que él considera importantes, o que podrían influir son:

1.­ Tipo de palo (grande o normal)2.­ Tipo de pelota (de goma de balata o de tres piezas)3.­ Caminar cargando los palos o usar carrito4.­ Beber agua o cerveza durante el juego5.­ Hora al jugar (mañana o tarde)6.­ Estado del tiempo al jugar (frío o calor)7.­ Tipo de spikes usados en los zapatos (metálicos o d ehule)8.­ Jugar con o sin viento.

Page 23: Bioestadística muestreo y diseño de experimentos

   

Diseño de experimentos

Enfoque de la mejor conjetura.­ el experimentador selecciona una combinación o ciertas combinaciones arbitrariamente. Funciona cuando el experimentador cuanta con mucha información y práctica sobre el sistema.Desventajas:

­ Tener que probar muchas combinaciones sin éxito ­ Dejar de hacer pruebas al encontrar resultados satisfactorios sin comprobar que sea en realidad el mejor resultado. 

Un factor a la vez.­ Se selecciona un punto de partida, o línea base de los niveles, para cada factor, para después variar sucesivamente cada factor en su rango, manteniendo constantes los factores restantes en el nivel base.

Después de haber realizado todas las pruebas, se construye por lo general una serie de gráficas en las que se muestra la forma en que la variable de respuesta es afectada al variar cada factor, manteniendo a los demás constantes.

Page 24: Bioestadística muestreo y diseño de experimentos

   

Diseño de experimentospu

ntua

ci

ó n punt

uaci

ó n punt

uaci

ó n punt

uaci

ó n

             G           N                  GB           TP                C             EC                     A             C           palo                               pelota                   desplazamiento                 Bebida

Siguiendo el enfoque de un factor a la vez, la decisión sería seleccionar el palo normal, cualquier pelota, desplazarse en carro y beber agua.

La desventaja principal es que no se considera ninguna INTERACCIÓN.

Un ejemplo de interacción en el ejemplo anterior se da entre el tipo de palo ya la bebida. Con el palo grande, la bebida tiene un marcado efecto pero no lo tiene con el palo normal.

punt

uaci

ó n            Agua      cerveza

Palo grande

palo  normal

Page 25: Bioestadística muestreo y diseño de experimentos

   

Un mejor enfoque para trabajar con varios factores y niveles es un experimento factorial. Se trata de una estrategia experimental en la que los factores se hacen variar en conjuntoen conjunto.

Supongamos que para el ejemplo anterior solo son de interés dos factores: el tipo de palo y de pelota, con sus dos niveles cada uno.  

Diseño de experimentos

Para el experimento factorial se usan todas las combinaciones posibles de los niveles de ambos factores. 

En este caso (dos factores con dos niveles) se tiene un diseño factorial 2 2.

1­Palo grande con pelota de goma2­Palo grande con pelota de tres piezas3­Palo normal con pelota de goma2­Palo normal con pelota de tres piezas

        PG                C           Tipo de palo   

      

Tipo

 de 

pelo

ta   

    G

B   

      

      

 TP

 

Page 26: Bioestadística muestreo y diseño de experimentos

   

Diseño de experimentos

Comparaciones:

        PG                C           Tipo de palo   

      

Tipo

 de 

pelo

ta   

    G

B   

      

      

 TP

 

        PG                C           Tipo de palo   

      

Tipo

 de 

pelo

ta   

    G

B   

      

      

 TP

         PG                C           Tipo de palo   

      

Tipo

 de 

pelo

ta   

    G

B   

      

      

 TP

 

Efecto del palo Efecto de la pelota

Efecto de la interacción palo­pelota

Page 27: Bioestadística muestreo y diseño de experimentos

   

Diseño de experimentos

Si hay k  factores, cada uno con dos niveles, se tendría un: diseño factorial 2k. 

Evidentemente, al aumentar el número de factores, aumenta con rapidez el número de corridas o pruebas por hacerse.

 Por ejemplo un experimento con 10 factores requeriría 1024 corridas. 

Esto pronto se vuelve impracticable. Pero no es necesario siempre probar todas las combinaciones, se puede llevar a cabo una variación del diseño factorial en la que sólo se realiza un subconjunto de las corridas  =  EXPERIMENTO FACTORIAL FRACCIONADO

Page 28: Bioestadística muestreo y diseño de experimentos

   

Diseño de experimentos

Cualquier problema experimental incluye dos aspectos: Diseño del experimento y análisis estadístico de los datos, los cuales están muy relacionados entre sí.

Principios básicos del diseño experimental:

1) Realización de réplicas.­ repetición del experimento básico. Nos permite calcular el error experimental y tener un tamaño de muestra suficiente para hacer las estimaciones. Tener cuidado en hacer réplicas reales y no solo medidas repetidas.Ejem: observar al mismo pez muchas veces en vez de utilizar diferentes peces.2) Aleatorización3) Formación de bloques.­ mejora la precisión de las comparaciones. Reduce la variabilidad transmitida por factores perturbadores.4) Controles5) Blancos

Page 29: Bioestadística muestreo y diseño de experimentos

   

Diseño de experimentos

Pautas generales para diseñar experimentos:

1) Identificación y enunciación del problema

2) Elección de los factores y niveles

3) Selección de la variable de respuesta

4) Elección del diseño experimental

5) Realización del experimento

6) Análisis estadístico de los datos

7) Conclusiones y recomendaciones