Diseño Por Bloques Completamente Aleatorizados

18
DISEÑO POR BLOQUES COMPLETOS Y ALEATORIZADOS El diseño por bloques completos y aleatorizados fue creado alrededor de 1925 por R. A. Fisher, quien buscaba métodos para el mejoramiento de experimentos en el campo agrícola. El diseño por bloques completos y aleatorizados es un diseño en el que las unidades (llamadas unidades de experimentación) a las que se aplican los tratamientos son subdivididas en grupos homogéneos llamados bloques, de tal manera que el número de unidades de experimentación en un bloque es igual al número (o a un múltiplo del mismo) de tratamientos en estudio. Luego se asignan los tratamientos en forma aleatoria a las unidades experimentales dentro de cada bloque. Es necesario hacer notar que cada uno de los tratamientos aparece en todos los bloques, y cada bloque recibe todos los tratamientos. Objetivo. El objetivo al utilizar el diseño por bloques completos y aleatorizados es aislar y eliminar del término de error la variación atribuible a los bloques, y asegurar que las medias del tratamiento estén libres de los efectos del bloque. La eficacia del diseño depende de la capacidad de conseguir bloques homogéneos de unidades de experimentación. Esta capacidad depende del conocimiento de los investigadores acerca del material experimental. Cuando el diseño se utiliza con eficacia, el cuadrado medio del error en la tabla ANOVA se reduce, aumenta la R.V. y mejora la probabilidad de rechazar la hipótesis nula. En experimentos con animales, si se piensa que las diferentes cepas de animales responderán de manera diferente a un mismo tratamiento, la cepa se puede utilizar como un factor para formar bloques. Las carnadas también pueden utilizarse como bloques, en cuyo caso un animal de cada carnada recibe un tratamiento. En experimentos en los que intervienen seres humanos, si se desea eliminar las diferencias que resultan de la edad, los individuos pueden agruparse de acuerdo con la edad, de tal forma que una persona de cada edad recibe el tratamiento respectivo. El diseño por bloques completos y aleatorizados también se puede utilizar de manera eficaz

description

Estadistica

Transcript of Diseño Por Bloques Completamente Aleatorizados

DISEÑO POR BLOQUES COMPLETOS Y ALEATORIZADOS

El diseño por bloques completos y aleatorizados fue creado alrededor de 1925 por R. A. Fisher, quien buscaba métodos para el mejoramiento de experimentos en el campo agrícola. El diseño por bloques completos y aleatorizados es un diseño en el que las unidades (llamadas unidades de experimentación) a las que se aplican los tratamientos son subdivididas en grupos homogéneos llamados bloques, de tal manera que el número de unidades de experimentación en un bloque es igual al número (o a un múltiplo del mismo) de tratamientos en estudio. Luego se asignan los tratamientos en forma aleatoria a las unidades experimentales dentro de cada bloque. Es necesario hacer notar que cada uno de los tratamientos aparece en todos los bloques, y cada bloque recibe todos los tratamientos.

Objetivo. El objetivo al utilizar el diseño por bloques completos y aleatorizados es aislar y eliminar del término de error la variación atribuible a los bloques, y asegurar que las medias del tratamiento estén libres de los efectos del bloque. La eficacia del diseño depende de la capacidad de conseguir bloques homogéneos de unidades de experimentación. Esta capacidad depende del conocimiento de los investigadores acerca del material experimental. Cuando el diseño se utiliza con eficacia, el cuadrado medio del error en la tabla ANOVA se reduce, aumenta la R.V. y mejora la probabilidad de rechazar la hipótesis nula.

En experimentos con animales, si se piensa que las diferentes cepas de animales responderán de manera diferente a un mismo tratamiento, la cepa se puede utilizar como un factor para formar bloques. Las carnadas también pueden utilizarse como bloques, en cuyo caso un animal de cada carnada recibe un tratamiento. En experimentos en los que intervienen seres humanos, si se desea eliminar las diferencias que resultan de la edad, los individuos pueden agruparse de acuerdo con la edad, de tal forma que una persona de cada edad recibe el tratamiento respectivo. El diseño por bloques completos y aleatorizados también se puede utilizar de manera eficaz cuando el experimento se lleva a cabo en más de un laboratorio (bloque) o cuando se requieren varios días (bloques) para terminarlo.

Ventajas: Una de las ventajas del diseño por bloques completos y aleatorizados es que se comprende fácilmente. Además, algunas complicaciones que podrían surgir en el transcurso de un experimento son fáciles de controlar cuando se utiliza este diseño.Resulta conveniente señalar que el análisis de comparaciones por parejas que aparece en el capítulo 7 es un caso especial del diseño por bloques completos y aleatorizados. El ejemplo 7.4.1. Puede ser como un diseño por bloques completos y aleatorizados en el que los dos puntos en el tiempo (antes y después) son los tratamientos, y los individuos sobre los que se hacen las mediciones son los bloques.

Despliegue de datos: En general, los datos de un experimento que utiliza el diseño por bloques completos y aleatorizados pueden presentarse en tablas como la 8.3.1. Se debe observar la siguiente notación nueva:

Lo cual indica que el gran total se puede obtener sumando los totales de los renglones o sumando los totales de las columnas.

TABLA 1. Tabla de valores aleatorios para el diseño por bloques completos y aleatorizados

ANOVA bilateral. La técnica para analizar los datos de un diseño por bloques completos y aleatorizados se llama análisis de la variancia bilateral, porque una observación se clasifica con base en dos criterios: el bloque al que pertenece y el grupo de tratamiento del cual forma parte.

Los pasos para la prueba de hipótesis, si se utiliza el diseño por bloques completos y aleatorizados, es como sigue:

1. Datos. Después de identificar los tratamientos, los bloques y las unidades de experimentación, los datos pueden presentarse por conveniencia, como en la tabla 1.

2. Supuestos. El modelo para el diseño por bloques completos y aleatorizados se fundamenta en las siguientes suposiciones:

El modelo es

En este modeloXij es el valor representativo de toda la poblaciónµ es una constante desconocida.bij representa un efecto de bloque que refleja el hecho de que la unidad de

experimentación cae en el i-ésimo bloque. tj representa el efecto de un tratamiento que refleja el hecho de que la unidad de

experimentación recibe el j-ésimo tratamientoeij es un componente residual que representa toda las fuentes de variación que no son

tratamientos ni bloques.

Supuestos del modelo

a. Cada Xij que se observa constituye una muestra aleatoria independiente de tamaño 1 a partir de una de las kn poblaciones representadas.

b. Cada una de estas kn poblaciones sigue una distribución normal con una media µij y la misma variancia 2, Esto implica que los eij siguen una distribución normal e independiente con una media igual a 0 y variancia 2.

c. Los efectos del tratamiento y del bloque son aditivos. Esta suposición se interpreta como la no existencia de interacción entre los tratamientos y bloques. En otras palabras, una combinación particular de bloque- tratamiento no produce un efecto que sea mayor o menor que la suma de sus efectos individuales. Es posible demostrar que cuando esta suposición se satisface

Las consecuencias de contravenir esta suposición son resultados engañosos. No es necesario preocuparse por la suposición de adición, a menos que la media mayor sea en más de 50 por ciento más grande que la media menor.

Cuando estas suposiciones son verdaderas, j y j, son un conjunto de constantes fijas, y se tiene una situación que se ajusta al modelo de efectos fijos.

3. Hipótesis. Se puede probar

H 0 : tj = 0, j = 1, 2, . .. , k

Contra la alternativaHA : no todas las j = 0

Una prueba de hipótesis respecto a los efectos del bloque no se efectúa, por lo general, bajo las suposiciones del modelo de efectos fijos por dos razones. Primero, el interés principal está en los efectos del tratamiento, siendo el propósito general de los bloques proporcionar una forma de eliminar las fuentes extrañas de variación. Segundo, aunque las unidades experimentales se asignen al azar a los tratamientos, los bloques no se obtienen de manera aleatoria.

4. Estadística de prueba. La estadística de prueba es R.V.

5. Distribución de la estadística de prueba. Cuando H 0 es verdadera y se cumplen las suposiciones, R.V. sigue una distribución F .

6. Regla de decisión. Se rechaza la hipótesis nula si el valor calculado para la estadística de prueba R.V. es mayor o igual que el valor crítico de F .

7. Cálculo de la estadística de prueba. Puede mostrarse que la suma total de los cuadrados para el diseño por bloques completos y aleatorizados puede dividirse en tres componentes, cada uno atribuible a los tratamientos (SCtrat), bloques (SCbloq) y error (SCresidual). Esto es:

SCtotal = SCbloq + SCtrat + scresidual

Las fórmulas para las cantidades en la ecuación 8.3.2 son las siguientes:

Los grados de libertad adecuados para cada componente en la ecuación 8.3.2 son:

total bloques tratamientos (error) residualk n = 1 = ( n - 1) + ( k + 1) + (n-1)(K-1)

Los grados de libertad residuales, al igual que la suma de cuadrados residuales, pueden calcularse mediante una resta como sigue:

( k n - 1 ) - ( n - 1 ) - ( k - 1 ) = k n - 1 - n + 1 - k + 1

= n ( k - 1 ) - l ( k - 1 ) = ( n - 1 ) ( k - 1 )

Tabla ANOVA

Los resultados de los cálculos para el diseño por bloques completos y aleatorizados pueden desplegarse en una tabla ANOVA como la 8.3.2

TABLA 2. Tabla ANOVA para el diseño por bloques completos y aleatorizados

8. Decisión estadística. Es posible mostrar que, cuando el modelo de efectos fijos se aplica y la hipótesis nula de no efectos del tratamiento (todas las i = 0) es verdadera, tanto el cuadrado medio del error, o residual, como el cuadrado medio de los tratamientos son estimaciones para la variancia común 2. Por lo tanto, cuando la hipótesis nula es verdadera, la cantidad

CMtrat /CMresidual

sigue una distribución F con k - 1 grados de libertad en el numerador y (n - 1) x (k - 1) grados de libertad en el denominador. La razón de la variancia calculada, por lo tanto, se compara contra el valor crítico de F.

9. Conclusión. Si se rechaza H0, se concluye que la hipótesis alternativa es ver-dadera. Si no se rechaza H0, se concluye que H0 puede ser verdadera.

10. Valor de p

El siguiente ejemplo muestra el uso del diseño por bloques completos y aleatorizados.

EJEMPLO 1.

Un fisioterapeuta tenía como propósito comparar tres métodos para enseñar a sus pacientes a utilizar cierto mecanismo protésico. Consideró que el porcentaje de aprendizaje sería diferente en pacientes con diferentes edades, y quiso diseñar un experimento en el que la edad fuera tomada en cuenta.

Solución: El diseño por bloques completos y aleatorizados es un diseño adecuado para el fisioterapeuta.

1) Datos. Escogió al azar a tres pacientes por grupo para formar cinco grupos de edad para que participaran en el experimento, y a cada uno de los pacientes en cada grupo de edad se le asignó al azar un método de enseñanza. Los métodos de instrucción forman tres tratamientos, y los cinco grupos de edad son los bloques. Los datos que se obtuvieron se muestran en la tabla 8.3.3.

2) Supuestos. Se supone que cada una de las 15 observaciones forman una muestra aleatoria de tamaño 1 a partir de una de las 15 poblaciones definidas por la combinación de bloques y tratamientos. Por ejemplo, se supone que el número 7 en la tabla forma una respuesta seleccionada al azar a partir de una población de respuestas que resultaría si la población de individuos con edades menores a 20 años recibiera el método de enseñanza A. Se supone que las respuestas en las 15 poblaciones representadas siguen una distribución normal con variancias iguales.

3) Hipótesis.

H0: tj = 0 j = 1, 2, 3HA no todas las j = 0

Sea = .05.

4) Estadística de prueba. La estadística de prueba es R.V. = CMtrat /CMresidual

TABLA 3. Tiempo (en días) necesario para aprender a utilizar cierto aparato protésico

5) Distribución de la estadística de prueba. Cuando Hg es verdadera y las suposiciones se cumplen, R.V. sigue una distribución F con 2 y 8 grados de libertad.

6) Regla de decisión. Rechazar la hipótesis nula si el valor calculado de R.V. es mayor o igual que el valor crítico de F. El valor de F, 4.46, se puede localizar en la tabla G.

7) Cálculo de la estadística de prueba. Se calculan las siguientes sumas de cuadrados:

Los grados de libertad en total son = (3) (5) - 1 = 14, bloques = 5 - 1 = 4 , tratamientos = 3 - 1 - 2, y el (error) residual = (5 - 1)(3 - 1) = 8. Los resultados de los cálculos pueden desplegarse en una tabla ANOVA como la que se muestra en la tabla 4.

TABLA 4. Tabla ANOVA para el ejemplo 8.3.1

8) Decisión estadística. Puesto que la razón déla variancia, 20,91, es mayor que 4.46, se rechaza la hipótesis nula de que no hay efectos del tratamiento bajo la suposición de que una R.V. tan grande refleja que el cuadrado medio de las dos muestras no son estimaciones de la misma cantidad. La otra única explicación para esa R.V tan grande sería que la hipótesis nula es realmente verdadera, y

que se observó un conjunto de resultados inusuales. Se descarta la segunda explicación en favor de la primera.

9) Conclusión. Se concluye que no todos los efectos de los tratamientos son iguales a cero, o equivalentes, es decir que no todos los tratamientos son iguales.

10) Valor de p. Para esta prueba p < .005.

Análisis por computadora Muchos paquetes de software estadístico analizan los datos a partir de diseños por bloques completos y aleatorizados, A continuación se muestra la entrada y la salida del paquete MINITAB. Los datos del experimento servirán para alimentar la hoja de trabajo de MINITAB formada por tres columnas. La columna 1 contiene las observaciones, la columna 2 contiene los números que identifican el bloque a que corresponde cada observación. La columna tres contiene los núme- 1 ros que identifican el tratamiento a que corresponde cada observación. La figura 1 muestra la hoja de trabajo de MINITAB para el ejemplo 1. La figura 2 muestra las cajas de diálogo para comenzar el análisis y la tabla ANOVA que resulta.

FIGURA 1. Hoja de trabajo de MINITAB para los datos de la figura 8.3.2.

FIGURA 2. Caja de diálogo y resultados para el análisis de la variancia bilateral, ejemplo 1. MINITAB.

FIGURA 3. Resultados impresos parcialmente para el ejemplo 1. Paquete MINITAB.

La tabla ANOVA producida por el paquete SAS® para el análisis del ejemplo 1 se muestra en la figura 3 Observe que en estos resultados el modelo SC es igual a la suma de SCbloq y SCtrat

Alternativas Cuando los datos disponibles no cumplen las suposiciones del diseño por bloques completos y aleatorizados tal como se estudia aquí, puede ser conveniente un procedimiento alternativo no-parámetrico como el de Friedman.

EJERCICIOS PROPUESTOS

Para los ejercicios del 1 al .5 aplique el procedimiento de los diez pasos de la prueba de hipótesis para el análisis de la variancia.

1. Druml et al. (A-ll) tenían como propósito, en uno de sus estudios, evaluar el impacto de la alcalosis respiratoria sobre la eliminación del lactato administrado por vía intravenosa. Rea-lizaron el estudio en ocho individuos que eran pacientes con tratamiento de respiración asistida debido a que presentaban enfermedades neurológicas o neuromusculares, Se tomaron mediciones, al azar y en dos ocasiones, de las concentraciones plasmáticas de lactato: primero, durante la respiración normal, y después durante la alcalosis inducida por hiperventilación controlada. Se evaluó la eliminación de lactato cinco minutos después de administrar 1 mmol/ kg de peso corporal de ácido L-láctico. Los siguientes datos

representan los niveles de lactato del plasma (mmol/1) 90 minutos después de administrarlo a cada uno de los pacientes por cada ocasión.

Después de eliminar los efectos en los individuos, ¿es posible concluir que la concentración media de lactato en el plasma es diferente durante la respiración normal y durante la hiperventilación? Sea = .05.

2. McConville et al. (A-12) informaron acerca de los efectos que produce masticar una pieza de goma de mascar con nicotina (2 miligramos) en la frecuencia con que se presenta un tic en pacientes con desórdenes de Tourette tratados inadecuadamente con haloperidol. Los siguientes datos corresponden a la frecuencia del tic nervioso bajo cuatro condiciones.

Después de disipar los efectos en el paciente, es posible concluir que el número medio de tics difiere en las cuatro condiciones? Sea a = .01.

3. Un equipo de especialistas en remotivación, en un hospital psiquiátrico, condujo un expe-rimento para comparar cinco métodos para remotivar a los pacientes. Estos fueron agru-pados de acuerdo con el nivel de motivación inicial. En cada grupo, los pacientes fueron asignados al azar a los cinco métodos. Al final del periodo experimental, un equipo de trabajo formado por un psiquiatra, un psicólogo, una enfermera y un trabajador social evaluaron a los pacientes. Ningún miembro del equipo de evaluación sabía de los métodos que fueron asignados a los pacientes. El equipo asignó a cada paciente una calificación como medida de su nivel de motivación. Los resultados son los siguientes:

¿Proporcionan estos datos evidencia suficiente que indique una diferencia en las calificacio-nes medias entre los métodos? Sea a = .05.

4. La enfermera supervisora de un departamento de salud local quería analizar el efecto de la hora del día en la duración de las visitas domiciliarias realizadas por el personal de enfermería. Pensaba que las diferencias individuales entre las enfermeras podían ser grandes, por lo que utilizó a las enfermeras como un factor de formación de bloques. Recolectó además los siguientes datos:

¿Proporcionan estos datos evidencia suficiente para indicar una diferencia en la duración de las visitas domiciliarias en las diferentes horas del día? Sea a = .05.

5. Cuatro individuos participaron en un experimento para comparar tres métodos de libera-ción de la tensión nerviosa. Cada individuo fue puesto en una situación de tensión nerviosa en tres ocasiones diferentes. Por cada vez se utilizó un método diferente para reducir el estrés en cada individuo. La variable de respuesta es el total de reducción del nivel de tensión nerviosa antes y después de la aplicación del tratamiento. Los resultados son los siguientes:

¿Es posible concluir a partir de estos datos que los tres métodos difieren en eficacia? Sea a = .05.

6. En un estudio realizado por Valencia et al. (A-13) se midieron los efectos de la temperatura ambiental y la humedad en el gasto energético durante 24 horas mediante calorimetría indirecta de todo el cuerpo en ocho hombres jóvenes con peso normal. Los individuos estudiados utilizaron ropa ligera y siguieron un régimen de actividad controlada. Se evaluaron los efectos de la temperatura medida a 20, 23, 26 y 30 grados Celsius en un ambiente húmedo, y en un ambiente altamente húmedo con temperaturas de 20 y 30 grados Celsius. ¿Cuál es la variable bloqueo? ¿Cuál es la variable tratamiento? ¿Cuántos bloques existen? ¿Cuántos tratamientos hay? Elabore una tabla ANOVA en la que se especifiquen las fuentes variabilidad y los grados de libertad para cada una. ¿Cuáles son las unidades experimentales? ¿Cuáles son las variables extrañas que pueden influir y podrían incluirse en el término de error?

7. Hodgson et al. (A-14) realizaron un estudio en el cual indujeron dilatación gástrica en seis perros con anestesia, mantenidos con dosis constantes de isofluorano en oxígeno. Compara-ron las mediciones cardiopulmonares antes de la distensión estomacal (medidas de línea de base) contra las mediciones tomadas durante .1, .5, 1.0, 1.5, 2.5 y 3.5 horas de distensión estomacal para analizar los cambios a partir de las medidas de línea de base. Después de la distensión estomacal, los índices cardiacos aumentaron de 1.5 a 3.5 horas. No hubo cambios en el volumen sistólico. Durante la insuflación, se observó un incremento en la presión arterial sistémica, arterial pulmonar y auricular derecha. No cambió la frecuencia de la respiración. La PaO2 tendió a disminuir durante la dilatación gástrica. ¿Cuáles son las unidades de experimentación? ¿Cuáles son los bloques? ¿Cuál es la variable tratamiento? ¿Cuál es la variable o variables respuesta? ¿Qué variables extrañas pueden causar efectos

que pudieran incluirse en el término de error? Elabore una tabla ANOVA para este estudio en el que se identifiquen las fuentes de variabilidad y se especifiquen los grados de libertad.