t Are Aaaaaaaaaa

16
i= 1. Explique en qué consiste y cuando se debe aplicar el diseño completamente al azar con un solo criterio de clasificación. Esta centrado en comparar los tratamientos en cuanto a sus medias poblacionales y se utiliza cuando el objetivo es comparar más de dos tratamientos 2. Supongamos que se desea aprobar la igualdad entre sí de cinco medias. Una alternativa para hacer esto sería comparar de dos en dos las medias, utilizando la prueba T student y al final tomar una decisión. Explique porque esto aumenta el error tipo I. En este caso con cinco medias tenemos diez posible pares de medias, y si la probabilidad de aceptar la H 0 para cada prueba individual es de 1- = 0.95, entonces la probabilidad de aceptar las diez H 0 es de 0.95 10 = 0.5987, lo cual representa un aumento considerable del error tipo I. Aunque se utilice un nivel de confianza tal que (1- ) 10 = 0.95, el procedimiento resulta inapropiado porque se pueden producir sesgos por parte del experimentador. 3. ¿Qué mide el cuadrado medio del error en el ANOVA de un experimento? Es la suma de cuadrados divididos entre sus respectivos grados de libertad 4. ¿Qué son los grados de libertad para una suma de cuadrados en un análisis de varianza? Representa el número de piezas de información independientes en la suma de cuadrados. En general, es el número de observaciones menos el número de parámetros estimados de los datos. 5. A continuación se muestra parte del ANOVA para comparar cinco tratamientos con cuatro replicas cada uno. Fuente de variación Suma de cuadrados G. de libertad C. medio Razón F Valor –p Tratamient o Error 800 400 1200 4 15 19 200 26.66 7.5 P(3.06>7.5 ) SC T = k n i j= 1 Y 2 ij 2 ; 800+400 CM TRAT = ; 800/4 Fo = CM TRAT / CM E ; 200/26.66 CM E = a) Agregar en esta tabla los grados de libertad, el cuadrado medio y la

description

t Are Aaaaaaaaaa

Transcript of t Are Aaaaaaaaaa

Page 1: t Are Aaaaaaaaaa

i=

1. Explique en qué consiste y cuando se debe aplicar el diseño completamente al azar con un solo criterio de clasificación.Esta centrado en comparar los tratamientos en cuanto a sus medias poblacionales y se utiliza cuando elobjetivo es comparar más de dos tratamientos

2. Supongamos que se desea aprobar la igualdad entre sí de cinco medias. Una alternativa para hacer esto sería comparar de dos en dos las medias, utilizando la prueba T student y al final tomar una decisión. Explique porque esto aumenta el error tipo I.

En este caso con cinco medias tenemos diez posible pares de medias, y si la probabilidad de aceptar la H0 para cada prueba individual es de 1- = 0.95, entonces la probabilidad de aceptar las diez H0 es de 0.9510 = 0.5987, lo cual representa un aumento considerable del error tipo I. Aunque se utilice un nivel de confianza tal que (1-

)10= 0.95, el procedimiento resulta inapropiado porque se pueden producir sesgos por parte del experimentador.

3. ¿Qué mide el cuadrado medio del error en el ANOVA de un experimento?

Es la suma de cuadrados divididos entre sus respectivos grados de libertad

4. ¿Qué son los grados de libertad para una suma de cuadrados en un análisis de varianza?

Representa el número de piezas de información independientes en la suma de cuadrados. En general, es el número de observaciones menos el número de parámetros estimados de los datos.

5. A continuación se muestra parte del ANOVA para comparar cinco tratamientos con cuatro replicas cada uno.

Fuente devariación

Suma decuadrados

G. de libertad C. medio Razón F Valor –p

TratamientoErrorTotal

8004001200

41519

20026.66

7.5 P(3.06>7.5)

SCT= ∑k

∑nij=1Y2ij – 2 ; 800+400 CMTRAT= ; 800/4

Fo = CMTRAT/ CME ; 200/26.66 CME =

a) Agregar en esta tabla los grados de libertad, el cuadrado medio y la razón F para cada una de lasFuentes de variación.

b) Explique de manera esquemática como calcularía el valor –P o la significancia observada, para ver si hay diferencia entre tratamientos.

Valor-p es el área bajo la distribución Fk-1, N-k a la derecha del estadístico F0, es decir, el valor-p=P(F>F0)

Page 2: t Are Aaaaaaaaaa

c) ¿con la información disponible se puede hacer conjeturas sobre si hay diferencias significativas entre tratamientos? Argumente su respuesta.

Es posible determinar la diferencia entre los tratamientos, mediante la información presentada en la tabla ANOVA con el valor obtenido del estadístico F0 que sigue una distribución F con (k-1) grados de libertad en el numerador y (N-k) grados de libertad en el denominador y el valor obtenido de la tablas de la distribución F para probar la hipótesis de igualdad de los tratamientos con respecto a la media de la correspondiente variable de respuesta. Ya que en caso de rechazar la hipótesis anterior se estaría asumiendo que las medias de los tratamientos son diferentes.

d) Anote el modelo estadístico y formule la hipótesis pertinente.

H0: = =

HA: ≠ para algún i ≠ j

6. Se desea investigar el efecto del pH en el crecimiento de cierto microorganismo en un medio específico. Para ello se realiza un experimento, teniendo como punto de partida la misma cantidad de microorganismos. Se hacen cuatro repeticiones y se obtienen los siguientes resultados. ¿estos datos son evidencia suficiente para afirmar que los niveles de pH donde se logra menor y mayorcrecimiento son el 3 y el 2, respectivamente? Explique su respuesta.

Nivel de pH Crecimiento promedio (en %)123

8010575

No se puede afirmar que el nivel de pH influya directamente en el crecimiento promedio, se considera que hay más factores que intervienen, además es necesario que nos proporcionen más datos por tratamiento para tomar esa decisión.

7. Se desea investigar la influencia de la temperatura en el rendimiento de un proceso químico, en particular interesa investigar un rango de temperatura entre 60 y 120 ºC. se tiene recursos para realizar 20 corridas experimentales.

a) Los niveles de temperatura con los que se experimenta son: 60, 65, 70 y 120; se hacen 5 repeticiones con cada nivel. ¿Considera que es adecuado el diseño experimental usado? Argumente su respuesta, y de ser necesario proponga alternativas.

No es adecuado el diseño experimental debido a que los niveles de temperatura con los cuales se pretende experimentar no están distribuidos uniformemente en el rango establecido, se recomienda hacer un experimento con 5 réplicas para los siguientes tratamientos: 60,80, 100, 120.

Page 3: t Are Aaaaaaaaaa

b) El orden en que decidieron hacer las corridas experimentales para facilitar el trabajo experimental fue: primero la cinco del nivel bajo de temperatura luego la cinco del siguiente y así hasta finalizar. ¿Es correcto lo que hicieron? Argumente su respuesta

No es correcto, las corridas experimentales deben ser aleatorias para que el resultado de un tratamiento no influya en el inmediato siguiente (no violar los supuestos del modelo)

c) Para hacer el análisis estadístico se comparan, mediante una prueba T-student, de dos en dos niveles de temperatura, y con base en esto obtuvieron conclusiones. ¿Es adecuado tal análisis? , argumente, en su caso proponga alternativas.

No adecuado, aumenta el error tipo I: rechazar la Ho siendo verdadera en cada par de medias.

8. Describa en qué consiste cada uno de los supuestos del modelo en el análisis de varianza, y explique la forma típica en que estos supuestos se verifican.

Normalidad: Consiste en verificar que los residuos sigan una distribución normal con media cero y se verifica graficando los residuos en una escala X-Y de tal manera que si los residuos siguen una distribución normal al graficarlos tienden a quedar alineados en una línea recta.

Varianza Constante: Comprobar que los residuos de cada tratamiento tienen la misma varianza, es verificado graficando los predichos contra los residuos y si los puntos en esta grafica se distribuyen de manera aleatoria en una banda horizontal (sin ningún patrón claro y contundente) entonces es señal de que se cumple el supuesto de que los tratamientos tienen igual varianza.

Independencia: Probar que los residuos son independientes entre si, se verifica si se grafica el orden en que se colecto un dato contra el residuo correspondiente, de esta manera si al graficar en el eje horizontal el tiempo (orden de corrida) y en el eje vertical los residuos, se detecta una tendencia o patrón no aleatorio claramente definido, esto es evidencia de que existe una correlación entre los errores y, por lo tanto el supuesto de independencia no se cumple.

9. ¿Qué son y cuando se aplican las pruebas para comparar medias?Son métodos que nos permiten hacer comparaciones entre todos los posibles pares de medias, dependiendo del número de tratamientos para identificar cuales resultaron diferentes, Se aplican cuando es rechazada la Ho (todas las medias son iguales).

Page 4: t Are Aaaaaaaaaa

4.3 6.5 9 548.88

15 - Una compañía farmacéutica desea evaluar el efecto que tiene la cantidad de almidón en la dureza de las tabletas. Se decidió producir lotes con una cantidad determinada de almidón, y que las cantidades de almidón a probar fueran 2%, 5% y 10% y la variable de respuesta seria el promedio de la dureza de 20tabletas de cada lote. Se hicieron 4 réplicas por tratamiento y se obtuvieron los siguientes resultados:

% almidón Dureza2 4.3 4.8 4.55 6.5 6.9 6.1

10 9 8.5 8.1

a) ¿Hay evidencia suficiente de que el almidón influye en la dureza de las tabletas? Halle el ANOVA.

Se indican los cálculos manuales:

2% 5% 10% Suma deCuadrados:

5.2 7.3 7.84.8 6.9 8.54.5 6.1 8.1

Yi. = 18.8 26.8 33.4 Y..= 79ni= 4 4 4 N= 12

yi. Media= 4.7 6.7 8.35 Y Media= 6.58Ti= -1.88 0.12 1.77

Obteniendo un:

ANOVA unidireccional: 2%, 5%, 10%

Fuente GL SC MC F PFactor 2 26.727 13.363 58.10 0.000Error 9 2.070 0.230Total 11 28.797

S = 0.4796 R-cuad. = 92.81% R-cuad.(ajustado) = 91.21%

Dado el criterio de rechazo con α=0.05, si 58.10 > F (o.o5, 2, 9) se rechaza la H0. 58.10 > 4.256

Se cumple, por lo tanto se rechaza la hipótesis nula, indicando que para cada tratamiento con porcentaje de almidón si influye en la dureza de las tabletas.

Page 5: t Are Aaaaaaaaaa

b) Realice los análisis complementarios necesarios:

El diagrama de cajas se ilustra de la siguiente manera:

Se observa que las cajas no se traslapan, otra muestra visual de que el algodón influye considerablemente en la dureza de las

tabletas, con 10% de algodón se obtiene mucha mas dureza.

Comparación de Media con Media:

Haciendo las comparaciones de media se evidencia que todas son significativamente diferentes

TUKEY y LSD

1 2 3𝜇 𝜇 𝜇34.7 6.7 8.35

T𝛼 =q𝛼 (k, N – k) �� ��𝐸 /𝑛𝑖T0.05=q0.05 (3,9) 0 23/43.95 0 0575 = 0.9471

LSD= t∝/2, N-k 2����𝐸 /𝑛

LSD=2.26 2��0 23/4LSD=0.76

Tukey𝜇 − 𝜇 3>0.9471

Significativo

𝜇 − ��3 3.65>0.9471 Significativo

𝜇 − 𝜇

2>

𝜇 − 𝜇

LSD

0.76Significativo

3 3.65>0.76 Significativo𝜇 − ��3 1.65>0.9471

Significativo𝜇 − ��3 1.65>0.76

Significativo

Page 6: t Are Aaaaaaaaaa

c) Si se desea maximizar la dureza de las tabletas ¿Qué es lo que recomendaría al fabricante?

Si el objetivo es maximizar la dureza en las tabletas se recomienda ampliamente aumentar el porcentaje de almidón en el proceso de fabricación de las tabletas.

d) Verifique los supuestos:

Se verificaran los supuestos de

Normalidad Varianza Constante Independencia

En la gráfica de probabilidad normal, los residuos tienden a ajustarse a la línea recta, se deduce que: las observaciones proceden de poblaciones normales. Se cumple el supuesto de normalidad visualmente.

Las otras graficas no presentan patrones anormales tales como forma de embudo o corneta por lo tanto las muestras son aleatorias e independientes. Se cumple el supuesto de que los tratamientos tienen igual varianza e independencia.

Page 7: t Are Aaaaaaaaaa

% A

ZUC

A R

REDU

C

18.- Se cultivaron cuatro diferentes clonas de agave tequilana bajo un mismo esquema de manejo. Se quiere saber qué clona es la que responde mejor a dicho manejo, evaluando el nivel de respuesta con el porcentaje deazúcares reductores totales en base húmeda. Los datos se muestran a continuación:

CLONA1 2 3 4

8.696.686.836.43

10.30

8.0016.4112.4310.9915.53

17.3913.7315.6217.0515.42

10.379.168.134.40

10.38

7.786 12.672 15.842 8.488

a) Mediante ANOVA, compare las medias de las clonas y verifique residuales.

ANOVA unidireccional: % AZUCAR REDUC vs. CLONA

Fuente GL SC MC F P CLONA 3 213,63 71,21 12,53 0,000Error 16 90,93 5,68Total 19 304,55

S = 2,384 R-cuad. = 70,14% R-cuad.(ajustado) = 64,55%

H0: =

HA: ≠ para algún i ≠ j

Rechazamos H0 si: F0 > Fk-1, N-k entonces, 12.53 > 3.24

Como esta condición se cumple, procedemos a rechazar la H0. Otra forma de rechazarla es que, el valor-p< αes decir, 0.000 < 0.05 de esta manera también decimos que rechazamos la H0 sobre igualdad de medias en los tratamientos.

Gráfica de caja de % AZUCAR REDUC

17,5

15,0

12,5

10,0

7,5

5,0

1 2 3 4

CLONA

Page 8: t Are Aaaaaaaaaa

Por

cent

aje

Frec

uenc

ia Re

sidu

oRe

sidu

o

Para probar cuales medias son diferentes, haremos comparaciones entre los 6 posibles pares de medias con los siguientes métodos:

Tukey Tα = q α (4,16) / = 4.316

DIFERENCIAPOBLACIONAL

DIFERENCIAMUESTRAL

(VALOR ABSOLUTO)DECISIÓN

μ2 – μ1 4.886 > 4.3164 Significativaμ3 – μ1 8.056 > 4.3164 Significativaμ4 – μ1 0.702 < 4.3164 No significativaμ3 – μ2 3.170 < 4.3164 No significativaμ4 – μ2 4.184 < 4.3164 No significativaμ4 – μ3 7.354 > 4.3164 Significativa

LSD (Fisher) LSD = t 0.025, 16 / = 3.1956

DIFERENCIAPOBLACIONAL

DIFERENCIA MUESTRAL(VALOR ABSOLUTO) DECISIÓN

μ2 – μ1 4.886 > 3.1956 Significativaμ3 – μ1 8.056 > 3.1956 Significativaμ4 – μ1 0.702 < 3.1956 No significativaμ3 – μ2 3.170 < 3.1956 No significativaμ4 – μ2 4.184 > 3.1956 Significativaμ4 – μ3 7.354 > 3.1956 Significativa

RESIDUALES

Gráficas de residuos para % AZUCAR REDUCGráfica de probabilidad normal vs. ajust es

99 4

90

50

10

1-5,0 -2,5 0,0

Residuo

2,5 5,0

2

0

-2

-4

8 10

12 14 16Valor ajustado

Hist ograma vs. orden4 4

3 2

02

-21

-40

-4 -2 0 2 4

2 4 6

8 10 12

14 16

18 20

Residuo Orden de observación

Page 9: t Are Aaaaaaaaaa

b) ¿Hay una clona que haya respondido mejor al esquema de manejo? Argumente su respuesta.

En el tercer tratamiento nos indica el promedio mas alto y que indica la mayor aportación de azucares reductores en base húmeda.

c) En caso de que exista un empate estadístico entre dos o más clonas, ¿qué propondría para desempatar?

Otro experimento con solo esos dos tipos de clonas pero considerando mas observaciones para checar cual es más efectiva.