Diseño y Análisis de Experimentos

download Diseño y Análisis de Experimentos

of 14

description

Proyecto Final, utilización del software Statgraphics.

Transcript of Diseño y Análisis de Experimentos

Proyecto Final

ContenidoPresentacin del tema a investigar2Objetivos del tema a investigar2Elementos necesarios para la investigacin2Desarrollo analtico e implementacin de la investigacin3Correlacin de las variables3Modelo inicial3Comprobacin de supuestos4Transformacin del modelo4Comprobacin de supuestos5Significancia de las variables6Efecto de las variables7Comparacin de medias7Grficas de interaccin8Mximo ptimo general9Conclusiones9Bibliografa10

Presentacin del tema a investigar En este proyecto se determin analizar un experimento, el cual fue realizado por los alumnos de la clase de Diseo y anlisis de experimentos. En dicho experimento se analiz la distancia que una flecha alcanzaba al ser lanzada por una ballesta casera, del mismo modo se tuvieron algunas variantes tales como el ngulo de tiro, el tamao de la ballesta, el tamao de la flecha y por ltimo el operador que lanzaba los tiros, esto con la finalidad de poder determinar los factores influyentes sobre la variable de respuesta (distancia recorrida por la flecha). Para poder analizar los datos que el experimento arroj se utilizaron las herramientas de Excel para poder acomodar y darle un mejor y efectivo uso a los datos, as como el paquete estadstico StatGraphics. ste ltimo contribuy a realizar el diseo de experimento, con el objetivo de ajustarlo a un modelo matemtico, poder explicarlo y analizar los factores que influyeron en la variable Y, adems para lograr una interpretacin adecuada de los supuestos matemticos (normalidad, homocedasticidad e independencia), el valor P asociado de las variables y del modelo y los errores. Del mismo modo se utilizaron las herramientas grficas de mnimos cuadrados, comparaciones de medias, ANOVA desglosado y los efectos de nivel. Objetivos del tema a investigar El objetivo del desarrollo de este proyecto consiste en llevar a cabo la realizacin de un experimento e identificar el punto ptimo en el que una flecha recorre mayor distancia al ser lanzada usando una ballesta, mediante la aplicacin de la metodologa de Diseo de Experimentos. Elementos necesarios para la investigacin Para este experimento se tienen diferentes factores y variables: Variable dependiente o de respuesta: Distancia que la flecha vuela Variables independientes: Tamao de la ballesta: chico, mediano y grande. Estas medidas fueron dadas por la maestra a cargo y se hicieron de materiales similares para que esto no afectara el experimento.

Tamao de la flecha: chica, mediana y grande. (El tamao de las flechas fue similar ms no exacto.) Operador: se utilizaron 3 operadores diferentes. ngulo de tiro: 30 y 45, para ello fueron utilizadas unas cuas. Nmero de tiros y repeticiones hechas: 270 tiros en total los cuales estn repartidos de la siguiente manera:Tamao de ballestaTamao de flechaNmero de operadorngulo de tiroBloques

90: Grande90: Mediana90: Chica30: Grande30: Mediana30: Chica10: operador 110: operador 210: operador 35: ngulo de 305: ngulo de 45Se hicieron cinco repeticiones por cada combinacin

Desarrollo analtico e implementacin de la investigacin Correlacin de las variables Primeramente se obtuvo la correlacin que existe entre las variables explicativas y la variable de respuesta. Al ser un diseo de experimentos en el cual se va a explicar un fenmeno, las variables se introducen en el modelo de mayor a menor correlacin. Se obtuvo el siguiente orden de correlacin respecto a la distancia.

1)

2) Tamao de ballesta: 0.52813) ngulo: 0.21064) Tamao de flecha: 0.07175) Operador: 0.03426) Bloque: 0.0048CorrelacionesDistancia

Ballesta0.5281

ngulo0.2106

Flecha-0.0717

Operador0.0342

BLOQUE-0.0048

Modelo inicial Se realiz un Anlisis de Varianza mediante Modelos Lineales Generalizados, y una por una se fueron eliminando las variables que no eran significativas para el modelo, resultado el siguiente. Modelos Lineales GeneralizadosNmero de variables dependientes: 1Nmero de factores categricos: 5 A=Ballesta B=ngulo C=Flecha D=Operador E=BLOQUE

Anlisis de Varianza para DistanciaFuenteSuma de CuadradosGlCuadrado MedioRazn-FValor-P

Modelo876.8982535.075916.290.0000

Residuo525.3122442.15292

Total (Corr.)1402.21269

Suma de Cuadrados Tipo IFuenteSuma de CuadradosGlCuadrado MedioRazn-FValor-P

Ballesta552.4112276.205128.290.0000

ngulo62.208162.20828.890.0000

Flecha7.337623.66881.700.1841

Operador11.128825.56442.580.0775

Ballesta*ngulo24.2212.15.620.0041

Ballesta*Flecha66.3809416.59527.710.0000

Ballesta*Operador52.3348413.08376.080.0001

ngulo*Flecha28.1729214.08646.540.0017

ngulo*Operador15.608127.804043.620.0281

Ballesta*ngulo*Operador57.1165414.27916.630.0000

Residuo525.3122442.15292

Total (corregido)1402.21269

R-Cuadrada = 62.5369 porcientoR-Cuadrada (ajustada por g.l.) = 58.6984 porcientoError estndar del est. = 1.46728El valor de R2 indica que el modelo explica la variabilidad de la distancia con una confianza de 62.53%. Un valor de R2 ajustada menor indica que no es necesario incluir ms variables explicativas al modelo. El error estndar de 1.46 se encuentra dentro del 20% de los datos. Al ser bastante grande no es aceptable en el modelo. Comprobacin de supuestos 1) Normalidad. El supuesto de normalidad no se cumple, ya que el valor p asociado al estadstico de Shapiro-Wilk es menor a 0.10. Adems hay demasiados puntos atpicos en el grfico de caja y brazos. Pruebas de NormalidadPruebaEstadsticoValor-P

Estadstico W de Shapiro-Wilk0.9746690.036985

2) Independencia. El supuesto de independencia si se cumple, ya que el valor p asociado al estadstico de Durbin-Watson es mayor a 0.10. El grfico de residuos vs nmero de fila no muestra una tendencia obvia, por lo que se pudo comprobar de manera grfica este supuesto. Estadstico Durbin-Watson = 1.9645 (P=0.3856)

3) Homocedasticidad. El supuesto de homocedasticidad no se cumple, ya que existe conicidad hacia el lado izquierdo en la grfica de residuos vs predichos.

Transformacin del modelo Al no satisfacer el Teorema Central del Lmite, dado que dos de los tres supuestos no se cumplan, se ajust el modelo de diseo de experimentos. Despus de varias transformaciones, se lleg a la conclusin que el mejor modelo, y que cumpla con los tres supuestos del teorema central del lmite, era un ajuste logartmico. A continuacin se muestra el modelo final y la comprobacin de los supuestos. Modelos Lineales GeneralizadosNmero de variables dependientes: 1Nmero de factores categricos: 5 A=Ballesta B=ngulo C=Flecha D=Operador E=BLOQUE

Anlisis de Varianza para log(Distancia)FuenteSuma de CuadradosGlCuadrado MedioRazn-FValor-P

Modelo18.7605250.7504220.360.0000

Residuo8.994522440.0368628

Total (Corr.)27.755269

Suma de Cuadrados Tipo IFuenteSuma de CuadradosGlCuadrado MedioRazn-FValor-P

Ballesta11.893725.94683161.320.0000

ngulo1.4151111.4151138.390.0000

Flecha0.36125820.1806294.900.0082

Operador0.12983620.06491821.760.1740

Ballesta*ngulo0.83024920.41512511.260.0000

Ballesta*Flecha1.7490640.43726611.860.0000

Ballesta*Operador0.81836340.2045915.550.0003

ngulo*Flecha0.48126920.2406356.530.0017

ngulo*Operador0.23800820.1190043.230.0413

Ballesta*ngulo*Operador0.84368640.2109215.720.0002

Residuo8.994522440.0368628

Total (corregido)27.755269

R-Cuadrada = 67.5932 porcientoR-Cuadrada (ajustada por g.l.) = 64.2728 porcientoError estndar del est. = 0.191997En esta versin final del modelo de diseo de experimentos se encontr que no es necesario incluir un bloque, por lo tanto no existe una variable no considerada o efecto perturbador que afecte el promedio de la distancia. El valor de R2 indica que el modelo explica la variabilidad de la distancia con una confianza de 67.59%, siendo mayor que la del modelo inicial. Un valor de R2 ajustada menor indica que no es necesario incluir ms variables explicativas al modelo. El error estndar de 0.19 se encuentra dentro del 3% de los datos, el cual al ser muy chico, es bastante aceptable en el modelo. Comprobacin de supuestos 1) Normalidad. El supuesto de normalidad se cumple ya que el valor p asociado al estadstico de Shapilo-Wilk es de 0.10, adems cuenta con dos puntos atpicos menos, y el grfico de caja y brazos muestra cierta distribucin normal. Tambin el grfico de probabilidad normal muestra que los datos centrales se ajustan a la recta. Pruebas de NormalidadPruebaEstadsticoValor-P

Estadstico W de Shapiro-Wilk0.9772850.100111

2) Independencia. El supuesto de independencia si se cumple, ya que el valor p asociado del estadstico Durbin-Watson es mayor a 0.10. El grfico de residuos vs nmero de fila no demuestra tendencia obvia, por lo que se puede comprobar grficamente que no hay dependencia entre los datos obtenidos. Estadstico Durbin-Watson = 1.9831 (P=0.4449)3) Homocedasticidad. La transformacin realizada aplana el modelo del diseo de experimentos, por lo que se puede observar una mejor homocedasticidad en la grfica de residuos vs predicho. Ahora que se cumplen los 3 supuestos, se llevar a cabo la interpretacin de grficos y comparacin de medias para encontrar la combinacin ptima que arroje la mayor distancia. Significancia de las variables En el grfico de Pareto se pueden observar las variables e interacciones que tienen mayor significancia en el modelo, es decir que son los elementos que explican de mejor manera la variabilidad de la distancia. El grfico muestra que la variable Tamao de Ballesta es la que tiene mayor influencia de manera proporcional, es decir que mientras ms grande sea la ballesta mayor ser la distancia. La variable que tiene menor significancia en el modelo es Operador, por lo que se concluye que no importa la persona que realice el lanzamiento, el resultado ser estadsticamente igual. Las interacciones Ballesta * Operador, Flecha * ngulo, y Operador * ngulo se muestran por debajo del error tipo I de 0.10, debido a que esta grfica fue obtenida por un anlisis de diseo de experimentos en el paquete estadstico. En realidad los grados de libertad estn modificando la tolerancia de la significancia, pero en el ANOVA desglosado de modelos lineales generalizados se observa que stas si afectan al experimento. Efecto de las variables La grfica de la derecha muestra el efecto que tiene cada variable explicativa en la variabilidad de la distancia. La variable Tamao de Ballesta est correlacionada en mayor medida, ya que sta es la que tiene la pendiente ms grande, adems de estar relacionada de manera positiva, es decir que la distancia aumenta mientras el tamao de la ballesta tambin aumente. La segunda variable con mayor correlacin es ngulo, e igualmente est relacionada de manera positiva, pero en menor medida. La siguiente variable con mayor correlacin es el Tamao de Flecha, pero sta est relacionada inversamente, es decir que la distancia se ve afectada de manera negativa mientras el tamao de la flecha aumenta. En ltimo lugar se encuentra la variable Operador, y se puede observar que la pendiente es muy chica, por lo tanto se concluye que el nmero de operador no afecta en gran medida a la distancia. Comparacin de medias Ahora se van a contrastar las variables significativas para el modelo y encontrar la mejor o mejores combinaciones para obtener la mayor distancia. Comparaciones Mltiples para log(Distancia) por BallestaMtodo: 95.0 porciento LSDBallestaRecuentoMedia MCSigma MCGrupos Homogneos

1901.650490.0202382X

3902.092550.0202382 X

2902.098810.0202382 X

ContrasteSig.Diferencia Lmites +/-

1 - 2 *-0.4483230.0563763

1 - 3 *-0.4420670.0563763

2 - 30.006256120.0563763

* denota una diferencia estadsticamente significativa.El tipo de ballesta 2 y 3 presentan la media mayor para la distancia, y son estadsticamente iguales entre ellos, pero estadsticamente diferentes a la ballesta tipo 1. Comparaciones Mltiples para log(Distancia) por nguloMtodo: 95.0 porciento LSDnguloRecuentoMedia MCSigma MCGrupos Homogneos

301351.874890.0165245X

451352.019680.0165245 X

ContrasteSig.Diferencia Lmites +/-

30 - 45 *-0.1447910.046031

* denota una diferencia estadsticamente significativa.El ngulo de 45 presenta la media mayor para la distancia. Es estadsticamente diferente al ngulo de 30.

Comparaciones Mltiples para log(Distancia) por FlechaMtodo: 95.0 porciento LSDFlechaRecuentoMedia MCSigma MCGrupos Homogneos

3901.909110.0202382X

2901.936140.0202382X

1901.99660.0202382 X

ContrasteSig.Diferencia Lmites +/-

1 - 2 *0.06046570.0563763

1 - 3 *0.08749450.0563763

2 - 30.02702880.0563763

* denota una diferencia estadsticamente significativa.El tipo de flecha 1 presenta la mayor media para la distancia, y es estadsticamente diferente a las flechas tipo 2 y 3, las cuales son estadsticamente iguales entre s.

Comparaciones Mltiples para log(Distancia) por OperadorMtodo: 95.0 porciento LSDOperadorRecuentoMedia MCSigma MCGrupos Homogneos

2901.917920.0202382X

1901.953330.0202382X

3901.970610.0202382X

ContrasteSig.Diferencia Lmites +/-

1 - 20.03540590.0563763

1 - 3-0.01727930.0563763

2 - 3-0.05268520.0563763

* denota una diferencia estadsticamente significativa.Los operadores 1, 2 y 3 presentan la media mayor para la distancia, y son estadsticamente iguales.Grficas de interaccin Ballesta * ngulo. Mximos ptimo viables: (2,45)Ballesta * Flecha. Mximos ptimos viables: (2,1), (2,2), (2,3), (3,1), (3,2), (3,3)

Ballesta * Operador. Mximos ptimos viables: (2,1), (2,2), (2,3), (3,1), (3,3) ngulo * Flecha. Mximos ptimos viables: (45,1), (45,2)

ngulo * Operador. Mximos ptimos viables: (45,1), (45,3)Ballesta * ngulo * Operador. Mximos ptimos viables: (3,45,3)

Mximo ptimo general Al observar y analizar las comparaciones de medias en las variables y las interacciones significativas entre ellas se decidi que existen dos combinaciones ptimas dadas por los siguientes juegos de niveles en cada factor. Ballesta: 3 (Grande) ngulo: 45 Flecha: 1 (Chica) Operador: 3 Ballesta: 2 (Mediana) ngulo: 45 Flecha: 1 (Chica) Operador: 3

Sin embargo, el paquete estadstico que se utiliz arroja una combinacin diferente, debido a la interpretacin y anlisis de los grados de libertad. Optimizar RespuestaMeta: maximizar log(Distancia)Valor ptimo = 2.28097FactorBajoAltoptimo

Ballesta1.03.03.0

Flecha1.03.03.0

Operador1.03.03.0

ngulo30.045.045.0

ConclusionesSe realiz una transformacin logartmica en el modelo debido a que el supuesto de homocedasticidad no se cumpla inicialmente al presentar conicidad, por lo cual era necesario aplanar la grfica. Al realizar el modelo, se identific al tamao de la ballesta como la variable de mayor correlacin con la distancia recorrida por la flecha, lo cual se identific visiblemente al realizar el experimento. Por otro lado, el equipo pudo comprobar que la mayor distancia recorrida por una flecha con movimiento parablico se logra con ngulo de salida de 45, como lo establecen estudios cientficos. De la misma manera, la flecha chica recorri mayor distancia al tener un peso ms ligero. Por ltimo, los operadores fueron alumnos sin experiencia en lanzamiento de flechas usando una ballesta, por lo que se puede concluir que todos se encontraban en las mismas condiciones. El equipo considera que es interesante formular teoras, realizar experimentos, analizar datos y comprobarlos usando la metodologa de Diseo de Experimentos, debido a que usando herramientas estadsticas es muy sencillo, preciso y prctico. La realizacin de este proyecto fue de gran agrado para el equipo debido a que con esto se pueden aplicar los conocimientos vistos durante el curso. Bibliografa Statgraphics Centurion XV. Versin 2005.