Análisis de La Varianza.docx Exposicion
-
Upload
biaank-jice -
Category
Documents
-
view
38 -
download
3
Transcript of Análisis de La Varianza.docx Exposicion
GRUPO N 6
ANLISIS DE LA VARIANZA
El anlisis de varianza es una tcnica que se puede utilizar para decidir si las medias de dos o ms poblaciones son iguales. La prueba se basa en una muestra nica, obtenida a partir de cada poblacin. El anlisis de varianza puede servir para determinar si las diferencias entre las medias mustrales revelan las verdaderas diferencias entre los valores medios de cada una de las poblaciones, o si las diferencias entre los valores medios de la muestra son ms indicativas de una variabilidad de muestreo.Si el valor estadstico de prueba (anlisis de varianza) nos impulsa a aceptar la hiptesis nula, se concluira que las diferencias observadas entre las medias de las muestras se deben a la variacin casual en el muestreo (y por tanto, que los valores medios de poblacin son iguales). Si se rechaza la hiptesis nula, se concluira que las diferencias entre los valores medios de la muestra son demasiado grandes como para deberse nicamente a la casualidad (y por ello, no todas las medias de poblacin son iguales).Los datos para el anlisis de varianza se obtienen tomando una muestra de cada poblacin y calculando la media muestral y la variancia en el caso de cada muestra. Existen tres supuestos bsicos que se deben satisfacer antes de que se pueda utilizar el anlisis de variancia.
1) Las muestras deben ser de tipo aleatorio independiente.2) Las muestras deben ser obtenidas a partir de poblaciones normales.3) Las poblaciones deben tener variancias iguales (es decir,)El anlisis de varianza, como su nombre lo indica, comprende el clculo de varianzas. La varianza de una muestra es el promedio de las desviaciones elevadas al cuadrado de la media del grupo. Simblicamente, esto se representa de la siguiente manera:
Cabe observar que se debe utilizar n -1, ya que se est trabajando con datos mustrales. De ah que, para obtener la varianza muestral, el procedimiento sea el siguiente:1) Calcular la media muestral2) Restar la media de cada valor de la muestra.3) Elevar al cuadrado cada una de las diferencias.4) Sumar las diferencias elevadas al cuadrado.5) Dividir entre n -1
LA RAZN FA diferencia de otras pruebas de medias que se basan en la diferencia existente entre dos valores, el anlisis de varianza emplea la razn de las estimaciones, dividiendo la estimacin intermediante entre la estimacin interna
Esta razn F fue creada por Ronald Fisher (1890-1962), matemtico britnico, cuyas teoras estadsticas hicieron mucho ms precisos los experimentos cientficos. Sus proyectos estadsticos, primero utilizados en biologa, rpidamente cobraron importancia y fueron aplicados a la experimentacin agrcola, mdica e industrial. Fisher tambin contribuy a clarificar las funciones que desempean la mutacin y la seleccin natural en la gentica, particularmente en la poblacin humana.El valor estadstico de prueba resultante se debe comparar con un valor tabular de F, que indicar el valor mximo del valor estadstico de prueba que ocurra si H0 fuera verdadera, a un nivel de significacin seleccionado. Antes de proceder a efectuar este clculo, se debe considerar las caractersticas de la distribucin F
CARACTERSTICAS DE LA DISTRIBUCIN FExiste una distribucin F diferente para cada combinacin de tamao de muestra y nmero de muestras. Por tanto, existe una distribucin F que se aplica cuando se toman cinco muestras de seis observaciones cada una, al igual que una distribucin F diferente para cinco muestras de siete observaciones cada una. A propsito de esto, el nmero distribuciones de muestreo diferentes es tan grande que sera poco prctico hacer una extensa tabulacin de distribuciones. Por tanto, como se hizo en el caso de la distribucin t, solamente se tabulan los valores que ms comnmente se utilizan.En el caso de la distribucin F, los valores crticos para los niveles 0,05 y 0,01 generalmente se proporcionan para determinadas combinaciones de tamaos de muestra y nmero de muestras.
La distribucin es continua respecto al intervalo de 0 a + . La razn ms pequea es 0. La razn no puede ser negativa, ya que ambos trminos de la razn F estn elevados al cuadrado. Por otra parte, grandes diferencias entre los valores medios de la muestra, acompaadas de pequeas variancias mustrales pueden dar como resultado valores extremadamente grandes de la razn F.
La forma de cada distribucin de muestreo terico F depende del nmero de grados de libertad que estn asociados a ella. Tanto el numerador como el denominador tienen grados de libertad relacionados.
DETERMINACIN DE LOS GRADOS DE LIBERTADLos grados de libertad para el numerador y el denominador de la razn F se basan en los clculos necesarios para derivar cada estimacin de la variancia de la poblacin. La estimacin intermediante de variancia (numerador) comprende la divisin de la suma de las diferencias elevadas al cuadrado entre el nmero de medias (muestras) menos uno, o bien, k -1. As, k -1es el nmero de grados de libertad para el numerador.En forma semejante, el calcular cada variancia muestral, la suma de las diferencias elevadas al cuadrado entre el valor medio de la muestra y cada valor de la misma se divide entre el nmero de observaciones de la muestra menos uno, o bien, n -1. Por tanto, el promedio de las variancias mustrales se determina dividiendo la suma de las variancias de la muestra entre el nmero de muestras, o k. Los grados de libertad para el denominador son entonces, k(n -l).Uso de la tabla de F del anlisis de variancia (ANOVA)En la tabla se ilustra la estructura de una tabla de F para un nivel de significacin de 0,01 o 1% y 0,05 o 5%. Se obtiene el valor tabular, localizando los grados de libertad del numerador (que se listan en la parte superior de la tabla), as como los del denominador (que se listan en una de las columnas laterales de la tabla) que corresponden a una situacin dada. Utilizando el nivel de significacin de 0,05 para grados de libertad, el valor de F es 8,89
ANLISIS DE LA VARIANZA
El anlisis de la varianza (o Anova: Analysis of variance) es un mtodo para comparar dos o ms medias, que es necesario porque cuando se quiere comparar ms de dos medias es incorrecto utilizar repetidamente el contraste basado en la t de Student. Por dos motivos:
En primer lugar, y como se realizaran simultnea e independientemente varios contrastes de hiptesis, la probabilidad de encontrar alguno significativo por azar aumentara. En cada contraste se rechaza la H0 si la t supera el nivel crtico, para lo que, en la hiptesis nula, hay una probabilidad a. Si se realizan m contrastes independientes, la probabilidad de que, en la hiptesis nula, ningn estadstico supere el valor crtico es (1 - a)m, por lo tanto, la probabilidad de que alguno lo supere es 1 - (1 - a)m, que para valores de a prximos a 0 es aproximadamente igual a m. Una primera solucin, denominada mtodo de Bonferroni, consiste en bajar el valor de a, usando en su lugar a/m, aunque resulta un mtodo muy conservador.
Por otro lado, en cada comparacin la hiptesis nula es que las dos muestras provienen de la misma poblacin, por lo tanto, cuando se hayan realizado todas las comparaciones, la hiptesis nula es que todas las muestras provienen de la misma poblacin y, sin embargo, para cada comparacin, la estimacin de la varianza necesaria para el contraste es distinta, pues se ha hecho en base a muestras distintas.
El mtodo que resuelve ambos problemas es el anova, aunque es algo ms que esto: es un mtodo que permite comparar varias medias en diversas situaciones; muy ligado, por tanto, al diseo de experimentos y, de alguna manera, es la base del anlisis multivariante.
EJERCICIO N 1 Una lista de palabras sin sentido se presenta en la pantalla del ordenador con cuatro procedimientos diferentes, asignados al azar a un grupo de sujetos. Posteriormente se les realiza una prueba de recuerdo de dichas palabras, obtenindose los siguientes resultados:
PROCEDIMIENTO 1PROCEDIMIENTO 2PROCEDIMIENTO 3PROCEDIMIENTO 4
5981
71163
6894
3755
9771
744
44
2
TABLA DE REALIZACION DE EJERCICIO
PROCED. 1PROCED. 2PROCED. 3PROCED.4TOTAL
Tc43424318146
Nc857626
Tc2/nc231.10352.8264.1054902
X226936428768988
SST= 902 (146)2 /26SST= 902- 819.80SST= 82.20SSE= 988-902SSE= 86
FUENTE DE VARIACIONSUMA DE CUADRADOSGRADOS DE LIBERTADCUADRADO MEDIO
ENTRE LOS GRUPOS82.204-1= 327.40
EN GRUPO8626-4= 223.90
TOTAL7.03
El valor en la F terica con 3 y 22 grados de libertad a un nivel de confianza del 95% es 3.05. Por consiguiente se rechaza la hiptesis nula y se concluye que los cuatro procedimientos de presentacin producen diferencias significativas.
EJERCICIO N 2 Se quiere evaluar la eficacia de distintas dosis de un frmaco contra la hipertensin arterial, comparndola con la de una dieta sin sal. Para ello se seleccionan al azar 25 hipertensos y se distribuyen aleatoriamente en 5 grupos- Al primero de ellos no le suministra ningn tratamiento, al segundo una dieta con un contenido pobre en sal, al tercero una dieta sin sal, al cuarto el frmaco a una dosis determinada y al quinto el mismo frmaco a otra dosis. Las presiones arteriales sistlicas de los 25 sujetos al finalizar los tratamientos son: GRUPO
12345
180172163158147
173158170146152
175167158160143
182160162174155
181175170155160
LA TABLA DE ANOVALA TABLA DE ANOVA ES: GL SS MS F
FUENTE DE VARIACION42010,64502,6611,24
TRATAMIENTO20894,444,72
ERROR242905,04
TOTAL
Como F=2,87 y 11,25 > 2,87 rechazamos la hiptesis nula y concluimos que los resultados de los tratamientos son diferentes
EJERCICIO NO. 3 Se tienen las lecturas de hemoglobina de estudiantes varones de 3 aulas de primero de secundarias en un colegio:
1er Grado A1er Grado B1er Grado C
141613
151715
161514
131417
9813
151210
16148
Media m =1413.7112.8640.57
Tc989690284
nc77721
1408137012123990
FORMULAS: Entre gruposDentro de los grupos
Tc989690284
3845.71
nc77721
1408137012123990
2/N2/21 Formato General de la tabla de anlisis de la varianza
Fuente de variacinSuma de cuadradosGrados de libertadCuadrado medio
Entre los gruposSSTK-1SST/K=MSTR
En los gruposSSEN-KSSE/N-K=MSR
Total
Fuente de variacinSuma de cuadradosGrados de libertadCuadrado medio
Entre los grupos4.953-14.95/2=2.475
En los grupos144.2921-3144.29/18=8.016
Total
INTERPRETACIN:
= 0.309, es la funcin de prueba Con (3-1) y (21-3) grados de libertad = 2 grados de libertad en el numerador y 18 en el denominador. , es el valor critico de la distribucin F
Se acepta la hiptesis nula.Las medias aritmticas son iguales.
EJERCICIO N 4 Un profesor del curso de mercadotecnia pidi a los alumnos de un de sus grupos que evaluaran su desempeo como excelente, bueno, regular o deficiente. Un estudiante egresado recopilo las evaluaciones y aseguro a los estudiantes que el profesor las recibira hasta que las calificaciones del curso se hubieran enviado a las oficinas de registro. La evaluacin (es decir, el tratamiento) que cada alumno asigno al profesor se compar con las calificaciones, que podr ir de 0 a 100 que obtuvo el estudiante en el curso. A continuacin se presenta la informacin de la muestra existe diferente entre los promedios de las calificaciones de los alumnos en cada uno de las cuatro categora de evaluacin? Utilice el nivel de significancia 0.01CALIFICACIONES DEL CURSO
EXCELENTEBUENO REGULAR DEFICIENTE
947570 68
906873 70
857776 72
808378 65
8880 74
68 65
65
1. Plantear la hiptesis nula y la hiptesis alternativa
2. Seleccionar el nivel de significancia Se elige el nivel 0.01 3. Cul es la regla de decisin Grados de libertad en el numerador = k-1= 4-1=3Grados de libertad en el numerador= n-k=22-4=18 EXCELENTE BUENOREGULARDEFICIENTETOTAL
X X X X
948836755625704900684624
908100684624735329704900
857225775929765776725184
806400836889786084654225
887744806400745476
684624654225
654225
3493915104141664
457622
30561308113733828634127344
4. Calcule SST, SSE Y SS totalSUMA DE CUADRADOS; TOTAL SS total = 127344 - = 1485.09
SUMA DE CUADRADOS DEBIDOS AL TRATAMIENTO SST =
SUMA DE CUADRADOS DEL ERRORSSE = SS total SST 1485.09-890.68 =594.415. elabore una tabla de ANOVA TABLA ANOVA
FUENTE DE VARIACION SUMA DE CUADRADOSGRADOS DE LIBERTADCUADRADO MEDIO F
TRATAMIENTOS SSTk-1SST/(K-1) = MSTMST/MSE
ERROR SSEn-kSSE/(N-K) =MSE
TOTAL SS totaln-1
TABLA ANOVA
FUENTE DE VARIACION SUMA DE CUADRADOSGRADOS DE LIBERTADCUADRADO MEDIO F
TRATAMIENTOS890,683296,898,99
ERROR594,411833,02
TOTAL1485,0921
EJERCICIO N 5
Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan con mtodos diferentes. El primer grupo realiza largos recorridos a ritmo pausado, el segundo grupo realiza series cortas de alta intensidad y el tercero trabaja en el gimnasio con pesas y se ejercita en el pedaleo de alta frecuencia. Despus de un mes de entrenamiento se realiza un test de rendimiento consistente en un recorrido cronometrado de 9 Km. Los tiempos empleados fueron los siguientes:
METODO IMEDOTO IIMETODO III
151413
161312
141511
151614
171411
A un nivel de confianza del 95% Puede considerarse que los tres mtodos producen resultados equivalentes? O por el contrario Hay algn mtodo superior a los dems?
DESARROLLOTC777261210
NC55515
TC / NC1185,81036,8744,22966,8
119110427512984
SST= (TC /NC) - () /NSST= 2966, 8 (210) / 15SST= 2966, 8 2940= 26, 8
SSE= - (TC /NC)SSE= 2984 2966, 8 = 17, 2FUENTE DE VARIACIONSUMA DECUADRADOSGRADOS DELIBERTADCUADRADO MEDIO
ENTRE GRUPOSSSTK-1SST/K-1= MSTR
EN LOS GRUPOSSSEN-KSSE/N-K= MSE
TOTALF(MSTR/MSE)
ENTRE GRUPOS26, 83-1= 213, 4
EN LOS GRUPOS17, 215- 3= 121, 43
F= (MSTR/MSE)F= 13, 4 / 1, 43F= 9, 37El valor de la F terica con 2 y 12 grados de libertad, a un nivel de confianza del 95% es 3,89. Por consiguiente se rechaza la hiptesis nula y se concluye que los tres mtodos de entrenamiento producen diferencias significativas.
EJERCICIO 6Una compaa ofrece el servicio desde el edificio Toledo hasta el aeropuerto metro (Detroit). El representante de la compaa est considerando dos rutas:Ruta 1 Us 25Ruta 2 Intertatal 75Desea estudiar el tiempo necesario para llegar al aeropuerto por cada uno de estos caminos y despus comparar resultados. Obtuvo los siguientes datos de muestra de minuto. Utilizo el nivel de significativa del 0,005Existe alguna diferencia en la variacin de los tiempos de recorrido de ambas rutas?US 25INTERSTATAL 75
5259
6760
5661
4551
7056
5463
6457
65
408472= 880
US 25 INTERSTATAL 75
27043481
44893600
31363721
20252601
49003136
29163969
40963249
4225
2426627982 = 52,248
SST =SST =51.628,57 8802 / 15SST = 51.628,57 51.628,67 SST = 1,9
SSE = - SSE = 52248 51.628,57SSE = 619,43
FUENTE VARIACION SUMA DE CUADRADOS GRADOS DE LIBERTAD CUADRADO MEDIO
Entre los grupos SST 1,902 - 1 = 11,9
En los grupos SST 619,4315 - 2 = 1347,64
F = 0,03
Valor Critico 4,67: Se rechaza la hiptesis nula debido a que el valor critico es mayor al valor F .
UNIVERSIDAD DE GUAYAQUILFACULTAD DE CIENCIAS ADMINISTRATICAS CARRERA: INGENIERIA COMERCIALGRUPO N 6TEMA: ANLISIS DE VARIANZA INTEGRANTES: ANGULO CERON DIANA BERNAL CONSUEGRA CHRISTIAN CHAVEZ ESTRELLA VALERIA CHOEZ PLUAS KERLY GALEAS VIVANCO MARIA SANCHEZ PALACIOS MARIA FERNANDA