Análisis de La Varianza.docx Exposicion

29
ANÁLISIS DE LA VARIANZA El análisis de varianza es una técnica que se puede utilizar para decidir si GRUPO Nº 6

Transcript of Análisis de La Varianza.docx Exposicion

GRUPO N 6

ANLISIS DE LA VARIANZA

El anlisis de varianza es una tcnica que se puede utilizar para decidir si las medias de dos o ms poblaciones son iguales. La prueba se basa en una muestra nica, obtenida a partir de cada poblacin. El anlisis de varianza puede servir para determinar si las diferencias entre las medias mustrales revelan las verdaderas diferencias entre los valores medios de cada una de las poblaciones, o si las diferencias entre los valores medios de la muestra son ms indicativas de una variabilidad de muestreo.Si el valor estadstico de prueba (anlisis de varianza) nos impulsa a aceptar la hiptesis nula, se concluira que las diferencias observadas entre las medias de las muestras se deben a la variacin casual en el muestreo (y por tanto, que los valores medios de poblacin son iguales). Si se rechaza la hiptesis nula, se concluira que las diferencias entre los valores medios de la muestra son demasiado grandes como para deberse nicamente a la casualidad (y por ello, no todas las medias de poblacin son iguales).Los datos para el anlisis de varianza se obtienen tomando una muestra de cada poblacin y calculando la media muestral y la variancia en el caso de cada muestra. Existen tres supuestos bsicos que se deben satisfacer antes de que se pueda utilizar el anlisis de variancia.

1) Las muestras deben ser de tipo aleatorio independiente.2) Las muestras deben ser obtenidas a partir de poblaciones normales.3) Las poblaciones deben tener variancias iguales (es decir,)El anlisis de varianza, como su nombre lo indica, comprende el clculo de varianzas. La varianza de una muestra es el promedio de las desviaciones elevadas al cuadrado de la media del grupo. Simblicamente, esto se representa de la siguiente manera:

Cabe observar que se debe utilizar n -1, ya que se est trabajando con datos mustrales. De ah que, para obtener la varianza muestral, el procedimiento sea el siguiente:1) Calcular la media muestral2) Restar la media de cada valor de la muestra.3) Elevar al cuadrado cada una de las diferencias.4) Sumar las diferencias elevadas al cuadrado.5) Dividir entre n -1

LA RAZN FA diferencia de otras pruebas de medias que se basan en la diferencia existente entre dos valores, el anlisis de varianza emplea la razn de las estimaciones, dividiendo la estimacin intermediante entre la estimacin interna

Esta razn F fue creada por Ronald Fisher (1890-1962), matemtico britnico, cuyas teoras estadsticas hicieron mucho ms precisos los experimentos cientficos. Sus proyectos estadsticos, primero utilizados en biologa, rpidamente cobraron importancia y fueron aplicados a la experimentacin agrcola, mdica e industrial. Fisher tambin contribuy a clarificar las funciones que desempean la mutacin y la seleccin natural en la gentica, particularmente en la poblacin humana.El valor estadstico de prueba resultante se debe comparar con un valor tabular de F, que indicar el valor mximo del valor estadstico de prueba que ocurra si H0 fuera verdadera, a un nivel de significacin seleccionado. Antes de proceder a efectuar este clculo, se debe considerar las caractersticas de la distribucin F

CARACTERSTICAS DE LA DISTRIBUCIN FExiste una distribucin F diferente para cada combinacin de tamao de muestra y nmero de muestras. Por tanto, existe una distribucin F que se aplica cuando se toman cinco muestras de seis observaciones cada una, al igual que una distribucin F diferente para cinco muestras de siete observaciones cada una. A propsito de esto, el nmero distribuciones de muestreo diferentes es tan grande que sera poco prctico hacer una extensa tabulacin de distribuciones. Por tanto, como se hizo en el caso de la distribucin t, solamente se tabulan los valores que ms comnmente se utilizan.En el caso de la distribucin F, los valores crticos para los niveles 0,05 y 0,01 generalmente se proporcionan para determinadas combinaciones de tamaos de muestra y nmero de muestras.

La distribucin es continua respecto al intervalo de 0 a + . La razn ms pequea es 0. La razn no puede ser negativa, ya que ambos trminos de la razn F estn elevados al cuadrado. Por otra parte, grandes diferencias entre los valores medios de la muestra, acompaadas de pequeas variancias mustrales pueden dar como resultado valores extremadamente grandes de la razn F.

La forma de cada distribucin de muestreo terico F depende del nmero de grados de libertad que estn asociados a ella. Tanto el numerador como el denominador tienen grados de libertad relacionados.

DETERMINACIN DE LOS GRADOS DE LIBERTADLos grados de libertad para el numerador y el denominador de la razn F se basan en los clculos necesarios para derivar cada estimacin de la variancia de la poblacin. La estimacin intermediante de variancia (numerador) comprende la divisin de la suma de las diferencias elevadas al cuadrado entre el nmero de medias (muestras) menos uno, o bien, k -1. As, k -1es el nmero de grados de libertad para el numerador.En forma semejante, el calcular cada variancia muestral, la suma de las diferencias elevadas al cuadrado entre el valor medio de la muestra y cada valor de la misma se divide entre el nmero de observaciones de la muestra menos uno, o bien, n -1. Por tanto, el promedio de las variancias mustrales se determina dividiendo la suma de las variancias de la muestra entre el nmero de muestras, o k. Los grados de libertad para el denominador son entonces, k(n -l).Uso de la tabla de F del anlisis de variancia (ANOVA)En la tabla se ilustra la estructura de una tabla de F para un nivel de significacin de 0,01 o 1% y 0,05 o 5%. Se obtiene el valor tabular, localizando los grados de libertad del numerador (que se listan en la parte superior de la tabla), as como los del denominador (que se listan en una de las columnas laterales de la tabla) que corresponden a una situacin dada. Utilizando el nivel de significacin de 0,05 para grados de libertad, el valor de F es 8,89

ANLISIS DE LA VARIANZA

El anlisis de la varianza (o Anova: Analysis of variance) es un mtodo para comparar dos o ms medias, que es necesario porque cuando se quiere comparar ms de dos medias es incorrecto utilizar repetidamente el contraste basado en la t de Student. Por dos motivos:

En primer lugar, y como se realizaran simultnea e independientemente varios contrastes de hiptesis, la probabilidad de encontrar alguno significativo por azar aumentara. En cada contraste se rechaza la H0 si la t supera el nivel crtico, para lo que, en la hiptesis nula, hay una probabilidad a. Si se realizan m contrastes independientes, la probabilidad de que, en la hiptesis nula, ningn estadstico supere el valor crtico es (1 - a)m, por lo tanto, la probabilidad de que alguno lo supere es 1 - (1 - a)m, que para valores de a prximos a 0 es aproximadamente igual a m. Una primera solucin, denominada mtodo de Bonferroni, consiste en bajar el valor de a, usando en su lugar a/m, aunque resulta un mtodo muy conservador.

Por otro lado, en cada comparacin la hiptesis nula es que las dos muestras provienen de la misma poblacin, por lo tanto, cuando se hayan realizado todas las comparaciones, la hiptesis nula es que todas las muestras provienen de la misma poblacin y, sin embargo, para cada comparacin, la estimacin de la varianza necesaria para el contraste es distinta, pues se ha hecho en base a muestras distintas.

El mtodo que resuelve ambos problemas es el anova, aunque es algo ms que esto: es un mtodo que permite comparar varias medias en diversas situaciones; muy ligado, por tanto, al diseo de experimentos y, de alguna manera, es la base del anlisis multivariante.

EJERCICIO N 1 Una lista de palabras sin sentido se presenta en la pantalla del ordenador con cuatro procedimientos diferentes, asignados al azar a un grupo de sujetos. Posteriormente se les realiza una prueba de recuerdo de dichas palabras, obtenindose los siguientes resultados:

PROCEDIMIENTO 1PROCEDIMIENTO 2PROCEDIMIENTO 3PROCEDIMIENTO 4

5981

71163

6894

3755

9771

744

44

2

TABLA DE REALIZACION DE EJERCICIO

PROCED. 1PROCED. 2PROCED. 3PROCED.4TOTAL

Tc43424318146

Nc857626

Tc2/nc231.10352.8264.1054902

X226936428768988

SST= 902 (146)2 /26SST= 902- 819.80SST= 82.20SSE= 988-902SSE= 86

FUENTE DE VARIACIONSUMA DE CUADRADOSGRADOS DE LIBERTADCUADRADO MEDIO

ENTRE LOS GRUPOS82.204-1= 327.40

EN GRUPO8626-4= 223.90

TOTAL7.03

El valor en la F terica con 3 y 22 grados de libertad a un nivel de confianza del 95% es 3.05. Por consiguiente se rechaza la hiptesis nula y se concluye que los cuatro procedimientos de presentacin producen diferencias significativas.

EJERCICIO N 2 Se quiere evaluar la eficacia de distintas dosis de un frmaco contra la hipertensin arterial, comparndola con la de una dieta sin sal. Para ello se seleccionan al azar 25 hipertensos y se distribuyen aleatoriamente en 5 grupos- Al primero de ellos no le suministra ningn tratamiento, al segundo una dieta con un contenido pobre en sal, al tercero una dieta sin sal, al cuarto el frmaco a una dosis determinada y al quinto el mismo frmaco a otra dosis. Las presiones arteriales sistlicas de los 25 sujetos al finalizar los tratamientos son: GRUPO

12345

180172163158147

173158170146152

175167158160143

182160162174155

181175170155160

LA TABLA DE ANOVALA TABLA DE ANOVA ES: GL SS MS F

FUENTE DE VARIACION42010,64502,6611,24

TRATAMIENTO20894,444,72

ERROR242905,04

TOTAL

Como F=2,87 y 11,25 > 2,87 rechazamos la hiptesis nula y concluimos que los resultados de los tratamientos son diferentes

EJERCICIO NO. 3 Se tienen las lecturas de hemoglobina de estudiantes varones de 3 aulas de primero de secundarias en un colegio:

1er Grado A1er Grado B1er Grado C

141613

151715

161514

131417

9813

151210

16148

Media m =1413.7112.8640.57

Tc989690284

nc77721

1408137012123990

FORMULAS: Entre gruposDentro de los grupos

Tc989690284

3845.71

nc77721

1408137012123990

2/N2/21 Formato General de la tabla de anlisis de la varianza

Fuente de variacinSuma de cuadradosGrados de libertadCuadrado medio

Entre los gruposSSTK-1SST/K=MSTR

En los gruposSSEN-KSSE/N-K=MSR

Total

Fuente de variacinSuma de cuadradosGrados de libertadCuadrado medio

Entre los grupos4.953-14.95/2=2.475

En los grupos144.2921-3144.29/18=8.016

Total

INTERPRETACIN:

= 0.309, es la funcin de prueba Con (3-1) y (21-3) grados de libertad = 2 grados de libertad en el numerador y 18 en el denominador. , es el valor critico de la distribucin F

Se acepta la hiptesis nula.Las medias aritmticas son iguales.

EJERCICIO N 4 Un profesor del curso de mercadotecnia pidi a los alumnos de un de sus grupos que evaluaran su desempeo como excelente, bueno, regular o deficiente. Un estudiante egresado recopilo las evaluaciones y aseguro a los estudiantes que el profesor las recibira hasta que las calificaciones del curso se hubieran enviado a las oficinas de registro. La evaluacin (es decir, el tratamiento) que cada alumno asigno al profesor se compar con las calificaciones, que podr ir de 0 a 100 que obtuvo el estudiante en el curso. A continuacin se presenta la informacin de la muestra existe diferente entre los promedios de las calificaciones de los alumnos en cada uno de las cuatro categora de evaluacin? Utilice el nivel de significancia 0.01CALIFICACIONES DEL CURSO

EXCELENTEBUENO REGULAR DEFICIENTE

947570 68

906873 70

857776 72

808378 65

8880 74

68 65

65

1. Plantear la hiptesis nula y la hiptesis alternativa

2. Seleccionar el nivel de significancia Se elige el nivel 0.01 3. Cul es la regla de decisin Grados de libertad en el numerador = k-1= 4-1=3Grados de libertad en el numerador= n-k=22-4=18 EXCELENTE BUENOREGULARDEFICIENTETOTAL

X X X X

948836755625704900684624

908100684624735329704900

857225775929765776725184

806400836889786084654225

887744806400745476

684624654225

654225

3493915104141664

457622

30561308113733828634127344

4. Calcule SST, SSE Y SS totalSUMA DE CUADRADOS; TOTAL SS total = 127344 - = 1485.09

SUMA DE CUADRADOS DEBIDOS AL TRATAMIENTO SST =

SUMA DE CUADRADOS DEL ERRORSSE = SS total SST 1485.09-890.68 =594.415. elabore una tabla de ANOVA TABLA ANOVA

FUENTE DE VARIACION SUMA DE CUADRADOSGRADOS DE LIBERTADCUADRADO MEDIO F

TRATAMIENTOS SSTk-1SST/(K-1) = MSTMST/MSE

ERROR SSEn-kSSE/(N-K) =MSE

TOTAL SS totaln-1

TABLA ANOVA

FUENTE DE VARIACION SUMA DE CUADRADOSGRADOS DE LIBERTADCUADRADO MEDIO F

TRATAMIENTOS890,683296,898,99

ERROR594,411833,02

TOTAL1485,0921

EJERCICIO N 5

Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan con mtodos diferentes. El primer grupo realiza largos recorridos a ritmo pausado, el segundo grupo realiza series cortas de alta intensidad y el tercero trabaja en el gimnasio con pesas y se ejercita en el pedaleo de alta frecuencia. Despus de un mes de entrenamiento se realiza un test de rendimiento consistente en un recorrido cronometrado de 9 Km. Los tiempos empleados fueron los siguientes:

METODO IMEDOTO IIMETODO III

151413

161312

141511

151614

171411

A un nivel de confianza del 95% Puede considerarse que los tres mtodos producen resultados equivalentes? O por el contrario Hay algn mtodo superior a los dems?

DESARROLLOTC777261210

NC55515

TC / NC1185,81036,8744,22966,8

119110427512984

SST= (TC /NC) - () /NSST= 2966, 8 (210) / 15SST= 2966, 8 2940= 26, 8

SSE= - (TC /NC)SSE= 2984 2966, 8 = 17, 2FUENTE DE VARIACIONSUMA DECUADRADOSGRADOS DELIBERTADCUADRADO MEDIO

ENTRE GRUPOSSSTK-1SST/K-1= MSTR

EN LOS GRUPOSSSEN-KSSE/N-K= MSE

TOTALF(MSTR/MSE)

ENTRE GRUPOS26, 83-1= 213, 4

EN LOS GRUPOS17, 215- 3= 121, 43

F= (MSTR/MSE)F= 13, 4 / 1, 43F= 9, 37El valor de la F terica con 2 y 12 grados de libertad, a un nivel de confianza del 95% es 3,89. Por consiguiente se rechaza la hiptesis nula y se concluye que los tres mtodos de entrenamiento producen diferencias significativas.

EJERCICIO 6Una compaa ofrece el servicio desde el edificio Toledo hasta el aeropuerto metro (Detroit). El representante de la compaa est considerando dos rutas:Ruta 1 Us 25Ruta 2 Intertatal 75Desea estudiar el tiempo necesario para llegar al aeropuerto por cada uno de estos caminos y despus comparar resultados. Obtuvo los siguientes datos de muestra de minuto. Utilizo el nivel de significativa del 0,005Existe alguna diferencia en la variacin de los tiempos de recorrido de ambas rutas?US 25INTERSTATAL 75

5259

6760

5661

4551

7056

5463

6457

65

408472= 880

US 25 INTERSTATAL 75

27043481

44893600

31363721

20252601

49003136

29163969

40963249

4225

2426627982 = 52,248

SST =SST =51.628,57 8802 / 15SST = 51.628,57 51.628,67 SST = 1,9

SSE = - SSE = 52248 51.628,57SSE = 619,43

FUENTE VARIACION SUMA DE CUADRADOS GRADOS DE LIBERTAD CUADRADO MEDIO

Entre los grupos SST 1,902 - 1 = 11,9

En los grupos SST 619,4315 - 2 = 1347,64

F = 0,03

Valor Critico 4,67: Se rechaza la hiptesis nula debido a que el valor critico es mayor al valor F .

UNIVERSIDAD DE GUAYAQUILFACULTAD DE CIENCIAS ADMINISTRATICAS CARRERA: INGENIERIA COMERCIALGRUPO N 6TEMA: ANLISIS DE VARIANZA INTEGRANTES: ANGULO CERON DIANA BERNAL CONSUEGRA CHRISTIAN CHAVEZ ESTRELLA VALERIA CHOEZ PLUAS KERLY GALEAS VIVANCO MARIA SANCHEZ PALACIOS MARIA FERNANDA