6 Semana Analisis Multivariante Parte I

26
UNIVERSIDAD NACIONAL UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS MAYOR DE SAN MARCOS Universidad del Perú, DECANA DE AMERICA Universidad del Perú, DECANA DE AMERICA Mg. María Estela Ponce Aruneri Mg. María Estela Ponce Aruneri ESCUELA ESCUELA ACADÉMICO PROFESIONAL DE ESTADÍSTICA ACADÉMICO PROFESIONAL DE ESTADÍSTICA ANÁLISIS MULTIVARIANTE ANÁLISIS MULTIVARIANTE SEMESTRE ACADÉMÍCO 2009-II SEMESTRE ACADÉMÍCO 2009-II

Transcript of 6 Semana Analisis Multivariante Parte I

Page 1: 6 Semana Analisis Multivariante Parte I

UNIVERSIDAD NACIONAL UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOSMAYOR DE SAN MARCOS

 Universidad del Perú, DECANA DE AMERICAUniversidad del Perú, DECANA DE AMERICA

Mg. María Estela Ponce AruneriMg. María Estela Ponce Aruneri

ESCUELAESCUELA ACADÉMICO PROFESIONAL DE ESTADÍSTICA ACADÉMICO PROFESIONAL DE ESTADÍSTICA

ANÁLISIS MULTIVARIANTEANÁLISIS MULTIVARIANTE

SEMESTRE ACADÉMÍCO 2009-IISEMESTRE ACADÉMÍCO 2009-II

Page 2: 6 Semana Analisis Multivariante Parte I

2

Page 3: 6 Semana Analisis Multivariante Parte I

3

1.INTRODUCCIÓNEl procedimiento MLG Medidas repetidas proporciona un análisis de varianza cuando se toma la misma medida varias veces a cada sujeto o caso. Si se especifican factores inter-sujetos, éstos dividen la población en grupos. Utilizando este procedimiento de modelo lineal general, puede contrastar hipótesis nulas sobre los efectos tanto de los factores inter-sujetos como de los factores intra-sujetos. Asimismo puede investigar las interacciones entre los factores y también los efectos individuales de los factores. También se pueden incluir los efectos de covariables constantes y de las interacciones de las covariables con los factores inter-sujetos.

Page 4: 6 Semana Analisis Multivariante Parte I

4

Ejemplo caso univariado:

Se investiga si los cambios de trabajo respiratorio de un grupo de pacientes que se recuperaban de insuficiencia respiratoria aguda, está o no relacionado con el efecto de un broncodilatador, para tal efecto se obtienen datos de los pacientes bajo estudio antes y después de inhalar el broncodilatador.

Page 5: 6 Semana Analisis Multivariante Parte I

5

Ejemplo caso general:

Sí se investiga si los cambios de trabajo respiratorio de un grupo de pacientes que se recuperaban de insuficiencia respiratoria aguda, está o no relacionado con el efecto de un broncodilatador, para tal efecto se obtienen datos de los pacientes bajo estudio antes y después del primer, segundo y tercer día de inhalar el broncodilatador.

Page 6: 6 Semana Analisis Multivariante Parte I

6

2. OBJETIVOS

Comparar más de dos tratamientos que se refieren a una sola variable de respuesta.

3. SUPUESTOS

•Cada sujeto o unidad experimental recibe tratamiento sobre períodos sucesivos de tiempo

11 1

1

q

n nq

x x

x x

X

xij: respuesta de la i-ésima unidad y j-ésimo tratamiento; i=1,2,…,n; j=1,2,……,q

xij tiene distribución N(µ,)

Page 7: 6 Semana Analisis Multivariante Parte I

7

1 2 1

1 3 2

1

1 1 0 . 0

1 0 1 . 0

. .. . . . .

. .. . . . .

1 0 0 . 1q q

1μ C μ

•Para comparar se tiene:

2 1 1

3 2 2

2

1

1 1 0 . 0

0 1 1 . 0

. .. . . . .

. .. . . . .

0 0 . 1 1q q q

μ C μ

O:

Page 8: 6 Semana Analisis Multivariante Parte I

2 1C μ C μ 0

8

C1 y C2 : las matrices de contrastes con “q-1” filas linealmente independientes.

4. Análisis de medidas repetidas

Cuando la media de los tratamientos son iguales se tiene que:

La prueba para igualdad de tratamientos en diseños de medidas repetidas, está dada por:

Hipótesis:

Ho: Cµ = 0

H1: Cµ ≠0

Page 9: 6 Semana Analisis Multivariante Parte I

9

Estadística para la prueba:

2 1( ) (*)

1, 1

( 1)( 1)

( 1)( ) '( ') ( )

q n q

n qF

n qT n

Cx CSC Cx

Rechazamos la hipótesis nula a un nivel de significación “” si se cumple (*)

Ejemplo:

A un grupo de 16 pacientes con Esclerosis Múltiple (EM) definida, tratados con Interferón Beta (IF-b), que son seguidos prospectivamente durante un periodo de tres años. El objetivo del estudio sería evaluar los cambios que se producen durante este tiempo en el volumen de las lesiones hiperintensas

Page 10: 6 Semana Analisis Multivariante Parte I

10

Estadísticos

16 16 16

.8406 .8844 .9288

.8000 .8350 .8700

.42284 .42068 .41779

.25 .27 .34

1.75 1.79 1.81

.5450 .5875 .6475

.8000 .8350 .8700

1.0725 1.1550 1.1825

n

Media

Mediana

Desv. típ.

Mínimo

Máximo

25

50

75

Percentiles

Volumenlesiones1º año

Volumenlesiones2º año

Volumenlesiones3º año

Page 11: 6 Semana Analisis Multivariante Parte I

11

Page 12: 6 Semana Analisis Multivariante Parte I

12

Prueba de rachas

.80 .84 .87

8 8 8

8 8 8

16 16 16

4 4 4

-2.329 -2.329 -2.329

.020 .020 .020

Valor de pruebaa

Casos < Valor de prueba

Casos >= Valor deprueba

Casos en total

Número de rachas

Z

Sig. asintót. (bilateral)

Volumenlesiones1º año

Volumenlesiones2º año

Volumenlesiones3º año

Medianaa.

Interprete los resultados

Page 13: 6 Semana Analisis Multivariante Parte I

13

Hipótesis:

Ho: Cµ = 0

H1: Cµ ≠0

Prueba de Kolmogorov-Smirnov para una muestra

16 16 16

.8406 .8844 .9288

.42284 .42068 .41779

.130 .124 .121

.130 .124 .121

-.081 -.081 -.087

.521 .494 .484

.949 .967 .973

n

Media

Desviación típica

Parámetros normales a,b

Absoluta

Positiva

Negativa

Diferencias másextremas

Z de Kolmogorov-Smirnov

Sig. asintót. (bilateral)

Volumenlesiones1º año

Volumenlesiones2º año

Volumenlesiones3º año

La distribución de contraste es la Normal.a.

Se han calculado a partir de los datos.b.

Contrastes multivariadosb

.792 26.706a 2.000 14.000 .000

.208 26.706a 2.000 14.000 .000

3.815 26.706a 2.000 14.000 .000

3.815 26.706a 2.000 14.000 .000

Traza de Pillai

Lambda de Wilks

Traza de Hotelling

Raíz mayor de Roy

Efectovolum

Valor FGl de lahipótesis Gl del error Significación

Estadístico exactoa.

Diseño: Intersección Diseño intra sujetos: volum

b.

Page 14: 6 Semana Analisis Multivariante Parte I

14

Podemos rechazar la hipótesis nula de igualdad de medias y concluir que los cambios que se producen en el volumen de las lesiones hiperintensas no son iguales durante los tres años.

Prueba de esfericidad de Bartletta

.000

137.006

5

.000

Razón de v erosimilitudes

Chi-cuadrado aprox.

gl

Signif icación

Contrasta la hipótesis nula de que la matriz de covarianzaresidual es proporcional a una matriz identidad.

Diseño: Intersección Diseño intra sujetos: volum

a.

Observación:Cuando se utiliza la prueba de Bartlett se incumple el supuesto de esfericidad.

Page 15: 6 Semana Analisis Multivariante Parte I

15

Prueba de esfericidad de Mauchlyb

Medida: MEASURE_1

.607 6.998 2 .030 .718 .773 .500Efecto intra-sujetosvolum

W de MauchlyChi-cuadrado

aprox. gl SignificaciónGreenhouse-Geisser Huynh-Feldt Límite-inferior

Epsilona

Contrasta la hipótesis nula de que la matriz de covarianza error de las variables dependientes transformadas es proporcional auna matriz identidad.

Puede usarse para corregir los grados de libertad en las pruebas de significación promediadas. Las pruebas corregidasse muestran en la tabla Pruebas de los efectos inter-sujetos.

a.

Diseño: Intersección Diseño intra sujetos: volum

b.

En los modelos de medidas repetidas, se supone que las varianzas de las diferencias entre cada dos niveles del factor son iguales.

Page 16: 6 Semana Analisis Multivariante Parte I

16

En nuestro ejemplo, tenemos: 1-2; 1-3; 2-3, 3 pares de combinaciones, calculando la diferencia entre estos pares, se tiene 3 nuevas variables, y suponemos que las varianzas de estas variables son iguales. Es decir que la matriz de varianzas-covarianzas es circular o esférica.La prueba de esfericidad no se rechaza al 1%.

Observación:

Si se rechazará la prueba de esfericidad, optamos por: 1° Utilizar los contrastes multivariados, puesto que no se afectan por la falta de esfericidad.

2°Utilizar el estadístico F univariado, que se muestra en la siguiente tabla:

Page 17: 6 Semana Analisis Multivariante Parte I

17

Observación:Si no se incumple el supuesto de esfericidad es preferible utilizar la aproximación univariada (esfericidad asumida); puesto que en este caso la estadística F es más potente que las pruebas multivariadas, sobre todo cuando las muestras son pequeñas.

Pruebas de efectos intra-sujetos.

Medida: MEASURE_1

.062 2 .031 34.596 .000

.062 1.435 .043 34.596 .000

.062 1.546 .040 34.596 .000

.062 1.000 .062 34.596 .000

.027 30 .001

.027 21.530 .001

.027 23.184 .001

.027 15.000 .002

Esf ericidad asumida

Greenhouse-Geisser

Huynh-Feldt

Límite-inf erior

Esf ericidad asumida

Greenhouse-Geisser

Huynh-Feldt

Límite-inf erior

Fuentevolum

Error(volum)

Suma decuadrados

tipo III glMedia

cuadrática F Signif icación

Page 18: 6 Semana Analisis Multivariante Parte I

18

La tabla anterior (F) también rechaza la hipótesis nula y concluimos que los cambios que se producen en el volumen de las lesiones hiperintensas no es el mismo durante los tres años.

Para probar :

Ho: µ = 0

H1: µ ≠0

Utilizamos:

Page 19: 6 Semana Analisis Multivariante Parte I

19

Pruebas de los efectos inter-sujetos

Medida: MEASURE_1

Variable transf ormada: Promedio

12.520 1 12.520 71.066 .000

2.643 15 .176

FuenteIntersección

Error

Suma decuadrados

tipo III glMedia

cuadrática F Signif icación

Se rechaza que el volumen promedio de las lesiones hiperintensas, sea cero.

El gráfico de perfil, muestra que el comportamiento de los volúmenes promedios de las lesiones hiperintensas durante los tres años se ajusta a una función lineal.

Page 20: 6 Semana Analisis Multivariante Parte I

20

Interprete los resultados.

Page 21: 6 Semana Analisis Multivariante Parte I

21

¿Será necesario evaluar las siguientes hipótesis?:

Comparaciones por pares

Medida: MEASURE_1

-.044* .011 .004 -.073 -.014

-.088* .013 .000 -.123 -.053

.044* .011 .004 .014 .073

-.044* .007 .000 -.063 -.026

.088* .013 .000 .053 .123

.044* .007 .000 .026 .063

(J) v olum2

3

1

3

1

2

(I) volum1

2

3

Diferenciaentre

medias (I-J) Error típ. Signif icacióna

Límite inf eriorLímite

superior

Interv alo de conf ianza al 95% para la dif erencia

a

Basadas en las medias marginales estimadas.

La diferencia de las medias es signif icativa al nivel .05.*.

Ajuste para comparaciones múltiples: Bonferroni.a.

Page 22: 6 Semana Analisis Multivariante Parte I

22

¿Qué conclusiones puede obtener de los gráficos?

Page 23: 6 Semana Analisis Multivariante Parte I

23Interprete los gráficos

Page 24: 6 Semana Analisis Multivariante Parte I

24

TAREA

¿SI NO SE CUMPLEN LOS SUPUESTOS, EXISTE OTRO TIPO DE HIPÓTESIS PARA PROBAR:

Ho: Cµ = 0

H1: Cµ ≠0 ?

Page 25: 6 Semana Analisis Multivariante Parte I

25

Ventajas:

son básicamente dos:

1º Se requieren menos sujetos experimentales, ya que la prueba tiene mayor potencia estadística, es decir, capacidad para detectar diferencias si es que existen.

2º Conseguimos mejor control de las diferencias entre los sujetos (variabilidad no sistemática) ya que la misma persona es valorada en dos o más momentos o situaciones y, en buena lógica, serán pocas las características del individuo (excluida la variabilidad sistemática de la variable resultado debida al factor que estamos evaluando) que hayan cambiado entre las mediciones; desde luego, habrá menos diferencias de las que deben presentarse entre dos sujetos distintos.

Page 26: 6 Semana Analisis Multivariante Parte I

26

BIBLIOGRAFÍA

1. URIEL, EZEQUIEL, ALDAS JOAQUIN. 2005 Análisis Multivariante Aplicado. Editorial Thompson Editores. España

2. DALLAS E. JOHNSON. 2000. Métodos Multivariados Aplicados al Análisis de Datos. International Thomson Editores.

3. HAIR J., ANDERSON R., TATHAM R., BLACK W. 2001. Análisis Multivariante. Prentice Hall.

4. JOHNSON, R.; WICHERN, D. 1982. Applied Multivariate Statistical Analysis. Editorial Prentice – Hall Inc.Englewood Cliffs. New Jersey.