Manova mb

25
TIPOS DE APLICACIONES DEL A. MULTIVARIADO 1. Reducir la dimensionalidad de un problema (análisis de componentes principales, análisis factorial, escalamiento multidimensional 2. Estudio de la dependencia múltiple de un conjunto de variables (correlación canónica) 3. Clasificar sujetos o grupos preestablecidos (análisis discriminante, regresión logística) 4. Comparar grupos en múltiples variables dependientes (análisis multivariado de la varianza: MANOVA)

description

 

Transcript of Manova mb

Page 1: Manova mb

TIPOS DE APLICACIONES DEL

A. MULTIVARIADO1. Reducir la dimensionalidad de un problema (análisis de

componentes principales, análisis factorial, escalamiento

multidimensional

2. Estudio de la dependencia múltiple de un conjunto de

variables (correlación canónica)

3. Clasificar sujetos o grupos preestablecidos (análisis

discriminante, regresión logística)

4. Comparar grupos en múltiples variables dependientes

(análisis multivariado de la varianza: MANOVA)

Page 2: Manova mb

Cuando queremos estudiar la influencia de una o más variables independientes

sobre dos o más variables dependientes utilizamos el MANOVA.

El MANOVA detecta si hay diferencias entre grupos a través de una combinación

lineal de las variables dependientes.

El MANOVA estudia si existen diferencias significativas entre las medias de las

variables dependientes en los niveles de las variables independientes (Camacho)

Al igual que en el ANOVA, el MANOVA ejecuta primero un test omnibus (global)

de significación y luego anovas univariados en cada una de las variables

dependientes.

Existe cierta controversia sobre si los análisis sobre las variables dependientes

deben hacerse siguiendo un modelo anova o un análisis discriminante.

Uno de las ventajas del MANOVA es que tiene en cuenta la correlación entre las

variables dependientes.

Page 3: Manova mb

t-test vs. ANOVA vs. MANOVA

En la siguiente tabla podemos ver las diferencias en cuanto a las variables

independientes y dependientes que hay entre las tres técnicas más utilizadas

en Ciencias Sociales

Test Variables Independientes Variables Dependientes

t-test Una Una

ANOVA Múltiples Una

MANOVA Múltiples Múltiples

1. El MANOVA permite el uso de múltiples medidas

2. Puede que no encontremos diferencias entre dos variables dependientes

correlacionadas si las evaluamos separadamente

3. Llevar a cabo múltiples ANOVAS nos lleva a aumentar la tasa de error tipo I

Page 4: Manova mb

Teoría detrás del MANOVA..

En el ANOVA la ratio F recoge la variación sistemática dividida por la

variación aleatoria…

2 2 2

intergrupo intragrupo =

ij j j ij j

j i j

Y Y n Y Y Y Y

SCT SC SC

Inter IntraInter Intra

Inter Intra

SC SCMC MC

gl gl

1

Inter Intra

Inter

Intra

E MC E MC

MCF E F

MC

Page 5: Manova mb

ANOVA

accion conductas compuls ivas

10.467 2 5.233 2.771 .080

51.000 27 1.889

61.467 29

Inter-grupos

Intra-grupos

Total

Suma de

cuadrados gl

Media

cuadrát ica F Sig.

ANOVA

pensamiento conductas obsesivas

19.467 2 9.733 2.154 .136

122.000 27 4.519

141.467 29

Inter-grupos

Intra-grupos

Total

Suma de

cuadrados gl

Media

cuadrát ica F Sig.

Observa el siguiente ejemplo… un ANOVA para cada variable

dependiente….

Page 6: Manova mb

ANOVA

accion conductas compuls ivas

10.467 2 5.233 2.771 .080

51.000 27 1.889

61.467 29

Inter-grupos

Intra-grupos

Total

Suma de

cuadrados gl

Media

cuadrát ica F Sig.

2 2 2

ij j j ij j

j i j

Y Y n Y Y Y Y

intergrupo intragrupo =

61.467 = 10.467 51.000

SCT SC SC

Inter Inter Inter Intra Intra IntraMC SC gl MC SC gl

5.233= 2.771 0.05

1.889

Inter

Intra

MCF F p

MC

Page 7: Manova mb

En el MANOVA dado que tenemos más de una variable dependiente hay que

recoger la relación entre las mismas y por tanto ya no hacemos una ratio de

sumas de cuadrados (como en el ANOVA) sino una ratio de matrices de

varianzas-covarianzas. Estas matrices se denominan Sumas Cuadradas de

Productos Cruzados (SCPC).

Un producto cruzado no es más que el sumatorio de la diferencia entre las

puntuaciones en una variable X y su media, multiplicado por las puntuaciones en

otra variable Y menos su media.

Teoría detrás del MANOVA..

( ) ( )i iX X Y Y

MANOVA tiene en cuenta la correlación entre las variables dependientes a

través de estos productos cruzados

Page 8: Manova mb

Dos variables Dependientes. El concepto de productos cruzados

.

.

.

i i

j j

i j i j

PC Total A A P P

PC Expl n A A P P

PC Err A A P P

Como en el ANOVA tenemos tres tipos de fuentes de variación o tres tipos de

matrices de productos cruzados. La total (T), la debida a la variación

sistemática (H) o del modelo, y la debida al error, o no sistemática (E).

Page 9: Manova mb

Vamos a crear tres matrices que combinen los productos cruzados

y las sumas cuadráticas univariadas

( )

.

.

61.47 5.47

5.47 141.47

Accion

Pensamiento

SCPC Total

SCT PC Total

PC Total SCT

T

ANOVA

accion conductas compuls ivas

10.467 2 5.233 2.771 .080

51.000 27 1.889

61.467 29

Inter-grupos

Intra-grupos

Total

Suma de

cuadrados gl

Media

cuadrát ica F Sig.

ANOVA

pensamiento conductas obsesivas

19.467 2 9.733 2.154 .136

122.000 27 4.519

141.467 29

Inter-grupos

Intra-grupos

Total

Suma de

cuadrados gl

Media

cuadrát ica F Sig.

Page 10: Manova mb

( )

.

.

51 13

13 122

Accion

Pensamiento

SCPC Error

SCE PC Error

PC Error SCE

E

ANOVA

accion conductas compuls ivas

10.467 2 5.233 2.771 .080

51.000 27 1.889

61.467 29

Inter-grupos

Intra-grupos

Total

Suma de

cuadrados gl

Media

cuadrát ica F Sig.

ANOVA

pensamiento conductas obsesivas

19.467 2 9.733 2.154 .136

122.000 27 4.519

141.467 29

Inter-grupos

Intra-grupos

Total

Suma de

cuadrados gl

Media

cuadrát ica F Sig.

Page 11: Manova mb

( )

.

.

10.47 7.53

7.53 19.47

Accion

Pensamiento

SCPC Modelo

SCExp PC Expl

PC Expl SCExp

H

ANOVA

accion conductas compuls ivas

10.467 2 5.233 2.771 .080

51.000 27 1.889

61.467 29

Inter-grupos

Intra-grupos

Total

Suma de

cuadrados gl

Media

cuadrát ica F Sig.

ANOVA

pensamiento conductas obsesivas

19.467 2 9.733 2.154 .136

122.000 27 4.519

141.467 29

Inter-grupos

Intra-grupos

Total

Suma de

cuadrados gl

Media

cuadrát ica F Sig.

Page 12: Manova mb

61.47 5.47 51 13 10.47 7.53

5.47 141.47 13 122 7.53 19.47T E H

1

1

1

10.47 7.53 0.0202 0.0021

7.53 19.47 0.0021 0.0084

0.2273 0.0852

0.1930 0.1794

Inter

Intra

MCF E F

MC

Mult HE

HE

Sumas de Cuadrados y productos cruzados para el ejemplo anterior

Para dividir matrices lo que

hacemos es multiplicar una

por la inversa de la otra…..

Hay distintas manera de resolver esta matriz para

alcanzar un valor de estadístico multivariado que

permita aproximar a F y evaluar la H0 del efecto

multivariado...

Page 13: Manova mb

Una vez calculadas las SCPC para el Error y la Hipótesis podemos aplicar dos

métodos.

1. Calcular el determinante de las SCPC anteriores hallando en este caso el valor

del estadístico multivariado lambda de Wilks...

2. Calcular los autovectores (eigenvector) y autovalores (eigenvalues) de la matriz

HE-1. Estos autovalores nos muestran la ratio entre la varianza sistemática

debida al efecto y la varianza error. El concepto de autovalor es básico en el

análisis multivariado. Conceptualmente se puede interpretar como la cantidad

de variabilidad que tenemos en nuestros datos. Veamos gráficamente que es

un autovector y un autovalor…

SCPCerror

SCPC SCPCerrorefecto

Page 14: Manova mb

La Fig. 1 muestra un patrón de ausencia de correlación entre dos variables. Por el

contrario la Fig. 2 muestra un patrón de correlación positiva entre dos variables. La

longitud y la altura de esta elipse se corresponden con los autovectores de la matriz de

correlaciones de estas dos variables. Cada autovector tiene un autovalor (eigenvalue)

que nos da la distancia entre los dos puntos de dichos vectores. De tal manera que

estos dos valores nos muestran cómo se distribuye la variabilidad en nuestra matriz de

correlaciones

Figura 1 Figura 2

Page 15: Manova mb

10.2273 0.0852

0.1930 0.1794

0.603 0.425.

0.335 0.339

0.335 0.

0 0.073

HE

Vector propio

Valor propio

El cálculo de los autovalores o valores propios de la matriz HE-1 nos permite pasar

obtener la ratio de una variabilidad con respecto a la otra obteniendo dos valores que

recogen cúanto explica nuestro modelo del total de la variabilidad de los datos…

hemos reducido cuatro valores a

dos valores para el cálculo de la

razón de variabilidad explicada

frente a no explicada..

Page 16: Manova mb

Finalmente el cálculo del estadístico se puede hacer por distintas fórmulas..

Todas ellas tienes aproximaciones a la distribución F para hacerla más

manejable…

1 1

si

i i

V

1

s

i

i

T

1

1

1

s

i i

Traza de Pillai-Bartlett. Siendo s el

número de funciones y lambda los

eigenvalue

Traza de Hotelling. Siendo s el

número de funciones y lambda los

eigenvalue

Lambda de Wilks. Siendo s el número

de funciones y lambda los eigenvalue.

Compara esta fórmula con la anterior

que vimos..

Page 17: Manova mb

La buena noticia es que todo esto lo hace el SPSS… ¿cómo? El siguiente

ejemplo nos servirá

Page 18: Manova mb
Page 19: Manova mb

Factores inter-sujetos

TCC 10

TC 10

Control 10

1.00

2.00

3.00

grupo

group

Etiqueta

del valor N

Estadísticos descriptivos

4.90 1.197 10

3.70 1.767 10

5.00 1.054 10

4.53 1.456 30

13.40 1.897 10

15.20 2.098 10

15.00 2.357 10

14.53 2.209 30

grupo group

TCC

TC

Control

Total

TCC

TC

Control

Total

acc ion conductas

compuls iv as

pensamiento

conductas obses ivas

Media Desv. típ. N

Prueba de Box sobre la igualdad

de las matrices de covarianzasa

9.959

1.482

6

18168.923

.180

M de Box

F

gl1

gl2

Signif icación

Contras ta la hipótesis nula de que las matrices

de cov arianza observ adas de las v ariables

dependientes son iguales en todos los grupos.

Diseño: Intercept+grupoa.

Igual que en el ANOVA necesitamos

comprobar la igual de varianzas. En este

caso covarianzas

Page 20: Manova mb

Contrastes multivariadosd

.983 745.230b 2.000 26.000 .000 .983 1490.459 1.000

.017 745.230b 2.000 26.000 .000 .983 1490.459 1.000

57.325 745.230b 2.000 26.000 .000 .983 1490.459 1.000

57.325 745.230b 2.000 26.000 .000 .983 1490.459 1.000

.318 2.557 4.000 54.000 .049 .159 10.227 .684

.699 2.555b 4.000 52.000 .050 .164 10.218 .682

.407 2.546 4.000 50.000 .051 .169 10.183 .678

.335 4.520c 2.000 27.000 .020 .251 9.040 .722

Traza de Pillai

Lambda de Wilks

Traza de Hotelling

Raíz mayor de Roy

Traza de Pillai

Lambda de Wilks

Traza de Hotelling

Raíz mayor de Roy

EfectoIntersección

grupo

Valor F

Gl de la

hipótesis Gl del error Signif icación

Eta al

cuadrado

parcial

Parámetro de

no centralidad

Potencia

observ adaa

Calculado con alfa = .05a.

Estadíst ico exactob.

El estadís tico es un límite superior para la F el cual of rece un límite inf erior para el nivel de signif icación.c.

Diseño: Intercept+grupod.

Los contrastes Multivariados nos dicen si las medias en las variables

dependientes son distintas en los grupos. Observa los valores de significación

¿Qué te sugieren?...

¡¡¡¡ recuerda !!!!

MANOVA ha generado una combinación lineal de las variables dependientes,

función, en la que lleva a cabo los contrastes de medias multivariados

Page 21: Manova mb

Pruebas de los efectos inter-sujetos

10.467b

2 5.233 2.771 .080 .170 5.541 .500

19.467c

2 9.733 2.154 .136 .138 4.308 .402

616.533 1 616.533 326.400 .000 .924 326.400 1.000

6336.533 1 6336.533 1402.348 .000 .981 1402.348 1.000

10.467 2 5.233 2.771 .080 .170 5.541 .500

19.467 2 9.733 2.154 .136 .138 4.308 .402

51.000 27 1.889

122.000 27 4.519

678.000 30

6478.000 30

61.467 29

141.467 29

Variable dependienteacc ion conductas

compulsiv as

pensamiento

conductas obsesiv as

acc ion conductas

compulsiv as

pensamiento

conductas obsesiv as

acc ion conductas

compulsiv as

pensamiento

conductas obsesiv as

acc ion conductas

compulsiv as

pensamiento

conductas obsesiv as

acc ion conductas

compulsiv as

pensamiento

conductas obsesiv as

acc ion conductas

compulsiv as

pensamiento

conductas obsesiv as

FuenteModelo corregido

Intersección

grupo

Error

Total

Total corregida

Suma de

cuadrados

tipo II I gl

Media

cuadrát ica F Signif icación

Eta al

cuadrado

parcial

Parámetro de

no centralidad

Potencia

observ adaa

Calculado con alfa = .05a.

R cuadrado = .170 (R cuadrado corregida = .109)b.

R cuadrado = .138 (R cuadrado corregida = .074)c.

Anovas UNIVARIADOS sobre cada variable denpendiente con la

variable independiente grupo ¿Qué puedes concluir?

Page 22: Manova mb

Matriz SCPC inter-sujetos

616.533 1976.533

1976.533 6336.533

10.467 -7.533

-7.533 19.467

51.000 13.000

13.000 122.000

acc ion conductas

compulsivas

pensamiento

conductas obsesivas

acc ion conductas

compulsivas

pensamiento

conductas obsesivas

acc ion conductas

compulsivas

pensamiento

conductas obsesivas

Intersección

grupo

Hipótesis

Error

acc ion

conductas

compulsivas

pensamiento

conductas

obsesivas

Basado en la suma de cuadrados tipo III

61.47 5.47 51 13 10.47 7.53 = +

5.47 141.47 13 122 7.53 19.47T E H

Le hemos pedido a SPSS que nos de las SCPC…. Recuerda que es sobre

estas matrices que hacemos los cálculos en MANOVA…

Page 23: Manova mb

¿Hay diferencias

entre las medias de

los niveles de la

variable grupo para

las variables

dependientes?..

¿qué vemos…?

Comparaciones múltiples

1.20 .615 .061 -.06 2.46

-.10 .615 .872 -1.36 1.16

-1.20 .615 .061 -2.46 .06

-1.30* .615 .044 -2.56 -.04

.10 .615 .872 -1.16 1.36

1.30* .615 .044 .04 2.56

1.20 .615 .184 -.37 2.77

-.10 .615 1.000 -1.67 1.47

-1.20 .615 .184 -2.77 .37

-1.30 .615 .131 -2.87 .27

.10 .615 1.000 -1.47 1.67

1.30 .615 .131 -.27 2.87

1.20 .615 .173 -.36 2.76

-.10 .615 .998 -1.66 1.46

-1.20 .615 .173 -2.76 .36

-1.30 .615 .126 -2.86 .26

.10 .615 .998 -1.46 1.66

1.30 .615 .126 -.26 2.86

-1.80 .951 .069 -3.75 .15

-1.60 .951 .104 -3.55 .35

1.80 .951 .069 -.15 3.75

.20 .951 .835 -1.75 2.15

1.60 .951 .104 -.35 3.55

-.20 .951 .835 -2.15 1.75

-1.80 .951 .207 -4.23 .63

-1.60 .951 .312 -4.03 .83

1.80 .951 .207 -.63 4.23

.20 .951 1.000 -2.23 2.63

1.60 .951 .312 -.83 4.03

-.20 .951 1.000 -2.63 2.23

-1.80 .951 .193 -4.22 .62

-1.60 .951 .280 -4.02 .82

1.80 .951 .193 -.62 4.22

.20 .951 .996 -2.22 2.62

1.60 .951 .280 -.82 4.02

-.20 .951 .996 -2.62 2.22

(J) group

TC

Control

TCC

Control

TCC

TC

TC

Control

TCC

Control

TCC

TC

TC

Control

TCC

Control

TCC

TC

TC

Control

TCC

Control

TCC

TC

TC

Control

TCC

Control

TCC

TC

TC

Control

TCC

Control

TCC

TC

(I) group

TCC

TC

Control

TCC

TC

Control

TCC

TC

Control

TCC

TC

Control

TCC

TC

Control

TCC

TC

Control

DMS

Bonf erroni

Sidak

DMS

Bonf erroni

Sidak

Variable dependiente

acc ion conductas

compuls iv as

pensamiento

conductas obses iv as

Dif erencia

entre

medias (I-J) Error t íp. Signif icación Límite inf erior

Límite

superior

Interv alo de conf ianza al

95%.

Basado en las medias observ adas.

La dif erencia de medias es signif icativ a al niv el .05.*.

Page 24: Manova mb

Aquí hemos llevado a cabo un contraste simple en el que comparamos los grupos de

tratamiento frente a control (3) en cada variable dependiente… este tipo de contraste se

pide en el SPSS en contrastes…

¿qué podemos concluir de esta tabla?..

Resultados del contras te (m atriz K)

-.100 -1.600

0 0

-.100 -1.600

.615 .951

.872 .104

-1.361 -3.551

1.161 .351

-1.300 .200

0 0

-1.300 .200

.615 .951

.044 .835

-2.561 -1.751

-.039 2.151

Estimación del contraste

Valor hipotetizado

Diferencia (Estimado - Hipotetizado)

Error típ.

Significac ión

Límite inferior

Límite superior

Intervalo de confianza al

95 % para la diferencia

Estimación del contraste

Valor hipotetizado

Diferencia (Estimado - Hipotetizado)

Error típ.

Significac ión

Límite inferior

Límite superior

Intervalo de confianza al

95 % para la diferencia

Contraste simple groupa

Nivel 1 - Nivel 3

Nivel 2 - Nivel 3

acc ion

conductas

compulsivas

pensamiento

conductas

obsesivas

Variable dependiente

Categoría de referencia = 3a.

Page 25: Manova mb

A practicar…