Cluster ANOSIM Bioenv

20
Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis

description

Tecnicas estadistivas multivariandes de la visualizacion al contraste de hipostesis

Transcript of Cluster ANOSIM Bioenv

Page 1: Cluster ANOSIM Bioenv

Técnicas estadísticas multivariantes: de la visualización al contraste de hipótesis

Page 2: Cluster ANOSIM Bioenv

Técnicas multivariantes:

muestras

espe

cies

matriz triangular de similitudes

aaa

bb

b

cc

c

ordenación

2

clasificación

a

a

a

b

b

cOrdenación y clasificación Ordenación y clasificación son formas de explorar/visualizar las relaciones de similitud entre muestras/tratamientos/factores

Page 3: Cluster ANOSIM Bioenv

3

Clasificación (análisis clúster)

Page 4: Cluster ANOSIM Bioenv

4

Clasificación (análisis clúster)

Técnicas para agrupar/separar grupos de objetos (e.g. muestras/especies) “en paquetes” basadas en su similitud (se basan en índices de similitud)

Genera en dendograma basado en una clasificación generalmente jerárquica: pequeños grupos de objetos (p.e. muestras/especies) dentro de grupos mayores y estos a su vez dentro de grupos mayores; y aglomerativa: se parte de tantas clases como objetos tengamos que clasificar y en pasos sucesivos vamos obteniendo clases de objetos similares

Page 5: Cluster ANOSIM Bioenv

5Diseño experimental y análisis estadístico: su aplicación en biología marina

Clasificación: un ejemplo

Page 6: Cluster ANOSIM Bioenv

"The availability of computer packages of classification techniques has led to the waste of more valuable scientific time than any other statistical innovation (with the possible exception of multiple regression techniques)." Cormack (1971) A review of classification. Journal of the Royal Statistical Society A 134, 321-367.

No sólo depende del tipo de distancia que seleccionemos, sino tb de las muchos estrategias para construir el dendograma. Y hay muchísimas¡

Clasificación: ¿merece la pena?

Diseño experimental y análisis estadístico: su aplicación en biología marina

Escepticismo respecto a la clasificación

Page 7: Cluster ANOSIM Bioenv

D C B A B A D C

Un dendograma pueden ser re-estructurado alrededor de cualquier intersección/nodo y objetos que aparecían distantes pueden aparecer cerca

Diseño experimental y análisis estadístico: su aplicación en biología marina

En estudios de ecología la mejor clasificación es una ordenación

Page 8: Cluster ANOSIM Bioenv

8

PCA/MDS/cluster son técnicas de visualización de patrones: no permite contraste de hipótesis

Necesidad de un test para contrastar las diferencias entre grupos que acompañe a una técnica de visualización de patrones

Rutina ANOSIM

Page 9: Cluster ANOSIM Bioenv

Ho = tratamientos son igualesHa = tratamientos NO son iguales

Tratamiento 1Tratamiento 2

9

Por ejemplo, ¿diferencias entre tratamientos 1 y 2?

Page 10: Cluster ANOSIM Bioenv

Ho = verdad

variabilidad entre tratamientos = o < variabilidad dentro de cada tratamiento

10

Page 11: Cluster ANOSIM Bioenv

variabilidad dentro de tratamientos < variabilidad entre tratamientos

11

Ha = verdad

Diseño experimental y análisis estadístico: su aplicación en biología marina

Page 12: Cluster ANOSIM Bioenv

ANOSIM

12

Page 13: Cluster ANOSIM Bioenv

13

ANOSIM

Técnica de contraste hipotético que proporciona un p-valor para contrastar la hipótesis:

Ho = tratamientos son iguales

Ha = tratamientos NO son iguales

Podemos ejecutar tantos contraste como pares de niveles queramos contrastar. Obtengo un estadístico (R) y lo importante: un p-valor asociado

Page 14: Cluster ANOSIM Bioenv

Rutina BIOENV (regresión múltiple multivariante)

14

Page 15: Cluster ANOSIM Bioenv

15

BIOENV

Análisis directo de gradientes: explicar la variabilidad de la matriz Y (biótica) en términos de variables predictoras “Xs” (abiótica)

A B réplica sp 1 sp 2 sp 3 sp 4 sp 5 sp n

A1 B1 1 … … … … … …

A1 B1 2 … … … … … …

A1 B2 1 … … … … … …

A1 B2 2 … … … … … …

A1 B3 1 … … … … … …

A1 B3 1 … … … … … …

A2 B1 1 … … … … … …

A2 B1 2 … … … … … …

A2 B2 1 … … … … … …

A2 B2 2 … … … … … …

A2 B3 1 … … … … … …

A2 B3 2 … … … … … …

A B réplica V 1 V 2 V 3 V 4

A1 B1 1 … … … …

A1 B1 2 … … … …

A1 B2 1 … … … …

A1 B2 2 … … … …

A1 B3 1 … … … …

A1 B3 1 … … … …

A2 B1 1 … … … …

A2 B1 2 … … … …

A2 B2 1 … … … …

A2 B2 2 … … … …

A2 B3 1 … … … …

A2 B3 2 … … … …

Y (matriz biótica) X (matriz abiótica)

Page 16: Cluster ANOSIM Bioenv

16

Problema: colinealidad; muchas X están correlacionadas. Por ello, uso RDA siempre en combinación la regresión multivariante múltiple para seleccionar las X apropiadas (rutina/freeware DISTLM que veremos en las prácticas) = buscar el modelo con mayor “parsimonia”

RDA: cómo actúa

Page 17: Cluster ANOSIM Bioenv

Diseño experimental y análisis estadístico: su aplicación en biología marina17

Técnicas multivariantes: resumiendo

Page 18: Cluster ANOSIM Bioenv

Variables (muestras)

Ob

jeto

s (e

spec

ies)

matriz triangular de similitudes

aaa

bb

b

cc

c

ordenación

18

clasificación

a

a

a

b

b

c

Page 19: Cluster ANOSIM Bioenv

19

Similitudes Objetivo/casos tipo

PCA Distancia euclidiana(asumo relación lineal entre variables y ejes)

Visualización de diferencias entre muestras/tratamientos usando variables abióticas/ambientales. Puedo saber el % de

variabilidad explicada por cada eje (componente)

nm-MDS

Cualesquiera (no asumo relación

lineal); trabajo con rangos

Visualización de diferencias entre muestras/tratamientos usando matrices bióticas: respuestas a nivel de comunidad

(datos se “portan muy mal”)

Ordenación: casos tipo y sus diferencias

Page 20: Cluster ANOSIM Bioenv

20

PCA, nm-MDS, análisis indirecto de gradientes

BIOENV – análisis directo de gradientes

Test = ANOSIM

Test = reg. múltiple Multivariante

Ordenación: casos tipo y sus tests de contraste