Escalamiento Multidimensional No-Métrico

Click here to load reader

  • date post

    25-Jan-2016
  • Category

    Documents

  • view

    98
  • download

    1

Embed Size (px)

description

Escalamiento Multidimensional No-Métrico. Capítulo 16 de McCune y Grace 2002. Rasgos generales. Busca las mejores posiciones de n objetos en un espacio de k dimensiones que se asemejen más a las posiciones de los objetos según sus distancias originales. Es iterativo - PowerPoint PPT Presentation

Transcript of Escalamiento Multidimensional No-Métrico

  • Escalamiento Multidimensional No-MtricoCaptulo 16 de McCune y Grace 2002

  • Rasgos generalesBusca las mejores posiciones de n objetos en un espacio de k dimensiones que se asemejen ms a las posiciones de los objetos segn sus distancias originales.Es iterativoNo supone que existan relaciones lineales entre variablesUtiliza el orden de distancias (ranked distances) como criterio principal.

  • Rasgos generales (continuacin)Permite utilizar cualquier medida de distancia o relativizacin. (Otros algoritmos (e.g., PCA) solo aceptan una medida de distancia).Cada corrida puede resultar en ordenaciones diferentes, si se comienza el proceso desde un arreglo distinto.Requiere muchos ms recursos de computacin que otros algoritmos, particularmente con muchos datos.Es posible que encuentre una solucin subptima (pero hay formas de evitarlo).

  • Procesamiento1. Calcular matriz de distancias ecolgicas entre unidades de muestra (disimilaridades)2. Asignar unidades en una configuracin inicial de k dimensiones3. Calcular la matriz D de distancias Euclidianas en el espacio de k dimensiones4. Ordenar los elementos de en orden ascendente

  • Procesamiento (continuacin)5. Ordenar los elementos de D en el mismo orden de 6. Calcular (matriz en la que se sustituyen las distancias no-monotnicas d con distancias monotnicas d)7. Calcular la tensin S (stress) del arreglo inicial a base de la suma de las diferencias (d-d)2.

  • Procesamiento (continuacin)8. Minimizar la tensin S mediante la modificacin del arreglo de unidades en el espacio de k dimensiones. El parmetro (initial step length) indica la velocidad inicial de modificacin de tensin.9. Iterar (regresar al paso 3) hasta que:Se completen un nmero mximo de iteracionesO se obtenga cierto nivel de estabilidad

  • Analoga Paisaje con varias lomas y valles de distintas profundidadesNMS intenta encontrar el valle ms profundo (mnimo global)En ocasiones encuentra un valle menos profundo (mnimo local)Los mnimos locales pueden evitarse:Haciendo varias corridas con arreglos iniciales al azarCorriendo NMS con arreglo inicial producido por otro mtodo de ordenacin

  • La mejor solucinSeleccionar un nmero de dimensiones k apropiadoBuscar tensin S bajaUtilizar una prueba de Monte CarloEvitar soluciones inestables

  • Nmero de dimensionesGraficar tensin final vs kGrfica screeSeleccionar nmero de ejes ms all de los cuales hay poca reduccin en tensin

  • Buscar tensin bajaRegla general:

  • Prueba de Monte CarloPrueba de significacia de un arreglo de muestras en espacio de ordenacinSe rearreglan las especies de la matriz de datos un nmero x de veces al azarPrecaucin con:Rezagados muy influyentesEspecies super abundantesCon pocas muestras la prueba puede ser conservadoraSi la data tiene muchos ceros puede haber problema con ciertas medidas de distancia

  • Evitar soluciones inestablesGraficar tensin vs iteraciones

  • Qu informar?Medida de distanciaAlgoritmo utilizadoArreglo inicial# de corridas con datos realesCmo mide dimensionalidadCuntas dimensiones en la solucin finalTensin de la solucin final

  • Qu informar?# de corridas con datos aleatoriosResultados de Monte CarloCuantas iteraciones para la solucin finalComo se evalu la estabilidadProporcin de varianza representada por cada ejeAyudas para interpretacin

  • Matriz de distancias originales

    s1s2s3s4s20.212s30.5940.549s40.5900.4400.594s50.8730.6430.6810.587

  • Matriz D

  • Elementos dematriz Elementos dematriz ordenados

  • Matriz Matriz D

  • Chart3

    0.212

    0.359

    0.44

    0.549

    0.587

    0.594

    0.594

    0.643

    0.681

    0.873

    1

    2

    3

    4

    5

    distancias en ordenacion

    distancias originales

    Sheet2

    s1s2s3s4

    s20.212

    s30.5940.549

    s40.5900.4400.594

    s50.8730.6430.6810.587

    xy

    s15512

    s23215

    s31514

    s40124

    s52142

    s1s2s3s4

    s23.6

    s343.6

    s46.43.24.1

    s551.44.12

    s1s20.212s1s23.6s1s20.2123.6s1s23.6

    s1s30.594s1s34s1s40.3596.4s1s34

    s1s40.359s1s46.4s2s40.443.2s1s46.4

    s1s50.873s1s55s2s30.5493.6s1s55

    s2s30.549s2s33.6s4s50.5872s2s33.6

    s2s40.44s2s43.2s1s30.5944s2s43.2

    s2s50.643s2s51.4s3s40.5944.1s2s51.4

    s3s40.594s3s44.1s2s50.6431.4s3s44.1

    s3s50.681s3s54.1s3s50.6814.1s3s54.1

    s4s50.587s4s52s1s50.8735s4s52

    Sheet2

    s1

    s3

    s5

    s4

    s2

    x

    y

    Sheet1

    1

    2

    3

    4

    5

    distancias en ordenacion

    distancias originales

    distnms

    Stand01Stand02Stand03Stand04Stand05Stand06Stand07Stand08Stand09Stand10Stand11promedios

    Stand020.1880.438

    Stand030.5640.5280.588

    Stand040.5770.4380.5960.468

    Stand050.8580.7120.7400.5380.621

    Stand060.6700.5130.6570.2380.5150.510

    Stand070.1840.2200.5050.6280.8730.6380.531

    Stand080.6720.5050.6350.3810.5340.5000.6840.506

    Stand090.6200.4490.5790.2890.4550.3750.6350.1710.449

    Stand100.6440.4840.5300.3140.4110.3890.6070.2140.1880.442

    Stand110.7400.5590.5490.5540.3080.4460.6790.5650.5080.4720.557

    Stand120.1260.2280.5860.5910.8820.6730.1910.7030.6640.6050.7480.545

    Stand01Stand02Stand03Stand04Stand05Stand06Stand07Stand08Stand09Stand10Stand11promedios

    Stand010.531

    Stand020.1880.438

    Stand030.5640.5280.588

    Stand040.5770.4380.5960.468

    Stand050.8580.7120.7400.5380.621

    Stand060.6700.5130.6570.2380.5150.510

    Stand070.1840.2200.5050.6280.8730.6380.531

    Stand080.6720.5050.6350.3810.5340.5000.6840.506

    Stand090.6200.4490.5790.2890.4550.3750.6350.1710.449

    Stand100.6440.4840.5300.3140.4110.3890.6070.2140.1880.442

    Stand110.7400.5590.5490.5540.3080.4460.6790.5650.5080.4720.557

    Stand120.1260.2280.5860.5910.8820.6730.1910.7030.6640.6050.7480.545