Clustering sponge marines usando red neuronal de Kohonen

20
UNIVERSIDAD DE SANTIAGO DE CHILE DOCTORADO EN CIENCIAS DE LA INGENIERÍA MENCIÓN INFORMÁTICA INGENIERÍA NEURONAL TEMA: Agrupamiento de esponjas marinas del atlántico mediterráneo (Demospongiae Porifera) basado en red neuronal de Kohonen ESTUDIANTES: Roberth Abel Alcívar Cevallos Jorge Antonio Párraga Álava PROFESOR: Dr. Gonzalo Acuña Leiva 19 de Diciembre de 2013

Transcript of Clustering sponge marines usando red neuronal de Kohonen

Page 1: Clustering sponge marines usando red neuronal de Kohonen

UNIVERSIDAD DE SANTIAGO DE CHILE

DOCTORADO EN CIENCIAS DE LA INGENIERÍA MENCIÓN

INFORMÁTICA

INGENIERÍA NEURONAL

TEMA:

Agrupamiento de esponjas marinas del atlántico mediterráneo

(Demospongiae Porifera) basado en red neuronal de Kohonen

ESTUDIANTES:

Roberth Abel Alcívar Cevallos

Jorge Antonio Párraga Álava

PROFESOR:

Dr. Gonzalo Acuña Leiva

19 de Diciembre de 2013

Page 2: Clustering sponge marines usando red neuronal de Kohonen

Índice de contenidos

1. Motivación ............................................................................................................................................ 1

2. Objetivos ............................................................................................................................................... 1

2.1. Objetivo General ............................................................................................................................... 1

2.2. Objetivos Específicos ........................................................................................................................ 1

3. Antecedentes ......................................................................................................................................... 2

4. Estado del arte ....................................................................................................................................... 4

5. Metodología usada ................................................................................................................................ 5

5.1. Preprocesamiento de los datos .......................................................................................................... 5

5.2. Diseño de la arquitectura de la red .................................................................................................... 7

5.3. Entrenamiento de la red .................................................................................................................... 8

5.4. Agrupamiento ................................................................................................................................... 9

6. Resultados ............................................................................................................................................. 9

7. Discusión............................................................................................................................................. 15

8. Conclusiones ....................................................................................................................................... 15

9. Referencias .......................................................................................................................................... 16

10. Anexos ............................................................................................................................................ 17

Índice de ilustraciones, tablas y figuras

Ilustración 1. Arquitectura SOM. (Entrada 0 porque la red aún no ha sido configurada con datos) ............ 7

Ilustración 2. Topologia Hexagonal SOM. ................................................................................................... 7

Ilustración 3. Caracteristicas en forma numerica de las 55 esponjas marinas del dataset .......................... 10

Ilustración 4. Posición de patrones iniciales y deseados. Dimensiones (4x4) (6x6) ................................... 11

Ilustración 5. Posición de patrones iniciales y deseados. Dimensiones (8x8) (10x10) ............................... 11

Ilustración 6. Mapa de hits. Dimensiones (4x4) (6x6). ............................................................................... 12

Ilustración 7. Mapa de hits. Dimensiones (8x8) (10x10). ........................................................................... 12

Ilustración 8. Mapa de distancias del vecindario. Dimensiones (4x4) (6x6) .............................................. 13

Ilustración 9. Mapa de distancias del vecindario. Dimensiones (8x8) (10x10) .......................................... 13

Ilustración 10. Mapa de ubicación de los pesos de las neuronas. Dimensiones (4x4) (6x6) ...................... 14

Ilustración 11. Mapa de ubicación de los pesos de las neuronas. Dimensiones (8x8) (10x10) .................. 14

Tabla 1. Parte de las instancias que presentan valores faltantes en alguno de sus atributos ......................... 6

Tabla 2. Parámetros del mapa autoorganizativo de Kohonen ....................................................................... 8

Tabla 3. Posibles valores de los atributos del dataset con su valor numérico representativo ..................... 10

Figura 1. Topología de red neuronal de Kohonen......................................................................................... 3

Page 3: Clustering sponge marines usando red neuronal de Kohonen

1

1. Motivación

Las esponjas marinas tienen una apariencia y un modo de vida que hasta 1825 no

fueron reconocidas como animales. Son seres vivos muy primitivos que habitan sobre

todo en aguas someras sujetas al fondo o a objetos sumergidos. Una de sus

peculiaridades más notable es la estructura porosa de su cuerpo, por la que han

recibido el nombre de Poríferos. [1]

La clasificación de las esponjas depende fundamentalmente de las particularidades

de su sistema esquelético [2], separar en grupos a estos seres vivos no es una tarea

nada fácil, pues características como: forma, tamaño o profundidad del poro; hacen

muy dificultosa esta actividad, así, en la actualidad se emplean algoritmos

matemáticos soportados en software que trabajan con técnicas de inteligencia

artificial conocidas como redes neuronales artificiales (RNA); debido a ello, en este

trabajo se pretende usar las RNA para llevar a cabo el agrupamiento de las esponjas

marinas del atlántico mediterráneo (Demospongiae Porifera).

2. Objetivos

2.1. Objetivo General

Crear una red neuronal artificial de Kohonen para el agrupamiento de esponjas

marinas del atlántico-mediterráneo según sus características.

2.2. Objetivos Específicos

Realizar el preprocesamiento o “limpieza” de los datos disponibles en el

dataset del experimento.

Diseñar la arquitectura que usarán la red neuronal artificial de Kohonen.

Page 4: Clustering sponge marines usando red neuronal de Kohonen

2

Ajustar el valor de los pesos de la red usando el conjunto de entrenamiento y

a través del algoritmo no supervisado Batch.

Verificar el correcto funcionamiento de la red neuronal mediante comparación

de varios tipos de mapas propios de la red Kohonen.

3. Antecedentes

En el mundo actual la información se ha convertido en uno de los recursos más

valiosos dentro de cualquier actividad humana. La aparición de grandes conjuntos de

datos es cada vez más frecuente como consecuencia del acelerado desarrollo

informático, en especial de la Internet (YouTube, Redes Sociales, Google, etc.). De

igual manera, la complejidad de los datos se va incrementando: desde trabajar con

datos simples como números o cadenas de texto hasta problemas que involucran

datos complejos como imágenes, vídeos o cadenas de ADN. De modo que surge la

necesidad de técnicas cada vez más eficientes para procesar los datos, detectar

interrelaciones y agrupamientos entre ellos e incluso generar nuevo conocimiento. [3]

El agrupamiento de datos es una tarea de análisis exploratorio que se refiere a la

clasificación de patrones de una forma no supervisada, formando grupos en base a

las relaciones no perceptibles a simple vista, con el objetivo de poder descubrir una

estructura subyacente. La utilidad en el análisis exploratorio de datos está

fuertemente demostrada por su uso en diversos contextos y disciplinas como la

recuperación de información, la minería de datos o la segmentación de imágenes

entre muchas otras. [4]

Los mapas auto-organizativos de Kohonen o Self-autorganizing map (SOM) es un

tipo especial de red neuronal que puede aprender de datos complejos,

multidimensionales y transformarlos en clúster visualmente descifrables. La teoría de

la red SOM está motivada en la observación de la operación del cerebro. Varias

impresiones sensoriales humanas se asignan neurológicamente en el cerebro de tal

Page 5: Clustering sponge marines usando red neuronal de Kohonen

3

manera que las relaciones espaciales o de otro tipo entre los estímulos corresponden

a las relaciones espaciales entre las neuronas organizadas en un mapa de dos

dimensiones. [5]

A diferencia de otros enfoques de redes neuronales, la red SOM realiza la formación

sin supervisión, es decir, durante el proceso de aprendizaje de las unidades de

procesamiento en la red ajustan sus pesos basado principalmente en las conexiones

de realimentación laterales. De las varias técnicas existentes para agrupamiento de

datos, los Mapas Auto-organizables de Kohonen vienen siendo ampliamente

utilizados en el agrupamiento de grandes conjuntos de datos, debido principalmente

a la poca dependencia al dominio del conocimiento y a los eficientes algoritmos de

aprendizaje disponibles. Estas estructuras resaltan por su capacidad de generar

mapas topológicos a través de una arquitectura paralela y distribuida. La Figura 1

muestra la arquitectura básica de los SOM, pudiéndose describir como un arreglo de

unidades cada una conectada con todos los patrones de entrada. [3]

Figura 1. Topología de red neuronal de Kohonen

Debido a estas ventajas las redes de Kohonen han sido usadas en varios estudios,

uno de ellos “Clustering Analysis aplications in matlab using Kohonen network” [6]

que ocupa este tipo de redes en la optimización de ubicación de centros de

distribución logrando que la distancia de un centro con otro sea la óptima. Los aportes

Page 6: Clustering sponge marines usando red neuronal de Kohonen

4

de esta investigación ayudan a entender los beneficios del uso de los mapas

autoorganizativos de Kohonen, objeto de estudio de este trabajo.

4. Estado del arte

En el trabajo “Red Neuronal Artificial ART2 para la agrupación de datos” [7] el autor

muestra la implementación de una red neuronal tipo resonancia adaptativa, ART2,

empleada para la agrupación de datos. Se compara la técnica implementada con el

algoritmo EM y los mapas autoorganizativos de Kohonen. En la investigación se

concluye que La red neuronal ART2 es una técnica viable para la agrupación de

datos, dada su alta efectividad; sin embargo, la configuración del parámetro de

vigilancia debe hacerse utilizando heurísticas o, en el peor de los casos, a través de

la experimentación. Por lo que una alternativa a ella es el uso de alguna red neuronal

con capacidad de autoorganización, aprendizaje no supervisado como lo es la red de

Kohonen.

Así mismo en “Teledetección Ambiental” [8] se explica la diferencia de los métodos

supervisados y no supervisados, destacándose lo siguiente:

Método Supervisado

El conocimiento supervisado parte de un cierto conocimiento de la zona de

estudio, adquirido por experiencia previa.

Maneja información de error o de control, esta información se emplea para

guiar al sistema.

Método no Supervisado

No implica ningún conocimiento del área de estudio.

Reajuste automático de los parámetros

Auto organización de la información

Por otro lado en el paper titulado “Identificación de patrones para la ordenación

urbanística mediante redes neuronales” [9] el autor descubre un heurístico de

Page 7: Clustering sponge marines usando red neuronal de Kohonen

5

conocimiento que se genera durante la determinación de la Ordenanza-red y lo pone

en práctica mediantes mapas autoorganizativos de Kohonen; a la vez destaca la

utilidad de los SOM para organizar y representar patrones de organización en las más

diversas disciplinas, pasando por trabajos de interpretación de sonidos, de lenguaje,

determinación de patrones para el diagnóstico precoz de enfermedades, o hasta el

descubrimiento de patrones ocultos en situaciones sociales.

Finalmente en el trabajo “Pattern Clustering via Ants Colony, Ward Method and

Kohonen Maps” [10] se utiliza el método Ward y mapas de Kohonen para el

agrupamiento de patrones usando tres conjuntos de datos distintos, de este modo los

autores comparan los resultados obtenidos notándose excelente rendimiento en

ambos casos.

5. Metodología usada

El conjunto de datos usado en este proyecto es: Sponge Marine, disponible en

http://archive.ics.uci.edu/ml/datasets.html, el mismo contiene un total de 76 instancias

y 45 atributos de características de esponjas marinas del atlántico mediterráneo

(Demospongiae Porifera). El proceso de agrupamiento de las esponjas marinas

mediante la red de Kohonen fue dividido en cuatro fases: Preprocesamiento de los

datos, Diseño de la arquitectura de la red, Entrenamiento de la red, Agrupamiento.

5.1. Preprocesamiento de los datos

Una vez que se contaba con el conjunto de datos se observó que el mismo tenia

extensión .data, por ello fue necesario convertirlo a formato .xlsx para poder

manipularlo con el programa Excel™. Luego, se realizó el análisis respectivo que

notando que 27 son de tipo no numéricos y nominales, 15 booleanos (si/no) y 3 tipo

numéricos (números naturales). (Anexo 1).

Page 8: Clustering sponge marines usando red neuronal de Kohonen

6

Al observar los datos, se evidenció la existencia de valores faltantes (aparecen con

signo ?) (tabla 1), por lo que se realizó la eliminación de las instancias que presentaran

al menos en un atributo este problema.

Tabla 1. Parte de las instancias que presentan valores faltantes en alguno de sus atributos

SIN_ESFERASTER MASIVO_IRREGULAR 0 NO OTROS

SIN_ESFERASTER INCRUSTANTE 0 NO ?

SIN_ESFERASTER INCRUSTANTE 1 SI OTROS

SIN_ESFERASTER INCRUSTANTE 0 NO ?

SIN_ESFERASTER DE_REVESTIMIENTO 0 NO ?

SIN_ESFERASTER DE_REVESTIMIENTO 0 NO OTROS

SIN_ESFERASTER DE_REVESTIMIENTO 0 NO OTROS

SIN_ESFERASTER MAZAS_PEDUNCULADAS_1 0 NO AMARILLO_PALIDO

Al contar con los datos “limpios”, las instancias se redujeron a 55, además fue

necesario hacer una conversión de los atributos que no eran de tipo numérico, así por

ejemplo el atributo cortex con valores posibles No/Si pasó a ser representado con

los valores 1/2 respectivamente. La conversión total se muestra en el Anexo 1.

Luego se procedió a visualizar los datos del dataset mediante el siguiente código:

[ndata, text, alldata] = xlsread('sponge.xlsx'); /Se lee el archivo del dataset en

formato .xlsx

encabezadoColumna=[text(1, 2:46)]; /Se obtiene los

encabezados de filas

y columna de los

datos. plot(ndata); /Grafico de los datos grid on; del conjunto de datos xLabel('Instancias'); yLabel('Valores'); Title('Esponjas Marinas del Atlántico Mediterráneo (Demospongiae

Porifera)'); legend(encabezadoColumna);

Page 9: Clustering sponge marines usando red neuronal de Kohonen

7

5.2. Diseño de la arquitectura de la red

Al contar con el conjunto de datos correctamente preprocesado, se diseñó la

arquitectura que tendría la red, en este caso no se divide el data set pues la cantidad

de instancias es reducida y, además cada instancia representa a una especie de

esponja marina, por lo que al dividir se estaría provocando la no aleatoriedad de los

datos. Luego, y sabiendo que el conjunto de datos es de 55 instancias, se determinó

que era adecuado un mapa autoorganizativo de 2-dimensiones (2 posibles

vecindarios para cada neurona) de 4x4 que permita un espacio adecuado para

agrupar a las 55 esponjas marinas. Se usó el código:

net = selforgmap([4 4];

view(net)

Y se obtuvo la arquitectura:

Ilustración 1. Arquitectura SOM. (Entrada 0 porque la red aún no ha sido configurada con datos)

De igual manera se decidió que la topología a usar sería la de rejilla hexagonal (con

lo cual las neuronas que no se encuentran en los bordes del mapa siempre tienen 6

neuronas vecinas con las cuales se conectan virtualmente) y distancia euclidiana.

Ilustración 2. Topologia Hexagonal SOM.

Page 10: Clustering sponge marines usando red neuronal de Kohonen

8

5.3. Entrenamiento de la red

Con la arquitectura de la red clara, se creó la red neuronal artificial de Kohonen con

la ayuda del paquete matemático MATLAB™. Se utilizó el comando selforgmap

(crea un mapa autoorganizativo) y se definieron los parámetros que se detallan en la

tabla 2, según lo planificado en la etapa de diseño.

Tabla 2. Parámetros del mapa autoorganizativo de Kohonen

Parámetro Valor

Dimensión Vector [4 4] (Luego se varió a [6 6] , [8 8]

[10 10])

Tamaño Inicial de la

vecindad 3=Valor por defecto de matlab

Topología Topología hexagonal

Función de Distancia Función de distancia euclidea

Así el código usado es el siguiente:

net = selforgmap([4 4],100,3,'hextop','dist');

Con la red creada, se procede a inicializar los pesos para visualizar los patrones del

clustering. Para el efecto se realizó lo siguiente:

net = configure(net,ds); plotsompos(net,ds); grid on; title('Inicialización: Posición de pesos SOM');

Finalmente se realiza el entrenamiento mediante la función trainbu que emula al

algoritmo de entrenamiento no supervisado Batch y que a la vez se usa por defecto

en matlab cuando se trabaja con mapas autoorganizativos de kohonen. Este

algoritmo entrena una red con pesos y bias basado en regla de aprendizaje con

actualizaciones por lote. Tambien se le indica a la red que debe trabajar hasta 500

épocas. Todo mediante el siguiente código:

[net,TR] = trainbu(net,ds); net.trainParam.epochs = 500;

Page 11: Clustering sponge marines usando red neuronal de Kohonen

9

En primer lugar, la red identifica la neurona ganadora para cada vector de entrada.

Cada vector de peso entonces se mueve a la posición media de todos los vectores

de entrada para los que es una ganadora o para el que está en la vecindad de una

ganadora. La distancia que define el tamaño de la vecindad se altera durante el

entrenamiento a través de dos fases: Ordenamiento, en donde la distancia de la

vecindad comienza con 3, y con una etapa de repeticion de 100 o hasta que las redes

hayan alcanzado el orden y distancia adecuada según la topologia hexagonal. Y

Afinación, una vez que el tamaño de la vecindad ha disminuido por debajo de 1, se

logra que sólo la neurona ganadora aprenda de cada ejemplo o patrón.

5.4. Agrupamiento

Una vez que se ha realizado el proceso de aprendizaje de la red, se procede a generar

los mapas que representan el proceso de clustering, en cada uno de ellos se resaltan

situaciones como: neuronas ganadoras, cantidad de victorias de cada neurona,

distancias entre neuronas, entre otras. Para el efecto basto unicamente el siguiente

código:

%Mapa de distancias de vecindario plotsomnd(net,ds); grid on; title('Mapa de distancias del vecindario'); %Mapa de distancias entre neuronas plotsomplanes(net) grid on; title('Mapa de distancias entre neuronas'); %Mapa de neuronas ganadoras grid on; title('Mapa de neuronas ganadoras'); plotsomhits(net,ds)

%Mapa de mapa de ubicación de los pesos de las neuronas grid on; title('Mapa de neuronas ganadoras'); plotsompos(net,ds)

6. Resultados

La etapa de preprocesamiento permitió realizar la conversión de valores de atributos

que no eran numéricos, como se observa parcialmente en la tabla 3, y completamente

en anexo 1.

Page 12: Clustering sponge marines usando red neuronal de Kohonen

10

Tabla 3. Posibles valores de los atributos del dataset con su valor numérico representativo

ATRIBUTOS RANGOS Y POSIBLES VALORES VALOR REPRESENTATIVO

CAPAS_DEL_CORTEX

1_CAPA 1

2_CAPAS 2

3_CAPAS 3

SIN_CORTEX 4

CORTEX NO 1

SI 2

GROSOR_DEL_CORTEX

0

1

2

3

4

HACES_DE_ESPICULAS_PRINCIPALES_EN_POMPON_EN_EL_CORTEX

NO 1

SI 2

Los datos “limpios” fueron visualizados para tener una idea de como se comportaban

las entradas (caracteristicas de cada esponja marina), todo ello se muestra en la

ilustracion siguiente:

Ilustración 3. Caracteristicas en forma numerica de las 55 esponjas marinas del dataset

Se estableció la arquitectura en 55 Ne x 16 Ns (y luego se fue variando a 36 Ns, 64

Ns, 100 Ns) (Ilustración 4 y 5), la topologia tipo hexagonal y distancia euclidea entre

neuronas. También se logró observar como los patrones (puntos verdes) se

organizan espacio topológico y como el proceso de inicializacion ubicó a los 16, 36,

64, 100 grupos deseados (puntos oscuros) según el caso.

Page 13: Clustering sponge marines usando red neuronal de Kohonen

11

Ilustración 4. Posición de patrones iniciales y deseados. Dimensiones (4x4) (6x6)

Ilustración 5. Posición de patrones iniciales y deseados. Dimensiones (8x8) (10x10)

Se realizó el grupamiento de las esponjas marinas obteniendo los mapas de hits

(Ilustración 6 y 7), mapa de distancias del vecindario (Ilustración 8 y 9) , mapa de

posición de pesos (Ilustración 10 y 11), todo esto gracias al algoritmo de

entrenamiento no supervisado Batch Unsupervised.

Page 14: Clustering sponge marines usando red neuronal de Kohonen

12

Ilustración 6. Mapa de hits. Dimensiones (4x4) (6x6).

Ilustración 7. Mapa de hits. Dimensiones (8x8) (10x10).

En la ilustración 6 y 7 se resaltan las neuronas ganadoras, donde el número que

está dentro de cada neurona indica la cantidad de patrones de entrada que cada

una de ellas representa, es decir, la cantidad de victorias de cada neurona. Cuando

las neuronas no tienen valor, corresponden a neuronas que no ganaron y en

consecuencia no representan a ningún patrón dentro del proceso de clustering.

Page 15: Clustering sponge marines usando red neuronal de Kohonen

13

Ilustración 8. Mapa de distancias del vecindario. Dimensiones (4x4) (6x6)

Ilustración 9. Mapa de distancias del vecindario. Dimensiones (8x8) (10x10)

En la ilustración 8 y 9, se visualiza qué tan diferente es una neurona de la otra; los

colores oscuros indican una gran diferencia mientras que los colores claros indican

similitud entre neuronas y por tanto entre patrones. Este mapa es el más indicado

para visualizar el número de grupos en los que se clasifica la información.

Page 16: Clustering sponge marines usando red neuronal de Kohonen

14

Ilustración 10. Mapa de ubicación de los pesos de las neuronas. Dimensiones (4x4) (6x6)

Ilustración 11. Mapa de ubicación de los pesos de las neuronas. Dimensiones (8x8) (10x10)

En la ilustración 10 y 11, se muestra el mapa de ubicación de los pesos de las

neuronas, en el, es posible observar como las neuronas se organizan ya no en el

espacio topológico sino en el espacio real de la información para representar

fielmente los patrones. Se observan los patrones de color verde en el fondo y las

neuronas de color gris encima.

Page 17: Clustering sponge marines usando red neuronal de Kohonen

15

7. Discusión

El uso de la red de Kohonen en actualidad es variado, un estudio de Reyes, M. et al.

(2008) las aplica para localización y accesibilidad de revistas cientificas en bibliotecas

universitarias, en este se aprovecha de la capacidad de agrupamiento para realizar

busquedas en base a citas bibliográficas, sin embargo difiere de nuestro trabajo pues

aplica la ley de bratford para delimitar las zonas de cada clustering [11]. Por otra parte

un estudio de Fernández, R. et al. (2008) aplicó los mapas de kohonen para el control

de movimiento de un robot [12], para analizar los movimientos de las ruedas del

mismo y gracias a esto fue posible reducir la cantidad de parámetros necesarios para

la detección de obstáculos, situación un poco similar a nuestro trabajo, pues se realizó

el clustering considerando varias dimensiones (salidas) del mapa topólogico. Estos

estudios hacen notar claramente la importancia del trabajo realizado, pues se han

aplicado muchos conceptos usados a nivel mundial por otros autores, a la vez que

se han aprovechado algunas de las ventajas que presentan los mapas

autoorganizativos de Kohonen y aplicados a un proceso tan arduo como el

agrupamiento de esponjas marinas del atlántico mediterráneo según sus

caracteristicas físicas.

8. Conclusiones

En este trabajo se demostró empíricamente que es factible utilizar los mapas

autoorganizativos de Kohonen para el clustering de esponjas marinas del atlántico

mediterráneo (Demospongiae Porifera) mediante un proceso de aprendizaje, que

comenzó a mostrar signos satisfactorios cuando la rejilla hexagonal del mapa tiene

una dimensión de 6x6, generando un cluster ganador de 9 especies de esponjas y

cluster mas pequeños de 1 y 2 especies. El máximo resultado de aprendizaje

alcanzado se da con la rejilla de dimensión 10x10, en donde el mayor cluster tiene 3

especies de esponjas y el resto apenas en cluster con 1 sola esponja; y cuyos

vectores de peso “calzan” perfectamente con los patrones iniciales, situaciones que

evidencian la capacidad de los mapas de kohonen para procesos de clustering.

Page 18: Clustering sponge marines usando red neuronal de Kohonen

16

9. Referencias

[1] J. Bejar and U. Cortes, "Sponges Marines," 1998. [Online]. Available:

http://archive.ics.uci.edu/ml/datasets/Sponge.

[2] A. Figueras, "Esponjas Marinas," 2009. [Online]. Available:

http://www.madrimasd.org/blogs/ciencia_marina/2009/03/31/115600.

[3] C. Bedregal, "Agrupamiento de Datos utilizando técnicas MAM-SOM," 2009.

[4] A. Jain, R. Duin and J. Mao, "Statistical pattern recognition: A review.," IEEE Trans.

Pattern Anual, vol. 22, no. 1, pp. 4-37, 2000.

[5] M. Kiang, "Extending the Kohonen self-organizing map networks for clustering analysis,"

Computational Statics & Data Analysis, vol. 38, pp. 161-180, 2001.

[6] S. Kajan, I. Sekaj and M. Latjman, "Clustering Analysis aplications in matlab using

Kohonen network," Stuba Journal, vol. 21, no. 2, pp. 1-8, 2009.

[7] J. Rodríguez, "Red Neuronal Artificial ART2 para la agrupación de datos," Ingeniería y

Tecnología.Revista Científica, vol. 1, no. 9, pp. 261-276.

[8] E. Chuvieco, Teledetección Ambiental, Editorial Ariel, 2002.

[9] F. Abarca, "Identificación de patrones para la ordenación urbanística mediante redes

neuronales," Serie Geográfica, vol. 17, pp. 45-60, 2011.

[10] R. Villwock, M. Arns and P. Siqueira, "Pattern Clustering via Ants Colony, Ward Method

and Kohonen," IJCSNS International Journal of Computer Science and Network

Security, vol. 12, no. 6, pp. 81-93, 2012.

[11] M. Reyes, V. Guerrero and F. Zapico, "Uso del algoritmo de Kohonen aplicado al estudio

y localización de revistas científicas en bibliotecas universitarias," International Society

for Knowledge Organization, vol. 5, no. 2, pp. 23-50, 2008.

[12] R. Fernández, O. Sánchez and D. Bendersky, "Control de movimiento de un robot

usando mapas autoorganizativos de Kohonen," in V Jornadas Argentinas de Robótica,

Bahía Blanca, 2008.

[13] F. Acquaticci, "Detección de complejos QRS mediante redes neuronales," Ingeniería

biomédica, vol. 2, no. 4, pp. 109-119, 2008.

[14] R. Florez and J. Fernández, Las redes neuronales artificiales. Fundamentos teóricas y

aplicaciones prácticas., 2008.

Page 19: Clustering sponge marines usando red neuronal de Kohonen

17

10. Anexos Anexo 1. Atributos con sus respectivos posibles valores

N° GRUPO ATRIBUTOS RANGOS Y POSIBLES VALORES VALOR REPRESENTATIVO

1

A

CAPAS_DEL_CORTEX

1_CAPA 1

2_CAPAS 2

3_CAPAS 3

SIN_CORTEX 4

2 CAPA_INTERNA_DEL_CORTEX

BANDAS_DE_ESPICULAS_CRUZADAS 1

MICROSCLERAS 2

PERPENDICULAR 3

SIN_CAPA_INTERNA_DEL_CORTEX 4

TANGENCIAL 5

TANGENCIAL_Y_PERPENDICULAR 6

3 CORTEX NO 1

SI 2

4 CORTEX_FIBROSO

NO 1

SI 2

SIN_CORTEX 3

5 CORTEX_SOLO_DE_ESPICULAS_TANGENCIALES

NO 1

SI 2

SIN_CORTEX 3

6 CUERPOS_EXTRANOS_EN_EL_CORTEX

NO 1

SI 2

SIN_CORTEX 3

7 GROSOR_DEL_CORTEX

0

1

2

3

4

8 HACES_DE_ESPICULAS_PRINCIPALES_EN_POMPON_EN_EL_CORTEX NO 1

SI 2

9 TILOSTILOS_ADICIONALES_COANOSOMA

ECTOSOMICOS_DISPERSOS 1

ECTOSOMICOS_EN_RAMILLETES 2

INTERMEDIARIOS 3

INTERMEDIARIOS_Y_ECTOSOMICOS 4

SIN_TILOSTILOS_ADICIONALES 5

10 B NUMERO_DE_TIPOS_DE_MEGASCLERAS

1_TIPO 1

2_TIPOS 2

3_TIPOS 3

11

C

TIPO_ESPICULA_PRINCIPAL_DIACTINA_TUBERCULADA NO 1

SI 2

12 TIPO_ESPICULA_PRINCIPAL_ESTILO NO 1

SI 2

13 TIPO_ESPICULA_PRINCIPAL_ESTILOS_2_TAMANOS NO 1

SI 2

14 TIPO_ESPICULA_PRINCIPAL_ESTILO_TILOSTILO NO 1

SI 2

15 TIPO_ESPICULA_PRINCIPAL_ESTRONGILOXA NO 1

SI 2

16 TIPO_ESPICULA_PRINCIPAL_OXAS NO 1

SI 2

17 TIPO_ESPICULA_PRINCIPAL_TILOSTILO NO 1

SI 2

18

D

ESPICULA_PRINCIPAL_ESTILO

FUSIFORME 1

NORMAL 2

POLITILOTA 3

SIN_ESPICULA_PRINCIPAL_ESTILO 4

19 ESPICULA_PRINCIPAL_TILOSTILO

FLEXUOSA 1

FUSIFORME 2

NORMAL 3

POLITILOTA 4

SIN_ESPICULA_PRINCIPAL_TILOSTILO_ 5

20 FORMA_BASE_TILOSTILO_PRINCIPAL

POMO 1

SIN_TILOSTILOS 2

SUBESFERICA_ALARGADA_OVOIDE 3

TRILOBULADA 4

21

E

DISPOSICION_MEGASCLERAS_ECTOSOMICAS_EN_EL_ECTOSOMA

EMPALIZADA 1

RAMILLETES 2

SIN_MEGASCLERAS_ECTOSOMICAS 3

TANGENCIALES 4

22 FORMA_BASE_TILOSTILO_ECTOSOMICO

SIN_TILOSTILO_ECTOSOMICO 1

SUBESFERICA_ALARGADA_OVOIDE 2

TRILOBULADA_CON_VESICULA_AXIAL 3

23 FORMA_MEGASCLERA_ECTOSOMICA CURVADA 1

Page 20: Clustering sponge marines usando red neuronal de Kohonen

18

RECTA_FUSIFORME 2

RECTA_NO_FUSIFORME 3

SIN_MEGASCLERA_ECTOSOMICA 4

24 TIPO_MEGASCLERA_ECTOSOMICA

ESTILO 1

ESTILO_TILOSTILO 2

OXAS_ESTRONGILOXAS 3

SIN_MEGASCLERA_ECTOSOMICA 4

TILOSTILO 5

25 F TIPO_DE_EXOSTILO

ANATRIENAS 1

CLADOTILOSTILOS 2

ESFEROTILOS 3

SIN_EXOSTILOS 4

TILOSTILOS_ESPINOSOS_EN_LA_PUNTA 5

TILOSTILO_LISO 6

31

J

ASTER NO 1

SI 2

32 DIAMETRO_ESFERASTER

|10_12| 1

|20_25| 2

|27_44| 3

|40_110| 4

|5_6_Y_15_35| 5

SIN_ESFERASTER 6

33 TIPO_DE_ASTER

ANFIASTER 1

DIPLASTER 2

ESFERASTER 3

ESPIRASTER 4

QUIASTER 5

QUIASTER_Y_ESFERASTER 6

SIN_ASTER 7

34 TIPO_DE_DIPLASTER

CON_ACTINAS_COMPLEJAS 1

CON_ACTINAS_SIMPLES 2

SIN_DIPLASTERES 3

35 TIPO_DE_ESFERASTER

OXIESFERASTER 1

OXIESFERASTER_Y_TILOESFERASTER 2

SIN_ESFERASTER 3

36 K FORMA_FINAL

DE_CONO_INVERTIDO 1

DE_REVESTIMIENTO 2

GLOBULOSA 3

HEMISFERICA 4

INCRUSTANTE 5

MASIVO_IRREGULAR 6

MAZAS_PEDUNCULADAS_1/PEDUNCULO 7

MAZAS_PEDUNCULADAS_VARIAS/PEDUNCULO 8

RAMIFICADA 9

37

L

NUMERO_DE_PAPILAS

0

1

2

3

4

38 PAPILAS NO 1

SI 2

39 M COLOR

AMARILLO_PALIDO 1

AZUL_O_ANARANJADO_INTENSOS 2

OTROS 3

40 N SUPERFICIE

ATERCIOPELADA 1

CON_AREAS_POLIGONALES_ABULTADAS 2

FRANJA_BASAL_DE_ESPICULAS_EN_FLECO 3

HISPIDEZ_MAYOR_HACIA_LA_BASE 4

LISA 5

RUGOSA 6

SOLO_PAPILAS_LISAS 7

TOTALMENTE_HISPIDA 8

41 O DISPOSICION_ESPICULAR_ESQUELETO

AXIAL 1

CONFUSA 2

HYMEDESMOIDE 3

PLUMOSA 4

RADIAL 5

RADIAL_EN_PERIFERIA 6

REDUCIDO 7

42

P

ALOJA_CANGREJO_ERMITANO NO 1

SI 2

43 PERFORANTE NO 1

SI 2

44 PSEUDORAICES NO 1

SI 2

45 SUSTRATO

AMBOS 1

BLANDO 2

DURO 3