AGRUPAMIENTO RELACIONAL Y REDES INMUNOLÓGICAS ARTIFICIALES

download AGRUPAMIENTO RELACIONAL Y REDES INMUNOLÓGICAS ARTIFICIALES

of 31

description

En este documento se presenta una revisión de dos ´áreas de investigación en cuanto a aprendizaje computacional: redes inmunológicas artificiales, presentada en el capítulo 2 y aprendizaje relacional o basado en similitud, presentada en el capítulo 3. En cuanto a la primera, se presenta un modelo genera el cual muestra los elementos esenciales de un modelo de red inmunológica artificial y revisa distintos modelos que se encuentran en la literatura con la guía del modelo general presentado; también presenta una comparación de esos modelos.En cuanto a la segunda, se presenta una motivación para considerar el paradigma relacional basado en similitud, se realiza una comparación entre éste y el paradigma tradicional basado en características y se muestran algunos modelos relacionales de agrupamiento.Este trabajo pretende dar información sobre la viabilidad de definir un modelo de red inmunológica artificial que se ajuste al paradigma relacional, así, en el capítulo 4 se presenta como conclusión un punto de contacto entre las dos áreas, indicando algunos aspectos para tener en cuenta al desarrollar un modelo relacional de red inmunológica artificial.

Transcript of AGRUPAMIENTO RELACIONAL Y REDES INMUNOLÓGICAS ARTIFICIALES

AGRUPAMIENTO RELACIONAL Y REDESINMUNOLOGICAS ARTIFICIALESJUANCARLOSGALEANOHUERTASGRUPODEINVESTIGACIONPROMENTEFACULTADDEINGENIERIADESISTEMASFUNDACIONUNIVERSITARIAKONRADLORENZ2006Indicegeneral1. Introduccion 22. RedesInmunologicasArticiales 32.1. Teora de Red Inmunologica. . . . . . . . . . . . . . . . . . . . . 32.2. Un Modelo General de Red Inmunologica Articial . . . . . . . . 42.3. Modelos de Red Inmunologica Articial . . . . . . . . . . . . . . 72.3.1. La Rama de Hunt & Cooke . . . . . . . . . . . . . . . . . 82.3.2. La Rama de aiNet . . . . . . . . . . . . . . . . . . . . . . 102.3.3. Otros Modelos . . . . . . . . . . . . . . . . . . . . . . . . 112.4. Comparacion entre Modelos . . . . . . . . . . . . . . . . . . . . . 123. AgrupamientoRelacional 163.1. Aprendizaje Relacional frente a Aprendizaje Basado en Caracte-rsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173.1.1. El Enfoque Tradicional en Aprendizaje de Maquina y Re-conocimiento de Patrones . . . . . . . . . . . . . . . . . . 183.1.2. Por que ResultaUtil el Enfoque Relacional? . . . . . . . 183.2. Estado del Arte. . . . . . . . . . . . . . . . . . . . . . . . . . . . 193.2.1. Denicion de Medidas de (Di)similitud . . . . . . . . . . . 193.2.2. Algoritmos de Aprendizaje . . . . . . . . . . . . . . . . . 203.2.2.1. Algoritmos Jerarquicos . . . . . . . . . . . . . . 213.2.2.2. Algoritmos Basados en Kernels . . . . . . . . . 213.2.2.3. Algoritmos Basados en Prototipos . . . . . . . . 223.2.2.4. Otras Estrategias . . . . . . . . . . . . . . . . . 223.3. Lneas de Investigacion y Problemas Abiertos . . . . . . . . . . . 234. ConclusionesyTrabajoFuturo 24Bibliografa 261Captulo1IntroduccionEn este documento se presenta una revision de dos areas de investigacion encuanto a aprendizaje computacional: redes inmunologicas articiales, presenta-daenelcaptulo2yaprendizajerelacionalobasadoensimilitud,presentadaen el captulo 3. En cuanto a la primera, se presenta un modelo genera el cualmuestra los elementos esenciales de un modelo de red inmunologica articial yrevisa distintos modelos que se encuentran en la literatura con la gua del mo-delogeneral presentado; tambienpresentaunacomparaciondeesosmodelos.En cuanto a la segunda, se presenta una motivacion para considerar el paradig-marelacional basadoensimilitud, serealizaunacomparacionentreesteyelparadigma tradicional basado en caractersticas y se muestran algunos modelosrelacionales de agrupamiento.Este trabajo pretende dar informacion sobre la viabilidad de denir un mo-delo de red inmunologica articial que se ajuste al paradigma relacional, as, enel captulo4sepresentacomoconclusionunpuntodecontactoentrelasdosareas, indicando algunos aspectos para tener en cuenta al desarrollar un modelorelacional de red inmunologica articial.2Captulo2RedesInmunologicasArticiales1Desde que Ishiguro publico el primer modelo computacional de red inmuno-logica articial en 1994 [19], varios modelos han sido propuesto para solucionardiferentes tipos de problemas tales como agrupamiento, analisis de datos y cla-sicacion. En este momento, el campo de las redes inmunologicas articiales seha convertido en un area de investigacion bien establecida dentro del campo delos sistemas inmunologicos articiales.Auncuandotodoslosmodelosestanbasadosenlateoraderedinmuno-logica de Jerne [22], presentan diferencias en terminos de que mecanismos sonmodelados,comosonmodelados,eltipoderepresentacionutilizadaylaapli-cacion objetivo. Este captulo tiene como objetivo hacer un analisis descriptivoy comparativo de los modelos de red inmunologica articial mas relevantes quehan sido publicados hasta este momento. Los modelos han sido clasicados deacuerdo a como algunos de ellos han evolucionado de los otros y se introduce unmodelo general de red inmunologica, el cual provee un marco conceptual paradiscutir las similitudes y diferencias de los modelos revisados.El restodel captuloestaorganizadodelasiguienteforma: laSeccion2.1presenta una revision de los principales conceptos y deniciones de la teora deredinmunologica;laSeccion2.2introduceunmodelogeneralderedinmuno-logica articial; la Seccion 2.3 describe diferentes modelos de red inmunologicaarticial tomandoencuentasuestructura, sudinamicaysumeta-dinamica;nalmente, la Seccion 2.4 presenta una comparacion entre los modelos.2.1. TeoradeRedInmunologicaLa teora de red inmunologica fue propuesta por Jerne [22] como una formade explicar las capacidades de memoria y aprendizaje exhibidas por el sistema1Estecaptulocorrespondeaunaversionextendidade[20]3inmunologico. Laprincipal hipotesis deesta teora diceque lamemoria inmu-nologicaesmantenidaporunconjuntodecelulasBqueinteract uanunasconotras, a un en la ausencia de antgenos extra nos. Estas interacciones pueden serde excitacion o de inhibicion. La produccion de un cierto anticuerpo (generadapor un antgeno externo) estimula / suprime la produccion de otros anticuerposqueestimulan/suprimenlaproducciondeotrosanticuerposyas sucesiva-mente [36]. Cabe notar que la palabra antgenodenota aquellas moleculas quelas celulas / moleculas del sistema inmunologico son capaces de reconocer, portanto es necesario diferenciar entre antgenos propios (anticuerpos) y antgenosextra nos. De acuerdo con la notacion sugerida por Jerne [22], la porcion en lasupercie de un antgeno que puede ser reconocida por un anticuerpo se deno-minaepitope,laporcionusadaporunanticuerpoparareconocerantgenossedenomina paratope, y el epitope de un anticuerpo (antgeno propio) se denominaidiotope.Algunos modelos de red inmunologica, basados en el trabajo de Jerne, hansidodesarrolladoutilizandoecuaciones diferenciales parapredecir laconcen-traciondeanticuerposduranteydespuesdeunarespuestainmunologica.LosprimerosmodelosfueronpropuestosporJerne, Farmeretal., yVarelaetal.,ver un resumen en [9].UnconceptoimportanteparaelmodelamientoderedesinmunologicasfueintroducidoporPerelson[36],el espaciodecaractersticas(shape-space).Esteconcepto considera las formas de los anticuerpos y los antgenos como puntos enunespacion-dimensional, el espaciodecaractersticas, dondecadadimensionesta relacionada con alguna caracterstica principal involucrada en el proceso dereconocimiento. Los anticuerpos reconocen aquellos antgenos que estan dentrosu alcance, el cual esta denido por una esfera con centro en el anticuerpo y conun cierto radio de reconocimiento.2.2. UnModeloGeneral deRedInmunologicaArticialUnaredinmunologicaarticial esunmodelocomputacional bioinspiradoque utiliza ideas y conceptos de la teora de red inmunologica, principalmentelasinteraccionesentrecelulasB(estimulacionysupresion), ylosprocesosdeclonacion y mutacion. En esta seccion, se presenta un modelo general de entre-namiento para una red inmunologica articial, la cual reeja los pasos comunesa los diferentes modelos encontrados en la literatura; tambien introduce una no-tacion matematica que permite la comparacion entre tales modelo, este modelose presenta en la Figura 2.1. Otros algoritmos generales han sido descritos porde Castro [7] y Garret [15].El algoritmorecibecomoentradaunconjuntodeantgenos(representadoporel conjuntoA), el cual debeserpresentadoalared, yretornaunaredinmunologicaarticial compuestaporunconjuntodecelulasByconexionesentre ellas. Cabe notar, que algunos modelos de red inmunologica articial no4GAIN(A: conjunto de antgenos)1: inicializacion:1.1: asignar a Bun conjunto inicial de celulas B1.2: inicializar la estructura Lde la red2: repetir hasta encontrar un criterio de parada2.1: presentacion de antgenos: afinidad Antgeno/Celula B2.1.1: calcular fafinidad (a, b) para todo a Ay b B estimulacion Antgeno/Celula B2.1.2: calcular fAestimulacion (a, b) para todo a Ay b B2.2: interaccion entre celulas B: estimulacion/supresion Celula B/Celula B2.2.1: calcular fBestimulacion (b

, b) y fBsupresion (b

, b) para to-do b, b

B2.3: maduracion de la afinidad: estimulacion total2.3.1: calcularF (b) :=aA,b

B,b

=b

fAestimulacion (a, b) +fBestimulacion (b

, b) + fBsupresion (b

, b)

,b B2.3.2: crear fclonacion (b) clones de la celula B b y mutar-los2.3.3: calcular estimulacion para todas las nuevas celu-las B2.4 metadinamica: borrar/crear celulas B y enlaces2.4.1: actualizar la estructura Lde la red retornar red inmunologica3: retornar(B, L)Figura 2.1: Algoritmo general de red inmunologica articial5representan explcitamente el concepto de estructura de red.El primer paso es crear un conjunto inicial de celulas B (representado por elconjuntoB). Algunos modelos utilizan un subconjunto del conjunto de antge-nos y otros generar este conjunto inicial mediante un procedimiento aleatorio.Despues de esto, se inicia un proceso iterativo comenzando con la presentaciondel conjunto de antgenos a la red. Para cada antgeno y cada celula B se calculael nivel de estimulacion. Esta medida se presenta mediante la funcionfAestimulacion : A B En la mayora de los modelos, la estimulacion es una funcion de una medidade anidad, la cual se dene en el espacio en el que las celulas B y los antgenosse representan. En tal caso, la medida de estimulacion se dene como siguefAestimulacion (a, b) := g (fafinidad (a, b)) ,dondefafinidad : B A B A yg : .fafinidadmide la similitud/ complementariedad entre elementos del espacio de caractersticas. En muchoscasos, fafinidadcorrespondeaunametricaoseudo-metricaenel espaciodecaractersticas. g calcula la cantidad de estimulacion producida por un antgenocon una cierta anidad con una celula B.En el siguiente paso, las celulas B interact uan unas con otras, lo cual se vereejadoporel calculodelosefectosdeestimulacionysupresionentreellas.Estos efectos, se representan mediante las funciones:fBestimulacion : B B yfBsupresion : B B De manera similar a la estimulacion entre antgenos y celulas B, la estimu-lacion (y supresion) entre celulas B puede ser calculada como una funcion de laanidad entre ellas.Una vez hecho esto, se calcula la estimulacion total F: B de las celulasB sumando los efectos causados por las interacciones con el antgeno y la red.F(b) =aAfAestimulacion (a, b)+b

B,b

=bfBestimulacion (b

, b)+b

B,b

=bfBsupresion (b

, b) ,b BCon base en la estimulacion total, algunas celulas B son seleccionadas y secreanfclonacion (b) de cada una de ellas. Esas copias experimentan un procesode mutacion con una cierta tasa de mutacion. Algunos modelos interpretan taltasa como la probabilidad de que una celula B efectivamente sea mutada; otros6Figura2.2:Arbol genealogicodemodelosderedesinmunologicasarticiales:cada modelo es una modicacion o esta basado en su padre.modeloslainterpretancomolaproporciondelosatributosdelacelulaBquesera cambiado.En el paso de metadinamica, algunas celulas B in utiles son eliminadas de lared y nuevas celulas son creadas aleatoriamente e incorporadas a la red.Finalmente. cuando se alcanza un cierto criterio de parada, se retorna la reden su estado actual.2.3. ModelosdeRedInmunologicaArticialMuchos de los modelos de red inmunologica articial que han sido publicadossonvariacionesdemodelospreviamentepropuestos. Estogeneraunarelacionde dependencia entre los modelos, la cual puede representarse por medio de unarbol genealogico. Estearbol sepresentaenlaFigura2.2. Todoslosmodelosde red inmunologica articial en el primer nivel, se consideran versiones compu-tacionales de los modelos de los de Jerne, Farmer y Varela, y Couthino, situadosen la raz del arbol. Aquellos modelos, han experimentado variaciones o han sidoinspiracion para los modelos que aparecen en los siguientes niveles.Unmodeloesunamodicacionoestabasadoenel modelopadre. Cadaramadel arbol seradescritatomandoencuentadiferenciasysimilitudesen7terminos de estructura, dinamica y metadinamica [9], y la aplicacion original delosmodelosenesarama.Laestructurasereerealasinteraccionesentreloselementosdelared;ladinamicasereerealosmecanismosempleadosporlaredparaadaptarseas mismayal ambiente; ylametadinamicadescribelosmetodosparagenerarnuevoselementosparalaredypararemoverelementosin utiles para ella [9].2.3.1. LaRamadeHunt&CookeEn 1996 Hunt y Cooke [17] propusieron una red inmunologica articial quefueaplicadaentareasdereconocimientodepatronesensecuenciasdeADN.Este modelo considera el sistema inmunologico como una red de celulas B rela-cionadas entre s por medio de su anidad y enemistad. Tales relaciones estanbasadasendistanciasdeHammingdeacuerdoconeltrabajodeFarmer[13].Todas las celulas B sufren clonacion y mutacion si el antgeno actual las estimulalo suciente, es decir, si el nivel de estimulacion de las celulas es mayor que uncierto umbral. El proceso de clonacion produce un n umero de copias exactas delas celulas B, que depende del nivel de estimulacion. El proceso de mutacion estabasadoenunaeleccionaleatoriaentretrestiposdetecnicas.Alnaldecadaiteracion, una subpoblacion de las celulas B menos estimuladas es removida dela red y se genera, e incorpora a la red, el mismo porcentaje de nuevas celulas.AINE(ArticialImmuneNetwork): Timmis et al. [42] propusieron en 2000una red inmunologica articial que representa una adaptacion del modelode Hunt y Cooke para llevar a cabo tareas de analisis de datos. Las celu-las B se relacionan unas con otras mediante estimulacion y supresion, locualseasemejalasinteraccionesdeanidadyenemistaddelmodelodeHunt y Cooke. Aquellas celulas cuyo nivel de estimulacion es mayor queunumbralsufrenunprocesodeclonaciondondeeln umerodecopiasesproporcional a su nivel de estimulacion. El metodo de mutacion asigna unaprobabilidad ja de mutacion para cada campo de los clones que deben sermutados. Este metodo corresponde a uno de los tres metodos de mutacionempleado en el modelo de Hunt y Cooke. Al nal de cada iteracion, el 5 %de las celulas B mas debiles, con nivel de estimulacion bajo, es removidode la red. De acuerdo con la aplicacion a analisis de datos, la celulas B sonrepresentadas como vectores de valor real en vez de cadenas de bits comoel modelo padre, y se introduce el umbral de anidad de la red (NAT, porsus iniciales en ingles) como criterio de conexion entre celulas.RLAIS(ResourceLimitedArticialImmuneSystem): En2001, Tim-mis y Neal [41] modicaron el modelo AINE introduciendo el concepto deBola Articial de Reconocimiento (ARB, por sus iniciales en ingles). UnaARB es una representacion de una familia (o tipo) de celulas B identicas,en vez de ser una unica celula B. En el modelo, hay una pila de recursos(celulas B) controlada de manera centralizada y las ARB compiten por laasignacion de esos recursos. Las interacciones entre los elementos propios8y los procesos de clonacion y mutacion son similares a los de AINE, peroal nivel de las ARB. A diferencia de AINE, aquellas ARB que no tienenrecursos son removidas de la red y el NAT depende del tiempo y se calculaa partir del conjunto de antgenos disponible.SSAIS(Self-StabilisingArticialImmuneSystem): Este modelo, presen-tadoporNeal [34] en2002, estabasadoenRLAISysehaaplicadoalanalisis continuo de datos que varan con el tiempo. La principal diferen-cia entre SSAIS y RLAIS, es que el primero no tiene un nivel limitado derecursos y cada ARB puede controlar su propio nivel de recursos (controldescentralizado).Adicionalmente,SSAISnoconsideralasupresionentrecelulas B en el calculo del nivel de estimulacion.Meta-StableMemoryImmuneNetwork: Siguiendo la lnea de AINE, Neal[35] propuso una version modicada de SSAIS en 2003 para analisis de da-tos,agrupamientoymemoriainmunologicaarticial.Enestenuevomo-delo, cada ARB es estimulada por antgenos extra nos y por sus vecinas enun espacio euclidiano como en SSAIS. La principal diferencia con SSAISes que el sistema emplea un proceso de clonacion como una respuesta pri-maria solamente, la cual esta mediada por el NAT, pero no considera unoperador de mutacion. Todas las ARB con un nivel de recursos menor queun umbral jo de mortalidad son removidas de la red.FractalImmuneNetwork: A pesar de que este modelo, propuesto por Bentleyy Timmis [2] en 2004, no es una modicacion de RLAIS, utiliza el concep-to de ARB y lo renombra como Espacio Fractal de Reconocimiento (FRS,por sus iniciales en ingles). Aqu, se considera que las interacciones entreelementospropiostienenlugarvacitoquinasarticiales. Lascitoquinasfractales estan representadas por un clon de FRS transmisores. La se nal esrecibida por un receptor fractal (un clon de FRS receptor) y se calcula sudistancia. Si tal distancia es menor que cierto umbral, el FRS transmisor seestimula solo si es un FRS maduro. El algoritmo de red inmunologica estabasado en SSAIS. Un FRS estimulado sufre clonacion, con un probabilidadja, creando una copia del FRS y esta copia es mezclada con el antgenosiguiendo un proceso de mezcla de protenas fractales. Si no existe un FRSestimulado, secreaunoenlaposiciondel antgenocomounarespuestaprimaria, igual que en su modelo padre. La muerte celular depende de laconcentracion: en cada iteracion, la concentracion de un FRS es incremen-tada de acuerdo con el nivel de estimulacion. Si la concentracion se hacemenor que un umbral de mortalidad, se remueve ese elemento de la red.El nivel de estimulacion de todos los FRS en el sistema, sufre un procesode decaimiento que act ua junto con otras operaciones como mecanismo decontrol de la poblacion.FuzzyAIS: En2002,Nasraouietal.[32]presentaronunmodelo,basadoenRLAIS para desempe nar agrupamiento, denicion de perles web y mine-ra web; introdujo el concepto de ARB difusa. Una ARB difusa dene un9conjunto difuso sobre el dominio del discurso que consiste en el conjuntodedatosdeentrenamiento.CadaARBdifusapuedetenersupropiaes-cala/radiodeinuencia(similaralNAT).OtradiferenciaconRLAISesque aquellas ARB cuya anidad es menor que un cierto umbral, se mez-clan(operaciondecruce).SeconsideraninteraccionesdeestimulacionysupresiontantoporantgenoscomoporARB.Losoperadoresdeclona-cionymutacionsonaplicadossobrelascelulasquepermanecendespuesde remover aquellas ARB con nivel de recursos igual a cero. El proceso deasignacion de recursos presenta modicaciones.TECNO-STREAMS: En 2003, Nasraoui et al. [31], adaptaron el Fuzzy AISpara desempe nar tareas de minera en ujos de datos. Los elementos pro-pios se denominan Celulas B Ponderadas y Dinamicas (D-W-B-cell, por eltermino en ingles), los cuales denen zonas de inuencia sobre el espaciode antgenos, como las ARB difusas. Sin embargo, dado que los datos tie-nen un aspecto temporal, los datos actuales tienen un nivel de inuenciamayor que los antiguos. El nivel de estimulacion decrece no solo con la dis-tancia desde el centro, sino tambien con el tiempo transcurrido desde queel antgeno fue presentado a la red inmunologica. La medida de anidadentre las celulas se dene por medio de una funcion robusta de pondera-cion/activacion la cual decrece con la distancia y el factor temporal de losantgenos, haciendoqueel sistemaseacapazdeidenticarruidoenlosdatos. La estimulacion total que una D-W-B-cell ha percibido despues deque cierto n umero de antgenos han sido presentados a la red, esta dadapor la densidad de la poblacion de antgenos alrededor de la celula y porlas interacciones con las vecinas. Este proceso se asemeja a la funcion deestimulaciondelFuzzyAIS,peroconsiderandolamedidamodicadadeanidad. Con el n de que el n umero de interacciones en la red decrezca,laredinmunologicaseseparaensubredesdemaneraquelosantgenosperturban solo una de tales subredes. La division de la red se lleva a cabopor medio del algoritmo K-means.2.3.2. LaRamadeaiNetEn 2001, de Castro y Von Zuben [11] propusieron este modelo para tareas deanalisis de datos. El modelo genera una red de anticuerpos enlazados de acuerdoa su anidad (distancia euclidiana). Se selecciona un subconjunto de anticuerposcon la mayor anidad con un antgeno dado y son clonados proporcionalmenteal esevalordeanidad. Todoslosclonesgeneradossonmutadosdemanerainversamente proporcional a la anidad con el antgeno. Un porcentaje jo declones es seleccionado como anticuerpos de memoria.JerarquadeaiNets: de Castro y Timmis [10] propusieron en 2002 un criteriode parada para el algoritmo aiNet basado en arboles de mnima expansion,y desarrollaron una tecnica para crear una jerarqua de aiNets con el n deencontrar no solo grupos principales sino tambien subgrupos. Esto se logra10alestructurarvariasaiNetsenunaformadearboldetalmaneraqueesposible separar autom aticamente los grupos, y los subgrupos, encontradosen los conjuntos de datos de entrenamiento.opt-aiNet: deCastroyTimmis[8] propusieronen2002estemodelo, comounaadaptaciondeaiNetparaoptimizaciondefuncionesmultimodales.Lascelulasdelaredinteract uandeacuerdoasuanidadypormediode un proceso de supresion que consiste en remover aquellas celulas cuyaanidad es menor que un cierto umbral. Todas las celulas de la red sufrenunprocesodeclonacionquegeneraunn umerojodecopias,lascualessufrenunprocesodemutacionproporcional alaaptituddel padre. Siel error enlaaptitudes signicativamentediferenteal deal iteracionprevia, el sistemallevaacabounprocesodesupresionyunporcentajejo de celulas es generado aleatoriamente e incorporado a la red. En casocontrario, las celulas contin uan con los procesos de clonacion y mutacionIPDaiNet: Alonsoetal.[1]hicieronunamodicaciondeaiNetparamode-larunagentequejuegael DilemaIteradodel Prisionero(IPD, porsusinicialeseningles).Enestemodelo,tantoantgenosconocelulasBestarepresentadosporestrategiadelIPD,cadaunadelascualesseconside-ra como una forma en que el jugador decide que movimiento hara dadasunas interacciones previas. Este agente inmunologico percibe la estrategiadel oponente e intenta encontrar una (la celula B mas estimulada), en lamemoria inmunologica, la cual le provee el pago mas alto al confrontar suoponente. La principalmodicacionhecha a aiNet estaen el mecanismode memoria: si una celula B se adiciona a la memoria, nunca se remueve.2.3.3. OtrosModelosEn 1994, Ishiguro [19] implemento una red inmunologica articial y demostrosu potencial aplicacion a un sistema de adquisicion de caminado para un robotde seis patas. Mitsumoto [30] extendio este trabajo al desarrollar un ambienteconm ultiplesrobots. Apesardelaecaciadeestasiniciativas, lasreglasdeinteraccionentreanticuerpossedenendeunaformaadhoc.Laecienciadeesteenfoqueserestringeasistemas debajacomplejidad, los cuales puedendescribirse utilizando pocos anticuerpos [18].MichelanYVonZuben: En2002, MichelanyVonZuben[29] presentaronun modelo de red inmunologica articial para el control de un robot mo-vilquedesempe natareasmultiobjetivo.Enestemodelo,losanticuerposrepresentanunaaccionqueelrobotdebeejecutary losantgenosrepre-sentan el estado actual del robot. Modelan interacciones de estimulacion ysupresion entre anticuerpos. La dinamica de la red se lleva a cabo por ope-radores de cruce y mutacion geneticos. Se utiliza un operador de seleccionelitistaenel algoritmodeentrenamiento. Lamuertecelularconsisteenseleccionar aquellos anticuerpos con una aptitud baja para reemplazarlospor nuevos anticuerpos.11CLARINET: CLARINET [43] es un modelo para navegacion autonoma pro-puestoporVargasetal.en2003.Esunsistemahbridonoparametricoquecombinasistemasclasicadores, algoritmosevolutivosyunaredin-munologica articial. Los sistemas clasicadores representan celulas B, lascuales interact uan con otras por medio de funciones de estimulacion y su-presion. El algoritmodeentrenamientoconsideraoperadoresdecruceymutacion de igual forma que en el modelo propuesto por Michelan et al.[29].RedInmunologicaReactiva: En 2004, Luh y Lin [27] propusieron otro mo-delo para navegacion autonoma. De manera usual, los antgenos represen-tan estados del ambiente y los anticuerpos representan las direcciones queel robot debe seguir. La estimulacion producida por antgenos se calculautilizandounenfoquedecampoarticialdepotencial,elcualconsiderauna fuerza articial de atraccion entre el robot y el objetivo y una fuerzavirtual repulsiva entre el robot y los obstaculos. La estimulacion y la su-presion causadas por anticuerpos esta relacionada con la diferencia entrelos angulos que denen las direcciones.AISEC(ArticialImmuneSystemforE-mailClassication): El propo-sitodeestemodeloesclasicarinformacioninteresanteynointeresanteproveniente de la web. Las celulas B representan prototipos de mensajesde correo electronico no interesantes y los antgenos representan mensajesde correo entrante. Si una celula B es activada por un antgeno, el men-saje asociado con ella es etiquetado como no interesante y se enva a unaubicacion especial. Las interacciones de estimulacion y supresion se llevana cabo va el incremento o disminucion de un contador. Se lleva a cabo elproceso de clonacion y una celula B puede morir por una de dos formas:una es eliminar aquellas celulas que tienen en cero el contador de estimu-lacion, y la otra es eliminar una celula B que hace una mala clasicacioncon base en retroalimentacion proveniente del usuario, es decir, cuando laclasicacion hecha por la celula B no coincide con la hecha por el usuario.Este modelo fue propuesto por Secker et al. [39] en 2003.2.4. ComparacionentreModelosEstaseccionpresentaunanalisiscomparativodelosmodelosantesmen-cionados. El analisis enfatizaaspectos especcos delos modelos tales comorepresentaciondeCelulas ByAntgenos, as comolas medidas deanidad,estimulacion y supresion.La Tabla 2.1 muestra los esquemas de representacion utilizados por los dife-rentes modelos. El esquema mas com un de representacion es la lista de atributos.Dependiendo del espacio del problema, se utiliza una cadena de bits o un vectorde valores reales. Cada campo, en la lista, representa una caracterstica relevantepara el problema, de tal forma que un campo en una cadena de bits modela lapresencia o ausencia de la caracterstica particular, mientras que un campo en12Modelo B AHunt y Cooke {0, 1}n{0, 1}nAINE n

nRLAIS n

nSSAIS n

nMeta-Stable IN n

nFractal IN 3, Fractal 3, FractalFuzzy AIS nnTECNO-STREAMS nn NaiNet n

nJerarqua de aiNets n

nopt-aiNet n

IPD-aiNet estrategia IPD estrategia IPDMichelan y Von Zuben {0, 1}n Saccion{0, 1}nCLARINET Stag {0, 1, #}n {0, 1}nStag {0, 1}nReactive IN 3

3AISEC Ssbj SsndSsbj SsndCuadro 2.1: Esquemas de representacion para celulas B y antgenos: las princi-pales opciones son la cadena de bits y el vector de valores reales. Otros modelosutilizan representaciones m as complejas con el n de ajustarlas a la aplicacionparticular.un vector real representa una cierta medida de la caracterstica. Las ramas deHunt y Cooke y aiNet adoptan esta representacion, a excepcion de los modelosFuzzy AIS y TECNO-STREAMS, donde los elementos del conjunto B contienenun radio de cobertura adicional al vector de caractersticas.La rama de Otros Modelos tiene representaciones mas complejas. Este grupocontiene modelos creados para tareas de navegacion autonoma y clasicacion decorreo electronico. En los modelos de navegacion autonoma, como el de Miche-lanyVonZubenyCLARINET, losantgenosrepresentanestadosdel robotenel ambienteylascelulasBrepresentanaccionesquepuedeejecutarel ro-bot enformadereglasquecontienenunacondicionquedebesersatisfecha({0, 1}n, Stag {0, 1, #}n) y la accion correspondiente (Saccion, {0, 1}n). En AI-SEC, creado para clasicaci on de correo electronico, los antgenos representanparejas asunto-remitente (SsbjSsnd) de los mensajes que deben ser clasicados, y las celulas B representan parejas asunto-remitente (SsbjSsnd) de prototiposde mensajes no interesantes.Note que la mayora de los modelos no diferencian entre fenotipo y genotipo,aexcepciondeFractal ImmuneNetwork, dondelosfenotiposestanrepresen-tadosportresvaloresreales,loscualessontransformadosengenotiposrepre-sentadosporfractales. Adicionalmente, losmodelosutilizanel mismotipoderepresentacion para antgenos y celulas B a excepcion de TECNO-STREAMS,que considera un factor temporal como parte de la representacion del antgeno; y13los modelos de navegacion autonoma, en donde los antgenos no tienen el factorde accion en su representacion.Enlosmodelos, lamedidadeanidadestabasadaenunamedidadedis-tanciaenunciertoespacioquedependedel problema. Ladeniciondeunamedidadeanidadgeneraimplcitamenteunespaciodeformas(shape-spaceen ingles). Como se muestra en la Tabla 2.2, las dos formas principales en quese modela la anidad son: una funcion de la distancia de Hamming (DH) paralarepresentaciondecadenadebits, yunafunciondeladistanciaeuclidiana(D) para la representacion de vector real. Cabe anotar que algunos modelos nopresentan explcitamente una funcion de anidad, pero denen el mecanismo deestimulacion directamente comoDo como 1 D. En general, una celula B esestimulada por un antgeno de manera proporcional a su anidad [36], el nivelde estimulacion depende de la anidad y, adicionalmente, tal nivel de anidadafecta los procesos de clonacion y mutacion.Esposibleclasicarlosmodelos,deacuerdoalasinteraccionesentrecelu-las que estos modelan, en dos grupos: aquellos que consideran interacciones deestimulacion y supresion entre celulas B, y aquellos que consideran solo interac-ciones de estimulacion. SSAIS, Meta-Stable Immune Network y Fractal ImmuneNetwork conforman el ultimo grupo. Teniendo en cuenta los mecanismos de su-presion, los modelos de la rama aiNet, modelan la supresion como un operadorde intercambio o muerte, mientras que los demas modelan la supresion como unoperador de estimulacion negativa.Losefectosdeestimulacionosupresion, experimentadosporunacelulaBcuando interact ua con otra celula B, tambien dependen de la anidad. Algunosmodelosconsideranel efectodeestimulacion(ydesupresion)comounafun-cion de la anidad entre dos celulas B; otros interpretan la supresion como unmecanismo de muerte celular, y otros no consideran tal efecto.Los procesos de clonacion y mutacion constituyen el mecanismo principal deactualizacion de la estructura de la red. De acuerdo con la teora inmunologica,las celulas B sufren clonacion y mutacion si su estimulacion total es mayor queun cierto umbral [36]. La mayora de los modelos utilizan esta idea, aunque haymodelosquesimplementecreanunn umerojodecopiasdelacelulaestimu-lada.Encuantoamutacion,haymodelosquelallevanacaboconunaciertaprobabilidad y otros lo hacen siempre, pero consideran una razon (proporcion)de mutacion que se calcula a partir de la medida de anidad o de la de estimu-lacion. Como casos especiales, algunos modelos usan algoritmos geneticos (GA,por sus iniciales en ingles) como un mecanismo de adaptacion de la estructurade la red.14ModelofafinidadfAestimulacionfBestimulacionfBsupresionfclonacionHuntyCookekG(DH

+1)fafinidadfafinidadfafinidadkFAINE1Dfafinidadfafinidadfafinidad1kFRLAIS1Dfafinidadfafinidadfafinidad1kFSSAIS1Dfafinidad1mfafinidaddecaeRF10mortalidadMeta-StableIN1D1fafinidad+2Dfafinidad+2D+11FractalIN1D10fafinidadAMfafinidad+2D+1CM1FuzzyAISexp

D22

fafinidad2fafinidad2fafinidad2kFTECNO-STREAMSexp

D222+J

fafinidad2fafinidad2fafinidad2kFaiNet1DmuertekfafinidadJerarquadeaiNets1Dmuertekfafinidadopt-aiNetDfitnessmuertekIPD-aiNetDHmuertekfafinidadMichelanyVonZubenkG(DH

+1)fafinidadfafinidadfafinidadGACLARINETkG(DH

+1)fafinidadfafinidadfafinidadGAReactiveINfobjetivo+fobstaculocos(ij)cos(ji)kFAISECpalabras|bshort|scontadorcelulaBcelulaMscontadorkFCuadro2.2:Modelosparalasmedidasdeanidad,estimulacionysupresionyparaelprocesodeclonacion:lamayoradelasmedidasestanbasadasenlanociondedistanciayelnumerodeclonescreadoes,engeneral,proporcionalalniveldeestimulaciondelacelulaB.Lasceldasvacasindicanquelafuncioncorrespondientenoesimplementadaporelmodelo.15Captulo3AgrupamientoRelacionalLos problemas de aprendizaje supervisado y no supervisado, pueden enten-dersecomoproblemasdeclasicacion, deunconjuntodeobjetosdeentrada,con naturalezas un poco distintas: en el primero, se conoce el conjunto de eti-quetas (clases) que pueden ser asignadas a los objetos y el problema consiste enasignar la etiqueta adecuada a cada objeto; en el segundo, debe encontrase unn umero razonable de etiquetas (grupos) en los que pueda ser dividido el conjun-to total de objetos, de tal forma que un nuevo objeto pueda ser ubicado dentrodel grupo mas adecuado. El criterio general para asignar la etiqueta adecuadaa un nuevo objeto consiste en ubicar el conjunto de objetos que comparten unamisma etiqueta y que son mas parecidos al nuevo objeto. De forma similar, elcriteriogeneral paraencontrarel n umerorazonabledegruposparadividirelconjuntototal deobjetos, consisteenponerjuntosaquellosobjetosqueseanmas parecidos entre s, deniendo as los lmites entre los grupos.Dentro de la literatura concerniente a las tecnicas de aprendizaje supervisadoynosupervisado, usualmenteestapresenteunanociondedistanciaentrelosobjetos del problema, la cual se construye frecuentemente sobre la base de unespaciodecaractersticasquedescribenaesosobjetos.Puedenotarsequeesanocion de cercana modela, de una u otra forma, un grado de (di)similitud entrelos objetos del problema, que es utilizado como criterio para resolver el problemade aprendizaje. Sin embargo, el concepto de similitud es mas general que el dedistanciayaquepuedemostrarsequeel primerononecesariamentesatisfaceciertas propiedades del segundo. Mas a un, aunque parece natural describir losobjetos mediante caractersticas, esto no siempre resulta facil y en tal caso unadenicion de similitud en terminos de distancia en un espacio de caractersticasno es posible. Los siguientes ejemplos pueden ayudar a aclarar esta armacion:Considereel problemadeidenticar unapersona: si alguienlepreguntaconoceustedaEduardo?, ysurespuestaes negativa, lapersonaintentaraayudarlearecordardescribiendoaEduardodiciendocosastalescomo aquelquemidemasomenos1.65m,tienecabellolisoynegro,pieltrigue na,etc.,es decir, la persona le dara un listado de caractersticas con el n de que ustedrecuerdeaEduardo.Apartirdeesto,ustedpuedeimaginarseunsistemaque16contengaunconjuntodefotosdepersonasylemuestreaquellasquemasseparecen a una que usted describe mediante caractersticas.Ahora bien, considere el problema de identicar un olor: si alguien le pregun-ta reconoce usted el perfume de Stella?, y de nuevo, su respuesta es negativa,cual sera la estrategia utilizada por la persona para ayudarle a recordar?, se-guramenteintentaradecircosastalescomo esunolorqueestaentrenaranjaylimon, separecemasal delanaranja, peronoesexactamentenaranja, esdecir, la persona le da un marco de referencia relativo a olores que usted cono-ce y que son similares al del perfume de Stella. A partir de esto, suponga queexiste un sistema que es capaz de generar olores; si usted quiere que el sistemareproduzca un olor particular, la forma quiza mas natural en que usted quisieradar las instrucciones sera en forma de expresiones tales como parecido al olorde la naranja, parecido al olor del limon y mas parecido al olor de la naranjaque al del limon.Desde el punto de vista computacional, los problemas antes planteados, pue-denversecomoproblemasdeclasicacion, perodenaturalezasunpocodife-rentes: enel primero, ustedrecibeunconjuntodecaractersticasoatributos(caractersticas fsicas que tiene Eduardo) de un objeto y usted debe encontrar(dentro del conjunto de sus recuerdos) el elemento que mejor se ajusta a la des-cripcionparaasignarlelaetiquetaapropiada(Eduardo);enelsegundo,ustedrecibeunconjuntodeelementos(naranja, limon)queseparecenendistintasproporciones (mas a naranja que a limon) a un cierto objeto y usted debe en-contrar (dentro del conjunto de sus recuerdos), el elemento que mejor se ajustaa las descripcion para asignarle la etiqueta apropiada (perfume de Stella).A partir de la discusion anterior, puede verse que el proceso de aprendizajeestasoportadoporunanocionde(di)similitud,envezdeporunconjuntodecaractersticas descriptoras. En este captulo, se pretende hacer una revision deaquellastecnicasdeaprendizajequesebasan, enmayorproporcion, enunanocion de (di)similitud en vez de hacerlo en un espacio de caractersticas; paraello, se hablara del enfoque relacional (o basado en similitud) de aprendizaje parareferirse a la naturaleza de las primeras, y se hablara del enfoque tradicional parareferirse a la naturaleza de las segundas.El captuloestaorganizadodelasiguienteforma: laSeccion3.1describede manera mas precisa las diferencias entre los enfoques basado en similitud ybasado en caractersticas; la Seccion 3.2 presenta una revision de algoritmos deaprendizaje basados en similitud; y, nalmente, la Seccion 3.3 presenta algunaslneasdeinvestigacionyproblemasqueresultandelaaplicaciondel enfoquebasado en similitud.3.1. Aprendizaje Relacional frente a Aprendiza-jeBasadoenCaractersticasEn el proceso de aprendizaje se consideran dos elementos basicos: un espaciode entrada X que dene el dominio del problema y un algoritmo de aprendizaje17A. El objetivodeAesconstruirunmodelofdeXapartirdeunamuestraXndelespaciodeentrada,dondeneseltama nodelamuestra.Elmodelofno es mas que una funcion que asigna una etiqueta a cada objeto deX, para elcaso de aprendizaje supervisado; o divide aXen un cierto n umero de grupos,para el caso de aprendizaje no supervisado, de tal forma que cada objeto deXpertenezca a un grupo. De esta forma, la diferencia entre los enfoques basado encaractersticas y basado en similitud radicara en la forma en que la informacioncontenida enX(posibles patrones) es transmitida aA para la construccion def.3.1.1. El Enfoque Tradicionalen Aprendizaje de MaquinayReconocimientodePatronesComo se dijo anteriormente, el enfoque tradicional se basa en la transforma-cion del espacioXen un espacio de caractersticasFen el que cada objeto esidenticado mediante un vector de atributos (v1, ..., vn). Esta transformacion esusualmente denominada representacion y puede denotarse mediante la funcion : X F.Dado que el proceso de aprendizaje esta soportado por una nocion de simi-litud, sobreloselementosdeXpuededenirseunamedidadesimilitud, quedenota el grado de semejanza entre cada par de objetos, tal funcion se denotamediante d : X X . Sin embargo, en este caso, el algoritmo A toma comoentrada el espacio Fy por tanto, es deseable que d tenga una medida correspon-diente en F, tal medida se denota como dF: F F . Usualmente, dFes unafuncion de la distancia denida sobre F, y as, la correspondencia deseable debeser tal que d (xi, xj) dF ((xi) , (xj)), donde el smbolo indica que puntosen el espacioFque esten cerca, deben ser imagenes de objetos en el espacioXque sean similares.Aunque se considere la denicion de la medida de similitud enX, tradicio-nalmente el proceso consiste en denir directamente una funcion de (di)similituddFcomo una funcion de la distancia (metrica) entre vectores de F. Sin embargo,el proceso de representacion no siempre es facil de realizar debido a la naturalezade los objetos en Xy, por otro lado, la funcion dF, denida en terminos de dis-tancia, no necesariamente preserva la nocion de similitud sobre X. Puede decirseentonces que este enfoque considera la transformacion del espacio del problemaa un espacio de caractersticas, como paso previo para la denicion de similitud[25]. La justicacion mas clara para este enfoque, es el soporte matematico conque se cuenta al transformarXen un espacio euclidiano.3.1.2. PorqueResultaUtilelEnfoqueRelacional?Una de las razones para considerar este enfoque es que el proceso de repre-sentacionpuederesultar, enciertosdominios, difcil einclusoinnatural. Estoocurreprincipalmenteenproblemasenlosquelosdatosdelproblemanosonnumericos y tienen una estructura compleja. Por ejemplo, en problemas de per-sonalizacion web, los objetos del espacio X son sesiones web; una transformacion18posibleesconsiderarF= {0, 1}mdondemesel n umerodepaginasdel sitioweb. De esta forma, cada elemento de Fes un vector de m componentes, dondecadacomponenteestaasociadaaunapagina, un1indicaquelapaginafueconsultada en una sesion particular, y el 0 indica que no. Esta representacion,tieneel problemadequempuedesermuygrande, dependiendodel tama nodel sitio[33]. Conestarepresentacion, el conceptodesimilitudentresesionesse limita a contabilizar el n umero de paginas en que las dos sesiones coinciden.Sin embargo, tal contabilizacion, difcilmente puede dar informacion acerca delcontenidodelaspaginasyel ordenenquefueronaccedidasencadaunadelassesiones, locual podrautilizarseparadescribirel comportamientodelosusuarios que navegan a traves del sitio [38]. Dentro de los dominios con objetosestructurados, seencuentrantambienlosdocumentosXMLsi sequierereali-zar reconocimiento de diferentes fuentes con el mismo tipo de informacion [14].Aqu,lamedidadesimilituddeberareejarunasemejanzaencuantoaltipode informacion descrita por dos documentos XML.Otros casos en los que la extraccion de caractersticas resulta innatural sonlos de las reglas de asociacion (minera de datos) [16] y datos que utilizan repre-sentacion de primer orden [24]. Sobre las primeras, es deseable hacer un procesode agrupamiento, con el n de reducir el n umero de reglas dentro de un sistema,sin embargo no parece natural extraer un conjunto de caractersticas del espa-ciodelasposiblesreglasdetalformaquelamedidadesimilitudentrereglascorresponda a una distancia en tal espacio.Un ejemplo mas en el que no parece natural la transformacion de X en Fsepresentaen[4],endondeseplanteaelproblemadehacerclasicaciondeolo-res. En este caso, los autores argumentan la dicultad de representar los oloresmediante caractersticas, sin entrar en detalles, basicamente porque correspon-dealaextracciondecaractersticasdecompuestosqumicosconestructurasheterogeneas y complejas.3.2. EstadodelArteDentro de los trabajos del area, puede distinguirse dos grandes grupos: aque-llos cuyo n ucleo de trabajo es la denicion de medidas de (di)similitud y aquellosque se centran en el procedimiento de aprendizaje mediante la manipulacion deuna matriz de (di)similitud general. Vale la pena mencionar que aunque se mues-tren estos dos grupos como conjuntos disjuntos, lo usual es encontrar trabajosqueaportanenambasdireccionesdetalmaneraqueunautorproponeunal-goritmoconladeniciondeunaciertamedidade(di)similitudyel trabajoesextendidopresentandonuevosdatosexperimentalesconnuevasmedidasde(di)similitud.3.2.1. DeniciondeMedidasde(Di)similitudComo ya menciono, el proceso de agrupamiento esta basado principalmenteenladenicionderelacionesentrelosobjetos, usualmentemedidasdecuan19semejantes o diferentes son. La exploracion en este grupo esta fuertemente re-lacionadaconlarepresentaciondelosobjetosenel espaciodeentradayelsignicado que quiere darsele al concepto de semejanza. En areas como la mi-nera web, donde el problema es aprender a partir de la informacion interesantepara los usuarios, es necesario denir medidas que capturen la similitud de in-tereses entre usuarios, para esto, la forma mas simple es representar los interesesde un usuario como el conjunto de paginas visitadas en una sesion [33], de talformaquedosusuariostendraninteresessimilaressi el conjuntointerseccionde las paginas visitadas es grande. Sin embargo, dado que usualmente se quie-reclasicarlosusuariosmedianteladeniciondeciertosperlesconelndehacer recomendaciones o personalizaciones en la navegacion, se hace necesarioagregarle a la medida de similitud informacion acerca de la estructura del sitio,lo cual puede interpretarse como una categorizacion del sitio desde el punto devista del usuario que esta accediendo [33].En [28], los autores plantean la estrategia de mejorar la calidad de las suge-rencias realizadas por un sitio web al usuario en sesion, mediante el aprendizajedesucomportamiento. Aseguranqueel comportamientonopuedeserdescu-bierto unicamenteconlainformacionacercadelosinteresesdel usuario, sinoque es necesario obtener informacion acerca de el orden en que los recursos sonsolicitados. As que, se hace necesaria una medida de (di)similitud que considerela secuencia de paginas accedidas por el usuario [28].El problema de agrupar y/o clasicar documentos es otro campo en el cualla denicion de la medida de (di)similitud es crucial y no trivial. En este caso, laforma natural de agrupar tales objetos es mediante alg un grado de sinonimia.Tal enfoque es adoptado en [14] en el que se pretende agrupar documentos XMLmediante el signicado, el cual pretende ser extrado de la estructura particularde tags.Dentro de los trabajos en esta direccion, se encuentran [26], [37] en los cualesel objeto de estudio es justamente la informacion capturada por las medidas desimilitud. Basicamente, pueden distinguirse dos grandes grupos de medidas: Eu-clidianas y No Euclidianas. Dentro de las primeras, se argumenta la limitaciondecapturarsoloestructurasesfericasmientrasquelassegundaspuedenapor-tar informacion relevante acerca de la estructura de los datos que las medidasEuclidianas ignoran [26]. Dentro de esta categora de trabajos, es usual que sehable, en forma general, de metricas y no metricas.Otros trabajos no realizan una denicion propiamente dicha de la medida desimilitud, en vez de eso, utilizan un peque no conjunto de datos para los cualesse conocen sus (di)similitudes, como conjunto de entrenamiento de un algoritmodeaprendizaje,conelndeestimarlamedidadesimilitudyapartirdeesemodelo aprendido, estimar los valores de similitud para los demas objetos en elconjunto de entrenamiento. Estos trabajos se revisaran mas adelante.3.2.2. AlgoritmosdeAprendizajeEnestasubseccion, sedescribenlasprincipalesestrategiasutilizadaspararealizaraprendizaje, yaseasupervisadoonosupervisado, tomandocomoin-20formacionunamatrizde(di)similitud. Dentrodeestegruposeevidencialapotencialidad de estos metodos dada por la independencia de la medida de si-militud. Aqu, se supone que el algoritmo tiene acceso a la medida de similitudentre cada par de objetos pero no a la forma de calcularla.3.2.2.1. AlgoritmosJerarquicosLaestrategiamas utilizadadentrodel areacorrespondealos algoritmosjerarquicos, tanto aglomerativos como divisivos (para una descripcion detalladade estos mecanismos ver [21]). La diferencia principal entre estas dos estrategiasconsiste en el punto de inicio. Mientras en los aglomerativos el punto de arranqueconsiste en considerarNgrupos, cada uno con un objeto y cada objeto en ungrupo,enlosdivisivos,elpuntodearranqueconsisteenconsiderarungrupo,el cual contieneatodos los objetos. Enambas estrategias, seconstruyeunarbol de jerarquas a partir de la medida de similitud (en los aglomerativos) odisimilitud(enlosdivisivos)enel cual cadanodorepresentaungrupo, cadaunoconuncierton umerodeobjetos,detalformaquecadanivelenelarbolrepresenta un n umero distinto de grupos [21]. Notese que en ambas estrategiasexisten dos puntos extremos: uno en el que cada objeto forma un grupo (hojasdel arbol), y otro en el que todos los objetos pertenecen a un unico grupo (razdel arbol). El problema consiste entonces en encontrar el nivel en el arbol quemejordescribelaestructuradelosdatos.Portanto,lostrabajosenestaareaconsisten justamente en denir criterios de seleccion de tal nivel. Dentro de estosse encuentra los trabajos presentados en [12], [14], [16] y [33]3.2.2.2. AlgoritmosBasadosenKernels1Un gran grupo de trabajo que cuenta con gran interes en la comunidad aca-demicaesel delosmetodosbasadosenkernels[23]. Laideaprincipal delosmetodos basados en kernels es implementar algoritmos que desempe nen tareasde aprendizaje de maquina (p.ej. agrupamiento) que reciben como entrada unamatriz cuyas celdas corresponden al producto punto (o producto interno) entrecadapardeelementosdelconjuntodeentrenamiento.Aunqueelconceptodeproducto punto supone una estructura vectorial del espacio, el concepto de ker-nel permite aislar la representacion del conjunto de datos del espacio en el cualel algoritmo trabaja.El objetivo primordial de los metodos kernel es descubrir patrones, en generalno lineales, dentro de un cierto conjunto de datos como proyecciones al espaciooriginal de patrones lineales descubiertos en un espacio, en general de dimensionmayor.Elconceptocentraldeestosmetodoseseldefuncionkernel:Unafuncion : X X es un kernel si(x, z) corresponde al producto punto entre losvectores(x)y(z),donde()esunafuncionquetransformaelespaciodeentrada X en el espacio de caractersticas F, como se menciono anteriormente.1Lainformacionconsignadaenestaseccionhasidotomadabasicamentede[23]y[3]21Lointeresantey util deestosmetodosesquenoesnecesarioconstruirexpl-citamenteelespacioFparaobtenerinformaciondelproductopuntoentrelosvectores que viven all; esto tiene la ventaja de no incrementar el costo compu-tacional decalcularel productopuntoenFque, engeneral, esdedimensionmayor que la deX. Otro punto importante es que no se requiere queXsea unespacio vectorial, en vez de eso, puede denirse la funcion de similitud sobreXy construir una funcion kernel correspondiente.Notesequesedijoquelamatrizqueservadeentradaalos algoritmosbasadosenkernels, contienelainformaciondelosproductospuntoentrelasproyeccionesalespacioFdeloselementosdelconjuntoX,ydurantetodaladiscusion se ha hablado especcamente de una matriz de similitud; la razon, esque las medidas de similitud puede ser denidas como funciones de distancia yesposibleconstruirunmedidadedistanciaapartirdelproductopuntoentredos vectores de la siguiente forma:d (x, z) = x z2donde x z2es la norma de la diferencia entre los vectoresx yz, donde lanorma de un vector se dene comox2 = x, xdonde x, z denota el producto punto entre los vectoresx yz.3.2.2.3. AlgoritmosBasadosenPrototiposEl siguiente grupo a considerar es el llamado basado en prototipos. En estecaso, el objetivo es seleccionar un conjunto de objetos del conjunto de entrena-miento, ogenerarunoapartirdeellos, querepresenteunaversioncompactadelconjuntodedatos,loselementosdeeseconjuntosedenominanprototipos[21]. En esta tecnica, el espacio de similitud se construye sobre los prototipos, esdecir, cada objeto en Xn se representa por el vector (d1, . . . , dk) donde di repre-senta la medida de similitud del objeto con el prototipoi. De esta forma, cadagrupo es representado por un prototipo y el proceso de clasicacion consiste enasignar un objeto a un grupo basado en el grado de similitud con los prototipos.Para esto pueden adoptarse diferentes estrategias dependiendo de si cada objetopuede pertenecer a un unico grupo (particion rgida) o si puede tenerse gradosde pertenencia (particion difusa) [5]. Dentro de estas estrategias se encuentrantecnicas como la de los k vecinos mas cercanos (KNN, por sus iniciales en ingles),k medias,k medoides con las correspondientes versiones difusas [21].3.2.2.4. OtrasEstrategiasDentrodeestacategoraseencuentrantrabajoscomoel de[40] endondese presenta una tecnica de agrupamiento que utiliza la matriz de similitud pa-radenirunaCadenadeMarkovdondecadaobjetorepresentaunestadoyalgunasestructurasestables, cuyaestabilidaddependedeunadistanciaentre22distribuciones de probabilidad, emergen durante la ejecucion de la cadena. Otrotrabajo relevante para destacar en este grupo de trabajos es el presentado en [6]en el cual se utiliza una estrategia supervisada para aprender la medida de disi-militud entre los datos y entonces utilizar esa medida aprendida para entrenarel algoritmo Fuzzy C-Means.3.3. Lneas de Investigacion y Problemas Abier-tosAunque el area de aprendizaje basado en similitud tiene aplicacion en mu-chas areas facilitando la denicion del modelo, de la exposicion presentada,puedeverse que el trabajo apunta basicamente en tres direcciones: deniciones de me-didas de (di)similitud, denicion de nuevos algoritmos cuyo desempe no depende unicamente de la informaci on de la (di)similitud entre los objetos y adaptacionde algoritmos al paradigma, esto es, hacer que estos algoritmos se desempe nenindependientemente de la representacion adoptada para el espacio de entrada.Dentro de las preocupaciones dentro de los investigadores en el area se en-cuentra por ejemplo el manejo de la dimensionalidad de los espacios de (di)similitud.Ya que en aplicaciones reales, es usual que haya un n umero mayor de datos quede dimensiones (para el caso de datos vectoriales), y en el enfoque directo, ca-da objeto, es representado mediante su (di)similitud con cada uno de los demasobjetos, y entonces aplicar alg un algoritmo tradicional de clasicacion en eseespacio, as que puede presentarse el problema conocido como la maldicion dela dimensionalidad. Este problema se ha enfrentado mediante el uso de meto-doscombinadosconmetodosbasadosenprototipos, enlosqueel espaciode(di)similitud se construye sobre un n umero reducido de ejemplos, de tal formaque la dimension de ese nuevo espacio resulta manejable.Vale la pena mencionar que la participacion de metodos bioinspirados en estaarea es poco, solo se cuenta con el hecho de que ciertas medidas de (di)similitudpueden ser aprendidas mediante el uso de redes neuronales [6]. Sin embargo, da-da la estrategia general del paradigma de denir una relacion de (di)similitud,hace natural pensarqueciertosmodelosbioinspiradoscomolossistemasin-munologicosarticialespuedenrepresentaruncampofertilparaexplotarestaidea, ya que el elemento clave en tales modelos es el concepto de anidad o reco-nocimiento entre celulas que usualmente ha sido representado como una funcionde la distancia de elementos en espacios vectoriales.23Captulo4ConclusionesyTrabajoFuturoEn este documento se presento una revision de las areas de redes inmunolo-gicas articiales como tecnicade aprendizaje computacional, y de aprendizajerelacional (o basado en similitud) como paradigmade aprendizaje computacio-nal. Tal presentacion muestra los conceptos basicos utilizados por un modelo dered inmunologica y las ideas basicas del paradigma relacional de aprendizaje.Comotecnicadeaprendizaje, unadelasaplicacionesmascomunesdelasredes inmunologicas articiales es ladeanalisis dedatos, especcamenteelagrupamiento de datos. La analoga consiste en suponer que los datos a analizarson antgenos de tal forma que si tales datos presentan alg un patron de agrupa-miento, los datos en un mismo grupo pueden considerarse antgenos parecidos ypor tanto, el sistema inmunologico articial creara familias de anticuerpos quereconocen esos antgenos. Los anticuerpos creados, de acuerdo a la dinamica dela red inmunologica, representaran una imagen interna del patron antigenico alque fue expuesto el sistema, es decir, los datos a analizar.Enlosmodelos,unodelosconceptoscentraleseseldelespaciodeformas(shape space), ya que en ese espacio, el reconocimiento de un antgeno por partede un anticuerpo depende de la distancia, en ese espacio, de ambos elementos.Deestaforma, puededecirsequelos modelos actuales deredinmunologicaarticial pertenecenal enfoquetradicional deaprendizaje, yaqueel primerpaso consiste en construir un espacio de formas para as denir un mecanismodereconocimiento, demaneramas especca, unamedidadeanidadentrelas celulas como una medida de distancia en ese espacio. Sin embargo, la ideabasicadereconocimientoestamediadaporcomplementariedadentreellas, esdecir,unanticuerporeconoceaunantgenosi esteencaja(matches)enaquelporsuforma, ylaanidadentreambosdependedelacalidaddeeseencaje.Deestamanerasevequeelelementoclaveenelreconocimiento,yportantoenladinamica, enel sistemainmunologico, eslaideadecomplementariedady, especcamente, la de anidad. Desde el punto de vista computacional y de24ingeniera,paraaplicarunmodeloderedinmunologicaarticialalasoluciondealg unproblema, noesnecesarioextraercaractersticasdelosobjetosdelproblemaconel ndedeniranidadcomounamedidadedistanciaeneseespacio, sino que debe denirse una medida de anidad entre tales objetos sinrestringirla al uso de una representacion particular.Deladiscusionanterior, seplantealaposibilidaddehacer, comotrabajofuturo, una equivalencia entre similitud y anidad para denir un modelo rela-cional de red inmunologica articial. Intuitivamente, se ve que el operador queresultaraafectadoconlaadaptacionaesteparadigma,eseldemutacion,yaque tradicionalmente, una celula mutada corresponde con una celula muy pare-cida a su padre, pero no igual, y que tiene potencialmente mayor anidad con elantgeno que genero la respuesta inmunologica. Esto corresponde, en el enfoquetradicional, alacreaciondeunaceluladelasvecindadesdelacelulapadre.As, enel enfoquerelacional, el operadordemutaciondeberagarantizarqueuna celula mutada conserva un cierto grado de anidad con el antgeno actual,independientemente de la representacion de las celulas. Esto debera recibir unaconsideracion importante a la hora de denir el nuevo modelo.25Bibliografa[1] O. M. Alonso, F. Nino, and M. Velez. A Robust Immune Based Approachto the Iterated Prisoners Dilemma. In G. Nicosia, V. Cutello, P. J. Bentley,and J. Timmis, editors, Proceeding of the Third Conference ICARIS, pages290 301, Edinburg, UK, September 2004. Springer.[2] P. J. BentleyandJ. Timmis. Afractal immunenetwork. InG. Nico-sia, V. Cutello, P. J. Bentley, andJ. Timmis, editors, Proceedingsof theThirdConferenceICARIS, pages 133145, Edinburg, UK, September2004. Springer.[3] AlexanderJ. SmolaBernhardSchilkopf. LearningwithKernels: SupportVector Machines, Regularization, Optimization, andBeyond. TheMITPress, 2001.[4] Manuele Bicego. Odor classication using similarity-based representation.Sensors and Actuators B: Chemical, 110(2):225230, October 2005.[5] Manuele Bicego, Vittorio Murino, and Mario Figueiredo. Similarity-basedclustering of sequences using hidden markov models. Pattern Recognition,37(12):22812291, 2004.[6] MarioG.C.A. Cimino, BeatriceLazzerini, andFrancescoMarcelloni. Anovel approach to fuzzy clustering based on a dissimilarity relation expectedfrom data using a ts system. Pattern Recognition, 39:2077 2091, 2006.[7] L. N. de Castro.Immune, swarm and evolutionary algorithms part i: Basicmodels. InICONIPConference(International ConferenceonNeural In-formationProcessing). WorkshoponArticial ImmuneSystems3, pages14641468, 2002.[8] L.N.deCastroandJ.Timmis. AnArticialImmuneNetworkforMul-timodal Optimisation. In Congress on Evolutionary Computation. Part ofthe2002IEEEWorldCongressonComputational Intelligence, pages 699 704, Honolulu, Hawaii, USA, May 2002. IEEE.[9] L. N. de Castro and J. Timmis. Articial Immune Systems: A New Compu-tational Intelligence. Spriger-Verlag, 2002.26[10] L. N. de Castro and J. Timmis. Convergence and Hierarchy of aiNet:BasicIdeasandPreliminaryResults. InProceedingsof ICARIS(InternationalConference on Articial Immune Systems), pages 231 240, University ofKentatCanterbury, September2002. Universityof KentatCanterburyPrinting Unit.[11] L. N. de Castro and F. J. V. Zuben. aiNet: An Articial Immune Networkfor Data Analysis. In H. A. Abbas R. A. S. and Charles S. Newton, editors,DataMining: AHeuristicApproach, chapterXII, pages231259. IdeaGroup Publishing, USA, 2001.[12] Shlomo Dubnov, Ran El-Yaniv, Yoram Gdalyahu, Elad Schneidman, Naf-tali Tishby, andGolanYona. Anewnonparametricpairwiseclusteringalgorithm based on iterative estimation of distance proles.Machine Lear-ning, 47(1):3561, April 2002.[13] J. D. Farmer, N. H. Packard, andA. S. Perelson. Theimmunesystem,adaptation and machine learning. Physica, 22D:187 204, 1986.[14] F. De Francesca, G. Gordano, R. Ortale, and A. Tagarelli. Distance-basedclusteringof xml documents. InLucDeRaedtTakashi Washio, editor,MGTS03,pages7578.ECML/PKDD03workshopproceedings,Septem-ber 2003.[15] S. Garret. A paratope is not an epitope: Implications for immune networkmodels andclonal selection. InE. Hart J. Timmis, P. Bentley, editor,ProceedingsoftheSecondInternational ConferenceonArticial ImmuneSystems, pages 217228, Edinburgh, UK, September 2003. Springer.[16] Gunjan K. Gupta, Alexander Strehl, and Joydeep Ghosh. Distance basedclustering of association rules. In Proceedings of the Articial Neural Net-worksinEngineeringConference(ANNIE),volume9ofIntelligentEngi-neering Systems Through Articial Neural Networks, pages 759764. ASMEPress, November 1999.[17] J. E. Hunt and D. E. Cooke. Learning using an articial immune system.ournal of Network and Computer Applications, 19:189 212, 1996.[18] A. Ishiguro, T. Kondo, Y. Watanabe, Y. Shirai, and Y. Uchikawa. Immu-noid: A Robot with a Decentralized Consensus-Making Mechanism Basedon the Immune System. In ICMAS Workshop on Immunity-Based Systems,pages 82 92, December 1996.[19] AIshiguroandUchikawaY. Agaitacquisitionofsix-leggedrobotusingimmune networks. In Proceedings of the International Conference on Intelli-gent Robotics and Systems (IROS94), volume 2, pages 10341041, Munich,Germany, 1994.27[20] F. GonzalezJ. C. Galeano, A. Veloza-Suan. Acomparativeanalysisofarticial immune network models. In Proceedings of the Genetic and Evo-lutionary Computation Conference (GECCO), Washington DC, USA, June2005. ACM Press.[21] A. K. Jain, M. N. Murty, and P. J. Flynn.Data clustering: a review.ACMComputing Surveys (CSUR), 31(3):264 323, September 1999.[22] N. Jerne. Towards a network theory of the immune system. Ann. Immunol(Inst. Pasteur), 125C:373389, 1974.[23] Nello Cristianini John Shawe-Taylor. Kernel Methods for Pattern Analysis.Cambridge University Press, 2004.[24] Mathias Kirsten and Stefan Wrobel. Relational distance-based clustering.In Fritz Wysotzki, Peter Geibel, and Christina Schadler, editors, Proc. Fa-chgruppentreenMaschinellesLernen(FGML-98), pages119124, 10587Berlin, 1998. Techn. Univ. Berlin, Technischer Bericht 98/11.[25] EdwinM. Knorr, RaymondT. Ng, andRubenH. Zamar. Robustspacetransformationsfordistance-basedoperations. InProceedingsof theSe-venthACMInternational ConferenceonKnowledgeDiscoveryandDataMining (SICKDD), pages 126135, 2001.[26] Julian Laub, Volker Roth, Joachim M. Buhmann, and Klaus-Robert M u-ller. On the information and representation of non-euclidean pairwise data.Pattern Recognition, 39(10):18151826, October 2006.[27] G.-C. Luh and W.-W. Liu. Reactive Immune Network Based Mobile RobotNavigation. In G. Nicosia, V. Cutello, P. J. Bentley, and J. Timmis, editors,Proceedingof theThirdConferenceICARIS, pages119132. Springer,2004.[28] Giuseppe Manco, Riccardo Ortale, and Domenico Sacc`a. Similarity-basedclustering of web transactions. In Proceedings of the 2003 ACM symposiumon Applied computing, pages 1212 1216, New York, NY, USA, 2003. ACMPress.[29] R. Michelan and F. J. V. Zuben. Decentralized Control System for Auto-nomousNavigationBasedonanEvolvedArticial ImmuneNetwork. InProceedings of the IEEE Congress on Evolutionary Computation, volume 2,pages 1021 1026, Honolulu, HI, May 2002. IEEE.[30] N. Mitsumoto, T. Fukuda, F. Arai, H. Tadashi, andT. Idogaki. Self-OrganizingMultipleRoboticSystem. InProceedingsof theIEEEInter-national Conference on Robotics and Automation, pages 1614 1619, Min-neapolis, April 1996.28[31] O. Nasraoui, C. Cardona, C. Rojas, and F. Gonzalez. TECNO-STREAMS:Trackingevolvingclustersinnoisydatastreamswithascalableimmunesystem learning model. In ThirdIEEEInternationalConferenceonDataMining, Melbourne, FL, November 2003. IEEE.[32] O. Nasraoui, F. Gonzalez, and D. Dasgupta. The fuzzy articial immunesystem: Motivations, basic concepts and application to clustering and webproling. In IEEEInternationalConferenceonFuzzySystems, pages 711 716, Hawaii, HI, May 2002. IEEE.[33] OlfaNasraoui,HichemFrigui,AnupamJoshi,andRaghuKrishnapuram.Miningwebaccesslogsusingrelational competitivefuzzyclustering. InProc. Eight International Fuzzy Systems Association World Congress - IF-SA 99, August 1999.[34] M. Neal. Anarticial immunesystemfor continuous analysis of time-varyingdata. InJ.TimmisandP.J.Bentley,editors,Proceedingsofthe1st International Conference on Articial Immune Systems (ICARIS), vo-lume 1, pages 76 85, University of Kent at Canterbury, September 2002.University of Kent at Canterbury Printing Unit.[35] M. Neal. Meta-stable memory in an articial immune network. In J. Tim-mis, P. Bentley, and E. Hart, editors, Proceedings of the Second Internatio-nal Conference ICARIS, pages 168 180, Edinburg, UK, September 2003.Springer.[36] A. S. PerelsonandG. Weisbach. Immunologyforphysicists. ReviewsofModern Physics, 69(4):12191267, 1997.[37] JanPuzicha,ThomasHofmann,andJoachimM.Buhmann. Atheoryofproximitybasedclustering: structuredetectionbyoptimization. PatternRecognition, 33(4):617634, April 2000.[38] T. A. Runkler and J. C. Bezdek. Web mining with relational clustering. In-ternational Journal of Approximate Reasoning, 32(2-3):217236, February2003.[39] A. Secker, A. Freitas, and J. Timmis. AISEC: An Articial Immune SystemforE-mailClassication. InR.Sarker,R.Reynolds,H.Abbass,T.Kay-Chen, R. McKay, D. Essam, andT. Gedeon, editors, Proceedingsof theCongressonEvolutionaryComputation, pages 131 139, Canberra. Aus-tralia, December 2003. IEEE.[40] Ben Taskar, Eran Segal, and Daphne Koller. Probabilistic classication andclustering in relational data. In Proceeding of IJCAI-01, 17th InternationalJoint Conference on Articial Intelligence, 2001.[41] J.TimmisandM.Neal. Aresourcelimitedarticialimmunesystemfordata analysis. Knowledge-Based Systems, 14:121 130, 2001.29[42] J. Timmis, M. Neal, andJ. Hunt. Anarticial immunesystemfordataanalysis. BioSystems, 55:143 150, 2000.[43] P. A. Vargas, L. N. de Castro, R. Michelan, and F. J. V. Zuben. An Immu-ne Learning Classier System for Autonomous Navigation. In J. Timmis,P. Bentley, andE. Hart, editors, Proceedingsof theSecondInternationalConference ICARIS, pages 69 80, Edinburg, UK, September 2003. Sprin-ger.30