Seleccion Clonal en Clasificacion

download Seleccion Clonal en Clasificacion

of 27

  • date post

    28-Oct-2015
  • Category

    Documents

  • view

    80
  • download

    0

Embed Size (px)

Transcript of Seleccion Clonal en Clasificacion

  • UNIVERSIDAD CARLOS III DE MADRID

    Aplicacin de algoritmos

    de seleccin clonal en

    problemas de

    clasificacin

    Computacin No Convencional

    Andrs Duque Fernndez. NIA: 100047570

    20/06/2010

    Mster Oficial en Ciencia y Tecnologa Informtica. Curso 2009/2010.

  • Aplicacin de algoritmos de seleccin clonal en problemas de clasificacin Computacin No Convencional. Curso 2009/2010

    2

    TABLA DE CONTENIDOS

    1. Introduccin..........................................................................................3

    2. Fundamentos tericos ..........................................................................5 2.1. El sistema inmune y la teora de seleccin clonal ..........................5 2.2. Algoritmo CLONALG......................................................................6 2.3. Algoritmo CSCA ..............................................................................8 2.4. Algoritmos y dominios de clasificacin ........................................10 2.5. Validacin cruzada........................................................................11

    3. Descripcin de la solucin..................................................................13 3.1. Dominios utilizados .......................................................................13 3.2. Descripcin del programa utilizado .............................................16

    4. Experimentacin y resultados ...........................................................19 4.1. Experimento 1: Dominio Aleatorio Sencillo .................................19 4.2. Experimento 2: Dominio Aleatorio Modificado............................20 4.3. Experimento 3: Dominio Bupa......................................................20 4.4. Experimento 4: Dominio Car ........................................................21 4.5. Experimento 5: Dominio Diabetes ................................................21 4.6. Experimento 6: Dominio Ionosphere ............................................22 4.7. Experimento 7: Dominio Iris.........................................................22 4.8. Experimento 8: Dominio Wine ......................................................23 4.9. Grficas comparativas ..................................................................23

    5. Conclusiones........................................................................................25

    6. Referencias ..........................................................................................27

  • Aplicacin de algoritmos de seleccin clonal en problemas de clasificacin Computacin No Convencional. Curso 2009/2010

    3

    1. Introduccin

    Los Sistemas Inmunolgicos Artificiales (SIA) son sistemas computacionales que imitan al sistema inmune de los animales vertebrados (ms especficamente, de los seres humanos), implementando las funciones, principios y modelos fundamentales de dicho sistema para su aplicacin en la resolucin de multitud de problemas. Estas tcnicas se comenzaron a utilizar en los aos 90 como parte de la rama de la Inteligencia Artificial que se ocupa de los sistemas con inspiracin biolgica, es decir, aqullas tcnicas que imitan comportamientos observados y analizados en la naturaleza y la biologa para resolver problemas que otros algoritmos y tcnicas no pueden resolver o para los cules ofrecen resultados poco satisfactorios. Estas mejoras aportadas por las tcnicas de los SIAs estn basadas, fundamentalmente, en las caractersticas que poseen dichos sistemas (Cruz, 2003): aprendizaje y memoria, descentralizacin, reconocimiento de patrones, paralelismo, diversidad, autorregulacin y deteccin distribuida, por lo que los SIAs se convierten en herramientas eficaces y robustas para su aplicacin en multitud de reas, como el desarrollo de antivirus, los sistemas de deteccin de intrusos (IDS), la proteccin de datos y de redes, la resolucin de problemas de bsqueda y optimizacin, la clasificacin y el reconocimiento de patrones, el aprendizaje automtico, el anlisis y la minera de datos, la navegacin autnoma de robots, etc. En el presente trabajo, se van a analizar la eficacia y el rendimiento de algunas tcnicas extradas de los SIAs, aplicadas a problemas de clasificacin en los que algoritmos clsicos de clasificacin no arrojan buenos resultados. Se van a analizar varios problemas de clasificacin, cada uno de los cules est representado por un dominio o conjunto de datos o patrones representativos del problema. Aunque existen otras tcnicas interesantes dentro de los SIAs (como la seleccin negativa o las redes inmunes), la tcnica que se va a utilizar en este trabajo es la denominada seleccin clonal, un proceso de seleccin, activacin y maduracin de las clulas del sistema inmune que permite reconocer elementos externos a dicho sistema (denominados antgenos) y activar los elementos internos del sistema (anticuerpos) para luchar contra dicho antgeno, as como mejorar el anticuerpo y memorizarlo para conseguir una defensa contra el antgeno ms rpida y ms precisa en un futuro (adaptabilidad y maduracin del sistema inmune). La implementacin de la tcnica de seleccin clonal en un algoritmo est basada en las caractersticas principales del

  • Aplicacin de algoritmos de seleccin clonal en problemas de clasificacin Computacin No Convencional. Curso 2009/2010

    4

    sistema natural (reconocimiento, seleccin, clonacin y maduracin), por lo que los algoritmos que se van a utilizar en el presente trabajo controlarn la interaccin entre los componentes del sistema inmune (en nuestro caso, los elementos clasificadores) y los antgenos externos (los patrones que se quieren clasificar). Es decir, el conjunto de anticuerpos que desarrollarn los algoritmos utilizados ser utilizado para clasificar los patrones de los dominios que sean presentados al sistema. Se van a utilizar dos algoritmos diferentes que implementan la tcnica de seleccin clonal: por una parte, el algoritmo CLONALG, que es uno de los ms utilizados por los SIAs para la resolucin de problemas de muy diversos tipos, y por otra parte, el algoritmo CSCA (Clonal Selection Classification Algorithm), una evolucin de CLONALG desarrollada para su aplicacin en problemas de clasificacin, como los que nos ocupan en este trabajo. En apartados posteriores se detallarn ambos algoritmos en mayor profundidad. El criterio principal que se utilizar para evaluar el comportamiento de los algoritmos utilizados en los problemas de clasificacin ser la tasa de acierto que presenta cada algoritmo en cada dominio probado, ya que el objetivo que se persigue es conseguir mejoras en la clasificacin que realizan otros algoritmos clsicos; sin embargo, tambin es importante prestar atencin al consumo de recursos de los algoritmos utilizados (fundamentalmente el tiempo de ejecucin), ya que aunque se consigan mejoras, si el tiempo de ejecucin es elevado habr que analizar la conveniencia de utilizar cada algoritmo en un momento concreto, o en un dominio de clasificacin en particular.

  • Aplicacin de algoritmos de seleccin clonal en problemas de clasificacin Computacin No Convencional. Curso 2009/2010

    5

    2. Fundamentos tericos

    2.1. El sistema inmune y la teora de seleccin clonal

    El sistema inmune de los vertebrados est compuesto por un conjunto de procesos que protegen al organismo de enfermedades mediante la identificacin y eliminacin de clulas patgenas y cancerosas. Aunque el sistema inmunitario est compuesto por

    varias capas (fsicas, como piel y mucosas, bioqumicas, como saliva, sudor o lgrimas, inmunes innatas e inmunes adquiridas o adaptivas), as como por muchos tipos de clulas, en este trabajo nos interesan el sistema inmune innato, ya que es el que inicia y controla la respuesta adaptativa, y el sistema inmune adquirido, ya que se ocupa de reaccionar ante los antgenos y de recordar los ataques que se han producido para mejorar la respuesta inmune en posibles ataques futuros. Asimismo, las clulas ms importantes en lo que se refiere al tema que se est tratando son los leucocitos o glbulos blancos, en concreto los linfocitos (pertenecientes al sistema adaptativo). Cuando un agente infeccioso entra en el cuerpo y los mecanismos de las capas anteriores son incapaces de detener la infeccin, los linfocitos se ocupan de la respuesta inmune: el agente infeccioso es presentado a los linfocitos de tipo T (o clulas T), que a su vez activan a los linfocitos de tipo B (o clulas B) para producir anticuerpos (especficos para cada uno de los agentes infecciosos). Adems de producir los anticuerpos, las clulas B recuerdan la respuesta inmune realizada para determinado agente externo para cuando se repita una intrusin. En lo que se refiere a la teora de la seleccin clonal, sus propiedades fundamentales son las siguientes:

    Seleccin negativa: Existe un conjunto de linfocitos que se ocupan de reconocer patrones antignicos que pertenecen al propio organismo. Estos linfocitos han de ser reconocidos y eliminados en fases tempranas del desarrollo del organismo, para evitar que se produzcan ataques a clulas propias, reconocindolas como ajenas (base de las enfermedades auto-inmunes).

    Expansin clonal: Se basa en la proliferacin y maduracin de clones cuando se produce un contacto entre linfocitos y antgenos (se detecta la presencia de elementos externos infecciosos).

  • Aplicacin de algoritmos de seleccin clonal en problemas de clasificacin Computacin No Convencional. Curso 2009/2010

    6

    Monoespecificidad: Se refiere al reconocimiento de cada antgeno por un linfocito diferente.

    Hipermutacin somtica: A la hora de realizar clonaciones de anticuerpos generados para luchar contra una infeccin, se producen cambios genticos aleatorios en dichos anticuerpos para conseguir mejores respuestas inmunes.

    Como ya se ha dicho, el proceso de seleccin clonal comienza