REDES NEURONALES, Aprendizaje Autosupervisado

27
FEBRERO 2003 ESCOM I P N 1

Transcript of REDES NEURONALES, Aprendizaje Autosupervisado

Page 1: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 1

Page 2: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 2

AprendizajeEl aprendizaje es el proceso por medio

del cual, los parámetros libres de una red neuronal son adaptados a través de un proceso de estimulación por el ambiente en el cual la red se encuentra inmersa.

El tipo de aprendizaje es determinada por la manera en la cual el cambio de parámetros tiene lugar.

Mendel and Mc Claren (1970)

Page 3: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 3

Tipos de AprendizajeAprendizaje Supervisado

entrada, salida, objetivo

Aprendizaje Autosupervisadoentrada, salida

Aprendizaje por Reforzamiento.Recompensa/castigo

Page 4: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 4

AprendizajeSupervisado

Entrada, salida, objetivo

Se le proporciona salidas deseadas, su meta es aprender una correcta salida dada una nueva entrada

Page 5: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 5

Aprendizaje Supervisado

Se realiza mediante un entrenamiento controlado por un agente externo (supervisor, maestro), que determina la respuesta que debería generar la red apartir de una entrada determinada.

Page 6: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 6

Aprendizaje por Reforzamiento

Recompensa/castigoEste produce acciones las cuales

afectan el edo del mundo, y recibe recompensas (o castigo). Su meta es aprender a actuar de tal forma que maximise las reconpensas a largo plazo.

Page 7: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 7

Aprendizaje por Reforzamiento

El aprendizaje da una comparación entrada/salida se desempeña a través de la interacción continua del medio ambiente de tal forma que se minimice un índice escalar de su desempeño.

Page 8: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 8

Aprendizaje por Reforzamiento

Se basa en la idea de no disponer de un ejemplo completo del comportamiento deseado, es decir, la función del supervisor se reduce a indicar mediante una señal de refuerzo si la salida de la red se ajusta a la deseada (éxito=1, fracaso= -1) y en función de ello se ajustan los pesos basándose en un mecanismo de probabilidades.

Page 9: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 9

Aprendizaje Autosupervisado

Entrada y salida.

Su meta es construir representaciones de la entrada que puedan ser usadas para razonamiento, toma de decisiones, prediccion, comunicación, etc.

Page 10: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 10

Aprendizaje AutosupervisadoNo hay un maestro

o critico externo para supervisar el proceso de aprendizaje.

No existen ejemplos etiquetados de la función que será aprendida por la red

Page 11: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 11

Aprendizaje AutosupervisadoEsta constituido por un conjunto de

reglas que dan a la red la habilidad de aprender asociaciones entre los patrones que ocurren en conjunto frecuentemente.

Una vez aprendido como asociación permite a las redes realizar tareas útiles de reconocimiento de patrones y recordar.

Page 12: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 12

El aprendizaje No Supervisado no involucra valores objetivo. De hecho, los objetivos son los mismos que las entradas.

En otras palabras, el aprendizaje no supervisado usualmente realiza la misma tarea que una red autoasociativa, la compresión de la información de las entradas.

Page 13: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 13

Metas del aprendizaje Autosupervisado

Encontrar representaciones utiles de los datos.

Encontrar Clusters. p/ej. K-means, ART.

Reduccion de dimensionalidad. P/ej. Aprendizaje Hebbiano, PCA, Escalamiento multidimensional (MDS)

Page 14: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 14

Metas del aprendizaje Autosupervisado (2)

Construcción de mapas topograficos. P/ej. Mapas de Kohonen, Redes elasticas.

Encontrar causas ocultas o fuentes de datos

Modelado de densidad de datos

Page 15: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 15

Usos del Aprendizaje Autosupervisado

Compresion de DatosDeteccion de bordesClasificación Hacer otras tareas de aprendizaje

mas faciles.Una teoría del aprendizaje

humano y la percepción.

Page 16: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 16

Clustering

Cluster: Separar en subconjuntos dado un conjunto de datos Los patrones en el

mismo cluster son tan similares como sea posible.

Los patrones de diferente cluster son tan distintos como sea posible

Page 17: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 17

ClusteringDivide un conjunto de datos en

subconjuntos.P/ej. Las flores se pueden agrupar de

acuerdo a colores y numero de pétalos

Page 18: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 18

Cuantización de Vectores

Regiones de Voronoi Cada región se

representa usando un solo vector llamado “code book vector”.

Cada punto del espacio de entrada corresponde a una de estas regiones.

El espacio se divide en varias regiones conectadas llamadas regiones de Voronoi

Page 19: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 19

Cuantización de Vectores

Usado para compresión de información voluminosa de entrada en un pequeño numero de vectores de pesos

Page 20: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 20

Investigadores del Aprendizaje No Supervisado

D.O. Hebb

James Anderson

Teuvo Kohonen

Stephan Grossberg

Page 21: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 21

Tipos de aprendizaje Autoupervisado

Aprendizaje Asociativo

Aprendizaje Competitivo y Cooperativo

Page 22: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 22

Aprendizaje Asociativo

ESTIMULO

A B

•No CondicionadoNo Condicionado

•CondicionadoCondicionado

RESPUESTA

•Un concepto Un concepto

•Una acciónUna acción

Page 23: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 23

Aprendizaje Competitivo y Cooperativo

Un neurona o un grupo de ellas compiten entre si por ser la ganadora; activandose solamente la ganadora y las demás colaboran inhibiendose.

Page 24: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 24

Wake up!

Page 25: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 25

Dudas ???

Page 26: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 26

Hasta la próxima !!!

Page 27: REDES NEURONALES, Aprendizaje Autosupervisado

FEBRERO 2003 ESCOM I P N 27

Ejemplos de algoritmos que usan el Aprendizaje por Refuerzo

Algoritmo Lineal con Recompensa y penalización (Linear Reward - Penalty), Narendra /Thathacher.

Algoritmo Asociativo con recompensa y penalización (Barto / Anandan).

Adaptive Heuristic Critic (Barto, Sutton, Anderson).