Redes Neuronales

19
Redes Neuronales Redes Neuronales Daniel Ochoa Daniel Ochoa 4ºC 4ºC

Transcript of Redes Neuronales

Redes NeuronalesRedes Neuronales

Daniel Ochoa Daniel Ochoa

4ºC4ºC

IntroducciónIntroducción

La inteligencia artificial es un intento por descubrir aspectos de la La inteligencia artificial es un intento por descubrir aspectos de la inteligencia humana que pueden ser simulados mediante máquinas. inteligencia humana que pueden ser simulados mediante máquinas.

Las redes neuronales son más que otra forma de emular ciertas Las redes neuronales son más que otra forma de emular ciertas características propias de los humanos, como la capacidad de características propias de los humanos, como la capacidad de memorizar y de asociar hechos. memorizar y de asociar hechos.

Una red neuronal es "un nuevo sistema para el tratamiento de la Una red neuronal es "un nuevo sistema para el tratamiento de la información, cuya unidad básica de procesamiento está inspirada información, cuya unidad básica de procesamiento está inspirada en la célula del sistema nervioso humano: en la célula del sistema nervioso humano: la neuronala neurona".".

Una primera clasificación de los modelos de redes neuronales Una primera clasificación de los modelos de redes neuronales podría ser, atendiendo a su similitud con la realidad biológica:podría ser, atendiendo a su similitud con la realidad biológica:

1)1) El modelo de tipo biológico. El modelo de tipo biológico. 2)2) El modelo dirigido a aplicación. El modelo dirigido a aplicación.

Ventajas de las redes Ventajas de las redes neuronalesneuronales

Aprendizaje adaptivoAprendizaje adaptivoAuto - OrganizaciónAuto - OrganizaciónTolerancia a fallosTolerancia a fallos

Operación en tiempo realOperación en tiempo realFácil intersección de la tecnología existente Fácil intersección de la tecnología existente

Aprendizaje adaptivoAprendizaje adaptivo La capacidad de aprendizaje adaptativo es una de La capacidad de aprendizaje adaptativo es una de

las características más atractivas de redes las características más atractivas de redes neuronales. neuronales.

Esto es, aprenden a llevar a cabo ciertas tareas Esto es, aprenden a llevar a cabo ciertas tareas mediante un entrenamiento con ejemplos mediante un entrenamiento con ejemplos ilustrativos. ilustrativos.

Las redes neuronales son sistemas dinámicos Las redes neuronales son sistemas dinámicos autoadaptativos.autoadaptativos.

Son adaptables debido a la capacidad de auto-Son adaptables debido a la capacidad de auto-ajuste de los elementos procesales (neuronas) ajuste de los elementos procesales (neuronas) que componen el sistema. que componen el sistema.

No es problema del diseñador el cómo la red No es problema del diseñador el cómo la red aprenderá a discriminar. aprenderá a discriminar.

Auto-organizaciónAuto-organización

Las redes neuronales emplean su Las redes neuronales emplean su capacidad de aprendizaje adaptativo para capacidad de aprendizaje adaptativo para auto-organizar la información que reciben auto-organizar la información que reciben durante el aprendizaje y/o la operación. durante el aprendizaje y/o la operación.

Cuando las redes neuronales se usan para Cuando las redes neuronales se usan para reconocer ciertas clases de patronesreconocer ciertas clases de patrones

Ellas auto-organizan la información usada. Ellas auto-organizan la información usada. Cuando las redes neuronales se usan para Cuando las redes neuronales se usan para

reconocer ciertas clases de patrones, ellas reconocer ciertas clases de patrones, ellas auto-organizan la información usada. auto-organizan la información usada.

Tolerancia a fallosTolerancia a fallos

Las redes neuronales fueron los primeros Las redes neuronales fueron los primeros métodosmétodos computacionales con la capacidad inherente de computacionales con la capacidad inherente de toleranciatolerancia a fallos. a fallos.

a)a) Las redes pueden aprender a reconocer patrones Las redes pueden aprender a reconocer patrones con con ruidoruido, distorsionados o incompletos. Esta es una , distorsionados o incompletos. Esta es una tolerancia a fallos respecto a los datos. tolerancia a fallos respecto a los datos.

b)b) Las redes pueden seguir realizando su función (con Las redes pueden seguir realizando su función (con cierta degradación) aunque se destruya parte de la cierta degradación) aunque se destruya parte de la red.red.

La mayoría de los ordenadores algorítmicos La mayoría de los ordenadores algorítmicos almacenan cada pieza de información en un espacio almacenan cada pieza de información en un espacio único, localizado y direccionable. único, localizado y direccionable.

En En cambiocambio, las redes neuronales almacenan , las redes neuronales almacenan información no localizada.información no localizada.

Las redes neuronales se adaptan bien a esto debido a Las redes neuronales se adaptan bien a esto debido a su implementación paralela. su implementación paralela.

Fácil inserción dentro de la Fácil inserción dentro de la tecnología existentetecnología existente

Las redes neuronales se adaptan bien a Las redes neuronales se adaptan bien a esto debido a su implementación paralela.esto debido a su implementación paralela.

Fácil inserción dentro de la tecnología Fácil inserción dentro de la tecnología existenteexistente

Una red individual puede ser entrenada Una red individual puede ser entrenada para desarrollar una única y bien definida para desarrollar una única y bien definida tarea tarea

Tareas complejas, que hagan múltiples Tareas complejas, que hagan múltiples selecciones de patrones, requerirán selecciones de patrones, requerirán sistemas de redes interconectadas. sistemas de redes interconectadas.

Elementos de una red neuronal Elementos de una red neuronal artificialartificial

Aquellas que reciben estímulos externos relacionados con el aparato sensorial, que Aquellas que reciben estímulos externos relacionados con el aparato sensorial, que tomarán la información de entrada.tomarán la información de entrada.

Dicha información se transmite a ciertos elementos internos que se ocupan de su Dicha información se transmite a ciertos elementos internos que se ocupan de su procesamiento. Es en las procesamiento. Es en las sinapsis sinapsis y y neuronasneuronas

Correspondientes a este segundo nivel donde se genera cualquier tipo de Correspondientes a este segundo nivel donde se genera cualquier tipo de representación interna de información.representación interna de información.

Como no tienen relación directa con la información de entrada ni con la salida, estos Como no tienen relación directa con la información de entrada ni con la salida, estos elementos se denominan elementos se denominan unidades ocultas.unidades ocultas.

Una vez finalizado el período de procesado, la información llega a las unidades de Una vez finalizado el período de procesado, la información llega a las unidades de salida, cuya misión es dar la respuesta al sistema.salida, cuya misión es dar la respuesta al sistema.

Los datos ingresan por medio de la "capa de entrada", pasan a Los datos ingresan por medio de la "capa de entrada", pasan a través de la "capa oculta" y salen por la "capa de salida". Cabe través de la "capa oculta" y salen por la "capa de salida". Cabe mencionar que la capa oculta puede estar constituida por varias mencionar que la capa oculta puede estar constituida por varias capas.capas.

En la siguiente figura se compara una neurona biológica con una En la siguiente figura se compara una neurona biológica con una neurona artificial. neurona artificial.

La neurona artificial pretende mimetizar las características más importantes de las neuronas biológicas.

Cada neurona i-ésima está caracterizada en cualquier instante por un valor numérico denominado valor o estado de activación ; asociado a cada unidad, existe una función de salida, que transforma el estado actual de activación en una señal de salida.

Una función de activación, F, determina el Una función de activación, F, determina el nuevo estado de activación de la neurona, nuevo estado de activación de la neurona, teniendo en cuenta la entrada total teniendo en cuenta la entrada total calculada y el anterior estado de calculada y el anterior estado de activación .activación .

Unidades de proceso: La Unidades de proceso: La neurona artificialneurona artificial

Si se tienen N unidades (neuronas), podemos Si se tienen N unidades (neuronas), podemos ordenarlas arbitrariamente y designar la j-ésima unidad ordenarlas arbitrariamente y designar la j-ésima unidad como.como.

En cualquier sistema que se esté modelando, es útil En cualquier sistema que se esté modelando, es útil caracterizar tres tipos de unidades: entradas, salidas y caracterizar tres tipos de unidades: entradas, salidas y ocultas. ocultas.

Estado de ActivaciónEstado de Activación Junto al conjunto de unidades, la representación Junto al conjunto de unidades, la representación

necesita los estados del sistema en un tiempo necesita los estados del sistema en un tiempo t.t. Esto se especifica en un vector de N números reales Esto se especifica en un vector de N números reales

A(t), que representa el A(t), que representa el estadoestado de de activación del conjunto activación del conjunto de unidades de procesamiento. de unidades de procesamiento.

Funciones de la red Funciones de la red neuronal artificialneuronal artificial

Función de salidaFunción de salidaAsociada a cada unidad Ui (neurona) hay una función Asociada a cada unidad Ui (neurona) hay una función de salida , que transforma el estado actual de activación de salida , que transforma el estado actual de activación en una señal de salida.en una señal de salida.cuatro funciones de transferencia típicas que determinan cuatro funciones de transferencia típicas que determinan distintos tipos de neuronas:distintos tipos de neuronas:Función escalón Función escalón Función lineal y mixta Función lineal y mixta Sigmoidal Sigmoidal Función gaussianaFunción gaussianaLa función escalón únicamente se utiliza cuando las La función escalón únicamente se utiliza cuando las salidas de la red son binarias. salidas de la red son binarias. La función lineal o identidad equivale a no aplicar La función lineal o identidad equivale a no aplicar función de salida. función de salida.

Conexión entre neuronasConexión entre neuronas

Las conexiones que unen las neuronas que forman una Las conexiones que unen las neuronas que forman una RNA tienen asociado un peso que es el que hace que la RNA tienen asociado un peso que es el que hace que la red adquiera conocimiento. red adquiera conocimiento.

Consideremos como el valor de salida de una neurona Consideremos como el valor de salida de una neurona ii en un instante dado. en un instante dado.

Una neurona recibe un conjunto de señales que le dan Una neurona recibe un conjunto de señales que le dan información del estado de activación de todas las información del estado de activación de todas las neuronas con las que se encuentra conectada.neuronas con las que se encuentra conectada.

Cada conexión (sinápsis) entre la neurona Cada conexión (sinápsis) entre la neurona ii y la y la jj está está

ponderada por un pesoponderada por un peso . .

Función de Regla o activaciónFunción de Regla o activación

Así como es necesario una regla que combine Así como es necesario una regla que combine las entradas de una neurona con los pesos de las entradas de una neurona con los pesos de las conexiones, también se requiere una regla las conexiones, también se requiere una regla que combine las entradas con el estado actual que combine las entradas con el estado actual de la neurona para producir un nuevo estado de de la neurona para producir un nuevo estado de activación. activación.

Dado el estado de activación de la unidad Dado el estado de activación de la unidad UiUi y la entrada total que llega, , el estado de y la entrada total que llega, , el estado de activación siguiente, , se obtiene aplicando activación siguiente, , se obtiene aplicando una función F, llamada una función F, llamada función de activación.función de activación.

Función de activación o escalónFunción de activación o escalón

Si el conjunto de los estados de activación es E ={0,1}, Si el conjunto de los estados de activación es E ={0,1}, tenemos que:tenemos que:

Si el conjunto es E = {-1,1}, tendremos que:Si el conjunto es E = {-1,1}, tendremos que:

Función de activación lineal o Función de activación lineal o identidadidentidad

El conjunto de estados E puede contener El conjunto de estados E puede contener cualquier número real; el estado de activación cualquier número real; el estado de activación coincide con la entrada total que ha llegado a la coincide con la entrada total que ha llegado a la unidad.unidad.

Función de activación lineal-Función de activación lineal-mixtamixta

Con esta función, el estado de activación de la Con esta función, el estado de activación de la unidad está obligado a permanecer dentro de un unidad está obligado a permanecer dentro de un intervalo de valores reales prefijados.intervalo de valores reales prefijados.

Función de activación sigmoidalFunción de activación sigmoidal

Es una función continua, por tanto el espacio de Es una función continua, por tanto el espacio de los estados de activación es un intervalo del eje los estados de activación es un intervalo del eje real.real.