Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019....

43
Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades Teoría 2 (Parte B) Introducción a los Agentes Inteligentes Sistemas Inteligentes 1 1 Universidad Nacional de San Luis, Argentina Carrera: Ingeniería en Informática Carrera: Ingeniería en Computación (Optativa) Departamento de Informática Año 2019

Transcript of Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019....

Page 1: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Teoría 2 (Parte B)Introducción a los Agentes Inteligentes

Sistemas Inteligentes1

1Universidad Nacional de San Luis, Argentina

Carrera: Ingeniería en InformáticaCarrera: Ingeniería en Computación (Optativa)

Departamento de InformáticaAño 2019

Page 2: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Aspectos a abordar

Agentes reflejos (o reactivos) simplesAgentes reflejos basados en modeloAgentes basados en objetivosAgentes basados en utilidadesRepresentación de estados y transicionesAgentes de Aprendizaje

Bibliografía: Capítulo 2, libro de Russell. Sección 2.4.

Page 3: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Clases generales de programas de agentes

Agentes reflejos (o reactivos) simplesAgentes reflejos basados en modeloAgentes basados en objetivosAgentes basados en utilidades

Estos tipos de agentes pueden a su vez ser implementadoscomo agentes de aprendizaje.

Page 4: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Clases generales de programas de agentes

Agentes reflejos (o reactivos) simplesAgentes reflejos basados en modeloAgentes basados en objetivosAgentes basados en utilidades

Estos tipos de agentes pueden a su vez ser implementadoscomo agentes de aprendizaje.

Page 5: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes reflejos simples (ARS)

También llamados agentes reactivos puros o agentestropísticos.Seleccionan una acción en base a la percepción actual,ignorando el resto de la historia perceptual (el pasado).No existe internamente ninguna representación deestado.La decisión sobre la acción a tomar se basa en unconjunto de reglas condición-acción (o situación-acción).

Ejemplo:

si auto-adelante-esta-frenando entoncescomenzar-a-frenar

Page 6: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes reflejos simples (ARS)

También llamados agentes reactivos puros o agentestropísticos.Seleccionan una acción en base a la percepción actual,ignorando el resto de la historia perceptual (el pasado).No existe internamente ninguna representación deestado.La decisión sobre la acción a tomar se basa en unconjunto de reglas condición-acción (o situación-acción).

Ejemplo:

si auto-adelante-esta-frenando entoncescomenzar-a-frenar

Page 7: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Un ejemplo de agente reactivo

Un agente reactivo para el mundo de la aspiradora

función AG-REF-ASPIRA(p)entrada: una percepción p = [ubic,est ].salida: una acción a ∈ {Aspirar ,Derecha, Izquierda,NoOp}.

si est = Sucio entonces retornar Aspirarsino si ubic = A entonces retornar Derechasino si ubic = B entonces retornar Izquierda

fin_función

Page 8: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Un agente reactivo genérico

función AG-REF-SIMPLE(percep) retorna una acciónestático: reglas: un conjunto de reglas condición-acción.

estado ← INTERPRETAR-ENTRADA(percep)regla← REGLA-MATCH(estado, reglas)

accion← ACCIÓN-REGLA[regla]fin_función

Page 9: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Un robot reactivo: vehículo de Braitenberg

Page 10: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Características de los agentes reactivos

Su comportamiento es dirigido por el principio deestímulo-respuesta característico de los reflejos de humanos,animales y plantas.

VentajasSimplicidad.Tiempo de respuesta mínimo.Reglas simples pueden producir comportamientoscolectivos complejos.Implementación directa en hardware (bueno pararobótica).

Page 11: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Características de los agentes reactivos

Su comportamiento es dirigido por el principio deestímulo-respuesta característico de los reflejos de humanos,animales y plantas.

VentajasSimplicidad.Tiempo de respuesta mínimo.Reglas simples pueden producir comportamientoscolectivos complejos.Implementación directa en hardware (bueno pararobótica).

Page 12: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Características de los agentes reactivos

Su comportamiento es dirigido por el principio deestímulo-respuesta característico de los reflejos de humanos,animales y plantas.

LimitacionesSólo trabajan bien si la acción correcta puededeterminarse en base a la percepción actual.Posibilidad de loops infinitos bajo observabilidad parcial.Incapacidad de analizar la consecuencia futura de lasacciones.

Page 13: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes reflejos basados en modelos (ARBM)

También llamados agentes reflejos con estado.

Cuentan con alguna estructura de datos o estado internoque registra información sobre el estado del ambiente y lahistoria perceptual.Actualizar la información de estado interno requiere unmodelo del mundo:

De que manera las acciones del agente modifican elmundo.De que manera el mundo evoluciona independientementedel agente.

El estado interno permite solucionar o aliviar losproblemas de observabilidad parcial.Si bien toma en cuenta el pasado no considera el futuro(no planifica).

Page 14: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes reflejos basados en modelos (ARBM)

También llamados agentes reflejos con estado.Cuentan con alguna estructura de datos o estado internoque registra información sobre el estado del ambiente y lahistoria perceptual.

Actualizar la información de estado interno requiere unmodelo del mundo:

De que manera las acciones del agente modifican elmundo.De que manera el mundo evoluciona independientementedel agente.

El estado interno permite solucionar o aliviar losproblemas de observabilidad parcial.Si bien toma en cuenta el pasado no considera el futuro(no planifica).

Page 15: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes reflejos basados en modelos (ARBM)

También llamados agentes reflejos con estado.Cuentan con alguna estructura de datos o estado internoque registra información sobre el estado del ambiente y lahistoria perceptual.Actualizar la información de estado interno requiere unmodelo del mundo:

De que manera las acciones del agente modifican elmundo.De que manera el mundo evoluciona independientementedel agente.

El estado interno permite solucionar o aliviar losproblemas de observabilidad parcial.Si bien toma en cuenta el pasado no considera el futuro(no planifica).

Page 16: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes reflejos basados en modelos (ARBM)

También llamados agentes reflejos con estado.Cuentan con alguna estructura de datos o estado internoque registra información sobre el estado del ambiente y lahistoria perceptual.Actualizar la información de estado interno requiere unmodelo del mundo:

De que manera las acciones del agente modifican elmundo.De que manera el mundo evoluciona independientementedel agente.

El estado interno permite solucionar o aliviar losproblemas de observabilidad parcial.

Si bien toma en cuenta el pasado no considera el futuro(no planifica).

Page 17: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes reflejos basados en modelos (ARBM)

También llamados agentes reflejos con estado.Cuentan con alguna estructura de datos o estado internoque registra información sobre el estado del ambiente y lahistoria perceptual.Actualizar la información de estado interno requiere unmodelo del mundo:

De que manera las acciones del agente modifican elmundo.De que manera el mundo evoluciona independientementedel agente.

El estado interno permite solucionar o aliviar losproblemas de observabilidad parcial.Si bien toma en cuenta el pasado no considera el futuro(no planifica).

Page 18: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Estructura de un ARBM

función AG-REF-BAS-MODELO(percep) retorna una acciónestático: estado: una descripción del estado actual del mundo.

modelo: descripción del efecto de las acciones.reglas: un conjunto de reglas condición-acción.accion: la acción más reciente (inicial/ ninguna).

estado ← ACTUALIZAR-ESTADO(estado,accion,percep,modelo)regla← REGLA-MATCH(estado, reglas)

accion← ACCIÓN-REGLA[regla]fin_función

Page 19: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Arquitecturas con estado: Recurrent Neural Networks

Traducción de lenguajes

Page 20: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Deduciendo propiedades ocultas del mundo

Page 21: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Deduciendo propiedades ocultas del mundo

Page 22: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Deduciendo propiedades ocultas del mundo

Page 23: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Deduciendo propiedades ocultas del mundo

Page 24: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Deduciendo propiedades ocultas del mundo

Page 25: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes basados en objetivos (ABO)

En la selección de acciones se toma en cuentainformación sobre los objetivos (estados deseables) aalcanzar.

El logro de un objetivo puede requerir analizar lasconsecuencias futuras de secuencias completas deacciones ( planes).Dos grandes grupos de ABO

Agentes de búsqueda.Agentes de planning.

Comparación respecto a los agentes reflejos (ARS’s yARBM’s):

Son menos eficientes.Son más flexibles (cambios de objetivo y condicionescambiantes).

Page 26: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes basados en objetivos (ABO)

En la selección de acciones se toma en cuentainformación sobre los objetivos (estados deseables) aalcanzar.El logro de un objetivo puede requerir analizar lasconsecuencias futuras de secuencias completas deacciones ( planes).

Dos grandes grupos de ABOAgentes de búsqueda.Agentes de planning.

Comparación respecto a los agentes reflejos (ARS’s yARBM’s):

Son menos eficientes.Son más flexibles (cambios de objetivo y condicionescambiantes).

Page 27: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes basados en objetivos (ABO)

En la selección de acciones se toma en cuentainformación sobre los objetivos (estados deseables) aalcanzar.El logro de un objetivo puede requerir analizar lasconsecuencias futuras de secuencias completas deacciones ( planes).Dos grandes grupos de ABO

Agentes de búsqueda.Agentes de planning.

Comparación respecto a los agentes reflejos (ARS’s yARBM’s):

Son menos eficientes.Son más flexibles (cambios de objetivo y condicionescambiantes).

Page 28: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes basados en objetivos (ABO)

En la selección de acciones se toma en cuentainformación sobre los objetivos (estados deseables) aalcanzar.El logro de un objetivo puede requerir analizar lasconsecuencias futuras de secuencias completas deacciones ( planes).Dos grandes grupos de ABO

Agentes de búsqueda.Agentes de planning.

Comparación respecto a los agentes reflejos (ARS’s yARBM’s):

Son menos eficientes.Son más flexibles (cambios de objetivo y condicionescambiantes).

Page 29: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Estructura de un ABO

Page 30: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes basados en utilidades (ABU)

Permiten realizar una distinción más fina (no binaria) entrelos estados que los ABO.

Cuentan con una función de utilidad

U : S → R

que captura las preferencias del agente por los estadosdel mundo.La utilidad de un estado cuantifica el grado de felicidad (odeseabilidad) de estar en el mismo.Un ABU es más adecuado que un ABO cuando:

Es necesario balancear objetivos conflictivos.Es necesario ponderar la importancia y probabilidad desuceso de varios objetivos para los que no existe certezade ser alcanzados.

Page 31: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes basados en utilidades (ABU)

Permiten realizar una distinción más fina (no binaria) entrelos estados que los ABO.Cuentan con una función de utilidad

U : S → R

que captura las preferencias del agente por los estadosdel mundo.

La utilidad de un estado cuantifica el grado de felicidad (odeseabilidad) de estar en el mismo.Un ABU es más adecuado que un ABO cuando:

Es necesario balancear objetivos conflictivos.Es necesario ponderar la importancia y probabilidad desuceso de varios objetivos para los que no existe certezade ser alcanzados.

Page 32: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes basados en utilidades (ABU)

Permiten realizar una distinción más fina (no binaria) entrelos estados que los ABO.Cuentan con una función de utilidad

U : S → R

que captura las preferencias del agente por los estadosdel mundo.La utilidad de un estado cuantifica el grado de felicidad (odeseabilidad) de estar en el mismo.

Un ABU es más adecuado que un ABO cuando:Es necesario balancear objetivos conflictivos.Es necesario ponderar la importancia y probabilidad desuceso de varios objetivos para los que no existe certezade ser alcanzados.

Page 33: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes basados en utilidades (ABU)

Permiten realizar una distinción más fina (no binaria) entrelos estados que los ABO.Cuentan con una función de utilidad

U : S → R

que captura las preferencias del agente por los estadosdel mundo.La utilidad de un estado cuantifica el grado de felicidad (odeseabilidad) de estar en el mismo.Un ABU es más adecuado que un ABO cuando:

Es necesario balancear objetivos conflictivos.Es necesario ponderar la importancia y probabilidad desuceso de varios objetivos para los que no existe certezade ser alcanzados.

Page 34: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

ABU’s y el principio de la UEM

Un agente ABU sigue los principios de teoría de decisiónpara balancear la deseabilidad (utilidad) de los resultadoscon la probabilidad de que éstos ocurran.

El principo de la utilidad esperada máxima (UEM)especifica que un agente racional debería seleccionaraquella acción que maximiza su utilidad esperada.

En este caso, un agente ABUselecciona la acción a2 conutilidad esperada:

23× 9 +

16× 0 +

16× 0 = 6

Page 35: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

ABU’s y el principio de la UEM

Un agente ABU sigue los principios de teoría de decisiónpara balancear la deseabilidad (utilidad) de los resultadoscon la probabilidad de que éstos ocurran.El principo de la utilidad esperada máxima (UEM)especifica que un agente racional debería seleccionaraquella acción que maximiza su utilidad esperada.

En este caso, un agente ABUselecciona la acción a2 conutilidad esperada:

23× 9 +

16× 0 +

16× 0 = 6

Page 36: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

ABU’s y el principio de la UEM

Un agente ABU sigue los principios de teoría de decisiónpara balancear la deseabilidad (utilidad) de los resultadoscon la probabilidad de que éstos ocurran.El principo de la utilidad esperada máxima (UEM)especifica que un agente racional debería seleccionaraquella acción que maximiza su utilidad esperada.

En este caso, un agente ABUselecciona la acción a2 conutilidad esperada:

23× 9 +

16× 0 +

16× 0 = 6

Page 37: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

ABU’s y Juego de dos personas - Minimax (1)

Page 38: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

ABU’s y Juego de dos personas - Minimax (2)

Page 39: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Algunos conceptos asociados a los ABU

Teoría de DecisiónTeoría de UtilidadTeoría de la ProbabilidadProcesos de Decición Markov (MDP’s)POMDP’sMétodos de Programación DinámicaAprendizaje por RefuerzosTeoría de JuegosEquilibrio de NashMecanismos económicos (subasta, votación, mercado,etc)

Page 40: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Representando estados y transiciones entre los mismos

¿Cómo representaré los estados del mundo y los efectos delas acciones (modelo de transición)? Enfoques:

AtómicaFactorizadaEstructurada

Page 41: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Representando estados y transiciones entre los mismos

Atómica: un estado es una caja negra (indivisible) sinestructura interna.Factorizada: un estado consiste de una colección devalores de atributos (reales, booleanos o de un conjuntofijo).Estructurada: cada estado incluye objetos, cada uno delos cuales puede tener atributos propios y tambiénrelaciones a otros objetos.

Page 42: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Agentes de aprendizaje

Incorporan la capacidad de aprender y mejorar sudesempeño a partir de la experiencia.Componentes conceptuales

Elemento de performance: componente que selecciona lasacciones externas (lo que antes era el agente completo).Elemento de aprendizaje: componente encargada dehacer las mejoras (cambios) en el elemento deperformance.Crítico: informa al alemento de aprendizaje cuán bien elagente se está comportando (de acuerdo a una medida deperformance establecida).Generador de problema: sugiere al elemento deaprendizaje acciones exploratorias que conducen aexperiencias nuevas e informativas.

Page 43: Teoría 2 (Parte B) Introducción a los Agentes Inteligentes - Universidad Nacional de ... · 2019. 8. 23. · Agentes reflejos simples Agentes reflejos basados en modelo Agentes

Agentes reflejos simples Agentes reflejos basados en modelo Agentes basados en objetivos Agentes basados en utilidades

Un agente de aprendizaje general