Incertidumbre

45
Manejo de incertidumbre e inconsistencia

Transcript of Incertidumbre

Manejo de incertidumbre e inconsistencia

Introducción

Todo sistema que tenga por objetivo simular las interacciones entre componentes inteligentes y autónomos debe de considerar el manejo de incertidumbre e inconsistencia.

Introducción

Incertidumbre– Información incompleta– Fuentes poco confiables– Detalles y hechos importantes cambian– Hechos imprecisos, vagos o difusos

La gente llega a soluciones razonables a pesar de todo

Lógica de predicados

Sistema convencional de razonamiento Trabaja con información

– Completa con respecto al dominio de interés. Todos los hechos están presentes o pueden derivarse de los que se encuentran.

– Consistente– La única forma en que pueda cambiar es

que se agreguen nuevos hechos.

Modelos

Razonamiento no monotónico– Los axiomas y/o reglas de inferencia se

complementan para permitir el razonamiento con información incompleta. Cuentan con la propiedad de que, en cualquier momento, dada una afirmación, ésta se cree verdadera, falsa, o ninguna.

Razonamiento no monotónico

La lógica clásica descansa sobre la premisa de que las deducciones que se obtienen a partir de ella son válidas y permanecen así.

Al agregar nuevos axiomas se incrementa la cantidad de conocimiento en la base de conocimientos.

El conjunto de hechos sólo puede crecer, no reducirse (monotónico).

Razonamiento no monotónico El razonamiento no monotónico

contempla el hecho de que nueva información puede cambiar las creencias o deducciones previas.

Razonamiento no monotónico

Sistemas de mantenimiento de verdad– Permite la adición de enunciados que

cambian la base de conocimientos (aún contradictorios).

– Se conocen como sistemas de verificación de creencias.

– Tienen la finalidad de mantener la consistencia del conocimiento que utiliza el resolvedor de problemas.

Razonamiento no monotónico

Sistemas de mantenimiento de verdad– No realiza funciones de inferencia.– Proporciona, al componente que realiza la

inferencia, la capacidad de realizar inferencias no monotónicas.

– Cuando descubre nuevos hechos, se reemplazan conclusiones previas no válidas.

– Mantiene el conjunto de creencias actualizado y válido.

Razonamiento no monotónico

Sistemas de mantenimiento de verdad

pedrofiestapersona

pedroestudiantebuen

YduroestudianoYfiestapersonaY

Xgradua

XduroestudiaMXestudiantebuenX

_

_

__:

__:

Modelos

Razonamiento estadístico– La representación se complementa para

permitir algún tipo de medida numérica de certeza asociada a cada afirmación o enunciado.

Razonamiento estadístico

Enfoque Bayesiano– Utilizando la teoría de probabilidades es

posible generalizar observaciones sobre eventos para llegar a afirmaciones sobre poblaciones de objetos, o viceversa, de poblaciones llegar a eventos específicos.

– Se utiliza el teorema de Bayes para manejar incertidumbre.

Teorema de Bayes

Sea {B1, B2, ..., B3} un conjunto de eventos que forman una partición en un estado muestra S, donde P(Bi) <> 0, para i = 1,2,..., n. Sea A cualquier evento de S tal que P(A) <> 0. Entonces, para K = 1,2, ... , n, se tiene:

n

iii

kkn

ii

kk

BAPBP

BAPBP

ABP

ABPABp

11

Teorema de Bayes

Probabilidad de tener un evento Bi dado que el evento A ha ocurrido.

Teorema de Bayes Ej. Si se conoce que el dos porciento de una población

tiene tuberculosis, podemos definir:– Dado el hecho: P(T) = 0.02– Variables definidas

• P(X | T) = probabilidad de que los rayos X de una persona con tuberculosis sean positivos.

• P(X | no-T) = probabilidad de que los rayos X de una persona saludable sean positivos.

• P(T | X) = probabilidad de que una persona con rayos X positivos tenga tuberculosis.

– Dada la información P(X | T) = 0.99 y P(X | no-T) = 0.01

Teorema de Bayes

Calcular P(T | X)

TnoXPTnoPTXPTP

TXPTPXTP

|

668.0

01.098.099.002.0

99.0)02.0(

Razonamiento estadístico

Mecanismos que explotan la estadística Bayesiana– Redes Bayesianas– Factores de certeza– Teoría de Dempster-Shafer (ignorancia)– Lógica difusa (vaguedad)

Redes Bayesianas

El razonamiento, utilizando el sentido común, generalmente es incierto.

Es posible construir y utilizar un método probabilístico para este tipo de razonamiento.

Se razona sobre las probabilidades en el conocimiento incierto.

Se encuentra una distribución de probabilidad que represente los posibles eventos.

Redes Bayesianas Modela la estructura causal de un proceso no

determinista. Es un grafo acíclico dirigido, G=(V,E), donde el

conjunto de vértices representa variables y cada arco las relaciones de causalidad que existen entre ellas.

La variable al final del arco es dependiente de la variable al inicio del mismo.

Cada nodo tiene una tabla de probabilidad condicional que cuantifica los efectos que los padres de un nodo tienen sobre él.

Redes Bayesianas

Las Redes Bayesianas pueden realizar cuatro tipos de inferencia– Diagnóstico (de efectos a causas)– Causales (de causas a efectos)– Intercausales (entre causas de un efecto

común)– Mixtas (combinación de dos o más de las

anteriores)

Ejemplo Alarma

Inferencia por diagnóstico: Dado que Arturo llamó, inferir la probabilidad de que hubo un asalto: P(Asalto | Arturo llamó)

Inferencia causal: Dado que hubo un asalto, inferir la probabilidad de que Arturo llame: P(Arturo llamó | Asalto)

Ejemplo Alarma

Inferencia intercausal: Dado que la alarma sonó, tenemos que P(Asalto | Alarma) = 0.376. Pero si se añade la evidencia de que hubo un terremoto, entonces P(Asalto | Alarma y Terremoto) = 0.003.

Aún cuando los asaltos y los terremotos son independientes, la presencia de alguno provoca que el otro sea menos probable.

Ejemplo Alarma

Inferencia mixta: Dado que Arturo llamó es verdadero y que terremoto es falso (inferencia de diagnóstico y causal).

P(Asalto | Arturo llamó y no-terremoto) (inferencia intercausal y de diagnóstico)

Teoría de Dempster-Shafer

Hace la distinción entre ignorancia e incertidumbre.

No conocer el valor de una variable no significa que está sujeta a incertidumbre.

Ejemplo

Definir un universo de discernimiento de hipótesis mutuamente excluyentes,

En un problema de diagnóstico este universo puede ser:

{alergia, gripa, resfrío, neumonía}

La meta es determinar alguna medida de credibilidad para los elementos de

Ejemplo

Sin embargo, no toda la evidencia confirma a un solo elemento. Es decir, si tenemos como evidencia fiebre, esta puede confirmar {gripa, resfrío, neumonía}.

Dempster-Shafer utiliza una función de densidad de probabilidad denotada m.

Ejemplo

La función m está definida no sólo para los elementos de sino también para todos sus subconjuntos.

El valor m(p) mide la cantidad de creencia que se asigna al subconjunto p de la hipótesis.

Si tiene n elementos existen 2n subconjuntos de

La suma de los valores de m asignados a los subconjuntos de es 1.

Ejemplo

Asumamos que, al inicio del diagnóstico, no existe información sobre cómo elegir entre las cuatro hipótesis. Entonces m se define como:

{ } (1.0)

Ejemplo

Todos los demás valores de m son 0. Ahora, suponemos que conocemos

cierta información que nos dice que con un 0.6 el diagnóstico está en {gripa, resfrío, neumonía}. Entonces m se actualiza como:

{ } (0.4)

{gripa, resfrío, neumonía} (0.6)

Ejemplo

Si recibimos más información que determina:

Debe calcularse la combinación de ambas informaciones para sacar el nuevo valor de m.

{ } (0.2)

{gripa, resfrío, alergia} (0.8)

Ejemplo

0 21

213 1

YX

ZYX

YmXm

YmXmZm

Ejemplo

{gripa, resfriado} (0.48)

{alergia, gripa, resfriado} (0.32)

{gripa, resfriado, neumonía} (0.12)

(0.08)

Ejemplo

Si ahora llega nueva evidencia:{alergia} (0.9)

(0.1)

Ejemplo

{gripa, resfriado} (0.104)

{alergia, gripa, resfriado} (0.696)

{gripa, resfriado, neumonía} (0.026)

{alergia} (0.157)

(0.017)

Factores de certeza

Es la forma más común de representar pesos heurísticos.

Utiliza técnicas pseudo-probabilísticas para manejar la incertidumbre.

Indican el grado de certeza en los que se cree que cada regla o hecho es verdadero.

Factores de certeza

Aplicados en el sistema MYCIN, que intentaba recomendar terapias a pacientes con infecciones bacterianas.

Factores de certeza

Se utilizan en los sistemas expertos, donde a cada regla se le asocia un valor de credibilidad a la conclusión.

Un factor de certeza se define en términos de dos componentes:– MB [h, e]– MD [h, e]

Factores de certeza

MB [h,e] – es la medida (entre 0 y 1) de credibilidad en la hipótesis h dada la evidencia e. Mide el grado en que la evidencia confirma la hipótesis.

MD [h,e] – es la medida (entre 0 y 1) de incredulidad de la hipótesis h dada la evidencia e. Mide el grado en el que la evidencia confirma negativamente la hipótesis.

Factores de certeza

El factor de certeza se mide como:

En MYCIN, los factores de certeza fueron proporcionados por expertos humanos.

ehMDehMBeh,CF ,,

Lógica difusa

Se utiliza para representar conceptos vagos o difusos.

Conjuntos difusos– En la teoría estándar un objeto pertenece

o no a un conjunto.– La lógica tradicional se basa en el hecho

de que P(a) es verdadero o falso.– Un conjunto difuso permite valores

diferentes de 0 ó 1.

Lógica difusa

Conjuntos difusos (cont.)– Sea U un conjunto enumerable o no– Sea x en elemento de U– Un subconjunto difuso de U es un

conjunto de pares ordenadospara toda x en U donde es una función característica con valores [0,1], que indica el grado o nivel de pertenencia de x en

A~

xux A, xuA

A~

Lógica difusa

Un valor de significa que x no es un miembro de , y un valor de

significa que x pertenece completamente a

Valores entre significa que x pertenece parcialmente a

0xuA

1xuA

A~

A~

10 xuA

A~

Lógica difusa

Las funciones características de los conjuntos difusos no deben confundirse con probabilidades.

Una probabilidad es la medida del grado de incertidumbre o creencia basada en la frecuencia o proporción de ocurrencia de un evento.

Una función característica difusa está relacionada con la vaguedad y es la medida de factibilidad de un evento.

Lógica difusa