UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

63
UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE MATEMÀTIQUES I ESTADÍSTICA Tesis de Master en Ingeniería Matemática t-Normas y Teorema de Ling Jesús Sols Lucia Director: Dr. Lluis Belanche Muñoz Departament de Llenguatges i Sistemes Informàtics

Transcript of UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

Page 1: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

UNIVERSITAT POLITÈCNICA DE CATALUNYA

FACULTAT DE MATEMÀTIQUES I ESTADÍSTICA

Tesis de Master en Ingeniería Matemática

t-Normas y Teorema de Ling

Jesús Sols Lucia

Director: Dr. Lluis Belanche Muñoz

Departament de Llenguatges i Sistemes Informàtics

Page 2: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

A mis padres

Page 3: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

Resumen

Palabras clave: Relaciones borrosas, t-normas

MSC2010: 03E72

El teorema de Ling demuestra que existe un generador aditivo único para

cada t-norma arquimediana y continua. Se trata de un teorema básico de la teoría

de t-normas, la cual se utiliza en la teoría de relaciones fuzzy. En la construcción

de Ling, este generador es construido partiendo del valor de su función pseudoin-

versa sobre todos los números racionales positivos. En esta memoria es construido

de una manera más simple y eficiente, partiendo de sólo los valores de la función

pseudoinversa sobre los números diádicos positivos.

Como aplicación de este teorema, tras recordar la familia de t-normas de

Schweizer y Sklar y también la de Yager, encontramos una familia que en buena

parte generaliza a ambas. Además definimos una nueva familia de t-normas para

controlar la transitividad de la relación de equivalencia borrosa de indistinguibili-

dad en procesos de observación aleatorios que siguen una distribución de Poisson.

Page 4: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

Abstract

keywords: fuzzy relations, t-norms

MSC2010: 03E72

The theorem of Ling asserts the existence of a unique additive generator for

each continuous Archimedean t-norm. It is a basic theorem of the theory of t-

norms, which is used in the theory of fuzzy relations. In the original proof of Ling,

this generator is constructed by specifying the value of the quasiiverse function

of this generator on all positive rationals. In this memoir, it is constructed in a

more simple and efficient way, starting with its values on only the positive dyadic

numbers.

As an application of this theorem, we find a new family of t-norms which

generalizes to a wide extent the Schweizer and Sklar’s family as well as the

Yager’s family, which we recall at the beginning. We also provide a new family

of t-norms to control the transitivity of the fuzzy relation of indistinguishability in

random procedures of observation following a Poisson distribution.

Page 5: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

1

Introducción

Este documento es mi memoria para la obtención del grado de Master en Inge-

niería Matemática de la Universitat Politécnica de Catalunya. Mi agradecimiento

al Dr. Lluis Belanche por haber sido mi director, y al Dr. Jordi Recasens por

haberme introducido al interesante tema de las t-normas.

Las t-normas son de especial interés en matemática fuzzy. Como es sabido, las

matemáticas fuzzy o borrosas sustituyen el grado de pertenencia de un elemento

a un conjunto, por un grado que no sólo puede valer cero o uno, sino que puede

tomar también valores intermedios.

Así por ejemplo dado un conjunto X , cualquier subconjunto suyo en sentido

clásico (crisp) es representable mediante su función característica

µ : X :−→ 0,1

donde µ(x) = 0 indica que x no pertenece al subconjunto, mientras que µ(x) = 1

indica la plena pertenencia de x al subconjunto. Un subconjunto borroso viene

dado por una aplicación µ : X −→ [0,1] de X en el intervalo unidad, donde µ(x)

indica nuevamente el grado de pertenencia de x al subconjunto pero pudiendo

ahora ese grado alcanzar valores intermedios.

Observemos que, dados dos subconjuntos clásicos de X , definidos mediante

sus funciones características µ, µ ′, su intersección es un subconjunto también

clásico de X cuya función característica es

(µ ∩µ′)(x) = µ(x) ·µ(x′) =

1, si ambos son 1

0 , si alguno es cero

Vemos pues que, en el caso clásico, dado un elemento x con dos grados de

pertenencia respectivos a dos subconjuntos, el grado de pertenencia a la intersec-

ción es menor o igual que cualquiera de los grados originales y en concreto es

Page 6: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

2

el producto de grados. En este caso también podríamos, con el mismo resultado,

haber tomado la expresión

(µ ∩µ′)(x) = max0,µ(x)+µ

′(x)−1 (Lukasiewick)

o aún

(µ ∩µ′)(x) = minµ(x),µ ′(x) (Mínimo)

Estas distinciones no son superfluas cuando hablamos de conjuntos borrosos.

Si conocemos los respectivos grados de pertenencia µ(x) y µ ′(x) de un elemento

x ∈ X a los subconjuntos difusos µ y µ ′ nos planteamos qué grado mínimo de

pertenencia de x a la intersección podremos garantizar, o qué es lo que en térmi-

nos borrosos entenderemos como intersección.

En general, si se cumplen dos condiciones, cada una en cierto grado queremos

establecer el grado mínimo en que entendemos se cumplen ambas. Ese grado

mínimo definirá el conjunto intersección

(µ ∩µ′)(x) = π(µ(x),µ ′(x))

con cierta π : [0,1]2 −→ [0,1]

Esta función π es por tanto la que asigna a cada par (a,b) de grados de

pertenencia de un x ∈ X a sendos subconjuntos µ y µ ′ su grado π(a,b) de

pertenencia a la intersección.

Es natural exigir que la función π sea conmutativa y asociativa:

(T1) π(a,b) = π(b,a) (Conmutatividad)

(T2) π(a,π(b,c)) = π(π(a,b),c) (Asociatividad)

Si a ≤ b, ¿Qué relación debe haber entre π(a,c) y π(b,c)? No cabe duda de

que fijado un grado de cumplimiento de una condición, se nos crea una relación de

monotonía: Cuanto menos sepamos de la otra condición, en menor o igual grado

se darán ambas simultáneamente. Es pues natural exigir también

Page 7: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

3

(T3)

a≤ b implica que para todo c ∈ [0,1], es π(a,c)≤ π(b,c) (Monotonía)

Por último nos planteamos qué deberá valer π(a,1). Si un elemento x ∈ X

pertenece a dos subconjuntos borrosos µ,µ ′de X con grados respectivos µ(x) = a

y µ ′(x) = 1 , el grado de pertenencia a su intersección debe ser a. Es pues natural

tomar como axioma

(T4) π(a,1) = a (condición de contorno)

A las aplicaciones que cumplen las condiciones T1 a T4 las llamamos t-

normas y las notamos habitualmente como T .

Las t-normas son de particular interés en la teoría de las relaciones de equiva-

lencia borrosas sobre un conjunto X , esto es aplicaciones

R : X×X −→ [0,1]

que satisfacen una obvia propiedad de simetría (R(x,y) = R(y,x)), y de reflexivi-

dad (R(x,x) = 1), pero con una propiedad de transitividad que es relativa a una

t-norma T : Si R(x,y) = a, R(y,z) = b , entonces R(x,z) ≥ T (a,b). Se pide a T

las propiedades T1-T4 para dar sentido a la T - transitividad. En algunos casos

se requiere además que, para todo a ∈ (0,1), se cumpla T (a,a) < a (T5); y que

T sea continua (T6). Cuando T satisface T1-T6, decimos que T es una t-norma

arquimediana y continua. Un resultado conocido e inmediato es que cualquier

función estrictamente decreciente y continua

t : [0,1]−→ [0,∞]

tal que t(1) = 0 genera aditivamente una t-norma arquimediana y continua, en el

sentido que se hace preciso en el enunciado de este lema. Un teorema de Ling en

1965 afirma el reciproco de este lema: cualquier t-norma arquimediana y continua

Page 8: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

4

es generada aditivamente por una función t estrictamente decreciente y continua,

con t(1) = 0, siendo t única salvo multiplicación por constante. Presentamos en

el capítulo 2 una demostración del teorema de Ling más simple que la aportada

por la propia autora.

Tras recordar el lema fácil y directo, como aplicación nos ocupamos de fun-

ciones estrictamente decrecientes y continuas

h : [0,1]−→ [0,1]

que asignan a cada probabilidad s de dos elementos x,y de un conjunto X resulten

distintos en la observación de un único factor aleatorio, la probabilidad h(s) de

que x,y sean distinguidos tras diferentes instancias de observación. Las inversas

t de las diferentes instancias de h generan aditivamente t-normas arquimedianas

y continuas, cada una de ellas adecuada a una situación distinta. En particular,

definimos una nueva familia de t-normas adecuada a la transitividad de la relación

de equivalencia borrosa resultante de asignar a cada dos elementos x,y ∈ X de

un conjunto su grado de indistinguibilidad tras la observación de un número n

de aspectos aleatorios, cuando se ha fijado por adelantado las probabilidades de

distinguirlos para cada r≤ n discordancias. (Estas t-normas incluyen como casos

particulares la t-norma de Lukasiewicz y algunas de las t-normas de Schweizer-

Sklar, y de Yager, teniendo por tanto como casos límite la t-norma producto y la

t- norma drástica); Describimos también una familia de t-normas que se adecúa a

condiciones de observación regidas por procesos de Poisson.

Finalmente, y como material preparatorio, recordemos que si una función

t : [x1,x2] [y1,y2]⊆ [z1,z2]

entre intervalos reales cerrados, con xi,yi,zi posiblemente +∞ or−∞, es continua

y estrictamente decreciente, entonces su pseudoinversa t [−1] es la extensión de la

Page 9: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

5

función estrictamente decreciente y continua

t−1 : [y1,y2] [x1,x2]

a una función continua no decreciente t [−1] : [z1,z2] [x1,x2] definida por t [−1](z)=

x2 si z < y1; y t [−1](z) = x1 si z > y2.

Un resumen de esta memoria va a aparecer publicado en las actas del congreso

Estylf 2012 sobre tecnologías y lógica fuzzy.

Page 10: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

6

CAPÍTULO 1: t-NORMAS

Dedicamos esta primera parte de la memoria a recordar la teoría de las t-

normas, y en particular ciertas familias conocidas de t-normas que aparecerán

aquí como casos particulares de la nueva familia que construiremos.

Elección de t-normas

Pretendemos difuminar nuestro concepto clásico (crisp) de una relación de

equivalencia. Recordemos que una relación de equivalencia sobre un conjunto X

se puede caracterizar mediante

R : X×X −→ 0,1

dondeR(a,b) = 1 si y sólo si a∼ b

R(a,b) = 0 , en caso contrario

cumpliéndose:

1. R(x,x) = 1 (reflexividad)

2. R(x,y) = R(y,x) (simetría)

3. R(x,y) = 1 y R(y,z) = 1 implican R(x,z) = 1 (transitividad)

Ahora partiremos de relaciones borrosas E : X ×X −→ [0,1], por tanto de

subconjuntos borrosos de X ×X . Cada par de elementos x,y está relacionado en

cierto grado E(x,y). Para una versión fuzzy de las relaciones de equivalencia,

asumimos que estas relaciones borrosas han de ser reflexivas y simétricas si bien

se manejan modelos con estas propiedades debilitadas o ausentes. Pero la cuestión

clave es el modo de expresar la transitividad en una relación borrosa. No tendría

mucho sentido que si el grado de relación entre x e y fuera alto, por ejemplo

Page 11: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

7

R(x,y)= a= 0.99 y también lo fuera la relación entre y y z,por ejemplo R(y,z))=

b = 0.99 resultara que el grado mínimo garantizado de relación entre el primero

y el tercero fuera muy bajo, por ejemplo que sólo pudieramos garantizar R(x,z)≥

0.1.

Sea a ∗ b la cota mínima garantizada de relación entre dos elementos cuando

media un tercer elemento con el que respectivamente se relacionan con grados a

y b. Observemos que

• La cota mínima garantizada no debe depender del orden en que aparezcan

los grados de relación , es decir a∗b = b∗a (conmutatividad)

• En general, la cota mínima garantizada debe depender del conjunto de grados

de relación que se interpongan, no de su orden ni de la forma en que los asociemos.

Por tanto (a∗b)∗ c = a∗ (b∗ c) (asociatividad)

• Si aumenta uno de los grados de relación, la cota mínima garantizada no

puede reducirse, es decir que es natural exigir que b≤ c implique a∗b≤ a∗ c

(monotonía)

• Por último, si una de las dos relaciones es segura (b = 1) la relación mínima

entre x y z es el grado en que se da la otra relación, esto es a∗1 = a (condición

de contorno)

En definitiva, para tratar la transitividad de una relación en el caso borroso es-

tamos garantizando un grado R(x,z) que satisface las propiedades que exigiríamos

al cumplimiento simultáneo de la relación entre x e y y de la relación entre y y z,

pues la idea es que en tanto esas dos relaciones se den, se relacionarán x y z, lo

cual es el concepto de transitividad.

Así pues

a∗b = T (a,b)

es una t-norma que expresa el mínimo grado de relación garantizado entre x y

z si media un elemento con el que se relacionan respectivamente con grados de

Page 12: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

8

relación a y b .

Definición: Una operador de T - indistinguibilidadad en un conjunto X es una

aplicación

E : X×X −→ [0,1]

que es reflexiva, simétrica y con una transitividad regulada por la t-norma T .

Operadores de indistinguibilidad asociados a una t-norma dada.

Dada una t-norma T continua (que lo sea como función) y un conjunto

X , interesa tratar de las relaciones de indistinguibilidad que se podrían definir

teniendo a esta t-norma como criterio de transitividad. Un subconjunto fuzzy µ

de X nos provee de una relación de este tipo. La idea es que, a través de este

subconjunto fuzzy µ,dos elementos x e y de X serán tanto más indistiguibles

cuanto más próximos entre sí estén sus grados µ(x) y µ(y) de pertenencia al

subconjunto µ. Pero mediremos este grado de proximidad en términos de la t-

norma T . Si es m = min µ(x),µ(y) y M = max µ(x),µ(y) tomamos como

grado de indistinguibilidad entre x e y el valor

A = maxa ∈ [0,1] | M ∗a≤ m= Eµ (x,y)

Lema: Dado un subconjunto fuzzy µ de un conjunto X y T una t-norma

continua la relación Eµ definida en X es un T - operador de indistinguibilidad.

Podemos forzar el contraste entre elementos x e y del conjunto X controlando

sus respectivos grados de pertenencia a los miembros de toda una familia (µi)i∈I

de subconjuntos borrosos de X . En este caso tomaremos como grado de indistin-

guibilidad el ínfimo de los grados obtenidos por separado. O sea

E(x,y) = infi∈I

Eµi(x,y)

Page 13: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

9

que se puede demostrar fácilmente que es un T -operador de indistinguibilidad.

De hecho, para una t-norma T continua, los únicos T - operadores de indistin-

guibilidad son los obtenidos de este modo, con lo que se llega al importante

Teorema de Representación: Dado un conjunto X y una t-norma continua

T , una relación borrosa R sobre X será un T - operador de indistinguibilidad

si y solo si existe una familia (µi)i∈I de subconjuntos borrosos tal que para todo

x,y ∈ X se cumple

R(x,y) = infi∈I

Eµi(x,y)

La t-norma asociada a una relación de posibilidad

Si entre los elementos de un conjunto un conjunto X establecemos un crite-

rio de medida de la indistinguibilidad de cualquier par de elementos, obtenemos

una relación E : X ×X −→ [0,1] para la que habremos de buscar a posteriori la

t-norma T apropiada que convierta a E en un operador de T - indistinguibilidad.

Esta es una idea que vamos a desarrollar en este trabajo: vamos a tratar del modo

en que distintos criterios de indistinguibilidad dan lugar a distintas cotas de tran-

sitividad. Trataremos en especial del caso en que la relación de indistinguibilidad

se construye a partir de diferentes condiciones de observación.

Consideremos primero la t-norma asociada a una relación de posibilidad. Par-

timos de un grafo G en el que dos objetos serán indistinguibles (o resultarán

"equivalentes") en cuanto se establezca cierto concepto de conexión entre ellos.

Cada una de las ramas entre dos nodos tiene una probabilidad de permitir la conex-

ión si ésta es solicitada. El grado de indistinguibilidad (o similaridad ) entre dos

nodos vendrá dado por la probabilidad de obtener esa conexión si la reclamamos

por la vía más eficiente.

Page 14: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

10

Proposición: Si el criterio de indistinguibilidad en un grafo con probabili-

dades asignadas a las ramas es la máxima (o suprema) opción de conexión por

alguna vía, entonces la cota mínima de relación entre dos elementos con otro el-

emento interpuesto con el que se relacionan respectivamente con grados a , y b

es

T (a,b) = a ·b

y a ésta denominamos t-norma Producto.

Demostración: En efecto, en el caso finito, dados elementos x, y,z del conjunto

X , si x,y se conectan por un camino con probabilidad a y existe otro camino que

conecta y,z con probabilidad b , entonces la unión de estos caminos enlaza x,z con

probabilidad a · b. Así pues a · b ≤ E(x,z) , que es la mejor opción de conexión.

Por tanto tomando T (a,b) = a · b la relación borrosa E es un T - operador de

distinguibilidad.

En el caso infinito, tenemos una sucesión de caminos enlazando x , y con

probabilidades crecientes (an)n∈N con liman = a , y otra sucesión de caminos en-

lazando y,z con probabilidades crecientes (bn)n∈N con limbn = b. Emparejando

los caminos γn con los γ1n (no es preciso hacer todas las combinaciones), se

obtiene una sucesión de caminos que enlazan x,z con probabilidades crecientes

an· bn siendo lim(an· bn) = a ·b. Estos caminos forman un subconjunto del con-

junto de caminos que enlazan x,z. Por tanto el supremo de las probabilidades de

conexión a través de ellos es menor o igual que el supremo global de las conex-

iones entre x,z o sea a ·b≤ E(x,z) por tanto tomando de nuevo T (a,b) = a ·b

la relación borrosa E es un T - operador de distinguibilidad.

Nota: Recordemos que, en teoría de grafos, Karl Menger hizo importantes

contribuciones relacionadas con la conectividad de un grafo (teorema de Menger).

El mismo abordó la cuestión de la fuzzificación de tales conexiones en el contexto

Page 15: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

11

de los espacios métricos probabilísiticos.

La t-norma asociada a una relación de semejanza

Sea Ω un universo de factores, tal que cada x ∈ X es observable mediante la

observación x(ω) de cada uno de esos factors ω ∈Ω en el elemento x, con el re-

sultado de que dos elementos x,y ∈ X aparecen en la observación indistinguidos,

y escribimos x(ω)≡ y(ω), o distinguidos.

Sea X un conjunto en el que cada elemento tiene asociado un conjunto finito

o infinito de aspectos atómicos (valores o cualidades) con un tipo clásico o "crisp"

de coincidencia o no coincidencia, en condiciones de plena transitividad.

Así pues, el grado de indistinguibilidad entre dos elementos x,y ∈ X sería la

proporción de factores comunes o equivalentes, o, lo que es lo mismo, la proba-

bilidad de que, observando un factor al azar en ambos objetos, se produzca coin-

cidencia o, digamos, equivalencia.

Más formalmente, si Ω es un universo de factores, cada x ∈ X es observable

a través de x(ω) con

x(ω) ∈ Aω = modalidades del factor ω

Así pues

R(x,y) = P(ω ∈Ω | x(ω)≡ y(ω))

R(x,y) = a , R(y,z) = b

Entonces

P(ω | x(ω)≡ z(ω))≥ P(ω | x(ω)≡ y(ω) , y(ω)≡ x(ω))

= P(ω | x(ω)≡ y(ω))+P(ω | y(ω)≡ x(ω))

−P(ω | x(ω)≡ y(ω) o bien y(ω)≡ x(ω))

≥ a+b−1

Page 16: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

12

Pero si a+b > 1, no tenemos garantizada ninguna coincidencia. Se obtiene pues

la siguiente

Proposición: Si el criterio de indistinguibilidad entre objetos observables a

través de un conjunto finito o infinito de factores es la proporción de factores

en que se manifiestan equivalentes, entonces la cota mínima de relación entre dos

elementos con otro interpuesto con el que se relacionan respetivamente con grados

a , b es

T (a,b) = max0,a+b−1

es decir la denominada T- norma de Lukasiewicz.

Las t-normas asociadas a un determinado número de coincidencias

Podríamos ser más exigentes, de modo que el grado de indistinguibilidad

entre dos elementos x,y ∈ X fuera la probabilidad de no observar diferencias

significativas en la observación de n aspectos. Más formalmente, si Ω es un

universo de factores y cada x ∈ X es observable a través de x(ω)ω∈Ω con

x(ω) ∈ Aω = modalidades del factor ω

se tendría:

R(x,y)) = P((ω1, ...,ωn) ∈Ωn | para todo i ∈ 1, ...,n es x(ωi)≡ y(ωi))

Así pues, si R(x,y) = a , R(y,z) = b, vamos a ver que es posible mejorar

la acotación inicial R(y,z) ≥ max0,a+ b− 1 que provendría de considerar un

universo de factores compuestos Ωn. En efecto, el conocimiento de que esas prob-

abilidades de indistinguibilidad en una observación provienen de la acumulación

Page 17: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

13

de equivalencias en n aspectos atómicos, permite conocer las respectivas proba-

bilidades de coincidencia atómica

P(ω | x(ω)≡ y(ω)) = a1/n

P(ω | y(ω)≡ z(ω)) = b1/n=⇒P(ω | x(ω)≡ z(ω))≥max0,a1/n+b1/n−1

Así pues

R(x,z) =

P((ω1, ...,ωn) ∈ Ωn | ∀i ∈ 1, ...,n, x(ωi)≡ y(ωi) ≥ (max0,a1/n +b1/n−1)n

Se obtiene pues la siguiente

Proposición: Cuando el criterio de indistinguibilidad entre objetos observ-

ables a través de un conjunto finito o infinito de factores es la probabilidad de que

no se encuentren diferencias (salvo equivalencias) en n observaciones, entonces

la cota mínima de relación entre dos elementos con otro interpuesto con el que se

relacionan respectivamente con grados a y b es

T (a,b) = (max0,a1/n +b1/n−1)n

tratándose de t-normas que forman parte de la familia de t-normas de Schweizer-

Sklar. Tomando λ = 1n , estas t-normas se generalizan a todo el dominio λ ∈

[−∞,∞] y se donotan T ssλ(a,b).

Comportamiento asintótico

En el caso en que el criterio de indistinguibilidad entre dos objetos en un

número arbitrariamente alto de observaciones es la probabilidad de no encontrar

diferencias significativas en ninguna de ellas, nos preguntamos por el modo en

que evolucionará la cota de transitividad.

Page 18: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

14

Obviamente, si a b = 0, entonces a1/n+b1/n−1 < 0, luego T (a,b) = 0 (tam-

bién por ser t-norma, pues 0 ≤ T (0,b) ≤ min0,b implica que T (a,b) = 0)

. Si a 6= 0,b 6= 0, existe un entero n0 ∈ N tal que para todo n ≥ no se tiene

a1/n +b1/n−1 > 0 , luego para todo n≥ n0 se tiene

Tn(a,b) = (a1/n +b1/n−1)n

Se trata, pues , de efectuar el siguiente cálculo

limn−→∞

Tn(a,b) = limn−→∞

(a1/n +b1/n−1)n = [1∞] = elimn−→∞ n((a1/n+b1/n−1)−1)

= elim a1/n+b1/n−21/n = elimx−→0+(

ax+bx−2x )

Por el teorema de l’Hôpital, se obtiene

limn−→∞

Tn(a,b) = elimx−→0+(ax/na + bx/nb) = a b

Por tanto,

limn−→∞

Tn(a,b) = a b si a b 6= 0

limn−→∞

Tn(a,b) = 0 = a b si a b = 0

Luego en todos los casos limn−→∞ T (a,b) = a b, y se obtiene así el siguiente

Teorema: Cuando el criterio de indistinguibilidad entre objetos observables a

través de un conjunto finito o infinito de factores es la probabilidad de no encon-

trar diferencias significativas en ninguna observación, entre un número indefinida-

mente alto de observaciones, entonces la cota mínima de relación entre dos ele-

mentos con otro interpuesto con el que se relacionan respectivamente con grados

a y b tiende a

T (a,b) = ab ( t-norma producto)

Page 19: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

15

Observación: Este resultado era previsible por cuanto, fijados a y b, el crec-

imiento de n supone unas probabilidades cada vez más altas para las regiones

de coincidencia de X con Y, así como de Y con Z, y por tanto de los tres (p ≥

a1/n + b1/n− 1). Así pues, el hecho de que las n observaciones de x e y se pro-

duzcan en su región de coincidencia (q = a1/n) apenas altera las opciones de con-

seguir nuevamente n coincidencias, por lo que acaban resultando sucesos inde-

pendientes, cuya probabilidad es por tanto el producto.

La t-norma de tolerancia

Siga siendo Ω un universo de factores, y siendo observable cada elemento

x ∈ X a través de x(ω)ω∈Ω con x(ω) ∈ Aω (modalidades del factor ω)

Consideremos un grado de distinguibilidad entre dos elementos x, y∈ X con-

sistente en la probabilidad de no observar más de una diferencia significativa en n

observaciones. Esta tolerancia puede basarse en una decisión basada en una fun-

ción de utilidad o podría basarse en unas condiciones de observación no sensibles

a una sola diferencia en n pruebas pero plenamente capaces de detectar dos difer-

encias. En nuestro modelo estamos por tanto asumiendo que no tenemos acceso

directo a la observación de las concordancias o discordancias a nivel atómico (un

solo factor) pero sí al resultado de cierta función de la muestra

ψx,y : Ωn −→ 0,1

a la que podemos denominar "función señal de distinguibilidad". Por tanto, ψx,y

es la función característica del conjunto

(ω1, ...,ωn) ∈Ωn | ]i ∈ 1, ...,n | x(ωi) y(ωi) ≥ 2

Page 20: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

16

Veamos el tipo de transitividad que ahora tenemos. Partimos pues de la siguiente

relación de indistinguibilidad

R(x,y)) = P((ω1, ...,ωn) ∈Ωn | ] i ∈ 1, ...,n | x(ωi) y(ωi) ≤ 1)

Sea R(x,y) = a, R(y,z) = b. Obviamente, el primer objetivo ahora es averiguar

qué proporción α de aspectos coincidentes entre x, y ha generado esta probabili-

dad a de no difererir más de una de entre n observaciones. Si

α = P(ω ∈Ω | x(ω)≡ y(ω))

entonces el número de coincidencias sigue trivialmente una binomial ξα : B(n,α),

por lo que

P(ξα ≥ n−1) = nαn−1(1−α)+α

n = a

luego

(1−n)αn +nαn−1 = a

Se trata pues de resolver esta ecuación. Para ello definimos

g(t) = (1−n)tn +ntn−1 t ∈ [0,1]

Se tiene entonces

g′(t) = (1−n)tn−1 +(n−1)ntn−2 = (n−1)ntn−2(1− t)> 0

si t 6= 1. Por tanto g(t) es creciente en [0,1], por lo que, si existe solución, será

única. Como

g(0) = 0

g(1) = 1

todo s ∈ [0,1] tendrá, por el teorema de Weierstrass, alguna antimagen, que será

única por el carácter creciente de g(x )

Page 21: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

17

En definitiva, hemos probado que g(x) es inversible en [0,1]. Así pues, β =

g−1

α = g−1(a) , β = g−1(b) g(t) = (1−n)tn +ntn−1

con

g(t) = (1−n)tn +ntn−1

De nuevo, el conocimiento de que las probablidades de indistinguibilidad en

una observación provienen de cierta condición creada a partir de la equivalencia

en aspectos atómicos, nos ha permitido conocer las respectivas probabilidades de

coincidencia atómica:

P(ω | x(ω)≡ y(ω)) = α = g−1(a)

P(ω | y(ω)≡ Z(ω) = β = g−1(b)

=⇒ γ = P(ω | x(ω)≡ Z(ω)≥max 0,g−1(a) +g−1(b)−1

Pero siendo γ = P(ω | x(ω)≡ z(ω)) , se tiene

R(x,z) = P(ξγ ≥ n−1)

= mγn−1(1− γ)+ γ

n = g(γ)≥ g(max0,g−1(a) +g−1(b)−1)

por ser g creciente. Se obtiene pues la siguiente

Proposición: Si el criterio de indistinguibilidad entre objetos observables a

través de un conjunto finito o infinito de factores es la probabilidad de no observar

más de una diferencia significativa en n observaciones, entonces la cota mínima

de relación entre dos elementos con otro interpuesto con el que se relacionan

respectivamente con grados a y b es

T (a,b) = g(max 0,g−1(a)+g−1(b)−1) con g(t) = (1−n)tn +ntn−1

siendo T una t-norma.

Page 22: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

18

Demostración: Sólo queda pendiente de demostrar que lo obtenido es efecti-

vamente una t-norma:

(T1) T (a,b) = T (b,a) es trivial, por la simetría de la fórmula.

(T2) Asociatividad. Veamos que T (T (a,b),c) = T (a,T (b,c)):

T (T (a,b),c) = g(max0,g−1(T (a,b))+g−1(c)−1)

= g(max0,max0,g−1(a)+g−1(b)−1+g−1(c)−1)

Puesto que

g−1(T (a,b))= g−1(g(max0,g−1(a)+g−1(b)−1)=max0,g−1(a)+g−1(b)−1

se tiene

T (T (a,b),c) = g(max0,max0,g−1(a)+g−1(b)−1+g−1(c)−1)

Caso 1. Si g′(a)+g′(b)> 1, entonces se tiene

T (T (a,b),c) = g(max0,g−1(a)+g−1(b)+g−1(c)−2)

Caso 2. Si g′(a)+g′(b)≤ 1, entonces

T (T (a,b),c) = g(max0,max0,0+g−1(c)−1) = g(0) = 0

Pero esta expresión coincide con la primera, pues si g−1(a)+g−1(b)≤ 1 entonces

g−1(a)+g−1(b)+g−1(c)−2≤ g−1(c)−1≤ 0

por lo que

max0,g−1(a)+g−1(b)+g−1(c)−2= 0

Page 23: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

19

luego

g(max0,g−1(a)+g−1(b)+g−1(c)−2) = 0 = T (T (a,b),c)

Por tanto, en todos los casos se tiene

T (T (a,b),c) = g(max0,g−1(a)+g−1(b)+g−1(c)−2)

una fórmula cuya simetría justifica la asociatividad.

Observación. Esto concuerda con el hecho de que, para cuatro elementos

x,y,z, t ∈ X con

R(x,y) = a, R(y,z) = b, R(z, t) = c

si sabemos que estos grados de indistinguibilidad provienen de unas probabili-

dades de coincidencia a nivel atómico g−1(a),g−1(b),g−1(c), entonces la cota de

coincidencia triple es

max0,g−1(a)+g−1(b)+g−1(c)−2

o sea

P(ω | x(ω)≡ t(ω))≥max 0,g−1(a)+g−1(b)+g−1(c)−2

por lo que, siendo g creciente, se tiene

R(x, t) = P((ω1, ...,ωn) ∈Ωn | ] i ∈ 1, ...,n | x(ωi) t(ωi))

= g(P(ω | x(ω)≡ t(ω)))≥ g(max0,g−1(a)+g−1(b)+g−1(c)−2)

(T3) Monotonía: a≤ b implica g−1(a)≤ g−1(b), y esto implica que, para todo

0 ∈ [0,1] , se tiene

g−1(a)+g−1(c)−2≤ g−1(b)+g−1(c)−2

Page 24: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

20

y por tanto

max0,g−1(a)g−1(c)−2 ≤max0,g−1(b)+g−1(c)−2

luego

g(max0,g−1(a)g−1(c)−2)≤ g(max0,g−1(b)+g−1(c)−2)

es decir

T (a,c) = T (b,c)

(T4)

T (a,1) = g(max0,g−1(a)+g−1(1)−1)

= g(max0,g−1(a)) = g(g−1(a)) = a

Generación aditiva de la t-norma de tolerancia

Va a resultar conveniente que tomemos como punto de partida la probabilidad

s = 1−α de no coincidencia en una observación elemental. Así pues,

si s = P(ω | x(ω) y(ω)),

entonces P(ξs ≤ 1) = g(1− s)

Definimos

h : [0,∞)−→ [0,1]

mediante

h(s) = 0 si s≥ 1

g(1− s) si s ∈ [0,1]

Para s ∈ [0,1] , el valor h(s) es la probabilidad de indistinguibilidad tras n obser-

vaciones (con el criterio fijado de no más de un desencuentro), si partimos de una

probabilidad s de no coincidencia en una observación.

Page 25: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

21

Trivialmente, a partir del crecimiento de g(x), la función h(s) es no creciente,

siendo decreciente en [0,1] :

h(s) = 0, si s≥ 1

(1− s)n +ns(1− s)n−1 , si s ∈ [0,1]

Se tiene pues, para la t-morma T que esta función genera, que T (a,b) es

g(max0,g−1(a)+g−1(b)+g−1(c)−1)

= g(max0,(1−h−1(a)+(1−h−1(b))−1))

= g(max0,1− (h−1(a)+h−1(b))

es decir g(0) = 0 si s = h′(a)+h′(b)≥ 1, y

g(1− (h−1(a)+h−1(b)) = h(h−1(a)+h−1(b))

si s = h−1(a)+h−1(b)∈ [0,1]. En el primer caso se tiene 0= h(h−1(a)+h−1(b)).

Hemos demostrado por tanto el siguiente

Teorema: Si el criterio de indistinguibilidad entre objetos observables a

través de un conjunto finito o infinito de factores es la probabilidad de no ob-

servar más de una diferencia significativa en n observaciones, entonces la cota

mínima de relación entre dos elementos con otro interpuesto con el que se rela-

cionan respectivamente con grados a y b es

T (a,b) = h(h[−1](a)+h[−1](b)) con h(s)0, si s≥ 1

(1− s)b +m(1− s)n−1, si s ∈ [0,1]

Como ya se ha demostrado, T es una t-norma.

Llamando t(a) = h−1(a) , vemos que t : [0,1] −→ [0,1] es una función que

cumple la siguientes propiedades:

Page 26: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

22

1. t(1) = 0

2. T (a,b) = t [−1](t(a)+ t(b)) ,

donde t [−1] es la pseudoinversa de t, o sea

t [−1](s) = supa | t(a)> s

3. La función t es estrictamente decreciente.

Observación: Son de importancia para comprender lo anterior, y también

para comprender el teorema de Ling que nos ocupará el siguiente capítulo, las

siguientes observaciones:

1. Hemos obtenido una t-norma T , lo que nos da un criterio para acotar

inferiormente el grado en que se dan simultáneamente dos condiciones, conocidos

los respectivos grados en que se dan por separado.

2. Hemos dispuesto de una información acerca de cómo se generan los grados

en que se da la condición en cada caso.

3. Esta información nos ha permitido retrotraernos a un dominio en el que

el incumplimiento de la condición tiene una penalización aditiva. En efecto, es

obvio que si

s1 = P(ω | x(ω) y(ω))

s2 = P(ω | y(ω) z(ω))

entonces

P(ω | x(ω) z(ω))≤ s1 + s2

4. Esto no hubiera sido posible si en algún caso T (a,a) = a, con a ∈ (0,1) ,

pues entonces

t(a) = t(T (a,a)) = t(a)+ t(a)

luego t(a) = 0 = t(1)

Page 27: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

23

5. La t-norma obtenida T (a,b) es una función continua.

(Más adelante definiremos t-norma arquimediana y continua como aquella t-

norma que cumple las condiciones de las dos últimas observaciones)

t-norma de r-tolerancia.

Vamos a hacer ahora una importante matización sobre el modelo anterior.

Seguimos con un universo de factores Ω y seguimos entendiendo que cada ele-

mento x ∈ X tiene asociada una familia x(ω)ω∈Ω con x(ω) ∈ Aω (modalidades

del factor ω). Pero ahora vamos a considerar los aspectos atómicos como in-

observables, pero sabiendo que un número superior a r de discordancias en n

aspectos atómicos controlados de forma global acabaría produciendo una señal

distinguible.

Sea R(x,y) = a , R(y,z) = b ¿Qué tipo de transitividad tendremos ahora? Nue-

stro primer objetivo es averiguar qué proporción s de aspectos discordantes entre

los elementos x, y ha generado esta probabilidad a de no diferir en más de r ob-

servaciones de entre un total de n observaciones

Si s= P(ω ∈Ω | x(ω) y(ω)) , entonces el número de discordancias sigue

una binomial ξs : B(n,s) por lo que

P(ξs ≤ r) = (1− s)n−Σrk=1

(nk

)sk(1− s)n−k = F(s,r) = hr(s) = a

donde F(s,r) es la función de distribución (acumulativa) de la binomial de parámetro

s

Vamos a aceptar como conocido que, en una binomial, la probabilidad de no

superar un determinado número de éxitos decrece estrictamente con el aumento de

Page 28: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

24

la probabilidad de éxito, siendo así inversible, y con una inversa computacional-

mente accesible. Sean pues s1 = hr(a) , s2 = hr(b) , con

hr(s) = (1− s)n−Σr

k=1(n

k

)sk(1− s)n−k, si s ∈ [a,1]

0, si s > 1

Como

P(ω | x(ω) y(ω)) = s1 = hr(a)

P(ω | y(ω) z(ω)) = s2 = hr(b)

se tiene

s3 = P(ω | x(ω) z(ω))≤min h−1r (a)+h−1

r (b),1

Así pues, al ser hr función no creciente se tiene:

R(x,z) = P(ξs3 ≤ r) = hr(s3)≥ hr(minh−1r (a)+h−1

r (b),1)

= maxhr(h−1r (a)+h−1

r (b)),hr(1)

= hr(1) = 0 si s = h−1

r (a)+h−1r (b)≥ 1

hr(h−1r (a)+h−1

r (b)) si h−1r (a)+h−1

r (b)< 1

En el primer caso se tiene 0 = hr(h−1r (a)+h−1

r (b)). Se tiene, en definitiva,

R(x,z)≥ hr(h−1r (a)+h−1

r (b))

y podemos así concluir la siguiente

Proposición: Sea X un conjunto de objetos dotados de factores x(ω)ω∈Ω

x(ω) ∈ Aω observados cada vez a través de un resultado global producido por

n de ellos elegidos al azar. Si entre estos objetos se establece como criterio de

indistinguibilidad la probabilidad de no aparición de una señal indicativa de la

Page 29: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

25

presencia de más de r divergencias, entonces la cota mínima de relación entre dos

elementos que se relacionan con otro respectivamente con grados a, b es

Tn,r(a,b) = hr(h[−1]r (a)+h[−1]

r (b))

donde

hr(s) = (1− s)n−Σr

k=1(n

k

)sk(1− s)n−k, si s ∈ [a,1]

0, si s > 1

para s = P(discordancia básica). Llamamos a Tn,r(a,b) la t-norma de r-tolerancia.

Demostración:

(T1) T (a,b) = T (b,a) por simetría de la fórmula.

(T2) Asociatividad. Veamos que T (T (a,b),c) = T (a,T (b,c)) :

T (T (a,b),c) = hr(h−1r (T (a,b))+h−1

r (c)) = hr(h−1r (a)+h−1

r (b)+h−1r (c))

Pero

h−1r (T (a,b)) = h−1

r (hr(h−1r (a)+h−1

r (b))) = h−1r (a)+h−1

r (b)

La simetría de la fórmula obtenida justifica la asociatividad.

(T3) Monotonía: Si a≤ b , entonces h−1r (a)≥ h−1

r (b) , luego

h−1r (a)+h−1

r (c)≥ h−1r (b)+h−1

r (c)

Luego, al ser hr decreciente, se obtiene T (a,c)≤ T (b,c)

(T4)

T (a,1) = hr(h−1r (a)+h−1

r (1)) = hr(h−1r (a)) = a

Por tanto la Tn,r que hemos definido es efectivamente una t-norma a la que

llamaremos t-norma de r-tolerancia.

Las t-normas de Schweizer-Sklar como caso particular

Page 30: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

26

Tomando r = 0 nos encontramos trivialmente en el caso del que habíamos

partido, pero abordado ahora desde un punto de vista más amplio. Ahora razon-

amos desde la función decreciente h que asocia a cada probabilidad de discor-

dancia elemental la consiguiente probabilidad de indistinguibilidad en una ob-

servación compleja. Antes lo hacíamos desde la función g que parte de las

probabilidades de concordancia. Obviamente h(s) = g(1− s) pero la expresión

a la que ahora llegamos, que en general es T (a,b) = h(h−1(a)+h−1(b)) es más

simétrica y conceptualmente más potente y nos acerca al teorema de Ling que

veremos más adelante.

En este caso, o sea si la señal de distinguibilidad se produce por la mera pres-

encia de una sola discordancia en un resultado determinado por n factores, se tiene

Tn,0(a,b) = h0(h−10 (a)+h−1

0 (b))

con

h0(s) = (n

0

)s0(1− s)n = (1− s)n si s ∈ [a,1]

0, si s > 1

Si s1 = h−10 (a), entonces a = (1− s1)

n y por tanto s1 = 1− a1/n

s1 = h−10 (a)

Así pues

Tn,0(a,b) = h0(h−10 (a)+h−1

0 (b)) = h0((1−a1/n)+(1−b1/n))

= h0(2− (a1/n +b1/n))

= (1− (2− (a1/n +b1/n)))n, si s3 = 2− (a1/n +b1/n)≤ 1

0, si s3 = 2− (a1/n +b1/n)> 1

= (a1/n +b1/n−1)n , si a1/n +b1/n−1≥ 0

0, si a1/n +b1/n−1 < 0

Page 31: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

27

Por tanto,

Tn,0(a,b) = (max0,a1/n +b1/n−1)n = T ss1/n(a,b)

que es la t-norma de Schweizer-Sklar con λ = 1n , que en el caso n = 1, por tanto

T1,0, se concreta en la t-norma de Lukasiewick.

Observemos finalmente que en este modelo no rige la acotación de Lukasiewick.

Se trata de una aparente paradoja. Lo que nos impediría considerar un espacio

de aspectos Ωn considerando "iguales" dos de ellos (x1, ...,xn) , (y1, ...,yn) si no

emiten una señal de distinguibilidad según el critero fijado, es que la relación que

así se obtendría no sería de equivalencia, por lo que , si R(x,y) = a , R(y,z) = b ,

entonces

a = P((xi)r∼ (yi))

b = P((yi)r∼ (zi))

y por tanto

P([(xi)r∼ (yi)]∧ [(yi)

r∼ (zi)])≥ P((xi)r∼ (yi))+P((yi)

r∼ (zi))−1 = a+b−1

Pero [(xi)r∼ (yi)] y [(yi)

r∼ (zi)] no implica (xi)r∼ (zi).

Las t-normas de Yager como caso particular

Tomar r = n− 1 sería una exigencia derivada de unas condiciones de ob-

servación extremas respecto de las que permitían controlar la transitividad de la

relación de equivalencia difusa mediante t-normas de la familia de Schweizer-

Sklar pues supone asumir o conocer que la indistinguibilidad se produce a partir

de una sola concordancia. Tendremos entonces

Tn,n−1(a,b) = hn−1(h−1n−1(a)+h−1

n−1(b))

Page 32: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

28

con

hn−1(s) = 1− sn si s ∈ [0,1]

0 si s > 1

Si s1 = h−10 (a) , entonces a = 1− sn

1 , por lo que

s1 = (1−a)1/n = h−1n−1(a)

Tenemos pues

Tn,n−1(a,b)

= hn−1(h−1n−1(a)+h−1

n−1(b)) = hn−1((1−a)1/n +(1−b)1/n) =

1− ((1−a)1/n +(1−b)1/n)n si s3 = (1−a)1/n +(1−b)1/n ≤ 1

0 si s3 = (1−a)1/n +(1−b)1/n > 1

Así pues

Tn,n−1(a,b) = max

1− ((1−a)1/n +(1−b)1/n)n,0= TY

1/n(a,b)

que es la t-norma de Yager TYλ

con λ = 1/n.

Comportamiento asintótico de la t-norma de tolerancia Tn,n−1

Se trata de averiguar cómo evoluciona la cota de relación garantizada entre

dos objetos que se relacionan con otro respectivamente con grados a y b si, por

resultar indistinguibles ante una sola concordancia, se ha establecido como grado

de indistinguibilidad la probabilidad de tener alguna coincidencia en n pruebas,

tendiendo n a infinito. Para ello consideramos los siguientes casos:

a) Si a 6= 1 y b 6= 1 entonces

limTn,n−1(a,b) = max

1− lim((1−a)1/n +(1−b)1/n)n,0

= max1− (1+1)∞,0= max−∞,0= 0

Page 33: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

29

b) Si a = 1 entonces

limTn,n−1(a,b) = max

1− (0+(1−b)1/n)n,0

= max1− (1−b),0= maxb,0= b

Resulta por tanto

limTn,n−1(a,b) = 0 si a 6= 1 y b 6= 1

mina,b en otro caso= TD(a,b)

donde TD es la t-norma drástica.

Observación: Los anteriores grados de indistinguibilidad se obtenían como

probabilidad de alguna coincidencia en un número cada vez más alto de pruebas.

Fijados estos grados, y haciendo tender n a infinito, representa la proveniencia de

elementos cada vez menos relacionados a nivel básico por lo que sus respectivas

probabilidades de discordancia en un sólo factor (1−a)1/n y (1−b)1/n tienden a

1, superándolo entre las dos. Así deja de estar garantizada cualquier transitividad

a menos que alguno de los dos valores a ó b fuese 1. En este caso, uno de los dos

pares de objetos tendría máxima relación por lo que el grado de equivalencia entre

el primero y el tercero quedaría acotado por el menor de los grados.

t-norma de tolerancia con criticidad borrosa.

Es conveniente crear modelos capaces de ajustarse al máximo a unas condi-

ciones concretas de observación. De forma más general podemos partir de una

sucesión (αr) de números reales con 0 = α0 ≤ ... ≤ αn−1 ≤ αn = 1 donde αr

es la probabilidad de que dos elementos cualesquiera sean distinguidos si se dan

Page 34: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

30

r discordancias entre n factores observados. Es natural definir entonces para cada

r su grado de criticidad αr = αr+1−αr. Un número r de discordancias sería

crítico si αr = 1, esto es si αr = 0 y αr+1 = 1, o sea cuando r+1 discordancias

distinguen pero tan sólo r discordancias no distinguen todavía a los elementos.

Estamos tratando así el predicado "criticidad de r" como un predicado borroso.

Podemos tomar entonces como relación de indistinguibilidad, la relación borrosa

Rn,α que asigna a cada x,y ∈ X la probabilidad de no distinguirlos bajo estas

condiciones de observación. Por tanto

Rn,α(x,y) = 1−n

∑r=0

αr ·P((ω1, ...,ωn) ∈Ωn | ] ωi | X(ωi) Y (ωi) = r)

Esta relación borrosa es reflexiva, simétrica y Tn,α -transitiva , donde Tn,α es la

t-norma arquimediana y continua generada por la función continua y estrictamente

decreciente hn,α : [0,∞]→ [0,1] definida por

hn,α = 1−Σn

k=0

(nk

)sk(1− s)n−k ·αr si s ∈ [0,1]

o si s > 1

donde la generación de Tn,α por hn,α significa que

Tn,α(a,b) = hn,α(h[−1]n,α (a)+h[−1]

n,α (b))

t-normas para diferencias que siguen una distribución de Poisson

Las condiciones de observación nos pueden privar de certeza acerca del número

de pruebas. Podemos analizar las t-normas que se derivarían de distintos mode-

los de distribución del número de elementos de contraste en cada observación.

Page 35: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

31

Planteamos aquí el modelo que se deriva de unas condiciones de observación

sometidas a un proceso de Poisson.

Asumimos pues que en cada unidad de tiempo concurren una media de λ0 as-

pectos inobservables, pero con efectos acumulados observables a través de señales

(la señal ψ que, como veremos, puede estar constituida por una función o por una

variable aleatoria).

Comencemos por el caso clásico en el que cada par de objetos emite o no

emite al cabo de una unidad de tiempo una señal que avisa de la presencia de

r o más discordancias. Definamos el grado de indistinguibilidad entre x,y me-

diante la siguiente función decreciente de la probabilidad de percibir una señal

diferenciadora en un período de observación

R(x,y) = 1− P(señal)Pmax

Llamemos λa = λ (x.y) a la media de eventos discordantes entre x , y en la

unidad de tiempo de observación. Demostramos a continuación la siguiente

Proposición: Si X es una variable de Poisson de parámetro λ0, y la proba-

bilidad de cierto suceso A ante cada evento es s , entonces los eventos en los que

se produce A siguen una distribución de Poisson de parámetro λ0 s.

Page 36: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

32

Demostración: Sea Y el número de ocurrencias de A. Se tiene

P(Y = y) = Σ∞k=0 P((Y = y)∧ (x = k))

= Σ∞k=0 P(X = k) P(Y = y | X = k)

= Σ∞k=yP(X = k) P(Y = y | X = k)

= Σ∞k=y

e−λ0 λ k0

k!

(ky

)sy (1− s)k−y

= e−λ0 syΣ

∞k=y

λ k0

y! (s− k)!

=e−λ0 sy λ

y0

y!Σ

∞k=y

λk−y0 (1− s)k−y

(s− k)!

=e−λ0 (λ0s)y

y!Σ

∞j=0

λj

0 (1− s) j

j!

=e−λ0 (λ0 s)y

y!eλ0(1−s)

=e−λ0s (λ0s)y

y!

Así pues, se tiene

P(Y = y) =e−λ0s (λ0 s)y

y!

por lo que Y sigue una distribución de Poisson de parámetro λ0 s.

Corolario: De esta proposición se siguen cinco consecuencias que nos serán

útiles en lo que sigue

1) Si λa es la media de eventos discordantes entre x e y en la unidad de tiempo

de observación, entonces

λa = λ0 P(ω | X(ω) Y (ω))

por lo que

P(ω | X(ω) Y (ω)) = λa

λ0

Page 37: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

33

2) El valor λ0 es una cota superior de las intensidades medias λ con la que se

puede dar cualquier suceso subordinados a la variable de Poison de parámetro λ0

3) Si x e y son tales que

P(ω | X(ω) Y (ω)) = 1

entonces la media de eventos discordantes entre ellos es λa = λ0

4) Si x e y son tales que

P(ω | X(ω) Y (ω)) = 0

entonces la media de eventos discordantes entre ellos es λa = 0.

5) La probabilidad de distinguir x e y por superación de r discordancias es

P((ω1, ...,ωn) ∈ Ωn | ] ωi | X(ωi) Y (ωi) = r)

= Σ∞k=r+1

e−λa λ ka

k!

Proposición: La probabilidad

g(λ ) = Σ∞k=r+1

e−λ λ k

k!

de advertir una distinción por superación de r discordancias es una función de λ

estrictamente creciente.

Demostración: Su derivada es

g′(λ ) = Σ∞k=r+1−

e−λ λ k + e−λ k λ k−1

k!= e−λ [Σ∞

k=r+1λ k

k!+Σ

∞k=r+1

λ k

(k−1)!]

= e−λ [−Σ∞k=r+1

λ k

k!+Σ

∞k=r

λ k

k!] =

e−λ λ r

r> 0

Page 38: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

34

si λ 6= 0.

Como consecuencia, la función

h(λ ) = 1− 1

Pmax[e−λ λ k

k! ] = 1− g(λ )Pmax(señal) , si λ ∈ [0,λ0]

0 , si λ > λ0

es estrictamente decreciente en λ dentro del intervalo [0,λ0] .

Dadas x , y con una intensidad de discordancias λ , hemos definido como grado

de indistinguibilidad entre x,y el valor

R(x,y) = 1− P(señal)Pmax(señal)

= h(λ )

= 1−Σ∞

k=r+1e−λa ·λ k

ak!

Σk=r+1e−λ0 ·λ k

0k!

= 1− 1Pmax

[e−λa ·λ k

ak!

]≤ 1

Para obtener la t-norma asociada a esta relación de indistinguibilidad, vamos a

utilizar ahora una vez más el teorema de Ling. Sea R(x,y) = a , y R(y,z) = b. Se

tiene que λa = h−1(a) y λb = h−1(b) son las respectivas medias de discordancias

en un periodo de observación. Sea R(x,z) = c . Se tiene pues λc = h−1(c) . Sean

γa,γb,γc las respectivas variables de Poisson. En el proceso concurren cada vez,

via Poisson, γ aspectos con media E(γ) = λ0, generando γa discordancias entre

x, y; y generando γb discordancias entre y, z.Así pues

γc ≤ γa + γb

γc ≤ γ

(La primera desigualdad se debe a que los aspectos concordantes se rigen por un

Page 39: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

35

criterio de equivalencia) Por tanto

λc = E(γc)≤ E(γa)+E(γb) = λa +λb = h−1(a)+h−1(b)

λc ≤ Eγ(γ) = λ0

luego

c = h(λc)≥ h(h−1(a)+h−1(b))≥ h(λ0) = 0

Obtenemos pues la siguiente

Proposición: Sea X un conjunto de objetos dotados de factores (x(ω)ω∈Ω

, con x(ω) ∈ Aω ) y sometidos a un proceso de observación consistente en las lle-

gadas durante un mismo período, y sujetas a una variable de Poisson de parámetro

λ0 conocido, de elementos de comparación sobre el conjunto de objetos. Si se es-

tablece como criterio de indistiguibilidad una función lineal de la probabilidad de

no aparición de una señal indicativa de la presencia de más de r divergencias, en-

tonces la cota mínima de relación entre dos elementos que se relacionan con otro

respectivamente con grados a y b es

T Poissλ0,r (a,b) = hr(h

[−1]r (a)+h[−1]

r (b))

con

hr(λ ) = 1− [

1−e−λ Σrk=0

λkk!

1−e−λ0Σrk=0

λk0

k!

], si λ ≤ λ0

0, si λ > λ0

siendo T Poissλ0,r

una t-norma a la que llamaremos t-norma de Poisson de parámetro

λ0 con r-tolerancia.

Observación: Sólo faltaría demostrar el carácter de t-norma pero en realidad

la demostración ya está hecha. En efecto, si observamos las demostraciones del

carácter de t-norma de las últimas que hemos construido podemos observar que

Page 40: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

36

en ningún momento utilizamos nada de lo concreto de la función h . Tan sólo hay

que comprobar que son estrictamente decrecientes en h−1((0,1]), que son con-

tinuas y que h(0) = 1. Además constatamos que las t-normas obtenidas cumplen

necesariamente las dos siguientes propiedades adicionales

1) T (a,a)< a, si a /∈ 0,1

Demostración: Si fuese T (a,a) = a, y a 6= 0, entonces h(2 h−[1](a)) = a, luego

a 6= 0, y por tanto 2 h−[1](a) = h−1(a), y así h−1(a) = 0, luego a = h(0) = 1

Además,

T (0,0) = h(h[−1](0)+h[−1](0))

siendo h[−1](0) = supx | h(x)> 0. Por tanto, h(2 h[−1](0))≤ 0, luego T (0,0) =

h(2 h[−1](0)) = 0.

2) La función T (a,b) obtenida es continua.

Demostración: hr(x) lo era , y h−1r (a) lo es por ser inversa de una función

continua, y así hr(h−1r (a)+h−1

r (b)) es continua.

Definición: Una t-norma que verifique

(1) para todo x ∈ (0,1), es T (x,x)< x

(2) T (x,x) es función continua

se denomina T- norma arquimediana continua.

Por tanto la t-norma que hemos obtenido T Poissλ0,r

es arquimediana y continua.

Comportamiento asintótico de la t-norma de Poisson con 0- tolerancia

Si r = 0, o sea si la señal se emite con una sola discordancia, entonces

Σrk=0

λ k

k!=

λ 0

0!= 1

Page 41: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

37

Por tanto,

h0(λ ) = 1− 1−e−λ

1−e−λ0, si λ ≤ λ0

0, si λ > λ0

Si λ ≤ λ0, entonces

h0(λ ) = y = 1−A(1− e−λ )

con A = 11−e−λ0

. Por tanto,

1− y = A(1− e−λ )

y se tiene1− y

A= 1− e−λ

En consecuencia, e−λ = 1− 1−yA , y así pues

−λ = ln(A

A−1+ y) = ln(

A−1+ yA

)

luego

λ = ln(A

A−1+ y)

Se obtiene pues, para todo y ∈ [0,1],

h[−1]0 (y) = ln(

AA−1− y

)

Obtenemos

T Poissλo,0 (a,b) = h0(h−1

0 (a)+h−10 (b))

= 1−A(1− e−(ln(A

A−1+a )+ln( AA−1+b ))

= 1−A[1− e− ln( A2(A−1+a)(A−1+b) )]

= 1−A[1− (A−1+a)(A−1+b)A2 ]

= 1−A+(A−1+a)(A−1+b)

A

Page 42: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

38

Pero limλ0−→∞ A = 1, y así

limλ0−→∞

T Poissλo,0 (a,b) = 1−1+

(1−1+a)(1−1+b)1

= ab

luego se obtiene la siguiente

Proposición: La t-norma T Poissλo,r

tiende asintóticamente a la T- norma pro-

ducto, cuando r = 0; esto es

limλ0−→∞

T Poissλo,0 (a,b) = ab

t-normas para número de factores y tolerancia aleatorios

Acabamos de analizar las t-normas requeridas a partir de condiciones de ob-

servación aleatorias pero asumiendo que los valores críticos son nítidos, esto es,

no borrosos. Nuevamente podemos generalizar al caso en que para cada número

de discordancias presentes haya sólo una probabilidad αr de distinguir los ele-

mentos obteniendo la siguiente

Proposición:

Sea X un conjunto de objetos dotados de factores (x(ω)ω∈Ω , con x(ω) ∈

Aω ) y sometidos a un proceso de observación consistente en las llegadas durante

un mismo período, y sujetas a una variable de Poisson de parámetro λ0 cono-

cido, de elementos de comparación sobre el conjunto de objetos. Sea (αn)n∈N una

sucesión no decreciente en [0,1] con α0 = 0 y limαn = 1, donde αn es la proba-

bilidad de distinguir dos elementos x,y de un conjunto cuando han concurrido a

la observación n discordancias. Si se establece como criterio de indistiguibilidad

de los elementos x e y una función lineal de la probabilidad de no distinguirlos,

Page 43: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

39

entonces la cota mínima de relación entre dos elementos que se relacionan con

otro respectivamente con grados a y b es

T Poissλ0,α

(a,b) = hλ0,α(h[−1]λ0,α

(a)+h[−1]λ0,α

(b))

donde

hλ0,α (λ ) = 1−

e−λ∞

∑k=0

λkk! αk

e−λ0∞

∑k=0

λk0

k! αk

si λ ≤ λ0

0 si λ > λ0

siendo T Poissλ0,α

una t-norma arquimediana y continua.

Demostración: Como ya hemos señalado, y a continuación veremos con

más detalle, las cotas garantizadas de transitividad generadas como T (a,b) =

h(h[−1](a)+ h[−1](b)) a partir de una función h : [0,∞] −→ [0,1] continua y es-

trictamente decreciente en [0,m] para cierto m ∈ (0,∞] con h(0) = 1 y h(m) = 0

, constituyen t-normas arquimedianas y continuas. Nos bastará por tanto verificar

que se dan estas condiciones.

1. Continuidad: trivial.

2. Decrecimiento estricto en [0,λ0]:

Si 0 < λ < λ0 entonces

hα(λ ) = 1−Ae−λ∞

∑k=1

λ k

k!αk

Así pues

Page 44: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

40

h′α(λ ) = −A

(−e−λ

∑k=1

λ k

k!αk + e−λ

∑k=1

λ k−1

(k−1)!αk

)=

= −A

(− e−λ

∑k=1

λ k

k!αk + e−λ

(α1 +

∑k=1

λ k

k!αk+1

))=

= −Ae−λ

(α1 +

∑k=1

λ k

k!(αk+1−αk)

)< 0

ya que αk+1 − αk ≥ 0 y alguno no es 0 por ser limαn = 1. En consecuencia,

h′α(λ ) < 0 para todo λ ∈ (0,λ0), por lo que hα es estrictamente decreciente en

(0,λ0) y, por continuidad, será estrictamente decreciente en [0,λ0] .

3. h(0) = 1

4. h(λ0) = 0

Se dan pues todas las condiciones que nos garantizan que la función T Poissλ0,α

,

operación binaria sobre [0,1] que hemos definido a partir de hα , es una t-norma

arquimediana y continua.

Proposición: La derivada de la función de la función hα que genera la t-

norma T Poissλ0,α

es proporcional a la media bajo λ de los grados de criticidad de los

distintos posibles números k de discordancias, siendo

h′α(λ ) =−A ·Eλ (α

k)

con αk = αk+1−αk = grado de criticidad de k.

Demostración:

Partiendo de la expresión de h′α(λ ) recién calculada se tiene

Page 45: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

41

h′α(λ ) = −Ae−λ

(α1 +

∑k=1

λ k

k!(αk+1−αk)

)=

= −Ae−λ

(λ 0

0!(α1−α0)+

∑k=1

λ k

k!(αk+1−αk)

)=

= −Ae−λ

(∞

∑k=0

λ k

k!(αk+1−αk)

)=−Ae−λ

(∞

∑k=0

λ k

k!α

k

)=

= −A ·∞

∑k=0

e−λ λ k

k!α

k =−A ·Eλ (αk)

con

αk = αk+1−αk =

grado de criticidad del número

k de discordancias

Observaciones.

1. El resultado anterior confirma la idea intuitiva de que si está muy alejada la

media λ de eventos discordantes de la región donde se encuentran los valores críti-

cos dominantes entonces una variación de λ afectaría muy poco a la probabidad

de distinguir los elementos.

2. Al demostrar que T Poissλ0,α

es una t-norma arquimediana y continua, no hemos

tenido que utilizar la condición limαn = 1 . Verosímilmente, en una mayoría

de condiciones de observación se tendría esta convergencia, pues es natural pen-

sar que si se acumula un número indefinido de discordancias la probabilidad de

distinguir los elementos tienda a 1. No obstante el hecho de que esta condición

no sea requerida permite desarrollar la t-norma en un caso más general. Como

hemos visto, tampoco se requiere que el crecimiento de (αn) sea estricto, aunque

obviamente debe haber al menos un valor de criticidad no nula.

Page 46: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

42

Recapitulemos lo expuesto hasta ahora. Hemos desarrollado diversos ejemp-

los de t-normas generadas a partir de relaciones de indistinguibilidad basadas en

diferentes condiciones de observación. Todos ellos tienen en común el hecho de

partir de una función h : [0,∞]−→ [0,1] continua y estrictamente decreciente en

[0,m] para cierto m ∈ (0,∞] con h(0) = 1 , y con h(x) = 0 si x ≥ m , siendo

h(x) función lineal de la probabilidad de no distinguir dos elementos tras una

observación compleja cuando la probabilidad de discordancia en un sólo factor

aleatorio es x.

En tales condiciones siempre la cota mínima de relación entre dos elementos

que se relacionan con otro respectivamente con grados a y b ha resultado ser de

manera natural

T (a,b) = h(h[−1](a)+h[−1](b))

donde

h[−1](a) = único x ∈ [0,m) tal que h(x) = a si a ∈ (0,1]

m si a = 0

Hemos constatado en varios ejemplos como la T resultante era siempre una

t-norma arquimediana y continua. Veamos que ha de ser así mientras la función

h que relaciona la probabilidad de discordancia básica con la probabilidad de no

advertirla en ciertas condiciones de observación sea estrictamente decreciente y

continua. Para ello nos apoyaremos en el siguiente lema debido a Ling:

.

Lema.

Sea h : [0,∞] −→ [0,1] una función continua, estrictamente decreciente en

[0,m] para cierto m ∈ (0,∞] con h(0) = 1 y h(x) = 0 para todo x ∈ [m,∞] . La

función T : [0,1]× [0,1]−→ [0,1] definida por

T (a,b) = h(h[−1](a)+h[−1](b)

Page 47: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

43

es una t-norma arquimediana y continua.

Demostración.

(T1) Conmutatividad: es trivial por la simetría de la expresión.

(T2) Asociatividad. Se trata de verificar que T (T (a,b),c) = T (a,T (b,c)).

Para ello observemos que en nuestro caso h[−1](h(x)) = minm,x . Así pues

T (T (a,b),c) = h(h[−1](h(h[−1](a)+h[−1](b)))+h[−1](c))

= h(min

m, h[−1](a)+h[−1](b)+h[−1](c))

Análogamente

T (a,T (b,c)) = h(h[−1](a), min

m, h[−1](b)+h[−1](c)

Consideraremos los siguientes casos:

1. Si ningún mínimo es m, entonces

T (T (a,b),c) = h(h[−1](a)+h[−1](b)+h[−1](c)) = T (a,T (b,c))

2. Si ambos mínimos son m, entonces

T (T (a,b),c) = h(m+h[−1](c)) = 0 = h(h[−1](a)+m) = T (a,T (b,c))

3. Si sólo m≤ h[−1](a)+h[−1](b) entonces

T (T (a,b),c) = h(m+h[−1](c)) = 0

0≤ T (a,T (b,c)) = h(h[−1](a)+(h[−1](b)+h[−1](c)))≤ h(m+h[−1](c)) = 0

Page 48: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

44

Así pues, se tiene de nuevo

T (T (a,b),c) = T (a,T (b,c))

y por tanto esta igualdad se da en todos los casos.

(T3) Monotonía: Una desigualdad a ≤ b implica h[−1](a) ≥ h[−1](b) y así

pues

h[−1](a)+h[−1](c)≥ h[−1](b)+h[−1](c)

por lo que

T (a,c) = h(h[−1](a)+h[−1](c))≤ h(h[−1](b)+h[−1](c)) = T (b,c)

(T4) Condición de contorno:

T (a,1) = h(h[−1](a)+h[−1](1)) = h(h[−1](a)+0) = h(h[−1](a)) = a

Con estas cuatro propiedades, tenemos garantizado que T es una t-norma.

Veamos las dos propiedades que faltan para establecer su carácter arquimediano y

continuo.

(T5) Si a ∈ (0,1) entonces T (a,a)< a

Demostración: Para 0 < a < 1 tenemos

T (a,a) = h(h[−1](a)+h[−1](a)) = h(2h[−1](a))

y distinguimos varios casos

1. 2 h[−1](a)≥ m entonces T (a,a) = h(2h[−1](a)) = 0 < a

2. 2 h[−1](a)< m entonces o < h[−1](a)< 2h[−1](a)< m

y así 1 > a > h(2h[−1](a)) = T (a,a)

Page 49: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

45

Vemos pues como en todos los casos se tiene que, si 0 < a < 1, entonces

T (a,a)< a.

(T6) Continuidad: Es trivial a partir de la continuidad de h.

En un futuro próximo pensamos explorar el caso en el que la función aditiva h

es discontinua.

Page 50: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

46

CAPÍTULO 2: EL TEOREMA DE LING

En 1965, Ling demostró el reciproco del lema principal del capítulo anterior.

En este capítulo damos una demostración más simple y operativa de este teorema.

De hecho, nosotros demostramos un teorema algo más explícito, que enunciamos

a continuación

Teorema (Ling, 1965): Dada una t-norma arquimediana y continua T : [0,1]×

[0,1] −→ [0,1], existe un generador aditivo y continuo t de T , esto es una fun-

ción. estrictamente decreciente y continua t : [0,1] −→ [0,∞] tal que t(1) = 0 y

T (x,y) = t [−1](t(x)+ t(y)) para todo x,y ∈ [0,1]. Esta función t es única salvo

multiplicación por una constante positiva. ([?])

El valor de la pseudoinversa h = t [−1] de t sobre cualquier número real no

negativo x ∈ R≥0, escrito de forma única como la serie x = Σn∈Zxn 2n ≥ 0, con

xn = 0,1 y xn = 0 para n > log2 x, es

h(x) = Tn∈Z(xnan +1− xn) = lim Tn≥k(xnan +1− xn)

donde

... < a2 < a1 < 1/2 = a0 < a−1 < a−2 < ...

satisface an+1 = T (an,an) para todo n ∈ Z.

Vemos aquí que el operador conmutativo binario T (a,b) = a ∗ b puede ser

considerado como un operador de un número finito pero arbitrario de argumen-

tos, usando la asociatividad de T. Para n ≥ 0, la igualdad an+1 = T (an,an) nos

permite construir la sucesión (an)n∈N recursivamente, partiendo de a0 = 12 . En

cuanto a los valores (a−n)n∈N, también se definen de forma recursiva desde a0 =12 ,

tomando como a−n−1 el único valor de x con a−n < x < 1 , y tal que T (x,x) = a−n

.

La existencia y unicidad de este valor de x se justifica a partir de la siguiente

Page 51: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

47

Proposición: Dada una t-norma t arquimediana y continua y un número a ∈

(0,1) , existe un único x > a tal que T (x,x) = a

Demostración:

a) Existencia. En toda t-norma T se cumple que T (x,0) = 0, dado que, por la

monotonía, se tiene T (x,0)≤ T (1,0) = 0.

Si T es continua, lo es también la función g(x)=T (x,x). Pero g(0)=T (0,0)=

0, y g(1) = T (1,1) = 1, luego, por el teorema de Bolzano, para cada a ∈ (0,1)

existirá algún x ∈ (0,1) con g(x) = T (x,x) = a .

Por la monotonía de T , se tiene a = T (x,x) ≤ x, pero, al ser además T arqui-

mediana, se tiene T (x,x)< x , por lo que a < x < 1.

b) Unicidad. Para establecer el carácter único de esta solución demostraremos

el siguiente

Lema: Si T es una t-norma arquimediana y continua, y si a < b , entonces

existe algún x ∈ (0,1) tal que a = b ∗ x .

Demostración del lema: En efecto, se tiene

b ∗ 0 = T (b,0) = 0

b ∗1 = T (b,1) = b

Pero la función T (b,_) es continua, luego existe algún x ∈ (0,1) con

T (b,x) = b ∗ x = a .

Veamos ahora que si a < b y T (a,a) 6= 0 , entonces T (a,a) 6= T (b,b).

Supongamos que existiesen a,b con a < b y T (a,a) = T (b,b), o sea con a ∗

a = b ∗ b . Por el lema anterior, existiría algún k < 1 tal que a = b ∗ k, y por

tanto si a ∗ a = b ∗ b supondría que

(b∗ k)∗ (b∗ k) = (b∗b)∗ (k ∗ k) = b∗b

Page 52: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

48

Se tendría entonces

(b∗b)∗ (k ∗ k)∗ (k ∗ k) = (b∗b)∗ (k ∗ k) = (b∗b)

Así, por inducción, se obtiene

(b∗b)∗ (k ∗ k)n = b ∗ b

(donde la potencia n significa producto n veces con la t-norma T ) . Pero la suce-

sión (k ∗ k)n es no decreciente y contiene una subsucesión hn := (k ∗ k)2n. Así

pues, hn verifica la relación de recurrencia hn+1 = T (hn,hn).

Por la continuidad de n se cumple que

l = lim hn+1 = lim T (hn,hn) = T (l, l)

por lo que l es punto fijo de la función T (x,x) , lo que implica que l ∈ (0,1) por

ser T arquimediana. Pero l ≤ hn ≤ k ∗ k < k < 1 , luego l = 0. Por tanto,

lim hn = lim (k ∗ k)2n= 0

Pero teníamos

(b∗b)∗ (k ∗ k)2n= b ∗ b

Por tanto T (b ∗b,hn) = b ∗b, y así, por la continuidad de T (x,x), llegamos a

b ∗ b = T (b ∗ b, lim hn) = T (b ∗b,0) = 0 = b ∗ b

Por tanto, si a ∗ a = b ∗ b, con a < b, se tendrá a ∗ a = b ∗ b = 0, por lo que la

ecuación T (x,x) = a 6= 0 tiene en efecto solución única.

La demostración que ahora vamos a proporcionar coincide con la demostración

de Ling en que construye primero la función pseudoinversa de la requerida, pero

difiere en que no lo hace sobre todos los números racionales, sino, más efectivo,

Page 53: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

49

le basta con construirla sobre los números racionales diádicos, es decir aquellos

expresables como una fracción cuyo denominador es una potencia de 2.

Construyendo la función pseudoinversa sobre los números diádicos

La igualdad an+1 = T (an,an) nos permite construir la sucesión (an) de forma

recursiva para valores positivos de n a partir de a0 = 1/2. En cuanto a los valores

(a−n)n∈N no será preciso realizar una elección de a−n−1 como por ejemplo lo

sería a−n−1 = supx | T (x,x) < a−n. La anterior proposición nos permite con-

struirlos también recursivamente tomando como a−n−1 la solución única de la

ecuación T (x,x) = an.

Para demostrar este teorema, podemos asumir, sin pérdida de generalidad, que

la función t que buscamos satisface t(1/2) = 1. Por supuesto, si t genera la

t-norma T , entonces para cualquier k ∈ R+, también kt la generará, dado que

t(T (x,y)) = t(x)+ t(y) implica kt(T (x,y) = kt(x)+ kt(y)

Como preparación para la demostración denotemos b0 = 1/2 , de forma que

t(b0) = 1. Dado que T (0,0) = 0 , T (1,1) = 1, y la función T (x,x) es continua,

existe algún número real x ∈ (0,1) tal que T (x,x) = b0 < x. Pero hemos visto

como la arquimedianidad nos asegura que este número es único. Sea pues b1 el

único valor x > bo = 1/2 tal que T (x,x) = 1/2.

Tenemos así t(b1) = 1/2, dado que

1 = t(b0) = t(T (b1,b1)) = t(b1)+ t(b1)

Tomemos como b2 > b1 el número que verifica T (b2,b2) = b1. Tenemos así

t(b2) = 1/4, ya que

12= t(b1) = t(T (b2,b2)) = t(b2)+ t(b2)

Page 54: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

50

Iterando este argumento construimos una sucesión creciente

1/2 = b0 < b1 < b2 < ...

en la cual t(bn) = 1/2n para n = 0,1,2, ...

Lema: limbn = 1

Demostración: La sucesión bn está acotada superiormente por 1, por lo que

tiene supremo l = supbn , el cual , por ser la sucesión creciente, es de hecho el

límite l = limbn. Este valor l es un punto fijo de la función T (x,x) : [0,1]−→ [0,1]

puesto que

l = limbn = limT (bn+1,bn+1) = T (l, l)

por ser T (x,x) continua.

Por la continuidad exigida a t , se requerirá

lim t(bn) = lim1/2n = 0 = t(l)

lo que exigiría l = 1. Al ser la norma T arquimediana los únicos puntos fijos de

T (x,x) : [0,1]−→ [0,1] son 0, 1. Pero l > 1/2 , luego l = 1.

Denotemos ahora a0 =12 , de modo que t(a0) = 1. Sea

a1 = T (a0,a0)< 1/2

Si a1 6= 0, entonces

t(a1) = t(T (a0,a0)) = t(a0)+ t(a0) = 2

Sea ahora

a2 = T (a1,a1)< a1

Page 55: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

51

Si a2 6= 0 entonces

4 = t(a1)+ t(a1) = t(T (a1,a1)) = t(a2)

Consideramos la sucesión

12= a0 > a1 ≥ a2 ≥ ...

con todas las desigualdades estrictas hasta que eventualmente se alcance an = 0,

siendo entonces an′ = 0 para todo n′ ≥ n. Esta sucesión está definida de forma

recurrente mediante

an+1 = T (an,an)

Si la t-norma T es estricta, o sea si para cada x ∈ (0,1] se cumple T (x,x) 6= 0,

entonces mediante una obvia iteración del argumento anterior, se obtiene

t(an) = 2n

para n = 0,1,2, ... En particular t(0) = ∞.

Si la t-norma T es nilpotente, es decir no estricta, existe un número positivo

n0 tal que an = 0 para todo n ≥ n0. En consecuencia, t [−1](2n) = 0 para todo

n≥ n0. Esto implica t(0)≤ 2n. En general t [−1](x) = 0 implica t(0)≤ x .

Lema: lim an = 0.

Demostración: La sucesión (an) está acotada inferiormente por 0, por lo que

tiene un ínfimo q que, al ser la sucesión decreciente, es su límite. Este valor

q = liman es un punto fijo de la función T (x,x) : [0,1]−→ [0,1] . En efecto,

q = liman = limT (an−1,an−1) = T (q,q)

puesto que, al ser T (x,y) continua, también lo es T (x,x). Como la norma T es

arquimediana, los únicos puntos fijos de T (x,x) son 0,1. Como q< 1/2, se deduce

que q = 0.

Page 56: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

52

Usaremos en lo sucesivo la notación a−n := bn para los números naturales

n = 1,2, ... . Así pues, la sucesión (an)n∈Z es decreciente.

Unicidad.

Demostremos primero la unicidad en el teorema. Para ello, supongamos que t

es un generador aditivo y continuo de T como se establece en el enunciado, y sea

h = t [−1] su pseudoinversa, que es no creciente. Tenemos entonces

h(2n) = an

para todo n ∈ Z . Sea Z2 el anillo de los números diádicos, es decir números

racionales cuyo denominador es una potencia de 2 ( es el anillo de fracciones

Z2 =Z2N del anillo Z por el subconjunto multiplicativamente cerrado 2N ⊆ Z de

las potencias de 2). Sea x ∈ Z2 un número diádico, que expresamos como está

indicado en el enunciado y por tanto con xn = 0 para "casi todos" los n ∈ Z (esto

expresa, como es usual, "todos, salvo un número finito de ellos") Definimos

sx := Tn∈Z(xnan +1− xn) ∈ [0,1]

(casi todos los argumentos xnan +1− xn toman valor 1). Así pues

sx = Txn 6=0(an)

si x 6= 0, y s0 = 1. Tenemos entonces

h(x) = h(Σn∈Zxn2n) = h(Σxn 6=02n) = Txn 6=0(an) =

= Tn∈Z(xnan +1− xn) = sx

si x 6= 0, y h(0) = 1 = s0. Esto prueba la unicidad, tal como se requería,

puesto que dos elecciones distintas de generadores t aditivos y continuos tendrían

dos distintas pseudoinversas h = t [−1] continuas y con el mismo comportamiento

Page 57: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

53

h(x) = sx sobre Z2∩ [0,∞), en contradicción con el hecho de que este conjunto

es denso en [0,∞).

Existencia.

Probemos ahora la existencia. Para construir un generador aditivo continuo t ,

o de forma equivalente su pseudoinversa h : [0,∞]−→ [0,1], asignamos primero

valores h(x) = sx a cualquier x ∈ Z2 ∩ [0,∞), donde sx está definido como

en la demostración de la unicidad. Observamos que, para dos números x,y ∈

Z2∩ [0,∞), esta asignación satisface

h(x+ y) = h(x)∗h(y)

Podemos suponer, sin pérdida de generalidad, que

x =x′

2k , y =y′

2k

para enteros no negativos x′,y′,k. En efecto para cualquier número entero

n≥−k,

an = an−1 ∗an−1 = a−k ∗ 2n+k+1)... ∗a−k = a∗2n+k+1

−k

Tenemos h(x) = a∗x′−k y h(y) = a∗y

−k, y así pues

h(x+ y) = a∗(x′+y′)

−k = a∗x′−k ∗a∗y

−k = h(x)∗h(y)

Decrecimiento estricto en h−1((0,1))

Sean x < y números diádicos positivos, y considerémoslos expresados en

forma binaria con el mismo número de decimales, lo que podemos conseguir aña-

diendo ceros al que tenga menos decimales. Obviamente, sumando reiterada-

mente el último dígito decimal, construimos una sucesión creciente que partiendo

del valor x alcanza el valor y. Cualquiera de estas adiciones produce en la ima-

gen por h un decrecimiento no estricto pues se traduce en la multiplicación por el

Page 58: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

54

correspondiente xn , y siendo toda t-norma monótona (T3) sabemos que a∗xn ≤ a

.

Es fácil ver que cada una de estas adiciones supone en la imagen por h un

decrecimiento estricto, pues si una sola vez la imagen no decreciera ya no lo haría

en lo sucesivo por estarse repitiendo el mismo producto. Esto permitiría doblar el

número b a partir del cual esto sucediera, sin que se alteraran las imágenes, por

lo que se tendría h(b) ∗ h(b) = h(b) con 0 < x ≤ b ≤ y < 1, lo que contradiría el

carácter arquimediano de T . Argumentemos esto en lenguaje más formal:

Se trata de ver que la asignación h : Z2∩ [0,∞) −→ [0,1] es estrictamente

decreciente en Z2∩ [0, l], donde l = sup x | h(x)> 0. Para verificarlo, expre-

semos dos números diádicos x < y en este dominio con un mismo denominador

x′

2n <y′

2n

donde x′,y′ ∈ Z≥0. Para k = 1, ..., y′− x′, la sucesión (ck) con ck =x′2n +

k2n

tiene imagen (h(ck)) decreciente puesto que

h(ck) = h(x′

2n +k2n ) = h(

x′

2n +k−1

2n )∗h(12n )

≤ h(x′

2n +k−1

2n ) = h(ck−1)

por el axioma (T3). En consecuencia, h(x)≥ h(y). Si alguna de las desigualdades

anteriores fuera una igualdad, por ejemplo para k0 , lo sería también para todo

k ≥ k0. Esto sería cierto en particular para k = 2k0, llegándose así a

h(ck0) = h(ck0 + ck0) = h(ck0)∗h(ck0)

con 0 < x < ck0 ≤ y < 1, lo que contradice el hecho de que T arquimediana.

Llegamos así a h(x)> h(y), como se requería.

Extensión por continuidad a todos los reales positivos.

Page 59: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

55

Para un número real positivo

x = Σn∈Zxn2n ∈ R+

(con xn = 0, para n > log2 x) y un entero positivo k > 0, definimos las aproxima-

ciones por defecto y por exceso

x[k] = Σn≥−kxn 2n ∈ Z+2 y x(k) = x[k]+

12k ∈ Z

+2

Ambas sucesiones, la sucesión creciente x[k] y la sucesión decreciente x(k) tienen

límite x, y de la misma forma las sucesiones h(x[k]) y h(x(k)) tienen un mismo

límite que denotaremos h(x), puesto que

lim h(x(k)) = limh(x[k]+12k ) = limT (h(x[k]),h(

12k )) =

= T (limh(x[k]), lim a−k) = T (limh(x[k]),1) = lim h(x[k])

La aplicación no creciente

h : [0,∞)−→ [0,1]

así definida es continua, pues hemos visto que cada x ∈ [0,∞) es límite de una

sucesión creciente y una sucesión decreciente cuyas imágenes convergen a h(x), lo

que es suficiente por la monotonía de h sobre los números diádicos. Observemos

que h es decreciente en [0, l] , donde

l = supy | h(y)> 0

puesto que ya lo probamos sobre los números diádicos sobre este intervalo. Clara-

mente, su extensión h : [0,∞]−→ [0,1] , obtenida al tomar h(∞) = 0, sigue siendo

continua. La inversa t : [0,1] −→ [0,∞] de la función decreciente hb[0,l] es el

generador aditivo y continuo de T que se buscaba. Esto prueba su existencia, y la

última parte del teorema se sigue de la construcción.

Page 60: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

56

Error de aproximación.

Se puede estimar el error en nuestra aproximación a h(x) empleando las de-

sigualdades h(x[k])< h(x)< h(x(k)).

Velocidad algorítmica.

La presente construcción de t a través de h presenta claras ventajas computa-

cionales:

1. Los valores an , para valores enteros n > 0, son calculables a velocidad

aritmética dentro de un cierto rango. Se almacenan en un vector A.

2. En cuanto a los valores an , para valores enteros n < 0, se obtiene cada

uno de forma sencilla a partir del valor anterior resolviendo una ecuación del tipo

T (x,x) = a. Estos valores se almacenan en un vector B.

4. Almacenados los vectores A y B con tanta longitud como precisión se re-

quiera, la computación crecerá con el número de dígitos no nulos de la truncación

km de x, y será por tanto un algoritmo de velocidad O(log2 x,m) si aceptamos que

el producto de la t-norma se produce en tiempo aritmético. Obviamente, si el

número de decimales tendiera a infinito, deberíamos contemplar los costes de al-

macenaje de A y de B, así como el crecimiento de la complejidad operativa para

el cálculo de T (a,b). Como para los niveles de precisión ordinariamente requeri-

dos los costes de almacenaje de A y B son obviables, por lo que obtenemos la

velocidad algorítmica anunciada

O(log2 x,m)

donde m es el número de dígitos decimales en la aproximación x[k] de x, que

depende del nivel de precisión requerido, y log2 x es el número de dígitos de su

parte entera.

Page 61: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

57

La ventaja computacional de nuestra construcción se basa pues en la posibili-

dad de almacenar los valores h(2n) para números altos 2n que son expresados

con bajos exponentes n≥ 0, y una indicación similar vale para números con mu-

chos dígitos decimales.

Conclusiones:

Hemos dado una demostración del teorema de Ling, que es un recíproco no

trivial del lema trivial que afirma que cualquier función t : [0,1] −→ [0,∞] es-

trictamente decreciente y continua que cumpla t(1) = 0 genera aditivamente una

t-norma T arquimediana y continua. Este recíproco afirma que cualquier t-norma

T arquimediana y continua puede ser generada de esta forma y que su gener-

ador t es único. La forma en que nosotros construimos este generador parece

más sencilla que la original en la demostración original de Ling, y de hecho tiene

velocidad algorítmica mayor que la de Ling.

Hemos construido también una familia de t-normas que generaliza algunas

de las t-normas de Schweizer y Sklar, incluyendo la t-norma de Lukasiewicz,

así como algunas de las t-normas de Yager. Hemos desarrollado también unas

t-normas adecuadas para controlar la transitividad de una relación de indistin-

guibilidad basada en procesos observacionales de Poisson. Parece interesante y

realista, como trabajo futuro, buscar t-normas más generales que generalicen to-

das las t-normas de Schweizer-Sklar y de Yager, e incluso algunas otras t-normas

ahora dispersas en la bibliografía.

Page 62: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

58

Page 63: UNIVERSITAT POLITÈCNICA DE CATALUNYA FACULTAT DE ...

Bibliography

[Dub-Prad] Dub-Prad: D. Dubois, H.M. Prade, "Fundamentals of

Fuzzy Sets", Kluwer Academic Publishers, Norwell,

2000.

[Hern-Mont-Mart-Mont] J. Hernandez, I. Montes, D. Martinetti, S. Montes, "Es-

tudio de la probabilidad de Zadeh para t- normas Arqui-

medianas", ESTYLF 2010

[Klem] E.P. Klement, R. Mesiar, E. Pap, "Triangular Norms",

Kluwer Academic Publishers, Dordrecht, 2000, 122.

[Kru-Geb-Kla] R.. Kruse, J. Gebhardt, F. Klawonn, "Foundations of

Fuzzy Systems", Wiley, 1994, Chichester.

[Ling] C.M. Ling, "Representation of associative functions",

Publ. Mat. Debrecen 12. 189-212, 1965.

[Rec] J. Recasens, "A Small course on indistinguishability

operators", 2007, Preprint de la Escuela de Arquitec-

tura de Barcelona.

[Sch-Sk] B. Schweizer, A. Sklar, "Associative Functions and Sta-

tistical Triangle Inequalities", Publ Math Debrecen 8:

169-186, 1961

59