Desafíos en bases de datos difusas

Post on 14-Apr-2017

57 views 0 download

Transcript of Desafíos en bases de datos difusas

DESAFÍOS EN BASES DE DATOS DIFUSAS

surgió hace 50+ años

Zadeh, L. A. (1965). “Fuzzy Sets”

Information Control, Vol. 8, pp. 338-353

La teoría de conjuntos difusos

2

La teoría de conjuntos difusos

permite dar un tratamiento matemático-computacional a conceptos vagos del lenguaje natural

𝜇𝐹: 𝑋 → 0,1

0,000,250,500,751,00

x1 x2 x3 x4 x5

0,000,250,500,751,00

x1 x2 x3 x4

3

Conjuntos difusos en bases de datos

30+ años como tema de interés

Datos DifusosBuckles, B., Petry, F. (1982). “A Fuzzy Representation of Data for

Relational Databases”, Fuzzy Sets and Systems

Consultas DifusasBosc, P., Galibourg, M., Hamon, G. (1988). “Fuzzy Querying with SQL:

Extensions and Implementation Aspects”, Fuzzy Sets and Systems

4

Conjuntos difusos en bases de datos

30+ años, mas no ha sido completamente explorado

No se ha incluido en el más reciente estándar

ISO/IEC (2011) Information technology — Database languages— SQL — Part 2: Foundation (SQL/Foundation), ISO/IEC 9075-

2:2011 (en)

5

Conjuntos difusos en bases de datos

30+ años, mas no ha sido completamente explorado

No se han resuelto interrogantes en el más reciente libro

Pivert, O. & Bosc, P. (2012) Fuzzy Preference Queries to Relational Databases, Imperial College Press

6

Conjuntos difusos en bases de datos

30+ años, mas no ha sido completamente explorado

No se ha aplicado el más reciente principio

Zadeh, L. A. (2015) “The Information Principle”, Information Sciences

7

Conjuntos difusos en bases de datos

30+ años, mas no ha sido completamente explorado

No se ha llevado a la más reciente tendencia: Big Data

Abadi, D. et al. (2016) “The Beckman Report on Database Research”, Communications of the ACM

8

Conjuntos difusos en bases de datos

Los SGBD actuales siguen adoleciendo de rigidez en la representación de datos imperfectos y consultas basadas en preferencias del usuario y el contexto

9

Modelo Relacional Difuso

20+ años se propuso GEFREDpermite representar relaciones difusas y atributos difusos

𝑅 𝑎1, 𝑎2, … , 𝑎𝑛 = Τ𝑡𝑖 𝜇𝑖

𝜇𝑖 = 𝜇𝑅 𝑡𝑖𝑡𝑖 = 𝑑𝑖,1, 𝑑𝑖,2, … , 𝑑𝑖,𝑛

𝑑𝑖,𝑗𝜖𝐹𝑑𝑜𝑚 𝑎𝑗

Medina, J. et al (1993). “GEFRED: A Generalized Model of Fuzzy Relational Databases”, Information Sciences

10

Modelo Relacional Difuso

Basado en GEFRED se han definido extensiones a SQL y se han implementado prototipos de DBMS

Galindo, J. (2005). “New Characteristics in FSQL, a Fuzzy SQL for Fuzzy Databases”. WSEAS Transactions on Information Science

and Applications

Galindo, J. (Ed.) (2008), Handbook of Research on Fuzzy Information Processing in Databases. Hershey, PA, USA

11

Atributos Difusos

Se distinguen cuatro tipos de FdomTipo 1, Tipo 2, Tipo 3, Tipo 4

Galindo, J., Urrutia, A., Piattini, M. (2006). Fuzzy DatabaseModeling, Design and Implementation, Idea Group

Publishing

12

Atributos Difusos

Se separa en dos* uno de los tipos de FdomTipo 1, Tipo 2, Tipo 3*, Tipo 4, , Tipo 5*

Coronado, D. et al (2015) "Portal de fuzzydoDB". Memorias de la Tercera Conferencia Nacional de

Computación, Informática y Sistemas, Valencia, Venezuela

13

Atributos Difusos

Tipo 1

atributos con valores de datos precisos que se pueden consultar usando términos lingüísticos vagos (difusos)

14

0,000,250,500,751,00

x1 x2 x3 x4 x5

0,000,250,500,751,00

x1 x2 x3 x4

término difuso término difuso

Atributos Difusos

Tipo 2

atributos numéricos cuyos valores son datos difusosrepresentados como números difusos

15

0,000,250,500,751,00

x1 x2 x3 x4 x5

0,000,250,500,751,00

x1 x2 x3 x4

valor difuso valor difuso

Atributos Difusos

Tipo 3

atributos cuyos valores son etiquetas de un conjunto provisto de una relación difusa de similitud

16

x1 x2 x3 x4

x1 1.00 0.25 1.00 0.75

x2 0.25 1.00 0.25 0.50

x3 1.00 0.25 1.00 0.75

x4 0.75 0.50 0.75 1.00

relación de similitud

Atributos Difusos

Tipo 4

cuyos valores son distribuciones de posibilidad sobre

conjunto de etiquetas

17

0,000,250,500,751,00

x1 x2 x3 x4 x5

valor posibilístico

Atributos Difusos

Tipo 5

cuyos valores son distribuciones de posibilidad sobre

conjunto de etiquetas con una relación de similitud

18

x1 x2 x3 x4

x1 1.00 0.25 1.00 0.75

x2 0.25 1.00 0.25 0.50

x3 1.00 0.25 1.00 0.75

x4 0.75 0.50 0.75 1.00

relación de similitud

0,000,250,500,751,00

x1 x2 x3 x4 x5

valor posibilístico

No resuelto: Ordenamiento de Datos Difusos

19

0,000,250,500,751,00

x0 x1 x2 x3 x4 x5 x6

0,000,250,500,751,00

x0 x1 x2 x3 x4 x5 x6

0,000,250,500,751,00

x0 x1 x2 x3 x4 x5 x6

0,000,250,500,751,00

x0 x1 x2 x3 x4 x5 x6

No resuelto: Particionamiento de Datos Difusos

20

0,000,250,500,751,00

x0 x1 x2 x3 x4 x5 x6

0,000,250,500,751,00

x0 x1 x2 x3 x4 x5 x6

0,000,250,500,751,00

x0 x1 x2 x3 x4 x5 x6

0,000,250,500,751,00

x0 x1 x2 x3 x4 x5 x6

No resuelto: Agregación de Datos Difusos

21

0,000,250,500,751,00

x0 x1 x2 x3 x4 x5 x6

0,000,250,500,751,00

x0 x1 x2 x3 x4 x5 x6

0,000,250,500,751,00

x0 x1 x2 x3 x4 x5 x6

0,000,250,500,751,00

x0 x1 x2 x3 x4 x5 x6

No resuelto: Aritmética de Datos Difusos

22

0,000,250,500,751,00

x0 x1 x2 x3 x4 x5 x6

0,000,250,500,751,00

x0 x1 x2 x3 x4 x5 x6

0,000,250,500,751,00

x0 x1 x2 x3 x4 x5 x6

0,000,250,500,751,00

x0 x1 x2 x3 x4 x5 x6

No resuelto:

Las estructuras de almacenamiento físico y recuperación de los manejadores relacionales no se adecúan en forma

directa para datos difusos

Hay mucho trabajo por hacer en Matemáticas e Informática para dar soporte consistente y eficiente a

bases de datos difusas

23

ABDI-USB: qué proponemos

Grupo de Aplicaciones y Bases de Datos Inteligentes de la Universidad Simón Bolívar

Tiene varios resultados en el área que están publicados en revistas y memorias de congresos

Puede albergar y dirigir estudiantes en trabajo de grado y postgrado, de forma presencial o remota

24

ABDI-USB: quienes somos

Prof. Leonid TINEO

PhD en Computación

leonid@usb.ve

25

ABDI-USB: quienes somos

Prof. José Tomás CADENAS

PhD en Computación

jtcadenas@usb.ve

26

ABDI-USB: quienes somos

Prof. David CORONADO

PhD en Matemáticas

dcoronado@usb.ve

27

ABDI-USB: quienes somos

Prof. Rosseline RODRÍGUEZ

MSc en Computación

crosseliner@usb.ve

28

ABDI-USB: quienes somos

Prof. Soraya CARRASQUEL

MSc en Matemáticas

scarrasquel@usb.ve

29

ABDI-USB: quienes somos

Prof. Ricardo MONASCAL

MSc en Computación

rmonascal@usb.ve

30

ABDI-USB: quienes somos

Prof. Josué RAMÍREZ

MSc en Computación

ramirezjosue@usb.ve

31

ABDI-USB: quienes somos

Prof. Darwin ROCHA

Lic en Computación

darwinrocha@usb.ve

32

Hay mucho trabajo por hacer

"Y todo lo que hagáis, hacedlo de corazón, como para el Señor y no para los hombres“

(Colosenses 3:23)

GRACIAS

33