DATOS DIFUSOS EN UN DBMS: SEMÁNTICA Y PRAGMÁTICA

Post on 21-Jan-2018

480 views 0 download

Transcript of DATOS DIFUSOS EN UN DBMS: SEMÁNTICA Y PRAGMÁTICA

DATOS DIFUSOS EN UN DBMS: SEMÁNTICA Y PRAGMÁTICA

Prof. Leonid TINEO, PhDUNIVERSIDAD SIIMÓN BOLÍVARVENEZUELA

Segundo Congreso Andino deComputación. Informática y Educación

CACIED 2015

Esquema del Contenido

• El grupo de investigación

• Preliminares

• Resultados obtenidos

• Librería 2013-Extensión-Esquemas de Traducción

• Aplicación web 2013

• Datos tipo 2. 2014

• Página web 2014 Análisis de desempeño

• Ordenamiento de diferentes tipos de datos difusos

• Distintos tipos de ordenamientos

• Trabajos futuros

Resultados de InvestigacionGrupo de Base de Datos Difusos (USB) 2 /50

Grupo de Bases de Datos Difusas - USB

Grupo de Base de Datos Difusos (USB) 3 /50

LeonidTINEO

leonid@usb.ve

RosselineRODRÍGUEZ

crodrig@usb.ve

Ricardo MONASCAL

rmonascal@usb.ve

DavidCORONADOdcoronado@usb.ve

SorayaCARRASQUELscarrasquel@usb.ve

DarwinROCHAdarwinrocha@usb.ve

José TomásCADENASjtcadenas@usb.ve

Josué RAMÏREZ

ramirezjosue@usb.ve

Grupo de Bases de Datos Difusas - USB

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 3 /50

LeonidTINEO

leonid@usb.ve

RosselineRODRÍGUEZ

crodrig@usb.ve

Ricardo MONASCAL

rmonascal@usb.ve

DavidCORONADOdcoronado@usb.ve

SorayaCARRASQUELscarrasquel@usb.ve

DarwinROCHAdarwinrocha@usb.ve

José TomásCADENASjtcadenas@usb.ve

Josué RAMÏREZ

ramirezjosue@usb.ve

David Alejandro

Lıneas de Investigacion

[Proyecto: Desafıos del Modelo

Relacional Difuso]

Resolver problemas abiertos del

Modelo Relacional Difuso,

particularmente vinculados a

1 relaciones de similitud

distribuciones de posibilidad y

operaciones con atributos

2

3

difusos

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 4 /50

Lıneas de Investigacion

[Proyecto: Desafıos del Modelo

Relacional Difuso]

Resolver problemas abiertos del

Modelo Relacional Difuso,

particularmente vinculados a

1 relaciones de similitud

distribuciones de posibilidad y

operaciones con atributos

2

3

difusos

2

[Bases de Datos

Sensibles al Contexto]

Las BD permiten flexibilizar

la representacion de los datos

mediante terminos lingu ısticos

Los terminos lingu ısticos

son elementos fuertemente

sensibles al contexto

La sensibilizacion al contexto

mejora el uso de las BD

1

3

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 4 /50

Preliminares

Conjunto difusoUn conjunto difuso S en un uni-

verso X

µS : X → [0,1]

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 6 /50

Preliminares

Conjunto difusoUn conjunto difuso S en un uni-

verso X

µS : X → [0,1]

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 6 /50

Preliminares

Conjunto difusoUn conjunto difuso S en un uni-

verso X

µS : X → [0,1] Relacion de similitud

µS : X × X → [0,1]

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 6 /50

Preliminares

Conjunto difusoUn conjunto difuso S en un uni-

verso X

µS : X → [0,1] Relacion de similitud

µS : X × X → [0,1]

µS(x,x) = 1,∀x ∈X

µS(x,y) = µS(y,x),∀x,y ∈X

µS(x,z) =maxy (mın(µS(x,y),µS(y,z)))∀x,y,z ∈X

1

2

3

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 6 /50

Numeros Difusos-Distribucion de Posibilidad

Distribucion de posibilidad Es el conjunto difuso de los

posibles valores de una variable.

πa = {πa(x)/x ,x ∈U }

πa = {πa(x1)/x1,πa(x2)/x2,.. .,πa(xn)/xn}

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 7 /50

Numeros Difusos-Distribucion de Posibilidad

Distribucion de posibilidad Es el conjunto difuso de los

posibles valores de una variable.

πa = {πa(x)/x ,x ∈U }

πa = {πa(x1)/x1,πa(x2)/x2,.. .,πa(xn)/xn}

Numero Difuso Es un caso particular de un conjunto

difuso, donde el dominio es ordenado y la funcion es

convexa y normalizada

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 7 /50

1

x1 x2 x3 x4

1

1 2 3 4

Proyecto: Desafıos del Modelo Relacional Difuso

Se trabajo con los diferentes tipos de datos del modelo relacional FUZZY

EER

Tipo 1: atributos con valores de datos precisos.

Tipo 2: atributos con valores de datos difusos

representados como numeros difusos.

Tipo 3: atributos con valores en un dominio formado por

etiquetas provisto de una relacion de similitud entre las

etiquetas y distribuciones de posibilidad sobre ellasa.

Tipo 4: similar a los atributos del tipo 3, pero sin las

relaciones de similitud.

aComo estudiaremos estas distribuciones de posibilidad por separado, lasllamaremos Tipo 5

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 8 /50

Resultados obtenidos: Librerıa 2013 1

Librerıa

Se creo un librerıa que implementa

consultas difusas usando software libre para

atributos Tipo 3 con

1 Ordenamiento

Agrupamiento2

Se posee la definicion formal de ellas.

1A. Gyomrey, B. Stornelli R. Rodrıguez, L. T ineo, S. CarrasquelGrupo de Base de Datos Difusos (USB) Resultados de Investigacion 9 /50

Extension 2013 2

Extension

Se extiende MariaDB usando una arquitectura de

acoplamiento medio que consiste en una implementacion

intermedia donde la logica de la extension fue programada en

el lenguaje nativo del SGBD

Esta extension posee una capa externa programada en JAVA

que implementa los esquemas de traduccion entre el lenguaje

extendido y el lenguaje nativo del SGBD

2A. Gyomrey, B. Stornelli R. Rodrıguez, L. T ineo, S. CarrasquelGrupo de Base de Datos Difusos (USB) Resultados de Investigacion 10 /50

Esquemas de Traduccion 2015 3

Esquemas de Traduccion

Traducen sentencias de manipulacion y consulta

de BD con cualidades difusas a Postgre SQL

extendiendo el catalogo de datos

3R. Rodrıguez, L. T ineo, S. Carrasquel, R. MonascalGrupo de Base de Datos Difusos (USB) Resultados de Investigacion 11 /50

Sentencias soportadas

SELECT

CREATE TABLE

ALTER TABLE

DROP TABLE

CREATE FUZZY DOMAIN

ALTER FUZZY DOMAIN

◮ ADD VALUES◮ DROP VALUES◮ ADD SIMILARITY◮ DROP SIMILARITY

DROP FUZZY DOMAIN

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 12 /50

Catalogo

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 13 /50

Ejemplo

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 14 /50

Ejemplo Group BY

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 15 /50

Ejemplo ORDER BY

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 16 /50

Aplicacion 4

Aplicacion web 2013

Se construyo una aplicacion Web, sobre una base de

datos real usando MariaDB extendido, con consultas

difusas.

4S. Moreau, C. Timaury, R. Rodrıguez, L. T ineo, S. Carrasquel (2013)Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 17 /50

Cercanıa ciudades 5

5S. Moreau, C. Timaury, R. Rodrıguez, L. T ineo, S. Carrasquel (2013)Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 18 /50

Categorıa empresas 6

6S. Moreau, C. Timaury, R. Rodrıguez, L. T ineo, S. Carrasquel (2013)Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 19 /50

Resultado de una consulta 7

7S. Moreau, C. Timaury, R. Rodrıguez, L. T ineo, S. Carrasquel (2013)Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 20 /50

Datos tipo 2. 20148

2014

Se migro el proyecto anterior a PostgreSQL sin afectar la

funcionalidad

Se creo sintaxis de literales difusos

Se extendio el catalogo, el parser, las operaciones

Se uso la base de datos de de Opinion Estudiantil (USB)

Se agrego a las materias 3 atributos difusos calculados sobre lasrespuestas a las siguientes preguntas

◮ Calificacion que esperas obtener al final del curso◮ Asıgnale un puntaje al grado de dificultad del curso◮ Preparacion previa para cursar esta asignatura

8J. Melian, J. Antonini, J. Goncalves, R. Monascal, D. Coronado, L. T ineo, S.

Carrasquel (2014)Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 21 /50

Portal web. 2014

9

9L. Esparragoza, J. Lovera, C. Nardone, R. Porras, R. Monascal, R. Rodrıguez, D.Coronado, L. T ineo, S. Carrasquel (2014)

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 22 /50

Casos de uso

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 23 /50

Diagrama de base de datos

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 24 /50

El nombre, mascota y diseno seleccionados

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 25 /50

Pruebas de compatibilidad

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 26 /50

Pruebas de funcionamiento

http://fuzzydodb.ldc.usb.ve/

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 27 /50

Analisis de Desempeno 2014: Bases de datos

Pokemon (creada)

10P. Zambrano, V. Balleste, A. Marcano, L. M. Garcıa, R. Monascal, R. Rodrıguez, D.Coronado, L. T ineo, S. Carrasquel (2014)

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 28 /50

Analisis de Desempeno 2014: Bases de datos

Pokemon (creada) World

10

10P. Zambrano, V. Balleste, A. Marcano, L. M. Garcıa, R. Monascal, R. Rodrıguez, D.Coronado, L. T ineo, S. Carrasquel (2014)

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 28 /50

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 29 /50

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 30 /50

Resultados

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 31 /50

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 32 /50

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 33 /50

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 34 /50

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 35 /50

Ordenamiento de diferentes tipos de datos difusos

Datos Tipo 1 atributos con valores de datos precisos

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 36 /50

Nombre · ··

Edad

Juan 28

Jose 20

Marıa 25

Marta 19

Alberto 21

Ordenamiento de diferentes tipos de datos difusos

Datos Tipo 1 atributos con valores de datos precisos

Se puede ordenar de forma clasica.

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 36 /50

Nombre · ··

Edad

Juan 28

Jose 20

Marıa 25

Marta 19

Alberto 21

Nombre · ··

Edad

Marta 19

Jose 20

Alberto 21

Marıa 25

Juan 28

Ordenamiento de diferentes tipos de datos difusos

Datos Tipo 1 atributos con valores de datos precisos

Se puede consultar de acuerdo a algu-

na etiqueta difusa, por ejemplo

16 18 20 22

Joven = { 1/Marta, 1/Jose, 0,5/Alberto}

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 36 /50

Nombre · ··

Edad

Juan 28

Jose 20

Marıa 25

Marta 19

Alberto 21

1 Joven

Datos Tipo 3

Atributos con valores en un dominio formado por etiquetas provisto de una

relacion de similitud entre las etiquetas

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 37 /50

Nombre · ··

Edad

Juan Mayor

Jose Joven

Marıa Adulto

Marta Mayor

Alberto AdultoJo Ad Ma

Jo 1 0.75 0

Ad – 1 0,5

Ma – – 1

Datos Tipo 3

Atributos con valores en un dominio formado por etiquetas provisto de una

relacion de similitud entre las etiquetas

Se puede ordenar usando la relacion

de similitud, escogiendo la primera

clase de la lista (Joven):

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 37 /50

Nombre · ··

Edad

Juan Mayor

Jose Joven

Marıa Adulto

Marta Mayor

Alberto AdultoJo Ad Ma

Jo 1 0.75 0

Ad – 1 0,5

Ma – – 1

Nombre · ··

Edad

Jose Joven

Marıa Adulto

Alberto Adulto

Marta Mayor

Juan Mayor

Datos Tipo 3

Atributos con valores en un dominio formado por etiquetas provisto de una

relacion de similitud entre las etiquetas

Se puede agrupar igualmente

Joven = { 1/Jose,

0,75/Marıa, 0,75/Alberto}

Adulto = { 1/Marıa, 1/Alberto,

0,75/Jose,

0,5/Juan, 0,5/Marta}

Mayor = { 1/Juan, 1/Marta,

0,5/Marıa, 0,5/Alberto}

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 37 /50

Nombre · ··

Edad

Juan Mayor

Jose Joven

Marıa Adulto

Marta Mayor

Alberto AdultoJo Ad Ma

Jo 1 0.75 0

Ad – 1 0,5

Ma – – 1

Datos Tipo 3

Atributos con valores en un dominio formado por etiquetas provisto de una

relacion de similitud entre las etiquetas

Las distribuciones de posibilidad so-

bre etiquetas lingu ısticas no ordena-

das provistas de una relacion de simi-

litud las llamaremos datos Tipo 5 y se

estudiaran posteriormente

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 37 /50

Nombre · ··

Edad

Juan Mayor

Jose Joven

Marıa Adulto

Marta Mayor

Alberto AdultoJo Ad Ma

Jo 1 0.75 0

Ad – 1 0,5

Ma – – 1

Datos Tipo 2

Atributos con valores de datos difusos representados como numeros difusos

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion 38 /50

Nombre · ··

Edad · ··

Juan - {0, 75/16, 1/18, 1/20,0,75/22}

-

Jose - {0,75/18, 1/20, 0,75/25} -

Marıa - (22, 25, 28, 30) -

Marta - (25, 28, 30, 32) -

Alberto - {1/30} -

Datos Tipo 2

Atributos con valores de datos difusos representados como numeros difusos

Para este tipo de datos

Existen varios tipos de ordenamiento: estamos implementandolos y compa-

rando.

Grupo de Base de DatosDifusos (USB)

Resultados de Investigacion 38 /50

Nombre · · · Edad · · ·

Juan - {0, 75/16, 1/18, 1/20,0,75/22}

-

Jose - {0,75/18, 1/20, 0,75/25} -

Marıa - (22, 25, 28, 30) -

Marta - (25, 28, 30, 32) -

Alberto - {1/30} -

Datos Tipo 2

Atributos con valores de datos difusos representados como numeros difusos

Para este tipo de datos

Con cada ordenamiento, se puede definir un agrupamiento.

Grupo de Base de DatosDifusos (USB)

Resultados de Investigacion 38 /50

Nombre · · · Edad · · ·

Juan - {0, 75/16, 1/18, 1/20,0,75/22}

-

Jose - {0,75/18, 1/20, 0,75/25} -

Marıa - (22, 25, 28, 30) -

Marta - (25, 28, 30, 32) -

Alberto - {1/30} -

Datos Tipo 5

Las distribuciones de posibilidad sobre etiquetas lingu ısticas no ordenadas

provistas de una relacion de similitud

Grupo de Base de DatosDifusos (USB)

Resultados de Investigacion 39 /50

Nombre · · · Edad

Juan {1/Jo}

Jose {0,75/Jo, 1/Ad , 0,75/Ma}

Marıa {0,75/Ad , 1/Ma}

Marta {1/Ad, 0,75/Ma}

Alberto {1/Ad}

Jo Ad Ma

Jo 1 0.75 0

Ad – 1 0,75

Ma – – 1

Datos Tipo 5

Las distribuciones de posibilidad sobre etiquetas lingu ısticas no ordenadas

provistas de una relacion de similitud

Este caso

Tambien se esta implementan-

do.

Grupo de Base de DatosDifusos (USB)

Resultados de Investigacion 39 /50

Nombre · · · Edad

Juan {1/Jo}

Jose {0,75/Jo, 1/Ad , 0,75/Ma}

Marıa {0,75/Ad , 1/Ma}

Marta {1/Ad, 0,75/Ma}

Alberto {1/Ad}

Jo Ad Ma

Jo 1 0.75 0

Ad – 1 0,75

Ma – – 1

Datos Tipo 5

Las distribuciones de posibilidad sobre etiquetas lingu ısticas no ordenadas

provistas de una relacion de similitud

Este caso

Por ser una combinacion de ca-

sos, existen varias formas de or-

denar/agrupar.

Grupo de Base de DatosDifusos (USB)

Resultados de Investigacion 39 /50

Nombre · · · Edad

Juan {1/Jo}

Jose {0,75/Jo, 1/Ad , 0,75/Ma}

Marıa {0,75/Ad , 1/Ma}

Marta {1/Ad, 0,75/Ma}

Alberto {1/Ad}

Jo Ad Ma

Jo 1 0.75 0

Ad – 1 0,75

Ma – – 1

Datos Tipo 4

Atributos con valores en un dominio formado por etiquetas sin relacion de

similitud

Actualmente, en estudio.

Grupo de Base de DatosDifusos (USB)

Resultados de Investigacion 40 /50

Nombre · · · Edad

Juan {1/Jo}

Jose {0,75/Jo, 1/Ad , 0,75/Ma}

Marıa {0,75/Ad , 1/Ma}

Marta {1/Ad, 0,75/Ma}

Alberto {1/Ad}Nombre · · · Edad

Juan Joven

Jose Joven

Marıa Adulto

Marta Mayor

Alberto Adulto

Datos Tipo 4

Atributos con valores en un dominio formado por etiquetas sin relacion de

similitud

Es una combinacion de casos pre-

vios, por lo que esperamos resolver

este caso una vez estos esten con-

cluidos.

Grupo de Base de DatosDifusos (USB)

Resultados de Investigacion 40 /50

Nombre · · · Edad

Juan {1/Jo}

Jose {0,75/Jo, 1/Ad , 0,75/Ma}

Marıa {0,75/Ad , 1/Ma}

Marta {1/Ad, 0,75/Ma}

Alberto {1/Ad}Nombre · · · Edad

Juan Joven

Jose Joven

Marıa Adulto

Marta Mayor

Alberto Adulto

Tipos de Ordenamiento: Sugeno

Tineo, S. Carrasquel (2014)

11S. Alibrandi, J. Delgado, J. Figueredo, R. Monascal, R. Rodrıguez, D. Coronado, L.

Grupo de Base de DatosDifusos (USB)

Resultados de Investigacion 41 /50

Tipos de Ordenamiento: Sugeno

Tineo, S. Carrasquel (2014)

11S. Alibrandi, J. Delgado, J. Figueredo, R. Monascal, R. Rodrıguez, D. Coronado, L.

Grupo de Base de DatosDifusos (USB)

Resultados de Investigacion 41 /50

Tipos de Ordenamiento: Sugeno

Tineo, S. Carrasquel (2014)

1111S. Alibrandi, J. Delgado, J. Figueredo, R. Monascal, R. Rodrıguez, D. Coronado, L.

Grupo de Base de DatosDifusos (USB)

Resultados de Investigacion 41 /50

Tipos de Ordenamiento: Choquet

12S. Alibrandi, J. Delgado, J. Figueredo, R. Monascal, R. Rodrıguez, D. Coronado, L. T ineo, S. Carrasquel (2014)

Grupo de Base de DatosDifusos (USB)

Resultados de Investigacion 42 /50

Tipos de Ordenamiento: Choquet

12S. Alibrandi, J. Delgado, J. Figueredo, R. Monascal, R. Rodrıguez, D. Coronado, L. T ineo, S. Carrasquel (2014)

Grupo de Base de DatosDifusos (USB)

Resultados de Investigacion 42 /50

Tipos de Ordenamiento: Choquet

1212S. Alibrandi, J. Delgado, J. Figueredo, R. Monascal, R. Rodrıguez, D. Coronado, L.

Tineo, S. Carrasquel (2014)Grupo de Base de DatosDifusos (USB)

Resultados de Investigacion 42 /50

Tipos de Ordenamiento: Riemann

13S. Alibrandi, J. Delgado, J. Figueredo, R. Monascal, R. Rodrıguez, D. Coronado, L. T ineo, S. Carrasquel (2014)

Grupo de Base de DatosDifusos (USB)

Resultados de Investigacion 43 /50

Tipos de Ordenamiento: Riemann

13

13S. Alibrandi, J. Delgado, J. Figueredo, R. Monascal, R. Rodrıguez, D. Coronado, L. T ineo, S. Carrasquel (2014)

Grupo de Base de DatosDifusos (USB)

Resultados de Investigacion 43 /50

Aplicacion 2014

Grupo de Base de DatosDifusos (USB)

Resultados de Investigacion 44 /50

Grupo de Base de DatosDifusos (USB)

Resultados de Investigacion 45 /50

Grupo de Base de DatosDifusos (USB)

Resultados de Investigacion 46 /50

Constantes Tipo 2

Grupo de Base de DatosDifusos (USB)

Resultados de Investigacion 47 /50

Grupo de Base de DatosDifusos (USB)

Resultados de Investigacion 48 /50

Trabajos futuros

Para datos tipo 4

ORDER BY

GROUP BY

Esquemas de traduccion

Aplicaciones

Analisis de desempeno

Grupo de Base de DatosDifusos (USB)

Resultados de Investigacion 49 /50

Para Datos T ipo 1-2-3-4

Se plantea para todos los Tipos de datos

Extender la clausula

WINDOW BY

Grupo de Base de DatosDifusos (USB)

Resultados de Investigacion 50 /50

Contáctanos …

Grupo de Base de Datos Difusos (USB) Resultados de Investigacion

LeonidTINEO

leonid@usb.ve

RosselineRODRÍGUEZ

crodrig@usb.ve

Ricardo MONASCAL

rmonascal@usb.ve

DavidCORONADOdcoronado@usb.ve

SorayaCARRASQUELscarrasquel@usb.ve

DarwinROCHAdarwinrocha@usb.ve

José TomásCADENASjtcadenas@usb.ve

Josué RAMÏREZ

ramirezjosue@usb.ve

David Alejandro