Distribución y fragmentación de datos

15
Distribución y Fragmentación de Datos José Alfredo Mendoza Heredia Maricruz ´Chávez Chávez Morelia, Michoacán a 24 de febrero de 2014

Transcript of Distribución y fragmentación de datos

Page 1: Distribución y fragmentación  de datos

Distribución y

Fragmentación de Datos

José Alfredo Mendoza Heredia

Maricruz ´Chávez Chávez Morelia, Michoacán a 24 de febrero de 2014

Page 2: Distribución y fragmentación  de datos

¿Distribuir?Para esto existen cuatro alternativas

principales:

Centralizada

Replicada

Fragmentada

Híbrida.

Una de las decisiones más

importantes que el diseñador de

bases de datos distribuidas debe

tomar es el posicionamiento de la

data en el sistema y el esquema bajo

el cuál lo desea hacer.

Page 3: Distribución y fragmentación  de datos

Centralizada

• Es muy similar al modelo de Cliente/Servidor en el sentido que la BDD está

centralizada en un lugar y los usuarios están distribuidos.

• Este modelo solo brinda la ventaja de tener el procesamiento distribuido ya

que en sentido de disponibilidad y fiabilidad de los datos no se gana nada.

Page 4: Distribución y fragmentación  de datos

Replicadas

• El esquema de BDD de replicación consiste en que cada nodo debe tener su copia

completa de la base de datos.

• Es fácil ver que este esquema tiene un alto costo en el almacenamiento de la

información.

• Debido a que la actualización de los datos debe ser realizada en todas las copias,

también tiene un alto costo de escritura, pero todo esto vale la pena si:

Tenemos un sistema en el que se va a escribir pocas veces y leer muchas.

Dónde la disponibilidad y fiabilidad de los datos sea de máxima importancia.

Page 5: Distribución y fragmentación  de datos

Granularidad

• Al referirnos a lo que es bloqueo en bases de datos en realidad utilizamos lo

que se conoce como granularidad del bloqueo.

• La granularidad se refiere a que tan fino se quiere que sea un bloqueo. Por

ejemplo:

• ¿Desea bloquear la tabla completa (un bloqueo de granularidad gruesa)

• Solo desea bloquear una fila especifica (un bloqueo de granularidad fina)?.

Page 6: Distribución y fragmentación  de datos

Particionadas

• Este modelo consiste en que solo hay una copia de cada elemento, pero la información está distribuida a través de los nodos.

• En cada nodo se aloja uno o más fragmentos disjuntos de la base de datos.

• Como los fragmentos no se replican esto disminuye:

• El costo de almacenamiento.

Pero:

• Sacrifica la disponibilidad.

• Fiabilidad de los datos.

Page 7: Distribución y fragmentación  de datos

La fragmentación se puede realizar también de tres formas:

•Horizontal: Los fragmentos son subconjuntos de una tabla

(análogo a un restringir).

•Vertical: Los fragmentos son subconjuntos de los atributos con

sus valores (análogo a un proyectar).

•Mixto: Se almacenan fragmentos producto de restringir y

proyectar una tabla.

Page 8: Distribución y fragmentación  de datos

¿Ventajas o

Desventajas?• Una ventaja significativa de este esquema

es que las consultas (SQL) también se

fragmentan por lo que su procesamiento

es en paralelo y más eficiente

• Pero se sacrifica con casos especiales

como usar JUNTAR o PRODUCTO, en

general casos que involucren varios

fragmentos de la BDD.

Una ventaja importante de

mencionar es la siguiente:

Page 9: Distribución y fragmentación  de datos

Para que una fragmentación sea correcta

esta debe cumplir con las siguientes

reglas:

Debe ser Completa

Debe ser Reconstruible

Los fragmentos deben ser Disjuntos

Page 10: Distribución y fragmentación  de datos

Debe ser Completa

Si una relación R se fragmenta en R1,R2, ... , Rn, cada elemento de la data de R

debe estar en algún Ri.

Page 11: Distribución y fragmentación  de datos

Debe ser Reconstruible

Debe ser posible definir una operación relacional que a partir de los fragmentos

obtenga la relación.

Page 12: Distribución y fragmentación  de datos

Los fragmentos deben ser Disjuntos

Si la fragmentación es horizontal entonces si un elemento e está en Ri este

elemento no puede estar en ningún Rk (para k distinto a i).

En el caso de fragmentación vertical es necesario que se repitan las llaves

primarias y esta condición solo se debe cumplir para el conjunto de atributos

que no son llave primaria.

Page 13: Distribución y fragmentación  de datos

Híbrido

• Este esquema simplemente representa la combinación del esquema de

partición y replicación.

• Se particiona la relación y a la vez los fragmentos están selectivamente

replicados a través del sistema de BDD.

Page 14: Distribución y fragmentación  de datos

¿Existen Criterios?

• Localidad de los datos.

• Fiabilidad de los datos.

• Disponibilidad de los datos.

• Capacidades y costos de almacenamiento.

• Distribución de la carga de

procesamiento.

• Costo de comunicación.

• Uso del sistema.

Existen un conjunto de criterios

para escoger la distribución :

Page 15: Distribución y fragmentación  de datos

• El éxito depende mucho de una buena distribución de los datos.

• Es importante considerar todos los criterios de distribución desde etapas de

diseño.

• La fragmentación brinda ventajas pero al mismo tiempo una cantidad

considerable de desventajas.

• Es importante que i la fragmentación es horizontal entonces si un elemento e

está en Ri este elemento no puede estar en ningún Rk