Base de Datos Distribuida (1)

26
BASE DE DATOS DISTRIBUIDA

description

BD

Transcript of Base de Datos Distribuida (1)

BASE DE DATOS DISTRIBUIDA

BASE DE DATOS DISTRIBUIDA1INTROCUCCIONConstruida sobre una red computacional y no en una mquina aislada. La informacin se almacena en diferentes sitios en la red, y las aplicaciones que se ejecutan accesan datos en distintos sitios. La administracin empieza con la planeacin del sistema de la empresa. Los gerentes planean la distribucin de todos los recursos y el trabajo de las organizaciones; los no gerentes planean solo sus propias actividades.2CONCEPTOLos datos se almacenan en varios computadores de un sistema distribuido se comunican entre s a travs de diversos medios de comunicacin, tales como cables de alta velocidad o lneas telefnicas. Un sistema distribuido de bases de datos consiste en un conjunto de localidades, cada uno de las cuales puede participar en la ejecucin de transacciones que accedan a datos de una o varias localidades

3DDBMS(distributed database management system ). Sistema de administracin de base de datos distribuidosE l sistema de bases de datos distribuidas es unasociedad entre los DBMS .Componente de software en cada sitio .Aspecto lgico de DBMS local realiza las funciones de sociedad necesarias; y es la combinacin de este nuevo componente y el DBMS .

4DIFERENCIA DE SISTEMASBase de datos distribuidos se encuentran en varias localidadesexiste un administrador global de la base de datos que se encarga de todo el sistema. base de datos centralizadoslos datos residen en una sola localidad.el administrador de base de datos de la localidad central controla la base de datos. 5EstructuraConsiste en un conjunto de localidades, cada una de las cuales mantiene un sistema de base de datos local. Cada localidad puede procesar transacciones locales, o bien transacciones globales entre varias localidades, requiriendo para ello comunicacin entre ellas.

6FORMAS DE CONECTARSE ENTRE LOCALIDADES FISICAMENTERed totalmente conectadaRed prcticamente conectadaRed con estructura de rbolRed de estrellaRed de anillo

7DIFERENCIAS ENTRE CONFIGURACIONES Coste de instalacin: El coste de conectar fsicamente las localidades del sistemaCoste de comunicacin: El coste en tiempo y dinero que implica enviar un mensaje desde la localidad A a la B.Fiabilidad: La frecuencia con que falla una lnea de comunicacin o una localidad.Disponibilidad: La posibilidad de acceder a informacin a pesar de fallos en algunas localidades o lneas de comunicacin.8TIPOS DE LLAMADASLas localidades pueden estar dispersas en una rea geogrfica extensa (a lo largo de un pas):llamadas redes de larga distancia se utilizan en la comunicacin lneas telefnicas, conexiones de microondas y canales de satlites; llamadas redes de rea local (en un mismo edificio) se utiliza cables coaxiales de banda base o banda ancha y fibra ptica.

9Consideraciones al distribuir la base de datosRazones para construir un sistemas distribuidos de bases de datos que son compartir la informacin, fiabilidad y disponibilidad y agilizar el procesamiento de las consultas. Tiene sus desventajas, como desarrollos de software ms costosos, mayor posibilidad de errores y costos extras de procesamiento.

10Ventajas de la distribucin de datosUtilizacin compartida de los datos y distribucin del controlFiabilidad y disponibilidadAgilizacin del procesamiento de consultasCapacidad de compartir y acceder a la informacin de una forma fiable y eficaz.

11Utilizacin compartida de los datos y distribucin del controlCada localidad pueda controlar hasta cierto punto los datos almacenados localmente. esta responsabilidad tiene el administrador de base de datos de cada localidad. Dependiendo del diseo del sistema distribuido.La posibilidad de contar con autonoma local es en muchos casos una ventaja importante de las bases de datos distribuidas.12Fiabilidad y disponibilidadSi se produce un fallo en una localidad de un sistema distribuido, se sigue trabajando en otras localidades. El fallo de una localidad no implica necesariamente la desactivacin del sistema.El sistema detectar cuando falla una localidad y tomar las medidas necesarias para recuperarse del fallo. Cuando se recupera los mecanismos para reintegrarla al sistema nada de complicaciones.La disponibilidad es fundamental para los sistemas de bases de datos que se utilizan en aplicaciones de tiempo real. Por ejemplo, si una lnea area no puede tener acceso a la informacin, es posible que pierda clientes a favor de la competencia.13Agilizacin del procesamiento de consultasSi una consulta comprende datos de varias localidades, puede ser posible dividir la consulta en varias subconsultas que se ejecuten en paralelo en distintas localidades. Sin embargo, en un sistema distribuido no se comparte la memoria principal, as que no todas las estrategias de interseccin se pueden aplicar en estos sistemas.En los casos en que hay repeticin de los datos, el sistema puede pasar la consulta a las localidades ms ligeras de carga.

14Desventajas de la distribucin de los datosMayor complejidad que se requiere para garantizar una coordinacin adecuada entre localidades.El aumento de la complejidad se refleja en:Coste del desarrollo de software:Mayor posibilidad de errores: Mayor tiempo extra de procesamiento:15Transparencia y AutonomaUna relacin se puede almacenarse de varias formas en un sistema de base de datos distribuida. Es esencial que el sistema reduzca al mnimo la necesidad de que el usuario se d cuenta de cmo est almacenada una relacin. Como veremos. un sistema puede ocultar los detalles de la distribucin de la informacin en la red.

16TRANSPARENCIA DE LA REDLa transparencia de la red se relaciona, en algn modo, a la autonoma local. La transparencia de la red es el grado hasta el cual los usuarios del sistema pueden ignorar los detalles del diseo distribuido.17PUNTOS DE VISTA:Nombre de los datos.Repeticin de los datos.Fragmentacin de los datos.Localizacin de los fragmentos y copias.18Diseo de la distribucin:

19IntroduccinEl diseo de un sistema de base de datos distribuido implica la toma de decisiones sobre la ubicacin de los programas que accedern a la base de datos y sobre los propios datos que constituyen esta ltima, a lo largo de los diferentes puestos que configuren una red de ordenadores. La ubicacin de los programas, a priori, no debera suponer un excesivo problema dado que se puede tener una copia de ellos en cada mquina de la red (de hecho, en este documento se asumir que as es). 20cul es la mejor opcin para colocar los datos:Una gran mquina que albergue a todos ellos, encargada de responder a todas las peticiones del resto de las estaciones sistema de base de datos centralizado podramos pensar en repartir las relaciones, las tablas, por toda la red. En el supuesto que nos decantsemos por esta segunda opcin qu criterios se deberan seguir para llevar a cabo tal distribucin? Realmente este enfoque ofrecer un mayor rendimiento que el caso centralizado? Podra optarse por alguna otra alternativa?

21Clasificacin de la organizacin tradicionalel nivel de comparticin, las caractersticas de acceso a los datos el nivel de conocimiento de esas caractersticas de acceso .

22El nivel de comparticin presenta tres alternativas:

Inexistencia, es decir, cada aplicacin y sus datos se ejecutan en un ordenador con ausencia total de comunicacin con otros programas u otros datos; se comparten slo los datos y no los programas, en tal caso existe una rplica de las aplicaciones en cada mquina y los datos viajan por la red; y, se reparten datos y programas, dado un programa ubicado en un determinado sitio, ste puede solicitar un icio a otro programa localizado en un segundo lugar, el cual podr acceder a los datos situados en un tercer emplazamiento. Como se coment lneas atrs, en este caso se optar por el punto intermedio de comparticin.

23

24Diseo

Existen diversas formas de afrontar el problema del diseo de la distribucin:En el primer caso, caso A, los dos procesos fundamentales, la fragmentacin y la asignacin, se abordan de forma simultnea. Esta metodologa se encuentra en desuso, sustituida por el enfoque en dos fases, caso B: la realizacin primeramente de la particin para luego asignar los fragmentos generados. El resto de los casos se comentan en la seccin referente a los distintos tipos de la fragmentacin.

25Conclusiones y consideraciones:

A lo largo de este documento se ha intentado dar una visin global y genrica de los problemas y caractersticas que contiene el diseo de una base de datos distribuida. Se ha hecho especial hincapi en las tcnicas de fragmentacin horizontal y vertical a travs de mtodos y algoritmos muy frecuentes en la literatura referida al tema. la puesta en prctica de los algoritmos, es decir, su codificacin, no es un proceso complicado si se poseen nociones en el desarrollo de algoritmos.. Tambin debera tenerse presente la existencia de enfoques de fragmentacin distintos y, posiblemente, ms complejos, pero se debe pensar que ms eficientes. Adems, estn apareciendo mtodos de fragmentacin mixta como el que se ha comentado. Pese a los mtodos de bases de datos distribuidas hace ya aos, parece que el salto de lo centralizado a lo distribuido a escala comercial est por venir. Considere los dos componentes bsicos de los sistemas de bases de datos distribuidos (la propia base de datos y la red de ordenadores) y piense en la situacin actual de la informtica. como parece ser que se ha asumido por parte de todo tipo de empresarios los beneficios que acarrea la conexin de los ordenadores. Slo falta que determinadas multinacionales decidan apostar ms fuerte por este enfoque a travs de sus famosos sistemas gestores de bases de datos y que se produzca la consolidacin de la resolucin de los problemas que el enfoque distribuido acarrea. 26