Post on 23-Jun-2015
1
Sistemas Distribuidos
Por: Mariela CurielBasado en los textos :
Sistemas Distribuidos Conceptos y DiseñoG. Coulouris, J. Dollimore, TimKinberg
Sistemas Distribuidos
DefinicionesEjemplosDesafíos en el diseño de sistemas distribuidosModelos ArquitectónicosModelos fundamentales para describir sistemas distribuidos
Definiciones
``Se define un sistema distribuido como aquel en el que los componentes de hardware y software, localizados en computadores unidos mediante una red, comunican y coordinan sus acciones sólo mediante el paso de mensajes´´, (c,d,k, 2001)
Definición
Esta definición tiene las siguientes consecuencias:?Concurrencia? Inexistencia de un reloj global
?Fallos Independientes
2
Definiciones
``Un sistema distribuido se compone de un grupo de computadores autónomos, enlazados mediante una red y equipados con un software de sistemas distribuidos. Este software permite que los computadores coordinen sus actividades y compartan recursos.
Definiciones
Los usuarios de un sistema distribuido bien diseñado deberían percibir un sistema de computación único e integrado, aun cuando las máquinas estén dispersas geográficamente´´ (c,d,k, 1998)
Definiciones
``Un sistema distribuido es un grupo de computadores independientes que son percibidas por los usuarios como un único computador´´, (tanenbaum, 1995)
Ejemplos
InternetIntranetsComputación Móvil
3
Desafíos
Heterogeneidad
ExtensibilidadSeguridad
Escalabilidad
Tolerancia a Fallas
Concurrencia Transparencia
Desafíos: Heterogeneidad
La heterogeneidad se aplica en los siguientes elementos:?Redes?Hardware de computadores
?Sistemas operativos?Lenguajes de programación
? Implementaciones de diferentes desarrolladores
Desafíos: Heterogeneidad
Middleware: es el estrato de software que provee una abstracción de programación, así como un enmascaramiento de la heterogeneidad subyacente de las redes, hardware, sistemas operativos y lenguajes de programación. Ejem: Corba, Java RMI
Desafíos: Heterogeneidad
Heterogeneidad y código móvil?Código Móvil: código que puede enviarse
desde un computador a otro y ejecutarse en este último.
?El concepto de máquina virtual ofrece un modo de crear código ejecutable sobre cualquier hardware
4
Desafíos: Extensibilidad
Es la característica que determina si el sistema puede extenderse de varias maneras. Un sistema puede ser abierto o cerrado con respecto a extensiones de hardware o de software. Para lograr la extensibilidad es imprescindible que las interfaces clave sean publicadas.
Desafíos: Extensibilidad
Los Sistemas Distribuidos Abiertos pueden extenderse a nivel de hardware mediante la inclusión de computadoras a la red y a nivel de software por la introducción de nuevos servicios y la reimplementación de los antiguos.
Otro beneficio de los sistemas abiertos es su independencia de proveedores concretos.
Desafíos: Seguridad
La seguridad tiene tres componentes:Confidencialidad: protección contra
individuos no autorizadosIntegridad: protección contra la alteración o
corrupciónDisponibilidad: protección contra la
interferencia que impide el acceso a los recursos
Desafíos: Seguridad
Existen dos desafíos que no han sido resueltos en su totalidad:?Ataques de denegación de servicio?Seguridad del código móvil
5
Desafíos: Escalabilidad
Se dice que un sistema es escalable si conserva su efectividad cuando ocurre un incremento significativo en el número de recursos y en el número de usuarios.
El diseño de SD escalables presenta los siguientes retos:Control de costo de los recursos físicos : para que un sistema con n usuarios sea escalable, la cantidad de recursos físicos necesarios para soportarlo debería ser O(n).
Desafíos: Escalabilidad
Controlar la degradación del rendimiento: Ejm: Los algoritmos que emplean estructuras jerárquicas se comportan mejor frente al crecimiento de la escala, que los algoritmos que emplean estructuras lineales. Evitar cuellos de botella: los algoritmos deberían ser descentralizados.
Desafíos: Escalabilidad
Prevenir el desbordamiento de los recursos de software
Desafíos: Tratamiento de Fallos
Detección de fallos: Ejem. Se pueden utilizar sumas de comprobación (checksums) para detectar datos corruptos en un mensaje. Enmarascamiento de fallos: Ejem.?Los mensajes pueden retransmitirse?Replicar los datos
6
Desafíos: Tratamiento de Fallos
Tolerancia de fallos: los programas clientes de los servicios pueden diseñarse para tolerar ciertos fallos. Esto implica que los usuarios tendrán también que tolerarlos. Recuperación de fallos: implica el diseño de software en el que, tras una caída del servidor, el estado de los datos puede reponerse o retractarse (rollback) a una situación anterior.Redundancia: emplear componentes redundantes.
Desafíos: ConcurrenciaExiste la posibilidad de acceso concurrente a un mismo recurso.La concurrencia en los servidores se puede lograr a través de threads.Cada objeto que represente un recurso compartido debe responzabilizarse de garantizar que opera correctamente en un entorno concurrente.Para que un objeto sea seguro en un entorno concurrente, sus operaciones deben sincronizarse de forma que sus datos permanezcan consistentes.
Desafíos:Transparencia
Transparencia de acceso: permite acceder a los recursos locales y remotos empleando operaciones idénticas.Transparencia de ubicación: permite acceder a los recursos sin conocer su localización.
Transparencia de concurrencia: permite que varios procesos operen concurrentemente sobre recursos compartidos sin interferencia mutua.
Desafíos:Transparencia
Transparencia de replicación: permite replicar los recursos sin que los usuarios y los programadores necesiten su conocimiento.Transparencia frente a fallos: permite ocultar fallos.
Transparencia de movilidad: permite la reubicación de recursos y clientes en un sistema sin afectar la operación de los usuarios y los programas.
7
Desafíos:Transparencia
Transparencia de rendimiento: permite reconfigurar el sistema para mejorar el desempeño según varíe su carga.Transparencia al escalado: permite al sistema y a las aplicaciones expandirse en tamaño sin cambiar la estructura del sistema o los algoritmos de aplicación.
Modelos arquitectónicos
Modelo Arquitectónico de un SD: trata sobre la colocación de sus partes y las relaciones entre ellas. Ejem: modelo cliente-servidor y el modelo de procesos de ¨igual a igual¨ (peer-to-peer)
Diferentes modelos arquitectónicos:? Capas de Software? Arquitecturas de Sistema? Interfaces y Objetos
Capas de Software
El término arquitectura de software se refería inicialmente a la estructuración del software como capas en un único computador. Más recientemente las capas son uno o varios procesos, localizados en el mismo o diferentes computadores, que ofrecen y solicitan servicios.
Capas de Software
Plataforma: estas capas más bajas proporcionan servicio a las superiores y su implementación es dependiente de cada computador.
Plataforma
Aplicación de servicios
Middleware
Sistema Operativo
Computador y Hw. de red
8
Capas de Software
Middleware:es una capa de software cuyo propósito es enmascarar la heterogeneidad y proporcionar un modelo de programación conveniente para los programadores de aplicaciones
Aplicación de servicios
Middleware
Sistema Operativo
Computador y Hw. de red
Capas de Software: Middleware
El middleware se ocupa de proporcionar bloques útiles para la construcción de componentes de software que puedan trabajar con otros en un sistema distribuido. En particular mejora el nivel de las actividades de comunicación de los P. de aplicación soportando abstracciones como: llamadas a procedimientos remotos, comunicación entre un grupo de procesos, etc.
Capas de Software: Middleware
Ejem: Sun RPC (llamadas a procedimientos remotos), CORBA (middleware orientado a objeto), Java RMI (invocación de objetos remotos en Java), DCOM (Modelo común de objetos distribuidos de Microsoft)
Capas de Software: Middleware
El middleware también puede proporcionar otros servicios, aparte de la comunicación, para su uso en programas de aplicación. Por ejemplo: gestión de nombres, seguridad, almacenamiento persistente, etc.
9
Arquitecturas de Sistema
Modelo Cliente-ServidorServicios proporcionados por múltiples servidoresServidores proxy y cachesProcesos peer-to-peer
Modelo Cliente-Servidor
Servidor
Cliente
Cliente
ServidorInvocación
Resultado Invocación
Resultado
Proceso
Computador
- El servidor puede o no estar en la misma máquina del cliente- Tanto servidores como clientes pueden ser iterativos o concurrentes
Servicios proporcionados por múltiples servidores
servicio
Servidor
Cliente
Cliente
Servidor
Servidor
-Los servidores pueden dividir el conjunto de objetos en los que está basado el servicio y distribuírselos entre ellos mismos.- Pueden mantener réplicas de los objetos en cada máquina.
Servidores Proxy y Caches
ClienteServidor Proxy
Servidor ProxyServidor Web
Cliente
-Un cache es un almacén de objetos de datos utilizados recientemente.-Los caches pueden estar ubicados en los clientes o en un servidor Proxy que se puede compartir desde varios clientes.-El propósito de los servidores proxy es incrementar la disponibilidad y las prestacionesdel servicio, reduciendo la carga en las redes de áreaAmplia y en los servidores WEB.
Servidor ProxyServidor Web
10
Procesos Peer-to-PeerTodos los procesos desempeñan tareas semejantes, interactuando cooperativamente como iguales para realizar una actividad distribuida o cómputo sin distinción entre clientes y servidoresLos procesos pares mantienen la consistencia de los recursos y sincroniza las acciones a nivel de aplicación.
Servidor ProxyAplicación
Código de Coord.
Servidor ProxyAplicación
Código de Coord.
Servidor ProxyAplicación
Código de Coord.
Interfaces y Objetos
Una interfaz de un proceso es la especificación del conjunto de funciones que se pueden invocar sobre él. En lenguajes orientados a objetos, los procesos distribuidos pueden ser construidos de una forma más orientada al objeto. Las referencias a estos objetos se pasan a otros procesos para que se pueda acceder a sus métodos de forma remota. Esta es la aproximación adoptada por CORBA y Java RMI.
Otros Modelos Arquitectónicos
Código Móvil
Agente Móvil: es un programa que se traslada en la red, de un computador a otro, realizando una tarea para alguien. Ejem. Recolecta información.
Computadores en red: se descarga desde un servidor remoto el sop y cualquier software de aplicación necesario.
Otros Modelos Arquitectónicos
Clientes Ligeros: en el cliente sólo se ejecuta una interfaz basada en ventanas, mientras que la aplicación si se ejecuta en un servidor remoto, usualmente muy potente (multiprocesador, clusters, etc.)
11
Requisitos para el diseño de Arquitecturas Distribuidas
Rendimiento? Capacidad de respuesta: para obtener buenos
tiempos de respuesta los sistemas deben estar compuestos por pocas capas de software y la cantidad de datos transferida debe ser pequeña (ejem. Uso de proxys y caches)
? Productividad: trabajos/unidad de tiempo? Balance de cargas: applets, varios servidores o
computadores para alojar un único servicio.
Requisitos para el diseño de Arquitecturas Distribuidas
Calidad de ServicioAlgunas aplicaciones mantienen datos críticos en el tiempo, flujos de datos que precisan ser procesados o transferidos de un proceso a otro a una tasa pre-fijada.QoS es la capacidad de los sistemas para satisfacer dichos límites.
Requisitos para el diseño de Arquitecturas Distribuidas
Calidad de ServicioEl satisfacer tales exigencias depende de la disponibilidad de los recursos en los instantes adecuados.Cada recurso crítico debe reservarse para las aplicaciones que requieren QoS. Los administradores de los recursos deben proporcionar la garantía. Las solicitudes de reserva que no se puedan cumplir se rechazan.
Requisitos para el diseño de Arquitecturas Distribuidas
Aspectos de Fiabilidad (que el sistema funcione correctamente)CorrectitudTolerancia de fallosSeguridad:?Confidencialidad? Integridad?Disponibilidad
12
Requisitos para el diseño de Arquitecturas Distribuidas
Tolerancia a Fallos: las aplicaciones estables deben continuar funcionando correctamente en presencia de fallos de hw, sw y redes. ? Se logra con redundancia
? Para hacer fiable un protocolo de comunicación se emplean otras técnicas. Ejem. Retransmitir el mensaje.
Requisitos para el diseño de Arquitecturas Distribuidas
Seguridad: necesidad de ubicar datos y otros recursos sensibles sólo en aquellos computadores equipados de un modo eficaz contra el ataque.
Modelos Fundamentales
Los modelos fundamentales están implicados en una descripción más formal de las propiedades que son comunes en los modelos arquitectónicos. Ayudan a localizar los problemas clave para los diseñadores de SD. Su propósito es especificar los problemas, dificultades y amenazas que deben superarse para desarrollar sistemas distribuidos fiables.
Modelos Fundamentales
Modelo de Interacción: Trata sobre el rendimiento y sobre la dificultad de poner límites temporales en un sistema distribuidoModelo de Fallos: intenta dar una especificación precisa de los fallos que se pueden producir en procesos y en canales de comunicación.Modelo de seguridad: posibles amenazas para los procesos y canales de comunicación-
13
Modelo de Interacción
Trata sobre el rendimiento y sobre la dificultad de poner límites temporales en un sistema distribuido. El cómputo ocurre en procesos. Los procesos interactúan a través del paso de mensajes.
En la comunicación hay retrasos. El modelo estudia como afectan estos retrasos la coordinación de los procesos.
Modelo de Interacción
Rendimiento de los canales de comunicaciones:? Latencia:retardo entre el envío de un mensaje por
un proceso y su recepción por otro.? Ancho de banda: cantidad total de información
que se puede transmitir en un momento dado.? Jitter o fluctuación: variación en el tiempo invertido
en completar el reparto de una serie de mensajes.
Dos variantes del Modelo de Interacción
Sistemas distribuidos síncronos?El tiempo de ejecución de cada etapa de
un proceso tiene límites superior e inferior conocidos.
?Cada mensaje se recibe en un tiempo limitado conocido.
?Cada proceso tiene un reloj local cuya tasa de deriva sobre el tiempo real tiene un límite conocido.
Dos variantes del Modelo de Interacción
Sistemas distribuidos síncronos? Es posible sugerir valores para esos límites pero
es difícil obtener valores realistas y dar garantías sobre los valores elegidos.
? Se pueden tener timeouts. Cuando expiran significa que ha fallado el proceso.
? Hay que garantizar ciclos suficientes de procesador, capacidad de red y proveer relojes con tasa de deriva limitadas.
14
Dos variantes del Modelo de Interacción
Sistemas distribuidos asíncronos . Son aquellos donde no existen limitaciones sobre:? La velocidad de procesamiento? Los retardos de transmisión de mensajes? Las tasas de deriva del reloj.
Los sistemas reales son frecuentemente asíncronos. Pero existen problemas que no pueden resolverse con este modelo.
Ordenamiento de Eventos
Aún cuando no hay relojes precisos la ejecución de un sistema se puede describir en términos de los eventos y su ordenación.
Ejemplo:1. X envía un mensaje de reunión2. Y y Z responden
x envíay lee y respondez lee x, y y envía otra respuesta.
Ordenamiento de Eventos
x
y
z
At1 t2 t3
m1
m1
m2
m2m3
envía
envía
envíaTiempo Físico
- Si los relojes pudieran sincronizarse pudiera utilizarse el tiempo Asociado localmente a c/mensaje enviado. Los mensajes en A se Mostrarían según el ordenamiento temporal.
Ordenamiento de Eventos
Tiempo lógico de Lamport?Los mensajes se reciben después de su
envíox envía m1 antes que y reciba m1
Y envía m2 antes que x reciba m2?Las respuestas se envían después que se
reciben los mensajes
Y recibe m1 antes de enviar m2
15
Ordenamiento de Eventosx
y
z
At1 t2 t3
m1
m1
m2
m2m3
1
23
4envía
envía
envíaTiempo Físico
1
3 4
5
2
1
m1
m2
Modelo de Fallos
Intenta dar una explicación precisa de los fallos que se pueden producir en los procesos y en los canales de comunicación para darnos una comprensión de sus efectos. Fallos por omisión?De procesos?De comunicaciones
Modelo de Fallos
Fallos de procesosRuptura accidentada del procesamiento.Es deseable si el resto de los procesos que
interactúan con el proceso interrumpido, o bien funcionan correctamente o se detienen.
El método de detección de ruptura descansa en timeouts.
Modelo de Fallos
Fallos de procesosFail-Stop: es cuando el resto de los procesos
puede detectar con certeza que cierto proceso interrumpio su ejecución. Se puede detectar en un sistema síncrono por los timeouts.
16
Modelo de FallosFallos por omisión de comunicaciones.?Fallos por omisión de envíos?Pérdida de mensajes entre los buffers
?Fallos por omisión de recepción.
Envía m Recibe
Proceso p Proceso q
Canal de comunicación
Buffer de Mensajes salientes
Buffer de Mensajes entrantes
Fallos por omisión de envío
Fallos por omisión de recepción
Fallos por omisión del canal
Modelo de Fallos
Fallos arbitrarios: cualquier tipo de error.?Procesos: se omiten pasos del procesamiento
o se realizan pasos adicionales, no intencionados.
?Canales: se corrompe el contenido de un mensaje o se repiten mensajes. Estos fallos se pueden reconocer y ocultar o enmascarar.
Transmitir mensajes arbitrariamente, comenter omisiones, un proceso puede realizar un paso incorrecto o detenerse.
Proceso o CanalArbitrario (bizantino)
El mensaje llega a la cola de mensajes entrantes pero el proceso no lo recibe.
ProcesoOmisión de recepción
El procesos envía pero el mensaje no se coloca en el buffer de mensajes salientes
ProcesoOmisión de Envío
Un mensaje en el buffer saliente nunca llega al buffer de mensajes entrantes
CanalOmisión
El proceso para y deja de funcionar. Otros procesos pueden no ser capaces de detectar su estado.
ProcesoRuptura
El proceso para y deja de funcionar. Otros procesos pueden detectarlo.
ProcesoFail-stop (fallo-parada)
DescripciónAfecta aClase de Fallo
Modelo de Fallos
Fallos de temporización?Existen en los SD síncronos donde se
establecen límites. Fallos de reloj y fallos de prestaciones.
?En un SDA un proceso pude terminar mas tarde pero no hay un fallo porque no se ha dado ningún tipo de garantía.
?Los SOP a tiempo real se diseñan con vistas a proporcionar garantías de temporización.
17
Modelo de Fallos
La transmisión del mensaje toma más tiempo del límite permitido.
CanalPrestaciones
El proceso excede el límite de ejecución
ProcesoPrestaciones
El reloj local del proceso excede el límite de su tasa de deriva sobre el tiempo real.
ProcesoReloj
DescripciónAfecta aClase de Fallo
Modelo de Fallos
Enmascaramiento de fallos? Ocultar el fallo ? Convertirlo en un tipo razonable
Fiabilidad y comunicación uno a uno. El término comunicación fiable se define en términos de validez e integridad.? Validez: cualquier mensaje en el buffer de salida llega
eventualmente al buffer de mensajes entrantes.? Integridad: el mensaje recibido es idéndico al enviado y
no se reparten mensajes por duplicado
Modelo de Fallos
Amenazas de Integridad? Protocolos que retransmiten pero no usan
números de secuencia para evitar que el mismo mensaje llegue duplicado.
?Usuarios mal intencionados que insertan mensajes inválidos, repiten mensajes antiguos o modifican mensajes autenticos.
Modelo de Seguridad
La seguridad de un SD puede lograrse asegurando los procesos y los canales empleados para sus interacciones y protegiendo los objetos que se encapsulan contra el acceso no autorizado.
18
Modelo de Seguridad
Protección de Objetos?Los objetos pueden contener datos
privados y públicos o compartidos.?Se otorgan derechos de acceso que
especifican a quien se permite realizar ciertas operaciones sobre un objeto. Los usuarios son los principales beneficiarios de estos derechos de acceso.
Modelo de Seguridad
Protección de Objetos? A cada invocación y a cada resultado se le asocia
la autoridad con que se ordena. Tal autoridad se denomina principal .
? El servidor es responsable de verificar la identidad del principal tras la invocación y comprobar que dispone de los diferentes derechos para realizar operaciones sobre el objeto.
? El cliente puede comprobar la identidad del principal tras el servidor para asegurar que el resultado proviene del servidor requerido.
Modelo de Seguridad
Cliente Servidor
Invocación
Resultado
red
Derechosde acceso Objeto
Principal (usuario) Principal (servidor)
Modelo de Seguridad
Asegurar procesos y sus interacciones? Cierto tipo de aplicaciones son más propensas a
los ataques.? Para este tipo de aplicaciones probablemente
habrá ataques a los procesos de los que se componen tales aplicaciones y a los mensajes que viajan entre los procesos.
? Cómo podemos analizar estas amenazas para derrotarlas?
19
Modelo de Seguridad
Modelo de amenazas de seguridadEl enemigo: es capaz de enviar cualquier
mensaje a cualquier proceso y también de leer o copiar cualquier mensaje entre un par de procesos. El ataque puede venir de un computador legitimamente conectado o de una máquina no autorizada.
Proceso P Proceso Qmm´
Copia de m El enemigo
Modelo de Seguridad
Amenazas a procesos: cualquier proceso puede recibir mensajes de otro proceso y bien pudiera no ser capaz de identificar la identidad del emisor. Los protocolos incluyen la dirección IP del emisor, pero no es un problema generar un mensaje con una dirección falsa. No conocer cuál es el origen del mensaje es una amenaza al correcto funcionamiento de clientes y servidores.
Modelo de Seguridad
Amenazas a canales: un enemigo puede copiar, alterar o insertar mensajes según viajen a través de la red. Otra forma es recopilar mensajes para volver a enviarlo más tarde, haciendo posible volver a enviar el mensaje más de una vez.
Modelo de Seguridad
Cómo se pueden vencer las amenazas de seguridad?Criptografía y secretos compartidos
AutenticaciónCanales seguros
20
Modelo de Seguridad
Criptografía es la ciencia de mantener los mensajes seguros y la encriptaciónes el proceso de transformar el mensaje de forma que quede oculto el contenido. Se emplean claves secretas que conoce el emisor y receptor.
Modelo de Seguridad
Autenticación: probar la identidad probada por los emisores. La técnica básica consiste en incluir dentro del mensaje un fragmento encriptado que contenga suficiente información para garantizar la autenticidad del mensaje.
Modelo de Seguridad
Canales Seguros: para construirlos se emplean técnicas de encriptamiento y autenticación. Un canal seguro es un canal de comunicación que conecta un par de procesos, cada uno de los cuales actúa en representación de un principal.
Modelo de SeguridadUn canal seguro presenta las siguiente
propiedades:Cada proceso conoce bien la identidad del principal en cuya representación se ejecuta el otro proceso. Asegura privacidad e integridad (protección contra la manipulación)Cada mensaje incluye un sello de carácter temporal, de tipo fisico o lógico, para prevenir el re-envío o la reordenación de los mensajes.Ejemplo: SSL (Secure Sockets Layer)
21
Modelo de Seguridad
Otras posibilidades de amenaza del enemigo son:Denegación de servicioCódigo móvil: puede incluir código que accede o modifica los recursos que están legitimamente disponibles para los procesos del host pero no para el creador del código.