Cluster de Alta Disponibilidade Com Ferramentas Open Source

14
Cluster  de Alta Disponibilidade com Ferramentas Open Source  High Availability C luster With Open Source Tools Fernando Luis Diesel¹, Ms. Fernanda Pamplona Ramão 2 1.2 Curso de Especialização em Redes de Computadores de Alta Velocidade - Faculdade Alfa Brasil - FAAB – Cascavel - Brasil [email protected]  Resumo: A necessidade de se ter serviços de rede em alta disponibilidade vem crescendo a medida que as empresas dependem primordialmente dos mesmos para seu pleno funcionamento. A exigência de investimento em equipamentos de rede para que haja segurança em disponibilidade de serviços na área computacional é grande, e é por isso que empresas buscam soluções viáveis através de softwares gratuitos para o gerenciamento de Clusters de Alta Disponibilidade. Este artigo tem como principal intuito, dar uma ampla visão ao leitor e administrador de redes sobre o que venha ser e como funciona a computação em cluster, soluções em ferramentas e hardwares utilizados, também as vantagens e a necessidade de se ter este tipo de infra-estrutura, tem como foco principal em cluster de Alta Disponibilidade com ferramentas Open Source . Palavras-chave: artigo; cluster; disponibilidade; ferramentas. Abstract:  The need to have network servic es for high availability is growing as companies rely primarily on the same for their full operation. The requirement for investment in network equ ipment to provide safety in the availability of services in computing is great, and why companies seek viable solutions thr oug h fre e sof twa re for man agi ng High Availabilit y Clusters. This art icle has as its main  purpose, to give the reader a broad overview and network administrators about what will be and how the cluster computing solutions, tools and hardware use d, also the advantages and the need to have this type of infrastructure structure, focused primar ily on cluster High Availability with Open Source tools.  Key-words:  Article; cluster; ava ilability; tools. 1. Introdu ção Atualmente com o avanço dos sistemas informatizados e o seu papel importante perante o mercado, fez com que a necessidade de manter determinados serviços ativos e com o menor tempo inoperante possível, se tornasse um dos principais requisitos para o mercado. Isso vem a prevalecer às sol ões Open Sour ce voltadas ao serviço de alta disponibilidade, seguindo no princípio e focando em clusters de Alta Disponib ilidade. Assim, o objetivo é apresent ar não só o conceito de clusters como também soluções de ferramentas Open Source, também como, algumas opções de hardware e redundância entre os mesmos, e por fim problemas e soluções que poderão ocorrer e intervir neste tipo de ambiente.

Transcript of Cluster de Alta Disponibilidade Com Ferramentas Open Source

  • Cluster de Alta Disponibilidade com Ferramentas Open Source

    High Availability Cluster With Open Source Tools

    Fernando Luis Diesel, Ms. Fernanda Pamplona Ramo2

    1.2Curso de Especializao em Redes de Computadores de Alta Velocidade - Faculdade Alfa Brasil - FAAB Cascavel - Brasil

    [email protected]

    Resumo:A necessidade de se ter servios de rede em alta disponibilidade vem crescendo a medida que as empresas dependem primordialmente dos mesmos para seu pleno funcionamento. A exigncia de investimento em equipamentos de rede para que haja segurana em disponibilidade de servios na rea computacional grande, e por isso que empresas buscam solues viveis atravs de softwares gratuitos para o gerenciamento de Clusters de Alta Disponibilidade. Este artigo tem como principal intuito, dar uma ampla viso ao leitor e administrador de redes sobre o que venha ser e como funciona a computao em cluster, solues em ferramentas e hardwares utilizados, tambm as vantagens e a necessidade de se ter este tipo de infra-estrutura, tem como foco principal em cluster de Alta Disponibilidade com ferramentas Open Source.Palavras-chave: artigo; cluster; disponibilidade; ferramentas.

    Abstract: The need to have network services for high availability is growing as companies rely primarily on the same for their full operation. The requirement for investment in network equipment to provide safety in the availability of services in computing is great, and why companies seek viable solutions through free software for managing High Availability Clusters. This article has as its main purpose, to give the reader a broad overview and network administrators about what will be and how the cluster computing solutions, tools and hardware used, also the advantages and the need to have this type of infrastructure structure, focused primarily on cluster High Availability with Open Source tools.Key-words: Article; cluster; availability; tools.

    1. Introduo

    Atualmente com o avano dos sistemas informatizados e o seu papel importante perante o

    mercado, fez com que a necessidade de manter determinados servios ativos e com o menor tempo

    inoperante possvel, se tornasse um dos principais requisitos para o mercado. Isso vem a prevalecer

    s solues Open Source voltadas ao servio de alta disponibilidade, seguindo no princpio e

    focando em clusters de Alta Disponibilidade. Assim, o objetivo apresentar no s o conceito de

    clusters como tambm solues de ferramentas Open Source, tambm como, algumas opes de

    hardware e redundncia entre os mesmos, e por fim problemas e solues que podero ocorrer e

    intervir neste tipo de ambiente.

  • 2. Clusters

    Um cluster pode ser definido como um conjunto de dois ou mais computadores, denominados

    nodos ou ns, que resulta em um nico sistema que responda por um ou mais servios.

    denominado Sistemas de Imagem nica (Single System Image Operating System - SSI OS),

    independente da infra-estrutura por detrs de um ambiente de alta disponibilidade, um nico sistema

    ir responder a solicitao pelo servio requerido (PITANGA, 2003).

    Clusters so usados em ambientes crticos onde h a necessidade de servios estarem sempre

    disponveis e/ou processados em menor tempo possvel. Provedores de internet, sites de comrcio

    eletrnico, redes sociais requerem alta disponibilidade e balanceamento de carga escalvel em seus

    servios.

    3. A necessidade da utilizao de um Cluster

    De acordo com Pitanga (2003), os clusters ou combinaes de clusters so utilizados a fim de

    processar contedos crticos ou disponibilizao de servios durante a maior parte do tempo. Os

    clusters de Alta Disponibilidade e Balanceamento de Carga normalmente so utilizados por lojas

    virtuais, Data Centers onde possuem recursos para detectar, recuperar e ocultar eventuais falhas,

    pois a porcentagem de disponibilidade destes servios precisa ser o mais alto possvel, por isso

    usado em ambientes crticos onde a paralisao de determinados servios, podem afetar gravemente

    o funcionamento do ambiente como um todo. Clusters de Processamento Paralelo so utilizados em

    ambientes onde h necessidade de se obter alto desempenho, como por exemplo, a renderizao de

    grficos de altssima qualidade e animaes. J em ambientes com clusters Beowulf ou aglomerado

    Beowulf so utilizados no processamento de dados com finalidade na pesquisa cientfica.

    As necessidades de implementao de clusters surgem em empresas que desejam incrementar

    sua escalabilidade, gerenciamento de recursos, disponibilidade ou processamento a nvel

    supercomputacional com um investimento vivel.

    4. Tipos de Cluster

    Segundo Pitanga (2003), basicamente, existem quatro tipos de clusters mais conhecidos e

    utilizados:

  • 4.1 Balanceamento de carga (HS Load Balancing): este tipo de cluster tem como funo

    receber o trfego de entrada e direcionar aos nodos para que executem os mesmos programas e ao

    mesmo tempo entre as mquinas que compem o cluster. Este tipo de ambiente se faz necessrio

    onde h uma demanda de processamento em larga escala e em determinados ambientes onde uma

    mquina s no conseguiria manter o servio no ar, como por exemplo, as lojas virtuais.

    4.2 Alta disponibilidade (HA High Availability): este tipo de cluster tem como funo

    permanecer o sistema ativo por um longo perodo de tempo e em plena condio de uso; sendo

    assim, pode se afirmar que eles nunca param seu funcionamento, alm disso, conseguem detectar

    erros se protegendo de possveis falhas;

    4.3 Combinao HA & HS: combina as caractersticas de dois tipos de cluster, aumentando assim

    a disponibilidade e escalabilidade de servios e recursos. Este tipo de configurao de cluster

    geralmente utilizado em servidores de web, mail ou ftp.

    4.4 Alto desempenho (HPC): este tipo de cluster associado ao projeto Beowulf e usado onde h

    a necessidade de executar tarefas ou servios que exigem alto poder de processamento, seja ele

    paralelo ou distribudo, fazendo com que as mesmas sejam processadas em menor tempo possvel.

    Essas tarefas podem ser divididas em pequenas tarefas que so distribudas entre os ns do cluster.

    Este tipo de ambiente computacional comumente utilizado em reas ligadas onde so feito

    clculos cientficos, anlises financeiras, entre outros.

    5. Cluster de Alta Disponibilidade

    A busca por solues plausveis e a tolerncia a falhas em sistemas computacionais faz com

    que haja um avano na rea de alta disponibilidade, resultando em necessidade de se ter ambientes

    de clusters com o propsito de ter redundncia caso haja quedas ou falhas em sistemas crticos.

    Quando se fala em alta disponibilidade, aglomera-se uma srie de fatores que atuam em conjunto

    para que haja disponibilidade propriamente dita.

    A disponibilidade de um sistema operacional pode ser calculada a partir de alguns fatores:

    MTBF(Mean Time Between Failures): Tempo mdio entre as falhas.

    MTTR(Mean Time To Repair): Tempo mdio para a reparao.

    Essa disponibilidade pode ser calculada pela seguinte frmula:

  • Disponibilidade = MTBF/(MTBF+MTTR)

    O resultado aceitvel em um ambiente crtico dever ser de aproximadamente acima de 99%,

    logicamente que quanto mais um ambiente se aproximar de um resultado de 100% mais tolerante a

    falhas ele vai ser e o custo de sua implantao ser mais alto (PITANGA, 2003).

    6. A composio de um Cluster de Alta Disponibilidade

    A composio de um ambiente Cluster HA vria muito da necessidade de cada empresa,

    geralmente quando projetado este tipo de ambiente deve-se conter um projeto detalhado no s das

    necessidades e problemas como tambm solues de implantao com base no custo e benefcio

    que a empresa dispe-se de investir.

    Um cluster de Alta Disponibilidade visa manter a disponibilidade dos servios prestados por

    um sistema computacional replicando servios e servidores, atravs da redundncia de hardware e

    reconfigurao de software. Vrios computadores juntos agindo como um s, cada monitoramento

    os outros e assumindo seus servios caso alguns deles venham a falhar (IKE, 2008). Um Cluster de

    Alta Disponibilidade alm dos ns ou nodos tambm formado pela disponibilidade de hardware,

    software para gerenciamento, monitoramento, e a estrutura de rede instalada no ambiente.

    6.1. Hardware

    A importncia de se ter alta disponibilidade de hardware dentro de um ambiente Cluster HA

    de suma importncia, uma vez que o hardware vital para o ambiente, logo se ele falhar como um

    todo, tudo estar comprometido no mesmo momento da falha.

    A redundncia do hardware instalado no ambiente Cluster HA depende muito da prioridade

    dada na necessidade em que montado o ambiente, isso implica na quantidade e estrutura dos

    equipamentos na rede, a seguir ser mostrado em quais equipamentos pode-se obter proveito,

    disponibilidade e segurana no ambiente com base em detalhes tcnicos.

    N ou Nodo: Toda mquina existente por trs de um ambiente Cluster denominado n ou

    nodo, logo se ela se integra ao ambiente tambm denominada Membership (The Cluster

    Membership Object). A quantidade de ns existentes em um Cluster pode variar dependendo

    da necessidade e do propsito que ele vai ser instalado.

  • Hard Disk Disco Rgido: Os discos rgidos ou comumente chamados de HDs, tem como

    funo o armazenamento de dados, em um ambiente Cluster HA eles podem ser utilizados

    para implantao de RAID, LVM ou Storage iSCSI.

    Fonte Redundante: A fonte tem funo de gerar energia e prover o funcionamento a todos

    os componentes de um computador, se tornando vital no funcionamento do mesmo. Por isso

    h a necessidade de fontes redundantes, pois quando houver a necessidade de uma potncia

    maior no ambiente, a mesma no deixar o ambiente cair por falta de potncia de energia.

    Storage: um hardware que contm slots para vrios discos rgidos, ele pode ser ligado aos

    ns do cluster atravs de iSCSI ou fibra ptica. Storages pode aceitar diversas conexes de

    servidores diferentes, ao mesmo tempo, logo poder ser utilizado para criar RAID, LVM, se

    tornando seguro e altamente portvel.

    Controladora RAID: um dispositivo dedicado para fazer RAID, pois ao invs de se fazer

    via software e hardware de uma mquina comum, as controladoras tm a funo dedicada a

    isto, com isso se ganha mais confiabilidade, segurana e desempenho.

    Switch Fibre Channel: Dispositivo de comunicao de alta velocidade, comumente

    utilizado para interligar servidores a sistemas de armazenamento do tipo SAN (Storage Area

    Network), pode ser utilizado tanto por cabeamento de fibra ptica como por cabeamento

    metlico.

    Adaptador de Rede: So os adaptadores de rede que fazem a diferena na comunicao

    entre os ns do cluster, pois so teis para bonding de interfaces, no ambiente cluster h

    exigncia se tratando do tipo de interface a se utilizar, pois as mesmas devem ser de boa

    qualidade sendo gigabit ou fibre channel para se obter melhor desempenho e segurana na

    comunicao dedicada entre os nodos do cluster.

    6.2. Softwares e Ferramentas Open Source

    As falhas ocorridas por software em um ambiente cluster normalmente so contornadas atravs

    da redundncia entre os nodos, j se tratando de falha de hardware dependendo da estrutura do

    ambiente, ainda haver redundncia para que o sistema no fique inoperante. O custo com a

    redundncia de equipamentos de um ambiente cluster torna-se alto, por isso a busca por solues

    Open Source torna-se um fator relevante devido o alto custo direcionado aos equipamentos.

    6.2.1. Distributed Replicated Block Device (DRBD)

  • DRBD (Distributed Replicated Block Device) consiste em um mdulo do kernel Linux, que

    somado com alguns scripts, oferece um dispositivo de bloco projetado para disponibilizar

    dispositivos de armazenamento distribudos, comumente utilizado em ambientes de cluster de alta

    disponibilidade. Geralmente sua implementao espelhada em conjuntos de blocos via rede

    dedicada, inclusive este espelhamento de rede de dados totalmente transparente, com isso consiste

    em fazer Raid1 em rede em tempo real. Trabalha no nvel mais baixo do filesystem, pois seu

    mdulo est devidamente localizado entre o sistema de arquivos e o I/O Sheduler.

    O DRBD no tem capacidade de detectar nenhum corrompimento no filesystem, porm isto

    no diminui sua importncia no ambiente, toda e qualquer leitura e escrita ser feita apenas no nodo

    primrio e replicado via rede para o nodo secundrio, sendo que o dispositivo replicado no

    montado no nodo secundrio para no haver conflitos na rede do ambiente, pois os nodos tero que

    ter um filesystem suportado para escrita concorrente, juntamente com respectivo storage, ambiente

    este que ser citada posteriormente. Outro fator que deve ser observado que quando o DRBD faz a

    replicao de dados pela rede, conseqentemente h uma perda de desempenho tanto pela rede

    como nos nodos. Devido ao problema de desempenho o DRBD possui mais de um protocolo de

    comunicao para ser escolhido conforme a necessidade de cada ambiente, dentre eles so:

    - Protocolo A (assncrono): Protocolo assncrono o mais rpido, porm tem uma maior

    probabilidade de perda dados, este protocolo tem seu processo de escrita contnua independente da

    confirmao de escrita do nodo primrio para o nodo secundrio. Por isso quando o nodo primrio

    falhar, a replicao ser feita para o nodo secundrio e as requisies no confirmadas estaro

    inconsistentes.

    - Protocolo B (semi-assncrono): Completa as operaes de gravao local no nodo primrio e

    so consideradas concludas assim que ocorreu a gravao do disco local e o quadro de replicao

    alcanar os nodos pares.

    - Protocolo C (sncrono): Protocolo mais seguro, pois s completa a requisio quando a

    operao local for concluda e for recebida a mensagem de WriteACK do nodo secundrio.

  • Figura 1 - Viso de nvel conceitual do funcionamento do DRBD.Fonte: Adaptado de REIS et al.

    6.2.2. Heartbeat

    Heartbeat o software responsvel por monitorar os nodos do cluster e tomar atitudes de

    acordo com os casos encontrados, pode-se dizer que o heartbeat o corao do ambiente HA (alta

    disponibilidade).

    O heartbeat um daemon que fornece infra-estrutura de cluster, provendo a comunicao e

    participao de servios aos seus nodos. Isso permite que os nodos comuniquem entre si para que os

    mesmos saibam qual deles esto inoperantes, assim havendo a replicao e levantamento de

    servios no outro nodo. A partir do momento em que o nodo master parar de responder, o heartbeat

    ir automaticamente levantar os servios e o ip virtual juntamente com o DRBD fazendo a

    replicao dos dados existentes no nodo master, lembrando que ele monitora somente o nodo em si,

    se acaso um servio cair, o mesmo no ser levantado no nodo slave, por causa do heartbeat, ele

    no monitora o servio e sim o nodo.

  • Figura 2 - Viso de nvel conceitual do funcionamento do Heartbeat.Fonte: Elaborao do autor.

    6.2.3. Mon

    Mon um utilitrio, para gerenciamento e monitoramento de processos, programas, arquivo,

    diretrio e sistema de arquivos em um sistema UNIX. O Mon realiza manuteno e reparao

    automtica e pode executar aes casuais em situaes de erro.

    No ambiente cluster, ao contrrio do heartbeat, o mon ir monitorar os servios ao invs do

    nodo em si, para que quando um servio cair no nodo master, o mesmo seja levantado no nodo

    slave. Com isso o mon vem como soluo perante a deficincia do heartbeat de monitorar s o nodo

    em si e no os servios e aplicaes que por ventura venham a falhar no ambiente.

    6.2.4. Ethtool - Channel-Bonding de Interfaces

    Ethtool um utilitrio cuja funo a configurao de placas de rede ou comente chamada de

    interfaces, o mesmo permite consultar e alterar configuraes como velocidade, porta, auto-

    negociao, PCI locais e descarregamento de checksum em muitos dispositivos de rede, inclusive

    tambm possui suporte a funo de channel-bonding.

    Channel-Bonding ou comumente citado como trunking ou at mesmo chamado de link

    agregation uma tcnica que permite o agrupamento de interfaces de rede como se fosse uma s,

    para garantir redundncia do servio nelas instalado. Qualquer nodo que se utilize deste servio,

    necessitar de ao menos de duas interfaces de rede, que o mesmo poder perder uma interface e o

    servio nela instalado ainda estar operante, sem a queda do mesmo. Alm de redundncia,

    dependendo do modo operante do bonding, pode-se tambm obter velocidade de conexo, e

  • tambm a soma da velocidade de cada uma das interfaces envolvidas. Esta redundncia de

    interfaces garante que a comunicao entre os nodos torne-se segura, pois uma vez que ocorra o

    rompimento desta comunicao, o ambiente pode sofrer com Split-Brain (crebro dividido), ou seja,

    os dois nodos acham que so master e levantam os mesmos servios causando problemas de

    consistncia de dados.

    Dependendo do ambiente e da estrutura instalada existe vrios modos que bonding pode operar,

    abaixo citado os principais modos:

    - Modo 0 (balance-rr): modo mais utilizado, transmite os pacotes em ordem seqencial do

    primeiro slave ao ltimo. o modo padro, tambm o nico modo que permite com que o trfego

    seja distribudo entre as interfaces slave simultaneamente.

    - Modo 1 (active-backup): neste modo apenas um slave estar ativo, as demais placas de rede

    apenas sero ativadas no caso de falha do slave ativo. Este modo propicio para tolerncia a falhas

    e alta disponibilidade.

    - Modo 2 (balance-xor): os dados transmitidos neste modo passam por uma poltica adotada

    baseada em hashs, as funcionalidades deste modo so as mesmas do modo 0. Neste modo tambm

    possvel configurar polticas alternativas modificando xmit_hash_policy ao carregar o mdulo.

    - Modo 3 (broadcast): transmite todos os pacotes em todos os slaves. Prov tolerncia a falhas

    e alta disponibilidade.

    - Modo 4 (padro 802.3ad): permite agregao dinmica de links. necessrio um switch que

    suporte 802.3ad e que o ethtool consiga configurar os parmetros speed e duplex em todos os

    slaves.

    6.2.5. Oracle Cluster File System - OCFS2

    OCFS2 um CFS (Cluster File System), sistema de arquivos de cluster de disco compartilhado,

    capaz de fornecer alto desempenho e alta disponibilidade. OCFS2 tem o propsito de suprir a

    deficincia dos tipos de sistemas ext4, ext3, entre outros, pois os mesmos no possuem suporte a

    DLM (Distributed Lock Manager), fazendo com que no tenham sucesso em ambientes com escrita

    de arquivos de dois ou mais nodos em discos compartilhados. Atualmente mantido e suportado

    pela Oracle, e usado em empresas de mdio porte at em grandes estruturas de cluster, onde a

    necessidade de se ter este tipo de CFS muito grande. Dentre as solues Open Source, a mais

    cabvel h um ambiente cluster seria formatar parties e discos compartilhados com OCFS2,

    justamente por ser livre, e est ao nvel de muitos filesystems de solues pagas.

    6.2.6. Openfiler - iSCSI

  • Openfiler um poderoso software para armazenamento Open Source, considerado por muitos a

    melhor e mais completa ferramenta livre para esta categoria, alm de leve e ter um bom

    desempenho tambm pode ser gerenciado via broswer facilitando e muito o seu acesso. suportado

    a diversos hardwares podendo se tornar um poderoso servidor NAS (Network Attached Storage).

    Openfiler construdo sobre o Linux Metadistribuio rPath e distribudo como um dispositivo

    stand-alone, os protocolos de rede baseados em arquivos suportados pelo Openfiler incluem: NFS,

    SMB, CIFS, HTTP, FTP e WebDAV. Diretrios de rede suportados pelo Openfiler incluem NIS,

    LDAP (com suporte para SMB, CIFS senhas criptografadas), Active Directory nos modos nativos e

    mistos, protocolos de autenticao Kerberos, e gerenciamento de servidores iSCSI, alm de ter

    suporte a RAID e LVM.

    ISCSI (Internet Small Computer System Interface) um protocolo da pilha TCP/IP, utilizado

    para criar uma ligao entre rede e armazenamento de dados. Para isso, este carrega comandos

    SCSI sobre redes TCP/IP para armazenamentos em redes locais e remotas. Este servio atua

    rodando em portas 860 e 3260, alm de suportar clientes, chamados de initiators enviem

    comando SCSI para os dispositivos de armazenamento SCSI denominados targets. um

    protocolo SAN (Storage Area Network), permitindo que empresas consolidem sua rea de

    armazenamento dentro de Data Centers enquanto prov hospedagem de servidores como banco de

    dados, web, com a iluso que possuem discos localmente anexados.

    Figura 3 - Viso de nvel conceitual do funcionamento Servidor iSCSI com o OpenfilerFonte: Elaborao do autor.

    .6.2.7. Nagios

  • Em um ambiente cluster essencial que se tenha monitoramento tantos dos servios como seus

    membros, para tal tarefa designada a ferramenta nagios, por ser robusta e totalmente intuitiva, a

    mesma distribuda sob a licena GPL (General Public License) com isso sendo de cdigo aberto.

    O nagios atualmente mantido por Ethan Galstad junto com uma equipe de desenvolvedores que

    ativamente mantm plugins oficiais e nooficiais.

    Dentre as caractersticas do nagios pode-se citar:

    Monitoramento de servios de rede (DHCP, SMTP, POP3 ,HTTP ,FTP ,SSH, IMAP, etc);

    Monitoramento de recursos (CPU, disco, memria, etc);

    Monitoramento do estado dos dispositivos;

    Define hierarquia da rede;

    Possui sistema inteligente de notificaes (sons, pop-up, e-mail, sms, etc);

    Possui checagem paralela de servios;

    Possui interface WEB capaz de informar sobre status de rede, hosts, servios, logs e

    notificaes.

    6.2.8. Ganglia

    Em um ambiente cluster h a necessidade de monitorar os nodos deste ambiente, tanto o

    desempenho como eventuais falhas e at prover antecipao de erros e falhas que podem ocasionar

    interoperabilidade do ambiente. Alm da ferramenta nagios citado anteriormente para o

    monitoramento de servios, o ganglia pode atuar como um complemento a esta, fazendo o que a

    mesma no faz, que monitorar o desempenho dos nodos.

    Ganglia uma ferramenta de monitoramento de desempenho, destinando a computao de alto

    desempenho com foco em clusters. Permite a visualizao remota de estatsticas em tempo real,

    histrico de utilizao de carga de rede, utilizao de CPU, entre outros, para todas as mquinas que

    esto sendo monitoradas. O ganglia possui alguns daemons dentre eles existe o gmond, que usado

    para monitorar as mudanas no estado de host, anunciar mudanas relevantes, alm de ouvir o

    estado dos outros nodos com o ganglia instalado atravs de um canal unicast ou multicast.

  • 7. Problemas

    A segurana em um ambiente cluster no se limita somente em um sistema implantado

    propriamente dito, mas sim como um todo, somando a estrutura com comunicaes dedicadas entre

    os nodos, redundncia de energia, redundncia de link WAN, entre outros que garantem uma maior

    segurana e estabilidade do ambiente, abaixo uma tabela com alguns desses requisitos:

    Tabela 1 - Problemas ocasionados em um cluster.Fonte: Elaborao do autor.

    Problema Conseqncia SoluoPerda de dados Inconsistncia no ambiente Raid, Backup local e remotoPerda de energia Ambiente Inoperante Links redundantes de energiaPerda de comunicao WAN Comunicao afetada Link WAN redundantesInterrupo na comunicao entre os nodos

    Resulta perda parcial ou completa dos servios gerando

    inconsistncia

    Comunicao dedicada entre os nodos com cabeamento fibre-channel ou interface e cabeamento gigabit.

    Superaquecimento Queima dos equipamentos Boa Refrigerao, e evitar aglomerao de equipamentos

    Eventuais Furtos de informaes Pode-se manchar a imagem da empresa

    Implantao de firewall, segurana, hardening de servios, etc.

    Hora no igual para os nodos Gravao de dados inconsistentes Implantao de servidor ntp.

    Quando se trata de redundncia de link WAN, deve-se observar se a ltima milha provedora do

    servio a mesma que prov para os links do cluster, porque se for, e a mesma chegar a ser

    derrubada, conseqentemente ambos os links iro cair e o ambiente ter seus servios inoperantes.

    O mesmo acontece com a redundncia de energia, se a empresa que fornece energia, for a mesma

    que fornece para ambos os links de energia do ambiente, e a mesma chegar a ser derrubada ambos

    os links de energia iro cair e o cluster parar de funcionar devido ao problema.

    Segundo Tanenbaum (1996), quando se comea a trabalhar com vrias mquinas em ambientes

    distribudos, cada uma com seu prprio relgio, o risco de inconsistncia de a hora ficar diferente

    entre as mquinas grande, pois embora a freqncia de um oscilador de cristal ser muito estvel,

    dificilmente cada um ter exatamente a mesma freqncia. Para contornar este problema

    recomenda-se a utilizao de um servidor NTP (Network Time Protocol), onde os nodos do cluster

    consultaram de tempo em tempo na internet a hora certa.

    8. Datacenter

    A consistncia de um cluster depende muito da forma com que o ambiente implementado, isso

    varia desde a escolha por solues at o custo com que vai ser investido para que se tenham

    vantagens. Vantagens essas que garantem a segurana do servio e das informaes neles contidos.

  • Figura 4 - Sistema de Alta Disponibilidade com dois nodos e sendo acessados por trs clientes. Nodo primrio(ativo) e nodo secundrio(passivo)

    Fonte: Adaptado de REIS et al.

    9. Concluso

    Atualmente ambientes clusters esto se tornando essenciais para suprir a demanda de alto trfego

    de dados e a disponibilidade de servios em sistemas crticos, a busca tambm muito grande para

    solues Open Source devido ao alto investimento de equipamentos. Solues estas que s vezes

    so difceis de escolher, de implantar, ou at quais escolher na hora de implantao de um cluster,

    por isso este artigo teve seu principal objetivo alm de apresentar as definies de ambientes aos

    mais diferenciados, como tambm apresentar ferramentas fceis de ser implementadas e tambm

    esclarecer alguns detalhes que devem ser observados atentamente.

    Referncias

    PITANGA, Marcos. Computao em cluster: O Estado da arte da computao. Rio de Janeiro: Brasport, 2003a.

    PITANGA, Marcos. Construindo supercomputadores com Linux. 2. ed. Rio de Janeiro: Brasport, 2003b.

    IKE, Fernando. O mximo da disponibilidade: Sempre Alerta. Linux Magazine. 43 edio, 2008.

  • TANENBAUM, Andrew S. Sistemas Distribudos. Rio de Janeiro: Editora Pearson Prentice Hall, 1996.

    REIS, Adrieli C. et al. Cluster de Alta Disponibilidade. So Paulo: Faculdade de Tecnologia de Guaratinguet (FATEC-GT),.

    Fernando Luis DieselFiliao institucional: Faculdade Alfa Brasil (FAAB)Aluno.Rua Domingos Correa Ribas, 611 Centro. Foz do Jordo-PR. CEP: 85.145-000(42)[email protected]

    Fernanda Pamplona RamoFaculdade de Cincias Sociais Aplicadas de Cascavel (UNIVEL)Docente.Mestre.Rua Padre Anchieta, 266 Pq So Paulo. Cascavel-PR. CEP: [email protected]

    1. Introduo2. Clusters3. A necessidade da utilizao de um Cluster4. Tipos de Cluster