Soluciones de Alta Disponibilidad y Escalabilidad con SQL Server 2000 Diego Casali Systems Engineer...

of 49/49
Soluciones de Alta Disponibilidad y Escalabilidad con SQL Server 2000 Diego Casali Systems Engineer Microsoft de Argentina Region Cordoba y NOA
  • date post

    03-Feb-2015
  • Category

    Documents

  • view

    18
  • download

    5

Embed Size (px)

Transcript of Soluciones de Alta Disponibilidad y Escalabilidad con SQL Server 2000 Diego Casali Systems Engineer...

  • Diapositiva 1
  • Soluciones de Alta Disponibilidad y Escalabilidad con SQL Server 2000 Diego Casali Systems Engineer Microsoft de Argentina Region Cordoba y NOA
  • Diapositiva 2
  • Agenda Que entendemos por Alta Disponibilidad (HA)? Tecnologas de HA Administrando para HA Diseando una Solucin para HA
  • Diapositiva 3
  • Alta Disponibilidad Es Una combinacin de diseo, personas, procesos, y tecnologa No es Solo una solucin tecnolgica Sinnimo de escalabilidad o managability Una decisin de IT sin conocimiento del negocio Una decisin de negocio aislada del costo de downtime
  • Diapositiva 4
  • Cinco Que? Que es un Nueve? RespuestaEcuacin Por Ao( 8760 HorasBajoPorAo) / 8760 Por mes( (24 * NumDiasEseMes) HorasBajoPorMes) / (24 * NumDiasEseMes) Por semana( 168 HorasBajoEsaSemana) / 168 12 345 99.999 % uptime A=(F-R)/F A=disponibilidad F=MTBF(Tiempo medio entre fallas) R=Tiempo medio para reparar
  • Diapositiva 5
  • Bajando los Nueve PorcentajeSin Respuesta (por Ao) 100%Nada 99.999%< 5.26 minutos 99.99%5.26 52 minutos 99.9 %52 m 8 h, 45 min 99 %8 h, 45 m 87 h, 36 m 90%788 h, 24 m 875 h, 54 m
  • Diapositiva 6
  • Que significa No Disponible? Total de No Disponibilidad Mantenimiento planeado de Servidores Cadas no planeadas (ataques, fallas de hardware, etc.) Tiempo para switchear a tecnologa Disponible Restauracin de Bases de Datos Que mas
  • Diapositiva 7
  • Que significa No Disponible? (cont.) No Disponibilidad perceptible SitioWeb/aplicacin/etc. cado, SQL Server Funcionando Problemas de Red Implementando nueva versin de aplicacin Errores de usuario o aplicacin Recursos mal entrenados Etc.
  • Diapositiva 8
  • Como obtener mayor Disponibilidad Hardware redundante y de Calidad Correctamente Administrado (SW & HW) Procesos que funcionen, incluyendo control de cambios Planes apropiados de mitigacin (recuperacin de desastres, etc.) que estn probados Excelencia en Operacin, planificacin y diseo Staff entrenado y calificado valido en cualquier disciplina
  • Diapositiva 9
  • Como obtener mayor Disponibilidad (cont) pero cuales son sus barreras a la Alta Disponibilidad? Personas? Procesos? Dinero? Tiempo? Tecnologa?
  • Diapositiva 10
  • El Costo de HA
  • Diapositiva 11
  • Calculando el Tiempo y Costo de HA 2: Costos de Administracin /Procedimientos 1: Hardware y Software 7: Costos de Usaurios finales 3: Soporte 4: Desarrollo 5: Costos de Telecomunicaciones 6: Cadas Factores de TCO
  • Diapositiva 12
  • Agenda Que entendemos por Alta Disponibilidad (HA)? Tecnologas de HA Administrando para HA Diseando una Solucin para HA
  • Diapositiva 13
  • Dos Niveles Tecnologa SQL Failover Clustering Log Shipping Replicacin Tecnologa Windows Windows Clustering NLB COMBINACIONES
  • Diapositiva 14
  • Como funciona el Failover Clustering PC Clientes Nodo ANodo B Array de discos compartido Heartbeat SQL Server
  • Diapositiva 15
  • Log Shipping
  • Diapositiva 16
  • Usos de Log Shipping Usos para HA: Facilita la actualizacin 7.0 2000 Mtodo de HA secundario para un failover cluster (resuelve el problema de la distancia) Llevar a cabo mantenimiento en el Servidor principal Chequeo de estado de la BD Tambin para reportes y consultas (no HA)
  • Diapositiva 17
  • Evaluando la Replicacin como una solucin para HA Si estn descartados failover clustering y log shipping Deteccin de fallas y failover no son automticos Cuando una funcionalidad Warm-standby sea aceptable Standby server no es idntico al primario: Algunos esquemas de usuario y algunos datos de sistemas no son replicados Los datos pueden no estar actuales La replicacin Merge no es consistente transaccional mente Hay algunos beneficios: Particionar los datos en el standby server (se pueden replicar partes de tablas) Acceso a datos para reportes
  • Diapositiva 18
  • Comparacion de Soluciones Standby Hot y Warm Definiciones Hot standby Warm standby Soporte de failover Hot standby Se requiere Failover clustering Deteccin de Falla y Failover son automticos Soluciones Warm standby Log shipping Transfiere backups desde un servidor primario a uno secundario Replicacin Provee acceso simultaneo a datos en otro nodo y particionamiento de objetos y datos
  • Diapositiva 19
  • Comparacin Tecnolgica de HA en SQL FeatureFailover ClusteringLog ShippingTransactional Replication Failure detectionAutomaticNot Automatic Automatic switch to secondary YesManual Protects against failed server process YesYes, but Protects against failed disk No, Shared-disk clusteringYes, but Meta data supportAll system and user schema and data for all databases Some system, all user schema and data for select databases Some user schema and data Transactionally consistent Yes Transactionally current YesNo, since last transaction log backup No, since last replicated transaction
  • Diapositiva 20
  • FeatureFailover ClusteringLog ShippingTransactional Replication Performance impact NoneMinimal (file copying on primary) Log reader continually running Time to switchSeconds to minutes, depends on db recovery time Seconds, more to recover more thoroughly LocationsClose (unless using distance clusters on HCL) Not location bound Additional complexity Some More Maximum number of servers 432 with NLB, otherwise no limit No limit Standby available for reporting, etc. N/A not a warm standby solutionYes. Possible Read- only access when logs are not being loaded Yes Partitioning of data to standby No Yes Comparacin Tecnolgica de HA en SQL
  • Diapositiva 21
  • Backup/Restore Se necesita una buena estrategia siempre pero Para HA, debe ser el ultimo resorte Pros Usted conoce de esto y lo Ama !!!!! Cons Fallos de medios, como cinta Tiempo para llevarlo acabo No crea redundancia En realidad, se necesita mas que datos de usuario BD de sistema, SO, etc.
  • Diapositiva 22
  • Balance de carga de red (NLB) Generalmente utilizado para escalabilidad no de SQL Server Puede ser usado con BD para obtener HA usarlo solo en las situaciones correctas Servidores de datos redundantes para solo lectura (i.e. informacin de catalogo) Front end switch para el cambio de rol en log shipping Servidor en espera para los Servicios de Anlisis (BI-DW)
  • Diapositiva 23
  • Agenda Que entendemos por Alta Disponibilidad (HA)? Tecnologas de HA Administrando para HA Diseando una Solucin para HA
  • Diapositiva 24
  • Prevencin de Desastres Administracin de Riesgos Estrategias para prevencin de desastres
  • Diapositiva 25
  • Manejo de Riesgos Lista de Riesgos Descartados Planear 3 Analizar 2 Controlar 5 Identificar 1 Documento con Riesgos Seguir 4 Top n
  • Diapositiva 26
  • Estrategias para prevencin de desastres Determinar potenciales causas de caida Crear Procesos operacionales efectivos Prevenir cadas en forma automtica Hardware redundante Volcado automtico a un Servidor en espera ....DDR y replicacin o log shipping con NLB
  • Diapositiva 27
  • Principios de Data Centers Control de Cambios Staff Plan de recuperacin ante desastres Libro de Accin Establecer excelencia operacional
  • Diapositiva 28
  • Monitoreo para HA Dos Teoras: Todos los contadores el 100% del tiempo Solo lo que se necesite No olvidar el Profiler Coordinar con Event Logs, SQL Logs, IIS Logs, etc. Horarios de diferencia entre servidores HA es una solucin total no solo SQL
  • Diapositiva 29
  • Backup y Restore Desarrollar una estrategia de backup Full database backups File/filegroup backups Transaction log backups Imagen de disco de SO Probar backups en otro servidor Rotar cintas off-site Usar servicios profesionales Asegurarnos que utilizan buenos principios de Data Centers
  • Diapositiva 30
  • Backup y Restore (cont) Testear los planes de recupero Localizar cintas Testear usando la interfase grafica Testear usando solo script Testear con diferentes personas en todos los equipos Cuanto tiempo lleva? Conocer al CEO/CFO/CIO cuando un servidor importante este cado esta listo ya, esta listo ya?
  • Diapositiva 31
  • Una de las claves para HA Sin esto, ..rece para que todo funcione Diferentes planes: Sitio cado Servidor cado Perdida de Datos Documentar el plan (mantenerlo actualizado) testear, testear TESTEAR! Almacenar resultados/aprendizajes Almacenamiento de backups Off-site, incluyendo el manual de operaciones (libro de accin) Diseando un Plan de recuperacin en desastres
  • Diapositiva 32
  • Desastre ocasionado por la naturaleza ou Hombre Buen caso para geoclusters/log shipping Puede darse que cada minuto sea crucial tener un hot/warm/cold standby es crucial Si no se cuenta con un hot/warm/cold standby, estar preparado para reconstruir .rece por que cuente con buenos y recientes backups Sitio Cado
  • Diapositiva 33
  • Esto tiende a ser un falla de sw/sw failure o un error human Otro buen argumento para geoclusters/log shipping y redundancia Si necesita reconstruir, tenga a mano: Configuracin de Sistema (Libro de Accin) Cintas/CDs disponibles Software, Claves de CD Nmeros de soporte Servidor Cado
  • Diapositiva 34
  • Perdida de Datos Error Human? Falla de Hardware? Puede hacer rollback/solucionar el problema? (i.e. deshacer va aplicacin, instruccin SQL, o herramienta como Lumigent, etc.) En estos casos es cuando un plan de backup/restore real, probado, testeado lo salvara
  • Diapositiva 35
  • Agenda Que entendemos por Alta Disponibilidad (HA)? Tecnologas de HA Administrando para HA Diseando una Solucin para HA
  • Diapositiva 36
  • Preguntas Bsicas Es Misin Critica? Que ocurre cuando esta cado? (Perdida de dinero? Perdida de vidas?) EN cuanto impacta el negocio no disponer de HA? Calcular cuanto costara estar fuera de servicio Que industria? Es OLTP, DSS? Cual es el presupuesto? Que disponibilidad y performance espera el usuario final?
  • Diapositiva 37
  • No hay ninguna gua al 100% que sirva para cualquier situacin Asegurarse que la tecnologa sea soportable en nuestro entorno Solo porque algo esta de moda, puede que no sea correcto i.e. As como failover clustering es la mejor opcin en la mayora de las situaciones, no es siempre la eleccin correcta Seleccionando la tecnologa correcta
  • Diapositiva 38
  • Invertir en su App? Contrario a lo que se piensa, no importa cuan confiable sea el HW, mala app = baja disponibilidad Invertir mucho en el desarrollo de su aplicacin Proyecto Nuevo? Mejor escenario Haga lo correcto desde el comienzo
  • Diapositiva 39
  • Entorno/app existente? Evaluar la infraestructura Necesita nueva estrategia de mantenimiento? Nuevo HW? Migracin de Datos? Rediseo de App? Crecimiento Capacidad, escalabilidad Ajustar ndices, esquema, mantenimiento; posibles cambios de diseo Que hacer si el HW no escala mas? Minimizar el downtime por el upgrade Invertir en su App? (cont)
  • Diapositiva 40
  • Disear su Aplicacin de BD para HA Involucrar a sus programadores desde el inicio Utilizar versioning & source control para todo el cdigo incluyendo SQL Manejar la implementacin con cuidado construir programas con instaladores y desinstaladores Limpios Utilizar tecnologas apropiadas en el cdigo
  • Diapositiva 41
  • Establecer entornos de desarrollo, testing, mas uno que sea exacto al entorno de produccin (con los datos actuales de produccin) Tener en cuenta las cadas, y como manejarlas no dejarlo para IT Datos de solo lectura deben manejarse en cache para mejorar la performance de la aplicacin (XML) Disear su Aplicacin de BD para HA (cont)
  • Diapositiva 42
  • Resolver cualquier problema de la aplicacin que afecte directamente SQL Server Locking/blocking Optimizar Consultas/Indizacin No procesar sobre la BD (cursores, grandes sp) Usar sp para IUD Asegurarse que las estadsticas esten actualizadas Disear su Aplicacin de BD para HA (cont)
  • Diapositiva 43
  • En lo posible codificar aplicaciones sin estado, si se mantiene estado, seleccionar una forma adecuada de hacerlo La experiencia del usuario debe ser positiva Seguridad Hacer competir y convivir su app con otras con las que tenga que vivir No codificar para un Service Pack/Versin especficos (OS/SQL) Dejar que los requerimientos definan la tecnologa Disear su Aplicacin de BD para HA (cont)
  • Diapositiva 44
  • Utilizar nombre completos para tablas y procedimientos almacenados Colocar todos los objetos en BD de usuario, no de sistema No harcodear en la aplicacion nombres de servidores, nombres de instancias, y direcciones IP Reutilizar conexiones de BD (Connection pooling)
  • Diapositiva 45
  • Disear su Aplicacin de BD para HA (cont) De ser necesario crear errores personalizados de SQL Server, pero asegurarse que no entren en conflicto con errores personalizados de la app Analizar Database collations Nombres de Usuario y logins nicos Asegurarse que trabajos de una app no entren en conflicto con otras app Transacciones pequeas (rollback de failover clustering y Log Shipping)
  • Diapositiva 46
  • En Resumen Una vez que el servidor este corriendo, djelo en paz. Cuatro pilares de HA Diseo Personas Procesos Tecnologa (comprar un nuevo cluster e instalar SS2KEE no es suficiente)
  • Diapositiva 47
  • 9 Hardware bien administrado Hardware bien administrado Puede tolerar algunas fallas de HW 9 Buena administracin y planificacin Puede tolerar la mayora de las fallas de HW Puede tolerar tareas normales de ope (ej., UPG de SW) Puede tolerar algunas fallas de SW 9 Excelencia operacional, de diseo y de planificacin Puede soportar la mayora de las cadas planeadas o no Puede tolerar algunas fallas de operaciones 9 9 Casi sin administrar En Resumen (cont)
  • Diapositiva 48
  • Para mas Informacin SQL Server Technical Information (http://www.microsoft.com/sql/techinfo/) Mucha info & links, incluyendo: SQL Server 2000 Operations Guide SQL Server 2000 Resource Kit (info only; you need the printed book the CD-ROM) SQL Server 2000 Failover Clustering Whitepaper Capacity Planning Microsoft SQL Server 2000 Administrators Companion MS Support Homepage (Q Articles)
  • Diapositiva 49
  • 2002 Microsoft Corporation. All rights reserved. This presentation is for informational purposes only. Microsoft makes no warranties, express or implied, in this summary.