perfSONAR en LHC
description
Transcript of perfSONAR en LHC
perfSONAR en LHC
Indice
1. Qué es perfSONAR2. Objetivos de diseño3. Principales servicios de perfSONAR4. Ejemplo de interacción de un cliente5. Herramientas de diagnóstico6. Arquitectura global perfSONAR-LHC7. Despliegue perfSONAR en Tier18. Despliegue perfSONAR en Tier29. Arquitectura LHC en España10.¿Dónde medimos?11.¿Cómo medimos?12.¿Cómo es perfSONAR?
Qué es perfSONAR
1. Es una infraestructura dedicada a la monitorización del rendimiento de la red
2. Permite solucionar problemas extremo a extremo en conexiones que atraviesan varios dominios de red
3. Contiene un conjunto de servicios dedicados a realizar medidas de rendimiento en entornos federados
4. Tiene 3 contextos diferenciados1. Es un consorcio de organizaciones que buscan
construir una infraestructura de medida de rendimiento de red interoperable entre múltiples dominios de red
2. Es un protocolo basado en SOAP XML3. Es un conjunto de paquetes de software
Objetivos de diseño
1.perfSONAR debe ser un despliegue abierto, flexible, extensible y descentralizado
2. La arquitectura resultante debe ser:1. Sistema modular que permita la división en múltiples
componentes
2. Sistema dinámico que permita eliminar y añadir componentes durante en operación
3. Sistema que permita a sus componentes y los Puntos de Medición anunciar a los demás sus funcionalidades
4. Sistema descentralizado, que permita a cada dominio administrativo limitar las funcionalidades del sistema en función de las necesidades
Objetivos de diseño II
5. Sistema escalable, que permita incorporar múltiples redes, servicios, fuentes de información y herramientas de monitorización
6. Sistema seguro que no pueda ser utilizado para otros fines que para la monitorización del rendimiento de la red
7. Sistema seguro, que no pueda provocar congestión en las redes que monitoriza
8. Sistema con tolerancia a fallos, que no sea inestable ante los posibles fallos de alguno de sus componentes
9. Sistema que proporcione mensajes regulares y claros en el caso de que se produzcan fallos
Principales servicios de perfSONAR
1. Measurement Point Service1. Crea y/o publica la información de
monitorización relativa a las medidas activas o pasivas
2. Measuremente Archive Service1. Guarda y publica la información recibida por
los Measurement Point Services
3. Transformation Service1. Proporciona la posibilidad de manipular
(agregar, concatenar, correlar, traducir) los datos archivados de las medidas realizadas
Estos servicios están específicamente dedicados a tareas de medidas de rendimiento y análisis de la red
Principales servicios de perfSONAR II
1. Lookup Service1. Permite al cliente descubrir los servicios
existentes y otros LS
2. Topology Service1. Permite que la información de la topología de
la red está disponible para los demás servicios
2. Se encarga de encontrar al MP más cercano
3. Proporciona información de la topología de red a las herramientas de visualización
3. Autentication Service1. Controla el acceso a los servicios
Ejemplo de interacción de un cliente
Cliente
Red A Red B
LS A LS BMA A MA B
a b
c de f
¿Utilización enlace – IPs a,b,c?
a,b,c : Red A, MA A
Obtener utilización enlace a,b,c
Respuesta
GráficogLS
¿Dónde consigo información Red A y Red B?
LS A, LS B
Herramientas de diagnóstico
1. pingER (latencia)1. Herramienta que realiza pings regularmente y almacena los
resultados
2. Proporciona:
– Información de Disponibilidad
– Referencia temporal sobre problemas
– Visión preliminar sobre las razones de una degradación del rendimiento
2. OWAMP (One Way Active Measurement Protocol)1. Demonio que solicita y ejecuta pruebas de latencia en un
solo sentido
2. Proporciona:
– Visión más exacta sobre la degradación de rendimiento (dirección de la degradación, más sensible al jitter)
– Visión acerca del routing (saltos, latencia en una dirección)
– Información de Disponibilidad
– Referencia temporal sobre problemas
Herramientas de diagnóstico II
3. BWCTL (BandWidth test ConTroLler)
1. Demonio que solicita y ejecuta pruebas de iperf y que soporta múltiples instancias
2. Proporciona:
– Detección de problemas ya que la herramienta hace un uso de la red del mismo modo que lo haría un usuario
– Archivado de pruebas realizadas con límite de tráfico alcanzado
– Informa de cuándo los problemas de rendimiento comenzaron
4. NDT (Network Diagnostic Tool)
1. Herramienta que desde un navegador web invoca un test de diagnóstica avanzado
2. Proporciona:
– Informa por qué pueden existir problemas de rendimiento
– Información de diagnóstico detallada que puede ser utilizada por los ingenieros de red
– Orientada a usuarios finales
Herramientas de diagnóstico III
5. Estado de enlace o circuito
1. Utilizando la herramienta más adecuada a cada caso (ej: SNMP)
2. Se realiza un archivado de los diferentes estados (up/down) de los enlaces más importantes
3. Genera alarmas que avisan al NOC sobre las incidencias de circuitos multidominio
6. SNMP MA (SNMP Measurement Archive)
1. Almacena la información de errores y utilización de enlaces
2. Simplifica los diagnósticos de problemas
3. Proporciona una visión sobre los patrones de utilización de la red
7. CACTI
1. Herramienta para generar gráficas de red basada en RRDTool
2. Requiere:
– SNMP
– MySQL
– PHP
3. Gestión de usuarios y perfiles
Herramientas de diagnóstico IV
8. NPAD (Network Path and Application Diagnosis)
1. Herramienta diseñada para realizar diagnósticos precisos sobre problemas en la red de usuario y sistemas finales
2. Pruebas realizadas desde un navegador web
3. Genera un informe que enumera todos los problemas que afectan la descarga de archivos de un sitio remoto
4. El diagnóstico incluye una guía para los usuarios finales y administradores de red para localizar la fuente de los problemas encontrados
9. Thrulay
1. Se utiliza para medir capacidad, retardo y otras medidas del rendimiento de una red enviando tráfico TCP o UDP sobre la misma
2. Mediante TCP permite medir RTT Delay con Throughput
3. Mediante UDP permite medir:
– One-Way Delay
– Paquetes perdidos
– Paquetes duplicados
10. NTP (Network Time Protocol)
1. Protocolo diseñado para sincronizar los relojes de los elementos de una red
2. Se utiliza para realizar medidas de rendimiento con la mayor precisión
Arquitectura Global perfSONAR-LHC
CERNT0
Tier 1 Tier 1 Tier 1 Tier 1 Tier 1 Tier 1 Tier 1 Tier 1 Tier 1 Tier 1Tier 1
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Tier 2
Despliegue perfSONAR para LHC
ICMP
Demonios para diagnóstico
Pruebas programadasAlmacenamiento de resultados
AnálisisInterface de Usuario
1. Despliegue en Tiers1 coordinado por DANTE
2. En España PIC-RedIRIS-DANTE
3. Prerequisitos para instalación1. Máquina HADES (OWAMP - IPPM)• Interfaz de gestión (100Mbps)• Interfaz de medida (100/1000Mbps)• Direccionamiento IPv4 para interfaces de gestión y
medida• Acceso HTTP y HTTPS a interfaz de gestión• Soporte IPv6• Acceso ssh• Para las medidas deben abrirse los puertos superiores
al 50000 (UDP)
Despliegue perfSONAR en Tier1
2. Máquina BWCTL - Puede ser la misma que HADES
• Interfaz de gestión (100Mbps)
• Interfaz de medida (100/1000Mbps)
• Direccionamiento IPv4 para interfaces de gestión y medida
• Acceso HTTP y HTTPS a interfaz de gestión
• Soporte IPv6
• Acceso ssh
• Puerto de control (4823) accesible
• Para las medidas iperf deben abrirse los puertos superiores al 5000
• Se recomienda que el servicio BWCTL tenga salida independiente del servicio HADES
• NO se contempla como válido un servicio en el que los servicios BWCTL y HADES utilicen la misma interfaz
Despliegue perfSONAR en Tier1 II
Despliegue perfSONAR en Tier1 III
1. Conexiones de las máquinas (PC)1. Interfaz de gestión RJ452. Interfaz de servicio HADES (100Mbps)3. Interfaz de servicio BWCTL opcional
(100/1000Mbps)4. Puerto BNC - conector de la tarjeta GPS5. Puerto RS2326. Fuente de alimentación 17. Fuente de alimentación 2 opcional
Despliegue perfSONAR en Tier1 IV
1. Descripción de las máquinas (PC)1. Tamaño 3U2. CPU 1x3.0GHz3. Disco Duro 2xSATA 80GB4. 512 MB RAM5. Tarjetas de red: 2x1Gbps en placa6. BUS: 2x32, 2xPCI-X 64 Bit7. Fuente de alimentación 460W8. Tarjeta de Gestión remota: eRIC express
1. Funcionalidad1. Hosts con conectividad ICMP• Necesidad de hacer ping y traceroute
2. Demonios para diagnóstico de problemas• NDT• OWAMPD• BWCTLD
3. Registro de disponibilidad
4. Almacenamiento de datos• Pruebas realizadas regularmente (pingER, OWAMP,
BWCTL)• Estado de enlace/circuito• Utilización de enlaces/circuitos
Despliegue perfSONAR en Tier2
1. Recursos necesarios1. Host accesible (firewall)
2. 2 Sistemas linux no muy sofisticados
3. Puede optarse por utilizar la misma configuración HW de los Tier1
4. Se debe correr un demonio que registre la disponibilidad de las herramientas al LS global (gLS)
5. Espacio en disco para almacenamiento de datos
6. Configuración para interactuar con la infraestructura existente
Despliegue perfSONAR en Tier2 II
1. Requerimientos Hardware1. 2 Sistemas linux no muy sofisticados (500 €
cada uno)
2. Diferenciar y aislar pruebas de rendimiento de red de las pruebas de las aplicaciones LHC propiamente dichas
3. 1 máquina para pruebas de latencia a poder ser con ahorro de energía deshabilitado y en condiciones ambientales controladas
– 2Ghz/1GB RAM/50GB HDD
– Tarjeta de red 10/100/100
1. 1 máquina similar para pruebas de ancho de banda
Despliegue perfSONAR en Tier2 III
Arquitectura de LHC en España
GW-Nacional2
GW-Nacional1
GW-Madrid0
GW-Barcelona0
GW-Valencia0
GW-Sevilla0
EB-Tenerife0
EB-Iris2
EB-Iris4
EB-Santiago0
EB-Bilbao0 EB-Santander0
UV
Anella
CAM
UNICAN
USC
IFCA
SW-Tenerife2
UMA
EB-Barcelona0
EB-Madrid0
UAM
CESGA
CIEMAT
UB
UAB
PIC
TIER 1TIER 2
TIER 2
TIER 2
TIER 2
TIER 2TIER 2
TIER 2
TIER 2
TIER 2
Red Regional
¿Dónde medimos?
1. La medida debe contemplar todo el camino, debe ser extremo a extremo. Esto es de usuario final a usuario final1. Medida entre Tier1 y RedIRIS
1. Sondas o máquinas de medida en PIC
2. Sondas o máquinas de medida en RedIRIS
2. Medida entre Tier2 y RedIRIS1. Sondas en cada Tier2
2. Sonda en RedIRIS - Resuelto en 1
3. Medida entre Tier2 y Tier1
4. Medida entre Tier2 y Tier2
2.Redes Regionales. Si no despliegan perfSONAR hay que saber cuándo un problema de rendimiento está en ellas
¿Cómo medimos?
1. Utilizando las herramientas propocionadas en el paquete perfSONAR.
2. Estableciendo un conjunto de parámetros de red necesarios para que una aplicación determinada funcione adecuadamente
3. Homogeneizando servicios perfSONAR en Tier2
4. Realizando un despliegue conjunto
5. Caracterizando la red (NREN, Tier1, Tier2, Red Regional??)
6. Utilizando la información recogida para su posterior análisis y detección de problemas
7. Cuidado con los firewalls, deben permitir que las medidas se realicen con propiedad
¿Cómo es perfSONAR?
¿Cómo es perfSONAR? II
¿Cómo es perfSONAR? III
¿Cómo es perfSONAR? IV
¿Cómo es perfSONAR? V
Edificio BroncePlaza Manuel Gómez Moreno s/n28020 Madrid. España
Tel.: 91 212 76 20 / 25Fax: 91 212 76 35www.red.es
30
¿Preguntas?
www.rediris.es