Sie sind auf Seite 1von 60

Monitoreo de Redes de Datos

ExpoComm 2007

EXPOCOMM Argentina 2007 Seminario de Tecnologa y Mercado Tutorial

Monitoreo de Redes de Datos


Ing. Marcelo Utard Profesor Facultad de Ingeniera UBA Socio Gerente U&R Consultores mutard@uyr.com.ar http://www.uyr.com.ar http://www.itmetro.com.ar
Pag. 2

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Contenidos
Se identifica la necesidad y la problemtica de medir. Se aborda todo aquello que facilita el "Soporte Proactivo", el "Capacity Planning", la "Verificacin de SLAs". Se presentan los conceptos fundamentales de gestin de fallas y performance de las redes de datos.

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 3

Contenidos
Se describen las metodologas, mecanismos, herramientas, tecnologas, que se suelen y pueden utilizar para medir. Se detallan algunas mtricas (variables) y mtodos de medicin (probes). Se presenta de qu modo se suele mostrar la informacin resultante de las mediciones (vistas, reportes).

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 4

Porqu medir?
Gestin de calidad de servicio
satisfaccin de necesidades

Gestin presupuestaria
control de gastos e inversiones control de proveedores
ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard Pag. 5

Para qu medir?
La medicin o monitoreo sistemtico y permanente permite hacer: Soporte proactivo Capacity planning Verificacin de SLAs

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 6

Para qu medir? Soporte Proactivo


Para lograr que los usuarios no perciban fallas, es necesario: minimizar el tiempo de restauracin (MTTR) disminuir la ocurrencia de fallas (maximizar el MTBF)
evitar las fallas predecibles evitar las fallas recurrentes

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 7

Para qu medir? Soporte Proactivo


Medir facilita el soporte proactivo, ya que permite: minimizar el tiempo de restauracin MTTR
detectando las fallas en forma temprana alertando a los operadores y administradores contando con informacin para el diagnstico

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 8

Para qu medir? Soporte Proactivo


Medir facilita el soporte proactivo, ya que permite: evitar las fallas por saturacin de recursos
identificando el desperdicio o mal uso de recursos prediciendo los cuellos de botella para el redimensionando anticipado de la capacidad de los recursos

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 9

Para qu medir? Soporte Proactivo


Medir facilita el soporte proactivo, ya que permite: evitar fallas recurrentes
identificandolas y corrigiendo sus causas

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 10

Para qu medir? Capacity Planning


Redimensionar los recursos, en funcin de las necesidades genuinas, racionalizando el presupuesto, con el tiempo de antelacin suficiente.
Medir facilita el capacity planning, relevando el grado de utilizacin de los recursos de la red mostrando la tendencia en el uso de los recursos permitiendo la estimacin de la medida justa de incremento

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 11

Para qu medir? Verificacin de SLAs


SLA Service Level Agreement: Acuerdo de Nivel de Servicio define clara y cuantitativamente el alcance del servicio compromete a quien lo provee su incumplimiento es penalizado Extended enterprise SLAs con usuarios internos SLAs con clientes SLAs con proveedores

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 12

Para qu medir? Verificacin de SLAs


Medir facilita la verificacin de los SLAs relevando las mtricas comparndolas con umbrales calculando el grado de cumplimiento generando reportes

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 13

Qu medir? Variables o Mtricas


En trminos generales, es necesario medir variables o mtricas de:

Status Uso de recursos Performance

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 14

Qu medir? Variables de Status


Alcanzabilidad de un host o router Estado operativo de una interfase Estado de un proceso ...

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 15

Qu medir? Variables de Uso de recursos


CPU Load Memory use Uso de ancho de banda Trfico Tx o Rx (en tramas/paquetes, en bytes) Composicin de trfico (por aplicacin, por src/dst, ...) Ocupacin de colas ...
Pag. 16

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Qu medir? Variables de Performance


time

round trip time response time transit delay delay jitter


packet loss ...

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 17

Qu medir? Real time vs Histrica


Info real time para: saber si todo esta up&running identificar y diagnosticar fallas Info histrica para: identificar y diagnosticar problemas hacer baselining dimensionar capacidad controlar SLAs
ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard Pag. 18

Cmo medir? Grupos de usuarios


operaciones mesa de ayuda administradores de plataformas/aplicaciones planificacin/tecnologa/ingeniera jefes/supervisores/gerentes c/mayor o menor dominio tcnico

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 19

Cmo medir? Requisitos de usuarios


Segun EMA (continuacion)

Fcil p/tomar decisiones


operativas (troubleshooting) de negocios (costo/beneficio)

Escalable Confiable Costo/beneficio


Restricciones presupuestarias ROI

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 20

Cmo medir? Arquitectura de NSM


NSM: Network & System Management NMS Network Management Station Probes & Agents Activos
ICMP Echo (ping), SNMP TCP, UDP, DNS (nslookup/dig) HTTP/HTTPS (wget), SQL (select), ...

Probes & Agents Pasivos


Sniffer, RMON, Netflows, ...
ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard Pag. 21

Cmo medir? Metodologas


Event Notification Exception Notification KeepAlive Notification Data Collection Polling Reporting

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 22

Cmo medir? Event Notification


Notificacin de eventos

por excepcin o keep-alive mensajes de log disparo de alertas ejecucin automatica de acciones

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 23

Cmo medir? Event Notification


Exception Notification slo notifica excepciones no news, good news problema de prdida de notificaciones no sirve p/seguimiento de estados tormenta de eventos demasiada informacin se escapa la tortuga no sirve p/coleccionar datos

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 24

Cmo medir? Event Notification


KeepAlive Notification

notifica siempre, peridicamente resuelve el problema de prdida de notificaciones sirve p/seguimiento de estados sirve p/coleccionar datos (ver reporting)

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 25

Cmo medir? Data Collection: Polling


Encuestado peridico desde la NMS

medicin de variables ms relevantes comparacin con umbrales almacenamiento de muestras


Sirve para:

seguimiento de estados coleccionar datos historicos


ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard Pag. 26

Cmo medir? Data Collection: Polling


Mayor consumo de ancho de banda que Event Notification Complejidad de probes en NMS Mayor exigencia de cpu y mem en NMS Otros Problemas: dependencias topolgicas ronda de polling y timeouts secuenciacin inevitable

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 27

Cmo medir? Data Collection: Reporting


Notificacin peridica a la NMS

medicin de variables ms relevantes comparacin de umbrales almacenamiento de muestras


Sirve para:

seguimiento de estados coleccionar datos historicos


ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard Pag. 28

Cmo medir? Data Collection: Reporting


Complejidad de probes en Agentes Menor exigencia de cpu y mem en NMS Mayor escalabilidad que el polling Evita muchos problemas del polling

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 29

Cmo medir? Estado de variables


dependencia entre variables

el estado depende de otras variables dependencias topolgicas arbol vs malla de dependencias


polling/recoleccin en funcin del estado alarmas en funcin del estado clculo de disponibilidad en funcin del estado

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 30

Cmo mostrar lo medido? Vistas, Mapas, Reportes


Vistas, mapas, reportes de Status de Uso de Recursos de Performance de Disponibilidad de Log de Eventos ...

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 31

NSM Implementacin y Mantenimiento


La implementacin y el mantenimiento del NSM es un proceso cclico compuesto por las siguientes fases:
1. 2. 3. 4.

Relevar/ corregir "baselines" Configurar/ ajustar umbrales y alarmas Monitorear Analizar fallas detectadas

Excesivas fallas no detectadas? Excesivas falsas alarmas?


ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard Pag. 32

NSM Tareas de OA&M


OA&M (Operacin, Administracin & Mantenimiento) ABM (Altas Bajas y Modificaciones) de:

mediciones/recolecciones umbrales/baselines eventos/alarmas/alertas vistas/mapas usuarios reportes


ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard Pag. 33

NSM con Recursos Propios


costo de adquisicin de herramientas costo de capacitacin del personal personal especializado rotacin del personal

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 34

NSM Service Providers


Tercerizacin del NSM para implementacin, mantenimiento, operacion, soporte y/o consultoria mejora el costo/beneficio

mayor know-how recursos compartidos recursos redundantes


independiente de otros SPs?
ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard Pag. 35

Muchas gracias por su atencin


Ing. Marcelo Utard Profesor FI UBA Socio Gerente U&R mutard@uyr.com.ar http://www.uyr.com.ar http://www.itmetro.com.ar 11 5235-9903

NSM Clases de Funciones de Management


Segun la ISO: Fault/Problem Management Performance/Resource Mgmt Configuration Management Security Management Accounting/Billing Management
ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard Pag. 37

NSM Arquitectura
Management Server / Console (NMS) Managed Node, Agent, SubAgent Probes, Collection Station User Station
User Tools: MSWinGUI, XWinGUI, WebBrowser

Gateway, Proxy Agent


ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard Pag. 38

NSM Aplicaciones
Licenciadas & Free Especializadas en management de: Lneas de dispositivos - Routers/Switches, Servers, etc Aplicaciones - Mail, RDBM, ERP, etc - Tipo/clase de management: Fault,Perf,Config,etc Plataformas de integracin
-

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 39

NSM Plataformas de management


p/integrar aplicaciones de NSM p/compartir datos

de config, de status, de eventos


es un nico tablero de control disminuye las tareas de sysadmin

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 40

NSM Medicin/recoleccin de datos


Tipos de objetos medidos/monitoreados:

Servicios Nodos (Equipos, Dispositivos) Recursos Trafico

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 41

NSM Medicin/recoleccin de datos


Tipos de mediciones:

Reachability/Availability Tiempo de respuesta Grado de utilizacin Verificacin de contenidos SLA conformance/violation

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 42

NSM Medicin/recoleccin de datos


Tipos de mediciones: Composicin de trfico
por Source/Destination Address por Protocolo (ICMP,TCP,UDP,etc) por ICMP Type por Src/Dst Port

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 43

NSM Medicin/recoleccin de datos


Tipos de mediciones: Composicin de retardo
end-to-end time

net/internet time

queueing time insertion time propagation time processing/switching/forwarding time connection setup time back-end time

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 44

NSM Medicin/recoleccin de datos


Rondas de muestreo

Intervalo de muestreo Timeout y retries


Problema de timeouts

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 45

NSM Medicin/recoleccin de datos


Almacenamiento de datos recolectados

Flat files RDBMs


Problema de Ocupacin de espacio

Sumarizacin/Promediacin

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 46

NSM Probes
Probes (puntas de prueba): Activos Pasivos (sniffers/snoopers) Embebidos (agents) Dedicados/externos Propietarios

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 47

NSM Probes
ICMP Echo (Ping)

%disponibilidad de nodos e interfaces RTT (Round Trip Time) Throughput

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 48

NSM Probes
SNMP snmpget, snmpset snmpnext / snmpwalk snmptrap OIDs MIBs: MIB2 Host, etc SNMPv1, SNMPv2, SNMPv2c, SNMPv3

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 49

NSM Probes
TCP (user defined) UDP (user defined) RPC (user defined) SMTP, POP3, IMAP4 Echo, NNTP (news), NTP DNS, LDAP, Radius DHCP, SQL Log Parsers
Pag. 50

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

NSM Probes
HTTP, HTTPS HTTP_TRAN web transaction recorder single step test WEB Browser client monitor plug-in applet/script Java Applet, Java Script, ActiveX

supply cookie to mgmt srv


hits a tag -> dowload prog
ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard Pag. 51

NSM Agents
SNMP Master agent / MIB subagents RMON Agents HP OVO/OVP Agents IBM Tivoli Agents BMC Patrol Agents CA Unicenter Agents Cisco Netflows Cisco IPSLA Agent IDSs
ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard Pag. 52

NSM Eventos, Alarmas & Alertas


Generacin de eventos por deteccin de: fallas cambios de estado tiempos de respuesta lenta recursos agotados/saturados recoleccin de datos y cruce de umbrales >, <, =, != fijos, variables baselines
ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard Pag. 53

NSM Eventos, Alarmas & Alertas


Mecanismos/protocolos de notificacin de eventos: snmptraps mails syslogs

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 54

NSM Eventos, Alarmas & Alertas


Tratamiento de los eventos: Formato de mensajes de log Categorizacin de eventos por severidad por tipo/clase Disparo de alertas Events forwarding Events correlation Seguimiento de estado de alarmas
ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard Pag. 55

NSM Eventos, Alarmas & Alertas


Mecanismos de alerta: Logs Mails Paging Audio, TextToSpeech Audio Streaming Llamada telefonica TroubleTickets Otras acciones (command exec)
ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard Pag. 56

NSM Management
Bussines oriented Management Service oriented Management Infrastructure oriented Management Network centered Management Device centered Management Policy Based Management
Pag. 57

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

NSM Policy Based Management


Definicin de politicas (reglas) que describen el comportamiento deseado Dimensionamiento/configuracin de la infraestructura "Baselining" Relevamiento/medicin p/saber q es "normal" y "anormal" como se comporta dia a dia? qu es sub/sobre utilizado? donde se producen mas errores?

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 58

NSM Policy Based Management


"Baseline analisis"

Determinacin de SLAs qu medir? qu cruce de umbrales detectar?


Medicin y reportes de SLAs Ajustes(reconfiguracion/redimensionamiento) en la infraestructura

ExpoComm Arg 07 - Tutorial "Monitoreo de Redes de Datos" - Ing. Marcelo Utard

Pag. 59

Muchas gracias por su atencin


Ing. Marcelo Utard Profesor FI UBA Socio Gerente U&R mutard@uyr.com.ar http://www.uyr.com.ar http://www.itmetro.com.ar 11 5235-9903

Das könnte Ihnen auch gefallen