Libres Consultores: Monitoreo Proactivo en Solución de Monitoreo

En ‎Libres Consultores‬ estamos trabajando para proveer capacidades de monitoreo proactivo, para ello usamos nuestra Solución de Monitoreo, basada en una integración Check_MK/Nagios para alimentar un server Graphite (vía Graphios por ejemplo). La información en Graphite puede ser explotada para monitoreo proactivo vía análisis de tendencias.

Desde el mismo Check_MK se monitorea las tendencias de las gráficas en Graphite para alertar de tendencias peligrosas en la infraestructura.

Por ejemplo, analizando la tendencia creciente de una gráfica que dibuje una curva basada en la tasa de errores de una interfaz de red, se puede alertar del repentino aumento de los mismos.

En primera instancia, el monitoreo proactivo no parece superior al monitoreo reactivo, en el ejemplo, eventualmente, la interfaz fallará y se producirá un evento de host caído por ejemplo, disparando una alerta y posiblemente una notificación.

No es siempre el caso en todas las interfaces, por ejemplo, muchas interfaces no están conectadas con hosts activamente monitoreados, y en realidad el grueso de las interfaces de red monitoreadas en una infraestructura están conectadas hacia estaciones de trabajo, cuyos eventos de "host caído" no son activamente monitoreados y/o alertados (porque las estaciones de trabajo se apagan y encienden cíclicamente, no representan fallos a informar).

En cambio al usar monitoreo proactivo se puede detectar un incremento de la tasa de errores* en una interfaz y/o grupo de interfaces (este último caso es el más frecuente), permitiendo localizar posibles problemas resultantes - "la red está lenta" - que no son fáciles de resolver usando monitoreo reactivo, ya que típicamente, el resto de los nodos/hosts/equipos de red que van a estar siendo monitoreados, no van a informar de ningún problema aparente.

* La alternativa a no reportar fallos devenidos de una cuenta alta de errores en una interfaz de red no monitoreada activamente es simplemente recorrer la información disponible (por ejemplo, gráficas MRTG, vía comandos en los equipos administrables, vía interfaz web cuando la tienen), de todas las interfaces de red de los equipos de red afectados, hasta encontrar las que efectivamente estén informando un estado de error*.

* Siempre con la salvedad de que existe un cant. mínima de errores luego de la cual recién entonces, el equipo de red reporta la interfaz como en estado de error. Si esa cantidad mínima no es muy alta, podría ser igualmente perjudicial para el desempeño de muchas aplicaciones intensivas en tráfico de red.

Las alertas por tendencia permiten superar por lejos la efectividad de la resolución reactiva de problemas, permitiendo resolver muchos fallos incluso antes de que se produzcan.‪

Libres Consultores

Páginas

Hoy decimos

jueves, 17 de abril de 2014

Monitoreo Proactivo en Solución de Monitoreo

No hay comentarios:

Publicar un comentario