Mantener la conectividad, las aplicaciones y los servicios de una red funcionando a un nivel óptimo es algo imprescindible en la gestión de redes. Network Fault Management o la gestión de fallos de red es la parte que ayuda a identificar, evitar y resolver los problemas que pueden dificultar el rendimiento de una red de transmisión digital.
¿Por qué es importante la adecuada gestión de fallos de red?
Los gastos que puede acarrear una mala gestión de la red pueden llegar a ser importantes, además de conllevar pérdida de tiempo y rendimiento.
La gestión de fallos de la red se hace necesaria, pues mantener y garantizar la continuidad y el funcionamiento de la red se ha vuelto crucial. Una buena gestión de los fallos ofrece vertientes muy positivas, puesto que permite mantener un rendimiento de red óptimo garantizando la disponibilidad, la minimización de los tiempos de inactividad y la detección temprana de los fallos.
¿Qué son los fallos o eventos de una red?
Podemos definir los fallos o eventos de una red como aquellos sucesos que interfieren en el correcto funcionamiento de la red, y por consiguiente disminuyen significativamente su rendimiento. Los ejemplos de fallos más comunes incluyen fallos en el hardware, en el cableado, interferencia inalámbrica, así como un cambio en el estado del puerto, saturación de ancho de banda o, lo que es peor, la pérdida de conectividad.
¿Cuál es el proceso de gestión de fallos de red?
El proceso de gestión de fallos puede verse modificado en cuestión de la plataforma utilizada para ello, pero comúnmente se siguen los siguientes pasos:
1. Detectar la localización del fallo
La continua monitorización de la red permite detectar anomalías en el rendimiento de la red o la interrupción del funcionamiento de la misma. Para ello normalmente se aplica la gestión de fallos activa y/o pasiva de red.
Por un lado, la gestión de fallos activa realiza continuas consultas a diferentes elementos de la red, en busca de los dispositivos de la red y de su estado. Es decir, la gestión activa está solicitando constantemente información para detectar cualquier fallo. Por otro lado, la gestión de fallos pasiva monitorea los entornos de la red para detectar eventos que suceden y que ellos mismos muestran que se ha producido una falla, sin necesidad de recurrir a las continuas consultas que vimos en la gestión activa.
En definitiva, la gestión activa pregunta por los fallos a los diferentes elementos de una red. Por el contrario, la gestión pasiva se limita a escuchar, es decir, detectar eventos que indican claramente que se ha producido un fallo.
2. Análisis y aislamiento
Identificar el tipo de evento o falla sucedido en la red que ha producido un impacto y conocer su causa raíz son procesos de los más importantes. Una vez comprendido el problema, el fallo se ha de aislar de la red con el fin de que la red continúe en funcionamiento con normalidad, garantizando de este modo la continuidad en el servicio.
3. Informar
Una de las partes muy importantes es la notificación del fallo. Puesto que permite avisar de los problemas a los técnicos de asistencia técnica, a los administradores mediante e-mail o SMS, y de forma visual a los administradores de NOC.
4. Resolver
Se evalúa el origen del problema, y en su caso se subsana o se reemplaza. Es importante contar con un buen NMS (Network Management System) que te permita resolver los problemas de forma sencilla y ágil, de forma automática e incluso poder aplicar el mantenimiento preventivo.
Network Fault Management forma parte del modelo FCAPS, qué es FCAPS?
FCAPS recoge las capas de un modelo de gestión de las redes establecido por la Organización Internacional de Normalización, también conocida como ISO. FCAPS es una abreviatura de un modelo que recoge una serie de procesos de gestión de redes: Fault Management, Configuration Management, Accounting Management, Performance Management y Security Management.
En la siguiente gráfica viene explicado como funciona nuestro software de gestión de redes en el entorno de las FCAPS.
Profundizaremos más sobre este tema en otro artículo, pero, tenemos que saber que Network Fault Management forma parte de las FCAPS.
¿Cómo funciona nuestro software de gestión de redes en la parte de Fault Management?
Nuestro sistema NMS, en lo que respecta a la parte de Network Fault Management no sólo realiza las acciones básicas, sino también ofrece opciones avanzadas. Permite consolidar la información de gestión de fallas de los diferentes proveedores de tu red dispersos en diferentes sistemas, a la vez que, acelerar la identificación y resolución de problemas en redes de múltiples proveedores.
Para plantear un ejemplo, vamos a tomar de referencia el sector de las Utilities. Las Utilities prestan sus servicios por medio de varios fabricantes, cada uno con su Network Management System o NMS (Sistema de Gestión de Redes). Lo cual significa que para ver dónde está el problema a veces tienen que buscar dicha información en distintos NMS. SGRwin reemplaza a varios NMS y proporciona una visión consolidada, facilitando de este modo la resolución de problemas.
¿Todavía no tienes un sistema de gestión de redes que te permita localizar, controlar y subsanar los fallos producidos en la red? Conoce nuestro producto SGRwin, un sistema de gestión de redes que te permitirá realizar tus tareas de Fault Management alcanzando los máximos niveles de rendimiento y eficiencia.