tobeitespecialis

04/09/2021

CONTROL: POR QUÉ ES IMPORTANTE



Muchos recordarán un anuncio de hace unos años: "El poder no es nada sin control". Esta máxima puede aplicarse también a las infraestructuras informáticas y Servicio de Monitorizacion de Cloud: no es raro tener sistemas potentes, con todos sus componentes redundantes y dotados de la mejor tecnología del mercado, que luego se ven mermados por un disco lleno en un servidor o un servicio que falla.
Para pintar un cuadro más completo de la situación, me gusta añadir otra máxima a aquella: "No puedes controlar lo que no conoces". Una afirmación que puede parecer trivial, pero que en realidad es a menudo el punto central de la cuestión: es absolutamente necesario, de hecho, cuando se diseña un sistema de control, tener una visibilidad de 360º de los sistemas implicados en los procesos y sus interacciones, precisamente para evitar que un solo servicio o parámetro fuera de control (normalmente aquel en el que nadie había pensado) bloquee la prestación de un servicio o, peor aún, desencadene el típico "efecto dominó", la prestación de varios servicios en cascada.
Incluso antes de decidir qué herramienta o técnica de control se va a adoptar, es fundamental identificar los sistemas y parámetros que se van a vigilar, determinando los umbrales de funcionamiento correcto, el método de cálculo de los parámetros y los métodos de señalización en caso de anomalías, intentando en la medida de lo posible no olvidar nada. De hecho, después de todo, la elección del sistema de supervisión no es tan crucial como se podría pensar: es mucho más importante saber qué comprobar y configurar las alertas para que estén dirigidas y limitadas a situaciones de anomalía reales, evitando así inundar al pobre personal de TI con numerosas y repetidas alertas que después de un tiempo ya ni siquiera se leen, dentro de las cuales se puede ocultar la única alerta realmente importante que necesita atención inmediata.
Dicho esto, entremos en un poco más de detalle.
Empezando por la "base", comenzamos por la capa de hardware: casi todos los sistemas están equipados con tarjetas de gestión capaces de enviar alertas en caso de problemas de hardware. Se trata de tarjetas que se encuentran en las placas base de los servidores (IMM en el caso de IBM, ILO en el de HP, iDRAC en el de Dell, etc.) y que, debidamente configuradas, son capaces de señalar de forma proactiva problemas relacionados con el funcionamiento de los componentes hardware del sistema, como ventiladores o fuentes de alimentación que no funcionan, módulos de memoria defectuosos, discos desconectados, etc.; existen herramientas similares en componentes como el almacenamiento, las unidades de cinta, los módulos UPS, los equipos de red, los sensores de control ambiental, etc.

04/09/2021 05:50 Enlace permanente. No hay comentarios. Comentar.

Bienvenido

Ya tienes weblog.

Para empezar a publicar artículos y administrar tu nueva bitácora:

  1. busca el enlace Administrar en esta misma página.
  2. Deberás introducir tu clave para poder acceder.

Una vez dentro podrás:

  • editar los artículos y comentarios (menú Artículos);
  • publicar un nuevo texto (Escribir nuevo);
  • modificar la apariencia y configurar tu bitácora (Opciones);
  • volver a esta página y ver el blog tal y como lo verán tus visitantes (Salir al blog).

Puedes eliminar este artículo (en Artículos > eliminar). Que lo disfrutes!

04/09/2021 05:44 Enlace permanente. No hay comentarios. Comentar.

| Blog ciudadano realizado con Blogia 2.0 | Suscríbete: RSS | Administrar