Notifications, graphiques et rapports
Notifications : stratégie et configuration
1. Stratégie de notification
Définition
Détecter les alertes, c’est bien. Les notifier, c’est mieux. L’objectif d’une stratégie de notification est d’alerter les bonnes personnes au bon moment et de la bonne manière.
Chaque changement d’état confirmé sur un hôte ou sur un service peut faire l’objet d’une notification. L’état oscillant (FLAPPING) ainsi que le fait d’être dans une période de temps d’arrêt programmé font partie des états éligibles aux notifications. Le retour dans un état nominal après un état d’erreur déclenche une notification appelée RECOVERY.
De larges possibilités sont offertes par Centreon pour la configuration des notifications : filtres, escalades, commandes personnalisées, dépendances, etc. Il s’agit de bien comprendre ces mécanismes et de mettre en œuvre une stratégie cohérente et maintenable (voir le chapitre Le projet de supervision pour une méthode basée sur les bonnes pratiques).
À propos des filtres
La sur-notification, comme la non-notification, est néfaste à une supervision efficace. Plusieurs mécanismes sont disponibles pour contrôler précisément les notifications souhaitées.
Tout d’abord, des filtres sur les périodes de notifications et les états notifiés sont disponibles au niveau des hôtes, des services, et également au niveau des contacts. Pour qu’une notification soit effectivement envoyée lors d’un changement d’état, les conditions suivantes doivent toutes être réunies :
-
L’état est confirmé (type hard).
-
La période de notification est valide pour l’hôte ou le service concerné.
-
L’état n’est pas filtré au niveau de l’hôte ou du service.
-
La période de notification du contact concorde.
-
L’état n’est pas filtré au niveau du contact.
Le deuxième moyen de limiter le nombre de notifications est de créer des liens de dépendance parents-enfants entre les hôtes et les services. En cas d’incident, les éléments...
Journaux d’évènements
Trois journaux d’évènements sont accessibles dans Centreon :
-
le journal des alertes issues de la supervision des ressources,
-
le journal des notifications,
-
le journal des évènements liés à la collecte des données.
1. Journaux d’évènements liés aux alertes et notifications
Les journaux d’évènements donnent des informations sur l’ordre d’arrivée des évènements, l’heure des notifications envoyées, des traps SNMP reçues, des changements d’état, etc. Ils sont utiles pour l’identification des sources d’incident et pour retracer précisément leur déroulement.
La configuration des évènements journalisés s’effectue globalement au niveau de l’ordonnanceur (cf. chapitre Ordonnanceurs et brokers) ou au niveau de la configuration des hôtes et services pour le mode stalking (cf. chapitre Configuration des ressources).
Interface
Pour consulter les journaux d’évènements :
Rendez-vous dans Supervision - Journaux d’évènements - Journaux d’évènements.
Plusieurs types de filtres sont disponibles pour afficher précisément les évènements recherchés.
La première partie de la barre de recherche permet de filtrer...
Graphiques de performance
1. Définition
Un graphique de performance est automatiquement généré pour chaque service qui remonte des données de performance (voir l’annexe Annexes - Développer ses sondes pour le format des données de performance générées par les sondes de supervision).
L’historique des données de performance est représenté par une courbe. Un même graphique peut contenir plusieurs courbes. Les graphiques peuvent par exemple représenter l’évolution de l’utilisation d’un espace disque sur une période donnée ou encore une consommation de bande passante.
Les graphiques de performance sont utilisés pour l’analyse graphique des historiques de données, par exemple pour détecter de manière visuelle la cause d’un incident ou encore visualiser l’impact d’un incident sur plusieurs données de performance à la fois. L’affichage de plusieurs graphiques l’un au-dessus de l’autre sur la même période temporelle facilite ce type d’analyse.
Les graphiques de performance sont également très utiles pour dégager des tendances sur des périodes plus ou moins grandes
a. Consultation et analyse
Un écran leur est consacré dans Centreon. Il est accessible via le menu Supervision - Informations de performance - Graphiques.
Cet écran est très similaire à l’écran de consultation des journaux d’évènements.
Pour rechercher un ou plusieurs graphes, choisissez d’abord l’hôte pour lequel vous souhaitez afficher les graphes dans le champ Filtrer par hôtes. Puis, dans le champ Graphiques, choisissez le graphe que vous souhaitez afficher.
Il est possible de sélectionner des services situés sur des hôtes différents. Les graphiques apparaissent alors alignés verticalement sur la même période temporelle, facilitant ainsi l’analyse de la performance des services sur la période indiquée.
À noter que les services ne remontant pas de données de performance...
Rapports standards de Centreon
L’analyse a posteriori de données compilées sur des périodes fixes est déterminante pour la détection des ressources régulièrement indisponibles.
Centreon propose une fonctionnalité de reporting en standard dans la solution capable de fournir des statistiques sur la répartition des états des ressources sur une période donnée.
Les rapports générés concernent un groupe d’hôtes, un hôte ou un groupe de services. Les périodes sont soit des périodes glissantes (exemple : les 30 derniers jours) ou des périodes définies qui se prêtent davantage à un reporting (exemple : le mois dernier).
Le côté manuel et instantané des rapports standards ainsi que leur format (HTML ou CSV) les cantonnent à une utilisation en reporting d’appoint uniquement. Pour une solution de reporting professionnelle hautement configurable et automatisable, voir le module Centreon MBI.
Interface
La construction et la visualisation des rapports standards de Centreon s’effectuent via le menu Rapports - Tableau de bord.
Rapport sur le groupe d’hôtes Infra web pour la période Les 30 précédents jours
La partie haute du rapport généré (diagramme en camembert et résumé par état) fournit des statistiques...