Déploiement de la Supervision Système
Ce rôle déploie une infrastructure de supervision système complète incluant NRPE (Nagios Remote Plugin Executor), des scripts de supervision personnalisés et des plugins Centreon.
Vue d’ensemble
Ce rôle déploie une infrastructure de supervision système complète incluant NRPE (Nagios Remote Plugin Executor), des scripts de supervision personnalisés et des plugins Centreon. Il gère les configurations spécifiques aux hôtes pour les conteneurs Docker, l’hyperviseur Proxmox, le pare-feu OPNsense et le serveur de supervision Centreon. Le rôle installe les paquets, déploie des scripts de vérification personnalisés, configure le daemon NRPE avec les permissions appropriées et met en place des intégrations de services telles que Centreon Apache HTTPS et la planification du stockage Proxmox PBS.
Ce que fait ce rôle
Pour tous les hôtes supervisés
- Installe les paquets de supervision (NRPE, plugins Nagios)
- Configure NRPE pour écouter sur l’IP du VLAN12
- Définit les allowed_hosts pour autoriser le serveur Centreon
- Crée le répertoire
/etc/nrpe.d/pour les commandes spécifiques aux hôtes - Déploie des scripts de supervision personnalisés dans les répertoires appropriés
- Active et démarre le service NRPE
Pour l’hôte Docker
- Installe les paquets RedHat (nrpe, nagios-plugins, cpanminus)
- Déploie le script
check_docker.pyvers/usr/lib64/nagios/plugins/ - Déploie la configuration des commandes NRPE Docker vers
/etc/nrpe.d/docker_commands.cfg - Ajoute l’utilisateur nrpe au groupe docker pour l’accès aux conteneurs
- Redémarre le service NRPE pour appliquer les modifications
Commandes NRPE Docker :
check_docker_containers: Vérifie l’état des conteneurscheck_docker_uptime: Vérifie la durée de fonctionnement des conteneurs
Pour l’hôte Proxmox
- Installe les paquets Debian (monitoring-plugins, nagios-nrpe-server, cpanminus)
- Installe les modules Perl (Config::Tiny) via cpanm
- Déploie le script
check_temp.shvers/usr/lib/nagios/plugins/ - Déploie le script
check_smart.plvers/usr/lib/nagios/plugins/ - Déploie la configuration des commandes NRPE Proxmox vers
/etc/nrpe.d/proxmox_commands.cfg - Configure sudoers pour que l’utilisateur nagios puisse exécuter
smartctlsans mot de passe - Crée des scripts d’activation/désactivation PBS et des planifications cron
- Redémarre le service NRPE pour appliquer les modifications
Commandes NRPE Proxmox :
check_cpu_temp: Surveille la température CPUcheck_smart_sda: Vérifie l’état SMART de /dev/sdacheck_smart_sdb: Vérifie l’état SMART de /dev/sdbcheck_smart_sdc: Vérifie l’état SMART de /dev/sdc
Pour le serveur Centreon
- Installe le plugin NRPE Centreon (centreon-nrpe3-plugin)
- Déploie des scripts personnalisés Centreon vers
/usr/lib/centreon/plugins/ - Configure Apache pour HTTPS avec des certificats SSL
- Configure les paramètres PHP (session, mémoire, limites de temps, certificat CA)
- Désactive le module autoindex Apache (sécurité)
- Redémarre les services httpd et php-fpm
Pour le pare-feu OPNsense
- Déploie des scripts de supervision personnalisés vers
/usr/local/libexec/nagios/
Remarque : OPNsense utilise NRPE intégré ; le rôle déploie uniquement les scripts.
Variables du rôle
| Variable | Description |
|---|---|
deploy_system_monitoring_centreon_ip | IP du serveur Centreon (VLAN12) |
deploy_system_monitoring_docker_uptime_warning | Seuil d’avertissement pour la durée de fonctionnement des conteneurs Docker (secondes) |
deploy_system_monitoring_docker_uptime_critical | Seuil critique pour la durée de fonctionnement des conteneurs Docker (secondes) |
deploy_system_monitoring_proxmox_cpu_temp_warning | Seuil d’avertissement de température CPU (°C) |
deploy_system_monitoring_proxmox_cpu_temp_critical | Seuil critique de température CPU (°C) |
deploy_system_monitoring_proxmox_cpu_sensor | Identifiant du capteur CPU |
deploy_system_monitoring_proxmox_smart_disks | Liste des disques pour la supervision SMART |
deploy_system_monitoring_proxmox_pbs_storage_name | Nom du stockage PBS dans Proxmox |
deploy_system_monitoring_proxmox_pbs_enable_hour | Heure d’activation du stockage PBS (1h10) |
deploy_system_monitoring_proxmox_pbs_enable_minute | Minute d’activation du stockage PBS |
deploy_system_monitoring_proxmox_pbs_disable_hour | Heure de désactivation du stockage PBS (2h20) |
deploy_system_monitoring_proxmox_pbs_disable_minute | Minute de désactivation du stockage PBS |
deploy_system_monitoring_centreon_ssl_cert_path | Chemin du certificat SSL Centreon |
deploy_system_monitoring_centreon_ssl_key_path | Chemin de la clé SSL Centreon |
Notes
- Le rôle détecte automatiquement le type d’hôte depuis les groupes d’inventaire et applique la configuration appropriée
- NRPE écoute sur l’adresse IP du VLAN12 pour la communication avec Centreon sur le port 5666
- Les hôtes Proxmox nécessitent
lm-sensorsetsmartmontools(installés par le rôle) - La planification PBS crée des tâches cron pour activer/désactiver le stockage pendant et hors des fenêtres de sauvegarde.