Pour reprendre une citation de Samul Smiles, mon approche en monitoring peut se résumer par « Un check pour chaque chose et toutes choses checkées« , et ce surtout s’il s’agit d’un contrôleur raid sur un serveur ESXi. Le script original check_esx_wbem.py publié par David Legeret, ne permettait pas d’identifier les erreurs sur le contrôleur raid sur les serveur HP, ainsi j’ai adapté le script original pour en faire un qui surveille spécifiquement le contrôleur raid en utilisant le support WBEM d’HP sous ESXi.
Output :
WARNING : Logical Volume 0 (RAID 5) - Logical Disk is degraded
Le script est disponible à l’adresse suivante : check_esxi_hpraid_wbem.py
define command{ command_name check_esxi_hpraid command_line $USER1$/check_esxi_hpraid_wbem.py https://$HOSTADDRESS$:5989 USER PASSWORD }
Conseil sécurité : Toujours utiliser un utilisateur dédié au monitoring… pas root ! et utilisez les variables $USER$ de nagios pour enregistrer le mot de passe (pour ainsi le masquer de l’interface Web)