Si la supervision des performances des applications critiques pour l'entreprise est incontestable, il en va de même pour la surveillance de l'état du matériel sur lequel ces applications s'exécutent. Souvent, les serveurs développent des problèmes critiques sans avertissement, ce qui entraîne des réparations matérielles coûteuses. Par conséquent, il est essentiel de garder un œil sur l'état et les performances du composant matériel de vos serveurs avec des outils de supervision de matériels robustes, afin de minimiser les temps d'arrêt des serveurs.
Le logiciel de surveillance du matériel d'Applications Manager contrôle de manière proactive les détails tels que la santé des processeurs, la défaillance de tout disque physique ou logique, les unités de refroidissement/ventilateurs et la tension actuelle, etc. pour les serveurs matériels (HP Proliant et Dell Power Edge) et les serveurs VMware ESX/ESXi, pour identifier les problèmes causés par un composant matériel défectueux.
Tout type de dégradation des performances matérielles du serveur est étroitement lié à l'état des paramètres suivants.
Alimentation électrique: Les tensions ou les puissances nominales en dehors de la plage autorisée peuvent endommager les composants électriques ou provoquer une panne du système. Surveillez les lectures de tension/puissance des serveurs avec notre solution de supervision du matériel pour vous assurer qu'ils sont dans la limite de fonctionnement sécuritaire.
Vitesse du ventilateur du processeur: Il est essentiel de vérifier le fonctionnement du ventilateur, pour détecter la surchauffe, due à des pics de température prolongés. Par exemple, si le ventilateur cesse de fonctionner, les composants du serveur seront gravement endommagés et il échouera.
Température: Dans les cas où la température augmente au-delà de la plage de fonctionnement, le processeur est grillé. Surveillez les températures au niveau du processeur du serveur ainsi qu'à l'entrée de la carte système avec le moniteur de performances matérielles d'Applications Manager, pour déterminer si les composants fonctionnent à une limite de sécurité.
Baie de stockage: Affichez les détails du disque (physique et logique) et assurez la disponibilité des données en détectant les pannes de disque ou les corruptions du système de fichiers avant qu'il ne devienne totalement irrécupérable.
Mémoire: Obtenez des statistiques sur le type et la taille des modules de mémoire installés. Détectez l'installation ou la configuration défectueuse/incorrecte des modules de mémoire avec notre moniteur de santé du matériel et corrigez-les.
Processeur: Notre outil de supervision des performances du matériel vous aide à afficher les détails de la configuration du processeur et à garantir le bon fonctionnement des processeurs en surveillant l'état (vitesse, nombre de cœurs, etc.) des périphériques de processeur.
L'outil de supervision du matériel d'Applications Manager vous permet de configurer des alarmes pour recevoir des alertes proactives lorsque les états des composants entrent dans ces catégories: échoué, erreur, non récupérable, avertissement, dégradé et critique, afin que des mesures correctives puissent être prises rapidement.