Différences
Ci-dessous, les différences entre deux révisions de la page.
| Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
| superviser_son_systeme_avec_monit [2023/12/05 22:28] – [Contrôles] superadmin | superviser_son_systeme_avec_monit [2024/05/26 10:10] (Version actuelle) – [État des disques] superadmin | ||
|---|---|---|---|
| Ligne 146: | Ligne 146: | ||
| Par exemple : « Si la charge CPU est supérieur à 90% alors on envoie une alerte » | Par exemple : « Si la charge CPU est supérieur à 90% alors on envoie une alerte » | ||
| - | Les services sont des ensemble | + | Les services sont des ensembles |
| - | ==== Déclaration d'un service | + | ==== Performances du système |
| - | Avant d' | + | < |
| - | + | ||
| - | ==== Contrôles ==== | + | |
| - | + | ||
| - | === Checks systèmes de base === | + | |
| - | + | ||
| - | < | + | |
| # | # | ||
| - | if loadavg (15min) > 4 then alert | + | IF loadavg (15min) > 4 THEN ALERT |
| # | # | ||
| - | if cpu usage (user) > 80% then alert | + | IF cpu usage (user) > 80% THEN ALERT |
| # | # | ||
| - | if memory usage > 90% then alert | + | IF memory usage > 90% THEN ALERT |
| # | # | ||
| - | if swap usage > 50% then alert</ | + | IF swap usage > 50% THEN ALERT</ |
| - | === Check des disques | + | ==== État du stockage ==== |
| - | Check simple de l'espace | + | === Condition physique d'un disque |
| - | < | + | Le tutoriel suivant permet de créer un script pour superviser l' |
| - | if space usage > 80% then alert | + | |
| + | [[https:// | ||
| + | |||
| + | === Espace disque restant === | ||
| + | |||
| + | Contrôle simple pour vérifier l' | ||
| + | |||
| + | < | ||
| + | IF space usage > 80% | ||
| + | THEN ALERT | ||
| </ | </ | ||
| - | === Check de fichiers/ | + | Il est recommandé d' |
| - | < | + | Le chemin doit être remplacé par celui vers l'UUID du disque en question : |
| - | if ... then alert</ | + | |
| + | < | ||
| + | |||
| + | < | ||
| + | IF space usage > 80% | ||
| + | THEN ALERT | ||
| </ | </ | ||
| + | |||
| + | ==== Test de fichiers/ | ||
| + | |||
| + | Tester l' | ||
| + | |||
| + | < | ||
| + | IF ... THEN ALERT</ | ||
| + | |||
| + | ==== État d'un hôte distant ==== | ||
| + | |||
| + | Vérifier qu'une machine est bien joignable (ici on teste le ping puis le SMTP, puis le SSH) : | ||
| + | |||
| + | < | ||
| + | IF FAILED icmp type echo count 3 with timeout 35 seconds THEN ALERT | ||
| + | IF FAILED port 25 protocol smtp with timeout 35 seconds THEN ALERT | ||
| + | IF FAILED port **** protocol ssh with timeout 35 seconds for 2 cycles THEN ALERT</ | ||
| + | |||
| + | ==== État d'un site web ==== | ||
| + | |||
| + | Ce contrôle permet de vérifier si un site web est bien accessible (ici en https port 443) : | ||
| + | |||
| + | < | ||
| + | IF FAILED | ||
| + | port 443 | ||
| + | protocol https | ||
| + | THEN ALERT | ||
| + | </ | ||
| + | |||
| + | ==== Utiliser un script ==== | ||
| + | |||
| + | Il est également possible de créer ses propres scripts de supervision en shell, de demander à Monit de les exécuter régulièrement et de réutiliser une valeur en sortie comme indicateur. | ||
| + | |||
| + | Exemple avec un script permettant de vérifier l' | ||
| + | |||
| + | < | ||
| + | every 120 cycles | ||
| + | if status != 1 then alert | ||
| + | group disks | ||
| + | </ | ||
| ===== Sources ===== | ===== Sources ===== | ||
| Ligne 187: | Ligne 234: | ||
| [[https:// | [[https:// | ||
| - | |||
| - | [[https:// | ||