Si vous utilisez un VPS ou un serveur dédié, la stabilité du disque n’est pas facultative – elle est essentielle. Un seul disque défaillant peut entraîner la perte de données, des temps d’arrêt et une récupération coûteuse. C’est pourquoi les administrateurs de systèmes Linux s’appuient sur smartctl, un puissant outil de ligne de commande qui vous donne un accès direct aux diagnostics des disques via S.M.A.R.T.

Ce guide vous accompagne dans l’utilisation de smartctl sous Linux, avec des commandes pratiques, des exemples concrets et une automatisation intelligente.

Qu’est-ce que smartctl ?

smartctl fait partie du paquet Smartmontools. Il permet d’accéder à la technologie S.M.A.R.T. (Self-Monitoring, Analysis and Reporting Technology), intégrée dans la plupart des disques durs et des disques SSD modernes.

Avec smartctl, vous pouvez :

  • Vérifier l’état de santé du disque
  • Exécuter des autotests courts ou longs
  • Visualiser les mesures de température et de performance
  • Détecter les premiers signes de défaillance du matériel

Le matériel pris en charge comprend

  • Disques SATA / IDE / SCSI / NVMe
  • SSD et HDD
  • La plupart des distributions de serveurs Linux et des plateformes d’hébergement

Pourquoi utiliser smartctl ?

AvantageAvantages
Détection précoce des défaillancesPrévenir la perte de données avant qu’elle ne se produise
Diagnostic en temps réelSurveillez vos disques sans redémarrer
Automatisation facileFonctionne bien avec les cron, les scripts et les alertes
Visibilité au niveau du matérielPas d’approximation – obtenez des données brutes du lecteur
Convivialité DevOps et sysadminLargement utilisé dans les centres de données et les serveurs en nuage

Comment installer Smartmontools

L’installation dépend de votre distribution Linux :

OSCommande d’installation
Ubuntu/Debiansudo apt update && sudo apt install smartmontools
CentOS/RHELsudo yum install smartmontools
Fedorasudo dnf install smartmontools
Arch Linuxsudo pacman -S smartmontools

Une fois installée, la commande smartctl est disponible dans le terminal.

Commandes essentielles de smartctl

CommandeCe qu’elle fait
smartctl -i /dev/sdaAffiche les informations sur le lecteur
smartctl -H /dev/sdaVérifie l’état de santé général
smartctl -A /dev/sdaListe les attributs S.M.A.R.T. détaillés
smartctl -t short /dev/sdaLance un autotest court (2 minutes)
smartctl -t long /dev/sdaLance un autotest complet et étendu (10-60 min)
smartctl -l selftest /dev/sdaAffiche l’historique des tests
smartctl -l error /dev/sdaAffiche les journaux d’erreurs

📌 Remplacez /dev/sda par votre lecteur actuel (par exemple, /dev/nvme0n1 pour les disques SSD NVMe).

Exemple : Vérification de la santé du lecteur

sudo smartctl -H /dev/sda

Résultat attendu :

Résultat du test SMART d'auto-évaluation de la santé globale : PASSÉ

Si le résultat est PASSED, votre disque est actuellement sain.
Si le résultat est FAILED, sauvegardez immédiatement et prévoyez un remplacement.

Principaux attributs SMART à surveiller

IDAttributSignification
5Nombre de secteurs réallouésSecteurs défectueux réaffectés pour réserver de l’espace
197Nombre de secteurs en attenteSecteurs en attente de relecture
198Nombre de secteurs non corrigés hors ligneSecteurs présentant des erreurs de lecture/écriture
194Température (Celsius)Maintenir à une température inférieure à 50 °C pour des performances optimales

Une valeur croissante dans ces champs = dégradation du lecteur en cours.

Calendrier de surveillance recommandé

TâcheFréquence
-Contrôle de santé HSemaine
Test court (-t court)Hebdomadaire
Test long (-t long)Mensuel
Examen du journal des erreursAprès un crash ou un problème d’E/S
Surveillance de la températureConstante (via des scripts)

Automatiser avec Cron

Exemple : un rapport hebdomadaire par courrier électronique sur l’état du disque

0 3 * * 1 smartctl -H /dev/sda | mail -s "Rapport de santé SMART" you@example.com

📌 Assurez-vous que mailutils ou sendmail est installé.

Conclusion

smartctl est un outil léger mais puissant qu’aucun administrateur système ne devrait négliger. Grâce à lui, vous pouvez garder vos serveurs en bonne santé, vos données en sécurité et votre infrastructure proactive.