[Toulibre] Surveiller l'état des disques durs

Jérôme jerome at jolimont.fr
Lun 15 Juin 22:15:29 CEST 2015


Le Mon, 15 Jun 2015 19:30:58 +0200,
Aymeric <mulx at aplu.fr> a écrit :

> Salut,

Bonsoir.

Merci pour les réponses. Je réponds point par point.
 
> Il faut aussi s'avoir lire les états S.M.A.R.T....

Oui, rien que ça, c'est pas trivial... Je suis bien content que tu te
proposes de regarder le mien.

> Tu peux poster le logs que tu as avec ?
> smartctl -a /dev/sda
> (si sda est bien ton disque douteux).

Le voici en PJ.

Ces deux lignes sont les résultats des tests d'hier, donc depuis
l'incident :

# 1  Extended offline    Completed without error 00% 10273 - 
# 2  Short offline       Completed without error 00% 10270 -

> Tu as peut être des secteurs défectueux en pending, si il y a de la
> place en réserve il faut récrire dessus pour que S.M.A.R.T. fasse la
> ré-allocation (et si il y a des secteurs défectueux, selon historique
> du disque, je te recommande de faire un effacement complet destructif)

Hmmm.... ? Je sais pas. Tu le vois dans mon log ?

> Tu peux aussi lancer l'execution d'un test de surface via S.M.A.R.T.,
> je te recommande de passer le livecd UltimateBootCD et d'executer le
> check via l'outil constructeur (ou celui de seagate si il n'y a pas).

OK, je note ça.
 
> Le RAID par mdadm (je ne connais pas les capacités RAID de lvm)
> execute un check régulièrement (en tout cas sur debian).
> Le test est lancé par crontab une fois par mois via (source
> /etc/cron.d/mdadm)
> /usr/share/mdadm/checkarray --all
> Le comportement de MDADM si est disque n'est pas conforme c'est de le
> retirer du groupe, ce qui génère une alerte visible dans /proc/mdadm
> ou via mdadm. Comme dit ailleurs tu peux catcher ces alertes pour
> recevoir un mail.
> 
> Du RAID avec btrfs il faut exécuter un scrub régulièrement, je ne sais
> pas si c'est passer dans cron ou pas.
> 
> Les autres FS qui font du RAID (ZFS), je ne sais pas.

Par défaut, je pense utiliser du ext4. Et debian.

> > -> Est-il possible de dialoguer avec un RAID logiciel pour avoir des
> > alertes liées à la couche RAID, autres que celles de smartmontools
> > qui sont au niveau disque ?
> 
> Si tu as RAID logiciel tu peux toujours interroger tes disques dur
> directement par smartctl.

Oui, et sur le serveur du boulot, j'y arrive aussi grâce à la bonne
option. Mais justement, ma question portait sur la possibilité d'avoir
un statut du RAID, pas de chaque disque. En raid logiciel, mdadm écrit
dans /proc/mdadm, tu viens de l'écrire, donc là c'est bon. Mais sur le
serveur du boulot, je ne sais pas parler au contrôleur de RAID matériel.

Mais peut-être que c'est pas intéressant. Si la seule chose que le RAID
est capable de dire c'est qu'il a enlevé un disque qui marchait plus,
SMART doit pouvoir le remonter aussi s'il n'a plus accès au disque.

> > J'ai laissé les vérifs par défaut au démarrage tous les N montages,
> > ou après indicent. Peut-être que cette vérif est une alternative à
> > smartmontools, en tout cas pour une machine perso qui redémarre
> > régulièrement.
> 
> Ça vérifie la cohérence du FS, objectivement il y a peu de change que
> ça remonte une erreur mais ça ne coûte que quelques minutes au
> démarrage une fois tous les x jours.

Oui, chez moi c'est rapide, ça me pose pas de pb.
 
> Dans tous les cas, tu as des backups ? :-)

Ben non, comme tout le monde... Enfin si, des vieilles de l'époque ou
je prenais le temps.

Mais je m'y attelle de ce pas.

Sur ma liste de bonnes intentions, il y a la mise en place du RAID, et
j'aimerais bien aussi mettre en place des sauvegardes croisées avec un
copain qui habite très loin. Ainsi, si une météorite explose tout le
sud-ouest, j'aurai pas tout perdu.

Au passage, j'ai acheté l'ordi d'occasion, c'est un Dell XPS 630 et le
disque c'est un Hitachi Deskstar.

http://www.tomshardware.com/reviews/hitachi-western-digital-terabyte,2017-2.html

Je pense que l'ensemble doit dater de 2008, ce qui ne nous rajeunit pas.

La machine a un contrôleur RAID matériel mais je préfère faire du RAID
logiciel au cas où la carte mère rende l'âme. Il manquerait plus que
ça.

J'hésitais entre 2 disques en RAID 1 et trois en RAID 5 (doubler le
volume pour +50% de coût seulement) mais à la réflexion, c'est
peut-être aussi bien RAID 1 pour moi car s'il arrive quoi que ce soit
au système, je peux toujours lire chaque disque indépendamment.

C'est une question annexe, mais tant que j'y suis, je veux bien
confirmation qu'en RAID 1, je peux démonter un disque et le lire
ailleurs et je peux utiliser un live-cd pour lire son contenu, alors
qu'en RAID 5, j'ai besoin d'avoir le système lancé avec mdadm et le
RAID complet (en tout cas deux disques) pour que ça marche. Et si je
démonte deux disques, j'ai pas un accès trivial à la donnée. Si j'ai
bien compris, alors autant partir sur du RAID 1. Le mieux est l'ennemi
du bien.

Merci encore à tou(te)s.

Bonne soirée.

-- 
Jérôme
-------------- section suivante --------------
Une pièce jointe autre que texte a été nettoyée...
Nom: log_smart
Type: application/octet-stream
Taille: 9872 octets
Desc: non disponible
URL: <http://toulibre.org/pipermail/toulouse-ll/attachments/20150615/4ff277be/attachment.obj>


Plus d'informations sur la liste de diffusion Toulouse-ll