[gull] systeme qui freeze

Marc SCHAEFER schaefer at alphanet.ch
Wed Jul 26 10:47:04 CEST 2006


On Wed, Jul 26, 2006 at 10:08:51AM +0200, Jose Ramon del Rio wrote:
> Ma station de travail à tendance à se freezer 2 à 3 fois par semaine sans aucune raison apparente  et ne répond plus.

En cas d'installation de matériel, voire de mise à jour du kernel, je
recommande la procédure suivante:

   - une nuit de test avec memtest86+

   - suivant l'importance des données, un test d'intégrité de données

        si la machine a x MB de mémoire
        faire, sur un jeu de données de 2 * x
           copier les données sur le même disque (ou d'un disque à l'autre)
           comparer

        le jeu de données idéal: mélange de données divers, certaines
        compressées, d'autres non

   - si l'on déploie du RAID1 ou autre, faire un test de reconstruction
     complet

        enlever disque 2
        écraser entièrement disque 2
        remettre disque 2
        reconstruire
        enlever disque 1
        écraser entièrement disque 1
        remettre disque 1
        reconstruire
        enlever disque 2

        comparer les données initiales avec celles présentes initialement (md5sum, etc)

        reconstruire
        fini

Si les tests précédents fonctionnent, on peut avoir une certaine confiance dans son
système.  Les crashes relevés sont alors probablement liés à des cartes spécifiques,
des pilotes propriétaires (p.ex. serveur X), etc. Il faut alors faire des tests
appropriés.

> - J'ai seulement acheté un proccesseur Intel et une nouvelle carte mère. J'ai installé une Kubuntu dapper. Au début pas de problème. Et puis le système à commencer à se freezer. A nouveau memtest ( tout un week-end) , pas de problème. Hier j'ai vu que xfsbufd prenait +90% du cpu. Après 5 minutes, j'ai décidé de rebooter car c'était impossible de travailler.

Donc vraisemblablement plus un problème disque/graphique/autre que CPU
ou mémoire.

Question: pourquoi utiliser xfs ?  avez-vous véritablement des besoins
si spécifiques qu'un ext3 standard ne vous suffirait pas ?

Il faut savoir que ext3 a une complexité beaucoup plus faible qu'xfs ou
reiserfs: sauf pour des applications très particulières il n'y a aucune
raison de déployer une telle complexité. Le gain en performance est
véritablement marginal et ne justifie pas la mise en danger de vos
données.

> Ce matin à nouveau le système était bloqué. Après le restart du systeème je suis allé voir le log et j'ai 59 erreurs :

et le log système (dmesg, /var/log/) ?

Peut-être c'est simplement votre disque-dur qui a trop chaud, fait des
erreurs I/O (cf dmesg) et xfs qui a de la peine avec.

Vous pouvez aussi installer les utilitaires smart-utils pour surveiller
le taux d'erreur et la température du disque.




More information about the gull mailing list