[gull] Machine Check Exception ?

Yann Forget yann at forget-me.net
Mon Dec 10 11:54:13 CET 2007


Bonjour,

J'ai des plantages réguliers sur une machine AMD64 bi-Opteron 242 avec 4
x 1 Go de RAM que j'utilise comme station de travail.
Le message d'erreur est (par exemple, les adresses mémoires sont
différentes à chaque fois, et il apparait aussi avec 1 Bank 1) :

==
CPU1 - Machine Check Exception
4 Bank 4 : b64e2001000083
TSC 6f6d3c5879 ADDR f160f160

This is not a software problem. Run through mcelog --ascii
to decode and contact your hardware vendor.
Kernel panic. Not syncing.
==

Le problem est lié à l'utilisation de la mémoire, et contrairement à ce
que dit le message, ce n'est probablement pas un problème hardware.
La machine peut quelque fois tourner un mois sans problèmes, suivant
l'utilisation.

J'ai bien évidemment fait tourner Memtest86 plusieurs fois, dont une
fois 19 heures sans aucune erreur. J'ai aussi essayé d'intervertir les
barrettes : même comportement. A noter que je n'ai pas réussi à planter
la machine avec seulement 2 x 1 Go de RAM.

Avec certaines versions du kernel (compilé avec CONFIG_MK8=y), le
plantage est systématique lorsque l'utilisation de la mémoire dépasse
150 Ko à 500 Ko (juste après le boot donc, lorsque l'on lance une
application quelconque). Avec le kernel standard Debian (2.6.22-3-amd64
#1 SMP, CONFIG_GENERIC_CPU=y) le plantage est moins fréquent et plus
aléatoire. Je me demande si j'ai pas un bug du kernel.

J'ai testé plusieurs distributions : Gentoo, Debian 32 bits avec kernel
64 bits, Debian 64 bits, et Ubuntu 64 bits. Le problème se produit dans
tout les cas, sauf avec Debian 32 bits avec kernel 64 bits.

Je n'obtiens aucune information avec

mcelog --ascii
mcelog --ascii --k8
mcelog --ascii --generic

Toute idée et suggestion bienvenue !

Par avance, merci.

Yann
-- 
http://www.non-violence.org/ | Site collaboratif sur la non-violence
http://www.forget-me.net/ | Alternatives sur le Net
http://fr.wikisource.org/ | Bibliothèque libre
http://wikilivres.info | Documents libres



More information about the gull mailing list