RedHatES5で負荷がとんでもない状況に

先月導入したSunのIntelサーバにログインして作業。シェルはサクサク動作しているのですが、何気なくtopコマンドを実行すると、load averageが164。えーと? 32コアで164って。見たことがないくらいとんでもない数字。

psでチェックしてみると、crondから起動されているコマンドがとってもたくさん。かたっぱしからkillするもののload aveは下がりません。

再度psでチェックしてみるとこんなコマンドがkill -9でも死なないで残っています。

cat /sys/hypervisor/uuid

なんだこりゃ?
/sys/hypervisor/uuid CPUとかとかでGoogle先生に聞いてみると、Xenのバグらしい。どうやらcron.houlyにあるmcelog.cronが終わらないでずーっといつづけている模様。
カーネルパッチをあてればいいようなんだけど、ちょっと怖いのでmcelog.cronを書き換え。

#!/bin/bash

exit 1;
#if [ -e /proc/xen ] && [ `cat /sys/hypervisor/uuid` != "00000000-0000-0000-0000-000000000000" ]; then
#       # this is a PV Xen guest.  Do not run mcelog.
#       exit 1;
#else
#       /usr/sbin/mcelog --ignorenodev --filter >> /var/log/mcelog
#fi

もともとのスクリプトを全部コメントアウトして、exitするだけに変更。なにかログだしているだけだから問題ない。。。と思う。