RedHatES5で負荷がとんでもない状況に
先月導入したSunのIntelサーバにログインして作業。シェルはサクサク動作しているのですが、何気なくtopコマンドを実行すると、load averageが164。えーと? 32コアで164って。見たことがないくらいとんでもない数字。
psでチェックしてみると、crondから起動されているコマンドがとってもたくさん。かたっぱしからkillするもののload aveは下がりません。
再度psでチェックしてみるとこんなコマンドがkill -9でも死なないで残っています。
cat /sys/hypervisor/uuid
なんだこりゃ?
/sys/hypervisor/uuid CPUとかとかでGoogle先生に聞いてみると、Xenのバグらしい。どうやらcron.houlyにあるmcelog.cronが終わらないでずーっといつづけている模様。
カーネルパッチをあてればいいようなんだけど、ちょっと怖いのでmcelog.cronを書き換え。
#!/bin/bash exit 1; #if [ -e /proc/xen ] && [ `cat /sys/hypervisor/uuid` != "00000000-0000-0000-0000-000000000000" ]; then # # this is a PV Xen guest. Do not run mcelog. # exit 1; #else # /usr/sbin/mcelog --ignorenodev --filter >> /var/log/mcelog #fi
もともとのスクリプトを全部コメントアウトして、exitするだけに変更。なにかログだしているだけだから問題ない。。。と思う。