昨日発生したサーバ障害。きっかけはサーバ室の空調不具合による室温上昇みたいなんですが、おなじラックに収まっている同一メーカの機器(機種は違う)には障害が発生していないのでどうやらハードウェア的にどこかがイカれたのかなと。
しかしハードウェアベンダに送付したログを解析してもらったところ、ファームウェアのバグで、ファンの回転数が0に固定されてしまったとか。
手動でファンの回転数を一度リセットして電源投入。一旦サービスはあがったもののやっぱり夜にダウンしてしまいました。
それにしても金曜日の夜にダウンするとか、そんなに最悪なタイミングでおちなくてもいいのに。