RedhatLinuxのNFSは使えない

RedhatLinuxEnterprise5をインストールしたX4450。OSをインストールしたのは4日の午前3時ごろ。そこから昨日の17時までなんと4回もストール。しかし昨日7日の17時ごろに起きた現象は私がコンソールで作業している最中に発生し、それですこし糸口が見えました。

どういう操作をしていたかというと

過去にも書いていますが、うちのウェブはZopeで動作しています。でもって、こう不安定なのでData.fsを一旦NAS上へ配置して、別の複数の機械からData.fsを参照できるようにしようとしました。いったんNAS鯖上のディスクを/mntへマウント。

# mount nas:/export/nas/data /mnt

それでData.fsをコピー

# cp /usr/local/zope/var/Data/fs /mnt

っと、ここでフリーズしました。

NFSが怪しい

ってことでNFSを容疑者として確保。Data.fsは7G近い容量があるのですが、そういうでかいファイルをやりとりするとダメらしいです。そういえば、落ちたときには大容量のログファイル解析なんかもやってたな。ログの置き場所もNASサーバ上だったんです。

NFSを排除

容疑者が確定したので、NFSマウントしているポジションを全部外してローカルディスクだけを参照するように。しかし複数のサーバで可動させている環境でNFSが使えないのは痛い。いたすぎる。NFSなんて本当に普通の機能なんだけど、こんな大きな落とし穴があるなんて。なんか普通に車を運転していて、ウィンカーを出したら大破したってな感じです。引き続きサポートには解析を依頼。ちなみにFedoreCore9で作った環境から7GのData.fsを参照して読み書きしてもまったく平気でした。エラーを吐いてファイルIOに不具合がでるとかじゃなくて、フリーズしてしまうって、どんな腐れOSじゃい。

Xenの環境

で、OSを再インストールする前のXen環境で発生していたethのエラーや、swapが激しい件は引き続き別マシンでは発生中。メーカに検証を依頼していますが、どうやら完全仮想化ではメモリの消費が激しいらしく、64GBも積んだ該当機器でさえダメらしい。まだまだ仮想化技術をエンタープライズ用途で使うには早かったみたいです。

とりあえずは

冗長化はされてないとはいえ、一応安定して動作する環境が手に入ったので対応にも余裕がでるってものです。先週は本当にひとごごちがしませんでした。それにしても三カ月動作して、古い環境を撤去した途端にこんな現象がでるって。あぁそうか、撤去されたSparcサーバの呪いだな。すみません。もうIAサーバは二度と使いません(藁