vine-users ML アーカイブ



[vine-users:063974] サーバーハング .. こんなことってありますか?

  • From: Yoneda <mrtksb@xxxxxxx>
  • Subject: [vine-users:063974] サーバーハング .. こんなことってありますか?
  • Date: Fri, 16 Jan 2004 11:55:34 +0900
はじめまして、サーバー公開歴3ヶ月のVine初心者です。
長文で申し訳ありませんが、全く心当たりのない状況に陥り、皆様のお知恵をお借りいたしたくメールをさせていただきました。どうかよろしくお願いいたします。

先日のことですが、いきなり次のような症状に陥り、Webサービスが停止となってしまいました。

●外部(インターネット)→サーバー
・sshd...応答なし(TeraTremからですと、5分以上何のメッセージも出ない)
・ping(応答なし)...ルーターでステルス設定にしてるので当然ですが^^;
・WEB...ページ表示不可。(5分以上何のメッセージも出ない場合と「ページが表示されません」と表示される場合がある)
・メール(APOP)...タイムアウトで接続を拒否されたというメッセージが出る
・abuseでメールサーバーチェックをすると、タイムアウトのメッセージ

●LAN内のクライアント→サーバー
・pingは正常に応答あり→サーバーは生きているということですよね?
・FTP、sshd、WEBとも5分以上何のメッセージも出ない
※Seagate?のScanでチェックをすると、25,80,110などのポートはきちんと空いている。

●コンソール操作(サーバー機での直接操作)
・キーボード操作を一切受け付けない→モニターにはきちんとつながってます。省電力設定にしてありますが、通常であれば、キーボード・マウスを触ればモニターにログインプロンプトが表示されますが、何をしても表示されない・・これが一番のなぞです。


●しょうがないのでしたこと
・ためしにルーターを再起動(時間を置いて2回)→2回とも改善なく、症状同じ。
・このため、どうしようもなく、強制的にサーバー機をリセットボタンでリブートすると何事もなかったように、正常に起動し、すべてのサービスが正常どおり復帰。

●再起動後いろいろ調べた自分なりの検証結果
・messages,named,apache,mail,router,snortなどの考えられるすべてログを調べたところ、サーバー機を再起動する前の最後の記録は、外部からのAPOP接続(私自身がアクセス)であり、その後の、一切の送受信はない。(ダウン前〜再起動までの間、ネットワークで動いていたクライアント機はありません)。このほかにも、怪しげなアクセスは
  なし。
・ダウン前の最後のアクセスは11:05だったが、この前後に、サーバー機自身で起動されるプログラムはMRTGの情報書き出しくらい。
・MRTGの記録のサーバートラフィックでは、ダウン中の送受信は一切なし。その前も特に怪しいところはない。
・MRTGのCPUロードでは、通常10%前後のところ、ダウン中はずっと20%で推移していた(サーバー機自身は生きていることの証明)
・/var/spool/mail/.(ユーザー名).pop というファイルが生成されていて、サーバー機起動後もこのユーザー名だけは、APOP接続を拒絶された。このファイルを削除したところ、正常にAPOP接続ができるようになった。エラーメッセージは次のとおり。
・Jan 15 22:44:06 *** in.qpopper[***]: username at server.domain (192.168.111.111): -ERR [SYS/PERM] Unable to process From lines (envelopes), change recognition modes or check for corrupted mail drop.

●質問
・/var/spool/mail/.(ユーザー名).pop は、このユーザへのメールが途中まではいっているテキストファイルみたいで、これって何のファイルか、ご存知の方、よろしくお願いします。(ロックファイルか何か?)
・気になるのは、このユーザー名(私自身ですが)は、外部から10分ごとにAPOPでメールを取り出すように設定しているのですが、メールの取り出しと配信とのタイミングにより、生成されることがあるんでしょうか?。
・このファイルができることで、サーバー機が停止してしまうなんていうことがあるんでしょうか?
・ほかにサーバー機が停止(外部からも内部からもコンソールからも操作できなくなる)で想定されることってあるでしょうか?
・今まで、ルーターが一時的に死んで、アクセスできなくなることは過去1度だけありましたが、ルーター交換後は順調に動いていただけに、今回は、打つ手が全くなく、本当に困りました。自分なりにも調べましたが、どうかよろしくお願いします。


参考までに環境は以下のとおりです。
●構成
インターネット〜ルーター〜サーバー
            〜クライアント
LAN内では、サーバーをDNSサーバーとして使用してます。

●サーバー概要
VineLinux kernel-2.4.22-0vl2.10(ダウン前日の夜カーネルアップグレードを実施し、再起動)apt-getで最新状態をキープしております。
PenIII166MB+RAM96MB+HDD6GB
httpd(外部公開)
postfix(外部公開、リレーはLAN内のみ)
sshd(外部公開)
proftpd(LAN内のみ)
named(LAN内のみ)
その他監視用にsnortを常駐、MRTG、analog,tripwireをcronで実行
※もちろんルーターも上記設定に併せて、適切に設定されています。
※cronで5分毎にMRTGの情報書き出しを実施、1時間おきにanalog、24時間ごとにtripwireを実施

-- 
T.Yoneda <mrtksb@xxxxxxx>