
仕事でサーバを作ることになり、遊び程度で構築したことはあるのですが、お金を貰ってやるのははじめてでしたが、なんとか構築してテスト中でした。
しかし、突然フリーズして全てのアクセスができなくなりました。
リモートでもログインできなくなり、本体から直接ログインして再起動しその後は今のところ通常通りに動いています。
とりあえず、/var/logにあるログを片っ端から見たのですが原因になりそうなログが見当たりませんでした。
わかったのはフリーズした時間のみです。
/var/log以外に見るべきところ、確認すべきところを教えてください。
以下システム概要
OS:CentOS4.6
kernel: 2.6.9-67.0.7
Webサーバ:Apache
POPサーバ:dovecot
SMTPサーバ:postfix
データベース:PostgreSQL
以上、よろしくお願いします。
No.2ベストアンサー
- 回答日時:
そうですか。
crontabに書いてある処理が止まったことで停止時刻がわかったのですね。知りたかったのは、フリーズしたように見えても実はそれはリモートだけで、本体のコンソールからなら操作することができるのかどうかということでした。
コンソールからログインして何かとコマンドを打つことができるのならいろいろと調べようがあります。しかし、それができないとするとやや手探りで調べることになりますね。
手探りで調べるとして、cron jobでもshell scriptでもいいのですが定期的(cronなら1分ごと、shell scriptなら10秒ごととか細かめの時間)でtopコマンドやpsコマンドの出力をログに残すように仕掛けておいて現象の発生を待ってみてはどうでしょう。uptimeや/proc/meminfoとかの内容も役に立つかもしれません。
フリーズする前に何かのプロセスが異常に増えているとか、何かのプロセスのcpu timeが異常に増えているとか、そういった現象をつかめたら原因を追いやすくなります。
dummyplug様
返事が遅くなってすみません。
現地の担当者に聴取したところ、本体のコンソールも反応しなかったみたいで、電源を強制的に落として再起動したそうです。
あとは現象の発生を監視しつつ、ご指摘の方法などで様子を見ようと思います。
dummyplug殿には丁寧なご説明をいただき、ありがとうございました。
No.1
- 回答日時:
それは弱りましたね。
フリーズする原因は千差万別なのでここを見れば全てがわかるというわけにはなかなか行きません。
とりあえず何をしているときに発生するのかを知りたいところです。いくつかのサービスを動かしているようですので止められるものは止めて一つずつ動かしてテスト・確認するとかも有効でしょう。
ディスクがあふれているとかメモリが足りないとかそういうことはないですよね。
あと、気になるのは「本体から直接ログインして再起動」というあたりです。リモートから使えないだけで本体では普通に使えるのであればそれはフリーズではなくて単にネットワーク周りのトラブルかもしれません。
となると症状が発生しているときにもいろいろ調べられますし、対処方法は全く変わってくると思います。
dummyplug様
ご回答ありがとうございます。
>フリーズする原因は千差万別なのでここを見れば全てがわかるというわけにはなかなか行きません。
>とりあえず何をしているときに発生するのかを知りたいところです。いくつかのサービスを動かしているようですので止められるものは止めて一つずつ動かしてテスト・確認するとかも有効でしょう。
そうですね。
いままで、Windowsの仕事はいろいろやったことはあったのですが、Linuxについてはほとんど手探り状態でWindowsのようにはなかなかいかないものです。
>ディスクがあふれているとかメモリが足りないとかそういうことはないですよね。
はい。これに関しては問題ないです。某外国メーカーのサーバ専用マシンで、ヨダレが止まらないくらいのスペックです。
>あと、気になるのは「本体から直接ログインして再起動」というあたりです。リモートから使えないだけで本体では普通に使えるのであればそれはフリーズではなくて単にネットワーク周りのトラブルかもしれません。
実は、止まった時間が分かった理由はcrontabに定期的に動作するように設定していたスクリプトが途中で止まってログに出ていなかったからなのです。
ご指摘のネットワーク関連も調べようと思います。
貴重なお時間いただき、ありがとうございました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
freeとpsでメモリ使用量が違う?
-
topコマンドで表示されるVIRT、...
-
CPU 使用率について(ps,top,sar)
-
Swap領域が使用されてない
-
ps aux ps auxw psauxwwの違い
-
Dirコマンドでフォルダ内ファイ...
-
Linux環境 grepで改行コード(CR...
-
SONYの音楽ソフト「x-アプリ」...
-
ラズパイで『’test.service’をs...
-
シェルスクリプトでエラーが出ます
-
net use /d の強制実行
-
batである文字列内に特定の文字...
-
pingは正常なのにtracerouteで...
-
Linux のシェルスクリプトの強...
-
TOPコマンドで表示するCPU使用...
-
-bash: ftp: コマンドが見つか...
-
テキストファイルから最終行の抽出
-
至急です、Ubuntuに詳しい方助...
-
エクセルの表にヘンな枠が・・・
-
スクリプトのエラー「unexpecte...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
topコマンドで表示されるVIRT、...
-
ps aux ps auxw psauxwwの違い
-
CPU 使用率について(ps,top,sar)
-
freeとpsでメモリ使用量が違う?
-
Linuxのメモリの関して
-
linuxサーバーに詳しい方、教え...
-
qmailのパフォーマンス向上方法...
-
実行中のプロセス数をカウント...
-
FreeBSDでのCPU占有率とメモリ...
-
cpuやメモリのスペックを調べる...
-
manの検索ディレクトリ
-
コマンドが持つmanのセクション...
-
DNS(BIND)を起動できない
-
サーバーのメモリーの状態
-
Windows10をリフレッシュする方法
-
postaliasとpostmapコマンドに...
-
psコマンドの意味がわからない。
-
freeコマンドのfree,swapについて
-
クーロンのプロセスサイズが知...
-
AIXでシステム内の全プロセスメ...
おすすめ情報