予期せずサーバが停止した場合の原因究明方法
先日、サーバが予期せずに停止しました。
再発防止のために原因究明をおこないたいのですが、どのような方法がありますでしょうか?
また、原因としてどのようなものが考えられるでしょうか?
現象としては次のような状態です。
・サーバーから応答が帰ってこなくなった。pingを打っても反応なし。
・(ハードはデータセンターに預けてあるので)連絡して、ランプ確認をしてもらったところ、Powerランプは点滅状態(スタンバイ状態)、ステータスランプは消灯状態だった。
・この状態のまま、モニタ・キーボードを接続したが画面上にはなにも表示されなかった。
CDのイジェクトボタンを押したらトレイは出てきた。
・電源ボタンを長く押したところ、電源が切れた。
・再度電源を投入したところ、ディスプレイには起動メッセージが表示され、起動できた。
その起動の際に、sda5のパーテーションのinodeをクリアしているようなメッセージが表示された。
機器構成などは以下のとおりです。
サーバー:NEC Express5800/R120a-1
CPU:Xeon E5520 × 2(2CPU)
メモリ:4GB
内蔵ディスク:146.5GB × 2(RAID-1)
OS:Redhat Enterprise Server releaqse5.1
原因究明・対応のとっかかりでも教えていただければ幸いです。
No.1ベストアンサー
- 回答日時:
とっかかりとして。
・停止した時に誰かログインしていたか。何か作業をしていたかを確認。
・/var/log/以下のファイル(特にmessages)でその時間帯に何か記録されていないか確認する。(ハードウエアエラーとか、アタックの形跡とか)
・sda5がどこにマウントされるデバイスか知りませんが、HDDに何らかのエラーが出ていた可能性は濃厚です。RAIDユーティリティをインストールしていると思いますので、HDDエラーがないか確認する。Expressをお使いなら保守に入っているでしょうからサポートデスクに連絡、問い合わせる。HDD故障なら無償で交換できます。
・kernel panicなどOSのエラーが疑われる場合はRedHatに問い合わせる。
・coreファイルを探してみる
回答ありがとうございます。
1)ログイン&作業
停止時にログインしての作業はないはずです。サーバとしてのWebアプリの動作はおこなわれていました。
2)ログ
当日は13:40ごろ停止し14:30ごろ再起動したのですが、messagesを見たらその日のログは、再起動直後からしかログは残っていませんでした。
他には、cron、secure、Apacheのaccess.log、error.logなどを見てみましたが、停止時に通常時と違ったようなログは無いように見えました。
3)HDDエラー
・自分ではRAIDユーティリティーというものを余り意識していなく、インストールされているか否かがあいまいなのですが、後ほど確認してみます。
・保守については、正直なところNECのサポート体制がよく理解できず Club Express -> PPサポート と問い合わせして 蹴られたところです。(PPサポートは、Linux サービスセット Liteでの登録だったため、障害対応はダメとのことです。)
後ほど、ハード系の窓口に問い合わせしてみようと思います。
4)kernel panic
単語としては聞いたことがあるのですが、Linuxで実際に目の当たりにしたことがないので、パニックになったのかどうかが判断つきかねています。
5)core
findで検索をしてみたところ、再起動した時刻に「./dev/core」というものが作成されていたようです。coreについても、自分で対処したことがなくどのように扱ったものかわかりかねている状態です。
非常に参考になりました。
もし、この回答からなにか推測できることがあったら教えていただけると幸いです。
ありがとうございます。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- デスクトップパソコン PCの通電はするがモニタが黒い画面のまま何も表示はじまらない。 7 2023/01/10 09:36
- 電気・ガス・水道 瞬電について教えてください 6 2022/07/26 11:00
- ノートパソコン ThinkPad X1 Carbon 2015年モデル 起動しない 突然起動しなくなりました。 最初 4 2022/07/16 00:42
- docomo(ドコモ) XPERIA・10・Ⅱ・docomo 3 2023/08/14 18:13
- バッテリー・充電器・電池 パソコンの充電がおかしいです 8 2022/10/13 19:51
- デスクトップパソコン ゲーミングPCが起動しない場合のアドバイスをいただきたいです。 こんにちは。 本日、私の使用していた 4 2023/07/11 12:49
- Mac OS 【MacOS】外付けHDDがUSB3.1バス上でのみアクセス出来なくなる 1 2022/10/29 10:27
- ノートパソコン Dellのノートパソコン、画面が映らない 5 2023/08/09 22:26
- テレビ 東芝REGUZA 65M550Kテレビの電源がはいりません 2 2023/01/20 11:19
- Android(アンドロイド) Androidスマホを使っていますが、最近急に電源が落ち、その後Androidシステムが読み込めない 5 2023/06/02 10:32
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
WindowsのエクスプローラーでFT...
-
sims4についてです。 別のパソ...
-
エックスサーバーでhttpd.conf...
-
ネットワークの構成に困っています
-
ネットワーク内のDNSについて
-
別サーバに構築したApache+Tomc...
-
Windows Server 2019 CALについて
-
TERATERMだけSSH接続できない
-
Windows server 2022 CALとSQL ...
-
オンラインゲームなどプレイ時...
-
お名前ドットコムの共用サーバ...
-
ログオンユーザーがいない場合...
-
WIN10のファイル又はフォ...
-
サーバーマネージャーが消えた
-
保存したはずのエクセルファイ...
-
FTPサーバのポートを変更したら...
-
httpのサイトにアクセスされた...
-
gmileに他のアカウントを追加し...
-
discordで2人だけのサーバー作...
-
メールサーバーに送信元IPアド...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
sims4についてです。 別のパソ...
-
WindowsのエクスプローラーでFT...
-
エックスサーバーでhttpd.conf...
-
サーバ空きスペースの活用方法
-
サーバーマネージャーが消えた
-
Apache24起動時のエラー
-
Windows Server 2019 CALについて
-
Windows server 2022 CALとSQL ...
-
別サーバに構築したApache+Tomc...
-
TERATERMだけSSH接続できない
-
「内部サーバーエラー サーバー...
-
動画を公開してダウンロードさ...
-
discordで2人だけのサーバー作...
-
メールサーバーについて詳しい...
-
FTPサーバのポートを変更したら...
-
.htaccessで特定のディレクトリ...
-
接続・ログインはできているの...
-
Windows2019CALとRDS CALについて
-
検索サーバーのHDDなど通常どれ...
-
サーバーの定期シャットダウン...
おすすめ情報