
社内のサーバで年2・3回の頻度で障害が発生しており、
その原因が特定できず、対応に困っております。
環境はHWが「PRIMERGY RX100」、OSが「Vine Linux 4.2」です。
サーバアプリとして「apache」、「bind」「squid」「sendmail」「ntpd」が稼動しています。
同様の構成のコールドスタンバイ機がありまして、メイン機とスタンバイ機ともに同じ障害が発生したことがあります。
症状は以下のとおりです。
(1)Pingコマンドに対する応答あり。
(2)sshによるリモート接続不可。
(3)KVMからの直接操作では、ログイン画面でキーボードから入力した文字は表示されるがEnterを押してもシェルからの応答がない。
(パスワード入力要求メッセージが出力されない)
(4)システムクロックに遅延が発生する。
(5)smartdが起動しており、一時間毎に状態をログに出力するよう設定を行っているが、それを含めた一切のログが出力されなくなる。
(6)NTPサーバを稼動させており、これと同期を取っているクライアントPCはサーバ障害発生時に(4)の影響でクロックが遅延する。
(7)障害復旧はマシンの電源ボタンで強制シャットダウンすることで対応していますが、過去に一度だけ再起動後にBIOSのRAID設定が消えていたことがあります。
会社のCE部門に尋ねても原因はわからないと言われてしまいました。
障害が発生する際にログ等の出力がないため、原因がハードにあるのかソフトにあるのか特定できず、今後の対応に困っております。
宜しくお願いいたします。
No.2ベストアンサー
- 回答日時:
ログも何も吐かれていなければ回答は不可能です。
とは言え、現場では何らかのアクションが必要ですものね。
#似たような経験があります
コアが吐かれていないのであればハードの可能性が高いはずです。
基本的にはメーカーコールをしてシステムチェックを行います。
運用に影響が出ると考えるならば部品を見込み交換しながら原因を特定するのが吉。
サーバー更新をするのが現場では一番ありがたいでしょうけど。
また、個人的意見ですがVineをミッションクリティカルなサーバーにすることに異論があります。
仕事で使用するのであれば保守サポートをつけることが望ましいと思いますが。
ありがとうございます。
ハードの保守契約は「なぜか」結んでいないのでメーカーコールするとなればスポットになると思います。
OSをLinuxに以外のモノに入れ替えてしばらく運用し、同様の障害が発生すれば「ハードの問題」、
逆に何事も起こらなければ「ソフトの問題」と、切り分けが可能です。
と上司に提案したのですが、
現時点では、大袈裟すぎる(工数が掛かりすぎる)との理由で却下されました。
結局は上司の指示により、現状ままでしばらく様子をみることに決定いたしました。
ありがとうございました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- その他(Microsoft Office) Office(Windows版,Word/Excel/PowerPoint等)にログインできません 4 2022/07/24 15:18
- 会社・職場 適応障害の職場復帰 はじめまして、私は26歳の社会人男です。 今の会社に入社後3ヶ月で適応障害を発症 6 2022/12/23 19:03
- 政治 新たな原発の建設を認めるなら、フランスのように原発は全て国有化するべきですね? 13 2022/09/04 06:14
- ガラケー・PHS SMSメールの受信遅延原因はガラケー自体の欠陥では 8 2022/08/06 11:46
- 発達障害・ダウン症・自閉症 知的障害者の20歳です。 優秀な親から犯罪者未満のような下劣な子供が産まれました。 私の両親は優秀で 1 2023/02/01 17:56
- 政治 南海トラフ地震が起きた場合、 関東地方、中部地方、中国地方、近畿地方、四国地方、九州地方の日本列島の 4 2022/07/03 00:39
- その他(ソフトウェア) Zoom 音が出ない 1 2023/02/11 11:00
- 発達障害・ダウン症・自閉症 発達障害持ちのアラサー女性です。 生きづらくて疲れました…。 発達障害と言っても、 ぱっと見普通に見 3 2023/03/20 14:37
- その他(趣味・アウトドア・車) Arudino nanoが正常に動作しない原因 1 2022/10/30 18:29
- モニター・ディスプレイ 長文です。デスクトップPCのHDMI入力機能について 4 2022/09/20 17:58
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
VLOG
-
TeraTermのログが正しく取得出...
-
パチスロAKB
-
ログとダンプの違いって・・・
-
自社サーバ内のページがネット...
-
AWSTATSのログ表示について
-
固定ではないはずなのにIPアド...
-
フォルダを移動した犯人は誰?
-
エラーコード500について
-
NTP時刻を知りたい
-
Linuxサーバが売っているサイト。
-
クロックの同期が取れずにネッ...
-
NTPで同期が始まらない
-
別のコンピュータ名でPINGを打...
-
BIOS時刻の確認方法について
-
日付と時刻を勝手に戻らせない...
-
Linux環境(wu-ftpd)でのft...
-
Symantec オフライン
-
アドレスの前にwwwの他にw...
-
Apacheのリバースプロキシ利用...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
フォルダを移動した犯人は誰?
-
TeraTermのログが正しく取得出...
-
IISのログに出力される「GET」...
-
ログとダンプの違いって・・・
-
外付けHDDへのアクセスログを取...
-
Cosminexusのログエージェント...
-
USBを刺した記録を消す方法
-
Webで重い処理をするとリクエス...
-
ユーザアカウント等の管理にお...
-
Winでいうイベントビューアって...
-
固定ではないはずなのにIPアド...
-
DISMのログを見る方法を教えて...
-
sendmailで遅延が発生したとき...
-
アクセスログ解析について
-
アクセスログを取る方法
-
「ハングアップ前に発生してい...
-
ルーターのアクセス制限ログに...
-
Apacheのログ206,304,404等につ...
-
LINUXサーバのSFTPのログ
-
イベントIDが529と680の失敗...
おすすめ情報