Linux自宅サーバを運用しておりますが、最近サーバダウンを繰り返し発生させており、対処としてHDD、メモリ、さらには本体(EPIAのEDEN)を交換したのですが、いまだサーバダウンが発生するため、苦慮しております。つきましては、下記ログを見て、原因がわかる方がいれば、ご教授ください。
自分としては、HDD交換を3度も行った上に本体も交換したのに発生する理由がわからず、ソフトの不具合かと思っておりますが、どのソフトが不具合の原因となっているのか皆目検討がつきません。
<スペック等>
VIA Esther processor 1200MHz
HDD:Hitachigstの160GB(SATA)
OS:FedoraCore9(Kernel 2.6.25)
Apache:2.2.9
PHP:4.4.7
Samba:3.2.0
<ログ:本ログ出力後にサーバダウンしている模様>
kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
kernel: ata1.00: BMDMA stat 0x25
kernel: ata1.00: cmd c8/00:80:80:ff:ff/00:00:00:00:00/ef tag 0 dma 65536 in
kernel: res 51/10:80:80:ff:ff/00:00:00:00:00/ef Emask 0x81 (invalid argument)
kernel: ata1.00: status: { DRDY ERR }
kernel: ata1.00: error: { IDNF }
kernel: ata1.00: configured for UDMA/133
kernel: sd 0:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE,SUGGEST_OK
kernel: sd 0:0:0:0: [sda] Sense Key : Aborted Command [current] [descriptor]
kernel: Descriptor sense data with sense descriptors (in hex):
kernel: 72 0b 14 00 00 00 00 0c 00 0a 80 00 00 00 00 00
kernel: 0f ff ff 80
kernel: sd 0:0:0:0: [sda] Add. Sense: Recorded entity not found
kernel: end_request: I/O error, dev sda, sector 268435328
kernel: ata1: EH complete
kernel: sd 0:0:0:0: [sda] 312581808 512-byte hardware sectors (160042 MB)
kernel: sd 0:0:0:0: [sda] Write Protect is off
kernel: sd 0:0:0:0: [sda] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
A 回答 (4件)
- 最新から表示
- 回答順に表示
No.4
- 回答日時:
突然の超オソレス すいません。
SWAPのエラーは消えたようなのでとりあえずはこの問題は解決してようですね。
kernel: [<c062750c>] rwsem_down_failed_common+0x13e/0x15a
kernel: [<c0627568>] rwsem_down_read_failed+0x1d/0x25
kernel: [<c06275eb>] call_rwsem_down_read_failed+0x7/0xc
が気になるエラーです。
搭載されているメモリ容量とdfコマンドで表示される /dev/shm の容量を補足ください。
搭載されているメモリ容量mysqlやoracleなどのデータベースアプリケーションでは不足すると
エラーで落ちます。
最近のPCではメモリを多くのせれるのでまず不足することは少ないのですが
mysqlの推奨設定値を満たしていないような気がします。
Perlのエラーはmysqlエラーにより派生的に発生しているように思えます。
この設定の変更方法のサイトを紹介しておきます。
参考URL:http://sato-si.at.webry.info/200711/article_1.html
この回答への補足
アドバイス、ありがとうございます。
早速確認した結果をお知らせします。
***
Filesystem 1K-ブロック 使用 使用可 使用% マウント位置
/dev/sda3 151717124 16458108 127552236 12% /
/dev/sda1 101086 11820 84047 13% /boot
tmpfs 484928 0 484928 0% /dev/shm
***
mysqlの推奨値は残念ながら確認できませんでした。(mysql --helpで確認したのですが・・・)
確認した結果を見ると、tmpfsが48Mというのは小さい気がしますが、どうでしょうか?
以上、よろしくお願いします。
No.3
- 回答日時:
An.2です。
[hda]の件は私の間違いでした。
本日RedHat4をSATA機にインストールしたところ[sda]となっていました。
それともう一点以降の記載はお忘れください。
失礼しました。
追記いただいた情報ですが
>デバイス Boot Start End Blocks Id System
>/dev/sda1 * 1 25 200781 83 Linux
>/dev/sda2 2619457 156087540 8e Linux LVM
LVMパーティションを作成されその中にSWAPとルートを設定されていると思われます。
「root_lv(/)」と「swap_lv(swap)」
SWAPがうまく設定できていない可能性があるのではと思います。
論理ボリュームLVMを使用するメリットはいろいろとあるのですが
一度LVMは使用せずに従来からよく使われている割当方法
sda1 * 1 /boot 100M 割当
sda2 swap 搭載メモリに合わせて 1Gから2G程度
sda3 / rootの割当で残り全て
用途によりsda4 に /optに割り振るなどしています。
WEB用途やSanbaでは ほぼsda3までの構成にしておりました。
過去に大手ベンダーに構築させた内容も同様になっていることから
今一度上記のような構成で考えなおされてはいかがでしょうか。
この回答への補足
アドバイスいただいたとおり、パーティションを以下のようにして、運用していたところ、またもサーバダウンしました。再度のお願いで恐縮ですが、何かわかればアドバイスをお願いします。
/dev/sda1 * 1 25 200781 83 Linux
/dev/sda2 26 280 2048287+ 82 Linux swap / Solaris
/dev/sda3 281 19457 154039252+ 83 Linux
以下、ログです。
最初はmysqlに関するメッセージが出力され、
kernel: INFO: task mysqld:5308 blocked for more than 120 seconds.
kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
kernel: mysqld D c078d23c 0 5308 5290
kernel: f7237dfc 00000086 091280d2 c078d23c c0790280 c0790280 c0790280 f6ed8e70
kernel: f6ed90b8 c178b280 00000000 c178b280 66d3bebe 0000b12d b1f27614 f6ed90b8
kernel: f6e48700 00000c9c f6fb2b1c 00000000 000f41a9 0000b12a c874c6b7 00000002
kernel: Call Trace:
kernel: [<c062750c>] rwsem_down_failed_common+0x13e/0x15a
kernel: [<c0627568>] rwsem_down_read_failed+0x1d/0x25
kernel: [<c06275eb>] call_rwsem_down_read_failed+0x7/0xc
kernel: [<c0626bc2>] ? down_read+0x26/0x29
kernel: [<c06292ee>] do_page_fault+0x29d/0x6eb
kernel: [<c0420669>] ? __wake_up+0x31/0x3b
kernel: [<c04f50c7>] ? copy_to_user+0x3b/0x10a
kernel: [<c05acc89>] ? move_addr_to_user+0x56/0x6e
kernel: [<c05acfd1>] ? sys_getsockname+0x6b/0x76
kernel: [<c041c9bb>] ? __dequeue_entity+0x73/0x7b
kernel: [<c04046c7>] ? __switch_to+0xcc/0x14c
kernel: [<c042316d>] ? hrtick_set+0x80/0xe5
kernel: [<c045786c>] ? audit_syscall_exit+0x2b1/0x2cc
kernel: [<c0629051>] ? do_page_fault+0x0/0x6eb
kernel: [<c0627c12>] error_code+0x72/0x78
kernel: =======================
1分後に今度はPerlに関するメッセージが出力されていました。
kernel: INFO: task perl:14113 blocked for more than 120 seconds.
kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disable
kernel: perl D c078d23c 0 14113 10797
kernel: f38d0c84 00000082 f38d0c2c c078d23c c0790280 c079028
kernel: dc9850b8 c178b280 00000000 c178b280 541f0a53 0000b16
kernel: 00000000 17401a02 f6e30db8 f38d0cd0 f38d0c7c c043aaa
kernel: Call Trace:
kernel: [<c043c0f7>] ? getnstimeofday+0x34/0xd1
kernel: [<c043aaa1>] ? ktime_get_ts+0x45/0x49
kernel: [<c0626206>] io_schedule+0x52/0x8a
kernel: [<c0461ad9>] sync_page+0x36/0x3a
kernel: [<c0626590>] __wait_on_bit_lock+0x34/0x5e
kernel: [<c0461aa3>] ? sync_page+0x0/0x3a
kernel: [<c0461a8e>] __lock_page+0x78/0x81
kernel: [<c0437baa>] ? wake_bit_function+0x0/0x43
kernel: [<c0461ce1>] find_lock_page+0x65/0x91
kernel: [<c0462212>] filemap_fault+0x95/0x337
kernel: [<c046ce68>] __do_fault+0x52/0x3a2
kernel: [<c0491571>] ? __d_lookup+0x9d/0xe9
kernel: [<c046e7e2>] handle_mm_fault+0x2f5/0x767
kernel: [<c0491e50>] ? dput+0x34/0xee
kernel: [<c041b23e>] ? kmap_atomic_prot+0x1dd/0x1df
kernel: [<c041b23e>] ? kmap_atomic_prot+0x1dd/0x1df
kernel: [<c041b041>] ? kunmap_atomic+0x87/0xa7
kernel: [<c046dcbb>] ? unmap_vmas+0x3b7/0x539
kernel: [<c04f2aae>] ? rb_insert_color+0x56/0xc0
kernel: [<c04f1614>] ? prio_tree_remove+0xbd/0xcc
kernel: [<c0629393>] do_page_fault+0x342/0x6eb
kernel: [<c046fcad>] ? free_pgtables+0x7e/0x95
kernel: [<c046af30>] ? vma_prio_tree_add+0x6d/0x7f
kernel: [<c046af6a>] ? vma_prio_tree_insert+0x28/0x2e
kernel: [<c0471254>] ? vma_link+0xa1/0xbe
kernel: [<c04724cf>] ? mmap_region+0x339/0x3f7
kernel: [<c053e11d>] ? randomize_range+0x1a/0x36
kernel: [<c04727ee>] ? do_mmap_pgoff+0x261/0x2c1
kernel: [<c045786c>] ? audit_syscall_exit+0x2b1/0x2cc
kernel: [<c0408cda>] ? sys_mmap2+0x63/0x7b
kernel: [<c0629051>] ? do_page_fault+0x0/0x6eb
kernel: [<c0627c12>] error_code+0x72/0x78
kernel: =======================
度々のアドバイスありがとうございます。さっそくご教授頂いた方法でサーバを再構築しています。今後の状況については、報告させていただきます。(従来ですと、1週間以内には必ずKernelPanicで落ちていますので)
No.2
- 回答日時:
仮想メモリにおけるカーネルパニックではないかと思われます。
x86メモリモデルとディスクリプタテーブルに関しての記述は
下記のサイトを一読ください。
まずはこれを理解していただないと説明の意味が通じないからです。
http://www.ibm.com/developerworks/jp/linux/libra …
エラーの開始は
kernel: sd 0:0:0:0: [sda] Sense Key : Aborted Command [current] [descriptor]
[current] [descriptor]を見てコマンドがアボートしてます。
kernel: Descriptor sense data with sense descriptors (in hex):
kernel: 72 0b 14 00 00 00 00 0c 00 0a 80 00 00 00 00 00
kernel: 0f ff ff 80
kernel: sd 0:0:0:0: [sda] Add. Sense: Recorded entity not found
ディスクリプタテーブルの指す先が見つからない
そこが物理メモリではなく、[sda] となっているのでSWAPかと想像します。
kernel: end_request: I/O error, dev sda, sector 268435328
セクター 268435328 HDのI/Oエラー
間違いなくSWAP領域なのでしょうか。
kernel: sd 0:0:0:0: [sda] 312581808 512-byte hardware sectors (160042 MB)
となっているので160GのHDは正しく認識されていると思われます。
HDの領域割当を一度確認されることをお勧めします。
QTPartedでパーティション割当は確認できます。
http://www.thinkpad-lover.org/main5/QTParted.htm
それともう1点
マザーボードの規格がわからないのではっきりしたことは言えませんが
SATAのHDでIDE互換モードでインストールしていれば [hda]になるはずです。
[sda] の表記なのでSCSI認識ですね。
このあたりの設定関係がトラブルの元になっている可能性はないでしょうか。
LOGを見た限りの私の思い込みもかなり入っているかもしれません。
解決への参考になれば幸いです。
この回答への補足
解析ありがとうございます。
QTPartedでHD領域割当が確認できるとのことでしたが、GUIツールなのでしょうか?(ご教授いただいたサイトを見る限り、そう判断しました)
また、HD領域割当ということであれば、fdiskでもいいのでしょうか?以下、fdiskの結果です。
***
Disk /dev/sda: 160.0 GB, 160041885696 bytes
255 heads, 63 sectors/track, 19457 cylinders
Units = シリンダ数 of 16065 * 512 = 8225280 bytes
Disk identifier: 0x0009d15d
デバイス Boot Start End Blocks Id System
/dev/sda1 * 1 25 200781 83 Linux
/dev/sda2 26 19457 156087540 8e Linux LVM
***
また、
>SATAのHDでIDE互換モードでインストールしていれば [hda]になるはずです。
とのご指摘については、SATAのHDです。IDE互換モードというのは、自分では意識せず、インストールを完了しています。どの時点で意識するべき事項なのでしょうか?
本日もサーバダウンをしており、下記ログを出力していました。
***
kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x2
kernel: ata1.00: BMDMA stat 0x24
kernel: ata1.00: cmd ca/00:08:31:1a:5c/00:00:00:00:00/ee tag 0 dma 4096 out
kernel: res 51/84:01:38:1a:5c/00:00:00:00:00/ee Emask 0x10 (ATA bus error)
kernel: ata1.00: status: { DRDY ERR }
kernel: ata1.00: error: { ICRC ABRT }
kernel: ata1: soft resetting link
kernel: ata1.00: configured for UDMA/133
kernel: ata1: EH complete
kernel: sd 0:0:0:0: [sda] 312581808 512-byte hardware sectors (160042 MB)
kernel: sd 0:0:0:0: [sda] Write Protect is off
kernel: sd 0:0:0:0: [sda] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
***
何かわかれば、お手数ですが、ご教授ください。
No.1
- 回答日時:
ハードウェアの不具合や相性のような気がしましたが、ソフトウェア以外に流用されているパーツは無いのですよね? 電源ケーブルやATAケーブルなども不具合の原因になります。
また、コンセントからの給電が不安定なのかもしれません。同じコンセントから大容量の家電(冷蔵庫やエアコン、電子レンジなど)が分配されていないか確認してみましょう。コンセントの位置を変えてもいいでしょうが、配電盤からの分岐を考えないと、あまり意味がないかもしれません。
OSなどのインストールも何度もされていると思います。
どのソフトや設定をした時点でそのエラーが出ているのかを、時刻から追跡してみるのもいいでしょうね。
この回答への補足
回答ありがとうございます。
電源ケーブル、ATAケーブルも交換しております。
コンセントからの給電は確認する術はありませんが、家庭用コンセント2口に対して、タップを使用して、HUB、サーバ2台(AC電源150A)を接続しているのみで感覚的には、大丈夫かなと思っております。
OSのインストール、自分もそのような方向がいいのかなと思っております。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- UNIX・Linux swapが機能しているかの確認について 2 2022/09/18 13:17
- UNIX・Linux Kali Linuxで起動できない - Minimal BASH Like Line Editing 1 2022/06/03 13:14
- 車検・修理・メンテナンス 軽のAT、FFのギヤオイルの交換は? 軽のATでFF車ってオートマミッションとフロントデフが一緒のギ 11 2023/02/01 14:17
- デスクトップパソコン 3分後に休止状態になる 1 2022/09/23 10:22
- UNIX・Linux VirtualBox ゲストOSにPC内蔵HDDのパーティションをマウントする方法は? 2 2023/05/06 22:52
- その他(SNS・コミュニケーションサービス) 自分のpcがハッキングされたようなメールが来たのですがどうすればいいですか? 4 2022/10/02 16:14
- 中古車 安いけど年式の古い車について。私の車は軽四で新車から10年目になり、今年の車検を通すか買い替えるか迷 7 2023/06/02 14:01
- C言語・C++・C# c言語の問題の説明、各所ごとに 5 2023/07/26 11:03
- 英語 when I describe people I often want to say nice th 1 2023/06/04 13:31
- UNIX・Linux マスターブートレコード方式のbiosを使ったシステムでインストールされたlinuxで/dev/sda 1 2023/05/13 21:23
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・プリン+醤油=ウニみたいな組み合わせメニューを教えて!
- ・タイムマシーンがあったら、過去と未来どちらに行く?
- ・遅刻の「言い訳」選手権
- ・【大喜利】【投稿~11/12】 急に朝起こしてきた母親に言われた一言とは?
- ・好きな和訳タイトルを教えてください
- ・うちのカレーにはこれが入ってる!って食材ありますか?
- ・好きな「お肉」は?
- ・あなたは何にトキメキますか?
- ・おすすめのモーニング・朝食メニューを教えて!
- ・「覚え間違い」を教えてください!
- ・とっておきの手土産を教えて
- ・「平成」を感じるもの
- ・秘密基地、どこに作った?
- ・【お題】NEW演歌
- ・カンパ〜イ!←最初の1杯目、なに頼む?
- ・一回も披露したことのない豆知識
- ・これ何て呼びますか
- ・初めて自分の家と他人の家が違う、と意識した時
- ・「これはヤバかったな」という遅刻エピソード
- ・これ何て呼びますか Part2
- ・許せない心理テスト
- ・この人頭いいなと思ったエピソード
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・ハマっている「お菓子」を教えて!
- ・【大喜利】【投稿~11/1】 存在しそうで存在しないモノマネ芸人の名前を教えてください
- ・好きなおでんの具材ドラフト会議しましょう
- ・餃子を食べるとき、何をつけますか?
- ・あなたの「必」の書き順を教えてください
- ・ギリギリ行けるお一人様のライン
- ・10代と話して驚いたこと
- ・つい集めてしまうものはなんですか?
- ・自分のセンスや笑いの好みに影響を受けた作品を教えて
- ・【お題】引っかけ問題(締め切り10月27日(日)23時)
- ・大人になっても苦手な食べ物、ありますか?
- ・14歳の自分に衝撃の事実を告げてください
- ・【大喜利】【投稿~10/21(月)】買ったばかりの自転車を分解してひと言
- ・ホテルを選ぶとき、これだけは譲れない条件TOP3は?
- ・家・車以外で、人生で一番奮発した買い物
- ・人生最悪の忘れ物
- ・【コナン30周年】嘘でしょ!?と思った○○周年を教えて【ハルヒ20周年】
- ・あなたの習慣について教えてください!!
- ・都道府県穴埋めゲーム
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
OLD MAC(68K)に外付CD-ROM(SCS...
-
USBフラッシュメモリのマウント
-
MS-DOSが認識できるHDの....
-
ubuntu 初期化について
-
「クラスが登録されていません 」
-
パソコンでゲームをプレイしよ...
-
gccのインクルードパスの確認
-
Raspberry Pi 3 A+ ブラウザ遅い
-
Ubuntu on Xorgのログインについて
-
1枚でも「1枚”組”」なのですか?
-
PUTTYでログインしたコンソール...
-
富士通 ESPRIMO B532/G のBIOS...
-
ubuntu8.0.4にopenssl-develを...
-
yumインストール先は、何で決ま...
-
linux mint での無線LANが認識...
-
yumとwgetの違い
-
メールソフトBecky!について
-
初の自作PCでBIOS設定していた...
-
TVTest、チャンネル取得失敗
-
OSの割り込みについて
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
MS-DOSが認識できるHDの....
-
/dev/hdaのhとは?
-
ネットワークがダウンしてしま...
-
USB メモリが認識されない
-
ハードディスクの故障? Drive...
-
やはり中古ノートでネットが繋...
-
USBフラッシュメモリのマウント
-
raid1で不良セクタがあると高負...
-
eth0が突然認識しなくなりました
-
USBデバイスのマウントについて
-
kernel-header作成方法
-
無線LAN(SC-32NE)
-
WES 2009 USBフラッシュメモリ...
-
新品HDDに交換しても、同様のエ...
-
MacOSX ・EPSONスキャナがFireW...
-
OLD MAC(68K)に外付CD-ROM(SCS...
-
ATAPIデバイスがSCSIデバイスと...
-
CD-ROMの認識方法について(MS-...
-
Windowsのコア数、32,64bitの一...
-
VineLinuxがSCSI-CDRドライブを...
おすすめ情報