プロが教えるわが家の防犯対策術!

RAIDの動作テストの方法って?

初歩的な質問失礼いたします。

サーバのHDD故障などに備えてRAIDがあると思いますが、HDDが故障したときに備えた動作テストは実際どのように行われているのものなのでしょうか。

・HDDの電源を切る
・HDDを接続している線を抜く
・実際にどこかが故障したHDDをつないでみる

など思いついたのですが、色々な故障を想定してテストしようとするとこれだけでは足りないと思います。
どんなテストをしているかご存知でしたら回答お願いします。

A 回答 (4件)

>・HDDの電源を切る


>・HDDを接続している線を抜く
>・実際にどこかが故障したHDDをつないでみる
上記の内容はHDD装置の故障をテストする内容でRAIDのテストではないと思います。

RAIDのテストなら、下記のようにRAID構成( ハードウェアRAID )によってテスト内容が変わります。
1.RAID1のテスト
  片方のHDDを抜くなど・・・
2.RAID5のテスト
  RAID5を構成している任意のHDDを1本抜くなど・・・

余計なことですが、RAIDのテストは実環境でないと確認できないし、実際に障害を発生される=HDDドライブを強制的に引き抜くなど「HDDドライブ」にとっては過酷なテストになるので、引き抜かれたHDDドライブを、その後の実運用に使用するには抵抗ありませんか?

このような実テストをしなくても良いようにホットスペアが存在すると理解しています。

この回答への補足

実テストをしなくて良いようにホットスペアがあるというのは
今まで聞いたことがない考え方だったので驚きました。

実テストによる検証を行わなくても十分な耐障害性を持たせられるということなのですね。

そもそものRAIDへの理解が足りなかったためか、意図した回答をいただけたとは言いづらいですが、
皆さまのご意見は大変参考になりました。

回答をしめきらせていただきます。

補足日時:2010/10/18 20:19
    • good
    • 0
この回答へのお礼

回答ありがとうございます。

お礼日時:2010/10/18 20:11

RAID5のサーバーのHDD交換をしたときの経験談です。

内容大幅に簡素化されていますので。。あしからず。

(1)RAIDのカードや重いBIOSの中に、監視機能があって常時テストされています。
HDDのハード的エラーが発生すると音やLEDなどで知らせてくれます。

➁アラームに気が付いたら、マニュアルにしたがって、エラーDISKの交換を行います。
ホットスワップなら電源ONのままで交換します。復旧のためのソフトはBIOSとして提供されています。

(3)ジャーナリング機能によるデータの回復などが行われます。

そんな感じです。

この回答への補足

テスト手順についての解説、ありがとうございます。

補足日時:2010/10/18 20:13
    • good
    • 0
この回答へのお礼

回答ありがとうございます。

お礼日時:2010/10/18 20:11

 お尋ねの件ですが、基本的にHDDの故障については、HDDの自己診断機能がPC毎にBIOSの機能として大抵入っております。

通常S.M.A.R.T情報(Self-Monitoring Analysis and Reporting Technology)と言われる機能ですが、PC及びM/Bの機種によりその機能が初期状態で無効化されている機種もあります。故障間近になりますと、BIOS上エラー表記にて知らせてくれたりする機能です。
 HDDについては、温度、データ読み込み・書き込みエラー率、不良セクタ数、磁気ヘッドのシークエラー率、電源のON/OFF回数等の利用形態により、故障頻度が変わりますが、S.M.A.R.T.と呼ばれる自己診断機能については、こういったステータス情報から故障等の障害を知らせてくれる機能です。
 RAID基板やボードとなると、S.M.A.R.T情報以外に、故障・異常を専用ソフト・ツールにて、OS動作中も知らせてくれる機能やEメールにて知らせてくれる機能もある機材も多いです。
 指摘のテストをかける以前に上記のように、S.M.A.R.T情報等によりHDD故障を知らせてくれるようになっております。

この回答への補足

PC自体に診断機能があり、テストをかける際にRAID側がS.M.A.R.T情報等によりHDD故障を知らせてくれる、ということなのですかね。

補足日時:2010/10/17 23:18
    • good
    • 0
この回答へのお礼

回答ありがとうございます。

お礼日時:2010/10/17 23:18

>HDDが故障したときに備えた動作テストは実際どのように行われているのものなのでしょうか



何をしたいのか良くわかりません。何がわからないかと言うと背景です。テストとは、目的にあった事柄をしないといけないので、背景がないと、的確な指示ができません。


例えば、あなたはRaidチップの開発チームの人ですか? それとも同じプロジェクトだが第3者テスト(ブラックボックステスト)ですか? そうではなく、単にサーバー関連のSEですか?

まず、立場を明確にしないとだめですね。次に、立場によりますが、どの段階のテストなんでしょう。開発段階のテスト、導入に向けたシステムチェック、などありますよね。

そういったもろもろの背景でテスト内容が変わります。

詳細は下記の本を買って勉強してください。

http://www.junglejapan.com/products/edu/pmp/

私はこの会社の人間でもないし、出版関係者でもありません。ただ、入社したては、これらを読まされました。

この回答への補足

立場についてですが、どれでもありません。
よって紹介いただいたプロジェクトマネジメント関係の本も(現在の立場では)あまり関係ないですね。

RAIDに興味があってその障害検出の信頼性が知りたかったときに、
自分でテスト方法が思いつかなかったので質問させていただきました。

補足日時:2010/10/17 22:59
    • good
    • 0
この回答へのお礼

回答ありがとうございます。

上の補足、見直してみると少し文意がおかしかったですね。
お気になさらないでください。

お礼日時:2010/10/17 23:21

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!