dポイントプレゼントキャンペーン実施中!

工場内で生産管理のシステムを運用しています。東南アジアのある国からです。現在の気温は34度です。

サーバー1台に対し、2つの生産ライン。それぞれのラインには、miniPCが1台ずつ、入力用のタッチパネルが2台ずつあります。
このシステム上には、上記のように合計7台のマシンがネットワーク接続されています。

ここ3ヶ月間は問題なく動いていましたが、今週火曜日から突然動作不安定になりました。最初はサーバーが不安定になり、筐体内の清掃を行ったところ、動作は安定しました。
ところが、今度は同じサーバーラック内に収めてあるminiPCが動作不安定を引き起こすようになりました。

工場は、電化製品を製造する工場で、サーバーラックは生産ラインの横に置いてあります。工場内の気温は30度に届かないくらいで、ラックは通気をよくしています。
サーバーは熱暴走が原因だと推定でき、清掃を行うことで動作は改善していますが、miniPCも同じように熱暴走が考えられますでしょうか?
現在、熱暴走を疑って、miniPCに冷却用のファンを取り付け、外部から強制的に冷やそうとしています。miniPCの筐体は全体が放熱フィンのようになっているタイプです。

ここまでに考えたことは、
・これまで3ヶ月問題なく動作してきたシステムなので、ソースコード上のエラーとは考えにくい。
・動作不安定の状況はminiPCが無反応になるため、このハードの障害。
・設置環境は確かにベストではないが、室内であること、周りに熱源がないこと、を考慮して使用に耐えうるものとの判断。
・サーバーおよびminiPCのリソースはきわめて安定。データベースも接続数、クエリ数などきわめて安定しているため、ソフト的な問題ではない。
などです。

データベースとのやり取りは、miniPCからデータベースへレコードを書き込み、タッチパネル端末がその内容を参照して画面に表示するという単純なものです。

これが熱暴走以外に考えられるとしたらどんなものがあるでしょうか?

A 回答 (2件)

震災の影響などで、久しぶりに覗いたところ解決していなかったみたいなので再度の投稿です。


※当方の地域は距離的に十分離れていますので影響はほとんどありませんでした。
 被災地の皆さまのご健康と一日も早い復興をお祈り申し上げます。
 
>ここが一番悩ましいところで、熱暴走であれば、再起動直後に通常動作に戻るようなこともありうるのでしょ>うか?普通のPCだとしばらく冷やしてから再起動となるように思うのですが、いかがでしょうか?

暴走した時点でCPU等は、殆ど動作停止状態になります。(無限ループにハマった場合は除いて)
あらかじめ決められたメモリエリア外をアクセスした時点で、CPUの例外が発生して停止に近い状態になります。
この為、再起動した時点ではCPUはある程度冷めている事が殆どです。

暴走するPCは下記のものですか?
http://www.marubun.co.jp/product/bcs/ipc/8ids6e0 …

HDDを利用する場合は、外気が最大45℃までとなっています。
ヒートシンクがあるということは、外気の対流によって本体を冷却する事を見込んでいると思いますが、サーバラックに入っていると、対流が殆ど起こらずその周辺に熱が籠っているのではないかと思われます。
HDDの代わりにCF(コンパクトフラッシュカード)を利用すると動作温度が60℃になるのは、CFの発熱が殆どないので、本体内部に熱がこもらないからです。

一度、サーバラック内に対流用のFANを取り付けてみては如何でしょうか?
それで収まるなら、ほぼ熱暴走と判断して間違いないでしょう。

下記はFANの例です。(対応電圧も100V~230Vまで数種類あるので適当なものを選択すればよいかと)
http://www.fa.omron.co.jp/product/family/809/ind …
    • good
    • 0
この回答へのお礼

YUI_AIさん、

気にかけていただいてありがとうございます。
その後ですが、少し進展がありました。
まず熱暴走を疑っていたのですが、メーカーであるVIAに問わ合わせたところ、気温70度までの動作を保証するということでした。米国ではレースカーに搭載して使用されているそうです。
しかし、サーバラックの中の空気の流れも確保するために、大量にファンを取りつけ、ラックの空気取り入れ口から全体に空気が流れるようにしました。

現状、.NET Runtime 2.0 Error Reporting ID:5000という.Net 2.0のバグが影響している可能性があり、この部分のソースを書きなおして、様子を見ているところです。
ネットで書かれている現象は、我々が遭遇している状況に酷似しています。

いずれにしても、YUI_AIさんのアドバイスは我々の焦っている気持ちを一度原点に戻し、落ち着いて考えるいい機会になりました。
ありがとうございました。

お礼日時:2011/03/21 20:00

通期を良くしているという事は、ホコリ等も一緒に通過させているという事でしょうか?


その場合、PC内にホコリが溜り、冷却が効率よく出来なくなります。

>設置環境は確かにベストではないが、室内であること、周りに熱源がないこと、を考慮して使用に耐えうるものとの判断。

周りに熱源が無くてもPC自体が熱源となりますので、サーバーラックの容積次第では十分に熱暴走を起こす温度まで上昇する事も考えられます。


通常のPCでの使用温度範囲は下記ぐらいです
※10~35℃、20~80%(ただし結露しないこと)

気温が、結構ぎりぎりなので、ラック内はそれより何度かは高くなっていると思われます。
※湿度も結構高いのではないでしょうか?

熱暴走対策としては、ホコリの除去(完全でなくても良いので)されたエアをサーバラックに常時送り続ける事ではないかと思います。

たとえば、工場のエアコンの吹き出し口からダクトを通して、ラック内に強制的に冷気を送り込むとか、下記の様な、ラック取付タイプのエアコンを設置するとかが考えられます。
http://www.apiste.co.jp/itc/

この回答への補足

YUI_AIさん、

早速のご回答ありがとうございます。
もう少し詳細を書かないとだめでした。質問を投稿した直後は補足を書き込めなかったので、ここで書かせていただきます。

サーバーに関してはYUI_AIさんのおっしゃるとおり、埃が堆積していました。これを取り除いて、とりあえずは復帰したところです。今後設置場所の変更を検討しています。
miniPCに関してですが、EITX-3000というVIAのものを使用しています。ファンレスで密閉されたケースですが、ケース全体が放熱フィンのようになっているものです。

不具合が出るのは、不定期ではありますが、大体1時間から2時間おきくらいで発生し、そのつどminiPCを再起動させます。再起動することで、通常の運用に戻ります。

ここが一番悩ましいところで、熱暴走であれば、再起動直後に通常動作に戻るようなこともありうるのでしょうか?普通のPCだとしばらく冷やしてから再起動となるように思うのですが、いかがでしょうか?

補足日時:2011/03/12 20:22
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!