こんにちわ。田中と申します。

会社でproxyサーバを管理しています。
A・Bと2台立ててまして普段は両方とも問題なく稼動しているのですが
Aだけ1~2ヶ月に1度、ものすごくcpuに負荷がかかり
squidが機能しなくなる事があります。

コマンドを叩こうにもレスポンスが著しく悪く
なんとか再起動したら元に戻ります。
同様のトラブルを防ぐ為に
ログ等を見て原因を解明しようと思うのですが
どこから調べたらいいのでしょうか。
負荷が異様にかかった状態が続く事はどういう事が考えられるでしょうか?
ヒントをお願いします!

ちなみに環境は
OS:RedHat6.0
squid:2.2STABLE4
ハード:Compaq PROLIANT1850R

squid.confの設定
cache_mem 24 MB
cache_dir /var/spool/squid 2048 16 256
dns_children 30
refresh_pattern .020%43200
reference_age 1 month

squid以外にはdelegateを動かしてるくらいです。
宜しくお願いします。

このQ&Aに関連する最新のQ&A

A 回答 (3件)

フォローが遅くなりました。



まず、見なければならないのは、極端に重くなる時間の直前のログですよね。
これは、普段からログを見る習慣をつけた上で、いつもと何が違うかを見極めなければなりません。

トラブルは何も、必ず分かりやすいエラーが出ているとは限りません。特に今回の場合などは、プロセスが落ちてるとかではなく、非常に重くなっているという現象であるため、エラーという形では出ていないと思われます。

となると、正常稼動時と何が違うのかが問題になってくるのです。
先の回答で例としてあげたのは、特定のクライアントが大量のダウンロードをしているかもしれないといった物ですが、処理自体は正常に行われていたとしても、システムにスペックの許容範囲以上の負荷をかけているかもしれません。そしてそういった状況は、ログを見ることで該当の時間に特定のクライアントがどこかにアクセスしてるな等の情報をログから読み取れるかどうかが鍵になります。
もちろん、これは例ですから別にこういう原因だと言うつもりであげているわけではありませんよ。

delegate側に原因があるのかもしれませんし、他の全く関係無い部分かもしれません。

しかし、それを特定できるのはatushi_tさんご自身しかいないのです。

こういってはなんですが、今後もこういった環境について会社で関わっていかなければならないのであれば、専門の業者と保守契約を結ぶか、UNIXのシステム管理についての基礎を少なくとも学んだ方が良いかと思いますよ。
    • good
    • 0
この回答へのお礼

ご返答ありがとうございます。
ログを確認する癖の重要性がわかりました。

起きてから動くのでは限界がありますね。
日々、トラブルのおきない環境作りとログの確認を心掛けます。

勉強になりました。
ここで一旦この問題について締め切らせていただきます。

お礼日時:2002/04/08 16:55

A,Bが並列に動作しているのか、それともカスケードしているのかで、変わってきますが、並列に動作していて利用しているクライアントにも違いがあるのなら、月に2回くらい死ぬほど負荷をかけるようなデータ転送をしているPCがあったりする可能性もありますね。

ひょっとすると複数台。

もちろん絶対ではないんですが、例えばWinのオフラインコンテンツの同期機能は、凶悪なまでに経路上のシステムへ負荷をかけます。
同期先のサイトの内容にもよりますが、データ量の多いサイトの場合、中継しているプロキシにもかなり負荷がかかるのでは無いかと・・・

まあ、トラブルシューティングの基本は、alfeimさんのおっしゃるようにログの解析からです。
まずは、そこから見てみたらどうですかね。
    • good
    • 0
この回答へのお礼

>まあ、トラブルシューティングの基本は、alfeimさんのおっしゃるようにログの解析からです。
>まずは、そこから見てみたらどうですかね。

恥ずかしながらどこから見てよいのか・・・。

ちなみにA・Bは並列に動作しており、仰った通りクライアント数も違います。
問題のAの方が利用者が多いと思われます。

本当に初心者的な質問で恐縮ですが宜しくお願いします。

お礼日時:2002/03/25 14:33

まずはerror.logやsyslog、およびそれらの過去分を見てwarningなりerrorなりの通知が無いかを探しましょう。



止まった日付と時間が分からないのならば、再起動して解決なされているようですのでsyslogから再起動時のログを探してその前方を調べます。

何らかのログが出てればそれを元に調べましょう。

ログに何も出ていなければ、topコマンドを動かしっぱなしにしておいて問題発生時にCPUを持って行っているプロセスを特定します。

そうやって問題のプログラムの特定ができたら、設定ファイルなどを良く調べて原因を特定、回避方法を探しましょう。
    • good
    • 0
この回答へのお礼

ご返答ありがとうございます。

恥ずかしながら、error.logやsyslogはどこを見ていいのかわかりません。
/var/log/boot.logでshutdownした時間はわかったのですが・・・

また、squidのaccess.logを見てもどれがいつのログかどうやって見るのでしょうか?

1016769576.644  8 172.**.**.** TCP_IMS_HIT/304 213 GET http://www.vector.co.jp/images/menu/vector_logo. … - NONE/- image/gif

といった感じでいつなのかわかりません。。

#topコマンドって便利なコマンドがあるんですね!
#cpu使用率がわかりすごいわかりやすい!

お礼日時:2002/03/25 14:29

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

QSquidが突然遅くなった?

Linux & Squidがインターネットゲートウエイなんですが
なぜかSquidが突然遅くなってしまいました。
同じマシーンにはIPマスカレードも動作していますが、
そちらを利用した場合は特に遅くはありません。

どのような場合遅いのかと言うと、ドメインを移動する時に
2~5秒ほどのラグがはっせいします。
ただ、一度訪れたドメインはキャッシュがヒットするらしく
ラグなしで表示されます。

この現象に気づいたのが、LAN側に別セグメントを増やす為にGWに
スタティックルートを追加してSquid.confにそのセグメントのACLを
追加した後に気づきました、これが原因で起こったと思い
設定を元に戻してRebootしてみたのですが状況が変わらず。

DNSのせいかと思い、GWマシーンのコンソールでnslookupで
まだ引いていないドメインを正引きしてみたのですが、色々
試してみてもDNSでラグが発生している様子はありませんでした。

次にsquidのキャッシュがコンフリクトしたのかと思い、キャッシュ
ディレクトリを削除後、ディレクトリの再構築を行なったのですが
やはり効果なし・・・

仕方が無いのでGWをRebootしたのですが、これも全く効果なし・・

こんな状況なのですが何か分かること、解決する方法は無いでしょうか?
よろしくお願いいたします。

Linux & Squidがインターネットゲートウエイなんですが
なぜかSquidが突然遅くなってしまいました。
同じマシーンにはIPマスカレードも動作していますが、
そちらを利用した場合は特に遅くはありません。

どのような場合遅いのかと言うと、ドメインを移動する時に
2~5秒ほどのラグがはっせいします。
ただ、一度訪れたドメインはキャッシュがヒットするらしく
ラグなしで表示されます。

この現象に気づいたのが、LAN側に別セグメントを増やす為にGWに
スタティックルートを追加してSquid.confにそ...続きを読む

Aベストアンサー

squid の access.log cache.log store.log が巨大化
してませんか? 巨大化してるようなら、こいつらを
消してしまうか、squid2 であれば、squid -k rotate
で、ログを rotate してみてはいかがでしょうか。

Qsquidのパフォーマンスチューニングに関して

Squidのパフォーマンスチューニングについて、勉強しています。
調査したところ、

1.Cache_MEMの値を変更する

2.ヒット率が少ない場合、Cacheログを使用しない(Cache_dirタグのオプションでread-onlyを使用する)

という方法があることがわかりました。
ほかの方法をご存知の方がいらっしゃいましたら、ご教授いただけますでしょうか?URLなどの紹介でも、うれしいです。

以上、よろしくお願いいたします。

Aベストアンサー

# チューウニングはターゲットを特定した方が実現しやすいです。

単体のパフォーマンスチューニングから若干はなれますが・・・

下記URLの「URLハッシュ式分散Proxyキャッシュ」をうまく利用すると、
静的コンテンツと、動的コンテンツをキャッシュするサーバの分離や、障害予備構成等が可能になります。
例えば、
静的コンテンツだけを扱うサーバは、高速DISKやキャッシュメモリを多くする。
動的コンテンツだけを扱うサーバは、ネットワークパフォーマンスを中心にOSのチューニングする。

などが可能になり、クライアントから見た時のパフォーマンスが向上します。
(当然ですが)ボトルネックがWAN回線になるのなら、動的コンテンツはキャッシュサーバを経由させない事も一案だと思います。

キャッシュシステム全体としてパフォーマンス向上が可能になると思われます。

参考URL:http://naragw.sharp.co.jp/sps/indexj.html

Q社内でwebページが表示されるのが遅い。でもネットワーク自体は重くない

お初に質問させていただきます。

インターネットの表示が遅いです。昔は早かったのですが、いつごろから遅くなっていたのかはわかりません。
社内でインターネットを見ると、ページが表示されるまでに10秒程度かかります。どの社内PCから見ても表示は遅く、どのサイトでも多少の違いはありますが、やはり遅い状況です。
社外のサイトだけでなく、社内サーバのwebページにアクセスした場合もやはり重いです。プロキシサーバは使用していますが、インターネットオプションで、「ローカルアドレスにはプロキシサーバを使用しない」に設定しているため、表示が遅いのはプロキシのせいというわけではなさそうです。その社内のサーバにpingをしても何の負荷もなく、返ってきます。
それと、社内のファイルサーバへのアクセスは何のストレスも無く、サクサクとコピーなども行えます。

いったい何が原因なのでしょうか?なにかアドバイス等ありましたら、よろしくお願いします。

Aベストアンサー

確かにDNSサーバ側のAレコードは、ドメイン名からIPアドレスを解決するためのものです。プロキシやWebサーバがドメインに参加されていないのなら、DNSでの解決ができずに、WINSなど別の手段で見つけようとしているのかもしれません。手動でプロキシやWebサーバのAレコードを登録してみてください。

今後のために、動的更新が有効になっているかも確認しておきましょう。
http://www.atmarkit.co.jp/fwin2k/win2ktips/531dnsupdate/dnsupdate.html
http://www.atmarkit.co.jp/fwin2k/win2ktips/358disableupdate/disableupdate.html
http://itpro.nikkeibp.co.jp/article/COLUMN/20060224/230602/


人気Q&Aランキング