並列計算について

解決済

質問者：naoki0115
質問日時：2011/08/17 17:42
回答数：2件

あまりパソコンに詳しい方ではありません。

今、linuxが入ったパソコン（CPU:Intel(R)Core(TM)i７ CPU９７０@3.20GHz,コア数12,
メモリ：5.8GiB）で数値計算をしています。コンパイラはgfortranです。OpenMPを使って、並列計算をしています。

例えば、スレッドを５使って一つのプログラムの計算したとします。次に別のプログラムをスレッドを５使って同時に計算したとします。
CPUモニタで確認すると、合計１２スレッド中、１０スレッドが使用率１００％になります。

しかし、計算時間はそれぞれ倍ぐらいになってしまいます。結局、プログラムを１
つずつ計算するのと同じ時間がかかります。また、使用するスレッドは５ぐらいが最適であることがわかっています。（それ以上多くしても計算時間が多くなるだけ）。つまり、１２スレッド中７スレッドは常に仕事をしていません。

原因、及び解決方法はあるでしょうか？

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (2件)

No.2ベストアンサー

回答者： kmee
回答日時：2011/08/18 09:32

各スレッドで個別に使う変数をPRIVATEに指定してありますか?

CRITICALとかBARRIER等の制御を使っていませんか?

並列計算は、各スレッドが独立している(他のスレッドと関係が無い)ほど効率がよくなります。
OpenMPでは、PRIVATEに指定していない変数はSHARED扱いになり、各スレッドで共有しようとするので、独立性が落ちます。
CRITICAL等の制御は必要なケースもありますが、他のスレッドを待ったりするために効率が落ちるので、最低限の利用に留める(できれば使わずに済むアルゴリズムにする)必要があります。

- 0
- 件

通報する

No.1

回答者： zwi
回答日時：2011/08/17 18:33

メモリアクセスが多くなるとメモリアクセスが足を引っ張りますのでマルチＣＰＵの効果が薄れると思います。

なので各スレッドは出来るだけ狭いメモリ領域を参照することが望ましいです（256KBを超えるランダムアクセスは低速化の要因）。
一番良いのは計算が複雑で変数や配列アクセスが極力少ないコードです。

あとCorei７９７０だと実コア数は６で、倍の１２に見えるのはハイパースレッディングの機能ですがプログラムの組み方次第ではハイパースレッディングでは効率的には動きません。場合によってはハイパースレッディングを切ってコア６で動かしたほうが早いかも知れません。