![](http://oshiete.xgoo.jp/images/v2/pc/qa/question_title.png?e8efa67)
No.2ベストアンサー
- 回答日時:
> 実務上、あるデータの集合があった場合、どの確率分布を使用するかどうやって決めればよいのでしょうか?
確率分布は現象のモデルなので、当人が「この分布で良い」と思えることが、まず必要です。そして実務上なのですから、さらにそれを他人に納得してもらう必要があります。これはやっかいな問題で、明確な答えは今も将来もありません。
たとえば一定時間内に到着する客の数にはポアソン分布をよく使います。それには理論的な根拠ももちろんありますけど、計算が簡単だから使うという側面も強く、反証があげやすいです。「ポアソンじゃなく集団到着だ」と言えば、多くの場合は集団到着の方が正確です。しかしそれにはまた反論があって、「ポアソンはパラメタが 1 つなのに、集団到着は 2 つだ。だから当てはまりが良いのは当然だ」というのも、正しいです。じゃあどっちが良いかは目的やデータによります。ポアソンなら単位時間あたりの客数を数えればすむのに、集団到着だと集団の数とそれらの大きさがいりますし。
また、たとえばねじの外径の測定値が正規分布すると言うと、それに反対する人はほとんどいないでしょう。しかし正規分布なら負の値を取る確率が正なのに、ねじの外径が負の値をとることはないので、その意味でモデルとしては不適切なことは、論理的には明らかです。それでも異を唱える人が少ないのは、
- 正規分布と思っても困ることはほとんどない、
- 正規分布とした前例が見つかる、
- 正規分布でないとした場合の標準的な手順がない、
など、消極的な理由の積重ねによります。
このように「こういう現象ならこの分布」という、いわば通念みたいなものが世の中にあって、それに合えば人に納得してもらいやすいわけです。通念がくせものですから、明確な答えはありません。新しい分析技術が流行すれば、その通念も変わります。だから昔はなかったのに、今はよく見る分布もたくさんあります。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
おすすめ情報