「みんな教えて! 選手権!!」開催のお知らせ

正規分布に従うとは、平均値の分布が多いという意味でしょうか?

日々変わるデータの点数が凸のような分布でなく、平均値付近が少ない
凹のようなデータの集合だと、標準偏差を算出し正規分布を使い
30%以下の人や70%以上の人を毎日抽出するような用途には
向かないのでしょうか?

A 回答 (6件)

まず、正規分布に従うとは、「分布が正規分布のグラフと同じ形をする事」をいいます。


そのため、平均辺りが多くても△のような分布グラフだったり、
左右が対象でないと、「正規分布に従う」とは言いません。

そのため、試験の成績などは、「正規分布に近い」だけであって、
「正規分布に従っている」のではありません。

つまり、「偏差値」を使うべきかどうかは、偏差値の「分かりやすさ」と、
その分布が正規分布に近いかどうかの判断になります。



例えば、凹のようなデータでも、両端がなだらかになっていれば、そこそこ偏差値も使えます。

逆に、両端が崖のようになっていると、偏差値を使うのは控えた方がいいでしょう。
(たとえば、30点や、80点の人は多いけど、29点以下や、81点以上がいないなど)

また、分布が左右対称でない場合も、使用をやめた方がいいでしょう。
平均値と、中央値(順位が真ん中の人の値)が離れると、偏差値の感覚的な値とは
ずれてきます。



いずれにしても、ある程度のデータがあるのであれば、そのデータで
やってみるのが一番です。

出るべき結果と大きなずれがなければ、分かりやすいので使ってしまっても
いいのではないでしょうか。

試験の結果なんかでも、山が二つあったり、左右に偏っている事なんて
よくあります。

それでも、偏差値が、それなりに機能していますから、まずはやってみるのが
いいのではないかと思います。
    • good
    • 5

> 平均値付近が少ない凹のようなデータの集合だと、標準偏差を算出し正規分布を使い30%以下の人や70%以上の人を毎日抽出するような用途には向かないのでしょうか?


【答】向きません。

お勧めしたいのは、次のような分布図を書くことです。
横軸は、点数とします。
縦軸は、その点数以下のデータの数(または全体に対する比率)とします。

このグラフの型が「いろいろ」であれば、それ以上の理論解析はムリです。もし、どれも「あるクセ」のある形をしているならば、毎日のデータから、あるパラメータを抽出して、管理に役立てることは可能です。
    • good
    • 3

正規分布なら平均値±2σの範囲におよそ95%あるといえますが、正規分布でない場合にはこの割合にはならないだけであって、標準偏差が全くナンセンスというわけではありません。


正規分布になっていない場合でも、標準偏差は、平均値付近の割合を調べる目安になります。例えば、チェビシェフの不等式というのがあります。式はWikipediaをご覧ください。この関係は「凹のようなデータ」を含め、どのような分布でも成り立ちます。

参考URL:http://ja.wikipedia.org/wiki/%E3%83%81%E3%82%A7% …
    • good
    • 3

No1,No2さんが述べているので、必要なことだけ確認します。


同じ母集団からサンプリングしたのでしょうね?二山になる分布の場合は、その可能性があります。
    • good
    • 2

あきらかに正規分布じゃないにもかかわらず「正規分布だと思う」ってのはさすがに無理があります. 例えば「-1 か 1 が等確率」とい

う究極の場合に「正規分布を使う」って思わない... よね?
    • good
    • 1

凹のデータの、確立密度関数は-∞から+∞で発散するんじゃないですか?



また、正規分布は正規分布の確率密度関数に従わないとならないですから、凹型のグラフは取りえないと思います。
絶対凸型じゃないでしょうか。

余事象の確率とかでいけそうな気もしますが。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています


おすすめ情報

このQ&Aを見た人がよく見るQ&A