dポイントプレゼントキャンペーン実施中!

ほぼ素人なのですが若い社員に教える必要があるので四苦八苦してます。どうぞ判りやすくお教えください。数値データを統計的に処理する場合標準偏差を求めますね。そして場合によっては、更に深く解析を進めるためにはそれを正規化し比較する作業がありますね。例えばこの正規化された数値は偏差値の計算にも使われます。偏差値=10u+50(uは正規化された数値) ここまでは間違ってないですね!
ここからが未だスッキリしない疑問です。正規化された数値はは平均値が0で、標準偏差・分散が1にあり-1~+1の範囲にある。と理解してましたが、どうも違う気がしてきてます。というのは正規化された数値が-1~+1の範囲の値しか取らないのであれば偏差値も40~60の値しか示さないことになります。「東大合格へは偏差値70あれば良い!」が説明できなくなります。多分、どこかで見た、あるいは教えていただいた「正規化された数値は-1~+1の範囲にある」が抜けきらないからスッキリしないと思うのですが、私は何処でどのように誤った理解をしたのかが気になって仕方ありません。「-1~+1の範囲」は誤りなので、割り切って頭の中を切り替えれば済むようですが・・・・・何方か私が誤った理解をするに至った経緯を推論していただけないでしょうか?気分をスッキリさせるだけの我が儘な質問ですがご親切な方、よろしくお願いします。

A 回答 (3件)

> 私が誤った理解をするに至った経緯を推論していただけないでしょうか?



正規化というのにはただ一つのやり方しかないと思い込んだのが間違いのもとです。
正規化とはデータを使いやすい数値に変換するということであってそのやり方にはいくつかあります。
平均値を引いて標準偏差で割るのも一つの方法ですが,
最小値を引いて(最大値-最小値)で割ったり,
中央値を引いて(最大値-最小値)で割ることも考えられるでしょう。
最後のやり方をすれば「正規化された数値は-1~+1の範囲にある」と言えます。
    • good
    • 0
この回答へのお礼

正規化の方法は「平均値を引いて標準偏差で割る」と思ってましたが、他の方法もあるんですね!おかげさまで知識の幅が拡がりました。正規化の範囲についてはスッキリしない部分が残りはしますが、ここは割り切って頭を切り換えることにします。ありがとうございました。

お礼日時:2012/02/27 15:23

http://www.google.co.jp/url?sa=t&rct=j&q=%E3%82% …

にありますが、標準正規分布 -∞から∞ まで 積分したとき 1 になります。 当然u も同じ値をだけあります。
 -∞から∞ の値をとります。
    • good
    • 0

正規化された数値は-1~+1の範囲にある。


は間違いです。

分布が正規分布に近い場合は、40から60の間に約68.3%、30から70の間に約95.4%、20から80の間に約99.73%、10から90の間に約99.9937%、0から100の間に約99.999953%が含まれる事が知られている。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!