電子書籍の厳選無料作品が豊富!

現在あるデータを正規化することを考えています.
状況を,簡単に説明します.
あるデータ集合A(A(0)~A(n)⊆A)があるとし,その平均をμ(A),標準偏差をσ(A)とし,
Aを正規化したデータをNormalized(A(n))とすると,正規化を表す式は以下のように,

Normalized(A(n)) = (A(n) - μ(A))/σ(A) となると思いますが,

上記の正規化式を以下のようにすることは統計的に正しいのでしょうか?
Normalized(A(n)) = (A(n) - μ(A))/σ(A) *2
Normalized(A(n)) = (A(n) - μ(A))/σ(A) *3
私としては,データには実際は,大きく平均から大きく離れた数値があることもあるため,
この方がよりデータとしては-1~1にまとまるので,良いように感じるのですが.

A 回答 (1件)

-1から1にまとめる理由は何でしょうか?



> Normalized(A(n)) = (A(n) - μ(A))/σ(A)

上記の方法なら標準正規分布との比較もしやすく、正規分布に従うデータならほとんどが-2から2の間に入ることがわかります。
ご提案の方法をあえて使う利点がないと思います。
    • good
    • 0
この回答へのお礼

返信が遅れてしまいました.すみません.
ご回答の方有難う御座います.

>-1から1にまとめる理由は何でしょうか?
正規化と言うと-1~1ではないか,と意味の無いことに固執していました.

よくよく考えて見ると,むしろ,比較などの際に雑さがまして悪い方向に向かうかもしれないと思いました.
参考になりました.有難う御座います.

お礼日時:2013/08/13 21:03

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!