dポイントプレゼントキャンペーン実施中!

大学院の学生です.データの標準化のことで教えていただきたいのですが,例えば1から10まであるデータをエクセルで標準化するにはどうすればよいのでしょうか.
 また,標準化されたデータは「個々のデータを標準化すると,個々のデータの相対的な全体の位置を知ることができる」と理解してよろしいのでしょうか.
 さらに,この標準化されたデータの統計学的有意差を見ることはできるのでしょうか?
 教わったまま時が過ぎてしまい,理解出来てない部分が多いです.
ですが教科書などを見ても簡単な表記(データ-平均値÷標準偏差)位で詳細がわかりません.先生に聞いても良くわかりません.長々とずうずうしくすみません,教えていただけましたら幸いです.宜しくお願いいたします.

A 回答 (3件)

 まず標準化についてですが、Excelには=standardize()という関数が用意されています。

使い方は

=standardize(X,平均,標準偏差)

です。
 データを標準化するのは、「平均が0、標準偏差が1になるように単位をそろえる」ためです。つまり、データを標準化することによって、標準正規分布を用いた推定や検定ができるというわけです。
    • good
    • 0

 標準化の計算方法は、他の方が書かれていますので、まず標準化の目的を、入試を例にして。


 入試の選択科目、例えば数学と国語が選択であるとします。国語の平均点は70点、数学が25点だと、国語を選択したほうが有利になることは明白です。これを補正するのに、平均値と標準偏差を用いた標準化が利用されます。 すなわち、どちらも正規分布するように補正するわけです。そうすると、得点分布を同じように変換できるので、選択科目による有利不利を解消できます。

>標準化されたデータは「個々のデータを標準化すると,個々のデータの相対的な全体の位置を知ることができる」と理解してよろしいのでしょうか。
 正規分布に変換するので、その値から、何番目を推定できます。
 すなわち、偏差値の場合は、平均を50点、標準偏差を10点なるような正規分布に変換するので、100人中、偏差値70の人は2~3番目、60点の人は16番目、50点の人は丁度平均点なので、50目と推算されます。

>この標準化されたデータの統計学的有意差を見ることはできるのでしょうか?
有意差の証明は、検定という作業です。検定は、平均値に差があることを証明するt-検定、分散の相違を調べるF検定が多用されますが、標準化すると平均値も分布同じになるので、有意差を出すことは数学的に不可能であり、検定は意味がありません。
 通常「集団が異なるので、差がある」と証明します。「集団AとBに有意差があるか」というのは、データーを標準化する必要はありません。そのままのデータで可能です。
 
 個々のデータで有意差があるというのならは、棄却検定に相当します。すなわち、そのデータは、有意とがあるので、その集団と考えるべきではなく、偶然であり、別の集団のデータなので、棄却してもよいと判断します。
 偏差値なら、偏差値70より上の人と30以下の人を足すと、全体では正規分布の5%以内に入ります。5%以内の場合、危険率5%以下として、その集団ではない、すなわち、全体からは出来が非常に良いまたは悪いので、有意差がある、というように表現可能です。が、あまりそのような表現はしません。
    • good
    • 0
この回答へのお礼

皆様丁寧なご返答ありがとうございました.
大変勉強になりました.

お礼日時:2005/12/01 16:31

標準化されたデータとは偏差値のプロ版と考えていいのでは?


標準化されたデータを10倍して50を加えたものが偏差値です。

標準化   偏差値  
0      50     平均値
2      70     正規分布で考えると上位約2%
-2      30 正規分布で考えると下位約2%
個々のデータで統計学的有意差をかんがえるという話は、あまり聞いたことがありません。統計学的に利用するとしたら異常値の判定など位かな?
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!