A 回答 (4件)
- 最新から表示
- 回答順に表示
No.4
- 回答日時:
「データを標準化」って何やねん?
正規分布を標準化すれば標準正規分布にゃなるが、
正規分布じゃないデータを正規分布にする方法なんてありゃせん。
つか、そんな方法があって、それを施したら、
データの分布が変わってまうやんか。
そんなんでええなら、採取したデータは捨ててもうて、
他所から何か正規分布するデータを持ってきたらええ。
その入れ替えで、「データは正規分布になった」ちゅうことや。
No.3
- 回答日時:
No.1です。
標準化に用いるσがそもそも違うのです。
すそ野を切断しているデータから求めていますからね。
そんなσで標準化して、正規分布に当てはめても、合わないに決まっています。
本来は、もっと上側にばらついている(実力差が拮抗しているのではなく、大きな実力差がある)状態なんですよ。
100点を越えて正規分布している感じです。
切断部分が見えなくなっているので、統計処理の際は、それを復元して使う必要があるわけですが、それには非常に手間が掛かります。
No.2
- 回答日時:
「標準化」と仰るのが「平均値を引き算してから標準偏差で割る」というフツウの意味であれば、山の偏りは全く変わらないままです。
もちろん、正規分布とは何の関係もない。ところで、ご質問は「偏差値」の計算方法の話だと思われ、その考え方と計算方法は以下の通り。
「ある未知の変数xは正確に正規分布に従っている。テストはxの大小を測っているには違いないのだが、テストの得点のスケールが一様でないために、xに比例した得点は得られず、その結果、得点の分布を見ると偏っている」という風に考えるのが、いわゆる「偏差値」ってやつです。(ただし、xを安易に「学力」などと呼ぶと誤解を招きかねないんで、要注意です。あくまでこのテストを受けた人の集団だけに関する、このテストだけで測った得点の話にすぎません。)
偏差値を計算するには、得点の数値ではなく、得点の順位を使います。N人居れば、最高点を取った1番からビリのN番まで、まずは順位をつけてやる。(ただし、たとえば31番〜40番が同点だというのなら、これら10人は全員「35番」であることにします。)
次に、数表に載っている「正規分布表」を使う。この表は「正規分布の確率密度関数」(あの、左右対称の釣鐘型をしたガウス関数)を表したものではなくて、それを積分した「正規分布の(累積)分布関数」の表です。具体的には、「標準正規分布に従う確率変数xの値がv以上になる確率p」が書いてある。なので、値vに対応する所に書いてある数値pを見れば「xの値がv以上である人はN人中にNp人居る」ということがわかる。
で、この表を逆に使います。すなわち、「順位がn番の人の得点以上の得点を取った人」はN人中のn人ですから、数値(n/N)が出ているvを探す。そうすると、n番の人のxの値はvだと分かります。こうして(あるいは表計算ソフトで「累積正規分布の逆関数」を使うのでもいいですが)、各人の順位nをその人のxの値へと換算してやるんです。
その結果得られるN人分のxのデータは、標準正規分布(すなわち、あの左右対称の釣鐘型をした分布で、平均0、分散1)に、当然従うことになります。というわけで、ご質問は「偏差値」の計算方法の話だと思われる理由がご理解いただけたでしょうかね。
なお、慣習的に学校の成績を指して言われる「偏差値」は、このxを10倍してさらに50を足したもの(つまり、平均50、標準偏差10になるようにしたもの)なんですが、ご質問の目的においては、そんな処理はまったく余計ですね。
No.1
- 回答日時:
> 正規分布化されるのでしょうか?
されません。
左に寄った場合、というかゼロ漸近しているデータは対数化というのが定石ですが、そうではない単なるいびつなデータには「ボックスコックス変換」「ジョンソン変換」というのを使います。
最近は後者が一般的に用いられます。
ただし、試験成績のような0~100の範囲のようなデータは、切断(トランケーション)と言って、100点以上の実力の人も100点として観測されてしまいます。
言い換えれば、規格外品を修正して規格内に入れたC国製品のような分布です。
この場合(絶壁で落ちている分布の場合)、統計的な扱いは非常に難しく、これだけで1冊の本が出ているくらいです。
岩崎学(2002)『不完全データの統計学』,エコノミスト社
https://www.amazon.co.jp/%E4%B8%8D%E5%AE%8C%E5%8 …
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 またまた質問です。 平均2.210 偏差ニ乗和825.180 分散4.147 標準偏差2.036 標 2 2024/01/10 05:26
- 統計学 母集団分布を平均 μ, 分散 σ2 の正規分布と想定し, 母集団から無作為抽出した標本のデータ(標本 4 2023/01/30 20:25
- 統計学 Excelによるサンプルの拡大について 6 2023/08/22 16:03
- 数学 以下の数学の問題を教えてください。 確率変数Xは標準正規分布N(0、1)に確率変数Yは平均3のポアソ 3 2022/12/02 19:13
- 数学 高校の数学Bの、確率分布と統計的な推測の、 正規分布の問題でわからない箇所がございます。問題文が、 2 2022/03/27 20:57
- 統計学 信頼区間についての質問です。 6 2023/06/25 17:34
- 数学 大数の法則と中心極限定理の違いについて 5 2023/09/02 13:23
- 統計学 数学です 4 2022/07/20 23:06
- 統計学 この問題が分からないので教えてください 定員200人に対して受験者が1000人あった入学試験について 6 2022/11/09 22:55
- 統計学 確率統計の問題です。 3 2022/04/07 04:39
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
EXCELにてローパスフィルタを作...
-
サンプル数の異なる2群間にお...
-
曲面z=log(x^2+y^2)のグラフの...
-
検量線の決定係数について
-
下の対数表示のグラフから低域...
-
最小二乗法を反比例の式を元に...
-
線形なグラフとはひとくちに言...
-
【統計】有意に「高い」?「低...
-
統計について
-
パイロットサンプルって何ですか?
-
回帰分析検証不一致
-
大数の法則と中心極限定理の関...
-
なぜ入試で三角関数のグラフを...
-
片対数グラフで…
-
データ点を線で結ぶ場合と結ば...
-
XRDその他のグラフ作成について
-
極値をもつ時と持たない時、単...
-
電子の比電荷
-
pHの平均値は出せない?統計処...
-
片対数グラフと傾き・切片の出し方
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
EXCELにてローパスフィルタを作...
-
エクセルのグラフから半値幅を...
-
検量線の決定係数について
-
下の対数表示のグラフから低域...
-
線形なグラフとはひとくちに言...
-
パイロットサンプルって何ですか?
-
最小二乗法を反比例の式を元に...
-
アンケートの集計分析の基礎(...
-
心理学の統計について
-
変化率のみで、有意差の検定は...
-
エクセルの統計でχ二乗検定の結...
-
グラフの"eye guide"について
-
【統計】有意に「高い」?「低...
-
統計について
-
片対数グラフで…
-
理科のグラフで、直線と曲線の...
-
一元配置分散分析のp値が0になる
-
死傷者数と死者数の違いって何...
-
統計学の質問【帰無仮説】 B大...
おすすめ情報

