A 回答 (4件)
- 最新から表示
- 回答順に表示
No.4
- 回答日時:
「データを標準化」って何やねん?
正規分布を標準化すれば標準正規分布にゃなるが、
正規分布じゃないデータを正規分布にする方法なんてありゃせん。
つか、そんな方法があって、それを施したら、
データの分布が変わってまうやんか。
そんなんでええなら、採取したデータは捨ててもうて、
他所から何か正規分布するデータを持ってきたらええ。
その入れ替えで、「データは正規分布になった」ちゅうことや。
No.3
- 回答日時:
No.1です。
標準化に用いるσがそもそも違うのです。
すそ野を切断しているデータから求めていますからね。
そんなσで標準化して、正規分布に当てはめても、合わないに決まっています。
本来は、もっと上側にばらついている(実力差が拮抗しているのではなく、大きな実力差がある)状態なんですよ。
100点を越えて正規分布している感じです。
切断部分が見えなくなっているので、統計処理の際は、それを復元して使う必要があるわけですが、それには非常に手間が掛かります。
No.2
- 回答日時:
「標準化」と仰るのが「平均値を引き算してから標準偏差で割る」というフツウの意味であれば、山の偏りは全く変わらないままです。
もちろん、正規分布とは何の関係もない。ところで、ご質問は「偏差値」の計算方法の話だと思われ、その考え方と計算方法は以下の通り。
「ある未知の変数xは正確に正規分布に従っている。テストはxの大小を測っているには違いないのだが、テストの得点のスケールが一様でないために、xに比例した得点は得られず、その結果、得点の分布を見ると偏っている」という風に考えるのが、いわゆる「偏差値」ってやつです。(ただし、xを安易に「学力」などと呼ぶと誤解を招きかねないんで、要注意です。あくまでこのテストを受けた人の集団だけに関する、このテストだけで測った得点の話にすぎません。)
偏差値を計算するには、得点の数値ではなく、得点の順位を使います。N人居れば、最高点を取った1番からビリのN番まで、まずは順位をつけてやる。(ただし、たとえば31番〜40番が同点だというのなら、これら10人は全員「35番」であることにします。)
次に、数表に載っている「正規分布表」を使う。この表は「正規分布の確率密度関数」(あの、左右対称の釣鐘型をしたガウス関数)を表したものではなくて、それを積分した「正規分布の(累積)分布関数」の表です。具体的には、「標準正規分布に従う確率変数xの値がv以上になる確率p」が書いてある。なので、値vに対応する所に書いてある数値pを見れば「xの値がv以上である人はN人中にNp人居る」ということがわかる。
で、この表を逆に使います。すなわち、「順位がn番の人の得点以上の得点を取った人」はN人中のn人ですから、数値(n/N)が出ているvを探す。そうすると、n番の人のxの値はvだと分かります。こうして(あるいは表計算ソフトで「累積正規分布の逆関数」を使うのでもいいですが)、各人の順位nをその人のxの値へと換算してやるんです。
その結果得られるN人分のxのデータは、標準正規分布(すなわち、あの左右対称の釣鐘型をした分布で、平均0、分散1)に、当然従うことになります。というわけで、ご質問は「偏差値」の計算方法の話だと思われる理由がご理解いただけたでしょうかね。
なお、慣習的に学校の成績を指して言われる「偏差値」は、このxを10倍してさらに50を足したもの(つまり、平均50、標準偏差10になるようにしたもの)なんですが、ご質問の目的においては、そんな処理はまったく余計ですね。
No.1
- 回答日時:
> 正規分布化されるのでしょうか?
されません。
左に寄った場合、というかゼロ漸近しているデータは対数化というのが定石ですが、そうではない単なるいびつなデータには「ボックスコックス変換」「ジョンソン変換」というのを使います。
最近は後者が一般的に用いられます。
ただし、試験成績のような0~100の範囲のようなデータは、切断(トランケーション)と言って、100点以上の実力の人も100点として観測されてしまいます。
言い換えれば、規格外品を修正して規格内に入れたC国製品のような分布です。
この場合(絶壁で落ちている分布の場合)、統計的な扱いは非常に難しく、これだけで1冊の本が出ているくらいです。
岩崎学(2002)『不完全データの統計学』,エコノミスト社
https://www.amazon.co.jp/%E4%B8%8D%E5%AE%8C%E5%8 …
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 またまた質問です。 平均2.210 偏差ニ乗和825.180 分散4.147 標準偏差2.036 標 2 2024/01/10 05:26
- 統計学 母集団分布を平均 μ, 分散 σ2 の正規分布と想定し, 母集団から無作為抽出した標本のデータ(標本 4 2023/01/30 20:25
- 統計学 Excelによるサンプルの拡大について 6 2023/08/22 16:03
- 数学 以下の数学の問題を教えてください。 確率変数Xは標準正規分布N(0、1)に確率変数Yは平均3のポアソ 3 2022/12/02 19:13
- 数学 高校の数学Bの、確率分布と統計的な推測の、 正規分布の問題でわからない箇所がございます。問題文が、 2 2022/03/27 20:57
- 統計学 信頼区間についての質問です。 6 2023/06/25 17:34
- 数学 大数の法則と中心極限定理の違いについて 5 2023/09/02 13:23
- 統計学 数学です 4 2022/07/20 23:06
- 統計学 この問題が分からないので教えてください 定員200人に対して受験者が1000人あった入学試験について 6 2022/11/09 22:55
- 統計学 確率統計の問題です。 3 2022/04/07 04:39
このQ&Aを見た人はこんなQ&Aも見ています
-
「どうして捨てられないの?」前妻の物を捨てられない男性の心理って?
前妻の物を捨てられない理由に加え、捨てるための手段はあるのかを専門家に聞いてみた!
-
計算ソフトでの計算精度について
計算機科学
-
変な計算方法(笑)
数学
-
エクセルでランダム関数で乱数を作ったのですが、グラフにしてみたら正規分布になりません。
統計学
-
-
4
この解説の(5)が分かりません。 二次方程式にしてるんだろうなぁ〜くらいです… 解説をお願いします。
計算機科学
-
5
長方形の分類(幾何学)
数学
-
6
[数的処理] Aは毎朝7時20分に自宅を出発し、徒歩で大学へ通学している。ある日、寝坊したため30分
数学
-
7
素数の無限この証明って
システム科学
-
8
ピタゴラスの定理は辺の長さが虚数でも成り立ちますか
数学
-
9
小学生算数の逆算について
数学
-
10
仮説検定の問題で納得できない点が2つあります。
統計学
-
11
統計の質問です。フィッシャーの正確確率検定?コクランのQ検定?それとも?
統計学
-
12
数列の和の比較
数学
-
13
0を0 乗すると答えは1ですか 考え方を文章で簡単に解説 お願いします
数学
-
14
ポアソン分布の連続版(?)
統計学
-
15
微分条件を満たす
数学
-
16
1次方程式の移行について。x-12=9+8xについて。左にxを配置させます。
数学
-
17
標準偏差
数学
-
18
数的推理 整数 問題 4個の自然数のa.b.c.dがあり、a>b>c>dである。 この4個の自然数か
数学
-
19
ここの計算ってどうやってやってるんですか? 一回√の中身を筆算で解いてから素因数分解してるのでしょう
数学
-
20
えこれわかるひといますか?
数学
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
統計学についてです。 抽象的で...
-
下の対数表示のグラフから低域...
-
EXCELにてローパスフィルタを作...
-
検定統計量の値がマイナス
-
検量線の決定係数について
-
【統計】有意に「高い」?「低...
-
統計について
-
カイ二乗検定
-
実験データの統計と検定でかな...
-
エクセルのグラフから半値幅を...
-
高一数学 K2条ー6>0のKの範囲...
-
エクセルの統計でχ二乗検定の結...
-
心理学の統計について
-
理科のグラフで、直線と曲線の...
-
統計学の質問【帰無仮説】 W大...
-
片対数グラフで…
-
対応のあるt検定の結果の書き方
-
フーリエ変換と離散フーリエ変...
-
少ない母数に対するアンケート...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
EXCELにてローパスフィルタを作...
-
サンプル数の異なる2群間にお...
-
下の対数表示のグラフから低域...
-
エクセルのグラフから半値幅を...
-
検量線の決定係数について
-
心理機能診断をしたのですが、...
-
統計について
-
エクセルの統計でχ二乗検定の結...
-
心理学の統計について
-
ノンパラメトリック検定の多重...
-
アスピリンの加水分解のPHプロ...
-
自由度(1,m)のF値は自由度mのt...
-
死傷者数と死者数の違いって何...
-
検定統計量の値がマイナス
-
極値をもつ時と持たない時、単...
-
最小二乗法を反比例の式を元に...
-
パイロットサンプルって何ですか?
-
【統計】有意に「高い」?「低...
-
対応のあるt検定の結果の書き方
-
片対数グラフで…
おすすめ情報