
No.4ベストアンサー
- 回答日時:
数学としての理論計算のご依頼ならば #2の方のように、パターンに当てはめて推測をすることができますが、今回は親御さんとして、「40位以内」という情報よりも詳しい情報を求めていらっしゃるのでしょう?(20位以内なら推薦をもらえる、というような。
)そこまで精度を求めても恐らく、計算で得られるのは期待する「現実の予想」とはかけ離れている可能性がありますから、#3の方がおっしゃる通り、「40位以内」あるいは「恐らく40位よりは、多少上」である程度納得して、過去は忘れて次のことに向き合った方が現実的だと思いますよ。
もう少し具体的に言うと、240人程度、という母集団も小さいと思います。
それに、中学生の成績は乱高下するので、いつも実力通り、とは限りません。425点→385点→445点 というような例は山ほどあります。順位表だって、作るとすればいつも同じラインアップではないでしょう。
さらに、「正規分布とすれば」というような仮定が、現実とだいぶ乖離します。
0~99点 1人
100~149点 4人
150~199点 4人
200~249点 10人
250~299点 33人
300~349点 23人
350~399点 45人
400~449点 83人
450~500点 40人
のピークがどこにありますか? 400~449点 の度数ですね。棒グラフを描けば、左右対称でないことがわかるでしょう。
中学も高校も、成績の分布はしばしば、ふたこぶラクダのような、複数ピークになりがちです。実際、今回のテストでも 250~299点 に小さなピークがありますね。
学校によっては、470点前後にもう一つピークができることもあります。
よって、今回の成績だけで見るよりも、全回までの度数分布と比較なさるのはいかがですか。前回の
400~449点 65人
450~500点 55人
(仮)というような分布と比較することによって、さらに、前回の順位が最終的にわかっていさえすれば、
「今回前回の55位の人は、今回はもっと低い点数に下がった可能性がある」
「今回40位の人は、前回もっと点数が上だった」
全体的にどのくらい上がっているか、下がっているか、
という参考情報にはなるでしょう。
あとは学校と直談判するぐらい、私には推測が立ちません。
さっき言ったように乱高下するお年頃なので、
30位か35位か よりも、「どこの集団に(先頭集団に)入っているか」「前回よりも努力を怠っていないように見えたか」の方が重要なのでは、と個人的に思います。
No.2
- 回答日時:
企業に勤める統計家です。
ご質問者は中学生ではなくデータ処理屋さんと見て、専門的な回答をします。
ご質問のように、階級毎にまとめてある表を度数分布表といいます。
ここから、第何番目かの値を求める問題は、パーセンタイルを求める問題と同義になります。
解法には、3つの方法が考えられます。
普通の人は、前から累積でやると思います。
(3)は、正確性を期すために、曲線近似をしてやろうという方法です。
(1)#1さんのように、平均、分散を求めて、正規分布をフィッティングする方法
平均E(u)=Σ(各級の中心値)×(各級の度数)/(総度数)
分散V(x)=E(x^2)-{E(x)}^2
ただし、これは不偏分散を与えないので
不偏分散V(x)={E(x^2)-E(x)^2}×n/(n-1)
で求めます。
すると、正規分布がフィッティングできます。
あとは、468点が何σかを計算して、正規確率表から確率を出し、順位に直します。
この手の問題は簡単に解け、前回のQC検定2級(大卒技術者レベル)にも出題されています。
(2)(1)の正確版です。
上のようなやり方では、問題があります。
なぜなら、この表を見ると、500点満点付近で減衰して来ません。
つまり、分布を部分的にしか見ていません。平均も怪しいし、分散も怪しくなります。
(1)の方法ではうまく解けないかもしれません。
このような状態を切断(トランケート)が起きていると言います。
そこで、トランケートが起きているデータとして、正攻法で分析します。
この説明は大変面倒です。岩崎学先生のテキスト「不完全データの解析」を参考にして下さい。
(3)累積分布のS字曲線の問題として考えます。
正規分布の累積分布であればシグモイドになりますが、
ここでは、分布を仮定せずに、非線形のフィッティングを行います。
ロジット関数の一種としてやれば良いと思います。
最後の級はデータとしては使いません。
なぜなら、もっと上の級があると仮定するとそれらを括った数になっているからです。
それは外れ値と考えるのです。
フィッティングにはレーベンバーグ・マルカート法を使うと良いでしょう。
私だったら、(3)で解析します。
業務で必要なら、Rでスクリプトを組んで解いても良いですよ。
(ただし、仕事の合間でやるので、1週間くらい下さい)
最後に、専門的なコメントで申し訳ないですが、
度数分布表というのは、データとしては、情報量は低いです。
分解能が足りずに量子化が起きているデータだからです。
この時は、量子化誤差というものが出ます。
(1)のように求めた分散は、真値より大きめになっています。
でも、パーセンタイルの問題であれば、順序が逆転することは、
ありませんので、問題ないです。
この回答へのお礼
お礼日時:2015/07/05 10:34
非常に詳しく、丁寧な回答ありがとうございます。
但し、私は、中学生ではないのですが、その父親で、
データ処理に関しても全く素人です。
(QC検定2級は持っています)。
最近の中学校の定期試験では、正確な順位を教えてくれないので、
単純に、息子の順位がどれくらいか知りたかっただけですので、
もし、時間があれば、(3)での解析をお願いします。
(忙しかったり、費用がかかったりするのであれば、
大変申し訳ないので、その必要はありませんので)
No.1
- 回答日時:
統計で語るには、せめて
平均
と
分散(高校で習います)
がわからないと、
468点が 450~500点 の中でも上位の方なのかちょうど中間なのか、
判断が付かないと思います。
本当は、
最高点 や 最低点
の情報もあった方が、統計的には役立つと思いますよ。
500点満点や498点の人がいたテスト
と、
468点で1位だったテスト
では、テストの難しさが違うことはわかるでしょう?
分散というのは例えば、10点満点の2つのテストで、両方とも平均点は5点だとして、
3 4 4 4 5 5 6 6 6 7
という10人のAテストと
0 2 3 5 5 5 5 7 8 10
という10人のBテストを比べると
平均は同じなのに、7点がすごいのかすごくないのかわからない
ですよね(Aでは7点なのにトップ)。
今もらっているデータで言えるのは
上から1番目 から 40番目の間
ということだけです。
450~468の間に開きがあるので、ある程度の人数はいるでしょうね(40位ってことはんないでしょう)。
でも、これだけでは、10位以内に入っているかどうか、なんとも言えません。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
このQ&Aを見た人はこんなQ&Aも見ています
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
3σの考え方
-
成績順位の推定
-
3σについて
-
nPrとnCrの違いを教えてください。
-
ギャンブラーの誤謬
-
サイコロを3回振って、123や345...
-
2つのサイコロの目の合計が偶数...
-
Uber デリバリー 夜中3時、4時 ...
-
じゅず順列の問題
-
数学Aの組み合わせにおいて、「...
-
2つのサイコロを投げた時、目...
-
00~99、AA~ZZの組み合わせっ...
-
サイコロ5個を同時に投げて任意...
-
6人でジャンケンをした時、1人...
-
6-5 高校数学の確率の問題です
-
1.2.3.4の中から重複を許して3...
-
効果量のマイナス表示に関して
-
妻の頼まれ事を、どのくらいの...
-
得点を補正する方法について
-
反応速度や濃度は、大きいor小...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
おすすめ情報