
お世話になります。
例えばAさん、Bさん、Cさんがそれぞれテストをしたとします。
回数はバラバラで7回、5回、3回です。
Aさんの場合
64,69,37,61,42,65,75点(最新順)
Bさんの場合
72,60,63,84,68点(最新順)
Cさんの場合
67,106,91点(最新順)
各人のテスト結果の中から上位5項目に対して、各データに重みづけをするため新しい順に5点・4点・3点…1点を掛けます。
その結果
Aさんの場合
(64*5)+(69*4)+(61*3)+(65*2)+(75*1)/5=196.8
Bさんの場合
(72*5)+(60*4)+(63*3)+(84*2)+(68*1)/5=205.0
と、ここで行き詰まってしまったんですが・・・。
Cさんのテスト回数はまだ3回で、AさんやBさんのように重みづけをどうすればいいのか分かりません。
Cさんは除外とすべきなのか、重みづけの工夫が必要だとすれば、どういう方法が考えられるでしょうか。
最終的には各人の偏差値を出したいと思っています。
ご教示いただければ幸いです
No.2ベストアンサー
- 回答日時:
企業で統計を推進する立場の者です。
博士(工学)です。最新のデータに近いところに次の値が来るだろう、と予測を行うことがあります。
この予測値は、ご質問者のように、過去のデータには低い重みを掛けて、新しいデータには高い重みを掛けて平均すれば求めることができます。
さらに、その予測値と実際の観測値の「偏差」を累積し続け、その累積値を評価するという考え方は品質管理などでも用いられます。過去の実力(=予測値)どおりの実測値であれば、少々ばらついても偏差の期待値は0なので、累積し続けても0ですが、それが増えたり減ったりするようなら「上昇気味の異常」「下降気味の異常」だと判断できます。もちろん、一定の値で生産し続けている工程での話であり、試験の成績のように毎回の難易度が異なる場合には使えません。
用いる重みですが、通常は指数関数的に減衰する重みを掛けて平均を取ります。
これを、EWMA(エキスポ―ネンシャリー・ウェイテッド・ムービング・アベレージ)と言います。
翻訳すると「指数加重移動平均」です。まさに加重平均です。
また、上記の品質管理手法を「EWMA管理図」と言い、国際規格ISOにも記載されています。
さて、ご質問の件です。
3個しかない、どうしよう。という時ですね。
品質管理に用いる指数関数的に減衰する重みも過去に向かって永遠に続いて0にならないです。サンプルが足りない!という危惧が生じます。
でも、ご心配なく。
最新の予測値は、1個前の実測値と予測値があれば、計算できるのです。減衰させる公比をλ(0.8とかいう値)とすれば、
(最新の予測値)=λ×(1個前の実測値)+(1-λ)×(1個前の予測値)
もちろん、1個目の予測値の計算時は(0個目の実測値)=(0個めの予測値)=(1個目の実測値)で代用してください。
重みに等比数列を用いると、このように計算できますから、「他は5回だがCは3回しかない」と悩むことはないのです。
それにEWMA法として確立していますから、論文にもEWMAを用いたって書けば査読はスルーです。
λの値は、過去何個分を引きずるかに影響しますが、ここでは紙幅の都合で書きません。ネット等で調べてください。
最後に「偏差値」ですが、成績の偏差値というのは、正規分布を仮定したときの、当該サンプルの「相対的位置」を表す指標です。
これは、平均が50、標準偏差が10に基準化されていますので、工程のデータのように扱えます。
AさんBさんCさん・・・の「最新の実力の予測値」は生点の加重平均で求めていけません。毎回難易度が一定なら良いですが、そんなことは無理です。しかし毎回の偏差値なら基準化されています。
そして、偏差値の加重平均から求められたAさんBさんCさん・・・の偏差の累積和を見れば、各人が上昇気味なのか下降気味なのかが分かると思います。瞬間瞬間の偏差値は、出題範囲の得手不得手で乱高下し一喜一憂しなければなりませんが、加重平均を用いているのでデータとしては安定していると思います。
学校の先生とお見受けしましたが、研究発表できるような内容ですね。でも、予備校などでは、もう既にやっているかもしれませんね。
大変勉強になりました。
がしかし、まだまだわからないことだらけで kamiyasiroさんの回答にしっかりとお礼もできず、恥ずかしい限りです。
まずはEWMAというものをしっかりと勉強することから始めます。
No.4
- 回答日時:
EWMAでデータの個数の差を気にしなくてもよい理由は、
No.3 の説明に尽きます。
御質問のようにデータ個数が極端に少ない場合には、
同様には考えれられないでしょう。
三人が7回、5回、3回であれば、4回め5回めについては
ほぼ 0 の重みを掛けざるを得ず、それなら、各人
最新3回ぶんだけを計算対象にしてもあまり違いはありません。
ご回答ありがとうございます。
なるほどです!
統計に無知な者が研究をスタートするには、もっとシンプルに、直近3回分だけ見ても問題ないのですね。ますますこの件について勉強したくなる心強いお言葉をありがとうございました。
No.3
- 回答日時:
#2です。
当然ですが、指数加重移動平均は、個数が不揃いでも、全て1個目の値から愚直に計算しないといけません。
でも、データ列が1000個とかいうときは、100個前くらいから移動平均の計算を始めれば良いです。
なぜなら、それより過去は重みがほぼ0だからです。
度々のご回答ありがとうございます。
統計学に無知すぎる私からすれば、最後の一文「過去は重みがほぼ0」という言葉に衝撃を受けました。(いろいろな意味で)納得できないと思いつつも、加重平均を当てはめると、過去より今(直近)の状態を知ることで、次に取るべき行動がわかるのではないかという仮説がありました。
まだまだわからないことがたくさんありすぎて、何から再質問すればいいのかもわからず…。このようなお礼で失礼します。
本当にありがとうございました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 テストの順位についてです 今回のテストの順位を知りたいのですが、できますでしょうか?今回は僕の学年は 4 2022/11/30 19:15
- 高校受験 中3 9月 模試の結果D判定 夏に受けた模試の結果が第1志望D判定でした。 あと21点でやっと合格圏 3 2022/09/09 23:19
- 高校受験 中学校3年生です。 今回の前期中間のテストが9教科 900点中364点でした。 僕は高校に進学を取る 3 2022/06/25 01:56
- 高校受験 夏休み、本気で勉強を頑張りたい 2 2022/07/03 16:33
- 高校 高校のテストの高得点 3 2023/05/24 21:04
- 統計学 統計学、エクセルがわかりません!解答と詳しい解説をお願いします! (1)それぞれの地域別に記述統計量 9 2022/08/21 16:30
- 統計学 投票のジレンマ。 3 2023/05/13 22:16
- 大学受験 共通テストの点数がなかなか取れません 国公立医学部志望です。一浪なのですが、現役の時から共通テストが 7 2023/07/25 22:55
- 高校受験 3ヶ月で偏差値5あげることはできますか? 中3 私は今年の6月に初めて模試を受け偏差値54、2回目の 0 2022/10/26 15:43
- 中学校受験 中学受験 3 2022/11/13 21:17
このQ&Aを見た人はこんなQ&Aも見ています
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
標準偏差
-
偏差値50~55の差と偏差値70~7...
-
標準偏差に「通常の範囲」はあ...
-
3教科の偏差値の出し方について...
-
ネノの求め方わかりやすく教え...
-
なぜ共分散はSxyで表すのですか...
-
偏差値60の人と偏差値50の人が...
-
幾何標準偏差の求め方
-
(1)で分散を求める時、解答では...
-
吹田市に出来た大和大学は、経...
-
5段階評価のつけ方について
-
エラーバーの書き込み方
-
偏差値の求め方(逆の場合)
-
偏差平方和なぜ2乗
-
偏差値だけで見ると、鳥取大学≧...
-
全体平方和の説明をお願いします
-
標準偏差を求める際のデータ数...
-
共分散と相関係数について
-
偏差値と正規分布の問題です。
-
標準偏差について
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
標準偏差
-
偏差値だけで見ると、鳥取大学≧...
-
幾何標準偏差の求め方
-
パーセンテージのバラツキを表...
-
小さければ小さい程高い偏差値
-
Excelで近似式の標準偏差を算出...
-
顔面偏差値100点満点中何点ぐら...
-
偏差値60の人と偏差値50の人が...
-
社会人の偏差値の調べ方
-
なぜ共分散はSxyで表すのですか...
-
推定(統計)です。有効数字の...
-
偏差値の求め方(逆の場合)
-
(1)で分散を求める時、解答では...
-
標準偏差値が合わない
-
エラーバーの書き込み方
-
平均年齢の表記方法(統計学的に)
-
偏差値から順位を求めるには
-
高校偏差値67ってどのくらい字...
-
標準偏差に「通常の範囲」はあ...
-
変動係数における平均値について
おすすめ情報