プロが教える店舗&オフィスのセキュリティ対策術

お世話になります。

例えばAさん、Bさん、Cさんがそれぞれテストをしたとします。
回数はバラバラで7回、5回、3回です。

Aさんの場合
64,69,37,61,42,65,75点(最新順)
Bさんの場合
72,60,63,84,68点(最新順)
Cさんの場合
67,106,91点(最新順)


各人のテスト結果の中から上位5項目に対して、各データに重みづけをするため新しい順に5点・4点・3点…1点を掛けます。

その結果
Aさんの場合
(64*5)+(69*4)+(61*3)+(65*2)+(75*1)/5=196.8
Bさんの場合
(72*5)+(60*4)+(63*3)+(84*2)+(68*1)/5=205.0

と、ここで行き詰まってしまったんですが・・・。
Cさんのテスト回数はまだ3回で、AさんやBさんのように重みづけをどうすればいいのか分かりません。

Cさんは除外とすべきなのか、重みづけの工夫が必要だとすれば、どういう方法が考えられるでしょうか。
最終的には各人の偏差値を出したいと思っています。

ご教示いただければ幸いです

A 回答 (4件)

企業で統計を推進する立場の者です。

博士(工学)です。

最新のデータに近いところに次の値が来るだろう、と予測を行うことがあります。
この予測値は、ご質問者のように、過去のデータには低い重みを掛けて、新しいデータには高い重みを掛けて平均すれば求めることができます。

さらに、その予測値と実際の観測値の「偏差」を累積し続け、その累積値を評価するという考え方は品質管理などでも用いられます。過去の実力(=予測値)どおりの実測値であれば、少々ばらついても偏差の期待値は0なので、累積し続けても0ですが、それが増えたり減ったりするようなら「上昇気味の異常」「下降気味の異常」だと判断できます。もちろん、一定の値で生産し続けている工程での話であり、試験の成績のように毎回の難易度が異なる場合には使えません。

用いる重みですが、通常は指数関数的に減衰する重みを掛けて平均を取ります。
これを、EWMA(エキスポ―ネンシャリー・ウェイテッド・ムービング・アベレージ)と言います。
翻訳すると「指数加重移動平均」です。まさに加重平均です。
また、上記の品質管理手法を「EWMA管理図」と言い、国際規格ISOにも記載されています。

さて、ご質問の件です。
3個しかない、どうしよう。という時ですね。
品質管理に用いる指数関数的に減衰する重みも過去に向かって永遠に続いて0にならないです。サンプルが足りない!という危惧が生じます。
でも、ご心配なく。
最新の予測値は、1個前の実測値と予測値があれば、計算できるのです。減衰させる公比をλ(0.8とかいう値)とすれば、

(最新の予測値)=λ×(1個前の実測値)+(1-λ)×(1個前の予測値)

もちろん、1個目の予測値の計算時は(0個目の実測値)=(0個めの予測値)=(1個目の実測値)で代用してください。
重みに等比数列を用いると、このように計算できますから、「他は5回だがCは3回しかない」と悩むことはないのです。
それにEWMA法として確立していますから、論文にもEWMAを用いたって書けば査読はスルーです。
λの値は、過去何個分を引きずるかに影響しますが、ここでは紙幅の都合で書きません。ネット等で調べてください。

最後に「偏差値」ですが、成績の偏差値というのは、正規分布を仮定したときの、当該サンプルの「相対的位置」を表す指標です。
これは、平均が50、標準偏差が10に基準化されていますので、工程のデータのように扱えます。
AさんBさんCさん・・・の「最新の実力の予測値」は生点の加重平均で求めていけません。毎回難易度が一定なら良いですが、そんなことは無理です。しかし毎回の偏差値なら基準化されています。
そして、偏差値の加重平均から求められたAさんBさんCさん・・・の偏差の累積和を見れば、各人が上昇気味なのか下降気味なのかが分かると思います。瞬間瞬間の偏差値は、出題範囲の得手不得手で乱高下し一喜一憂しなければなりませんが、加重平均を用いているのでデータとしては安定していると思います。

学校の先生とお見受けしましたが、研究発表できるような内容ですね。でも、予備校などでは、もう既にやっているかもしれませんね。
    • good
    • 0
この回答へのお礼

大変勉強になりました。
がしかし、まだまだわからないことだらけで kamiyasiroさんの回答にしっかりとお礼もできず、恥ずかしい限りです。
まずはEWMAというものをしっかりと勉強することから始めます。

お礼日時:2020/06/26 21:37

EWMAでデータの個数の差を気にしなくてもよい理由は、


No.3 の説明に尽きます。
御質問のようにデータ個数が極端に少ない場合には、
同様には考えれられないでしょう。
三人が7回、5回、3回であれば、4回め5回めについては
ほぼ 0 の重みを掛けざるを得ず、それなら、各人
最新3回ぶんだけを計算対象にしてもあまり違いはありません。
    • good
    • 0
この回答へのお礼

ご回答ありがとうございます。
なるほどです!
統計に無知な者が研究をスタートするには、もっとシンプルに、直近3回分だけ見ても問題ないのですね。ますますこの件について勉強したくなる心強いお言葉をありがとうございました。

お礼日時:2020/06/26 21:36

#2です。



当然ですが、指数加重移動平均は、個数が不揃いでも、全て1個目の値から愚直に計算しないといけません。
でも、データ列が1000個とかいうときは、100個前くらいから移動平均の計算を始めれば良いです。
なぜなら、それより過去は重みがほぼ0だからです。
    • good
    • 0
この回答へのお礼

度々のご回答ありがとうございます。
統計学に無知すぎる私からすれば、最後の一文「過去は重みがほぼ0」という言葉に衝撃を受けました。(いろいろな意味で)納得できないと思いつつも、加重平均を当てはめると、過去より今(直近)の状態を知ることで、次に取るべき行動がわかるのではないかという仮説がありました。
まだまだわからないことがたくさんありすぎて、何から再質問すればいいのかもわからず…。このようなお礼で失礼します。

本当にありがとうございました。

お礼日時:2020/06/26 21:38

その「重み」って何なのか、何のためにそんなものを付けるのか、ということに依存します。



「偏差値」を求めるのに「重み」などは不要です。
    • good
    • 0
この回答へのお礼

お答えいただきありがとうございます。

すみません(汗)
私自身も、重みづけに意味があるのだろうかと思いながらも、とりあえずやってみるかと進めております^^;

単純に平均を取るのではなく、次回テストに時期的に近い過去テストほどウエイトを重くした結果、どういうことがいえるのだろうか?
という興味本位でして・・・。

お礼日時:2020/06/26 10:42

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!