アプリ版:「スタンプのみでお礼する」機能のリリースについて

ちょっと分かりにくいかもしれませんが,統計分析で小規模データから全国への効果を推定できればと考えています.
具体的な例として,"ある学校のクラス"でトレーニング前後での50 m走のタイムの変化が分かっている場合に,そのトレーニングを全国に普及させた場合の改善効果(タイム減少の平均とその信頼区間 など)を見積もりたいと考えています.

・この例はイメージです.実際に計画している内容とは全く関係ありません.
・"あるクラス"の方のデータを増やして分布を近づけるということはできません.数に限りがあります(全国は全部で数百~数千件,"あるクラス"は数十件とイメージしてください).
・"あるクラス"と全国とでは身長,親の収入の分布も異なり(かつ正規分布は保証されない),50 m走タイムの平均なども異なるとします.
・全国データは身長110-120cm,収入600-800万円で7.5-8.0秒が〇〇人,8.0-8.5秒が××人のように大雑把な集計結果だけ利用可能とします.
・添付した図では2変数で描いていますが,実際は多変数となる予定です.

特に2番目,3番目の内容があり,あるクラスは全国をある程度カバーしているものの,全体を代表しているとは言い難い状況ですので,単に全国平均タイムを定数倍だけ減少させる訳にはいかないのかと考えています.
これは勝手な思い込みですが,うまい具合に"あるクラス"の各データに全国分布との関係に基づく重みづけすることで全国値を求めるのに使えるのではないかと思うのですが,今度は個人差なども入ってしまい,手法が分かりません.

ご教示いただけますよう,よろしくお願いいたします.

「統計分析で小規模データから全国への効果を」の質問画像

A 回答 (3件)

それそのものの万能な方法はないと思いますが、強い相関が考えられる他の全国データがあれば、そのデータからの推定で特定地域のデータを全国に拡張して推定することは可能だと思います。



たとえば、トレーニングによる「水泳」や「ボール投げ」の効果の各県別データのような、あなたが全国に展開したいと考えているのと似たような「分布」、「特性」をもったものがあれば、「50 m走のタイム」もそれと強い相関があるはず、という仮定で推定することができるのではないでしょうか。

実際にどれだけの相関があるのか、その推定が妥当であるかの検証や、推定精度の評価などいろいろな工夫や付帯作業は必要ですが、妥当な仮定や仮説に基づいたものであれば、それなりの説得性や客観性を持たせられるのではないでしょうか。
    • good
    • 0
この回答へのお礼

ご回答ありがとうございます.
50 m走のタイムと相関が高そうな別の項目を使うという発想はなかったため,参考にさせていただきたいと思います.

ただ,質問にも書かせていただいたように,今回50 m走のタイムはあくまで例え話で,実際にやりたいことは別にあり,
実際には,類似の分布が考えにくいものを対象としようとしています.

「ラジオ体操の参加率」くらい離れた情報なら何とか集められるかもしれませんが,
「トレーニングによる水泳のタイム変化」くらい50 m走のタイム変化に近そうなものは今のところ思いつかない状況です.

お礼日時:2019/08/20 17:52

No.1です。



> 思い切った仮定を置いて,とりあえずの値を導く方向で
これは、いわゆる統計の操作になります。役人としては優秀な方、ですが。
    • good
    • 0
この回答へのお礼

再度のコメントありがとうございます.
この思い切りが正直難しいところです.この辺の統計処理について何か追加のコメントを頂けると幸いです.

お礼日時:2019/08/20 18:14

> 小規模データから全国への効果を推定する方法はありますか?


ありません。
小規模データーは、それが特異なのか広域平均なのかが全く分かりません。
あるとすれば、それは広域に対する地域順位が無い、という事になります。
    • good
    • 0
この回答へのお礼

ご回答ありがとうございます.
統計的に真っ当な方法がないのであれば,思い切った仮定を置いて,とりあえずの値を導く方向で考えようと思います.

お礼日時:2019/08/20 16:11

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!