
A 回答 (4件)
- 最新から表示
- 回答順に表示
No.4
- 回答日時:
#3です。
期待値(平均)を変えてしまうのを、バイアス(偏差)と言います。バリアンス(分散)に対する言葉です。
統計的な3大バイアスというのがあります。
・サンプルセレクション・バイアス(行に起因するバイアス)
・削除変数バイアス(列に起因するバイアス)
・内生性バイアス(誤差に起因するバイアス)
内生性バイアスとは、説明変数により誤差が異なるときに生じるバイアスです。
#2はサンプルセレクション・バイアス、
#3は内生性バイアスが原因だった、ということになります。
ちなみに、削除変数バイアスは、学歴と年収のような関係を言うとき、高度な資格(医師や弁護士)という変数を見落とすことに起因するバイアスです。
最終的に、
>具体的にはどのような場合か、
というご質問に大局的見地で回答すると、
「このようなバイアスが生じる原因は、主に3つある」ということになります。
No.3
- 回答日時:
>具体的にどのような場合でしょうか。
先に「構成数の違い」を回答しましたが、別の原因を示します。
事例は、
https://qiita.com/aoki-h/items/b8281823146b0e6c3 …
8 Schools Problem
ベイズ統計言語Stanの開発者 Andrew Gelmanによる教科書『Bayesian Data Analysis』で取り上げられているデータ。
8つの高校で実施された標準学力テスト対策のコーチングの効果のデータ。
しかし、そもそも学校間では生徒の学力に差がある。
また、学校間で効果のばらつきも見られる。
そこから、コーチング効果だけを分離する問題。
「マルチレベル・モデル」という問題で、マルチレベル分析とかマルチレベルモデルでググれば、多数のテキストがヒットします。
この数値例では、構成数は分っていません。
というか、被験者は同一人物で、特訓のビフォア・アフターかもしれません。よって構成数の違いは無いかもしれません。
ここでは、標準誤差の違いにより、バイアスが生まれています。
お断り:単純な平均でもコーチング効果が出ているので、逆転にはなっていません。(正味の効果を間違えてしまうということです)
No.2
- 回答日時:
#1さんのおっしゃる通り、構成数が異なるときに生じるバイアスですね。
サンプルセレクション・バイアスと呼ばれます。
有名なのは、シンプソンのパラドックス(1951)。
このようなバイアスを取り除いて期待値(平均)を求める方法が「最小二乗平均」。
シンプソンのパラドックスの数値例は、有名なパール先生の近刊にも出ています。訳本とそれに出てくる数値例を挙げておきます。
Judea Pearl,落海浩[訳](2019)「入門統計的因果推論」,朝倉書店,p3
700人の患者について回復率を調査した。350人は旧療法、350人は新療法。
このケースでは、期待値は正しくはオッズ比を使いますが、ここでは簡単に率で示します。
男性旧療法:270人中234人治癒
男性新療法:87人中81人治癒
回復率87%→新療法で93%に向上
女性旧療法:80人中55人治癒
女性新療法:263人中192人治癒
回復率69%→新療法で73%に向上
男女を合計すると、
男女旧療法:350人中289人治癒
男女新療法:350人中273人治癒
回復率83%→78%
男女別では見られた新療法の治癒効果が逆転して低くなる。
ネットでシンプソンのパラドックスをググると、出てくる数値例はまちまちですが、どれも言っていることは同じです。
No.1
- 回答日時:
構成個体数と、「期待値」を求める統計変量との関係によってはあり得るでしょう。
たとえば
A1:100人でテスト結果の期待値が 20点
A2:10人でテスト結果の期待値が 90点
B1:20人でテスト結果の期待値が 10点
B2:200人でテスト結果の期待値が 80点
の場合には、明らかに
A1の期待値>B1の期待値
A2の期待値>B2の期待値
です。
ところが
A1:人数分の得点の合計は 20点 × 100人 = 2000点・人
A2:人数分の得点の合計は 90点 × 10人 = 900点・人
B1:人数分の得点の合計は 10点 × 20人 = 200点・人
B2:人数分の得点の合計は 80点 × 200人 = 16000点・人
ですから、
(A1 + A2) の期待値:
(2000点・人 + 900点・人) ÷ 110人 = 26.3636・・・ ≒ 26.4点
(B1 + B2) の期待値:
(200点・人 + 16000点・人) ÷ 220人 = 73.6363・・・ ≒ 73.6点
であり、
(A1 + A2) の期待値 < (B1 + B2) の期待値
となります。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 数学 数学の問題です。 問1: ある(人数の非常に多い)集団から無作為に6名を選んで身長を測ったところ、そ 2 2022/12/09 12:03
- 統計学 期待値を求める問題はとりあえず確率を全部出せばいいってことで答えは出せるのですが、なぜそれぞれの確率 2 2023/07/08 23:11
- 統計学 「期待値が高い」という言葉を日常的に使う場合、それは統計学の期待値とは全く違う意味で使われてますか? 1 2022/07/25 13:18
- 統計学 確率統計の問題です。 3 2022/04/07 04:39
- その他(社会・学校・職場) 個人主義の人間が、集団主義の人間達と上手く付き合っていくにはどうすればいいですか? 4 2023/03/02 10:34
- その他(教育・科学・学問) 期待値について 2 2022/11/27 16:31
- 数学 ポアソン分布と二項分布について ・ポアソン分布における期待値と分散は等しくならない場合がある。 ・二 1 2022/06/12 16:29
- Visual Basic(VBA) vbaエクセルマクロ RemoveDuplicatesについて RemoveDuplicatesを使 1 2023/02/27 22:21
- Visual Basic(VBA) vbaエクセルマクロ RemoveDuplicatesについて RemoveDuplicatesを使 3 2023/02/28 01:13
- Excel(エクセル) IF関数について 5 2023/06/26 00:46
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
宮崎県の市について
-
教えてください
-
数学(ほぼ統計)について、教...
-
至急!!エクセルで度数分布表...
-
正規分布の加法性について
-
2つの正規分布を合成したらど...
-
K回同期加算すると、雑音が1/K...
-
糸井重里「若いときから考えて...
-
分散が1でない場合のカイ二乗分...
-
分散…
-
反復試行 nが十分大きいとき...
-
1〜6の目が等しい確率で出るサ...
-
統計熱力学の冒頭部分です。
-
正規分布の問題なのですが
-
正規化された確率分布を合成す...
-
標準偏差
-
正規分布に従わないと標準偏差...
-
偏差値50~55の差と偏差値70~7...
-
標準偏差バーをグラフに入れた...
-
工程能力のN数補正について
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
重荷分散の為に敷く板には木製...
-
宮崎県の市について
-
2つの正規分布を合成したらど...
-
数学(ほぼ統計)について、教...
-
K回同期加算すると、雑音が1/K...
-
統計データーの簡素なロギング
-
至急!!エクセルで度数分布表...
-
統計の分散のイメージ
-
統計学、共分散・相関係数です
-
数学の答えと解き方を教えてく...
-
分散の定義について
-
以下の数学の問題を教えてくだ...
-
X/Yの確率分布(コーシー分布で...
-
分散が大きいとデータの偏りが...
-
正規分布の加法性について
-
質量がばらついているサンプル...
-
長期的に見れば予測は当たりや...
-
ランダムに答えた場合の正答率
-
金融資産1億円以上持っている...
-
統計学の問題です。 ある駅の売...
おすすめ情報