数学の「確率」に詳しい人がいらっしゃいましたら教えてください。
確率とはその母集団の多い少ないに関係なく、ある程度の正確性というかデータの確実性が成立しますか?
例えば、母集団が1万人の中の確率と10人の確率でもデータの精度に変わりはありませんか? それとも精度に差は出ますか?
この前、テレビでお酒の強い弱いの話題が触れられていました。
①たくさん飲めて顔も赤くならないタイプ(アルデヒド分解酵素とアルコール分解酵素が両者活性型) 日本人の56%がお酒が強いこのタイプ
②少量のお酒で顔が赤くなるタイプ(アルデヒド分解酵素が不活性型でアルコール分解酵素は活性型) 日本人の40%がお酒が弱いこのタイプ
③お酒自体が飲めない下戸タイプ(アルデヒド分解酵素とアルコール分解酵素が両失活型) 日本人の4%がお酒が強いこのタイプ
という割合になるそうです。強い:弱い:下戸という比率は日本人だと56:40:4で、この比率に男女差は全く無いそうです。
「確率」で考えた時、例えば日本人の全人口の女性で考えた時に、強い:弱い:下戸という比率=56:40:4ということになるんだと思いますが、例えば、女子大のとあるゼミナールに属するゼミ生の女子大生10人の集団でも同じ比率(56:40:4)になる可能性が高いということですか?
また、例えば大手企業の楽天グループの正社員の日本人女性は合計しても1000人以上はいると思いますが、楽天グループの正社員の日本人女性という母集団だと同じ比率(56:40:4)になる可能性は大きいと思いますが、それぞれの部署に所属する女性社員でも同じ比率(56:40:4)になるということですか?
数学に詳しい方がいらっしゃいましたら教えてください。
お願いします。
No.5
- 回答日時:
「確率」ってのは数学の話です。
現実の話とは無関係であり、「母集団」なんて概念とも無縁です。だから、このご質問はナンセンス。一方、
https://oshiete.goo.ne.jp/qa/12813837.html
は「推測統計」すなわち現実のデータに基づく推定の方法の話のようなので、ならば、こちらのご質問には(読んでないけど、おそらく)意味がある。
確率は統計に応用されるけれども、だからって両者をごっちゃにしてはいけないっすよ。
No.4
- 回答日時:
#1です。
ご質問は、統計量が母集団に依存するか否かを問われていると思います。
「どのような母集団についての統計量(母平均とか母比率とか)か」を読みとるのは非常に重要です。それは常にバイアスが入っているからです。
「統計的な3大バイアス」というものがあります。
①サンプルセレクションバイアス(エクセル表でいうと行を抜くケース)
例えば、女性のサンプルだけ取り出せば、平均等が変わってきます。
②削除変数バイアス(同時方程式バイアス)(エクセル表でいうと列を抜くケース)
例えば、分解酵素の働きと女性の月経との間に交絡があるときに、ランダム化比較試験の際にそれを見落としているとします。(エクセル表に月経という列が無いのです。)
すると「性差なし」という結論が出てしまいますが、実は性差があったりします。(普段酒に強くても生理のときは酒に弱い、これはよく言われます)
③内生性バイアス(変数と誤差が相関を持つケース)
例えば、因子である分解酵素の活性化度と、生体反応のばらつきが相関を持ってしまうと、正しい検定ができません。検定は「因子と誤差は無相関であること」が大前提だからです。
ご質問の内容は①のサンプルセレクションバイアスに関するものかなあと思いました。
No.3
- 回答日時:
56:40:4というのは、「日本人の、ある母集団で統計を取ったらそういう結果だった」というだけのことです。
それがいつでも正しいというわけではありませんが、無作為に抽出した母集団であれば、おおよそ正しい可能性が高いということがいえます。
たとえばこの母集団が「居酒屋で深夜まで飲んでる人1000人に聞きました!」みたいなのだったら結果は変わりますよね。
そしてこの「おおよそ」は、母集団の数で変わってきます。
仮に日本人全員の統計を取ったら、その時点での正確な統計です。
女子大生10人の集団だったら、56:40:4の「4」は母集団の10分の1以下ですから、その比率(56:40:4)が10人の集団で正確に現れることはあり得ません。
楽天グループだってたとえばお酒を飲む人が採用されやすいという文化が仮にあれば、その比率と大きく違う結果になるかもしれません。逆の場合もあるかもしれません。
統計というのは、「あるとき、あるところで、ある母集団で統計を取ったらそういう結果だった」というだけです。それ以上の意味はありません。
No.1ベストアンサー
- 回答日時:
このような医学的・疫学的な調査は、ランダム化比較試験という年齢・性別・居住地域などをランダム化して、アルデヒド分解酵素の活性度だけに着目して2群に分け(本調査では2×2群)、アルコールパッチテストを行うことで、分解酵素と「赤くなるという生体反応」の因果関係を調べています。
分解酵素の活性度の人口内訳は、血液検査などから分かるので、そこから類推して、強い:弱い:下戸という人口比率を出しています。
強い:弱い:下戸なんか、飲む量、酒の種類などツッコミどころ満載ですが、パッチテストによるものだよ、と言われれば頷けると思います。
①母集団の大きさの依存性
類推というかあくまで推定値ですが、正確な分解酵素の人口比との因果関係から求めていますので、母集団の大きさによらず、ほぼ正確ではあるのですが、飲む量、酒の種類などに左右される値でもあります。
②母集団の属性の依存性
一方、女子大生(性別)、特定の会社の社員(年齢)となると、バイアスが入りますので、調査結果をそのまま適用することはできません。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 数学の「確率」に詳しい人がいらっしゃいましたら教えてください。 2 2022/07/29 16:52
- お酒・アルコール アルコール耐性証明書の導入の是非について 1 2021/11/23 14:31
- 飲み会・パーティー 女性は、お酒に強い体質・お酒に弱い体質のどちらが有利だと思いますか? 2 2022/06/21 17:22
- 依存症 日本人の21歳〜27歳までの女性がアルコール依存症の予備軍という衝撃な数字についてどう思いますか? 1 2022/03/27 14:35
- 大学・短大 数年前に起きた明治大学クライス「女子大生集団昏睡事件」と再発防止策について。 2 2021/11/24 14:57
- 日本語 「酒が強い」・「酒が弱い」という日本語の使い方は間違っていると思います。 6 2022/06/14 18:27
- 大学・短大 近頃の大学生(女子学生)の飲酒率について質問です。 1 2022/06/07 15:43
- 医学 女性の飲酒の是非について 2 2022/03/26 16:40
- 大学・短大 女子大生(成人している大学2年以降の学生)の飲酒とリスクについて質問です。 5 2022/03/26 19:45
- 子供 男性に必要で女性に不要なモノ(才能・能力・身体的機能など)は何だと思いますか? 3 2022/06/21 17:07
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
統計でいう「n」は、何の略な...
-
N数?n数?サンプル数の「エヌ...
-
多数決 統計学に詳しい方教え...
-
統計誤差について
-
統計学における無作為抽出に関...
-
t検定って何ですか
-
有意差があってもサンプルサイ...
-
評価者により採点に差が出るこ...
-
多変量解析のサンプル数の妥当性
-
統計学-母集団が少ない場合の...
-
標準偏差
-
正規分布に従わないと標準偏差...
-
統計学でいうRSD%とは何ですか。
-
統計学における有効数字につい...
-
標準偏差バーをグラフに入れた...
-
平均値と中庸値の違い
-
パーセンテージのバラツキを表...
-
サンプル数が1とサンプル数が...
-
相対標準偏差についてですが…
-
標準偏差を求める際のデータ数...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
統計でいう「n」は、何の略な...
-
N数?n数?サンプル数の「エヌ...
-
統計学-母集団が少ない場合の...
-
評価者により採点に差が出るこ...
-
t検定のt値について
-
信頼区間から標準偏差の求め方
-
適正なサンプル数について
-
標準体重の求め方
-
有意差があってもサンプルサイ...
-
統計学の検出力の問題が分から...
-
母集団と確率空間の違い
-
多数決 統計学に詳しい方教え...
-
エクセルで「集団から最大値、...
-
時系列データの検定
-
ある集団の平均身長を調べたい....
-
ある試験の受験者全員の平均点...
-
点推定と区間推定について
-
モデルのパラメータの定義がい...
-
Zスコアと標準偏差について
-
アンケート調査に必要なサンプル数
おすすめ情報