確率についての質問です。内容は独立性の検定についてです。
統計学の内容です。
BellCurve「統計Web」
内容:独立性の検定―最もポピュラーなカイ二乗検定
URL:https://bellcurve.jp/statistics/blog/14038.html
このサイトを読んでいましたが、一つ質問があります。
「2つの事象AとBについて、その同時確率P(AB)がAの確率とBの確率との積となるならば、すなわち、P(AB)=P(A)・P(B)となるならば、AとBは独立であるという」
と書かれていて、その下に具体例があります。その具体例は大学生の美容室と理容室の利用について性差があるかという内容ですが、
ここでいう事象Aが「女性である」となっています。つまりP(A)というのは「女性である確率」を指すわけですが、そこの解釈につまづいています。
「女性である確率」や「男性である確率」という表現でつまづいています。その違和感について言葉で説明するのが難しいのですが、男性か女性かというのが確率で扱うことに違和感を感じています。
アンケートの取り方によっては男性2割、女性8割にもなりますし、男性3割、女性7割にもなります。
どう解釈すれば違和感なく「女性である確率」や「男性である確率」を理解できますでしょうか?つまり、どういう理解でいれば良いでしょうか?
No.3ベストアンサー
- 回答日時:
恐らくですが「男性(or女性)である確率」と言うのを「私が男性である確率」「大島優子が女性である確率」と言った具合に受け止めるからおかしく感じるのでは? そう受け止めているとしたら確かに「確率もヘッタクレもないじゃん! もう決定してるじゃん!」と言う話になるのはむしろ当然でしょう。
なので理容室の話で言うならば、例えば「○○理容室に次に来店するのが男性(or女性)である確率」と言ったものを考えるならば「男性(or女性)である確率」と言う表現に違和感は持たなくなると思います。>理容室の話で言うならば、例えば「○○理容室に次に来店するのが男性(or女性)である確率」と言ったものを考えるならば
確かにそう考えるならば違和感は感じませんね。
アンケートの事例でも、次にアンケートに回答(またはアンケートを提出)する人が男性である確率と考えれば違和感は感じませんね。
あとは全数調査で考えていたから混乱していたのかもしれません。そもそも確率を持ち出す必要のない集団ということです。
ある大人数の集団で男性が6割、女性が4割で構成されていたとしたら、次にアンケートに男性が回答する確率が3/5となるみたいに考えれば、男性である確率という表現にも納得はいきます。
No.2
- 回答日時:
No.1 です。
「お礼」に書かれたことについて。>つまりここでの男女の確率というのは、あくまで「観察した人達の集団から無作為に抽出した時の確率」という理解でよろしいのでしょうか?
はい。
>例えば、男女100人のアンケートを考えた際に、男30人、女70人の場合は男である確率は3/10であるといったことでしょうか?
はい。
「確率」という言葉がしっくりこないのなら、単に「比率」とか「構成率」とか「○○率」と呼べばよいと思います。「全部足し合わせると 1 になる」という条件さえ満たせば。
素早いご返信をありがとうございます。比率とすれば理解が出来ます。
ということは、独立性検定を行う際は以下の流れになるのでしょうか。同じようなことを聞いているかもしれませんが、最後に確認をしたいのでお願いします。
例えば「性別によってある病気が重症化率が違うか」ということを調べようとしたときに適当に罹患したことがある男女1000人に調査した結果、
・男300人、女700人だった場合は、男である確率が3/10として独立性の検定を行うこととする
・男400人、女600人だった場合は、男である確率が4/10として独立性の検定を行うこととする
というように調査結果によりそこの確率を変えていくという認識でよろしかったでしょうか?
No.1
- 回答日時:
「Aの確率」を「ある事象がAであることを観測値から計算したもの」と考えればよいのでは?
未知の母集団の母数(平均値や標準偏差)を知ろうと思ったら、そうするのが当然ですよね?
製品の中から1,000個のサンプルを採って15個の不良品があった場合には、「不良確率」(の最もありそうな値)を「0.015」と考えます。
ブサイクなサイコロを振って、1の目が出る回数を観測して100回中21だったら、その「ブサイクなサイコロ」の「1の目の出る確率」(の最もありそうな値)は「21/100」とみなしますよね?
「サイコロなんだから 1/6 のはずだ」と考える方がおかしいです。
それと同じではありませんか?
「通行人」や「入店者」を観察して、その「男女」を調べたものが「男性の確率」「女性の確率」(の最もありそうな値)です。
「男性」が 1/2 のはずだ、と考える方がおかしいです。
「通行人」や「入店者」を観察するのですから、「世の中全体から無作為に抽出する」というのと違って当然です。
ご回答ありがとうございます。
つまりここでの男女の確率というのは、あくまで「観察した人達の集団から無作為に抽出した時の確率」という理解でよろしいのでしょうか?
例えば、男女100人のアンケートを考えた際に、男30人、女70人の場合は男である確率は3/10であるといったことでしょうか?
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 物理学 宇宙は無限か有限か? 4 2023/05/28 13:35
- 数学 二項定理と乗法定理の問題について 2 2022/04/25 22:05
- 統計学 数学の「確率」に詳しい人がいらっしゃいましたら教えてください。 2 2022/07/29 16:52
- 数学 確率、排反と独立の問題について 2 2022/04/19 11:39
- 数学 確率の問題を教えてください 2 2022/10/21 14:23
- その他(社会・学校・職場) 日本社会は女性に甘すぎませんか? 甘やかせすぎではないですか? 3 2022/05/05 15:25
- 統計学 X 病というある病気があり,その病気の発見には Y という検査薬が用いられるという.成人が X 病に 3 2022/07/22 00:56
- 数学 モンティ・ホール問題 12 2022/09/24 12:47
- 数学 広島県における新型コロナウイルスの感染率は1万人当たり14人 (2022年12月19日現在) であり 1 2023/01/03 23:43
- お酒・アルコール 高学歴の女性は飲酒率が高いという仮説は本当だと思いますか? 5 2022/08/11 11:33
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
±4σに入る確率について教えてく...
-
ピリオドグラムって…
-
[数学] 無限大÷無限大の答えは?
-
同じクラスになる確率
-
確率が重複する場合の計算方法
-
1から13までの数字が1つずつ書...
-
スマホゲームをしていて気にな...
-
4人がじゃんけんしてあいこにな...
-
円周率の最後の数字が9である確率
-
事象の確率と三角関数の関係に...
-
確率密度関数の縦軸Y
-
発生確率0と見なせるのは?
-
どう確率を出したらいいか教え...
-
相関係数にでる P<0.001のPは...
-
R言語
-
スマホを見る度によく2時55分と...
-
トランプを使った確率の計算方...
-
【数学】 確率で、復元抽出が独...
-
確率の問題
-
サイコロを9回振って3回連続で...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
±4σに入る確率について教えてく...
-
丁半バクチの確率
-
同じクラスになる確率
-
4人がじゃんけんしてあいこにな...
-
可能性は「高い」?「大きい」?
-
8頭身あって10人に1人くらいの...
-
相関係数についてくるP値とは何...
-
卵が2個連続双子の確率は?
-
確率が重複する場合の計算方法
-
1から13までの数字が1つずつ書...
-
1σの確率の計算方法?
-
スマホゲームをしていて気にな...
-
どう確率を出したらいいか教え...
-
勝率50%のじゃんけんやコイ...
-
4人のうち3人が勝ち1人が負けに...
-
2人でじゃんけんをして1人の人...
-
確率の問題です。 スペード、ハ...
-
確率密度関数の縦軸Y
-
発生確率0と見なせるのは?
-
Cp値
おすすめ情報
質問の背景も追記します。
「性別によってある病気が重症化率が違うか」ということについて2元分割表の多項分布モデルを考えた際に、男性である確率をp、重症化する確率をqとして確率密度関数を求めた際に
男性で重症化する人数:n_11
男性で重症化しない人数:n_12
女性で重症化する人数:n_21
女性で重症化しない人数:n_22
となる確率は2つの事象が独立している際に
f((n_ij);(p,q))∝(pq)^(n_11)*{p(1-q)}^(n12)*{(1-p)q}^(n21)*{(1-p)(1-q)}^(n22)
となると思います。
しかし、pはそもそも定まっているのではないかと考えていました。ただ回答を踏まえると、そもそもこの確率密度関数は「分割表のように数値が出される確率」であって、独立性の話とはまた違うのかなと考察しています。