プロが教えるわが家の防犯対策術!

中が見えない箱に玉が20個入れてあるとします。そのうち5つを取り出したところ、全てが赤い玉でした。このとき20個の玉の全てが赤い玉である確率はどうなるのでしょうか。
答えを分かり易く誘導記述していただくと、数式にそれほど強くない私としては助かります。

質問者からの補足コメント

  • このような問題でも解があるのかな?と思っての質問でした。ベイズ統計についても、何も知らないまま、そんな問題でも答えが出ると何かの本で読んだことを思い出し、専門性の高い人に質問してみようと投稿した次第です。
    お二方の論戦は分からぬなりに大変勉強になりました。ご両名様に厚く感謝いたしながら質問を閉じさせていただきます。。

      補足日時:2019/02/22 07:54

A 回答 (22件中21~22件)

ご質問の話が難しすぎるんで、まずは単純化した問題を考えましょう:



Q: 箱に2個の玉が入っていて、その色は赤か赤以外である。ランダムに1個取り出したら赤だった。さて、はじめに箱の中に入っていた2個の玉がどちらも赤であった確率はいくらか?(すなわち、取り出していない1個が赤である確率はいくらか?)

 まずは直感的に考えてみて、如何でしょう?Qが求めている確率が推定できそうな気がしますかね?

 「ランダムに1個取り出したら赤だった」という事象をRと書くことにします。すると、
  P(R|赤2個が入っていた) = 1
であり
  P(R|赤1個が入っていた) = 1/2
である。なので、実際にRが生じたということの説明としては「赤2個が入っていた」という説明の方がもっともらしい。こっちの方が説明の蓋然性が高くて説得力があるじゃんかよぉ。

という主張は可能です。が、これじゃ「2個の玉がどちらも赤であった確率」は出せません。

 そこで腰を据えてやってみましょう。「2個の玉がどちらも赤であった確率」がθであるときに事象Rが生じる確率はθの一次式で表され、
  P(R|θ) = θ + (1-θ)/2 = (1+θ)/2
です。また、事象Rが生じる全確率P(R)は、θの分布をP(θ)とするとき
  P(R) = ∫P(R|θ)P(θ) dθ (積分はθ=0〜1の定積分)
であり、これはP(θ) が決まっていれば「θによらない定数」になります。
 したがって「ベイズの定理」(「なんでこんなのに定理とか名前つけてるねん」といつも思いますが)を用いて、「Rが生じたとき、θである確率」は
  P(θ|R)= P(R|θ)P(θ)/P(R) ∝ P(θ)(1+θ)/2 (∝は「比例する」という意味)
だとわかります。注意すべきなのは、P(θ|R)とはパラメータθの確率(正確には確率密度関数)のことであって、θは確率を表していますから、つまりP(θ|R)は「確率の確率密度関数」の話をしている、ということです。つまりベイズ推定は確率θの具体的な値を推定する(点推定する)わけではありません。
 P(θ)は先験確率(事前確率)と呼ばれるものです。箱に2個の玉を入れることに関する何らかの情報があれば、P(θ)がどんな確率密度関数なのかが絞れます。(たとえば「赤A個、白B個のボールの中からランダムに2個を選んで箱に入れた」というような情報があれば、P(θ)がはっきり定まります。)しかしそういう情報が全くないのなら、客観的に言えることはもうない。ここで行き止まりです。もしもこの先に話が続くならば、それはなんらか主観的な意見・感想を述べているにすぎません。(すなわち、この場合にθははっきりと計算できるとか言う人がいたら、その人は何か勘違いしているか、何らか根拠レスなジョーシキなり思い込みなりに凝り固まっているに違いありません。)

 で、その「もしも」として、たとえば「何の情報もないのなら、P(θ)は一様分布(つまりθがいくらであろうと一定)だと仮定してみるとどうか?」とやると(もちろん、これだって根拠レスです)、
  P(θ|R) ∝ P(R|θ)= (1+θ)/2
ということになる。これでもθは具体的には決まらないわけで、これが「点推定ではない」ということです。でも「P(θ|R)が最大になるのはθ=1の時だ」ということならわかり、これは最初に述べた「説明の蓋然性」の話と整合している。また、P(θ)を一様分布だと仮定したので、P(θ|R) の期待値は
   ∫θ (1+θ)/2 dθ (積分はθ=0~1の定積分)
   = 2/3
だから、「θ=2/3ぐらいだろと言っとけば大きな間違いはないんじゃ?」と考えることもできる。主観的な仮定をひとつ決めてもなお、いろんな結論が引き出せる(引き出せてしまう)わけです。

 で、ご質問の場合にはですね(θが1個の数値ではなく15次元のベクトル値になってややこしい、という点を除いては)ほぼ同じ論理展開によって、上記と同様のぐだぐだな話にしかならない、ということを大体想像していただけるんじゃなかろうか。
    • good
    • 0

企業でSQCを推進する立場の者です。

博士(工学)です。

興味深い問題です。前提の設定が①②考えられますが、設定によっては非常に難しいです。
お尋ねします。5個取り出す試行は、①復元抽出ですか、②非復元抽出ですか。

①つまり、1個調べて箱に戻してガラガラして、また1個調べてというのが復元抽出で、このケースの観測は「2項分布」に従いますので、ベイズではExactに(数学的に厳密に)解くことが可能です。
事前分布として、例えばB(5,5)というベータ分布を仮定すると、5回中5回が赤ですので、赤玉の出現率はベイズではp=1/3になります。あとは、20個のPの確率質量をp=1/3として二項分布で計算するだけです。次の式です。
P=20C20×p^20×(1-p)^0=2.87×10E-10

②ところが、5個同時にあるいは1個ずつでも良いんですが、観測時に箱には15個しか残っていない状態が作り出されるというのは、5個の分布としては「超幾何分布」という分布になり、このような観測に用いるベイズの事前分布は何か、というところから調べなければなりません。私にとっては超難問です。

「そのうち5つを取り出したところ」と書いてありますので、②ですよね。

さて、方針です。
このケースでは、モンティホール・ジレンマのように、場合分けして、5/20~20/20までの項目毎に、超幾何分布で尤度計算をして求めるのが、近道かもしれませんね。

腕に覚えのある方、ご支援をお願いします。
    • good
    • 0
この回答へのお礼

ありがとうございました。5個取り出す試行は、②の非復元抽出です。私も、このような問題が統計計算で求め得るとは思ってもみませんでした。煩わせて申し訳けありません。

お礼日時:2019/02/10 15:13

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!