プロが教える店舗&オフィスのセキュリティ対策術

条件確率である
P(A|B)=P(A∩B)/P(B)
とは和訳するとどういう意味なのでしょうか?
またベイズの定理の
P(B|A)=P(A|B)×P(B)/P(A)
もうまく理解できません…何か良い例はないでしょうか?
回答よろしくおねがいします。

A 回答 (7件)

#4です。

ちょっとだけ勉強してきました。

僕はいんちきコインを賭博師に提供する職人で、3種類のいんちきコインを製造しているものとします。
夫々表が出る確率は、
タイプA・・・1/4
タイプB・・・1/3
タイプC・・・2/3
とします。(裏が出る確率は、それぞれ1-表が出る確率)

いま、タイプAを300枚、Bを100枚、Cを200枚造ったのですが、誤って全部混ぜてしまいました。(>_<)

そこで今その中から一枚一枚とって、それがA,B,Cのどのタイプか、調べることにしました。見た目・重量などでは区別がつかない(極めて精巧)ので、何度か投げて、表が出る割合を調べることにしました。

と言っても顧客の賭博師たちに卸すまでに時間がありません。(ToT)

何千回何万回と実験すれば、ほぼ正確に分類できるでしょうが、
せいぜい一枚につき10回ずつしか、実験できません。

さていま、一つのコインをとり、10回投げて、表が4回出たとします。この事象をTとします。

ということは、今起きたのは、
(ア)取り出したコインがAであって、10回中表が4回出た。
(イ)コインがBであって、10回中表が4回出た。
(ウ)コインがCであって、10回中表が4回出た。
のどれかですね。

取り出したコインがタイプAである事前確率(実験する前に考えられる確率)P(A)は300/(300+100+200))=1/2で、
タイプAを10回投げて表が4回出る確率P(T|A)は、10C4{(1/4)^4}{(3/4)^6}
ですね。
だから、一枚選んで10回投げたとき、(ア)となる確率は、このP(A)×P(T|A)で求まります。

同様に、
P(B)=1/6、P(T|B)=10C4{(1/3)^4}{(2/3)^6}
P(C)=1/3、P(T|C)=10C4{(2/3)^4}{(1/3)^6}
であり、
(イ)となる確率はP(B)P(T|B)
(ウ)となる確率はP(C)P(T|C)
で求まりますね。

ということは、Tが起きたとき、そのコインがAである確率は、
P(A|T)=P(A)P(T|A)/{P(A)P(T|A)+P(B)P(T|B)+P(C)P(T|C)}
で計算できるわけですね。
※分母は、イコールP(T)です。

そこで、計算機で計算すると、
P(A|T)=0.562
P(B|T)=0.292
P(C|T)=0.146
となり、このコインはきっとAだと推定できるわけです。

それであわてて分類して、無事売り抜けました。(さあ、失った信用はどの位でしょうか??)

素朴に考えると、4/10=0.4で、一番近いのはB、と考えてしまいますが、Bは枚数が少なく、Aは多いので、実はAである確率の方が大きくなるんですね。

とにかくこのように、たくさん実験できないときに推定をする際に、特に有用なようです。

長くなって済みません。
    • good
    • 2
この回答へのお礼

回答ありがとうございました。
頑張ってさらに理解を深めようと思います

お礼日時:2007/10/24 09:34

これは#1さんの仰ってる例が1番分かりやすいでしょうね。

「ベイズ統計学」となるとなかなか頭のいたい問題が出てきますが、「ベイズの定理」自体はそんなに問題にはならないとおもいます。#1さんの例をもう一度なぞってみます。

        B:男子 ¬B:女子  計
 A:眼鏡あり  10人  20人  30人
¬A:眼鏡なし  30人  40人  70人
    計    40人  60人  100人

一部変えてあるのは総計を100人、と付け足した事です。単にこれを使って計算してみればいいだけです。

P(A∩B)=男子の眼鏡クン/総数=10人/100人=10%

まあ、これは簡単でしょう。
次に、P(A|B)×P(B)を見てみましょう。P(A|B)は「男子と言う条件の下での眼鏡クンの割合」です。ここの数値には女子は関係ありません。またP(B)は「全体の中での男子の割合」ですね。

P(A|B)×P(B)=眼鏡クンの数/男子の数×男子の数/総数=眼鏡クンの数/総数=10人/100人=10%

はい。不思議な事に全く同じ数となりました。
次にP(B|A)×P(A)を調べてみます。P(B|A)は「眼鏡をかけてると言う条件の下での男子の割合」です。ここの数値には「眼鏡をかけてない」は関係ありません。またP(A)は「全体の中での眼鏡使用者の割合」ですね。

P(B|A)×P(A)=男子の数/眼鏡使用者の総数×眼鏡使用者の総数/総数=10人/30人×30人/100人=10%

と全く同じ数が得られます。
従って、

P(A∩B)=P(A|B)×P(B)=P(A|B)×P(A)

と言う関係が得られます。これがベイズの定理を導き出す前提です。

良くいわれるベイズの定理の応用では、「スパムメールフィルタ」と言うものがありますね。原理的には上のような判定法を用いています。
例えば「SEX」と言う単語が入ったメールを受け取る。そのメールがスパムか否か?と言う問題です。スパムだったら迷惑メールボックスに自動で突っ込んでほしい。そう言うプログラムを作りたい。
ベイズの定理を用いると、

P(スパムメール|SEX)=P(SEX|スパムメール)×P(スパムメール)/P(SEX)

と記述できます。左辺は「SEXと言う単語を含んだ上でのスパムメールである確率」右辺は「SEXと言う単語を含みかつスパムメールである」確率を「SEXと言う単語を含むメールを受け取った確率」で割ればよい。重要なのは、分子のP(SEX|スパムメール)と言う部分で、これが示唆するのは「スパムメールのデータベースがあり、そのうちの何件がSEXと言う単語を含んでいる」情報さえあれば、そこからP(スパムメール|SEX)が予測出来る、と言う事です。コンピュータ上で解釈するには非常に便利な数式なんです。
例えば、

           ¬B:ハム  B:スパム  計
¬A:SEXと言う単語ナシ  10通  20通  30通
 A:SEXと言う単語アリ  30通  40通  70通
         計    40通  60通  100通

なんてデータがあれば「SEXと言う単語が含まれている条件でのスパムである確率」は暫定的には計算が可能です(ハムメールとはスパムメールじゃない"通常の"メールの事を指します)。
こまかい部分のテクニックは色々とありますし、差はあります。例えば、実際は「たった一つの単語を使って」判定する事はあり得ず、複数の単語を使って判定します。また、P(スパムメール)を馬鹿正直に(上の例では)40/100と計算せず、適当な数値を使う場合もありますが、原理的には同じです。
この辺りは広義では「判別問題」といい、またスペシフィックには「テキスト分類問題」と呼びます。また、上のような「ベイズの定理」を使ったテクニックを「ナイーブベイズ分類法」等と呼びます。
    • good
    • 0
この回答へのお礼

詳しく説明していただき、ありがとうございます
具体例を用いると理解しやすいですね

お礼日時:2007/10/24 09:36

#3です。

ベイズの式の説明です。
数値例は、#1さんが示されたものを使わせていただきます。

この学校には、男子がP(B)=40/100の確率で入ってきます。そして、男子はP(A|B)=10/40の確率でメガネをかけます。女子はP(A|NotB)=20/60の確率でメガネをかけます。

生徒からランダムに1人を選んだところ、メガネをかけていることが判明しました。この人が男である確率は?というのが問題です。

実は、確率は、もともと「未来の事象」について述べるものであって「過去の事象」に関するものではありません。ここでは「男か女か」は過去の事実であって、すでに確定しており、単に解答者が「まだ知らない」だけの話です。このために「ベイズの定理」は、すべての数学者が納得しているものとは、なっていないのです。まだ「哲学的な」議論の余地を残しています(リンク先参照)。しかし、私たちは、このような必要にしばしば直面し、この定理を道具として便利に使っています。

ベイズの公式の発想は、(A(メガネ着用)となるすべての場合の確率)の中に占める(B(男子)を経由してA(メガネ)となる場合の確率)の割合が「メガネの生徒が男である確率」であって、次のように書くことができます。

P(B|A)=P(B)P(A|B)/(P(B)P(A|B)+P(NotB)P(A|NotB))----(1)
数値は、(2/5)(1/4)/((2/5)(1/3)+(3/5)(1/3))=1/3
この式を簡単にすると、
P(B|A)=P(A|B)(P(B)/P(A))----(2)
数値は、(1/4)((2/5)/(3/10))=1/3

(1)→(2) の証明は、省略しますが、やってみる価値はあります。
P(NotB) は1-P(B)に、P(A|NotB)) は P(A)-P(A|B) に置き換えられます。

しかしベン図を使うと、かなり直観的に、(1)と(2)が等しいことが分かります。

参考URL:http://ja.wikipedia.org/wiki/%E3%83%99%E3%82%A4% …
    • good
    • 0

#2です。



確率はともかく、統計は「経験者」ではないのですが、

ベイズの定理の式自体は確率論的にはほとんど自明(少なくとも、簡単に証明できる)ですが、それを統計学に用いて、非常によい「推定」の方法を、ベイズさんが考えたということでしょう?

ですから、式の意味よりも、「どのように用いるのか」が重要で、それが分からないと、ベイズの定理の有用性は分からないはずです。
そこは、統計の経験者・専門家が現れて、説明して下さるのを期待しましょう。(僕には無理です、ごめんなさい)

だけど、それは種々の本、またHPにも書いてあることですから、それを自分で勉強されて、分かられなければ、また質問するという様にした方がいいと思います。
応用の仕方が分かれば、式自体の意味は自然に分かると思いますよ。

※素人考えで言えば、P(B|A)とP(A|B)と、右辺と左辺でA,Bが入れ替わっているのがきっとポイントで、P(B|A)の値を統計的に推定したいとき、それが直接は難しいが、P(A|B)を統計的に推定することは可能なときに、用いるということでしょうね。具体例はちょっと思いつきませんが。経験者さんよろしく。
    • good
    • 1

ベイズの定理の意味・記述が理解できないのか、それとも、式(1)から式(2)を導くことができないのか、ちょっとハッキリしません。


式を導くだけならば、(1)を(2)に代入することで、容易にできそうですが。

この回答への補足

式の導き方は分るのですが、
どういう意味なのか、またどういう使い方をするのかが理解できないのです

補足日時:2007/10/16 21:05
    • good
    • 1

全体事象をBに制限する、ということです。



全体事象をBに制限したときの、Aの確率(Aがおきる確率)は、
P(A∩B)/P(B)
になるでしょう?

分からなければ、図を描いて考えてみて下さい。

言葉を変えれば、「Bが起きるときの、Aが起きる確率」です。


ベイズの定理の意味は、条件付確率の意味が分かった上で、考えてみて下さい。
    • good
    • 0
この回答へのお礼

全事象をBに制限するというのは分りやすいですね
回答ありがとうございます<m(__)m>

お礼日時:2007/10/16 21:05

例だけ説明します。


良く使われるのが性別と眼鏡の関係です。

A事象・・眼鏡をかけている
B事象・・男子

        B:男子 ¬B:女子  計
 A:眼鏡あり  10人  20人  30人
¬A:眼鏡なし  30人  40人  70人
    計    40人  60人

とします。

> P(A|B)=P(A∩B)/P(B)とは和訳するとどういう意味なのでしょうか?
P(A|B):B事象が発生したときのA事象、つまり10/40=25%です。
P(A∩B):A事象とB事象が同時に起こるので10%です。
P(B):B事象の確率=40/100=40%です。

> またベイズの定理のP(B|A)=P(A|B)×P(B)/P(A)もうまく理解できません
P(B|A):A事象中のB事象ですから10/30=33%
P(A|B):先ほどの25%です。
P(B):B事象=40/100=40%
P(A):A事象=30/100=30%

これで式が理解できたら式の証明に挑戦してみてください。
    • good
    • 1
この回答へのお礼

簡単な例をありがとうございます。
証明してみます

お礼日時:2007/10/14 20:36

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!