アプリ版:「スタンプのみでお礼する」機能のリリースについて

次に関して本当かどうか、教えて下さい。

(1)ベイズの方法は予測に価値を置いているのですか。
計量経済学は何かの予測をゴールにしていることが多いので、ベイズの方法とは相性がいいのですか。

(2)「医学の疫学研究のように間違いが決して許されない分野では、頻度論が使われる。ベイズは必ず仮定を置いて考えるが、間違いが決して許されないときには、仮定なんか置かないほうがいいという立場だ」と言っている人がいますが、仮定とは事前分布のことだと考えられますか。 頻度論のほうが強引な仮定を置くと思うのですが・・・

(3)「ベイズと頻度論は目的に応じて使い分ければよい。ビッグデータの場合には両方の結果が収束してくると思う。ベイズの方法でたとえ極端な仮定から出発しても、サンプル数が増えていけば頻度論で真値といわれる値に近づきます。 」
と言っている人がいますが、それって、ベイズで全数データを使うということを言っているのでしょうか。

A 回答 (1件)

(1) ベイズ主義は「仮説を信じる度合いを、証拠によって更新する」と言ってるに過ぎんでしょう。

信じるところに従って予測を行うのはご自由だけれども、それが当たるかどうかについては何も言ってない。

(2) 頻度主義ってのは「ある方法による予測が当たる確率を推定する」ってことであり、その典型的なヤリカタのひとつがフィッシャーの検定。帰無仮説H(棄却できないときには無に帰す仮説)を使い、帰無仮説Hを棄却するときに危険率、すなわち「間違いをどの程度許すか」を決めておく。もっと古いピアソンの検定では「仮説Hと対立仮説A」があって、これは「HとAのどっちかが正しい」という仮定を、何か統計以外の根拠に基づいて置いたという訳です。どっちも、そ(れら)の仮説のもとで事象が発生する確率が確率論で計算できるような、そういう仮説でなくちゃいけないという制約がある。いずれにせよ仮説があって初めて話が始まるのであり、「仮定なんか置かないほうがいいという立場だ」ってことではない。
 もちろん、ベイズ主義でも(信念の度合い付きの)仮説がなくては始まらないし、その仮説は事象が発生したという条件のもとで仮説が成立つ確率を計算できるものでなくてはならないという制約がある。そして、ベイズの定理によればその制約は「その仮説のもとでの事象の発生確率が確率論で計算でき、かつ事前確率が与えられている」ということに他ならない。「事前確率」を除けば両方とも制約は同じ事で、だからどっちが強引ってことはないでしょ。
 なお、「間違いが決して許されない」のであれば、どんな統計も無力です。確実に予言が当たるという訳には行かないのは勿論のこと、たとえば「(量的ではなく)質的に未曾有」の事象(つまり「こんなに大規模なことがおこるとは!」じゃなくて「まさかこんなことがあり得るとは!」)について発生確率を計算できる統計なんか原理的に無い。第一、統計じゃ因果関係については何も言えないんですし。
 ともあれ、ベイズ主義・頻度主義(そして尤度主義)はそれぞれやろうとしていることが最初から食い違っているので、(それがやろうとしていることと、現実のある具体的な問題を解決することとの整合性を論じるのならともかく)、一般論として優劣を論じるのは、ソモソモおかしな話だと思います。

(3) 「ベイズの方法でたとえ極端な仮定から出発しても…」とは、事前分布がまるっきりデタラメでも、データを増やしていけばデタラメさが薄まって行く、ということであり、ベイズ主義が「仮説を信じる度合いを、証拠によって更新する」ということをやっていると言えるのはこの性質があるから。
 しかし、「頻度論で真値といわれる値」は昔の概念じゃないのかな。「真値」なんてものが無条件にあるとは、少なくとも物理学・工学では仮定しませんし、ISO, JISからも「真値」という概念は消えたはず。
 ご質問で、もし「全数データ」を「取れたサンプル全部」の事を指して仰っているのであれば、「サンプル数が増えていけば」とは「(これまでに取れたサンプルだけじゃなしに)データをもっと取れば」ということ。そうじゃなく母集団全部という意味で「全数データ」と仰っているのなら、それは母集団が無限集合なら不可能。(たとえば「あらゆるトンボ」という母集団は、将来生まれるトンボも含む。)なお、母集団が有限集合でも確率論や統計を使うことがあるのは、「有限とは言ってもあんまり要素が多いから、無限集合で近似する」ということでしょう。

というわけで、(1)~(3)が本当かどうかという以前に、それらはなんか変な話をしているようだ、というのが感想です。

この回答への補足

ベイズにおける事前確率は、仮定なんかではなく、過学習を防ぐための手立てに過ぎないと思います。一方、古典論のP値による判定は、前提となる分布を仮定しているので、これは強い制約だと思います。

補足日時:2014/02/23 09:37
    • good
    • 0
この回答へのお礼

ご丁寧な回答ありがとうございました。
ざっと読んで、私がこれまで勉強してきた内容と一致しており、一安心したところです。熟読して、分からないことがあれば、また質問しますので、ご指導よろしくお願いします。

さて、この記述は、まもなく創刊される●経ビッグデータという月刊誌の中の対談記事で、例のベストセラー本の著者西●啓氏が語っていた内容です(ちょうど、ネットで公開されていたのを見かけたのです)。あまりにも私の理解を逸脱しているのでご質問した次第です。対談相手のデータサイエンティスト●藤卓哉さんも迎合してみえたので、あれれ、となったのです。社会的影響が大きいですよね。

お礼日時:2014/02/19 05:25

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!