次に関して本当かどうか、教えて下さい。
(1)ベイズの方法は予測に価値を置いているのですか。
計量経済学は何かの予測をゴールにしていることが多いので、ベイズの方法とは相性がいいのですか。
(2)「医学の疫学研究のように間違いが決して許されない分野では、頻度論が使われる。ベイズは必ず仮定を置いて考えるが、間違いが決して許されないときには、仮定なんか置かないほうがいいという立場だ」と言っている人がいますが、仮定とは事前分布のことだと考えられますか。 頻度論のほうが強引な仮定を置くと思うのですが・・・
(3)「ベイズと頻度論は目的に応じて使い分ければよい。ビッグデータの場合には両方の結果が収束してくると思う。ベイズの方法でたとえ極端な仮定から出発しても、サンプル数が増えていけば頻度論で真値といわれる値に近づきます。 」
と言っている人がいますが、それって、ベイズで全数データを使うということを言っているのでしょうか。
No.1ベストアンサー
- 回答日時:
(1) ベイズ主義は「仮説を信じる度合いを、証拠によって更新する」と言ってるに過ぎんでしょう。
信じるところに従って予測を行うのはご自由だけれども、それが当たるかどうかについては何も言ってない。(2) 頻度主義ってのは「ある方法による予測が当たる確率を推定する」ってことであり、その典型的なヤリカタのひとつがフィッシャーの検定。帰無仮説H(棄却できないときには無に帰す仮説)を使い、帰無仮説Hを棄却するときに危険率、すなわち「間違いをどの程度許すか」を決めておく。もっと古いピアソンの検定では「仮説Hと対立仮説A」があって、これは「HとAのどっちかが正しい」という仮定を、何か統計以外の根拠に基づいて置いたという訳です。どっちも、そ(れら)の仮説のもとで事象が発生する確率が確率論で計算できるような、そういう仮説でなくちゃいけないという制約がある。いずれにせよ仮説があって初めて話が始まるのであり、「仮定なんか置かないほうがいいという立場だ」ってことではない。
もちろん、ベイズ主義でも(信念の度合い付きの)仮説がなくては始まらないし、その仮説は事象が発生したという条件のもとで仮説が成立つ確率を計算できるものでなくてはならないという制約がある。そして、ベイズの定理によればその制約は「その仮説のもとでの事象の発生確率が確率論で計算でき、かつ事前確率が与えられている」ということに他ならない。「事前確率」を除けば両方とも制約は同じ事で、だからどっちが強引ってことはないでしょ。
なお、「間違いが決して許されない」のであれば、どんな統計も無力です。確実に予言が当たるという訳には行かないのは勿論のこと、たとえば「(量的ではなく)質的に未曾有」の事象(つまり「こんなに大規模なことがおこるとは!」じゃなくて「まさかこんなことがあり得るとは!」)について発生確率を計算できる統計なんか原理的に無い。第一、統計じゃ因果関係については何も言えないんですし。
ともあれ、ベイズ主義・頻度主義(そして尤度主義)はそれぞれやろうとしていることが最初から食い違っているので、(それがやろうとしていることと、現実のある具体的な問題を解決することとの整合性を論じるのならともかく)、一般論として優劣を論じるのは、ソモソモおかしな話だと思います。
(3) 「ベイズの方法でたとえ極端な仮定から出発しても…」とは、事前分布がまるっきりデタラメでも、データを増やしていけばデタラメさが薄まって行く、ということであり、ベイズ主義が「仮説を信じる度合いを、証拠によって更新する」ということをやっていると言えるのはこの性質があるから。
しかし、「頻度論で真値といわれる値」は昔の概念じゃないのかな。「真値」なんてものが無条件にあるとは、少なくとも物理学・工学では仮定しませんし、ISO, JISからも「真値」という概念は消えたはず。
ご質問で、もし「全数データ」を「取れたサンプル全部」の事を指して仰っているのであれば、「サンプル数が増えていけば」とは「(これまでに取れたサンプルだけじゃなしに)データをもっと取れば」ということ。そうじゃなく母集団全部という意味で「全数データ」と仰っているのなら、それは母集団が無限集合なら不可能。(たとえば「あらゆるトンボ」という母集団は、将来生まれるトンボも含む。)なお、母集団が有限集合でも確率論や統計を使うことがあるのは、「有限とは言ってもあんまり要素が多いから、無限集合で近似する」ということでしょう。
というわけで、(1)~(3)が本当かどうかという以前に、それらはなんか変な話をしているようだ、というのが感想です。
この回答への補足
ベイズにおける事前確率は、仮定なんかではなく、過学習を防ぐための手立てに過ぎないと思います。一方、古典論のP値による判定は、前提となる分布を仮定しているので、これは強い制約だと思います。
補足日時:2014/02/23 09:37ご丁寧な回答ありがとうございました。
ざっと読んで、私がこれまで勉強してきた内容と一致しており、一安心したところです。熟読して、分からないことがあれば、また質問しますので、ご指導よろしくお願いします。
さて、この記述は、まもなく創刊される●経ビッグデータという月刊誌の中の対談記事で、例のベストセラー本の著者西●啓氏が語っていた内容です(ちょうど、ネットで公開されていたのを見かけたのです)。あまりにも私の理解を逸脱しているのでご質問した次第です。対談相手のデータサイエンティスト●藤卓哉さんも迎合してみえたので、あれれ、となったのです。社会的影響が大きいですよね。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 人の主観を使って判断する例を探しています。 5 2022/06/15 14:57
- 医学 陽性適中率と偽陽性について 1 2022/04/24 13:08
- 宇宙科学・天文学・天気 博士課程の指導員先生:予定している研究テーマの先生がふさわしいの?それとも研究の手法を専門の先生? 2 2022/12/09 00:11
- 大学・短大 大学 統計学 1 2022/09/14 11:27
- その他(悩み相談・人生相談) パートナー(配偶者や恋人)は、価値観が違う方が良いですよね? 6 2022/08/22 20:27
- 統計学 統計学が分かりません!詳しい解説と回答を教えてくださる方お願いいします! 5 2022/08/23 03:10
- 化学 水性ペンキで塗装する際の安全な頻度、ホルムアルデヒドについて。 2 2023/03/19 17:45
- 大学受験 自己推薦書の添削や意見・アドバイスお願いします 2 2022/08/27 19:34
- その他(社会・学校・職場) 平均的日本人の頭は悪くはないはずですし、学校で習う内容が幼稚というわけでもないのに、世間には幼稚な大 7 2023/04/05 20:51
- 物理学 アインシュタインの質量とエネルギーの等価性(E=mc²)って間違ってますよね? 4 2023/01/14 13:29
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
統計でいう「n」は、何の略な...
-
N数?n数?サンプル数の「エヌ...
-
評価者により採点に差が出るこ...
-
エクセルで「集団から最大値、...
-
有意差があってもサンプルサイ...
-
t検定って何ですか
-
モーメント法による母集団の偏...
-
統計学における無作為抽出に関...
-
誤差範囲を検証して必要なサン...
-
統計学の検出力の問題が分から...
-
統計学-母集団が少ない場合の...
-
大至急お願いします! 統計学の...
-
母集団のばらつきをサンプルか...
-
統計学でいうRSD%とは何ですか。
-
標準偏差
-
統計学における有効数字につい...
-
中学1.2年で5教科の合計点が350...
-
正規分布に従わないと標準偏差...
-
偏差値60の人と偏差値50の人が...
-
ExcelでCVを計算するには
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
統計でいう「n」は、何の略な...
-
N数?n数?サンプル数の「エヌ...
-
統計学-母集団が少ない場合の...
-
評価者により採点に差が出るこ...
-
t検定のt値について
-
信頼区間から標準偏差の求め方
-
適正なサンプル数について
-
標準体重の求め方
-
有意差があってもサンプルサイ...
-
統計学の検出力の問題が分から...
-
母集団と確率空間の違い
-
多数決 統計学に詳しい方教え...
-
エクセルで「集団から最大値、...
-
時系列データの検定
-
ある集団の平均身長を調べたい....
-
ある試験の受験者全員の平均点...
-
点推定と区間推定について
-
モデルのパラメータの定義がい...
-
Zスコアと標準偏差について
-
アンケート調査に必要なサンプル数
おすすめ情報