当方、統計の専門ではありません。
最近、ベイズ推定を勉強し始めました。
事前分布を選択する予備解析として、
経験ベイズを試そうかと考えていますが、
下記のような経験ベイズの使い方は、
1)マナー違反にならないか、
2)そもそも手続きとしておかしい部分がないか、
(その他、考えられうるメリットやデメリットなど)
コメントなど頂けますと幸いです。
アカデミアからの見地か、RDからの見地か、
明記して頂けますと助かります。
よろしくお願い致します。
【背景】
勉強し始めの現状は、
MCMCサンプラーを用いて事後分布を推定する、
推定の相場や挙動が掴めてきたところです。
自分の研究への適用方針として、
なるべくアンバイアスな事前分布には一様分布を用いようと
考えていますが、定義域の設定で幾分かのバイアスは避けられません。
(尤度関数は正規分布を想定しています)
そこで、事前に実測データから事前分布の当たりをつけ、
経験ベイズを実施してみようと考えています。
経験ベイズ用の実測データはまだ未取得のため、なんとも言えませんが、
おそらく単峰性か二峰性(各峰は正規分布様)、あるいは指数分布様と見込んでいます。
実測データを用いて推定した事後分布を確認しておき、
改めて、実測データの計測域より広域(恣意的な範囲)で定義した
一様分布を事前分布として、事後分布を推定し直そうと思っています。
一様分布を用いて推定した事後分布を、先に経験ベイズで得た事後分布との
類似性で評価しようと考えています(各種事後推定値やKS検定を検討中です)。
成果をまとめる際は、
1)「一様分布を用いて推定した」(経験ベイズには言及しない)
2)「経験ベイズにより条件検討後、一様分布を用いて推定した」
の2パターンの文脈を考えています。
No.2ベストアンサー
- 回答日時:
ちょっと修正。
非正則(Improper)な事前分布を使えるのは、やっぱり、ベイズ推定ではなくて、MCMCのときだけですね。
それから、
無情報の事前分布としては、正規分布を使うのは、やっぱり、ちょっと良くないと思うので、
一様分布か、コーシー分布にするのがよいでしょう。
貴重なご回答を頂き、ありがとうございました。
ご回答を受け、以下の情報を参照しました。
https://www.slideshare.net/KojiKosugi/cauchy2015 …
https://www.slideshare.net/hoxo_m/ss-59418886
https://projecteuclid.org/euclid.ba/1340371048
ちょうど、分散パラメータを推定するつもりでしたので、
大変参考になりました。
(推定結果の評価のため?になるかと思い)
逆ガンマ分布を事前分布にした場合の推定も実施する目論見でしたが、
上記論文によると、逆ガンマ分布はあまりイケてないみたいですね。
また予備解析的ですが、実測データ取得の前に、
簡易なデータ生成モデルを用い、生成モデルのパラメータを複数に振り、
期待しているデータの(複数の群からなる)予想分布を確認したところ、
分散パラメータは予想通りに変わりましたが、
平均パラメータも群間(状態間)で変わることを確認したところです。
当初は平均パラメータは0で固定のつもりでしたが、
群間(状態間)で平均パラメータが変わる機構も考察する必要がありそうです。
・平均パラメータの事前分布: コーシー分布、一様分布
・分散パラメータの事前分布: 半コーシー分布、一様分布
として、推定結果を確認してみようと思います。
あとはデータを実測して解析パイプラインに乗せようと思います。
なお、コーシー分布も位置やスケールのパラメータを定義可能ですが、
これらは測定データを見て恣意的に決めようと思います。
ありがとうございました。
No.1
- 回答日時:
まず、原理的には、MCMC(というか、ベイズ推定)では、
範囲が (-∞, +∞) の一様分布を事前分布として使うことが可能です。
「非正則な事前分布」といいます。
ただ、使うソフトによっては、範囲無限大の一様分布を事前分布に設定できないかもしれません。
たとえば、stanでは使えますが、BUGS系は(たぶん)使えないと思います。
その場合は、範囲 [-A, +A]としておいて、Aを十分大きな値にしておけばよいと思います。
こだわりたいなら、Aを変化させて、事後分布が変化しないかどうかを確かめればよいです。
事前分布を決めるのに経験ベイズを用いるのは、それこそ、
事前分布が(一様分布ではない)なんらかの偏った分布に従うと考える根拠がある場合
のみにしたほうがよいと思います。
例えば、「事前分布(事後分布ではなく)が単峰性か二峰性になるはずだ」と思える根拠がある場合。
本当に何の知識もないのであれば、経験ベイズなんかを使うと、逆に、事後分布に変なバイアスが入ることになると思いますよ。
非正規な一様分布あるいは、正規分布、あるいは、半コーシー分布みたいな、特徴のない分布にするのが一番よいと思います。
ちなみに、「思います」と少し曖昧に書いたのは、この
・何の事前知識もないときに、事前分布をどう設定するのがよいのか
(もっといえば、そもそも「事前分布」とはいったい何なのか。データによってパラメータを推定するのであって、データが何もないときの「分布」とはいったい何のか)
というのは、古典的統計学の人が、ベイズ統計学を批判する最も大きなポイントでして、深入りすると神学論みたいなことになるので。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 人の主観を使って判断する例を探しています。 5 2022/06/15 14:57
- 統計学 統計学を学んでいるものです。 区間推定や検定において度々 t分布やカイ二乗分布、F分布が現れますが、 6 2023/02/15 14:26
- 統計学 確率統計の問題です。 6 2022/07/26 23:23
- 統計学 確率統計の問題です。 3 2022/04/07 04:39
- 数学 モデルのパラメータの定義がいまいちわかりません。 3 2022/10/11 15:16
- 統計学 母集団分布を平均 μ, 分散 σ2 の正規分布と想定し, 母集団から無作為抽出した標本のデータ(標本 4 2023/01/30 20:25
- 統計学 統計学の質問【帰無仮説】 高校の新学習指導要領では、統計的仮説検定の基本的な考え方が必修単元となった 5 2023/05/23 21:00
- 統計学 統計学の問題です。教えてください(_ _) 数万人の有権者がいる選挙区で, 無作為に400人の標本を 2 2023/02/03 15:27
- 統計学 こんな問題を使って教育するのは、文科省の方針ですか。 3 2022/06/17 09:14
- 計算機科学 エクセルのデータの表すことについて 2 2023/03/05 20:49
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
EXCELにてローパスフィルタを作...
-
下の対数表示のグラフから低域...
-
サンプル数の異なる2群間にお...
-
検量線の決定係数について
-
心理機能診断をしたのですが、...
-
溶解度の問題 理科
-
エクセルのグラフから半値幅を...
-
全商推薦について教えてください。
-
統計学のサンプル数2000の根拠は?
-
統計学の問題でわからないので...
-
統計 RSD%について教えて下さい。
-
対数グラフの対数とは・・・?
-
対応のあるt検定の結果の書き方
-
エクセルの統計でχ二乗検定の結...
-
両側検定と片側検定のp値の違い
-
片対数グラフで…
-
データが正規分布しているか判...
-
検量線の作り方
-
パイロットサンプルって何ですか?
-
標準偏差の分母にルートをかけ...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
EXCELにてローパスフィルタを作...
-
サンプル数の異なる2群間にお...
-
心理機能診断をしたのですが、...
-
エクセルでランダム関数で乱数...
-
ブラック・ショールズ方程式を...
-
複数の集団の全体平均が0より有...
-
検量線の決定係数について
-
ポアソン回帰でのカウントデー...
-
青い下線部分はなぜそうなるの...
-
統計学の問題でわからないので...
-
[Excel] リストからの無作為抽出
-
x^2+y^2はどのような分布をする?
-
エクセルのグラフから半値幅を...
-
統計について
-
極値をもつ時と持たない時、単...
-
エクセルで正規分布かどうかを...
-
パイロットサンプルって何ですか?
-
データが正規分布しているか判...
-
回帰分析の回帰係数のt検定
-
正規分布について
おすすめ情報