ノンパラメトリックベイズの初心者です。以前に質問したノンパラメトリックベイズに引き続いて質問させてください。
(質問1)
書籍「続・分かりやすいパターン認識」のp260~261のクラスタリング法1のアルゴリズムのStep3ですが、「各クラスタのパラメータθiを確率的に決定し、更新する」の実際のやり方ですが、
p259のθiの事後確率の式(12.15)を実際に計算したものはp269の式(12.37)となるので、この式を使って各クラスタごとのp(θi | {xk; xk∈ωi})を計算する。その結果例えば3クタスタ(ω1、ω2、ω3)あったとして、その確率の値がA, B, Cだったとした場合、
threshold1 = A / (A+B+C)
threshold2= (A+B) / (A+B+C)
として、pythonのbumpy.random.uniform()で発生させた乱数をthresholdとして、
threshold < threshold1 の時ω1
threshold1 < threshold < threshold2 の時ω2
threshold2 < threshold の 時ω3
が選択されるようにする。
ここでω1が選択されたとした場合、Step1に戻って、
ω1のクラスタで計算されたμ1、Λ1の値を使って、p259の式(12.14)のp(xk | θi)
の値を計算して、Skの事後確率を計算する手順を繰り返す。
と言う理解でいいのでしょうか?
(質問2)
p267の式(12.30)のウィッシャート分布の式ですが、この式は確率密度関数の式なので、積分すれば1、各点の値は、0 <x <1 の値になると思っていいのでしょうか。(今計算してみると1よりも
ずっと大きな数値になってしまっているようです。どこかに計算間違いがあるのかもしれない)
No.1
- 回答日時:
質問1
Step2ではなくて、Step3の「各クラスタのパラメータθiを確率的に決定し、更新する」についての質問ですよね。
Step2でωkは決定しているわけで、Step3でやることはθiを決めることですよ。
例えば、Step2で、3クラスタ(ω1、ω2、ω3)になったとしたら、各クラス多のパラメータ(θ1、θ2、θ3)を更新するのが、Step3です。
例えば、θ1の更新をバカ丁寧に説明すれば、
1. 全データ{xk}から、Step3でクラスタ1(ω1)に分類されたデータの集合 {xk; xk∈ω1}を抽出する
2. (12.15)式で、p(θ1| {xk; xk∈ω1}) の分布を計算して、そこからランダムサンプリングして、新しいθ1にする
ということです。θ2、θ3についても同様に更新します。
質問2
確率密度関数は、
「積分すれば1」はその通りですが、
「各点の値は、0 <x <1 の値になる」は違います。
各点の値は、0 ≦ x ですが、いくらでも大きな値になりえます。
No.2ベストアンサー
- 回答日時:
補足について。
(1) OKです。
(2)
>Step2で決定したωの分類に従って新たに計算したθをそのまま使う
っていうのが、どういう操作を意味しているのか私には理解できないです。
>そうではなくて、p269の式(12.37)のμi、ΛiをそれぞれN(μi;μc,Λc-1)とW(Λi;νc,Sq)の分布からギブスサンプリングして求めたθi(μi,Λi)を次の繰り返しのStep2のp(xk|θi)のθiとして使うという理解でいいんですよね?
こっちは、それでよいと思います。μiとΛiの分布は無関係なので、「ギプスサンプリング」ではないと思いますが。
(3)
Λi のサンプリングは、とにかく、確率密度関数 W(Λi;νc,Sq) にしたがってサンプリングできるなら、どうやってもよいです。
確率密度関数 W(Λi;νc,Sq) の具体的な形が式で書かれているわけで、原理的には、逆関数法とかで直接サンプリングすることも可能なはずです。
ただ、実際には、W(Λi;νc,Sq) は相当に複雑な形なので、直接サンプリングするのはなかなか大変です。
なんで、前の質問の#1にも書きましたが、このサンプリング自体をMCMCで行うことが多いです。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 電気工事士 6.6kVケーブル単芯325sq-1.5kmの遮蔽銅テープ抵抗値は何Ω? 1 2023/05/02 21:06
- 統計学 統計検定2級の過去問について 1 2023/01/04 16:40
- Excel(エクセル) 達成率の計算式を教えていただきたいです。 KPIでの不良削減達成率の計算方法を教えて下さい。 昨年度 3 2022/04/10 15:11
- 情報処理技術者・Microsoft認定資格 応用情報処理技術者試験のシステム利用率の計算について 2 2022/03/28 07:43
- Excel(エクセル) エクセル 関数について質問です。 2 2022/10/03 11:14
- 数学 二項定理と乗法定理の問題について 2 2022/04/25 22:05
- 数学 連立微分方程式の解き方について 7 2022/12/16 13:39
- Excel(エクセル) エクセルでSUMIFS関数で条件範囲の部分が#valueになる。 4 2023/04/28 12:42
- 工学 2電力測定の実験で出てきた公式で、cosθは力率を表していて、P1とP2は電力計のそれぞれの値です。 2 2023/05/12 11:11
- 統計学 こんな問題を使って教育するのは、文科省の方針ですか。 3 2022/06/17 09:14
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
至急!尿検査前日にオナニーし...
-
尿検査の前日は自慰控えたほう...
-
首吊りどこ締めるの
-
尿検査前日に自慰行為した時の...
-
1日前の検尿
-
今朝、毎朝の習慣でオナニーし...
-
射精をして1週間以内に尿検査を...
-
変な話しになります。尿検査で...
-
男です。昨日の午後3時くらいに...
-
検便についてです。 便は取れた...
-
EXCELで条件付き書式で空白セル...
-
白血球が多いとどんな心配があ...
-
彼女のことが好きすぎて彼女の...
-
腕を見たら黄色くなってる部分...
-
口の中に黒い血の塊
-
小数点以下を繰り上げたものを...
-
値が入っているときだけ計算結...
-
2つの数値のうち、数値が小さい...
-
エクセルでエラーが出て困って...
-
舌の裏の痛みのないプツプツの...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
首吊りどこ締めるの
-
中出しをするとお腹が痛い・・・。
-
麻疹風疹の抗体検査結果につい...
-
エクセルでエラーが出て困って...
-
白血球が多いとどんな心配があ...
-
彼女のことが好きすぎて彼女の...
-
検便についてです。 便は取れた...
-
勃起する時って痛いんですか? ...
-
至急!尿検査前日にオナニーし...
-
納豆食べた後の尿の納豆臭は何故?
-
これって喉仏ですか? 私は女性...
-
EXCELで条件付き書式で空白セル...
-
精子が黄色?
-
小数点以下を繰り上げたものを...
-
値が入っているときだけ計算結...
-
口の中に黒い血の塊
-
健否~書類の書き方~
-
甲状腺が腫れているが血液検査...
-
はしかの抗体検査は何科の病院...
-
テスターで断線を調べる方法教...
おすすめ情報
理解悪くて申し訳ないです。でもご回答から分かってきたようなので、再度確認させてください。
(1)Step2ですが、ここは前に質問した「ノンパラメトリックベイズの計算方法」のNo.3の回答の捕捉で私の書いたやり方でいいんですよね?(式(12.14)で計算された各クラスタの確率比でランダムに振り分ける。)
(2)Step3はStep2で決定したωの分類に従って新たに計算したθをそのまま使っては駄目なのですよね。そうではなくて、p269の式(12.37)のμi、ΛiをそれぞれN(μi;μc,Λc-1)とW(Λi;νc,Sq)の分布からギブスサンプリングして求めたθi(μi,Λi)を次の繰り返しのStep2のp(xk|θi)のθiとして使うという理解でいいんですよね?
(3)W(Λi;νc,Sq)のギブスサンプリングもこの書籍の捕捉に出ている正規分布の場合と同じように行えばいいのでしょうか?