プロが教える店舗&オフィスのセキュリティ対策術

統計検定の勉強をしていて理解できない箇所が一つあります。

フィッシャーネイマンの因子分解定理です。



こちらの動画をみて勉強しています。7:35あたりの説明が何回聞いても自分の中に落とし込めません。なぜT(x)=sが消せるのでしょうか。

ご教示お願いします。

A 回答 (5件)

> Pθ(X = x, T(X) = s) = a(x)b(T(x)|θ)どうしてこの等号が成り立つのでしょうか。



これは私の書き方も良くなかったかもしれません。
Pθ(X = x, T(X) = s)
は、T(X) = s を満たし、かつ X = x となる確率ですが、T(X) = s となる X = x であれば1、T(X) ≠ s となる X = x であれば0となる関数 I(x) を導入して
Pθ(X = x, T(X) = s) = a(x)b(T(x)|θ)I(x)
とした方が良かったかもしれません。
この場合、最終的に
Pθ(X = x | T(X) = s)
= a(x)I(x) / Σ_{x| T(x) = s} a(x)
となりますが、結論には変わりありません。

これなら分りますでしょうか?
    • good
    • 0

#1です。



#3さんが書かれていることは、ごもっとも。xじゃなくてXの部分。確かに何の保証もありません。私も本来証明が必要だよなぁと思った部分です。

#1は取り消します。すみません。

動画の証明は飛躍し過ぎています。
    • good
    • 1
この回答へのお礼

回答ありがとうございます。おかげで理解できました。

お礼日時:2023/01/04 02:50

消せないので、自分の中に落とし込めないのも無理はありません。



Pθ(X = x | T(x) = s) = Pθ(X = x)
とはなりません。
Pθ(X = x)
には T(x) = s という制限が含まれていません。
したがって、等しくなる保証がないのです。

そもそも
Pθ(X = x | T(x) = s)
ではなく、
Pθ(X = x | T(X) = s)
でなければいけません。
(T(x) と T(X) の違いに注意)

Pθ(X = x | T(X) = s)
= Pθ(X = x, T(X) = s) / Pθ(T(X) = s)

の分子分母はそれぞれ次のようになります。

Pθ(X = x, T(X) = s) は T(X) = s を満たす X のうちの x というデータが得られる確率なので
Pθ(X = x, T(X) = s) = a(x)b(T(x)|θ) = a(x)b(s|θ)
となります。

Pθ(T(X) = s) は T(X) = s となる X の確率を足し合わせれば良いので
Pθ(T(X) = s) = Σ_{x| T(x) = s} a(x)b(T(x)|θ)
= Σ_{x| T(x) = s} a(x)b(s|θ)
= b(s|θ)Σ_{x| T(x) = s} a(x)
となります。
Σ_{x| T(x) = s} は T(x) = s を満たす x についての和です。

以上から

Pθ(X = x | T(X) = s)
= a(x) / Σ_{x| T(x) = s} a(x)

が得られ、T(X) が十分統計量であることがわかります。
    • good
    • 0
この回答へのお礼

回答ありがとうございます。
すみません。やはりここの説明がわかりません。

Pθ(X = x, T(X) = s) = a(x)b(T(x)|θ)どうしてこの等号が成り立つのでしょうか。その前までは理解できました。

お礼日時:2023/01/03 17:47

補足です。



観測値、1,2,3,4,5,6,7,8,9,10があり、足してnで割る平均値の式Tを考えたとき、

それらの観測値が、正規分布に従っていても、ポアソン分布に従っていても、一様分布に従っていても、つまり母パラメータθがそれぞれ異なっていても、統計量T(x)=5.5が成り立ちます。

ただ、平均値を「最尤推定」という方法で定義すると、一様分布の平均は、
{min(x)+max(x)}/2となります。これはθ依存です。

つまり本来は証明が必要な部分ですが、「大前提」と言って避けているのです。「定義」だから、と言っても良いと思います。
    • good
    • 0

T(x)=sが消せるのではなく、Pθ(T(x)=s)=1だと言っています。


消すと言うか、掛け算の式の中で1に置き換えるということです。

その説明が語られる時に、背景が黒のインポーズが出ますが、そこに書いてある通りです。

Pθ(T(x)=s)は、統計量Tの関数に、母パラメータθに依存する実現値(観測値)xを代入したときに、その統計量がsになることを満足する確率のことを言っており、

式の展開上、出てきてしまうのですが、

実現値x1x2・・・をTという関数で処理するとsになるという前提だったので、当然の如く、いかなるxのときだって、それは母数θに関係なく100%生起するよね、と言っています。

だから、θに関する同時確率の式の中で、掛ける1なので式からは消して構わないということになります。

てか、統計検定1級レベルって、証明まで必要なんですね。
QC検定1級では、不偏推定量って何?の関連でしかなかったと思います。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!