最速怪談選手権

条件付き平均として以下のような公式があります。
E(x)=E(E(x|y)) などです。確率統計のテキストでは条件つき分散もあり、公式が続々と出てくるところです。条件付き〇〇とはx,yが出てくるので確率変数が見かけ上2つあるように思います。どちら側でのE[]なのかについてどのように判断したらいいのでしょうか。ある文献では"yに対する期待値をとれば...”などと明示されている場合もあります。
ということはやはり明示されない限り先に進めないということになるのでしょうか。それとも論旨を追えばわかる、ということなのでしょうか。E[]だけでなくVar[]もあります。

A 回答 (2件)

企業で統計を推進する立場の者です。



条件付き〇〇というのは、多くは因果性や時系列性の判断に使用される重要な統計量です。

|の後ろが、因果であれば親因子、時系列であれば時間的先行性のある観測値群です。そして、E()やV()の値は|の前、因果であれば子、時系列であれば現時刻の値について取り上げます。

データサイエンス関連の書籍では、#1さんの書かれているようなケース(具体的数値で範囲を限定すること)は少なく、いずれのケース(親因子、時間的に先行する観測値)も確率変数として考えているので、密度関数f(y)で与えられているのではないでしょうか。

「マルコフ性」とかで検索すれば、概要がつかめると思います。
    • good
    • 0

単に「記号の書き方」「記号の定義、意味」という話ですよね?



E(X|Y) は「Y = y の条件下での X の期待値という意味の記号です」といったような。
正確に書けば
 E(X|Y=y)
従って、これは y の値が変われば変わります。
つまり
 f(y) = E(X|Y=y)
ということで、y の関数となっています。

その上で、「いろいろな y の変化全体に対する x の期待値」という意味で
 Ey(X) = いろいろな y に対する f(y) = E(X|Y=y) の期待値
つまり
 Ey(X) = Ey[E(X|Y=y)]   ①
というのを
 Ey(X) → E(X)
 Ey[E(X|Y=y)] → E[E(X|Y)]
のように略して
 E(X) = E[E(X|Y)]
と書いているのです。
正確に書けば①ということです。
 
(私個人的には、こういう「簡略化した書き方」というのは好きではありませんが、世の中全体でそういうものが通用しているので、そのようにきちんと解釈して理解、使用していくしかありません)

記号に惑わされずに、その記号が「どういう意味を表すこととして定義されているのか」ということをきちんと理解しましょう。

下記のサイトの説明が分かりやすいかもしれません。

https://mathtrain.jp/condexpectation#:~:text=%E7 …
    • good
    • 1
この回答へのお礼

回答ありがとうございました。このような記述は、データサイエンス関係の書籍にすごくいっぱい出てきます。さらりと説明してどんどん速度を上げて説明が進んでいくのでついていけません。
カルマンフィルタ、ベイズと機械学習、時系列解析などにみられるようです。暗黙的に了解されている事項があり、読者も同意しているという前提で書かれている本が多いと思うのですが。

お礼日時:2021/02/10 01:02

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!