Monte Carlo法とやらで、あるデータ解析の時に下記の
手順で解析を行なっているという研究論文がありました。
こうすることの利点とは何なのでしょうか? また、
この手法についてはどの本などで紹介されていますでしょうか?
------------------------------------------------------
ある複数のパラメータで変化するデータがあります。
そのデータにガウシアンノイズ(分布分散シグマ)を与えて
1000セットのデータを作ります。
1000セットのそれぞれのデータからInverse methodにて
もとのパラメータのセットを別々に1000個求めて、これを
平均します。
------------------------------------------------------
No.4
- 回答日時:
ご質問について再度考えてみましたが、やはりANo.2の通り、感度分析を目的とした計算であって、どうもブートストラップ法とは違うように思うんです。
ブートストラップ法だとすると、「パラメータが未知の分布」に従う標本をいっぱい集める必要があるでしょう。分布全体からまんべんなくサンプルを取るわけです。
でもご質問では、あるデータがあって、それにガウシャンノイズを加えたサンプルを作ることになっている。これで得られるのは、その「あるデータ」(実現値)の近辺における情報だけです。こういう、局所的なサンプリングだけでブートストラップのようなことができるものでしょうか。
しかも、その局所的サンプルからパラメータがinversionできるという。ならばご質問で言う「パラメータ」とは、「分布のパラメータ」のことではなくて、そのパラメータを決めればデータの「実現値」が(多少のノイズはあるかも知れないが)一意的に決まるという話だろうと考えられます。
No.3
- 回答日時:
これはブートストラップ法だと思います。
ブートストラップ法は標本のリサンプリングを繰り返して情報を徹底的に絞り出すような方法です。パラメータθを持つ分布Fθからの標本をX1, X2,…,Xn 、θの推定量を
θ推定(X1,…,Xn) とします。
例)
平均θの分布で標本平均Xbar=(X1+‥+Xn)を考えると
θ = E[Xbar] = ∫Xbar d Fθ …(1)
X1,…,Xn の実現値をx1,…,xn として経験分布を
F経験(x) = (1/n)Σ Θ(xi - x)
で定義します。ここでΘ(x)は階段関数です。θは(1)のように推定量と
分布Fθで表わされますが、Fθは未知なので経験分布で代用するのが通常の点推定の方法です。これに対し経験分布からモンテカルロ法で標本x1*, …xn* を抽出して(1)のようにパラメータを推定し、さらに平均をB回のリサンプリングで置き換えることが考えられます。これがブートストラップ法です。ブートストラップ法の利点は(1)のような期待値が解析的に計算が難しい時にも容易に適用できることです。nが大きければ中心極限定理により
T= √n(θ推定 - θ)/σ推定
の分布は標準正規分布で近似できるので、経験分布をこれで近似したものがご質問の方法だと思います
参考書)
Efron, Tibshirani;An Introduction to the Bootstrap,(1993)
汪金芳、田栗正章「統計科学のフロンティア11巻 計算統計1」(2003)
No.2ベストアンサー
- 回答日時:
直接測れないものx(ご質問で言うところのパラメータのひとつ)を
x= g(y[1],y[2],…,y[k])
という関係にあるy[1],y[2],…,y[k]を測定することで推定したい。ただし、y[1],y[2],…,y[k]の測定にも誤差(これらは互いに無相関)があって、そのせいでg(y[1],y[2],…,y[k])を計算した結果にも誤差が出る。
このとき、もし測定誤差が十分小さくて、その範囲ではg( )が一次式で近似できるというのなら、∂g/∂y[j]を計算すれば、y[j]の誤差がxの推定値にどれだけの影響を与えるかを見積もれる。(感度分析)
けれども、yの誤差が十分小さいかどうかを検討することや、∂g/∂y[j]を計算することが結構難しいような場合(例えば、gの式が複雑だったり、gがアルゴリズムとしてしか与えられていないなど)に、もし、g( )の非線形性があまり強くなくて、y[1],y[2],…,y[k]それぞれの分散σ[1]^2, σ[2]^2, …, σ[k]^2がおおよそ分かっているなら、
y[j] = (平均Y[j]、分散σ[j]^2 の正規分布に従う乱数)
によってデータを沢山(ご質問では1000個)作り、xを計算して分布を調べる
という手は確かに有効です。これによって、難しい検討など一切抜きにして、「g( )で計算したxの推定値にはどれぐらいの誤差があるか」が見積もれる。xの推定値の(平均ではなく)分散の方にこそ興味がある訳です。
もっときちんと言うと、「この計算に使ったY[1],Y[2],…,Y[k]の値に近いy[1],y[2],…,y[k]が与えられたときに、g( )で計算したxの推定値が持つ誤差の程度」が分かる訳です。だから、何通りかY[1],Y[2],…,Y[k]のセットについてこの計算をしてみれば、「ある範囲内のy[1],y[2],…,y[k]において、g( )で計算したxの推定値の誤差は高々いくら」ということも言えるでしょう。
No.1
- 回答日時:
y=f(x)
という関数があり、yがガウス分布に従う場合に、xの出現の平均を求める場合に本方式は有効では?
Monte Carlo法、モンテカルロ法は、乱数を使う方式で、ある程度収束が早いとされています。例えば、ある変数f(x)の積分を求める場合、台形公式で、細かい精度で端から順に計算すると、最後まで計算しないと答えはわかりませんが、xを一様乱数にし、ランダムに面積を求めていくと、少ないサンプルでなんとなく面積が見えてきます。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- その他(プログラミング・Web制作) 下記内容はpythonの重回帰分析で可能でしょうか? python初心者です。現在の業務でもしかした 2 2022/06/16 00:36
- その他(プログラミング・Web制作) 大学のゼミのレポートがムカつきます。 R言語というデータ分析に特化したプログラム言語を用いた授業の課 1 2023/06/29 00:50
- 宇宙科学・天文学・天気 AIが答えた方程式 1 2023/02/20 00:12
- 数学 【 数Ⅰ 分散 】 問題 20個の値からなるデータがあり, そのうちの8個の値の平均値は3,分散は4 4 2023/02/15 23:28
- その他(学校・勉強) 宿題の所で答えが合ってるか教えて欲しいです!情報Iです! データの分析・利用を行う際の流れについて、 2 2022/07/24 08:17
- 数学 【 数I 分散 】 3 2023/02/26 21:55
- 統計学 統計学、エクセルがわかりません!解答と詳しい解説をお願いします! (1)それぞれの地域別に記述統計量 9 2022/08/21 16:30
- 統計学 生物統計学の質問 7 2022/05/17 13:59
- 統計学 確率統計の問題です。 3 2022/04/07 04:39
- 統計学 一変量分析(度数分布表)は、結果をもとに特に検定せずに断定してもよいですか? 7 2022/11/24 23:20
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
成績順位の推定
-
4つのサイコロを同時に振って...
-
ふと疑問に思いました。世の中...
-
統計学の問題なんですが・・・
-
数学の問題で4C0の答えを教えて...
-
2つのサイコロの目の合計が偶数...
-
重複順列
-
一般常識を教えてください。1割...
-
サイコロ5個を同時に投げて任意...
-
a.b.c.d.eの5個から3個を選んで...
-
円順列
-
調査結果は、標準誤差率が何%...
-
サンプルサイズの大きく違うF検定
-
子供が親より先に死ぬ確率は計...
-
「○○通りのパターンがある」の...
-
統計学について質問です。 1個...
-
五分を6回連続で外すのはなん...
-
30%の確率が5回連続で起きない...
-
確率0.02%って10000人に2人です...
-
P(A|B)などの読み方
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
おすすめ情報