dポイントプレゼントキャンペーン実施中!

二次元正規分布に関連する問題に困っています.

xy平面上に10×10の100個の格子があり,
そのそれぞれの格子がzの値として,
1から100のいずれかの値を持っています.
与えられる点のイメージは以下のようになります.

(x,y,z)=(1,1,56)
(x,y,z)=(1,2,57)
(x,y,z)=(1,3,59)

(x,y,z)=(100,100,98)

zの値はxy平面上にランダムに散らばっているのではなく,
波の様なある曲面に沿って散らばっています.
今この局面上に散らばった値をもとに,
z=55.55
という値が最も存在し得る位置を求めます.

現在のところ自分の考えではz=55.55という値と,
散らばった100個のzの値との偏差を計算し,
この100個の偏差が最小となる点が,
最もz=55.55の点が存在し得るということを考えました.

ここで,相関係数ρ=0とした二次元正規分布,
f(x,y)=1/(2pi*σx*σy)
*exp( -1/2 * ( (x-μx)^2/σx^2 + (y-μy)^2/σy^2 ) )
というf(x,y)を導入して,
上で考えたz=55.55という値が最も存在し得る位置を求めたいです.

どなたか確率分布に詳しい方がいらっしゃいましたら,
アドバイスをよろしくお願いいたします.

「二次元正規分布に関連する問題に困っていま」の質問画像

A 回答 (3件)

確率という言葉は事象の母集団があったときにその中で事象が起こったとき、母集団の大きさに対する事象頻度の比として表されます。

母集団の大きさは具体的な物理量でなければ計算できません。
図で示されたデータの性質(何らかの統計量であるのか、座標に関する測定値であるのかなど)がわからない限り、単に曲面の近似パラメータを求めたり、曲面上のz=55.55となるx-y曲線のパラメータを求めて推定誤差が従う確率分布などの確率の概念を使用する以外に、おっしゃられる「存在確率」の意味を推測するのは不可能です。
もしデータのzが実は何らかの統計頻度分布なのであれば、曲面はその確率分布と統計変動に基づいて推定することができますし、z=55.55も確率変数ですからその確からしさを確率の言葉で表現できるでしょう。
しかし、曲面が例えば陸地の地表面の形状であったり、気圧であったり、何らかの物理量の測定値なのであれば、曲面や曲線の補間や線型回帰などによる誤差解析を行う以外に確率という言葉が出てくるとは思えません。
あるいは単に統計の割合として確率という言葉を使うのであれば、zの値の頻度分布を作り、55.55付近に集まる数が全体のどのくらいの割合かを言うことはできます。
また、データ(x,y)の意味も不明なため、格子の中央点で近似したための真の曲面からのずれを誤差として誤差解析を行う以外に、これを確率変数として確率分布を使用する意味は見出せません。

もしおやりになろうとすることに関して何かベースになる例がおありでしたらそれを示していただければ理解できるかもしれませんが、そうでない限り、あるいはデータの性質を示されるのでない限り、おやりになりたいことはこれまでのやりとりのようなことからは永久に理解できないと思われます。
そういうわけで、ちょっかいをかけたみたいになって大変申し訳ありませんが、現状では私の手には余るようですのでこれ以上のデータや方法論に関する基礎情報がない限り、有効なアドバイスは不可能と考えますのでこれで応答を終了させていただきます。
    • good
    • 0

まだ意味不明です。


>(x,y,z)=(?, ?, 55.55)という点の存在確率分布を,
>二次元正規分布を利用して求められればと思いました.
>今得ている点の分布から導かれる確率は,
>二次元正規分布に従ってxy平面の中心から散らばると仮定すれば,
>xy平面の中心から近い領域は確率を高く,
>逆に中心から遠い領域は確率を低く考えることが必要と考えました.

例えば z=55.55 に近い(x,y)が(x,y)=(1,100)のようなところにあれば、データがそうなっているのに、存在確率は低いということですか? どうも存在確率の定義があいまいすぎてわかりませんし、「今得ている点の分布から導かれる確率」というのが「何の」確率なのかも不明です。
z軸へ射影するならば、z軸上の1~100の区分の中に何個ずつ点があるか勘定できるので、それを点の分布とみなすことは可能かと思いますが。

この回答への補足

jaspachateさん,どうもありがとうございます.
自分の考えたい存在確率について考えてみたのですが…
1/abs(図の点のzの値と55.55との偏差)
これ,若しくはこれの2乗を,
x=?,y=?,z=55.55という点が存在し得そうな確率指標とし,
またx=?,y=?,z=55.55という点が二次元正規分布に従って分布すると仮定して,
上の指標にf(x,y)を掛ければ良いかと思いました.
f(x,y)=1/(2pi*σx*σy)
*exp( -1/2 * ( (x-μx)^2/σx^2 + (y-μy)^2/σy^2 ) )

f(x,y)=1/(2*π)*exp(-0.5*(x^2+y^2))

2つ目のfを使うべきでしょうか.
お手数をおかけしておりますが,よろしくお願いいたします.

補足日時:2008/12/21 16:01
    • good
    • 0

「z=55.55という値が最も存在し得る位置」


との意味が不明です。
zはある曲面上にあるとのことであれば、関数z=g(x,y)上にあるわけですね。z=55.55という一定値になるのは、g(x,y)=55.55で表される曲線になります。その曲線を求めたいのでしょうか?
もし、z=55.55に対して近い値を拾ってきて、それぞれに対する(x,y)をx-y平面にプロットすれば、曲線にそって点が散在するはずです。それらの点から曲線を推定するには曲線のモデルを作ってそのパラメーターに関する最小2乗法や最尤法を用いることができます。あるいはスプライン関数などで近似してもいいでしょう。

2次元正規分布関数を考えるというのは、直接に曲面を近似したいわけでしょうか。例えば Σ[μx,μy]A(μx,μy)f(x,y;μx,μy) というような? 正規分布を使う根拠が不明ですが、図を見る限り意味が無いように思います。曲面近似ならば他に多項式近似など簡便で強力な方法があります。

この回答への補足

jaspachateさん,
アドバイスをくださり,どうもありがとうございます.
私がやりたいことについて拙い文章になりますが,
自分なりにまとめてみます.

私がやりたいことは図に示すようなxy平面に散らばる100点の点のうちで,
(x,y,z)=(?, ?, 55.55)という点の存在確率分布を求めたいです.

(x,y,z)=(?, ?, 55.55)という点の存在確率分布を,
二次元正規分布を利用して求められればと思いました.

今得ている点の分布から導かれる確率は,
二次元正規分布に従ってxy平面の中心から散らばると仮定すれば,
xy平面の中心から近い領域は確率を高く,
逆に中心から遠い領域は確率を低く考えることが必要と考えました.

ttp://aoki2.si.gunma-u.ac.jp/lecture/Bunpu/2dim-normal.html
上の群馬大学のページの一番上にある図が,
私の考えている二次元正規分布のイメージです.

わかりにくい箇所があればご指摘をよろしくお願いいたします.

補足日時:2008/12/18 12:36
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!