ID登録せずに、ニックネームで質問できる♪教えて!gooアプリ

当方、統計の専門ではありません。

最近、ベイズ推定を勉強し始めました。
事前分布を選択する予備解析として、
経験ベイズを試そうかと考えていますが、
下記のような経験ベイズの使い方は、
1)マナー違反にならないか、
2)そもそも手続きとしておかしい部分がないか、
(その他、考えられうるメリットやデメリットなど)
コメントなど頂けますと幸いです。

アカデミアからの見地か、RDからの見地か、
明記して頂けますと助かります。

よろしくお願い致します。


【背景】
勉強し始めの現状は、
MCMCサンプラーを用いて事後分布を推定する、
推定の相場や挙動が掴めてきたところです。

自分の研究への適用方針として、
なるべくアンバイアスな事前分布には一様分布を用いようと
考えていますが、定義域の設定で幾分かのバイアスは避けられません。
(尤度関数は正規分布を想定しています)

そこで、事前に実測データから事前分布の当たりをつけ、
経験ベイズを実施してみようと考えています。

経験ベイズ用の実測データはまだ未取得のため、なんとも言えませんが、
おそらく単峰性か二峰性(各峰は正規分布様)、あるいは指数分布様と見込んでいます。

実測データを用いて推定した事後分布を確認しておき、
改めて、実測データの計測域より広域(恣意的な範囲)で定義した
一様分布を事前分布として、事後分布を推定し直そうと思っています。

一様分布を用いて推定した事後分布を、先に経験ベイズで得た事後分布との
類似性で評価しようと考えています(各種事後推定値やKS検定を検討中です)。

成果をまとめる際は、
 1)「一様分布を用いて推定した」(経験ベイズには言及しない)
 2)「経験ベイズにより条件検討後、一様分布を用いて推定した」
の2パターンの文脈を考えています。

A 回答 (2件)

ちょっと修正。



非正則(Improper)な事前分布を使えるのは、やっぱり、ベイズ推定ではなくて、MCMCのときだけですね。

それから、
無情報の事前分布としては、正規分布を使うのは、やっぱり、ちょっと良くないと思うので、
一様分布か、コーシー分布にするのがよいでしょう。
    • good
    • 0
この回答へのお礼

貴重なご回答を頂き、ありがとうございました。

ご回答を受け、以下の情報を参照しました。
https://www.slideshare.net/KojiKosugi/cauchy2015 …
https://www.slideshare.net/hoxo_m/ss-59418886
https://projecteuclid.org/euclid.ba/1340371048

ちょうど、分散パラメータを推定するつもりでしたので、
大変参考になりました。
(推定結果の評価のため?になるかと思い)
逆ガンマ分布を事前分布にした場合の推定も実施する目論見でしたが、
上記論文によると、逆ガンマ分布はあまりイケてないみたいですね。

また予備解析的ですが、実測データ取得の前に、
簡易なデータ生成モデルを用い、生成モデルのパラメータを複数に振り、
期待しているデータの(複数の群からなる)予想分布を確認したところ、
分散パラメータは予想通りに変わりましたが、
平均パラメータも群間(状態間)で変わることを確認したところです。
当初は平均パラメータは0で固定のつもりでしたが、
群間(状態間)で平均パラメータが変わる機構も考察する必要がありそうです。
 ・平均パラメータの事前分布: コーシー分布、一様分布
 ・分散パラメータの事前分布: 半コーシー分布、一様分布
として、推定結果を確認してみようと思います。

あとはデータを実測して解析パイプラインに乗せようと思います。
なお、コーシー分布も位置やスケールのパラメータを定義可能ですが、
これらは測定データを見て恣意的に決めようと思います。

ありがとうございました。

お礼日時:2017/06/27 15:25

まず、原理的には、MCMC(というか、ベイズ推定)では、


範囲が (-∞, +∞) の一様分布を事前分布として使うことが可能です。
「非正則な事前分布」といいます。

ただ、使うソフトによっては、範囲無限大の一様分布を事前分布に設定できないかもしれません。
たとえば、stanでは使えますが、BUGS系は(たぶん)使えないと思います。
その場合は、範囲 [-A, +A]としておいて、Aを十分大きな値にしておけばよいと思います。
こだわりたいなら、Aを変化させて、事後分布が変化しないかどうかを確かめればよいです。

事前分布を決めるのに経験ベイズを用いるのは、それこそ、
事前分布が(一様分布ではない)なんらかの偏った分布に従うと考える根拠がある場合
のみにしたほうがよいと思います。
例えば、「事前分布(事後分布ではなく)が単峰性か二峰性になるはずだ」と思える根拠がある場合。
本当に何の知識もないのであれば、経験ベイズなんかを使うと、逆に、事後分布に変なバイアスが入ることになると思いますよ。
非正規な一様分布あるいは、正規分布、あるいは、半コーシー分布みたいな、特徴のない分布にするのが一番よいと思います。

ちなみに、「思います」と少し曖昧に書いたのは、この
・何の事前知識もないときに、事前分布をどう設定するのがよいのか
(もっといえば、そもそも「事前分布」とはいったい何なのか。データによってパラメータを推定するのであって、データが何もないときの「分布」とはいったい何のか)
というのは、古典的統計学の人が、ベイズ統計学を批判する最も大きなポイントでして、深入りすると神学論みたいなことになるので。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aと関連する良く見られている質問

Qノンパラメトリックベイズの計算方法

ノンパラメトリックベイズの初心者です。書籍「続わかりやすいパターン認識」の第12章のp260~261のクラスタリング法1のアルゴリズムの実装に関して何点か質問があります。この当たりについてご経験のある方のアドバイスをお願い致します。
(1)Step2ですが、p259の式(12.14)についてですが、これは式上段の現クラスタ数cの事後確率と式下段の新規での事後確率(1個)を計算して、その中でその値が一番大きいものをSk(所属クラスタ)として採用するという理解でいいでしょうか?
(2)Step3のθiを確率的に決定し、更新する方法がいまいちよく分かりません。これは(1)で所属クラスタが決定すれば、その情報に合わせて各クラスタごとにθiの値を計算し直せばいいと思うのですが、その場合p259の式(12.15)の各クラスタの事後分布を使ってどのような計算を行えばいいのかがよく分かりません。たとえば、θ1 = a, θ2 = b, p(θ1|xk∈ω1) = A, p(θ2|xk∈ω2) = Bが求まったとしてどのような計算を行えばいいのでしょうか?また、A、Bの値は実際にはp269の式(12.37)を計算することになりますが、これらの値は既に正規化されていると思っていいのでしょうか?(A/(A+B)のようなものを計算しなくてもよい。)
(3)p259の注釈(10)ですが、初回の1回目を実行してみたところ、所属クラスタは初期設定したものと同じという結果になってしまいました。この場合は、このクラスタはパターンの増減がなかったので、式(12.15)は計算しなくてよいのでしょうか?また、新規クラスタでの式(12.15)はパターン1個のみで行うと書いてありますが、これは具体的にどのような計算をすればいいのでしょうか?
(4)p267のウィッシャート分布Wですが、1回目の計算が終わった段階で、分母の2^(νd/2)はd=2で、p269の式(12.37)、式(12.42)によりμc=15 + 500=515でかなり大きな数になってしまうようなのですが、一般的に式(12.30)はそのまま計算できるものなのでしょうか?それとも比を取るなどして計算できるように(値が発散してしまわないように)工夫する必要があるのでしょうか?

たくさん書いてしまいましたが、ノンパラメトリックベイズは是非習得したいと思っているので、御経験のある方、是非ご教示願えればと思います。

ノンパラメトリックベイズの初心者です。書籍「続わかりやすいパターン認識」の第12章のp260~261のクラスタリング法1のアルゴリズムの実装に関して何点か質問があります。この当たりについてご経験のある方のアドバイスをお願い致します。
(1)Step2ですが、p259の式(12.14)についてですが、これは式上段の現クラスタ数cの事後確率と式下段の新規での事後確率(1個)を計算して、その中でその値が一番大きいものをSk(所属クラスタ)として採用するという理解でいいでしょうか?
(2)Step3のθiを確率...続きを読む

Aベストアンサー

(1) 違います。
c個のクラスタ全てについて(12.14)式の上段の式を計算し、また、式下段の新規での事後確率(1個)を計算して、c+1個の確率の比に応じてskをどこにするかランダムに決めるということです。

(2) 質問の意味がよくわかりません。どこかで勘違いがあるような気がします。
Step 3は、(12.15)式によって定まるθiの事後分布から、ランダムにサンプリングして、それを新しい θi にする、ということです。

(3) 単純に、(12.15)式で、クラスタωi に属するxkが1個だけ、つまり、ωi = {xk} とすればいいわけで、具体的に書けば、
p(θi |{xk}) = G0(θi)*p(xk|θi) / ∫{G0(θi)*p(xk|θi)}dθi
です。

(4) 式(12.37)のθiの事後分布からサンプリングするのは簡単にはできないので、普通は、このサンプリングもMCMC(MH法など)を使ってやります。
基本的にMCMCであれば、確率密度関数の比させとれればよいわけで、正規化する必要はありません。したがって、式(12.30)の分母は計算する必要はありません。
また、基本的には、確率密度関数そのものではなくて、その対数をとったものを使って計算するので、ちょっとくらい、べき乗の数が大きくなっても問題なく計算できます。

(1) 違います。
c個のクラスタ全てについて(12.14)式の上段の式を計算し、また、式下段の新規での事後確率(1個)を計算して、c+1個の確率の比に応じてskをどこにするかランダムに決めるということです。

(2) 質問の意味がよくわかりません。どこかで勘違いがあるような気がします。
Step 3は、(12.15)式によって定まるθiの事後分布から、ランダムにサンプリングして、それを新しい θi にする、ということです。

(3) 単純に、(12.15)式で、クラスタωi に属するxkが1個だけ、つまり、ωi = {xk} とすればいいわ...続きを読む

Q統計学の微積分について

統計学の微積分についてですが、数Ⅱレベルの知識では太刀打ちできないですか?
もし統計学を深く学ぶようなら、数Ⅲ以上で学ぶ微積分が必要でしょうか?

Aベストアンサー

明らかに、数Ⅲ以上の微積分が必要です。

Qノンパラメトリックベイズの計算方法(2)

ノンパラメトリックベイズの初心者です。以前に質問したノンパラメトリックベイズに引き続いて質問させてください。
(質問1)
書籍「続・分かりやすいパターン認識」のp260~261のクラスタリング法1のアルゴリズムのStep3ですが、「各クラスタのパラメータθiを確率的に決定し、更新する」の実際のやり方ですが、
p259のθiの事後確率の式(12.15)を実際に計算したものはp269の式(12.37)となるので、この式を使って各クラスタごとのp(θi | {xk; xk∈ωi})を計算する。その結果例えば3クタスタ(ω1、ω2、ω3)あったとして、その確率の値がA, B, Cだったとした場合、
threshold1 = A / (A+B+C)
threshold2= (A+B) / (A+B+C)
として、pythonのbumpy.random.uniform()で発生させた乱数をthresholdとして、
threshold < threshold1 の時ω1
threshold1 < threshold < threshold2 の時ω2
threshold2 < threshold の 時ω3
が選択されるようにする。
ここでω1が選択されたとした場合、Step1に戻って、
ω1のクラスタで計算されたμ1、Λ1の値を使って、p259の式(12.14)のp(xk | θi)
の値を計算して、Skの事後確率を計算する手順を繰り返す。
と言う理解でいいのでしょうか?
(質問2)
p267の式(12.30)のウィッシャート分布の式ですが、この式は確率密度関数の式なので、積分すれば1、各点の値は、0 <x <1 の値になると思っていいのでしょうか。(今計算してみると1よりも
ずっと大きな数値になってしまっているようです。どこかに計算間違いがあるのかもしれない)

ノンパラメトリックベイズの初心者です。以前に質問したノンパラメトリックベイズに引き続いて質問させてください。
(質問1)
書籍「続・分かりやすいパターン認識」のp260~261のクラスタリング法1のアルゴリズムのStep3ですが、「各クラスタのパラメータθiを確率的に決定し、更新する」の実際のやり方ですが、
p259のθiの事後確率の式(12.15)を実際に計算したものはp269の式(12.37)となるので、この式を使って各クラスタごとのp(θi | {xk; xk∈ωi})を計算する。その結果例えば3クタスタ(ω1、ω2、ω3)...続きを読む

Aベストアンサー

補足について。

(1) OKです。

(2)
>Step2で決定したωの分類に従って新たに計算したθをそのまま使う
っていうのが、どういう操作を意味しているのか私には理解できないです。

>そうではなくて、p269の式(12.37)のμi、ΛiをそれぞれN(μi;μc,Λc-1)とW(Λi;νc,Sq)の分布からギブスサンプリングして求めたθi(μi,Λi)を次の繰り返しのStep2のp(xk|θi)のθiとして使うという理解でいいんですよね?

こっちは、それでよいと思います。μiとΛiの分布は無関係なので、「ギプスサンプリング」ではないと思いますが。

(3)
Λi のサンプリングは、とにかく、確率密度関数 W(Λi;νc,Sq) にしたがってサンプリングできるなら、どうやってもよいです。
確率密度関数 W(Λi;νc,Sq) の具体的な形が式で書かれているわけで、原理的には、逆関数法とかで直接サンプリングすることも可能なはずです。

ただ、実際には、W(Λi;νc,Sq) は相当に複雑な形なので、直接サンプリングするのはなかなか大変です。
なんで、前の質問の#1にも書きましたが、このサンプリング自体をMCMCで行うことが多いです。

補足について。

(1) OKです。

(2)
>Step2で決定したωの分類に従って新たに計算したθをそのまま使う
っていうのが、どういう操作を意味しているのか私には理解できないです。

>そうではなくて、p269の式(12.37)のμi、ΛiをそれぞれN(μi;μc,Λc-1)とW(Λi;νc,Sq)の分布からギブスサンプリングして求めたθi(μi,Λi)を次の繰り返しのStep2のp(xk|θi)のθiとして使うという理解でいいんですよね?

こっちは、それでよいと思います。μiとΛiの分布は無関係なので、「ギプスサンプリング」ではないと思いますが。

(...続きを読む

Q累積度数分布を求める問題なのですが

次の粉塵濃度の水平分布から頻度分布のヒストグラムと累積度数分布を示せ。と言う問題なのですが手順がイマイチわからず困っています。
求め方を教えて下さいm(_ _)m

Aベストアンサー

#4です。

生データのヒストグラム・累積分布と、
密度を求めた時のヒストグラム・累積分布を
掲載するのを忘れていました。

ヒストグラムの横軸がうまく貼れていませんが、”濃度”です。

密度は低濃度側の頻度が高く、合ってない感じがします。
これが、前の投稿に書いた疑問です。
シン・プレートでは、うまく補間できないのかもしれません。

QR について質問です。単線形回帰分析です。 lm関数を使わずに 線形回帰モデルのYi=β0+β1Xi

R について質問です。単線形回帰分析です。

lm関数を使わずに
線形回帰モデルのYi=β0+β1Xi+eの
β0=yの平均-β1xの平均
β1=SXY/SXX
であることと
abline()を使って
データの散布図と回帰直線を引く操作を教えて下さい。色々試したのですが上手くいかず、苦戦しています。よろしくお願いいたします。

Aベストアンサー

企業でSQCを推進する立場の者です。

こんな感じでしょうか。
これに信頼区間とか予測区間を加えようとすると、
絶対にlmでやった方が楽ですけど・・・。

rm(list=ls()) # メモリー上の残骸を消す

# 適当に点列を作ってプロットする
# 仮に、β=1.5,y切片=3 とする。

x <- rnorm(0:100,5,2.5)
y <- 3 + 1.5 * x + rnorm(0:100,0,0.5)
xy <- data.frame(cbind(x,y))

plot(xy,pch=16,xlim=c(-5,15),ylim=c(-5,25),las=1)
abline(h=0)
abline(v=0)

xy.c <- scale(xy,,scale=F) # 中心化

# 偏差平方和を求める
# XTXで求めるという、定石を使う

SS <- t(as.matrix(xy.c)) %*% (as.matrix(xy.c))
Sxx <- diag(SS)[1] # XTXの左上部分
Sxy <- SS[lower.tri(SS)] # XTXの左下部分

# 回帰のパラメータを求める

beta1 <- Sxy / Sxx
beta0 <- mean(y) - beta1 * mean(x)

# 回帰線を追加する

abline(beta0,beta1)

# 念のため検算

names(xy) <- c("X","Y")

lm(Y~.,data=xy)
beta0
beta1

企業でSQCを推進する立場の者です。

こんな感じでしょうか。
これに信頼区間とか予測区間を加えようとすると、
絶対にlmでやった方が楽ですけど・・・。

rm(list=ls()) # メモリー上の残骸を消す

# 適当に点列を作ってプロットする
# 仮に、β=1.5,y切片=3 とする。

x <- rnorm(0:100,5,2.5)
y <- 3 + 1.5 * x + rnorm(0:100,0,0.5)
xy <- data.frame(cbind(x,y))

plot(xy,pch=16,xlim=c(-5,15),ylim=c(-5,25),las=1)
abline(h=0)
abline(v=0)

xy.c <- scale(xy,,scale=F) # 中心化

# 偏差平方和を...続きを読む

Q凸クラスタリングについて

書籍、続・わかりやすいパターン認識の10章p207~208にある凸クラスタリングの実験をpythonで実装して実際にやってみました。その結果書籍の内容と少し違った結果になったところとかもあり、その対応の仕方で疑問の残ったところもあるので質問させていただきました。
まず、図10.6のiter=0の500個の散布図は、pythonのnumpy.random.multivate_normal()関数を使って似たようなものを作りました。また、πiで、(0.001/samples)以下のものは強制的に0にして削除しながら、その都度、式(10.37)で再正規化を行いました。(samplesはπi != 0のπiの個数で500から徐々に減っていきます。)初期条件などは、書籍のものに合わせて行っています。
この結果、私のやってみたものでは、iter=4000で、12クラスタが残りました。これらの点は、5クラスタの中の3クラスタが中心付近に複数の点があります。書籍ではこの段階で5個のクラスタに収束したと書かれています。(また図10.6のiter=4000で3つ円の輪郭線がその他の2つのものより太く描かれているようですが、これはどういう意味なのでしょうか?)12クラスタ残った後の処理をどのようにしたら一番良いものか分かりかねています。ちなみに、σやiterの回数や上の閾値を色々変えてやってみたのですが、私のものでは、5クラスタには収束しませんでした。後この状態で、πi > 0.01の選別を行うと、6クラスタになりました。(真ん中のものだけ中心付近に2点残りました。πi = 0.1701 と πi = 0.0339 で足すと0.2に近い値になり、2点の重心も平均すると(0, 0)に近い値になります。
書籍に書かれているような希望するクラスタ数に収束しなかった場合のその後の処理の仕方について、詳しい方がいられたら、御教示願えればと思います。(他の書籍でも色々調べてみたのですが、この部分に関する記述は見つけることができませんでした。よろしくお願い致します。)

書籍、続・わかりやすいパターン認識の10章p207~208にある凸クラスタリングの実験をpythonで実装して実際にやってみました。その結果書籍の内容と少し違った結果になったところとかもあり、その対応の仕方で疑問の残ったところもあるので質問させていただきました。
まず、図10.6のiter=0の500個の散布図は、pythonのnumpy.random.multivate_normal()関数を使って似たようなものを作りました。また、πiで、(0.001/samples)以下のものは強制的に0にして削除しながら、その都度、式(10.37)で再正規化を行い...続きを読む

Aベストアンサー

なにも併合処理しない凸クラスタリングは、そうなりますよ。
書籍で5つにクラスタリングできたというのも、あきらかに併合すべきクラスタを併合すると5つになった、ということです。

凸クラスタリングは、標準偏差σが全クラスタで共通と仮定しているわけですが、
これは、言うなれば解像度がσで固定の虫眼鏡を使って世界を見ることにします、といっているわけで、
原理的に、0.3σ程度以下の2点はそもそも区別できないです。

なんで、単純に、0.3σ程度より近い距離にある2つのクラスタは、併合してしまえばよいです。

Q1次元混合正規分布の等高線の描き方

書籍、「続・わかりやすいパターン認識」のp182の図9-3の「混合正規分布のパラメータ推定」
の図でμ1とμ2の等高線を描きたいのですが、この図のμ1とμ2の関係式はどのようにして導かれる
のでしょうか?p181の図9.31の説明では、式(9.17)により計算される対数尤度logp(x;θ)の
等高線が描かれているとあります。

この書籍勉強されている方で、分かる方、御教示でがえればと思います。

Aベストアンサー

企業で統計を推進する立場にある者です。

まず、等高線を描くRスクリプトを投稿します。
機械学習を学ばれている方なら、Rくらいは使えますよね。

次の投稿で、対数尤度の部分の解説をしたいと思います。

~~~~~~~~~~~~~~~~~~~~~~

rm(list=ls())
par(ask=T)

# 1次元混合モデルの尤度の等高線を描く
# μ1,μ2は未知数としてパラメータ扱いする

n <- 500
Pr1 <- 0.6
Pr2 <- 0.4

# 500個のデータを乱数生成しヒストグラムを描く

x <- c(rnorm(n * Pr1,3,1),rnorm(n * Pr2,-1,1))
bk <- seq((-5-1/6),(7+1/6),by=1/3) # 図9.2の区切り方
hist(x,breaks=bk,xlim=c(-4,6))

# 等高線図を作るためのグリッドを生成する

mu1 <- mu2 <- seq(-4,6,by=0.2)
z <- expand.grid(mu1,mu2)
len <- nrow(z)

# 500個のデータの対数尤度を、格子点毎に計算する

y <- NULL
for(i in 1:len){
l <- sum(log(dnorm(x,z[i,1],1) * Pr1 + dnorm(x,z[i,2],1) * Pr2))
y <- append(y,l)
}

# 格子点データを等高線図,外観図として描く

y <- matrix(y,ncol=sqrt(len))
contour(mu1,mu2,y,nlevels=50,drawlabels=FALSE)
persp(mu1,mu2,y,theta=-20,phi=45,expand=0.5,col="lightblue",shade=0.75)

# 最尤値

index <- which(y == max(y))
z[index,]
max(y) # そのときの対数尤度

企業で統計を推進する立場にある者です。

まず、等高線を描くRスクリプトを投稿します。
機械学習を学ばれている方なら、Rくらいは使えますよね。

次の投稿で、対数尤度の部分の解説をしたいと思います。

~~~~~~~~~~~~~~~~~~~~~~

rm(list=ls())
par(ask=T)

# 1次元混合モデルの尤度の等高線を描く
# μ1,μ2は未知数としてパラメータ扱いする

n <- 500
Pr1 <- 0.6
Pr2 <- 0.4

# 500個のデータを乱数生成しヒストグラムを描く

x <- c(rnorm(n * Pr1,3,1),rnorm(n * Pr2,-1,1))
bk <...続きを読む

Q正規分布の確率密度関数

画像のような問題で、定数kと分散の値は出せたのですが、平均の導き方がどうしてもわかりません。
助けて頂けると嬉しいです!

Aベストアンサー

#3です。企業に勤務する統計家です。

今日のお昼休みに、実際に解いてみました。
そうしたら、②の平均の導出がヒントとなって、
③の分散が、#2さんの「2次の中心積率」で簡単に解けることが分かりました。

#3での、#1さんへの指摘「前に出る定数e^1/2は分母になるのでは?」は、
私の勘違いでした。お詫びします。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

【問】k*exp(-x^2/2-x)が正規分布の確率密度関数のとき、
定数k,平均,および分散を求めよ。

①「密度関数は、-∞から∞まで積分した時に1になる」を使う。
ガウスの積分公式を使うため、まずネイピア数の指数を平方完成する。

(与式)=k*exp(-1/2*(x^2+2*x))
=k*exp(-1/2*(x+1)^2+1/2)
=k*exp(1/2) * exp(-1/2*(x+1)^2)

ガウスの積分公式∫e^(-at^2)dt=sqrt(π/a) より、

∫(与式)dx=k*exp(1/2) * sqrt(2*π) 積分区間は-∞から∞まで

k*exp(1/2) * sqrt(2*π)=1  と置くと、

∴k=1/(exp(1/2)*sqrt(2*π))

②与式は正規分布と指定されていることから、平均は与式を微分して0と置いて求める。
なぜなら、正規分布関数は、確率密度が一番高い所が平均だから。

(k*exp(-x^2/2-x))´
=k*exp(-x^2/2-x) * (-x^2/2-x)´
=k*exp(-x^2/2-x) * (-x-1)

これを0と置くと、前の項は指数関数で0にならないから、
(-x-1)=0
x=-1

∴E(x)=-1

③分散は2次の中心積率から求める。

V(x)=∫(x-(-1))^2*(与式)dx   積分区間は-∞から∞まで

②より、(与式)=(与式)´/-(x+1) となることに着目

V(x)=∫(x-(-1))^2*(与式)dx
=-∫(x+1)^2/(x+1)*(与式)´dx
=-∫(x+1)*(与式)´dx
=-((x+1)*(与式)-∫(x+1)´*(与式)dx)     ・・・部分積分を適用
=-(x+1)*(与式)+∫(与式)dx

第1項は(-1,0)を中心とした回転対称になる奇関数なので積分値は0。
第2項は確率密度の全範囲積分だから1。

∴V(x)=1

#3です。企業に勤務する統計家です。

今日のお昼休みに、実際に解いてみました。
そうしたら、②の平均の導出がヒントとなって、
③の分散が、#2さんの「2次の中心積率」で簡単に解けることが分かりました。

#3での、#1さんへの指摘「前に出る定数e^1/2は分母になるのでは?」は、
私の勘違いでした。お詫びします。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

【問】k*exp(-x^2/2-x)が正規分布の確率密度関数のとき、
定数k,平均,および分散を求めよ。

①「密度関数は、-∞から...続きを読む

Q数学の「無定義用語」

数学には「無定義用語」というものがありますよね?
「言葉を厳密に定義することはできないので、いくつかの「無定義用語」を用意して、その関係を公理によって設定する」みたいな感じだったと思います。
そこで疑問に思ったのですが、「無定義用語」の関係を表す言葉(記号?)に「意味」があるのはまずくないですか?
いくら「無定義用語」を使っていても、それらの関係性を表す言葉(記号?)に「意味」があったら(定義されていたら)「無定義用語を使っている意味がないのでは」とならないでしょうか?

そのことを数学に詳しい人に聞いてみたところ
「実はその関係性を表しているもの、これも無定義なんだよ。ただこれを説明しようとすると
公理的集合論の話になる。」
と言っていました。

そこで公理的集合論のことをちょっと調べてみたのですが、それらしき話は見つかりませんでした。
関係性を表している「もの」も無定義とは、どういうことなのでしょうか?
そもそもとして、関係性を表している「もの」も無定義で、理論を展開できるのでしょうか?
=や∀や⊃などの記号は意味があるから使えているような気がするのですが...。

数学の素人の質問なのでトンチンカンな事を聞いているのかもしれませんが、どうしても気になります。回答お願いします。

(数学に関して素人なので、分かりやすく解説してくれると助かります。)

数学には「無定義用語」というものがありますよね?
「言葉を厳密に定義することはできないので、いくつかの「無定義用語」を用意して、その関係を公理によって設定する」みたいな感じだったと思います。
そこで疑問に思ったのですが、「無定義用語」の関係を表す言葉(記号?)に「意味」があるのはまずくないですか?
いくら「無定義用語」を使っていても、それらの関係性を表す言葉(記号?)に「意味」があったら(定義されていたら)「無定義用語を使っている意味がないのでは」とならないでしょうか?
...続きを読む

Aベストアンサー

数学をドライに捉える「公理主義」、あるいは、(現実とすっぱり縁を切ってしまったという意味で)もっとドライな「形式主義」に関するご質問かと思います。
 無定義用語のみならず、「無定義用語の関係を表す言葉」にも意味はありません。ただ、それら(要するに記号)の操作の仕方が公理系によって規定されているだけです。また定義によって導入された用語も、その定義というのが無定義用語と「無定義用語の関係を表す言葉」だけで与えられているに過ぎないんですから、おいこら一体どういう意味やねん、と徹底的に問い詰めて行けば、結局は「意味のないものに関する意味のない関係を満たす意味のないものです」ということになっちゃいます。ですが、あの「意味のないもの」とその「意味のないもの」とは必ずしも同じではなくて、操作の仕方の違いという区別がはっきりある。なので、それらの区別を明示するために、それぞれ別の用語を割り当てる訳です。

> そもそもとして、関係性を表している「もの」も無定義で、理論を展開できるのでしょうか?

 記号の扱い方が規定されている、その規定の中で、どんな論理式が真であると言えるのか、だけを問います。真だと言える論理式の集まりこそが、数学で言うところの「(その公理系における)理論」です。

 で、無定義用語や「無定義用語の関係を表す言葉」を何か特定の意味(イメージでもいいんです)だと思ってみたときに、それらの操作の仕方が公理系によって規定されている通りになる場合、そういう意味付けを「モデル」と言います。特に、その特定の意味付けが現実の何かとの対応である場合、この理論はその現実へ応用できる。数学の理論がいろんな所に応用が利くのは、理論に特定の意味を与えていないからです。まっさらだからこそ、いろんな意味付けができるというわけ。
 もちろん、意味付けしてみたものの、現実の側がちょっとでも公理系による規定の通りでないと、辻褄の合わない所が発生してしまって、これは理論の限界(limitation)ということです。たとえば、お金の計算は四則演算でできるかというと、10円を3人で分けるという話になると、なんだか辻褄が合わなくなる。

数学をドライに捉える「公理主義」、あるいは、(現実とすっぱり縁を切ってしまったという意味で)もっとドライな「形式主義」に関するご質問かと思います。
 無定義用語のみならず、「無定義用語の関係を表す言葉」にも意味はありません。ただ、それら(要するに記号)の操作の仕方が公理系によって規定されているだけです。また定義によって導入された用語も、その定義というのが無定義用語と「無定義用語の関係を表す言葉」だけで与えられているに過ぎないんですから、おいこら一体どういう意味やねん、と徹底...続きを読む

Q電流計についてなのですが、画像の問題を読むと 回路の電流を測定するために電流計をつけた。それによる測

電流計についてなのですが、画像の問題を読むと

回路の電流を測定するために電流計をつけた。それによる測定回路の抵抗の変化分を補償するために直列に抵抗Rをつけた

と書いてあるのだと思うのですがなぜ抵抗Rをつけるのでしょうか。
元々は導線で抵抗0の所に電流計をつけてそれによる回路全体の抵抗の変化を少しでも少なくしたいのだからrgとRsで並列となり、この部分の抵抗自体は少なくなって(元々の状態の抵抗0に近づいて)いるのだからわざわざ補償用抵抗をつける必要はないのではないでしょうか

電流計の耐電圧の関係かなと思いましたがそのような事も書いてありませんし、なぜわざわざ減った抵抗値を増やすような事をするのでしょうか。

Aベストアンサー

>元々は導線で抵抗0の所に電流計をつけて
>それによる回路全体の抵抗の変化を少しでも少なくしたいのだからrgとRsで並列となり、
>この部分の抵抗自体は少なくなって(元々の状態の抵抗0に近づいて)いるのだから
>わざわざ補償用抵抗をつける必要はないのではないでしょうか

これは一面では正しいと思います。
しかし、
「測定電流値を増やしてもa,b端子間の抵抗値を変えない」重視なら
正しくない、「補償用抵抗を付ける必要がある」ということでもあります。

この設問は「変えたくない」理由は書いてないですが、
設問に対しては「そういう前提」と解釈して解答するだけですね。
「その理由がわからないと解答できない」ってわけじゃないですし。

で、「測定電流値を増やしてもa,b端子間の抵抗値を変えない」意味ですが、
例えば、実験目的で電流値をいろいろ変え、追従してRs値交換し、電流値を記録し
a,b端子間の電圧降下を算出する場合などは、一定値の方が都合がいいように思います。
計算式が1つで済むので。
そうでないと(測定時のRs値によって)計算式を変える必要がありますよね。
組合せが増えれば作業も手間だし間違える可能性も出てくるし検証も複雑になる。


「一定にする」のと「少しでも小さくする」のは両立できず、一長一短です。
どちらを取るかは状況や価値観によります。本設問では「一定にする」と読めます。

電流計はrg=0オームで回路に影響与えないのが理想なんですが、
回路のエネルギーを横取りするので、現状、どういう方法でも元の回路に影響を与えます。
(クランプ式の電流計も)
少しでも0に近い方が、それによる測定誤差はより小さくなり、望ましいのですが
素の電流計 rg 以下にはできません。誤差の要因は他にもあります。
「測定誤差はこれくらいは許容」前提な測定を行うことはママあります。

>元々は導線で抵抗0の所に電流計をつけて
>それによる回路全体の抵抗の変化を少しでも少なくしたいのだからrgとRsで並列となり、
>この部分の抵抗自体は少なくなって(元々の状態の抵抗0に近づいて)いるのだから
>わざわざ補償用抵抗をつける必要はないのではないでしょうか

これは一面では正しいと思います。
しかし、
「測定電流値を増やしてもa,b端子間の抵抗値を変えない」重視なら
正しくない、「補償用抵抗を付ける必要がある」ということでもあります。

この設問は「変えたくない」理由は書いてないで...続きを読む


人気Q&Aランキング