プロが教える店舗&オフィスのセキュリティ対策術

今、実験値の統計処理を行っています。

同じ試料について一定量をサンプリングし、測定値を理論式に当てはめ、誤差伝播を考えた形x±Δxで実験値を算出しています。何度も測定を行ったので、平均値や分散などを計算したいんですが、処理の方法に困っています。

標本の平均値や分散などの不確かさは、それぞれに誤差伝播式
f:=f(x_i) ⇒ Δf = ( Σ(∂f/∂x_i)^2 Δx_i^2 )^(1/2)
を当てはめて計算して良いですか?

あと、t分布で母平均を推定したいんですが、標本の平均や分散に不確かさが含まれている場合、どのように計算すれば良いのでしょうか・・・??


何卒ご教授宜しくお願いします。

A 回答 (5件)

> 当てはめて計算して良いですか?


 引用なさっている式は、fをxiについてテイラー展開して1次までで打ち切ったもの
f(x1+dx1,…,xn+dxn)≒f(x1,…,xn)+Σ(∂f/∂xi)dx
を使った近似において、xiの誤差がそれぞれ互いに独立であると仮定し、その分散を計算したものに他なりません。ですから、

(1) fは(x1,…,xn)の近傍で十分滑らかであって、誤差の程度Δxiの絶対値が小さい、従ってfは線形近似できる
(2) xi(i=1,2,…)の持つ誤差は互いに独立である

という条件でなら大丈夫。

> 標本の平均や分散に不確かさが含まれている場合

 標本から計算した不偏推定量に不確かさが含まれていない場合などあるんでしょうかね。ふつーにやればいいんです。ふつーに。
    • good
    • 0
この回答へのお礼

ご回答ありがとうございます。


> 引用なさっている式・・・

2乗のルートを取る当たり、ベクトルの長さを考えたものだと思っていたんですが、テーラー展開だったんですね。それなら、相対誤差は1より十分小さいので、この式で見積もって大丈夫そうですね。


> 不偏推定量に不確かさが含まれていない場合などあるんでしょうかね

不確かさという言葉がまずかったのかも知れません・・・。
上の式が使って計算すると、分散や平均がV±ΔV、<x>±Δ<x>と幅を持って計算されてしまうと思うんですが、母平均を推定する際に、露わになっている誤差 ΔV、Δ<x> の影響をどう処理すれば良いのか困っています。こういうときは、どうやって母平均の信頼区間を計算するのでしょうか・・・。

お礼日時:2008/05/10 21:51

ANo.4のコメントについて、念のためANo.4で申し上げたことをもう一度整理しますと、



●母集団A: うどんの重量の、無限個の数値の集団。
●母集団B: はかりを使って得られるであろう測定値の、無限個の数値の集団。
 なので、Bは、(1)Aの分布、すなわちうどんの重量のばらつきの分布と、(2)ヘタレなはかりの誤差の分布、の両方から決まるある分布に従っています。

●実際に持っているデータはBから取ったサンプルであって、Aからのサンプルではない。

●このデータから、Aの分布に関する情報を引き出したい。

 第一段階として、サンプルからBの母平均の分布と母分散の分布を推定する。(この段階ではかりの心配なんかしても無意味です。それも加味しての母集団Bですから。)
 「母平均と、その不偏推定(つまりデータの平均値)とのズレ」は、(1)Aからサンプルを取る際に生じた偏りと、(2)はかりの誤差、の両方に起因しています。(そしてこのズレは、t分布(あるいは2乗すればF分布)に従う。)

 ところで「Bの分布は、Aの分布とはかりの誤差の分布(両者は幸いにも、独立と考えられる)の合成である」、および「はかりの誤差の分布は平均Aと分散S^2を持つ」というアプリオリな知識を持っている。

 そこで第二段階として、第一段階で得たBの母平均の分布と母分散の分布から、はかりの誤差による影響を除いて、Aの母平均の分布と母分散の分布を計算すれば良い。

======================

> 測定値の平均は
> Δ<N> = (1/測定数 * ΣΔN_i^2)^0.5
> だけ揺らいでしまいました。

 間違ってます。というのは、この式は「(2)はかりの誤差に起因する、真の母平均と不偏推定量とのズレ」しか表していない。肝腎の「(1)サンプルを取る際の偏りに起因する、真の母平均と不偏推定量とのズレ」を無視しています。
(もし母集団Aにばらつきが全くないなら、すなわち「ヘタレなはかりの誤差の分布を調べるために、たった一杯のうどんを繰り返し測る実験をした」という事なら、この式で良い。が、そういう話じゃないでしょ?)
    • good
    • 0
この回答へのお礼

ご回答ありがとうございます。

> ヘタレなはかりの誤差の分布を調べるために、たった一杯のうどんを繰り返し測る実験をした

私の過ちが分かりました。コレで目的は達せそうです。長々とお世話いただきありがとうございました!

お礼日時:2008/05/14 18:46

 少し、問題の在処が見えて来た気がします、stomachmanです。

気のせいかもしれませんが。

ご質問の文章でよく分からないのは、そもそもiは複数の種類(たとえば、体重、身長、握力、…)の測定を区別するための番号なのか、それとも同じ測定の繰り返しを言っているのか。fって具体的には何のことなのか(「理論式」のことなのか、当てはめにつかう目的関数なのか、あるいは、平均を計算するというような統計操作のことなのか)。Δx_iは測定して得たものなのか、あるいは、どこかに書いてある数値なのか…
 ま、要するに分からないことだらけ。なので、具体的にどれがどうとは言えず、曖昧な表現になるけど一般論を書きます。

 測定誤差がランダムなものであれば、それを含めての母集団だと考えれば良いんです。

 どういうことかと言うとですね:
 例として、1変数の分布を考えます。たとえば、「学食のうどん1杯に入っているうどんの本数」。これは数値の集団である。ただし、無限杯のうどんが供されたときに初めて構成される集団であり、空想上のものである。けれども、これを母集団Aとする。(改めて確認すると、Aは数値の集団であって、うどんの集団ではない。)そのAについて統計を知りたい。
 ですが、その母集団Aとは別に、「Aを計測器で測定して得られる値」がなす母集団Bを考えるんです。すなわち、「『突撃!ぼくらのうどん調査隊』の隊員が報告したうどんの本数」が母集団B。これもまた、無限に調査を繰り返したときに到達するであろう、数値の集団のことです。
 で、実際に得られるのはBのサンプルだけです。Aのサンプルは得られない。

 母集団Aが正規分布に従い、『突撃!ぼくらのうどん調査隊』隊員の測定誤差も正規分布に従うものとすれば、母集団Bもまた正規分布に従う。そこで、

第一段階:母集団Bが平均m, 分散σ^2の正規分布に従うとき、母分散の不偏推定量u^2は、サンプルの分散s^2とサンプル数nを使って、
u^2 = (s^2)n/(n-1)
であり、そして、
z = n(s^2)
は自由度n-1のχ二乗分布に従う。また、サンプルの平均 aを使って
y = ((a-m)√n)/u
を作ると、これは自由度n-1のt分布に従う。

というわけで、Bの平均の推定値の分布と、 Bの分散の推定値の分布が分かる。

 つまり今度は、「Bの平均の推定値」という母集団Cと、「Bの分散の推定値」という母集団Dを考えている。これらは、このようなサンプリング調査を無限回繰り返したときに到達すると想像される空想上の集団である訳です。

 第二段階:Bの平均の分布と、分散の分布に加えて、測定装置である『突撃!ぼくらのうどん調査隊』隊員の持つ誤差の平均Aと分散S^2が分かっているとする。このときに、Aの平均の分布と分散の分布はどうなるかを考えるのです。ここでANo.3の後半の話になります。
 
 で、ご質問と補足を拝見すると、全くの憶測ですけれども、母集団Aと母集団B、すなわち「うどんの本数の集団」と、「うどんを測定器で測定して得た本数の集団」を混同なさっているのではないか、さらに、その原因は、「うどんの本数の集団」と「うどんの集団」とを混同なさっているからではないか、という印象を受けました。なので、問題の在処が見えて来た気がする、と申し上げた訳です。
    • good
    • 0
この回答へのお礼

わかりやすい例を交えてくださり、ありがとうございます。

> 「うどんの本数の集団」と、「うどんを測定器で測定して得た本数の集団」を混同・・・「うどんの本数の集団」と「うどんの集団」とを混同・・・

正直混同しているかどうかも分かりません・・・。

うどんの例をお借りしますが、うどんの本数の測定のために重さを量ったとして、その測定値(から計算されるうどんの本数)の揺らぎが、うどん一杯の本数の揺らぎにはならない・・・これは分かります。

食堂が公表するうどんの本数が本当かどうかを判断し、違えば抗議しに行こうとしている私がいるとします。

はかりでうどんの重さを Wi と量り、それにうどんの密度 ρ (うどん一本の長さはほとんど違わないとして・・・無理がありますが・・・)を掛け合わせて、うどんの本数
Ni=Wiρ=:f(Wi)
を測定してたのですけれども、はかりの仕組み上 ΔW だけ、どうしても重さに揺らぎが生じてしまうことがわかっているので ΔNi の計算に
ΔNi = ( (∂f/∂W)^2 ΔW^2 )^(1/2) = ρΔW
という式を使いました。(実際の式ではρにあたる部分に 測定番号i への依存性が多少あります・・・Ni に対して無視しても良いような差ですが・・・)


一度の測定値だけじゃ信じてもらえないと思って何度か測定して、その平均 <N> を求めることにしたんですが、なにぶん私は貧乏で、 ΔNi の影響を無視できるほどのうどんを買うことが出来ず、測定値の平均は
Δ<N> = (1/測定数 * ΣΔN_i^2)^0.5
だけ揺らいでしまいました。

各測定値 Ni には、うどんの長さの僅かな差で揺らぎ u^2 がありますが、どうも疑わしい結果が出たため、私の測定平均値は「ここからここまでに95%の確率で入ってます」とt分布から主張したいのですが・・・ ΔNi をの影響をどう考慮すれば良いのかと悩んでいるのが今の私です。

測定平均値推定区間と、うどんの本数の平均値推定区間をごっちゃにしていた面は多少あるかも知れません。

ΔNiは測定平均値の推定区間と別の事柄じゃないのかと思えてきたんですが、ΔNiの影響はありますか?

長々と申し訳ありません。

お礼日時:2008/05/13 23:04

ANo.2のコメントについてです。



 系統誤差にもいろいろあるけど、主に「未知の要因による誤差」を系統誤差と呼ぶことが多い。それを除外できたとすると、計測器の狂い、つまり「同じものを測定したらいつも同じだけ出る誤差」が残ります。「計器によって生じると分かり切った誤差」と仰るのだから、後者の話でしょう。
 これは「同じものを測定したときに±幾ら」という格好にはならない。もし複数の計測器で測ったデータをごっちゃにするのであれば、その前にそれぞれの計測器の持つ狂いを補正する(較正と言います)処理をしなくちゃだめです。

 一方、そうじゃなくて、計測器の測定精度の限界が「±幾ら」と書いてある、という話であるならば、それは系統誤差じゃなくて、測定値の持つ精度、つまりランダムな誤差のばらつきを表している。
 測定結果のばらつき(分散(σr)^2)は、標本の持つばらつき(分散σ^2)と計測器のランダムな誤差(分散(σm)^2)の和であって、両者は独立だから、
(σr)^2 = σ^2 + (σm)^2
という関係にある。この式から、σ^2 が計算できますよね。
    • good
    • 0
この回答へのお礼

何度もすいません。


> 系統誤差じゃなくて、測定値の持つ精度、つまりランダムな誤差のばらつきを表している

統計は一通り学んだつもりでいたんですが、全然駄目みたいですね。これを「系統誤差」と呼ぶものだとばっかり思っていました。お恥ずかしい・・・^^;

> (σr)^2 = σ^2 + (σm)^2

分散の意味を考えてみたら、示していただいた式が理解できました。でも、標本の平均の誤差が気になります。自分なりに、少し調べてみたところ、標本平均の誤差は、誤差伝播式から
Δ<x>^2 = 1/N * ΣΔx_i^2
と計算して良いみたいで、標本数が30くらいあれば無視して良い?とのことだったんですが、今のケースがそれに当てはまりません。標本平均に誤差を含んでいて、それが無視できないような場合、母平均はt分布で推定するようなことは出来ないのでしょうか・・・。

お礼日時:2008/05/12 18:42

> 2乗のルートを取る当たり、ベクトルの長さを考えたものだと思っていたんですが



間違いではありません。標準偏差の2乗(つまり分散)の和を取って平方根を使うのは、ピタゴラスの定理によって、互いに直交する(つまり独立な)誤差成分の和ベクトルの長さ(すなわち、標準偏差)を計算するためですから。

> 上の式が使って計算すると、分散や平均がV±ΔV、<x>±Δ<x>と幅を持って計算されてしまう

 仰る意味がさっぱり分からない。というのは、もしΔVやΔ<x>まで分かっているんなら、既に答が出ているのでは? この上何をやろうと言うのかが分かんない。
    • good
    • 0
この回答へのお礼

ご親切にご回答いただき有り難うございます。

補足もこちらでさせてください。

> 仰る意味がさっぱり分からない。というのは、もしΔVやΔ<x>まで分かっているんなら、既に答が出ているのでは? この上何をやろうと言うのかが分かんない。

「系統誤差」という言葉で良かったと思うんですが、生の測定値は計器によって生じると分かり切った誤差が含まれていて、それを理論式と誤差伝播式で処理して実験値 xi±Δxi を得ています。これより母平均の信頼区間を求めるにはどうすれば良いですか? 代表値 xi だけに対して処理するということも考えてみたんですが、なんだかしっくりいきません。こういう場合、どうやって母平均を推定すれば良いのでしょうか・・・

上手く説明できず、ごめんなさい。

お礼日時:2008/05/11 14:10

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!