「みんな教えて! 選手権!!」開催のお知らせ

生物実験において例えば
1回の実験につき3つのデータを取り、同じ実験を3回繰り返して
以下のようなデータが出たとします。

実験1回目)120, 130, 110
実験2回目)75, 80, 70
実験3回目)105, 120, 90

それぞれの実験の平均値は以下の値です。
実験1回目)120
実験2回目)75
実験3回目)105

この実験から母集団の平均値のありそうな範囲を求めたいので
標準誤差(SE)を出すと思うのですが、
SE=標準偏差/√データ数
ということから、
平均値mは実験1~3)の平均値から
m=(120+75+105)/3
=100
標準偏差σは
σ=√Σ(m-それぞれの実験の平均値)^2/(標本数-1)
=√[{(100-120)^2 + (100-75)^2 + (100-105)^2}/(3-1)]
=√(1050/2)
(分母は標本数なのかもしれませんが)
よって
SE=√(1050/2)/√3
でいいのでしょうか?

以下に書いてあるように、
http://oshiete1.goo.ne.jp/kotaeru.php3?q=1514110
「平均値の標準偏差」が「平均値の標準誤差」ということなら、
SE=√(1050/2)
なのかなとも思っていまして。誤解していたらすみません。

標準誤差についての説明は多く見受けられましたが、
具体的な計算方法が載っているものがほとんどなかったので
(探せられなかっただけかもしれません)質問させて
頂きました。上記の計算方法が間違っていたら、
ご指摘くださいますようよろしくお願いいたします。

A 回答 (7件)

#2のコメントへ



前後の文脈がなくその英文だけでは何をさしているのかわかりません。
本当に平均値の標準偏差を取るのかもしれませんし。

話を整理します。

1. 中心極限定理
母集団について平均をμ、標準偏差をσとします。
この母集団からn個の標本を取り出し平均値を求めると、その平均値の分布は、nが十分に大きければ、平均がμ、標準偏差がσ/√nの正規分布に近づきます。これが中心極限定理です。(厳密にはn無限大の極限で一致ですが、n=10程度になれば、そこそこ近い分布になります。)

この定理により、1セットの実験を繰り返して多数個の平均値を求めなくても、平均値の分布を求めることができます。

2. 不偏分散
母集団の平均や標準偏差が求められればいいのですが、現実には求めることができません。そこで、代用品として推定量を使うことになります。この推定量は、一つの値単独では母集団の値とずれるのは仕方ありませんが、期待値を取ったとき(要するに多数回の実験を繰り返して平均を求める)に母集団の値と一致するような量を選びます。これが不偏推定量で、分散の不偏推定量を特に不偏分散と呼びます。

一回の測定で求められる平均と標準偏差をMとSとすると、定義どおり計算すれば、測定値をxとして1回の実験ごとに

M =Σx/n, S^2 = Σ(x-M)^2/n

が求められます。m回の実験を繰り返すと、それぞれ

M1, M2, M3, ・・・・, Mm, S1^2, S2^2, S3^2,・・・・,Sm^2

とm個のMとS^2が得られ、それぞれの平均、

(M1+ M2+M3+ ・・・・+Mm)/m, ( S1^2+ S2^2+ S3^2+・・・・+Sm^2)/m

を計算することができます。

幸いなことに、Mについてはm→∞の極限でこの平均値の平均が母集団平均μに一致するので、標本平均Mを平均値の不偏推定量として使うことができます。

ところが、S^2については、この分散の平均はm→∞の極限でも母分散σ^2には一致しないので、不偏推定量としては使えません。しかし、その極限値は(n-1/n)σ^2になるので、はじめからS^2の定義に(n/n-1)をかけた量

(n/n-1) S^2 = (n/n-1)Σ(x-M)^2/n = Σ(x-M)^2/(n-1)

を考えておけば、この量の平均はm→∞の極限で母分散σ^2に一致することになります。これが不偏分散です。

3. 平均の実験標準偏差
上のことを考えれば、一回の実験のn個の測定値から平均値の標準偏差を推定することができます。つまり、2の不偏分散をnで割ってやれば平均値の分散の推定値を得ることができ、標準偏差は分散の正の平方根なので、平均値の標準偏差は

√[Σ(x-M)^2/(n-1)/n]

で求められることになります。GUMでは、この量に対し、平均の実験標準偏差という名前が与えられています。

質問の文章や上の回答の中に出現している「平均値の標準偏差」や「平均値の標準誤差」というものは、このような手順で導出される量を指しています。したがって、質問にあるように複数個の平均が求められている場合に、その公式を平均値に使うのは誤りです。

ただし、これが質問者が書いているような「同じ実験」ではなく、制御できない要因が入り込んだことによる別の実験の個々の測定値であるとするのであれば、おそらく、質問の計算は間違いでもないと思われます。が、本当にそれに意味があるかどうかは別途考察が必要だろうと思います。たとえば、求めたいものが制御不能な変動の巾であるのだとしたら、最後にnで割らず、

√[Σ(M-<M>)^2/(n-1)] または√[Σ(M-<M>)^2/n]

で求める方が適切です。
    • good
    • 0
この回答へのお礼

hitokotonusiさんへ
勉強不足のため、質問が適切でないにもかかわらず
詳しい親切な回答ありがとうございました。
まだ理解していない部分もありますが、
回答を参考にしながら勉強させていただきたいと思います。

お礼日時:2008/09/11 10:36

> 誤差の定義は、測定値と真の値との差です。



なるほど、そういう言い方をすれば確かに誤差と呼ぶのはよくないのかもしれません。

> BIPMとISOが90年代に取りまとめた『計測における不確かさの表現ガイド』(通称GUM)のなかに標準誤差という言葉が間違って使われていると書いてあります。

私にはこれがどれほど信用できるものなのか判断できないのですが、標準誤差は標準誤差で当たり前のようにどの教科書、論文でも使われている用語なので、それが間違いだとしても覆すのは難しいのでしょうね(^_^;)

標準誤差の使い方や理解のしかたに誤りがあったとしても、この用語自体が誤り問うのには少し疑問が残りますね。ちょっと詳しく調べてみます。
    • good
    • 0
この回答へのお礼

backsさんへ
回答ありがとうございました。
人によってわからないまま(わかったつもりで?)
標準誤差という言葉を使っていたりするんでしょうね。
僕自身もまだはっきり理解していないところがあるので、
回答を参考にしながら勉強させていただきたいと思います。

お礼日時:2008/09/11 11:00

我田引水ですが、


http://oshiete1.goo.ne.jp/qa3484149.html

>SE=√(1050/2)/√3 でいいのでしょうか?
そのとおりです
標準誤差は、標本の平均値のバラツキ(=標本標準偏差、あるいは不偏標準偏差というらしい)の平均値を表します。平均値は、データ数で割るので、この場合平均値は3つなので、3で割ります。

参考URL:http://oshiete1.goo.ne.jp/qa3484149.html
    • good
    • 0
この回答へのお礼

kgu-2さんへ
回答ありがとうございました。
今後の勉強の参考にさせていただきます。

お礼日時:2008/09/11 10:38

#3さんへ



誤差の定義は、測定値と真の値との差です。
偏差の定義は、測定値と母平均との差です。

したがって、不偏分散

Σ(m-それぞれの実験の平均値)^2/(標本数-1)

で求めているのは、母平均周りの二次のモーメントの推定値ですから
誤差と呼ぶべきものではありません。

これは私が勝手に言っていることではなくて、BIPMとISOが90年代に取りまとめた『計測における不確かさの表現ガイド』(通称GUM)のなかに標準誤差という言葉が間違って使われていると書いてあります。
    • good
    • 0

横レス失礼します。



> 標準誤差という言い方は学生実験のテキストなどで広くみられる言葉ではありますが、明らかな誤用なので使うべきではない

というのはどういうことでしょう?
    • good
    • 0

この場合なら、各実験ごとの値が離れすぎているので、私ならそのまま平均を取ることは躊躇します。


実際の測定でこのデータが出たら、測定数を増やすなど、系統誤差分が各実験ごとに大きく違っていないか確認をすると思います。

が、質問にあるデータは明らかにつくられたデータなので、問題作成者の意図を斟酌して上記の点に目をつぶってしまえば(非常に気持ち悪いですが)、計算は質問の1番目にある。

>SE=√(1050/2)/√3

で正しいです。(数字は確認してません)

なお、標準誤差という言い方は学生実験のテキストなどで広くみられる言葉ではありますが、明らかな誤用なので使うべきではないと、先生に言っておいてください。

また、

σ=√Σ(m-それぞれの実験の平均値)^2/(標本数-1)

は標準偏差そのものではなく、母集団標準偏差の推定値です。

この回答への補足

hitokotonusiさん、ご回答ありがとうございます。
例題が悪くてすみません。
本来ならデータからこういうことを示したいから
この計算をするというふうにするのだと思いますが
(逆で、あることを示したいならどんなデータを出せばいいか、
そしてデータをある解析方法で示すためにはどんな実験を
組み立てればいいかってするのが本来かな?
ちょっと違うような。閑話休題。)、
文献の中に
the standard deviation of the mean of at three different experiments; three samples were used in a given experiment
と書いているものがあったのでこれを参考にし、
「平均値の標準偏差」=「平均値の標準誤差」
と思って質問欄に書いてあるような計算をしました。
他には
SD of three different experiments; three samples were used in a given experiment
と書いてあるものもありましたが意味することは同じだと考えました。
質問欄に書いてある計算方法「SE=標準偏差/√データ数」から出た値は、
上記の英語の意味することと同じと考えていいと思われますか?

補足日時:2008/09/10 17:55
    • good
    • 0

> 具体的な計算方法が載っているものがほとんどなかった



s.e. = sqrt(s^2 / n)で標準誤差を計算できます。s^2は分散、nはサンプルサイズです。

> 母集団の平均値のありそうな範囲を求めたい

それならば、95%の信頼区間、あるいは99%の信頼区間を求めることです。

> 上記の計算方法が間違っていたら、ご指摘ください

計算方法が間違っているかどうかは、webサイトや参考書の例題と照らし合わせてみるとよいでしょう。

ちなみに、1回目の標準誤差は5.77、2回目の標準誤差は2.89、3回目の標準誤差は8.66ですよ。

標準偏差と標準誤差について、詳しくはhttp://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc …を参照のこと。

この回答への補足

標準誤差は繰り返した実験の平均値から出すのかと思っていたのですが、
1回の実験で出た値から出してもいいんですね。
でも1回の実験から標準誤差が出るならこの実験の標準誤差は
3回の平均を取って
(5.77+2.89+8.66)/3=5.77
とするのは間違っているんですよね。
質問欄に書いたような方法で出すのが正しいんですよね。
まだよくわかっていないので勉強します。

補足日時:2008/09/10 18:20
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!


おすすめ情報