アプリ版:「スタンプのみでお礼する」機能のリリースについて

標本分散と不偏分散について勉強しているのですが
例えば、分散についての問題が出たときには「不偏分散を求めよ」
「標本分散を求めよ」といった、どちらの公式を使うか問題で指定されるものなのでしょうか?
それとも、自分でどちらの公式を使うか見分けるものなのでしょうか?
もし、見分けるものなら見分けるポイント等を教えていただけたらと思います。

質問の内容が分かりにくいとは思いますが、よろしくお願いします。

A 回答 (3件)

母集団がらサンプルを選んだとき、サンプルの平均、サンプルの分散がきまります。

で、そのサンプルの分散と母集団の分散の間には関係があります。その1つが普遍分散で、なんどもサンプルをとったときにうら、その平均値=期待値が母集団の分散に一致するものを不偏分散といいます。サンプルをとったときに、平均に含まれる揺らぎにより見かけ上分散が小さくなってしまうぶんを補正しているわけですね。

ちなみにこの補正は計算から得られるもので以下の計算で確かめることができます。n個のデータ(確率変数Xj(j=1~n))からなるサンプルを考えたとき、その平均値m=ΣXj/nは確率変数Xjの関数です。そこで、不偏分散の期待値を計算してみます。
∫dP(X1)...dP(Xn)Σ(Xj-m)/(n-1)
これにm=ΣXj/nを代入して、計算すると
<X^2>-<X>^2
が得られます(<f>=∫dP(X)f(X)の意味)。

というわけで、標本分散と不偏分散の使い分けはやりたい内容によります。サンプルについて言及したい場合は標本分散、その母集団について言及したい場合は不偏分散ですね。たとえばテストをやって、学級の中での偏差値を出したい場合は標本分散、その学級の結果をつかって全国の学生の学力の分布を言及したい場合は不偏分散といったところでしょうか?
※しかし、実際にサンプル数が少ない状況で全国の学生の学力の分布のようなことを議論するときは、不偏分散だけを持ち出すのではなく統計的検定によって、どれくらい正しいかということも含めて議論することになるかと思います。なので、不偏分散はサンプル数を多くとった場合に、母集団の分散示したいときに"より正確には"といった感じで使うのではないでしょうか?
    • good
    • 0

 標本分散と不偏分散の相違を知りませんが、おそらく次のような内容という前提で。



 母集団のデータを全て用いて計算できるのなら、誰がやっても同じ値になります。この場合は、nで割る。あるクラスの生徒の身長などです。

 ところが、その学年、他の学校、市町村全員、となると、その中から、いくつかの標本を抜き取りねサンプルとします。この場合、無作為抽出したとしても、標本が異なるので、やる人によつて、微妙に異なります。この場合は、n-1で割る不偏分散を用います。
 この理由は、不偏分散も、データ全部を用いた母集団の分散の代わりにもちいるものです。このばあい、nで割ると、不偏分散の値が小さくなるので、母集団の分散から外れる可能性があります。そこで、、n-1で割って、分散の幅をやや拡げ、網を大きくして、外れることを防ぐとか。
    • good
    • 0

今まで何度勉強しても理解が出来ません。


標本数が少ないときは普遍分散を使い標本数が多いときは標本分散で代用できるらしいのですが。↓

平均値を取るとこれが自由度1を消費するので、分散を計算するには自由度をN-1としなければ
いけないということらしいですがますます判りません。

私はとにかく丸暗記しています。

答えになっていなくてすみません。

参考URL:http://dsl4.eee.u-ryukyu.ac.jp/DOCS/error/node19 …
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!