確率・統計の”標本分散”は不偏統計量でしょうか。すなわち標本数をnとした場合、(n-1)で割るかどうかです。テキストなどによると(n-1)で割るようなのです。とすると、nで割る場合それは何でしょうか。標本分散に母数(母分散)を推定するためのもの、という目的が明確に示されているなら、不偏統計量にするということもわかる気がします。一方、ただn個の数値があって、その分散は何かと言われたらnで割るのではないかと思うのですが。
言葉の定義の問題なのでどちらでもありうるのかもしれませんが、明確性はあった方がいいと思いますのでお尋ねしてみました。
A 回答 (3件)
- 最新から表示
- 回答順に表示
No.1
- 回答日時:
企業で統計を推進する者です。
企業人なので、このような議論は、国内ルール、国際ルールに従うという立場です。ですからアカデミアと少し違うかもしれません。ご参考として読んで下さい。
n個の数値があって、その標本(その集団)の分散を求めよ。と言うときはnで割ります。それをかつては「標本分散」と呼んで不偏分散と区別していました。現在は呼び名がありません。
さらに、現在は不偏分散のことを標本分散と呼ぶようになりました。
なお、Excelの関数では、nで割るときのものには、pが付きます。ポピュレーション(全数の)という意味です。
つまり、全数データを対象とするときはnで割るということで、ご質問者のお考えは正しいです。
以下は、ご質問の趣旨から外れますが用語に関する混乱をまとめたものです。
かつてのJISによると、
・不偏分散は、偏差平方和 S を自由度 (φ=n-1) で割ったものです。
・それに対してS を n で割ったものが標本分散です。標本分散は「この標本についての分散」という意味で、全数データに対して用いられます。全数データは平均値の「推定」が必要ないため自由度が減りませんからnで割ります。
ところが、
・2006年のJISの改訂で、(n-1) で割ったものを、ISOに準拠する形で標本分散と呼ぶことになりました。注意が必要です。
・しかも、不偏分散 V の平方根 s は厳密には標準偏差 σ の不偏推定量ではない(1999年のJISでは明記されていた)にもかかわらず、2015年のJISでは、「標本標準偏差はばらつきの指標である」という曖昧な表現になりました。
このような背景から、
・テキスト、ネット、以下の両方が混在しています。我々は文脈からどちらのことか想像しながら読まなければいけません。
①古い記述:n-1で割ったものが不偏分散、nで割ったものが標本分散
②新しい記述:n-1で割ったものを不偏分散とも標本分散とも言う。nで割ったものに対する呼称は無い
回答ありがとうございます。
実際に勉強している立場で何冊かの本を並行して読んでいてこのような疑問が出てきました。1冊の本の中で定義が混在するということはないと思います。つまり通読中にはこのような疑問は生じないようです。しかし、複数の本あるいは複数の人間の間で定義の差異が起こる可能性があるということになるわけですね(ある本には定義が2つあるので注意と記載されているものもありました)。学科試験としてどうなるんだろうという疑問もあります。標本分散というのはかなり初等的な概念だと思うので。
確率統計、あるいはデータサイエンスの分野とはそのようなものと理解しておくべきなのでしょうか。他にもあるかもしれないと警戒したくなります。この学問は成立過程で論争が続いたということもよく聞くのですが、その辺の事情もあるのかなと思いますが。
No.2
- 回答日時:
「標本分散」という言葉は、使わないほうが無難だと思います。
数学上は、n で割るものが「分散」、(n-1) で割るものが「不偏分散」です。
「標本分散」では、標本の分散なのか、標本の不偏分散なのかが判りません。
それに関する規約は No.1 さんが書いておられますが、学術用語ではなく
所詮 JIS の規約なので、いつまた変わるとも知れません。
統計学の知識としては、標本の不偏分散が母集団の分散の不偏推定量なのだ
ということを理解しておくことが大切なのだと思います。 参考↓
https://ai-trend.jp/basic-study/estimator/unbias …
回答ありがとうございます。分散は割と初等的なものだと思いますが、そこでさえ用語がゆるぎなく定まっていないというのは珍しいのかなと思いました。一応、確率・統計って数学の中に含まれると思いますが、その中でも特別な位置づけになっているように思います。第一種過誤とか人間くさい感じもしますし。
No.3
- 回答日時:
#1です。
ご質問者のように、複数の書籍を並行して調べるようなケースでは、分散に限らず、用語の定義が異なることがあります。非常に困ります。
これは、統計の世界に限らないと思います。
ご質問者がご指摘されておられるとおり、明確性があった方が良いのは当然です。
学校では、試験がどう採点されるのかという心配がありますが、商取引では、もっと深刻な問題になります。
そのために国際規格があると思います。
そして、それが間違いであっても、それに従うことが必要だと思っています。
6÷2(1+2)
が1か9か、このサイトで時々話題になりますが、これも、計算ルールを誰かが決めて、そのコミュニティーではそれに従うことが必要だと思います。
回答ありがとうございます。6÷2(1+2)の問題は、和差・積商・かっこの3者の順番が明記されるか、掛け算のXは省略可能か、というルールが明確でないかもしれないということですね。悪法も法というか、使いづらさはさておき、ルールが明確かどうか、ゆるぎなく皆が使っているかどうかということですね。
それがそうじゃない場合があるっていうのが不思議です。赤信号・青信号の取り決めについて(それが真逆であってもいい)ですが、まだらになっている、すなわち場合によって赤で止まったり・進んだりするという感じがしてしまいました。内容はともあれ、皆が一斉に従うからこそ皆にメリットがあるのにです。
今回の標本分散の件では時間的に実被害があり、一旦停止して自分がどこで間違ったのか再度あれこれチェックするという事態になりました。懇篤な説明をいただきありがとうございます。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 不偏分散について 3 2022/03/29 15:57
- 統計学 統計学の問題です。教えてください(_ _) 数万人の有権者がいる選挙区で, 無作為に400人の標本を 2 2023/02/03 15:27
- 統計学 標本分散の求め方 1 2022/11/18 19:29
- 大学・短大 大学 統計学 1 2022/09/14 11:27
- 統計学 不偏分散を計算するときに標準偏差和をn-1で割りますが、なぜ-1なのでしょうか? 「なぜnでなくn- 5 2022/07/04 14:54
- 統計学 統計学が分かりません!詳しい解説と回答を教えてくださる方お願いいします! 5 2022/08/23 03:10
- 統計学 最近統計学について独学で勉強している者です。 mとnは二つの母集団から無作為抽出した際の標本のサイズ 2 2023/02/07 12:35
- 統計学 母集団分布を平均 μ, 分散 σ2 の正規分布と想定し, 母集団から無作為抽出した標本のデータ(標本 4 2023/01/30 20:25
- 統計学 t値の計算方法 1 2022/11/29 18:37
- 統計学 統計学を独学で勉強してます。 ページ左上に誤差分散の推定量の指揮があると思いますが(青いペン) 例題 2 2023/02/12 12:34
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
EXCELにてローパスフィルタを作...
-
下の対数表示のグラフから低域...
-
統計学 1.二特性相関について。...
-
エクセルのグラフから半値幅を...
-
脳波(EEG)の周波数は0.5~60Hzで...
-
【統計】有意に「高い」?「低...
-
サンプル数の異なる2群間にお...
-
統計について
-
エクセルでランダム関数で乱数...
-
心理機能診断をしたのですが、...
-
[Excel] リストからの無作為抽出
-
ヒストグラムの分布形状が二山...
-
ポアソン回帰でのカウントデー...
-
検量線の決定係数について
-
正規分布について
-
統計 RSD%について教えて下さい。
-
統計学の問題でわからないので...
-
高校 数学 aを実数の定数とする...
-
フーリエ変換の質問です。 一定...
-
複数の集団の全体平均が0より有...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
EXCELにてローパスフィルタを作...
-
サンプル数の異なる2群間にお...
-
心理機能診断をしたのですが、...
-
検量線の決定係数について
-
下の対数表示のグラフから低域...
-
エクセルのグラフから半値幅を...
-
x^2+y^2はどのような分布をする?
-
検定統計量の値がマイナス
-
統計について
-
【統計】有意に「高い」?「低...
-
統計学の基本的なことについて...
-
最小二乗法を反比例の式を元に...
-
心理学の統計について
-
ポアソン回帰でのカウントデー...
-
[Excel] リストからの無作為抽出
-
対数グラフの対数とは・・・?
-
極値をもつ時と持たない時、単...
-
対数目盛の読み方を教えてください
-
溶解度の問題 理科
-
正規分布について
おすすめ情報