確率・統計の”標本分散”は不偏統計量でしょうか。すなわち標本数をnとした場合、(n-1)で割るかどうかです。テキストなどによると(n-1)で割るようなのです。とすると、nで割る場合それは何でしょうか。標本分散に母数(母分散)を推定するためのもの、という目的が明確に示されているなら、不偏統計量にするということもわかる気がします。一方、ただn個の数値があって、その分散は何かと言われたらnで割るのではないかと思うのですが。
言葉の定義の問題なのでどちらでもありうるのかもしれませんが、明確性はあった方がいいと思いますのでお尋ねしてみました。
A 回答 (3件)
- 最新から表示
- 回答順に表示
No.3
- 回答日時:
#1です。
ご質問者のように、複数の書籍を並行して調べるようなケースでは、分散に限らず、用語の定義が異なることがあります。非常に困ります。
これは、統計の世界に限らないと思います。
ご質問者がご指摘されておられるとおり、明確性があった方が良いのは当然です。
学校では、試験がどう採点されるのかという心配がありますが、商取引では、もっと深刻な問題になります。
そのために国際規格があると思います。
そして、それが間違いであっても、それに従うことが必要だと思っています。
6÷2(1+2)
が1か9か、このサイトで時々話題になりますが、これも、計算ルールを誰かが決めて、そのコミュニティーではそれに従うことが必要だと思います。
回答ありがとうございます。6÷2(1+2)の問題は、和差・積商・かっこの3者の順番が明記されるか、掛け算のXは省略可能か、というルールが明確でないかもしれないということですね。悪法も法というか、使いづらさはさておき、ルールが明確かどうか、ゆるぎなく皆が使っているかどうかということですね。
それがそうじゃない場合があるっていうのが不思議です。赤信号・青信号の取り決めについて(それが真逆であってもいい)ですが、まだらになっている、すなわち場合によって赤で止まったり・進んだりするという感じがしてしまいました。内容はともあれ、皆が一斉に従うからこそ皆にメリットがあるのにです。
今回の標本分散の件では時間的に実被害があり、一旦停止して自分がどこで間違ったのか再度あれこれチェックするという事態になりました。懇篤な説明をいただきありがとうございます。
No.2
- 回答日時:
「標本分散」という言葉は、使わないほうが無難だと思います。
数学上は、n で割るものが「分散」、(n-1) で割るものが「不偏分散」です。
「標本分散」では、標本の分散なのか、標本の不偏分散なのかが判りません。
それに関する規約は No.1 さんが書いておられますが、学術用語ではなく
所詮 JIS の規約なので、いつまた変わるとも知れません。
統計学の知識としては、標本の不偏分散が母集団の分散の不偏推定量なのだ
ということを理解しておくことが大切なのだと思います。 参考↓
https://ai-trend.jp/basic-study/estimator/unbias …
回答ありがとうございます。分散は割と初等的なものだと思いますが、そこでさえ用語がゆるぎなく定まっていないというのは珍しいのかなと思いました。一応、確率・統計って数学の中に含まれると思いますが、その中でも特別な位置づけになっているように思います。第一種過誤とか人間くさい感じもしますし。
No.1
- 回答日時:
企業で統計を推進する者です。
企業人なので、このような議論は、国内ルール、国際ルールに従うという立場です。ですからアカデミアと少し違うかもしれません。ご参考として読んで下さい。
n個の数値があって、その標本(その集団)の分散を求めよ。と言うときはnで割ります。それをかつては「標本分散」と呼んで不偏分散と区別していました。現在は呼び名がありません。
さらに、現在は不偏分散のことを標本分散と呼ぶようになりました。
なお、Excelの関数では、nで割るときのものには、pが付きます。ポピュレーション(全数の)という意味です。
つまり、全数データを対象とするときはnで割るということで、ご質問者のお考えは正しいです。
以下は、ご質問の趣旨から外れますが用語に関する混乱をまとめたものです。
かつてのJISによると、
・不偏分散は、偏差平方和 S を自由度 (φ=n-1) で割ったものです。
・それに対してS を n で割ったものが標本分散です。標本分散は「この標本についての分散」という意味で、全数データに対して用いられます。全数データは平均値の「推定」が必要ないため自由度が減りませんからnで割ります。
ところが、
・2006年のJISの改訂で、(n-1) で割ったものを、ISOに準拠する形で標本分散と呼ぶことになりました。注意が必要です。
・しかも、不偏分散 V の平方根 s は厳密には標準偏差 σ の不偏推定量ではない(1999年のJISでは明記されていた)にもかかわらず、2015年のJISでは、「標本標準偏差はばらつきの指標である」という曖昧な表現になりました。
このような背景から、
・テキスト、ネット、以下の両方が混在しています。我々は文脈からどちらのことか想像しながら読まなければいけません。
①古い記述:n-1で割ったものが不偏分散、nで割ったものが標本分散
②新しい記述:n-1で割ったものを不偏分散とも標本分散とも言う。nで割ったものに対する呼称は無い
回答ありがとうございます。
実際に勉強している立場で何冊かの本を並行して読んでいてこのような疑問が出てきました。1冊の本の中で定義が混在するということはないと思います。つまり通読中にはこのような疑問は生じないようです。しかし、複数の本あるいは複数の人間の間で定義の差異が起こる可能性があるということになるわけですね(ある本には定義が2つあるので注意と記載されているものもありました)。学科試験としてどうなるんだろうという疑問もあります。標本分散というのはかなり初等的な概念だと思うので。
確率統計、あるいはデータサイエンスの分野とはそのようなものと理解しておくべきなのでしょうか。他にもあるかもしれないと警戒したくなります。この学問は成立過程で論争が続いたということもよく聞くのですが、その辺の事情もあるのかなと思いますが。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・人生のプチ美学を教えてください!!
- ・10秒目をつむったら…
- ・あなたの習慣について教えてください!!
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・【大喜利】【投稿~9/18】 おとぎ話『桃太郎』の知られざるエピソード
- ・街中で見かけて「グッときた人」の思い出
- ・「一気に最後まで読んだ」本、教えて下さい!
- ・幼稚園時代「何組」でしたか?
- ・激凹みから立ち直る方法
- ・1つだけ過去を変えられるとしたら?
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
EXCELにてローパスフィルタを作...
-
エクセルの統計でχ二乗検定の結...
-
【統計】有意に「高い」?「低...
-
統計について
-
理科のグラフで、直線と曲線の...
-
検定統計量の値がマイナス
-
エクセルのグラフから半値幅を...
-
全数調査における検定の必要性...
-
ヒストグラムの分布形状が二山...
-
x=2分の3のグラフはどのように...
-
検量線の決定係数について
-
極値をもつ時と持たない時、単...
-
データ点を線で結ぶ場合と結ば...
-
統計学の問題でわからないので...
-
エクセル統計のランク化した数...
-
aを実数の定数とする。二次関数...
-
単回帰分析と重回帰分析の結果...
-
統計グラフの山と谷の判別について
-
標準正規分布表の確率で、上位...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
EXCELにてローパスフィルタを作...
-
カイ二乗検定
-
エクセルのグラフから半値幅を...
-
統計について
-
検量線の決定係数について
-
3群の比較にχ二乗検定を使う場...
-
【統計】有意に「高い」?「低...
-
エクセルの統計でχ二乗検定の結...
-
ノンパラメトリック検定の多重...
-
パーセンテージの平均値2標本の...
-
パイロットサンプルって何ですか?
-
二次関数の問題です 二次関数 y...
-
理科のグラフで、直線と曲線の...
-
心理機能診断をしたのですが、...
-
アンケートの集計分析の基礎(...
-
変化率のみで、有意差の検定は...
-
検定統計量の値がマイナス
-
極値をもつ時と持たない時、単...
-
最小二乗法を反比例の式を元に...
おすすめ情報