プロが教える店舗&オフィスのセキュリティ対策術

標本平均の分布について
添付の画像は高校の数学C(数研、平成8年)の第4章統計処理の第9節の解説ですが、?をつけた2行がどうしてもわかりません。
「X1、X2、・・・、Xnの各々は大きさ1の標本とみなされる」の意味がわかりません。たった1つの大きさの標本では期待値や分散などは計算できないのではないかと思ってしまいます。
ご教示、よろしくお願いいたします。

「標本平均の分布」の質問画像

A 回答 (9件)

はい。

間違えました。

σ/√nの式が成り立たない。の間違いでした。

ご指摘、感謝します。
    • good
    • 0

> 有限母集団からn個の標本を「非復元抽出」すると、「?」の式は成立しないですからね。



いえ、成り立ちます。
    • good
    • 0

yhr2様



回答の趣旨、理解しました。

「n個の有限標本で、それらの具体的な値が観測されていても、実は、それらの値の期待値は(何度も試行すれば(yhr2さんによれば、たくさん採ってきたとき))、既知の母集団から採取したサンプルであれば、母集団のm,σ^2 に一致する。」

ということをご説明されているのですね。

背景には、「何度も試行すれば(たくさん採ってきたとき、というかn個の標本を採取する試行を繰り返したとき)」があるのですが、統計屋の慣習でそれは暗黙の了解になっていますからね。


あえて、この教科書の説明にケチを付けるなら、母集団のサイズは無限大(あるいは十分に大きい)であることも明記すべき点です。有限母集団からn個の標本を「非復元抽出」すると、「?」の式は成立しないですからね。(有限母集団修正が必要です)
まあ、ラージN個の母集団とは書いてないし、QC検定1級レベルで高校生には難解なので、指摘しませんでしたが・・・。

分散をnで割っている点と標本標準偏差を標準偏差と書いている点は、ちょっと書かせてもらいました。
    • good
    • 0

No.4 です。



kamiyasiro さん、#5 のご指摘ありがとうございます。

>E()とか、V()とか、σ()のように記述してあることを見落としていませんか。

>既知の母集団から「大きさ 1」 の無作為標本を抽出しても、平均の期待値はm、分散の期待値はσ^2です。

おそらく、質問者さんはそこのところに疑問を持ったのだろうな、と想像して #4 を書きました。

特に、その上の文章に

「大きさ n の無作為標本 X1, X2, ・・・, Xn を抽出する」
「標本平均 Xbar = (X1 + X2 + ・・・ + Xn)/n」

と書かれているので、この X1, X2, ・・・, Xn は「具体的な観測値」だと捉えてしまいます。つまり1つ1つが具体的な固有の値をもった観測値であると。

なので、その下で「X1, X2, ・・・, Xn の各々は大きさ1の標本とみなされるから」と言われると、それは「具体的な値1つ」と解釈してしまうことになります。
そして、「具体的な値」が決まっているのに、「期待値」や「分散(標準偏差)」の話が出て来るので「???」となってしまうと思うのです。

「大きさ1の標本は、採って来るたびにいろいろ変化する(分布する)」つまり「X1, X2, ・・・, Xn は具体的な1つの観測値ではない、統計変数である」ということが、ここに書かれた内容からは想像しにくいように思えます。


kamiyasiro さんのようにこの道の専門の方には、「大文字の X1, X2, ・・・」なのだから、具体的な観測値ではなく「無作為に抽出した標本の集合である」ということが当たり前の常識なのだと思いますが、初学者・浅学者、特に高校生などには、そういった「概念」が理解できていないことが多いように思います(私も勘違いすることが多い)。
    • good
    • 0

#4さんへ、



E()とか、V()とか、σ()のように記述してあることを見落としていませんか。

既知の母集団から「大きさ 1」 の無作為標本を抽出しても、平均の期待値はm、分散の期待値はσ^2です。

今の教科書の記述で問題ありません。

あるクラスから、無作為に2名選んで、身長差を測る。その期待値と分散を求めよ。

という問題があれば、差の平均はm-m=0、分散は分散の加法性からσ^2+σ^2=2σ^2 です。

もし大きさ1の標本は、ばらつきがないとか言い出すと、この試行を何回行っても、身長差のばらつきは無いことになってしまいます。
    • good
    • 1

質問者さんの疑問はもっともですね。


この説明はあまりよくないと思います。

この書き方だと、「大きさ n の無作為標本を抽出する」ので、それは
 x1, x2, ・・・, xn
という「具体的な値」をとるように読み取れます。
そうすれば、その「n 個の値からなる標本」の平均値は
 μx = (x1 + x2 + ・・・ + xn)/n
になります。

ところが、これを「大きさ 1 の無作為標本を抽出する」ということなら、「具体的な値」は「x1」しか存在しないので、
・平均は x1
・分散は 0 (データは1個しかないのだから「分布」しない)
ということになりますよね。

どうやら、ここで言っている「X」は、大文字で書かれているので、上のような「具体的な値」ではなく「抽象的、一般的な統計変数」のことを指しているようです。
統計では、よくそのような表わし方をしますが、その教科書の最初の方に、そういった「文字、記号の意味の使い分け」のようなことが書いてありますか?

たとえばこんなような

https://toukeigaku-jouhou.info/2018/01/25/differ …

このような意味だと、

「X1」とは、「1個のデータの具体的な値」を表わすのではなく、「1個のデータをたくさん採ってきたときの具体的な値の集合」を表わしている可能性が高いです。
その場合には、「1個のデータを無限回だけ採ってくれば、その分布は母集団と同じになるはず」という前提になります。
それは「X2」「X3」「Xn」も同じ。
それが「?」を書かれた2行ということになります。

この辺の前提条件や、記号の意味(大文字、小文字など)がきちんとなされていれば、ここに書かれていることは間違いありません。
この「具体的な数値」を表わすのか、「統計変数全般」(具体的な数値をたくさんの回数採って来たものの集合)を表わすのか、きちんと説明してもらわないと訳が分かりませんね。

そういう不親切さが「統計嫌い」「統計苦手」を作り出しているみたいです。
    • good
    • 1

#2です。

タイプミスを訂正させて下さい。すみません。

注1)高校では、「一部の」サンプルから母集団を逆推定することはやりません。不偏分散は大学に入ってからやります。
「一部のサンプルを新たな母集団とみなして」計算するということを教えています。「その標本の」標準平均、標準偏差です。



「その標本の」標本平均、標準偏差です。


あと、テキストで、標本平均と対(つい)になる言葉として「標本標準偏差」を使っていないのは、#2に書いたように現行JISに反するからです。
    • good
    • 0

母平均m(既知)の母集団から得られた、大きさnのサンプルの期待値はmです。

nはいくつでも構いません。

同様に母標準偏差σ(既知)の母集団から得られた、大きさnのサンプルの標準偏差はσです。

n=1のとき計算できないとのご心配は無用で、計算する必要はなく、そういうサンプルだよ、ってことです。

一方、計算式を使用する場面ですが、平均や標準偏差を計算する計算式は、未知の母集団から得られた「全数」サンプルから、未知の母集団のmやσを逆推定しようという式です。今は既知だから関係ないのです。

注1)高校では、「一部の」サンプルから母集団を逆推定することはやりません。不偏分散は大学に入ってからやります。
「一部のサンプルを新たな母集団とみなして」計算するということを教えています。「その標本の」標準平均、標準偏差です。

注2)平均や標準偏差を逆推定する式は、「最尤法」という枠組みで計算された結果、得られた式です。最尤法は分布の仮定が必要です。

注3)平均や分散の式は定義のように書かれているけど、定義ではありません。定義は、
平均:E(g(x))=∫g(x)f(x)dx 1次の積率
分散:V(g(x))=∫(g(x)-E(g(x)))^2f(x)dx 2次の中心積率
です。分布f(x)の違いにより、異なる平均の式が出てきます。


注3はともかく、上の2点は、統計関連のアカデミアが文科省に改訂を勧告しているところです。

さらに、ご質問者には、どうでも良いことかもしれませんが、2006年のJISの改訂で、(n-1) で割った分散(不偏分散 V)を、ISOに準拠する形で標本分散と呼ぶことになりました。
しかも、不偏分散 V の平方根 s は厳密には標準偏差 σ の不偏推定量ではない(1999年のJISでは明記されていた)にもかかわらず、2015年のJISでは、「標本標準偏差はばらつきの指標である」という曖昧な表現になりました。

現在、「標本標準偏差」という言葉の定義は、ネット上では2通り存在します。
・かつては「その標本の標準偏差」nで割った旧標本分散を使用
・今は「母集団のばらつきの指標」(n-1)で割った不偏分散を使用
    • good
    • 0

例えば、クラスの身長の統計と考えた場合、


X1 は 出席番号1の人の身長・・・というような具合で、
標本の大きさというのはクラスの人数のことになります。

X1は一人分なので大きさとしては、1として計算します。
    • good
    • 0
この回答へのお礼

ShowMeHowさん、早速のご回答、ありがとうございました。御礼が大変遅れて失礼いたしました。

また、そのほかの方々もご回答ありがとうございました。順次御礼のメッセージを送らせていただきます。

重ねて、ありがとうございました。

お礼日時:2022/06/19 11:02

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!