初めて質問します。
一般に標準偏差の計算は,母集団=標本集団とすると
(測定値-平均値)の2乗の和をデータ数で割ったものの平方根だと思います。
(EXCELのSTDEVP関数もこの計算をしているようです。)
ところで,大学のときに習った平均自乗誤差は,
母集団=標本集団の場合
(測定値-平均値)の2乗の和をデータ数の2乗で割ったものの平方根
ただし,母集団>標本集団の場合は,
(測定値-平均値)の2乗の和を
(データ数*データ数-1)で割ったものの平方根
以上のように習いました。
そこで質問です。
1.分母が標準偏差は1乗で,平均自乗誤差は2乗なのはなぜでしょうか?
2.母集団>標本集団の場合は,(データ数*データ数-1)になるのはなぜでしょうか?
3.EXCELには母集団=標本集団のSTDEVP関数と
母集団>標本集団のSTDEV関数がありますが,母集団>標本集団の場合の標準偏差の計算というのはどんな計算をしているのでしょうか。
よろしくお願いします。
No.3ベストアンサー
- 回答日時:
diviationは、deviation の誤りです。
ディビエーション、と日本語で発音していますので、つい。>「標準誤差はサンプルのバラツキぐあい」標準偏差はサンプルの平均値のバラツキぐあい」とありますが,標準偏差はサンプルのバラツキ 標準誤差はサンプルの平均値のバラツキ」の誤りと理解してよろしいですか?
私は、「バラツキぐあい」と表現しましたが、バラツキとの違いが分かりません。
>誤りと理解して
同一ですか、であればyes、でしょう。テキストは、「バラツキ」と表現してあるでしょうが、その様子と言う意味を込めてバラツキぐあい、としました。
が誤りなら、バラツキぐあいとバラツキの違いを書き込んでくださればお答えできるでしよう。
なお、バラツキにしても、標準偏差からだけでは、何もわかりません。標準偏差が10と分かっても、バラツキが大きいのか小さいのか判断できないからです。
無意識にせよ、平均値を念頭においているハズデス。
>数学的にもう少し説明するとどうなるのでしょうか?
専門家、としたので、誤解されていると想うのですが、数学的な素養はありません。学生時代に、統計学の試験のときに教科書持ち込みだったのですが、どこを写せば良いかわからず、終了まで教科書をめくるだけでした。
その後、有意差検定をせざるを得なくなり、標準偏差や標準誤差をかじりました。そこで、学生時代に出来が悪かっただけ、統計学のどの部分が分かりにくいか、だけは理解しているつもりです。そういう意味の専門家です。
テレビを楽しむときに、どのチャンネルで目的の番組を見れば良いかは十分に理解していますが、そのチャンネルを見れば、何故その番組をみることができるのか、というテレビの仕組みは理解しなくても良い、というのが私の立場です。
ただ、なぜnで割るか、については、どの教科書にも書いてないのでは。
それが定義だから、と答えることは可能です。逆に考えれば、標準偏差にしても、平均値±標準偏差には、サンプルの68%が入ります。が、68%しか入らない、とも言えます。標準偏差の2倍、すなわち、標準偏差±2×標準偏差なら、95%のサンプルが入ります。その方がバラツキを表しやすい、とも考えられます。
したがって、なぜそのような数式になるのか、というよりも、その使い方を誤らないようにさえすれば良い、というのが私の姿勢です。標準誤差を経験するのは、グラフのデータを表すときに、『バラツキが小さい』と感じて、脚注を見ると標準誤差だった、ということぐらいです。
数学的な説明については、申し訳有りませんが、私の手に余ります。
私が普段使う誤差論に関する教科書にも,まるで定義であるかのように,nで割ると書いてあります。
(他の教科書に当たっても定義であるかのような説明でした。)
本当にありがとうございました。今までの疑問が解けて,本当にすっきりしました。
No.2
- 回答日時:
>分母が標準偏差は1乗で,平均自乗誤差は2乗なのはなぜでしょうか
標準偏差は、母集団から取り出した一つ一つのサンプルのバラつきを表しています。
標準誤差は、母集団から取り出したサンプルの平均値をまず求めます。この操作をすると、取り出したサンプルが、その都度異なるので、平均値もややズレます。すなわち、この平均値のばらつきを示すのが、標準誤差です。
繰り返しになりますが、標準誤差は、サンプルのバラつき具合。標準偏差は、サンプルの平均値のバラつき具合です。サンプルをサンプルの平均値にするには、データ数で割る、ということになりませんか。したがって、標準誤差を求めるには、標準偏差を、もう一度データ数で割ることになります。
私は、グラフに表すとき、平均±標準偏差を用いますが、外国の論文を読んでみると、平均±標準誤差で表す人が多いようです。そうすると、バラつきが少ないように見えます。
ご質問の意味を取り違えていたら、ご容赦を
>EXCELには母集団=標本集団のSTDEVP関数と
母集団の標準偏差はSTDEVP、母集団からサンプルを選んだ場合は標本標準偏差でSTDEVを用いています。
いつも混乱するのは、標本標準偏差は、,(データ数*データ数-1)で割った不偏標準偏差を用いますが、これは、Partial Standard Diviationの英訳でしょう。ですから、EXECELでは、標本標準偏差(不偏標準偏差)には、PのついたSTDEVPを使いたくなるのです。しかし、同じデータで計算すると、STDEV<STDEVPにはならず、逆になります。ですから、前に書いたように、Pが最後に無いSTDEVが標本標準偏差です。
EXCELがこんな錯乱をおこしそうな関数にしたのかは知りません。いつも頭にきています。
この回答への補足
非常にわかりやすい説明ありがとうございました。
標準偏差と標準誤差のイメージがつかめ,頭がすっきりした気分です。(笑)
追加の質問ですがよろしいでしょうか?
1.「繰り返しになりますが・・・」以下の文ですが本文には,「標準誤差はサンプルのバラツキぐあい」標準偏差はサンプルの平均値のバラツキぐあい」とありますが,標準偏差はサンプルのバラツキ 標準誤差はサンプルの平均値のバラツキ」の誤りと理解してよろしいですか?
2.サンプルを平均値にするにはデータ数で割る だから標準偏差をデータ数で割れば,標準誤差になるという説明はイメージがつかめ,非常にわかりやすいのですが,数学的にもう少し説明するとどうなるのでしょうか?サンプルの平均値は,サンプルの総和をデータ数で割るのと同様に,標準偏差をデータ数で割るだけでなく,標準偏差の総和をデータ数で割るような気がするものですから。(馬鹿げた質問かもしれませんが・・・)
補足の説明をしていただけると幸いです。
No.1
- 回答日時:
統計学では、母集団について考えます。
ですから、全てのサンプルが使える、たとえば1年2組の生徒の身長の平均値と標準偏差については、これは全ての生徒の身長を使いますので、平均値も、標準偏差も、誰が計算しても同じ値になります。それでは、世界の小学生の身長については、どうでしようか。サンプル数が多すぎて、どうしようもありません。そこで、世界の小学生から適切な方法(現実には、これが難しい)でサンプルを選び、その平均値と標準偏差を、母集団である世界の全ての小学生の身長の平均値と標準偏差、とします。
標本から平均値と標準偏差は、母集団の推定なのです。これは、すべてのサンプルから、どれを計算用の値として用いるかによって、大きく左右されます。そこで、その誤差を少なくするために、(データ数*データ数)で割ったものではなく、(データ数*データ数-1)で割ったものを用いて、やや広く推定値の幅をとり、推定が外れる危険性を少なくしています。
(データ数*データ数-1)部分の-1が、-1ではなく、-2でも、-3でもないのは・・・、と悩んだこともあるのですが、-1が最適だということは、ある本によれば、数学的に証明できるのだそうです。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 t値の計算方法 1 2022/11/29 18:37
- 統計学 母集団分布を平均 μ, 分散 σ2 の正規分布と想定し, 母集団から無作為抽出した標本のデータ(標本 4 2023/01/30 20:25
- 統計学 不偏分散を計算するときに標準偏差和をn-1で割りますが、なぜ-1なのでしょうか? 「なぜnでなくn- 5 2022/07/04 14:54
- 統計学 ある集団の平均身長を調べたい. 集団全体を母集団とし, 母集団から無作為抽出した15人の平均身長が1 1 2023/02/03 15:26
- 統計学 不偏分散について 3 2022/03/29 15:57
- 統計学 統計学 最大値の標準偏差 15 2023/02/02 18:36
- 統計学 【統計】標本平均、標本標準偏差からt分布グラフ作成方法 9 2022/10/18 23:46
- 統計学 統計学 このデータはある母集団からとった標本である 42 41 48 40 45 37 43 47 4 2022/12/23 01:29
- 統計学 信頼区間についての質問です。 6 2023/06/25 17:34
- 統計学 統計学の問題です よろしくお願いします 区間推定 母集団は正規分布に従い,母分散は σ2 = 112 1 2023/01/31 18:57
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
統計でいう「n」は、何の略な...
-
N数?n数?サンプル数の「エヌ...
-
数量化3類について
-
t検定のt値について
-
初歩の統計の質問です
-
クラスター分析について
-
統計学-母集団が少ない場合の...
-
パラメトリックとノンパラメト...
-
エクセルで「集団から最大値、...
-
行列の行と列に対称性がないり...
-
標準偏差
-
統計学でいうRSD%とは何ですか。
-
今日数学のテストが返ってきて ...
-
加重平均偏差値 とは、どんな偏...
-
標準偏差バーをグラフに入れた...
-
中学1.2年で5教科の合計点が350...
-
ExcelでCVを計算するには
-
偏差値から順位を求めるには
-
顔面偏差値100点満点中何点ぐら...
-
平均値と中庸値の違い
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
統計でいう「n」は、何の略な...
-
N数?n数?サンプル数の「エヌ...
-
評価者により採点に差が出るこ...
-
t検定のt値について
-
t検定って何ですか
-
有意差があってもサンプルサイ...
-
多数決 統計学に詳しい方教え...
-
信頼区間から標準偏差の求め方
-
統計学-母集団が少ない場合の...
-
統計 基準値の標準偏差はなぜ1か
-
エクセルで「集団から最大値、...
-
Zスコアと標準偏差について
-
出口調査と結果分析(数学的根拠)
-
モデルのパラメータの定義がい...
-
多変量解析のサンプル数の妥当性
-
標準体重の求め方
-
時系列データの検定
-
統計学における無作為抽出に関...
-
20代100人の身長を調べたら日本...
-
母集団のばらつきをサンプルか...
おすすめ情報