同様の質問がネット上にありましたが、それでもよく分からないので質問させていただきます。
標準偏差は「平均値に対するブレ」の平均値であると聞きました。
計算ではプラスマイナスを無効化するために一度2乗したのち、ルートをかけて戻すというイメージで覚えています。このとき何故、分母であるサンプル数にもルートがかかっているのでしょうか?
例えばポイントが2,3,4,5,6の母集団を考えるとき、その平均値は4で、各サンプルとのプラスマイナスを除いた差分はそれぞれ2,1,0,1,2であり、この差分の平均は1.2です。これが所謂「平均値からのブレの平均値=標準偏差」かと思っていたのですが、標準偏差の公式に当てはめると答えは√2であるかと思います。
そもそも標準偏差とは「平均値からのブレの平均値」という認識が間違えているのでしょうか?
もしそうであれば所謂基準値を求めるために、分母に標準偏差を置くことが不適切であるようにも思います。
宜しくお願いします。
No.3ベストアンサー
- 回答日時:
>計算ではプラスマイナスを無効化するために一度2乗したのち、ルートをかけて戻すというイメージ
はい、合っています。その「二乗偏差の合計」を、データ1個当たりの「平均」にするために、データの個数で割ります。
要するに
分散 = (偏差の二乗) / (データの個数)
つまり、「分散」とは
(偏差の二乗) の平均値
です。
これを「ルートをかけて戻す」ときに、分母の「データの個数」は、「 (データの個数)のルート」になります。
「標準偏差」が「分散の平方根」なので、機械的にそうなるだけの話です。
「 (データの個数)のルートで割る」という発想ではありません。
>例えばポイントが2,3,4,5,6の母集団を考えるとき、その平均値は4で、各サンプルとのプラスマイナスを除いた差分はそれぞれ2,1,0,1,2であり、この差分の平均は1.2です。
「差分」で勝手にプラスマイナスを除いてはいけません。差分は
-2, -1, 0, 1, 2
です。この平均は、当然ながら「0」です。
「プラスマイナスを除いて、平均する」ことの意味は何ですか?
ただの「偏差」の平均をとったら必ず「0」になるので、わざわざそれを二乗して(正にして)平均をとるのです。そうすれば、一種の「ベクトル」としての「平均値からの距離」を平均したことになります。それが「分散」。
分散 = (偏差の二乗) / (データの個数)
標準偏差は、それをデータの「次元」に合わせるために「平方根」にします。
ありがとうございます。
差分を言うのに勝手に±を排除してはいけませんね、絶対値という表現をすればよかったところを失礼しました。
単純に「分散の平方根が標準偏差だからそういうもの」として理解すべきなのは分かったのですが、ではなぜ「平均値からの距離」の平均を求めるのに"あえて"分母の平方根を用いるメリットがどこにあるのでしょうか?
そもそも 分散 = (偏差の二乗) / (データの個数) という定義がなぜ (偏差の二乗)/(データの個数の二乗)とはならなかったのでしょうか。
No.4
- 回答日時:
No.3です。
>そもそも 分散 = (偏差の二乗) / (データの個数) という定義がなぜ (偏差の二乗)/(データの個数の二乗)とはならなかったのでしょうか。
数学の専門家ではないので明確な回答はできませんが、そもそもの「分布」を特徴づけるパラメータは「標準偏差」ではなく「分散」の方です。
正規分布の表わし方
N(μ, σ²)
が表わすとおりです。
うまく説明はできませんが、正規分布の確率密度関数の形と関連しているのだと思います。(確率密度関数には、σ² の形で登場し、σ 単独では登場しない)
https://ja.wikipedia.org/wiki/%E6%AD%A3%E8%A6%8F …
つまり、正規分布の形(分布のしかた)が、「データの個数が変わると分布のしかたが変わる」ということです。もしデータの個数によっても「σ」が変わらないなら、「データの個数が変わっても分布のしかたは同じ」ということになってしまいます。
これは一般論として、「データの個数を N 倍にすると、そのバラツキぐあいは『N倍』にはならず、√N 倍になる」という経験則にも一致します。つまり「データの精度を高くするには、サンプルの数を増やす」ということです。「10人に聞いた内閣支持率」よりも、「1万人に聞いた内閣支持率」の方が精度が高い(バラツキが小さい)ということです。
その上で、「σ²」では「データの次元の2乗」の次元になってしまうため、データの次元(単位)と合わせるために「ルートをとって、データと同じ次元(単位)にする」という操作をしているのだと思います。
ただし、これは「はじめから σ ありき」で定義したものではなく、「はじめに σ² ありき」から「σ を求めて」使っているということなのです。
うまく説明できませんが。
分布の値としてσ^2という表現をすることが前提として在り、これを平方してみたものがσで、それを標準偏差と名付けた、ということでしょうか。他の方の回答も踏まえて、どうやら私は「平均偏差」と「標準偏差・標準誤差」の区別やその役割の違いをきちんと理解していなかったようです。ありがとうございました。
No.2
- 回答日時:
> 標準偏差は「平均値に対するブレ」の平均値であると聞きました。
> 計算ではプラスマイナスを無効化するために一度2乗したのち、ルートをかけて戻す
そうではありません。
その考え方で計算すれば単に、「平均値との差分の絶対値、これの平均値」になります。
標準偏差は、平均値との差分のRMS、といえます。
これと似たものに、期待値のとの差分(誤差)の場合がRMSE、になります。
とりあえずは、理屈よりも公式(計算方法)を覚えておけばよいでしょう。
ありがとうございます。
RMSやRMSEという言葉すら聞いたことがないので正直よく分からないのですが、とりあえず公式として覚えて使うことには少し抵抗があります。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 Excelによるサンプルの拡大について 6 2023/08/22 16:03
- 統計学 生物統計学の質問 7 2022/05/17 13:59
- 統計学 以下の問題が分からないので計算式を教えてください ある企業が製造している電球の寿命の母平均と,母標準 3 2023/01/14 00:43
- 統計学 信頼区間についての質問です。 6 2023/06/25 17:34
- 統計学 統計学についての質問です。 2標本問題で A: サイズ32 平均62.2 標準偏差11.0 B: サ 2 2023/02/08 14:15
- 統計学 t値の計算方法 1 2022/11/29 18:37
- 統計学 標準偏差は平均値との差分ですか?中央値との差分ですか?どちらでもないですか? 7 2023/03/11 13:09
- 統計学 確率統計です。 1 2022/07/27 23:14
- 数学 この問題の右ページの分散を求めるときなんですけど、平均点の方は前の平均が71なので(新)=71✖️0 3 2022/06/10 23:02
- 統計学 化学 物理 電気 とある実験で求めた抵抗値の測定から求めた標準偏差(124)を利用して計算された平均 3 2023/06/25 20:34
このQ&Aを見た人はこんなQ&Aも見ています
-
見学に行くとしたら【天国】と【地獄】どっち?
みなさんは、一度だけ見学に行けるとしたら【天国】と【地獄】どちらに行きたいですか? 理由も聞きたいです。
-
秘密基地、どこに作った?
小さい頃、1度は誰もが作ったであろう秘密基地。 大人の今だからこそ言える、あなたの秘密基地の場所を教えてください!
-
これが怖いの自分だけ?というものありますか?
人によって怖いもの(恐怖症)ありませんか? 怖いものには、怖くなったきっかけやエピソードがあって聞いてみるとそんな感覚もあるのかと新しい発見があって面白いです。
-
いけず言葉しりとり
はんなりと心にダメージを与える「いけず言葉」でしりとりをしましょう。 「あ」あら〜しゃれた服着てはりますな 遠くからでもわかりましたわ
-
タイムマシーンがあったら、過去と未来どちらに行く?
20XX年、ついにタイムマシーンが開発されました。 あなたは過去に行く? それとも未来? タイムマシーンにのって、どこに行って、何をしたいか教えてください!
-
標準誤差の式の分母はなぜ√n
数学
-
数学の問題の質問です! 標準偏差が√10になったのですが、√を外さないといけないんですか?また、√の
数学
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・【大喜利】【投稿~12/2】 国民的アニメ『サザエさん』が打ち切りになった理由を教えてください
- ・ちょっと先の未来クイズ第5問
- ・【お題】ヒーローの謝罪会見
- ・これが怖いの自分だけ?というものありますか?
- ・スマホに会話を聞かれているな!?と思ったことありますか?
- ・それもChatGPT!?と驚いた使用方法を教えてください
- ・見学に行くとしたら【天国】と【地獄】どっち?
- ・【大喜利】【投稿~11/22】このサンタクロースは偽物だと気付いた理由とは?
- ・お風呂の温度、何℃にしてますか?
- ・とっておきの「まかない飯」を教えて下さい!
- ・2024年のうちにやっておきたいこと、ここで宣言しませんか?
- ・いけず言葉しりとり
- ・土曜の昼、学校帰りの昼メシの思い出
- ・忘れられない激○○料理
- ・あなたにとってのゴールデンタイムはいつですか?
- ・とっておきの「夜食」教えて下さい
- ・これまでで一番「情けなかったとき」はいつですか?
- ・プリン+醤油=ウニみたいな組み合わせメニューを教えて!
- ・タイムマシーンがあったら、過去と未来どちらに行く?
- ・遅刻の「言い訳」選手権
- ・好きな和訳タイトルを教えてください
- ・うちのカレーにはこれが入ってる!って食材ありますか?
- ・おすすめのモーニング・朝食メニューを教えて!
- ・「覚え間違い」を教えてください!
- ・とっておきの手土産を教えて
- ・「平成」を感じるもの
- ・秘密基地、どこに作った?
- ・カンパ〜イ!←最初の1杯目、なに頼む?
- ・この人頭いいなと思ったエピソード
- ・あなたの「必」の書き順を教えてください
- ・ギリギリ行けるお一人様のライン
- ・10代と話して驚いたこと
- ・大人になっても苦手な食べ物、ありますか?
- ・14歳の自分に衝撃の事実を告げてください
- ・家・車以外で、人生で一番奮発した買い物
- ・人生最悪の忘れ物
- ・あなたの習慣について教えてください!!
- ・都道府県穴埋めゲーム
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
下の対数表示のグラフから低域...
-
極値をもつ時と持たない時、単...
-
検量線の決定係数について
-
エクセルのグラフから半値幅を...
-
EXCELにてローパスフィルタを作...
-
統計について
-
一次関数 グラフや式それぞれ...
-
エクセルの統計でχ二乗検定の結...
-
統計学の問題です。 どなたか分...
-
【統計】有意に「高い」?「低...
-
心理学の統計について
-
線形なグラフとはひとくちに言...
-
統計学の質問【帰無仮説】 B大...
-
統計学の質問【帰無仮説】 昨年...
-
統計学の問題でわからないので...
-
理科のグラフで、直線と曲線の...
-
2郡の共通の標準偏差とは
-
卒業論文のアンケートの数について
-
統計学の質問【帰無仮説】 W大...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
検量線の決定係数について
-
下の対数表示のグラフから低域...
-
エクセルのグラフから半値幅を...
-
EXCELにてローパスフィルタを作...
-
心理学の統計について
-
統計について
-
極値をもつ時と持たない時、単...
-
エクセルの統計でχ二乗検定の結...
-
卒業論文のアンケートの数について
-
理科のグラフで、直線と曲線の...
-
【統計】有意に「高い」?「低...
-
一次関数 グラフや式それぞれ...
-
一元配置分散分析のp値が0になる
-
最小二乗法を反比例の式を元に...
-
検定統計量の値がマイナス
-
対応のあるt検定の結果の書き方
-
x=2分の3のグラフはどのように...
-
統計学の問題でわからないので...
-
片対数グラフで…
おすすめ情報