アプリ版:「スタンプのみでお礼する」機能のリリースについて

標準偏差と分散の単位についての質問です.

データのばらつきを評価する1つの手段として,分散が使われます.この時,分散の計算式から,「分散の単位は,標本のデータの2乗である.そこで標本のデータと単位をそろえるために,平方根を取り,標準偏差とする」と,しばしば説明されます.この説明の,特に前半部分がピンときません.

例えば標本の単位がメートルであった時,分散の単位は平方メートルになります.「そりゃ,機械的にそうなるよな」と,私はまず思います.次に「単位が平方メートルということは,じゃあ,分散というものは面積か?」と考えてしまいます.そして「長さのばらつきを評価したいだけなのに,なぜ面積なんかが登場するのだ」,と混乱します.標本の単位がグラムであれば,「グラムの2乗ってなんなんだ?」とますます混乱します.

混乱しないためにはどのように考えれば良いのか,アドバイスをいだたければ幸いです.

メートルの2乗だから面積,などと具体的に踏み込んでしまうのがいけないのでしょうか?メートルの2乗はメートルの2乗以上のものではなく(つまり面積を意味しているわけではなく),機械的にメートルの2乗になっているだけなのでしょうか?グラムの2乗についてもそうで,その具体的な意味を考えることが無意味なのでしょうか?

それとも,グラムの2乗にもちゃんと意味があって,混乱するのは,私が単位というものの本質を理解していないからでしょうか?

A 回答 (2件)

あるるデータが平均値からどれくらい偏っているかを表す為に、


単純に平均値との差を取り全データの和を取るとプラスマイナスが
相殺して違いが消えてしまうことが有ります。
これを避けるために、差の絶対値を取ると相殺という欠点は無くなりますが、
絶対値記号は不連続関数で数学的に取り扱い難いという問題点が有ります。
それでは4乗でも6乗でも良いのかと言うと、やはり2乗は取り扱い易く
応用も広いと言う利点が有ります。
これらの点に付いては「分散と標準偏差」に付いての他のQ&Aを
参考にしてください。


さて、単位ですが興味有る問題です。
数学では A + B = C と書いてしまえばそれまでです。
この式が何らかの意味、例えば社会的や物理的な意味、を持つためには
単位や次元が必要となります。
A=キャベツ5(個)、 D=人間2(人)の場合、
A+B=5+2=7(は何でしょう?) つまり、意味の無い足し算です。

自然科学では、計算の場合に常に左右の単位は合っていなければなりません。
単位は系として時間T、長さL、質量Mの組合せで順次構成されています。
単位の掛け算とわり算も行います。例えば、長さから
長さ1m は [L]、 面積 1mx1m はm2 [L^2]、 体積1mx1mx1m は
m3 [L^3]と表されます(L^2はLの2乗)。
速度vは有る距離Lを行くのに掛かる時間tですから、
v = L/t [L/T]=[L*T^(-1)]
加速度αは有る時間間隔Δtでの速度の増加Δv
α = Δv/Δt [(L/T)/T] = [L/T^2] = [L*T^(-2)]
力Fの場合、質量mに掛かる加速度
F = mα = [M*(L*T^(-2))] = [M*L*T^(-2)]

物理や化学で、有るモノAがある量にBに比例すると言い(A=kB)、
AとBの次元(単位)が違う場合には、その比例係数kが次元(単位)を
調整する次元を持ちます。
変な例ですが、ある人の所有する土地は3m幅の細長い矩形で端からの
面積Sm2は端からの長さLmに比例する場合
S=kL k=3 で Sの次元[M^2] =定数kの次元 [M]x長さの次元[M]です。
A=キャベツ5(個)、 D=人間2(人)の場合、
A/B=5/2=2.5 は(個/人) つまり、一人当たりのキャベツの
個数で意味の有る結果と単位です。


つまり、意味のある議論をするためには常に単位に配慮しなければならない
ということで、分散(バラツキ)と言う尺度を平均との関連で議論する場合には
√操作をして次元(単位)を揃えてやる必要が出てくるわけです。

単位や次元を掛けたり割ったりすれば無限の単位や次元の組合せが
出てきます。その中で「意味の有る」ものだけが議論に使われます。
重さの2乗とは?と聞かれ「親亀の背中に子亀が乗った状態では」一般性も
汎用性もでてきません。

単位は物理屋にも難敵ですから、考え出したら混乱するのも
無理は無いと思います。
    • good
    • 0
この回答へのお礼

ご回答ありがとうございました。単位についての解説も、ありがとうございます。

お礼日時:2010/10/17 09:46

統計が嫌いな私が言うことなので、多少の偏見が混じっていると思いますが、



Q.なぜ二乗するか?
A.平均からどの程度はなれているかをそのまま計算すると+と-が発生して都合悪いから。

Q.なぜ絶対値を使わないか?
A.そのような計算方法もある(平均偏差)

Q.なぜ標準偏差のほうがよくつかわれるのか?
A.積分などをするときに、計算上処理しやすい面をもっているから。

ということで、標準偏差を考えるときに二乗に具体的な意味があるのかというと、その単位にはあまり意味はないと思いますので、特に考える必要はないと思います。 ただの機械的な計算手順と考えたほうが良いと思います。 そして(その先の計算手順で)ルートを取って元の単位にあわせて1偏差を表現していると思います。 

加速度などの単位としては(m/s^2) などがありますが、これも計算していくとそのようになるだけで、秒の二乗自体に意味があるのではないと思います。(少なくとも私のような凡人には、その単位の意味するスペースを理解することはできません。) 
    • good
    • 0
この回答へのお礼

ご回答ありがとうございました。統計値に関する解説もありがとうございます。

お礼日時:2010/10/17 09:47

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!