プロが教えるわが家の防犯対策術!

標準偏差ってなんですか?
具体的にどんな場面で使って、何を意味するものでしょうか?
また、その計算方法は?
お馬鹿な質問ですいません。

A 回答 (11件中1~10件)

何かの結果や現象の数値が5つ以上得られたときに求めます(3つ以上あれば計算できますが、論文などでは最低5つを要求します)。


平均値と個々のデータの差を自乗したものの総和をデータ数から1を引いた『自由度』で割ってやれば、標準偏差を求めることができます。エクセルだと、STDVの関数だったかと思います。
平均値というのは、実際の集団を現すのには非常に怪しいものですよネ。たとえば、新聞発表などで、国民の平均貯蓄額は700万円なんて書かれていても、大多数の人には実感がないでしょう。というのも、2億円も3億円も貯めている人もいれば、全然貯金のない人もいて、それらをひっくるめて平均しているからなんです。
そんなとき、標準偏差を求め、平均値±標準偏差の3倍の範囲を求めると(データが正規分布しているときは)、その範囲内に97%のデータがあることがわかっているので、自分の位置が普通なのか、下すぎるのかということが理解できます。
これを応用したのが試験成績での偏差値です。ある集団の試験結果から、平均と標準偏差を求め、ある点数がその集団の中でどの位置にあるのかを求めたものがいわゆる偏差値ですネ。
こんなところで、ご理解いただけましたでしょうか?
以上kawakawaでした

この回答への補足

ありがとうございます。
標準偏差がある集団に対する位置を表現するものだということは、なんとなく理解できました。
ところでご説明をみて思ったのですが、これは「予測」に応用できるものなのでしょうか?
例えば、下世話な例で申し訳ありませんが、競馬のレースを考えます。
ある馬が過去5回のレースで100秒、500秒、200秒、600秒、300秒のタイムを記録したとします。(各レースの条件は同じとします)
ご覧のとおりかなり気まぐれな馬ですので、平均タイム340秒をこの馬の能力とするには無理があります。
そんな時、標準偏差を求めご説明の計算を行えば、この馬の次レースのタイムは97%の確率で計算結果の範囲内になると予測する。
というような使い方をしても構わないでしょうか?

補足日時:2000/12/09 22:07
    • good
    • 0

以下の参考URLサイトが簡単に具体例が説明されて参考になります。


 更に、専門的には医学・薬学・生物(・人間)等の集団
(データ集団)を扱う数学的技法です。つまり、データのバラツキ(簡単に言えば直線に乗らないデータ)の多い場合に統計学的手法が使われます。
 専門的には、興味があれば以下のサイトを覗いて下さい。
1.http://w3.cc.nagasaki-u.ac.jp/contrib/Excel/youg …
(統計用語)
2、http://www.ec.kagawa-u.ac.jp/~hori/statedu.html
(WWWで統計を学習しよう)
統計関連のサイトリンクです。

これら以外にも沢山のサイト及び成書等がありますので、
興味があれば図書館で本をさがされる事をお勧めします。

初歩の成書が知りたければ補足お願いします。

参考URL:http://www.netlaputa.ne.jp/~onoe_com/com/kaisetu …

この回答への補足

ありがとうございます。
初歩の初歩がありましたら、教えて下さい。

補足日時:2000/12/09 22:03
    • good
    • 0

補足します。


近くの図書館で、以下の成書の中であれば、その本を開いてご自分が見て分かりやすいと思うものを選んでみては如何でしょうか?
(ポイントはどの分野で統計手法を使いたいのか、PCを
使用しながらか等です。)
-----------------------------------------------
1.統計学入門/沖津直/八千代出版/1998.4 
2.Excelで学ぶ統計学入門/第2巻/長谷川勝也/技術評論社/1998.2 
3.Excelで学ぶ統計学入門/第1巻/長谷川勝也/技術評論社/1998.2 
4.看護研究のための統計学入門/中野正孝/医学書院/1997.9 
5.確率・統計学入門/勝野恵子/八千代出版/1997.1 
6.PT・OTのための統計学入門/渡辺宗孝/三輪書店/1997.2 
7.統計学入門/杉田暉道,栃久保修/医学書院/1997.1 
8.医薬統計学入門/スタントン・A.グラ…[他]/メディカルリサーチセ…/1996.4 
9.生物統計学入門/新城明久/朝倉書店/1996.10 
10.心理・教育のための統計学入門/渡部洋/金子書房/1996.7 
11.PC SASによる基礎統計学入門/新城明久/東海大学出版会/1995.1 
12.医歯系・生物系の統計学入門/O.J.ダン[他]/大竹出版/1994.3 
13.統計学入門/2/蓑谷千凰彦/東京図書/1994.7 
14.統計学入門/下/エドウィン・マンスフ…[他]/多賀出版/1994.4 
15.計算機統計学入門/Mark C.K.Y…[他]/エム・ピー・シー/1994.4 
16.統計学入門/上/エドウィン・マンスフ…[他]/多賀出版/1994.2 
17.統計学入門/1/蓑谷千凰彦/東京図書/1994.2 
18.統計学入門/大薮和雄,大野拓行/大学教育出版/1993.10 
19.生物実験のための統計学入門/山田武/川島書店/1993.3 
20.保健・医療・看護・福祉系の統計学入門/阿部剛久,佐久間淳/大竹出版/1992.4 
21.統計学入門/稲垣宣生/裳華房/1992.11 
22.ひとりで学べる統計学入門/並木博,渡辺恵子/慶応通信/1992.3 
23.よくわかる医療・看護のための統計学入門/高木広文,三宅由子/メディカ出版/1991.8 
24.基礎統計学/1/東京大学教養学部統計…/東京大学出版会/1991.7 
25.統計学入門/杉田暉道,津田忠美/医学書院/1990.11 
26.統計学入門/森棟公夫/新世社/1990.12 
27.統計学入門/平林宏朗/槙書店/1990.11 
28.パソコン統計学入門/芹沢正三/講談社/1990.2 
---------------------------------------------
最近であれば、PCを使いながら学んだ方が良いと思います。

ご参考まで。
    • good
    • 0
この回答へのお礼

こんなにたくさんの本をご紹介下さりありがとうございます。
今度、町の図書館に行った折に2か5か28あたりをあたってみようと思ってます。

お礼日時:-0001/11/30 00:00

再登場です。


補足を拝見しました。
競馬のタイムの予測に偏差は応用できるかということですネ。
それをするためには、まず、予測的バリデーションを行います。これは,過去のデータを蓄積し、それらの解析から平均値±(標準偏差の三倍)範囲を求めて予測を行います。ついで、実際の結果を取り入れて同時的バリデーションを行います。そして、それらの結果から回顧的バリデーションを行い検証するという段階を経て、初めて、予測にデータを応用する準備が整います。
結局は、±3σという平均値±(標準偏差の三倍)範囲内にデータが来れば、それは異常値ではないということを認識する程度の予測なのですけどネ。
あらゆるギャンブルは数学的な解析を積むことで勝つことができるという説もありますネ。そこまで数学的な能力があれば、ギャンブルなんかに頼る必要はなくなるでしょうけど‥
    • good
    • 0

再々登場です。


申し訳ないです!はじめの回答の計算式の訂正!
個々の数値と平均値の差の総和を求め、その平方根を、データ数から1を引いたもので割ると標準偏差になります。
ふと間違いに気付いちゃいました‥
それから、2つ以上のデータ集合の比較に使います。
平均値±標準偏差を棒グラフで示してみてください。そして、その数値が小さい方のデータの平均値+標準偏差と、数値が大きいほうのデータの平均値-標準偏差の数値がかぶっていなければ、それらの集団は明らかに違うものであると言えます。本当はt検定という統計手法を用いて、それらの集団に有意差があるかないかを調べるのですが、グラフ化してみれば、おおよその予想がつきます。
競馬で2頭の馬の成績を統計処理し、グラフ化してやれば、実力に明らかな差があるのかどうかを判断することができますネ。
以上kawakawaでした
    • good
    • 0
この回答へのお礼

平方根でしたか。
実は計算してみるととんでもない数値になりましたので、自分の算数の能力を疑っていたところです。
ありがとうございました。

お礼日時:-0001/11/30 00:00

標準偏差とは


標準なのか変なのかを調べるものです

標準?変さ

なーーんちゃって
    • good
    • 0
この回答へのお礼

おお!
これぞ真理を語るダジャレか!?
感服いたしました。

お礼日時:2000/12/14 21:51

kawakawa教授てば、計算法が変です。



(個々の数値と平均値との差)の2乗の総和を求め、
データ数から1を引いたもので割って、
それから平方根を取るんです。
    • good
    • 0

http://oshiete1.goo.ne.jp/kotaeru.php3?q=20620
に質問を立てた者ですが、質問する態度が悪いためか回答がありません。
ここでの回答欄にあるURLをたどってだいたい理解することができました。
誰か暇があったら、チャチャでも入れに来て下さいな。回答が一つもないと閉じることも補足するともできませんので。

標準偏差の計算はstomachmanさんが正しいようです。

あと便乗質問で恐縮ですが、『自由度』ってなんですか。
母集団全体だとn-1じゃなくてnとなるようですが。(エクセルだと、STDEVPのほう)

参考URL:http://oshiete1.goo.ne.jp/kotaeru.php3?q=20620

この回答への補足

便乗されている質問者のrickbonです。
大元の質問が大雑把なためか、みなさんからいろいろなご回答を頂きたいへん参考になっております。
が、同時に新たな疑問もたくさん出てきました。
もう何から手を付けようか迷う位です。
自由度ってなに?工程能力指数って工程能力を評価できるってこと?標準偏差のこんなややこしい公式を考えたのはだれ?私の質問はいつ締め切ればいいの?etc...

補足日時:2000/12/21 22:27
    • good
    • 0

質問者をほったらかしてごめんなさいね。



nanashisanさんてば、便乗しないで、是非別の質問を立ててくださいよ。「自由度」の質問は他にも来そうな話ですから。

この回答への補足

ほったらかしにされている質問者です。
計算式の補足ありがとうございます。
でも自由度や標準偏差の応用例については私も知りたいです。
できればご指導ください。

補足日時:2000/12/21 23:04
    • good
    • 0

うう。

どうしても長文になっちゃうなあ。
自由度一般については、とりあえず別件にしましょう。この質問に関連する「自由度」というのは、分散(平方根を取る前のやつ)の分母がなんでNではなくてN-1なのかってことです。この-1がどこから出てきたのか。

まずは問題を整理すると共に、必要な概念を説明します。しんどいけど、おつきあい願います。

●母集団とサンプルの区別が重要になります。母集団というのはあらゆるデータ全部集めたやつ(無限集合かもしれない)。サンプルはその母集団の中から、無作為に選んだ代表の集合ですね。(無作為が重要。でかいのだけ選んだりしたら、以下の話は成り立ちません。)

●もし、母集団の全データを利用できれば、平均と標準偏差はきっかり決まります。これは推定ではない。母集団のデータy[j]の数がM個なら、平均A、分散D^2 およびその平方根である標準偏差Dは
A = (Σy[j])/M (Σはj=1,2,....,Mについての和)
D^2 = {Σ(y[j] - A)^2}/M(Σはj=1,2,....,Mについての和)
で計算できる。しかし通常はサンプルしか得られないから、これらの式は使い物にならない。

●「N個のサンプルx[j] (j=1,2,...,N)から、母集団の平均と分散を推定しよう」という時には、「不偏推定」という考え方を取ります。つまり、サンプルしかないのだから正確な値は絶対出ないけれども、最も正解である確率が高くなるような最良の推定を行います。

●このような不偏推定は、母集団の平均Aの推定値aに関しては
a = (Σx[j])/N  (Σはj=1,2,....,Nについての和)
になる。つまり、(a-A)の期待値は0です。(無作為にサンプルを選ぶのが条件ですよ。)
さてここで、(a-A)^2の期待値はいくらかというと、(D^2/N)になります。
(なんでか?はめんどいので堪忍。)

もちろん、サンプルには偶然の偏りがあるから、Aとはずれている訳です。
 そして母集団の分散D^2の推定値σ^2に関しては
σ^2 = {Σ(x[j] - A)^2}/N(Σはj=1,2,....,Nについての和)
です。よく見て!! 分母はNです。ところがこの計算は実行不可能。Aが分からないからです。
 そこで、Aの代わりにaを使わなくてはならない。この場合の不偏推定は
σ^2 = {Σ(x[j] - a)^2}/(N-1)(Σはj=1,2,....,Nについての和)
になる。

●直感的に言えば:
 Aの代わりにaを使いました。ところが、サンプルに偏りがあって、たとえばちょっと大きめに偏ったとすると、aはAよりちょっと大きめに出てしまう。さて、そのaを基準にして分散を計算すると、ちょっと小さめに出てしまう。
 なぜなら、基準になる平均aが大きい方にずれているために、「大きいサンプルが真の平均よりどれだけ大きいか」が小さめに見えてしまい、「小さいサンプルが真の平均よりどれだけ小さいか」が大きめに見える。サンプル集団には小さいのよりは大きいのが多めに入ってますから、全体としては、ばらつきが小さめに見えてしまう。~あかん。全然直感的じゃないかな~

●こんどはいい加減な数式で迫ってみましょう。
Nσ^2 = {Σ(x[j] - A)^2} ={ Σ(x[j] - a+(a-A))^2}
= (Σ{(x[j] - a)^2+(a-A)^2-2(a-A)(x[j] - a)})
= (Σ(x[j] - a)^2)+{Σ(a-A)^2}-2(a-A){Σ(x[j] - a)}
ここでΣ(x[j] - a)=Σ(x[j] )- aN = 0 ですから、
Nσ^2 = (Σ(x[j] - a)^2)+N(a-A)^2
です。ここで、(a-A)^2の期待値(D^2/N)を入れると、(誤差はあるけど期待値としては)
Nσ^2 = (Σ(x[j] - a)^2)+(D^2)
である。σ^2はD^2の期待値の筈ですから、D^2はσ^2と同じと考えたって、まあよろしい。よって
Nσ^2 = (Σ(x[j] - a)^2)+(σ^2)
(N-1) σ^2= (Σ(x[j] - a)^2)
よって、
σ^2= (Σ(x[j] - a)^2)/(N-1)
まあ、そういう事です。

●もし、サンプルを選んで母集団の平均を推定してaを得た後、改めてサンプルを選び直してから、母集団の分散を推定するという場合には、
σ^2 = {Σ(x[j] - a)^2}/N(Σはj=1,2,....,Nについての和)
が不偏推定になります。

●ここまでのまとめ
母集団の本当の平均値Aが分からないので、サンプル集団から求めた平均値aを使った。そして、その同じサンプル集団に対して、aを使って分散を計算した。これが(N-1)の原因。

●「自由度」という言葉を使って.....
 もともとN個あったサンプルx[j](j=1,2,..N)は自由度Nです。おおざっぱに言えば、N個のパラメータがそれぞれ独立に変化しうる、ということを自由度Nと言うわけです。
 平均値a(1個の数値。自由度1)を求めて引き算し、(x[j]-a)を作りますと、平均値aと、(x[j]-a)(j=1,2,..N)の、合わせてN+1個の数値がある。
 しかし、「(x[j]-a)(j=1,2,..N)の合計は必ず0でなくてはならない」という制限が加わっている。だから一つ欠けても元のx[j]が全部再現できます。つまり{平均値aと、(x[j]-a)(j=1,2,..N)}はやはり自由度Nを持っている。
 もしN個の数値(x[j]-a)(j=1,2,..N)だけ知っている(aは不明)なら自由度はN-1になり、元のx[j]の再現はもはや不可能ですが、どれか一つが欠けても(x[j]-a)(j=1,2,..N)は再現できる訳です。

この回答への補足

うーん私のレベルでは難解すぎて...
何とか概念だけでも理解しようとここ数日幾度か読み返して参りましたが、特に数式の部分はロゼッタストーンを眺める酔っぱらいの如くただ眼をうつろにして呆然とするばかりです。
でも、私でも理解し得る断片を集めて私なりに解釈するとすれば、自由度とはサンプル(全集団のデータを計算することが不可能なために全集団から無作為に取り出したサンプル、若しくは過去の集団から未来を推定する目的での過去の全集団でもいいのかな?)を真の全集団のデータに少しでも近づけるために連続的にサンプルの変化を評価するしくみ....自分でも何が言いたいのかよくわかりませんが、こんな感じなのでしょうか?

補足日時:2000/12/27 22:50
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!