A 回答 (4件)

ほんとに昔はkawakawaさんの仰るように、表を作り手計算でしたね。


標準偏差=(((測定値ー平均値)^2の和)/(データ数ー1))の平方根
です。
次のサイトの中程に、平均値μと標準偏差σの関係を図に表しています。
(標準偏差の(データ数)のところは一般には(データ数ー1)が使われます。)
http://homepage1.nifty.com/QCC/sqc-2.html

ここにデータを入力すると標準偏差などを計算してくれます。
http://www.auemath.aichi-edu.ac.jp/teacher/iijim …

Excelを使えば、STDEV関数で一発で求まります。上のサイトのようにデータ数で割ったものはSTDEVPという関数が用意されています。
参考まで。

参考URL:http://homepage1.nifty.com/QCC/sqc-2.html,http://www.auemath.aichi-edu.ac.jp/teacher/iijim …
    • good
    • 0

n-1を使う場合が多いです。



全数検査のときにnを使用し.サンプル検査の場合にはn-1を使用します。

まれに.推定値が含まれる場合には推定値の数を更に減らします。推定値1個を含む場合には.n-2を.推定値2個を含む場合にはn-3を...
n-2を使う人は.よほど統計を知っている人か.どうしょうもない人(統計を理解していないにもかかわらす.統計を使っている人)がすることです。

通常.全数検査はありえませんので.n-1を使います。
    • good
    • 0

ルートを書くと式が煩雑になるので、分散(=標準偏差^2)


の方で以下書きます。最後に分散の平方根を求めればいい
のです。

定義式は、

分散=(Σ(X_i-M)^2)/N

N : 度数(データ数)
X_i : N個の変量(測定値)。i=1,2,...N
M : 変量の算術平均

変形すると、

=(Σ(X_i)^2)/N-((ΣX_i)/N)^2

とも書けます。こちらは平均値を先に求める必要がない
ので、場合によっては便利です。

データが母集団のサンプル(標本)であるときは、他の
回答のように定義式でNのかわりにN-1を使ったものを
「(標本)分散」、その平方根を「(標本)標準偏差」
と呼ぶこともあります。これは標本から母集団の分散を
推定するときには、N-1を使った方がよい推定値に
なっているという事情によります。

NとN-1のどちらを使うかは、文脈、各学問分野の習慣
などによって判断してください。
    • good
    • 0

各数値と平均値の差を二乗して総和を求めます。


それを(n-1)でわります。
そして、そのルートしたものが標準偏差ですネ。
昔は手計算で求めたものです。
以上kawakawaでした
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q母標準偏差・標本標準偏差と標本平均(Xバー)の標準偏差

(聞きたいのは、最後の3行がメインです)
http://oshiete1.goo.ne.jp/qa3478996.html
の質問をしたものです。

標準偏差を求めるとき、(ルートの中の)分母が「n」か「n-1」
の2種類があることはわかりました。
母標準偏差であっても標本標準偏差であっても「n」で求められる
が、標本から母標準偏差を推定するときが「n-1」を使うという
ことで理解しました。

ところで、「n」にしても「n-1」にしてもそんなに値としては
変わらないということなんですよね?

高校の時の教科書で、「標本平均(Xバー)の標準偏差」という
のがありました。
 「母平均m、母標準偏差sの母集団から大きさnの無作為標本
 抽出するとき、標本平均Xバーの標準偏差σ=s/(ルートn)」
というのがありました。
 「標本標準偏差」とこの「標本平均Xバーの標準偏差」というの
は全然違うものなんですよね?(値も全然違うものになってしま
うと思います。)

Aベストアンサー

 統計学での目的は、集団全体のこと、すなわち母集団について知ることです。

 標準偏差は、集団のばらつきの程度を示し、本当に知りたいのは母集団の標準偏差、すなわち、母標準偏差です。しかし、母標準偏差が現実には求められない場合があります。一つは標本数が多すぎる場合、もう一つは蛍光灯の寿命のように全てを調べると商品が残らなくなつてしまう場合です。
 そこで、仕方なくその一部を取り出す(=抽出して)、母集団のバラツキを推定します。母集団を推定するためには、いくつかを標本として選び、その標準偏差、すなわち標本標準偏差(不偏標準偏差ともいう)を代わりに用いることになります。標本は、ランダムサンプリングをするので、選ぶたびに異なり、そのバラツキは母集団とは同一の標本にはなりません
 そこで、母標準偏差はnで割るので、標本標準偏差はn-1で割っておけばやや広い範囲になるので、標本の選択が少々不味くても、広めに取ってあるのでカバーできることになります(数学的には証明できるようですが、私には無理なので、直感的に表現しました)。もちろん、標本数が大きければ、nであろうが、n-1であろうが大差はありません。このようにして、計算が非現実的な母集団のバラツキを推定するわけです。標本標準偏差は、母標準偏差の代理なのです。

>標本平均Xバーの標準偏差
 標準偏差は、母集団のバラツキを示します。標本標準偏差は、母集団のバラツキの推定値です。
 これは、標準誤差で、母集団から抽出した「標本の平均値のバラツキ」を示しています。平均ですから、再度nで割り算することになります。外国人の論文には、バラツキがグラフ上などでは小さく見えるので、標本標準偏差(母集団のバラツキの推定値)ではなく、この標準誤差(標本の平均値のバラツキ)で示したものを見かけます。

 なお、標準偏差は、英語ではStandard Deviation、エクセルではSTDEVPでPの根拠が不明。標準誤差は、英語ではPartial Standard Deviation、エクセルはSTDEVで、Patialの単語の部分が見当たりません。エクセルの関数を使うときは、逆にやりそうで、いつも混乱しています。

 統計学での目的は、集団全体のこと、すなわち母集団について知ることです。

 標準偏差は、集団のばらつきの程度を示し、本当に知りたいのは母集団の標準偏差、すなわち、母標準偏差です。しかし、母標準偏差が現実には求められない場合があります。一つは標本数が多すぎる場合、もう一つは蛍光灯の寿命のように全てを調べると商品が残らなくなつてしまう場合です。
 そこで、仕方なくその一部を取り出す(=抽出して)、母集団のバラツキを推定します。母集団を推定するためには、いくつかを標本として選び、...続きを読む

Qどうやって偏差値の公式、 偏差値=(得点ー平均点)÷標準偏差×10+5

どうやって偏差値の公式、 偏差値=(得点ー平均点)÷標準偏差×10+50 を導き出したのでしょう? また、どうしてこの公式なのでしょう?
知っている方、教えてください

Aベストアンサー

 入試の合否判定は相対評価でなされるので、入試に合格する目安は、受験者集団の中で本人がどの辺にいるか、ということになります。例えば、模擬試験の平均点が70点だったとして、それだけでは何もわかりません。平均点が60点のときの70点ならば集団の中のやや上位と言えるし、平均点が70点ならばその人は集団の真ん中にいる、といえるわけです。

 次に、平均点が60点ので本人得点が70点だったとき、集団のどの辺にいるか、ということは、他の受験者の点数の散らばり具合にもよります。平均60点で、ほとんどの受験生が55点~65点、という場合なら、70点はかなり上位になります。また、平均60点でも、30点台も90点台もごろごろいるような場合なら、70点といってもそんなに上位になならないでしょう。

 そこで、「標準偏差」という、テストの点の散らばり具合を表す数を使います。
 平均60点で、標準偏差が10点なら、50点~70点の範囲に、受験生の68%がいることになるので、70点の人は上位16%のところにいることがわかります。つまり、平均点から標準偏差だけ離れておれば、上位16%のところにいる、ということです。
 もし標準偏差が5点なら55点~65点の範囲に受験生の68%がおり、50点~70点の範囲には95%の受験生がいることになりますので、このときの70点なら上位3%のところにいることがわかります。つまり、平均点から標準偏差の2倍だけ離れておれば、上位3%のところにいる、ということです。

 このように、平均点からのずれが標準偏差の何倍かがわかれば、本人の集団での位置がわかり、「あなたの得点は,標準偏差の○○倍だけ離れています」ということで、受検などに対する目安がわかります。

 ほんとはこれだけでいいのですが、「平均点からのずれが標準偏差の0.6倍」とかいってもわかりにくいと思ったある中学校の先生が、今使われている「偏差値」という表し方を考えました。
 まず、(得点ー平均点)÷標準偏差 だと小数になるところを10倍しました。(「0.6倍」よりは「6点」のほうがわかりやすい?)
 それから、平均より低い場合にマイナス(平均点より低いと -6点 とか)になるので、マイナスにならないように、全体に50を足した、というものです。

 偏差値が50→平均そのもの→集団の真ん中
 偏差値が60→平均点から標準偏差の分だけ高い→集団の上位16%

などということになります。


>どうやって偏差値の公式、 偏差値=(得点ー平均点)÷標準偏差×10+50 を導き出したのでしょう? >また、どうしてこの公式なのでしょう?

については、上述したように必然的な結果というわけではなく、「適当に」決めたものです。

http://www.stockage2002.com/archives/category/%E5%81%8F%E5%B7%AE%E5%80%A4%E3%81%A3%E3%81%A6%EF%BC%9F

 入試の合否判定は相対評価でなされるので、入試に合格する目安は、受験者集団の中で本人がどの辺にいるか、ということになります。例えば、模擬試験の平均点が70点だったとして、それだけでは何もわかりません。平均点が60点のときの70点ならば集団の中のやや上位と言えるし、平均点が70点ならばその人は集団の真ん中にいる、といえるわけです。

 次に、平均点が60点ので本人得点が70点だったとき、集団のどの辺にいるか、ということは、他の受験者の点数の散らばり具合にもよります。平均60点...続きを読む

Q偏差値と標準偏差の公式をそれぞれ教えてください。

偏差値と標準偏差の公式をそれぞれ教えてください。
後、下の問題の偏差値と標準偏差を計算してください!
お願いします。

5人のテストの点数が、以下のようになっていました。(100点満点)
A:67点、B:58点、C:43点、D:83点、E:79点

Aベストアンサー

(1) 5 人の点数を合計する。
(2) 合計を人数 5 で割る。
その値が「平均点」。
(3) 各人の点数から平均点を引く。
(4) その差を、それぞれ2乗する。
(5) 2乗した値を、5 人分合計する。
(6) 合計を人数 5 で割る。
その値が「分散」。
(7) 分散の平方根が「標準偏差」。
(8) 50+10×(点数)/(標準偏差) のことを
各人の「偏差値」と言う。

計算は、必ず自分で!

Q標準偏差の出し方

Xが1、2,3,4計で確率が0.3、0.5、0.1、0.1計1での 問題なのですが、Ex=2となって 分散Vx=0.8と解いたのですが、Dx=の出し方が解りません。教科書を読むのですが、Vxとやり方が同じでただ 0.8に√をつければいいのかと? 是非 教えてください <(_ _)> 公式の意味も イマイチ理解できず困っています。出来れば 何か例題で教えてくれると有難いです。 お願いします。

Aベストアンサー

分散と標準偏差はデータが平均値を中心にどのくらい散らばっているのかを示します。つまり、これらが大きいほどデータの中に平均値に近い値が少なく、逆に小さければ平均値に近いデータが多いということです。

ここで、分散とはそれぞれの値から平均値をひいた値を二乗したものを足して、データの数で割ったものです。つまり、平均値から離れたデータがたくさんあると必然的に大きくなるのが分かると思います。

次に分散は分散の平方根をとってもとのデータと単位をそろえたものです。分散を求めるときはデータと平均値との差を二乗してますよね。

(これは平均値から同じ値だけ正負に離れた数字があるとします。例えば、平均値が5なら2と8といった感じです。両方差が3ですよね。ここで、分散を求めるときに二乗しなければ分散は0になってしまいます。実際は平均値から離れているデータなのにおかしいですよね。きちんと平均値からの差を明確にするために二乗してるんですよ。)

話が少しズレましたがこの分散を求める時に二乗したことによって実際の平均値との差の統計ではなくなってますよね。簡単に言えば二乗にすることによってもとのデータと同じスケールではなくなってます。(かなり意味合いが違いますが、長さと面積を比べてもって感じです。)つまり、分散の平方根をとってやることによってもとのデータと同じスケールとなるのですよ。

だから分散が0.8ならその平方根をとれば大丈夫です。約0.894程度になるんですかね。

参考になればこれ幸いです。では、がんばってください!

分散と標準偏差はデータが平均値を中心にどのくらい散らばっているのかを示します。つまり、これらが大きいほどデータの中に平均値に近い値が少なく、逆に小さければ平均値に近いデータが多いということです。

ここで、分散とはそれぞれの値から平均値をひいた値を二乗したものを足して、データの数で割ったものです。つまり、平均値から離れたデータがたくさんあると必然的に大きくなるのが分かると思います。

次に分散は分散の平方根をとってもとのデータと単位をそろえたものです。分散を求めるときはデ...続きを読む

Q標準偏差の出し方

アンケート結果のデータ分析をしているんですが、回答のばらつきを標準偏差(数値が高いほどばらつきが高い)で表すことができるようなんですが、出し方がよくわかりません。
以下のような場合、どのように標準偏差を出したらいいのでしょうか。
エクセルでの出し方をご存知の方がいらっしゃいましたら、ご教示ください。
よろしくお願いします。

例)
アンケートの回答の仕方:1番~5番で回答。
1と回答した人:9名
2と回答した人:17名
3と回答した人:3名
4と回答した人:2名
5と回答した人:2名

Aベストアンサー

1.まず、このように回答を集計してしまっては駄目です。元データそのものを使って分析をする習慣を付けてください。
33人分のデータですから、A列に氏名をいれ、B列に回答を入力します。
A列  B列(アンケートの回答)
太郎  1
次郎  2
三郎  4
花子  2


以下33番目の人まで。
で、後は、stdev関数を使うだけです。上記の場合で言うと、
STDEV(B1:b33) と入力すれば、標準偏差は出ます。同様に、
c列に別のアンケートの集計を入力してやれば、個々の
アンケートの標準偏差は出ます。

2.さて、このような質問を出すということは学部生ですね。
一応、忠告をしておきますが、この種のアンケート
の回答(これを順序尺度または質的変数と言います)
に標準偏差を適用することは意味がありません。
間違いとは言いませんが、無意味です。
アンケート回答データの分散を「敢えて」調べる場合は
KirkのDを使います

>回答のばらつきを数値化して示すために、よく使われている手法
まぁ、確かにそういう論文が(私の分野でも)あることは事実です。

統計手法は、よく誤用されます。書く方も読む方も統計の
素人ですから(私は、教育関係の研究者)、よく分から
ないまま、何となく納得してしまうのです。
これは、私達の分野でもよくある話で、専門の統計学の
先生から笑われたりします。
例えば、t検定をやっているのに、分布の正規性を
確認していない、とかね。

3.どんな本でも良いですから、統計の基本が書いてある本を
まず読んでください。どんな本でも、こうした順序尺度
に、「標準偏差を用いることが普通」、などと書いてあるはずが
ありません。
最初の方に書いてあるはずですから、立ち読みでも結構。
利用する手法は
基本統計量
クロス集計
χ2乗検定
その上で、モデル化をして、乖離係数を出すのが普通でしょう。

1.まず、このように回答を集計してしまっては駄目です。元データそのものを使って分析をする習慣を付けてください。
33人分のデータですから、A列に氏名をいれ、B列に回答を入力します。
A列  B列(アンケートの回答)
太郎  1
次郎  2
三郎  4
花子  2


以下33番目の人まで。
で、後は、stdev関数を使うだけです。上記の場合で言うと、
STDEV(B1:b33) と入力すれば、標準偏差は出ます。同様に、
c列に別のアンケートの集計を入力してやれば、個々の
アンケートの標準偏差は...続きを読む


人気Q&Aランキング

おすすめ情報