A 回答 (4件)

ほんとに昔はkawakawaさんの仰るように、表を作り手計算でしたね。


標準偏差=(((測定値ー平均値)^2の和)/(データ数ー1))の平方根
です。
次のサイトの中程に、平均値μと標準偏差σの関係を図に表しています。
(標準偏差の(データ数)のところは一般には(データ数ー1)が使われます。)
http://homepage1.nifty.com/QCC/sqc-2.html

ここにデータを入力すると標準偏差などを計算してくれます。
http://www.auemath.aichi-edu.ac.jp/teacher/iijim …

Excelを使えば、STDEV関数で一発で求まります。上のサイトのようにデータ数で割ったものはSTDEVPという関数が用意されています。
参考まで。

参考URL:http://homepage1.nifty.com/QCC/sqc-2.html,http://www.auemath.aichi-edu.ac.jp/teacher/iijim …
    • good
    • 0

n-1を使う場合が多いです。



全数検査のときにnを使用し.サンプル検査の場合にはn-1を使用します。

まれに.推定値が含まれる場合には推定値の数を更に減らします。推定値1個を含む場合には.n-2を.推定値2個を含む場合にはn-3を...
n-2を使う人は.よほど統計を知っている人か.どうしょうもない人(統計を理解していないにもかかわらす.統計を使っている人)がすることです。

通常.全数検査はありえませんので.n-1を使います。
    • good
    • 0

ルートを書くと式が煩雑になるので、分散(=標準偏差^2)


の方で以下書きます。最後に分散の平方根を求めればいい
のです。

定義式は、

分散=(Σ(X_i-M)^2)/N

N : 度数(データ数)
X_i : N個の変量(測定値)。i=1,2,...N
M : 変量の算術平均

変形すると、

=(Σ(X_i)^2)/N-((ΣX_i)/N)^2

とも書けます。こちらは平均値を先に求める必要がない
ので、場合によっては便利です。

データが母集団のサンプル(標本)であるときは、他の
回答のように定義式でNのかわりにN-1を使ったものを
「(標本)分散」、その平方根を「(標本)標準偏差」
と呼ぶこともあります。これは標本から母集団の分散を
推定するときには、N-1を使った方がよい推定値に
なっているという事情によります。

NとN-1のどちらを使うかは、文脈、各学問分野の習慣
などによって判断してください。
    • good
    • 0

各数値と平均値の差を二乗して総和を求めます。


それを(n-1)でわります。
そして、そのルートしたものが標準偏差ですネ。
昔は手計算で求めたものです。
以上kawakawaでした
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q相関係数と標準偏差

相関係数と標準偏差
相関係数の分母がなぜ標準偏差になるのかわかりません。
なぜ平均や分散ではだめなのでしょうか。
数学の初心者にもわかりやすい解説をいただけるとうれしいです。

Aベストアンサー

> 相関係数の分母がなぜ標準偏差になるのか

相関係数を無次元化(参考 URL)するためです。

たとえば x が時間を年で測ったもの、y が長さを m で測ったものとします。x と y の相関係数の、分子の単位は 年・m になります。x の標準偏差の単位は年、y の標準偏差の単位は m ですから、分母の単位も 年・m になります。分母と分子の単位が同じなので、x と y の相関係数の単位はなくなります。

> なぜ平均や分散ではだめなのでしょうか。

分母を x の平均と y の平均の積にすると、分子と分母の比は何を表現しているのか、解釈が難しいです。分母を x と y の分散の積にしても同様で、その上、単位を気にしないといけなくなるので、使いものになりません。

参考URL:http://ja.wikipedia.org/wiki/%E7%84%A1%E6%AC%A1%E5%85%83%E6%95%B0

Qどうやって偏差値の公式、 偏差値=(得点ー平均点)÷標準偏差×10+5

どうやって偏差値の公式、 偏差値=(得点ー平均点)÷標準偏差×10+50 を導き出したのでしょう? また、どうしてこの公式なのでしょう?
知っている方、教えてください

Aベストアンサー

 入試の合否判定は相対評価でなされるので、入試に合格する目安は、受験者集団の中で本人がどの辺にいるか、ということになります。例えば、模擬試験の平均点が70点だったとして、それだけでは何もわかりません。平均点が60点のときの70点ならば集団の中のやや上位と言えるし、平均点が70点ならばその人は集団の真ん中にいる、といえるわけです。

 次に、平均点が60点ので本人得点が70点だったとき、集団のどの辺にいるか、ということは、他の受験者の点数の散らばり具合にもよります。平均60点で、ほとんどの受験生が55点~65点、という場合なら、70点はかなり上位になります。また、平均60点でも、30点台も90点台もごろごろいるような場合なら、70点といってもそんなに上位になならないでしょう。

 そこで、「標準偏差」という、テストの点の散らばり具合を表す数を使います。
 平均60点で、標準偏差が10点なら、50点~70点の範囲に、受験生の68%がいることになるので、70点の人は上位16%のところにいることがわかります。つまり、平均点から標準偏差だけ離れておれば、上位16%のところにいる、ということです。
 もし標準偏差が5点なら55点~65点の範囲に受験生の68%がおり、50点~70点の範囲には95%の受験生がいることになりますので、このときの70点なら上位3%のところにいることがわかります。つまり、平均点から標準偏差の2倍だけ離れておれば、上位3%のところにいる、ということです。

 このように、平均点からのずれが標準偏差の何倍かがわかれば、本人の集団での位置がわかり、「あなたの得点は,標準偏差の○○倍だけ離れています」ということで、受検などに対する目安がわかります。

 ほんとはこれだけでいいのですが、「平均点からのずれが標準偏差の0.6倍」とかいってもわかりにくいと思ったある中学校の先生が、今使われている「偏差値」という表し方を考えました。
 まず、(得点ー平均点)÷標準偏差 だと小数になるところを10倍しました。(「0.6倍」よりは「6点」のほうがわかりやすい?)
 それから、平均より低い場合にマイナス(平均点より低いと -6点 とか)になるので、マイナスにならないように、全体に50を足した、というものです。

 偏差値が50→平均そのもの→集団の真ん中
 偏差値が60→平均点から標準偏差の分だけ高い→集団の上位16%

などということになります。


>どうやって偏差値の公式、 偏差値=(得点ー平均点)÷標準偏差×10+50 を導き出したのでしょう? >また、どうしてこの公式なのでしょう?

については、上述したように必然的な結果というわけではなく、「適当に」決めたものです。

http://www.stockage2002.com/archives/category/%E5%81%8F%E5%B7%AE%E5%80%A4%E3%81%A3%E3%81%A6%EF%BC%9F

 入試の合否判定は相対評価でなされるので、入試に合格する目安は、受験者集団の中で本人がどの辺にいるか、ということになります。例えば、模擬試験の平均点が70点だったとして、それだけでは何もわかりません。平均点が60点のときの70点ならば集団の中のやや上位と言えるし、平均点が70点ならばその人は集団の真ん中にいる、といえるわけです。

 次に、平均点が60点ので本人得点が70点だったとき、集団のどの辺にいるか、ということは、他の受験者の点数の散らばり具合にもよります。平均60点...続きを読む

Qこの問題の分散と標準偏差のやり方がわかりません(泣)誰かわかりやすくやり方教えてください〜

この問題の分散と標準偏差のやり方がわかりません(泣)誰かわかりやすくやり方教えてください〜

Aベストアンサー

No.2です。

(3)は、yi = (3xi - 5)/2 を各々計算して、同じことを繰り返せば求まります。やってみるとよい。

ただ、平均値や標準偏差の意味が分かっていれば、
 ・平均値は ybar = (3xbar - 5)/2
 ・標準偏差は (3/2)s(x)
になることが分かるはず。

上のやり方と比べてみるよい。

Q偏差値と標準偏差の公式をそれぞれ教えてください。

偏差値と標準偏差の公式をそれぞれ教えてください。
後、下の問題の偏差値と標準偏差を計算してください!
お願いします。

5人のテストの点数が、以下のようになっていました。(100点満点)
A:67点、B:58点、C:43点、D:83点、E:79点

Aベストアンサー

(1) 5 人の点数を合計する。
(2) 合計を人数 5 で割る。
その値が「平均点」。
(3) 各人の点数から平均点を引く。
(4) その差を、それぞれ2乗する。
(5) 2乗した値を、5 人分合計する。
(6) 合計を人数 5 で割る。
その値が「分散」。
(7) 分散の平方根が「標準偏差」。
(8) 50+10×(点数)/(標準偏差) のことを
各人の「偏差値」と言う。

計算は、必ず自分で!

QMATLABでの標準偏差

MATLABでの標準偏差

MATLABで入力するいくつかの数値の標準偏差が分かっているのですが、
その変数たちで作られる関数の標準偏差を求めることは出来ますか?
例えば、x、yに標準偏差を導入した場合、
f(x、y)の標準偏差をもとめたいのですが。
たとえば、f(x、y)=xyだった場合、
まず、どのように、x、yの標準偏差を導入し、
どのようにfの標準偏差を求めればよいでしょうか?
コマンド文を教えてください。

Aベストアンサー

う~ん、これは……。
いや、MATLABの問題じゃないような……。

読んだ感じですと、「使おうとしている統計」自体が凄く曖昧な気がしています。
例えば、

>いくつかの数値の標準偏差が分かっている

と言う事はxの標準偏差とyの標準偏差が分かっている?
と言うことはxもyも確率変数でそれぞれ別の分布に従っている、と。
だったら、ダイレクトに任意の分布をp_iとして

f_1(x)=p_1(x)
f_2(y)=p_2(y)

ですね。

>f(x、y)の標準偏差をもとめたいのですが。
>たとえば、f(x、y)=xyだった場合、
>まず、どのように、x、yの標準偏差を導入し、
>どのようにfの標準偏差を求めればよいでしょうか?

ここら辺から凄く怪しい事言ってます(笑)。
例えばf(x,y)とは言っても、

・確率変数xとyが独立な場合
・確率変数xとyが関係している場合

で全然変わってきますね。
仮に独立だったら話は簡単で、

f(x,y)=p_1(x)×p_2(y)

で終了です。これなら別に考え込む事が無いんですが……。
問題は2番目のケースですね。ちょっとどっちの想定を行ってるのかが分かりません。xの振る舞いにyが左右されている、とかないしは逆の場合ですと、同時分布にしないとダメでしょう。まあ、難しい方法じゃなくても、xとyが同時にどう言う分布に従うのか調べないといけないでしょうね。

う~ん、これは……。
いや、MATLABの問題じゃないような……。

読んだ感じですと、「使おうとしている統計」自体が凄く曖昧な気がしています。
例えば、

>いくつかの数値の標準偏差が分かっている

と言う事はxの標準偏差とyの標準偏差が分かっている?
と言うことはxもyも確率変数でそれぞれ別の分布に従っている、と。
だったら、ダイレクトに任意の分布をp_iとして

f_1(x)=p_1(x)
f_2(y)=p_2(y)

ですね。

>f(x、y)の標準偏差をもとめたいのですが。
>たとえば、f(x、y)=xyだ...続きを読む

Q標準偏差の出し方

Xが1、2,3,4計で確率が0.3、0.5、0.1、0.1計1での 問題なのですが、Ex=2となって 分散Vx=0.8と解いたのですが、Dx=の出し方が解りません。教科書を読むのですが、Vxとやり方が同じでただ 0.8に√をつければいいのかと? 是非 教えてください <(_ _)> 公式の意味も イマイチ理解できず困っています。出来れば 何か例題で教えてくれると有難いです。 お願いします。

Aベストアンサー

分散と標準偏差はデータが平均値を中心にどのくらい散らばっているのかを示します。つまり、これらが大きいほどデータの中に平均値に近い値が少なく、逆に小さければ平均値に近いデータが多いということです。

ここで、分散とはそれぞれの値から平均値をひいた値を二乗したものを足して、データの数で割ったものです。つまり、平均値から離れたデータがたくさんあると必然的に大きくなるのが分かると思います。

次に分散は分散の平方根をとってもとのデータと単位をそろえたものです。分散を求めるときはデータと平均値との差を二乗してますよね。

(これは平均値から同じ値だけ正負に離れた数字があるとします。例えば、平均値が5なら2と8といった感じです。両方差が3ですよね。ここで、分散を求めるときに二乗しなければ分散は0になってしまいます。実際は平均値から離れているデータなのにおかしいですよね。きちんと平均値からの差を明確にするために二乗してるんですよ。)

話が少しズレましたがこの分散を求める時に二乗したことによって実際の平均値との差の統計ではなくなってますよね。簡単に言えば二乗にすることによってもとのデータと同じスケールではなくなってます。(かなり意味合いが違いますが、長さと面積を比べてもって感じです。)つまり、分散の平方根をとってやることによってもとのデータと同じスケールとなるのですよ。

だから分散が0.8ならその平方根をとれば大丈夫です。約0.894程度になるんですかね。

参考になればこれ幸いです。では、がんばってください!

分散と標準偏差はデータが平均値を中心にどのくらい散らばっているのかを示します。つまり、これらが大きいほどデータの中に平均値に近い値が少なく、逆に小さければ平均値に近いデータが多いということです。

ここで、分散とはそれぞれの値から平均値をひいた値を二乗したものを足して、データの数で割ったものです。つまり、平均値から離れたデータがたくさんあると必然的に大きくなるのが分かると思います。

次に分散は分散の平方根をとってもとのデータと単位をそろえたものです。分散を求めるときはデ...続きを読む

Q標準偏差って?

標準偏差ってもんがどんなものなのかわかりません。

あるクラスの、
国語のテストの平均が60点、標準偏差が5。
算数のテストの平均が80点、標準偏差が8。

とすると合計得点の平均点は140点だと思うのですが、標準偏差はどうなりますか?
それともこれだけじゃわかりませんか?

Aベストアンサー

統計学には「正規分布の再生性」という定理があって、

「二つの確率変数X、Yが互いに独立で、正規分布し、
Xの平均がa、標準偏差がα、
Yの平均がb、標準偏差がβ とすると、
X+Yの平均はa+b、標準偏差は√(α^2 + β^2)
(^2は2乗の意味)
となる」
とあります。
これを問題に当てはめてみると、
標準偏差は√(5^2 + 8^2)で√89となります。

ただし問題は定理の中の「互いに独立」というところです。
国語・数学のテストは、独立になってません。
すなわち、国語の成績のいい子は、数学も成績がいい場合が多いだろうと考えられます。
XとYがまったく関係がないなら計算できますが、
テストの場合は上の定理が成り立ちません。
(標準偏差の値は上の値より増えると考えられます)

Q標準偏差の出し方

アンケート結果のデータ分析をしているんですが、回答のばらつきを標準偏差(数値が高いほどばらつきが高い)で表すことができるようなんですが、出し方がよくわかりません。
以下のような場合、どのように標準偏差を出したらいいのでしょうか。
エクセルでの出し方をご存知の方がいらっしゃいましたら、ご教示ください。
よろしくお願いします。

例)
アンケートの回答の仕方:1番~5番で回答。
1と回答した人:9名
2と回答した人:17名
3と回答した人:3名
4と回答した人:2名
5と回答した人:2名

Aベストアンサー

1.まず、このように回答を集計してしまっては駄目です。元データそのものを使って分析をする習慣を付けてください。
33人分のデータですから、A列に氏名をいれ、B列に回答を入力します。
A列  B列(アンケートの回答)
太郎  1
次郎  2
三郎  4
花子  2


以下33番目の人まで。
で、後は、stdev関数を使うだけです。上記の場合で言うと、
STDEV(B1:b33) と入力すれば、標準偏差は出ます。同様に、
c列に別のアンケートの集計を入力してやれば、個々の
アンケートの標準偏差は出ます。

2.さて、このような質問を出すということは学部生ですね。
一応、忠告をしておきますが、この種のアンケート
の回答(これを順序尺度または質的変数と言います)
に標準偏差を適用することは意味がありません。
間違いとは言いませんが、無意味です。
アンケート回答データの分散を「敢えて」調べる場合は
KirkのDを使います

>回答のばらつきを数値化して示すために、よく使われている手法
まぁ、確かにそういう論文が(私の分野でも)あることは事実です。

統計手法は、よく誤用されます。書く方も読む方も統計の
素人ですから(私は、教育関係の研究者)、よく分から
ないまま、何となく納得してしまうのです。
これは、私達の分野でもよくある話で、専門の統計学の
先生から笑われたりします。
例えば、t検定をやっているのに、分布の正規性を
確認していない、とかね。

3.どんな本でも良いですから、統計の基本が書いてある本を
まず読んでください。どんな本でも、こうした順序尺度
に、「標準偏差を用いることが普通」、などと書いてあるはずが
ありません。
最初の方に書いてあるはずですから、立ち読みでも結構。
利用する手法は
基本統計量
クロス集計
χ2乗検定
その上で、モデル化をして、乖離係数を出すのが普通でしょう。

1.まず、このように回答を集計してしまっては駄目です。元データそのものを使って分析をする習慣を付けてください。
33人分のデータですから、A列に氏名をいれ、B列に回答を入力します。
A列  B列(アンケートの回答)
太郎  1
次郎  2
三郎  4
花子  2


以下33番目の人まで。
で、後は、stdev関数を使うだけです。上記の場合で言うと、
STDEV(B1:b33) と入力すれば、標準偏差は出ます。同様に、
c列に別のアンケートの集計を入力してやれば、個々の
アンケートの標準偏差は...続きを読む

Q母標準偏差・標本標準偏差と標本平均(Xバー)の標準偏差

(聞きたいのは、最後の3行がメインです)
http://oshiete1.goo.ne.jp/qa3478996.html
の質問をしたものです。

標準偏差を求めるとき、(ルートの中の)分母が「n」か「n-1」
の2種類があることはわかりました。
母標準偏差であっても標本標準偏差であっても「n」で求められる
が、標本から母標準偏差を推定するときが「n-1」を使うという
ことで理解しました。

ところで、「n」にしても「n-1」にしてもそんなに値としては
変わらないということなんですよね?

高校の時の教科書で、「標本平均(Xバー)の標準偏差」という
のがありました。
 「母平均m、母標準偏差sの母集団から大きさnの無作為標本
 抽出するとき、標本平均Xバーの標準偏差σ=s/(ルートn)」
というのがありました。
 「標本標準偏差」とこの「標本平均Xバーの標準偏差」というの
は全然違うものなんですよね?(値も全然違うものになってしま
うと思います。)

Aベストアンサー

 統計学での目的は、集団全体のこと、すなわち母集団について知ることです。

 標準偏差は、集団のばらつきの程度を示し、本当に知りたいのは母集団の標準偏差、すなわち、母標準偏差です。しかし、母標準偏差が現実には求められない場合があります。一つは標本数が多すぎる場合、もう一つは蛍光灯の寿命のように全てを調べると商品が残らなくなつてしまう場合です。
 そこで、仕方なくその一部を取り出す(=抽出して)、母集団のバラツキを推定します。母集団を推定するためには、いくつかを標本として選び、その標準偏差、すなわち標本標準偏差(不偏標準偏差ともいう)を代わりに用いることになります。標本は、ランダムサンプリングをするので、選ぶたびに異なり、そのバラツキは母集団とは同一の標本にはなりません
 そこで、母標準偏差はnで割るので、標本標準偏差はn-1で割っておけばやや広い範囲になるので、標本の選択が少々不味くても、広めに取ってあるのでカバーできることになります(数学的には証明できるようですが、私には無理なので、直感的に表現しました)。もちろん、標本数が大きければ、nであろうが、n-1であろうが大差はありません。このようにして、計算が非現実的な母集団のバラツキを推定するわけです。標本標準偏差は、母標準偏差の代理なのです。

>標本平均Xバーの標準偏差
 標準偏差は、母集団のバラツキを示します。標本標準偏差は、母集団のバラツキの推定値です。
 これは、標準誤差で、母集団から抽出した「標本の平均値のバラツキ」を示しています。平均ですから、再度nで割り算することになります。外国人の論文には、バラツキがグラフ上などでは小さく見えるので、標本標準偏差(母集団のバラツキの推定値)ではなく、この標準誤差(標本の平均値のバラツキ)で示したものを見かけます。

 なお、標準偏差は、英語ではStandard Deviation、エクセルではSTDEVPでPの根拠が不明。標準誤差は、英語ではPartial Standard Deviation、エクセルはSTDEVで、Patialの単語の部分が見当たりません。エクセルの関数を使うときは、逆にやりそうで、いつも混乱しています。

 統計学での目的は、集団全体のこと、すなわち母集団について知ることです。

 標準偏差は、集団のばらつきの程度を示し、本当に知りたいのは母集団の標準偏差、すなわち、母標準偏差です。しかし、母標準偏差が現実には求められない場合があります。一つは標本数が多すぎる場合、もう一つは蛍光灯の寿命のように全てを調べると商品が残らなくなつてしまう場合です。
 そこで、仕方なくその一部を取り出す(=抽出して)、母集団のバラツキを推定します。母集団を推定するためには、いくつかを標本として選び、...続きを読む

Q大数の法則を適用した標準偏差の出し方について

数学は苦手です。少しだけ統計学などを学んだことがありますがそれによる自信などありません。再度、自分なりに考えた上で、質問しています。

私が分からなかった計算や解説が以下にあります。

http://oshiete.goo.ne.jp/qa/6573724.html

No.9 及び No.7 です。

どうして標準偏差がルート3と出るのですか?

「そして、出にくいほうに注目します。
今回のご質問では、3と5なので、3の方が少ないです。」
というのもよく分かりません。3は成功回数で、5は目標の数値なのでしょうか。私としてはバラついている対象をはっきりさせたいのです。

「平方根に反比例します」
というのも、いざ式を見ると分からなくなりました。

大数の法則や統計学を学んだのはずいぶん昔のことなので、なにがなんやら自分の考えが不安になってきました。

お願い致します。

Aベストアンサー

「大数の法則…」とありますが、大数の法則は関係ないような…

それはともかくとして、

> どうして標準偏差がルート3と出るのですか?

√3では見積もりが大きすぎますね。
各試行で成功する確率が変化しないという条件ならば、成功する回数は二項分布に従います。
8回終えて成功したのが3回という結果から、成功確率の推定値は3/8となります。

二項分布の標準偏差は、試行回数Nと成功確率pから√{Np(1-p)}で求められます。
N = 8、pは推定値の3/8を用いると、標準偏差の推定値は
√{Np(1-p)} = √{8 * 3/8 * (1 - 3/8)} = √(15/8) < √3
となります。

√3というのは、ポアソン分布と勘違いされたのだと思います。

> 「平方根に反比例します」

前述のとおり、成功回数の標準偏差は√{Np(1-p)}で求められます。
従って、成功確率の推定値の標準偏差は
[√{Np(1-p)}] / N =[√{p(1-p)/N}
となるので、試行回数の平方根に反比例していることがわかります。
(残念ながら、リンク先の計算は間違っていますが)

「大数の法則…」とありますが、大数の法則は関係ないような…

それはともかくとして、

> どうして標準偏差がルート3と出るのですか?

√3では見積もりが大きすぎますね。
各試行で成功する確率が変化しないという条件ならば、成功する回数は二項分布に従います。
8回終えて成功したのが3回という結果から、成功確率の推定値は3/8となります。

二項分布の標準偏差は、試行回数Nと成功確率pから√{Np(1-p)}で求められます。
N = 8、pは推定値の3/8を用いると、標準偏差の推定値は
√{Np(1-p)} = √{8 * 3/8 * (1 - 3/...続きを読む


このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング