今だけ人気マンガ100円レンタル特集♪

統計の勉強をしていて、標準偏差とはデータの
ばらつき具合、分散と書かれていました。
平均から比べてどのくらい差があるかという事は
理解しました。

しかし基準値を勉強していて、
本には基準値の平均は必ず0である。標準偏差は
必ず1であると書かれています。標準偏差は
データのばらつき具合なのに、なぜ基準値の元では
すべての標準偏差は1になるのでしょうか?

このQ&Aに関連する最新のQ&A

A 回答 (3件)

「基準値を勉強してい」る



という状態がどういうことなのかわからないのですが,

標準正規分布のことではありませんか?
「標準正規分布」は正規分布のうち,平均値が0(ゼロ),標準偏差が1(いち)のものです。

「統計用語つづき1」↓

参考URL:http://w3.cc.nagasaki-u.ac.jp/contrib/Excel/youg …
    • good
    • 0

標準化に関する質問だと思います。

母集団の平均値をAvrX, 標準偏差をSとすると、母集団の各要素Xの値を
  (X-AvrX)/S
とすることを標準化と呼びます。標準化をすると平均値は0になり、上述の式の通り元々のXの値を母集団のバラツキである標準偏差で割るので、標準化後の標準偏差は1になります。
標準化とは無次元化することに等しいですから、これにより異なる母集団の分布を比べることが可能になります。偏差値がその良い例です。
    • good
    • 1

どんな確率分布でも事象の確率変数の値の単位を変換すると標準偏差を1にすることができると思います.σ=1では余計な定数が出てこなくて

がハッキリしやすいと思います.また、平均は事象の値を平行移動することで0にすることができると思います.
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q標準偏差について詳しい方お願いします

お世話になります。
標準偏差は平均からのばらつき・・とききますが、「標準偏差が大きい」「小さい」という、その目安がわかりません。

たとえば、50人の集団で平均年齢30歳、標準偏差1.2だったらどうでしょうか?

また、平均年齢が同じぐらいでも、標準偏差が1.0と10.0と違う2つの集団についていろんなデータを比べると、何か問題がありますか?

どちらかでもいいので、わかるかたがいましたらおねがいいたします。

Aベストアンサー

とりあえず、「標準偏差」の定義はURLを読んでいただくとして。

標準偏差は「分散」の平方根ですから、その集団の標準偏差が大きい
ということは、その集団のデータのばらつきが大きいということです。

とりあえず、以下の話は母集団が正規分布をするという仮定で行います。

仮に平均年齢が同じ30歳で、標準偏差が1の集団の場合、その集団には
28歳~32歳の人しかいない(95%程度の確率でその中にデータがある)
ということですし、標準偏差が10ならば35歳の人も結構フツーにその
中にいる(同じ確率では10~50歳になります)ということです。

逆に、例えばテストの点などを考えますと、同じ60点でも平均65点、
標準偏差5、の場合と平均70点、標準偏差10の場合では、どれだけ
違うか直接には比較出来ません。これらを「平均50、標準偏差10」
に換算して比較するのが「偏差値」の考え方です。
(上記の場合、どちらも同じ偏差値40になります)

ということで標準偏差は、ばらつきの度合いを平均値と同時にチェック
する時に使う値です。標準偏差の違う集団を直接に比較するかどうかは
その母集団の性質によって違いますよ。

参考URL:http://ja.wikipedia.org/wiki/%E6%A8%99%E6%BA%96%E5%81%8F%E5%B7%AE

とりあえず、「標準偏差」の定義はURLを読んでいただくとして。

標準偏差は「分散」の平方根ですから、その集団の標準偏差が大きい
ということは、その集団のデータのばらつきが大きいということです。

とりあえず、以下の話は母集団が正規分布をするという仮定で行います。

仮に平均年齢が同じ30歳で、標準偏差が1の集団の場合、その集団には
28歳~32歳の人しかいない(95%程度の確率でその中にデータがある)
ということですし、標準偏差が10ならば35歳の人も結構フツーにその
中にいる(同じ確率...続きを読む

Qエクセル STDEVとSTDEVPの違い

エクセルの統計関数で標準偏差を求める時、STDEVとSTDEVPがあります。両者の違いが良くわかりません。
宜しかったら、恐縮ですが、以下の具体例で、『噛み砕いて』教えて下さい。
(例)
セルA1~A13に1~13の数字を入力、平均値=7、STDEVでは3.89444、STDEVPでは3.741657となります。
また、平均値7と各数字の差を取り、それを2乗し、総和を取る(182)、これをデータの個数13で割る(14)、この平方根を取ると3.741657となります。
では、STDEVとSTDEVPの違いは何なのでしょうか?統計のことは疎く、お手数ですが、サルにもわかるようご教授頂きたく、お願い致します。

Aベストアンサー

データが母集団そのものからとったか、標本データかで違います。また母集団そのものだったとしても(例えばクラス全員というような)、その背景にさらならる母集団(例えば学年全体)を想定して比較するような時もありますので、その場合は標本となります。
で標本データの時はSTDEVを使って、母集団の時はSTDEVPをつかうことになります。
公式の違いは分母がn-1(STDEV)かn(STDEVP)かの違いしかありません。まぁ感覚的に理解するなら、分母がn-1になるということはそれだけ結果が大きくなるわけで、つまりそれだけのりしろを多くもって推測に当たるというようなことになります。
AとBの違いがあるかないかという推測をする時、通常は標本同士の検証になるわけですので、偏差を余裕をもってわざとちょっと大きめに見るということで、それだけ確証の度合いを上げるというわけです。

Q基準値からのばらつき

平均からのばらつきを調べるためには標準偏差というものがありますが
平均ではなくある基準値からのばらつきを調べたいのですがその場合も
標準偏差の計算式を応用でできるのでしょうか。

例)A、B、Cという数値がある場合

標準偏差 (A-平均)^2 (B-平均)^2 (C-平均)^2 の平均の平方根
  ↓
基準値Dからのばらつき (A-基準値D)^2 (B-基準値D)^2 (C-基準値D)^2 の平均の平方根

という式は成り立つのでしょうか? 

Aベストアンサー

成り立つとか成り立たたないとかの話ではなく、
「基準値からのバラつき」なるものを
そのように定義したいってことでしょう?
すればいいんじゃないですか? 誰も止めません。
ヒルベルトなんか、直線をビアマグと呼んでました。
…とかは置いといて、

n 個のデータ xi (i=1,2,…,n) の平均を m とすると、
基準値 D との差の 2 乗和は、
Σ(xi-D)2乗 = Σ((xi-m)-(D-m))2乗
= Σ((xi-m)2乗 - 2(xi-m)(D-m) + (D-m)2乗)
= Σ(xi-m)2乗 - 2(D-m)Σ(xi-m) + Σ(D-m)2乗
= Σ(xi-m)2乗 - 0 + n(D-m)2乗.

両辺を n で割ると、
(1/n)Σ(xi-D)2乗 = (xiの分散) + (D-m)2乗
となります。
貴方の「バラつき」は、(基準値と平均の差の 2 乗)と分散の和の平方根です。
xi の分散に対して単調増加ですから、
バラつきの指標として使えそうな気はしますね。

Q相関係数についてくるP値とは何ですか?

相関係数についてくるP値の意味がわかりません。

r=0.90 (P<0.001)

P=0.05で相関がない

という表現は何を意味しているのでしょうか?
またMS Excelを使ってのP値の計算方法を教えてください。

よろしくお願い致します。

Aベストアンサー

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場合はp=0.1%でもいいと思いますが)
相関係数においても相関の有無を結論つけるにはそのrが偶然出る確率を出すか、5%の確率ならrがどれぐらいの値が出るかを知っておく必要が有ります。

>r=0.90 (P<0.001)

相関係数は0.90と計算された。相関がないのに偶然r=0.90 となる確率は0.001以下だと言ってます。

>P=0.05で相関がない

相関がないと結論。(間違っている確率は5%以下)だと言ってます。

エクセルでの計算ですが、まず関数CORRELを使ってr値を出します。xデータがA1からA10に、yデータがB1からB10に入っているとして

r=CORREL(A1:A10,B1:B10)

次にそのr値をt値に変換します。

t=r*(n-2)^0.5/(1-r^2)^0.5

ここでnは組みデータの数です。((x1,y1),(x2,y2),・・・(xn,yn))
最後に関数TDISTで確率に変換します。両側です。

p=TDIST(t値,n-2,2)

もっと簡単な方法があるかも知れませんが、私ならこう計算します。(アドインの分析ツールを使う以外は)

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場...続きを読む

Q±2SDには何パーセントが入りますか

ちょっとしたことを調べていて、手元の本で調べられません。標題の通りです。もう少しくわしくわかる方法、ホームページがあったら教えて下さい。

Aベストアンサー

これではどうでしょう↓

参考URL:http://aoki2.si.gunma-u.ac.jp/lecture/Univariate/sd.html

Qエクセルで範囲内の条件を満たす数値を返す関数を教えてください。

エクセルで範囲内の条件を満たす数値を返す関数を教えてください。

100以下なら1111
100超~200以下なら2222
200超~300以下なら3333
300超~400以下なら4444
400超~500以下なら5555
500超~600以下なら6666
600超~700以下なら7777
700超~800以下なら8888
800超~900以下なら9999
900超なら10000

上記のような条件があり、入力した数字が該当する条件の範囲内に該当している数字を抽出したいのですが、それができる関数を教えてください。

例えばA1セルに650と入力するとB1セルに上記の条件で該当する7777を表示する、
A1セルに100と入力するとB1セルに1111、
901とA1に入力するとB1に10000と表示されるなどのようにしたいのです。

IFを使った関数では7つまでしかネストできないので、上記の場合10ネストしなければならないのでIF関数が使えません(使える方法があるかもしれませんが私は知りません)。
ネストせずに「&」を使う方法も考えたのですが、それだと数値として扱われず文字として扱われてしまい表示形式を自在に編集することができなくなってしまいます。

良い解決方法を教えてください。

エクセルで範囲内の条件を満たす数値を返す関数を教えてください。

100以下なら1111
100超~200以下なら2222
200超~300以下なら3333
300超~400以下なら4444
400超~500以下なら5555
500超~600以下なら6666
600超~700以下なら7777
700超~800以下なら8888
800超~900以下なら9999
900超なら10000

上記のような条件があり、入力した数字が該当する条件の範囲内に該当している数字を抽出したいのですが、それができる関数を教えてください。

例えばA1セルに650と入力するとB1セルに上記の条件で該当する7777を...続きを読む

Aベストアンサー

お示しの条件を示す表が例えばD列からF列を使って入力されているとします。D1セルには超、E1セルには以下のように入力します。D2セルには0、E2セルには100、F2セルには1111と入力し、D3セルには100、E3セルには200、F3セルには2222のように入力します。以下同様にします。
そこでA1セルに数値を650のように入力したときに該当のデータをB1セルに表示させるためにはB1セルに次の式を入力します。

=IF(A1="","",VLOOKUP(A1-1,D:F,3,TRUE))

A列のデータに対応させるためにはこの式を下方にオートフィルドラッグすればよいでしょう。

Q上司に「ご報告まで」は失礼?

上司に対して些細な事をメールで報告する時に
メールの最後に「ご報告まで」と付けるのは失礼ですか?

「ご報告までです」ならOKですか?

Aベストアンサー

「ご報告まで」は「ご報告まで申し上げます」の省略形です。
上司に対しては失礼です。
「ご報告までです」は日本語としておかしいです。
省略しないで元の形のままにするか
「ご報告いたします」
「ご報告申し上げます」
でお願いします。

Q標準得点はなぜ平均0,分散1になるのか

標準得点がなぜX~N(0,1)の分布になるのかが理解できません。
なんとなくですが、計算式 "(X-平均)/標準偏差"から、標準得点とは
「"平均から値Xの差"が標準偏差のどれくらいの割合か」
という意味だろうなぁと理解してます。
しかし、なぜこの計算式の結果が、平均が0、標準偏差が1の分布になるのでしょうか?

Aベストアンサー

> 式展開を教えてもらえませんか?

Σx[i]/n=m
Σ(x[i]-m)^2/n=s^2
であれば
Σ((x[i]-m)/s)/n
=(Σx[i]/n-Σm/n)/s
=(m-m)/s
=0
Σ((x[i]-m)/s-0)^2/n
=Σ((x[i]-m)/s)^2/n
=Σ(x[i]-m)^2/n/s^2
=s^2/s^2
=1


人気Q&Aランキング