偏差を合計するとゼロになるので、偏差の2乗を求めて、その合計から分散や標準偏差を求めていく ということを習いました。
しかし、エクセルで計算をしてみたら、偏差の合計がゼロにならずに、変な表記なりました(エラー?)。
これはなぜですか?
どなたか、詳しい解説お願いします。

このQ&Aに関連する最新のQ&A

A 回答 (3件)

#1 です。



>0にならないわけがありません

は、言いすぎでした。
 エクセルなど、コンピュータで数値処理をするときには精度の限界があるので、

-x.xxxxE-15

みたいな結果になることはあります。「変な表記」とはこのような物でしょうか?

 これは、x.xxxx かける 10の-15乗 ということで、0.000000……xxxx という、非常に小さい数値です。

コンピュータでの誤差の話については

http://oku.edu.mie-u.ac.jp/~okumura/software/exc …

などを参照してください。

ただ、これは、コンピュータの処理の限界の問題であって、「偏差を合計するとゼロになる」ということ自体に誤りはありません。
    • good
    • 0
この回答へのお礼

有難うございました。
大変参考になりました。

お礼日時:2008/06/29 22:24

こんにちは。



Excelをどう使ったか不明ですが、
それは、明らかに使い方を間違えてますね。

下記を丸写しして試してみてください。

データは、1,2,3,4,5,6,7,8,9,10 の10個です。
(平均は5.5、偏差の合計はのはずですよね。)

セルB2に 「平均」と文字記入
セルB3に =AVERAGE(D3:D12) と入力

セルD3に 「データ」 と文字記入
セルD4に 1 と入力
セルD5に 2 と入力
 ・・・・・
セルD13に 10 と入力

セルE3に 「偏差」 と文字記入
セルE4に =D4-$B$3 と入力
セルE4をセルE5~セルE13にコピー
(すると、D列の各データの偏差がE列に出現します。)

セルD15に 「偏差合計」 と文字記入
セルD16に =SUM(E4:E13) と入力
(おしまい)


ちなみに、セルE4に B3 ではなく、絶対座標の $B$3 と入力する理由は、
E5~E13を全部手で打つのが面倒くさいので、
E4からのコピーで発生させるためです。
(平均値としては、どのデータの偏差に対しても、全てセルB3を参照するので。)
    • good
    • 0

>エクセルで計算をしてみたら、偏差の合計がゼロにならずに、変な表記なりました



 どんな計算式であったか、具体的に書いてください。

 ちなみに「偏差」は、「平均値との差」ということですね?この偏差をそのまま合計すると0にならないわけがありません。
    • good
    • 0

このQ&Aに関連する人気のQ&A

このQ&Aと関連する良く見られている質問

Qクラスの人数と平均点のみから標準偏差や偏差値を求めることはできるか

お願いします。

複数のクラスでテストを実施しました。
各クラスの人数と、クラスの平均点はわかります。個々の点数はわかりません。
この場合、標準偏差を求めることはできるでしょうか。
可能な場合、どのようにして求めるのでしょうか。
(テストを受けた人たちは、以下のクラスで全員となります)

Aクラス:15人、平均76点
Bクラス:20人、平均72点
Cクラス:25人、平均78点
Dクラス:30人、平均67点
Eクラス:10人、平均70点

全員の平均は72.4になります

エクセルで上記の数値をSTDEVPすると約3.97となります。
しかし、各クラスの人数が異なるのにこの計算式でやってしまって良いのか気になります。たぶんダメですよね。

しかし個々の点数がわからないのですから、仮にAクラスには76点の人が15人(全員が76点)として、Bクラスには72点の人が20人にて・・・ということにして計算を勧めた方が、より正しい標準偏差が出せるでしょうか?

Aクラスは15人全員が、平均点に対して3.4ポイント高く、その総和(15人分)を2乗して2061という数字を出し・・・これを各クラスで集計して合計した17,820という値を、データ数(生徒全員)である100でわると、約13.34という標準偏差らしきものが出るのですが。。。

個々の点数がわからない場合、もっとも精度の高い標準偏差(らしきもの)を出すにはどうすればよいでしょうか?

お願いします。

複数のクラスでテストを実施しました。
各クラスの人数と、クラスの平均点はわかります。個々の点数はわかりません。
この場合、標準偏差を求めることはできるでしょうか。
可能な場合、どのようにして求めるのでしょうか。
(テストを受けた人たちは、以下のクラスで全員となります)

Aクラス:15人、平均76点
Bクラス:20人、平均72点
Cクラス:25人、平均78点
Dクラス:30人、平均67点
Eクラス:10人、平均70点

全員の平均は72.4になります

エクセルで上記の数値をSTDEVPする...続きを読む

Aベストアンサー

No.2です。No.2には「標準偏差の目安」と書きましたが、正確に言えば「目安にもならない」ものです。

「クラス全員がそのクラスの平均点を得点した」という仮定での「ヒストグラム」を書いてみれば分かります。
全員が「67~78点」の範囲内にプロットされるわけですから。そんな分布の「標準偏差」には意味がありません。

従って、現実的には「これで標準偏差もどきを求めても無駄である」ということを付記しておきます。

クラスの人数を加味した「学年全体の平均値」は正しい値なので、使えます。

Qこの問題の分散と標準偏差のやり方がわかりません(泣)誰かわかりやすくやり方教えてください〜

この問題の分散と標準偏差のやり方がわかりません(泣)誰かわかりやすくやり方教えてください〜

Aベストアンサー

No.2です。

(3)は、yi = (3xi - 5)/2 を各々計算して、同じことを繰り返せば求まります。やってみるとよい。

ただ、平均値や標準偏差の意味が分かっていれば、
 ・平均値は ybar = (3xbar - 5)/2
 ・標準偏差は (3/2)s(x)
になることが分かるはず。

上のやり方と比べてみるよい。

Q信頼区間から標準偏差の求め方

統計初心者です。
統計の問題で行き詰まっています。
参考書やネットで調べたのですが、問題の出し方が少し特殊だったので調べきれませんでした。

Q
100人の生徒に100点満点の試験を行い平均値と標準偏差を計算し、平均値の95%信頼区間を求めたところ、(57.1-62.9)となった。標準偏差に最も近い値を選べ。

A
1 5.0
2 7.5
3 10.0
4 12.5
5 15.0

答えを見る前は、57.1~62.9=5.8 
5.8/2=3.9
3.9/2=2.95
で標準偏差は2.95かなとも思ったのですが、回答欄とかすりもしませんでした。
(±2.95×2=95%信頼区間と考えました)

ハンバーガー統計学でも調べたのですが、自由度や平均が分からないと信頼区間は出せない気がします。
(なお、この問題には自由度のt分布表はありませんでした)
数学初心者ですので(Σがギリギリくらい)、できるだけ数式を少なく教えて頂けるとありがたいです。

信頼区間から標準偏差を求める方法(考え方)をお願いします。

統計初心者です。
統計の問題で行き詰まっています。
参考書やネットで調べたのですが、問題の出し方が少し特殊だったので調べきれませんでした。

Q
100人の生徒に100点満点の試験を行い平均値と標準偏差を計算し、平均値の95%信頼区間を求めたところ、(57.1-62.9)となった。標準偏差に最も近い値を選べ。

A
1 5.0
2 7.5
3 10.0
4 12.5
5 15.0

答えを見る前は、57.1~62.9=5.8 
5.8/2=3.9
3.9/2=2.95
で標準偏差は2.95かなとも思ったのですが、回答欄とかすりもしませんでした。
(±2...続きを読む

Aベストアンサー

これは、条件などが何も書かれていませんが、「100人のサンプルデータから、母集団(たとえば日本の受験生全体)の平均値の範囲」を推定する、いわゆる「区間推定」という話と解釈します。

100人分のデータだけに関する話なら、平均値は確定するので、「信頼区間」などという話は出て来ないはずです。
おそらく、問題文の中に「母集団の平均値を信頼度95%で推定したら、57.1 ~ 62.9 であった」とあるべきでしょう。

100人のデータで、平均点 xbar 、標準偏差 σs を求めたとして、信頼度95%での母集団の平均値の信頼区間は、「不偏分散」ということで自由度:サンプル数 - 1 =100 - 1 = 99 を用いて、
  xbar - 1.96*σs/√(100 - 1) ~ xbar + 1.96*σs/√(100 - 1)
です。

これが 57.1 ~ 62.9 ということは
  xbar - 1.96σ/√99 = 57.1
  xbar + 1.96σ/√99 = 62.9
ということです。

これを解いて、
  xbar = 60
  σ ≒ 14.7
従って、選択肢の中では「5」なのでしょうね。

先の別な質問もそうでしたが、「問題文が舌足らずで不適切」かと思います。

↓ 参考サイト
http://www.tamagaki.com/math/Statistics502.html
http://yuku-tech.hatenablog.com/entry/20100704/1278255336

これは、条件などが何も書かれていませんが、「100人のサンプルデータから、母集団(たとえば日本の受験生全体)の平均値の範囲」を推定する、いわゆる「区間推定」という話と解釈します。

100人分のデータだけに関する話なら、平均値は確定するので、「信頼区間」などという話は出て来ないはずです。
おそらく、問題文の中に「母集団の平均値を信頼度95%で推定したら、57.1 ~ 62.9 であった」とあるべきでしょう。

100人のデータで、平均点 xbar 、標準偏差 σs を求めたとして、信頼度95%での母集団の平均値...続きを読む

Q分散分析の交互作用グラフの解説

以下のリンク先の分散分析の交互作用グラフの解説をお願いします。
http://kogolab.chillout.jp/elearn/hamburger/chap7/sec3.html

主効果がある、ないの見方が理解できません。
→以降に、自分の見方を書きました。見方は適切でしょうか。
(1)~(5)は理解できましたが(6)が理解できません。
わかりやすく解説して頂けると幸いです。

■交互作用のない場合
(1)Aの主効果もBの主効果もない。
→B水準のB1とB2を比較し、差がない。A水準のA1とA2を比較しても、差がない。
つまり、A、Bともに主効果がない。グラフは平行なため交互作用なし。

(2)Bの主効果のみ。
→B水準のB1とB2を比較し、差がある。A水準のA1とA2を比較しても、差がない。
つまり、B水準の主効果はある。A水準の主効果はなし。グラフは平行なため交互作用なし。

(3)A、Bともに主効果あり。
→B水準のB1とB2を比較し、差がある。A水準のA1とA2を比較し、差がある。
つまり、A、Bともに主効果がある。グラフは平行であるため、交互作用なし。

■交互作用のある場合
(4)A、Bともに主効果があり、交互作用あり。
→B水準のB1とB2を比較し、差がある。A水準のA1とA2を比較し、差がある。
つまり、A、Bともに主効果がある。グラフは平行ではないため、交互作用あり。

(5)A、Bともに主効果があり、交互作用あり。
B水準のB1とB2を比較し、差がある。A水準のA1とA2を比較し、差がある。
つまり、A、Bともに主効果があるが、B1ではA水準の効果はなく、B2でのみA水準の効果がある。グラフは平行でないため、交互作用あり。

(6)交互作用のみ。
→B水準のB1とB2を比較し、差がある。A水準のA1とA2を比較し、差がある。
つまり、A、Bともに主効果がある?とおもいます。グラフも平行でないため交互作用もある。
(6)が理解できません・・・

よろしくお願いします。

以下のリンク先の分散分析の交互作用グラフの解説をお願いします。
http://kogolab.chillout.jp/elearn/hamburger/chap7/sec3.html

主効果がある、ないの見方が理解できません。
→以降に、自分の見方を書きました。見方は適切でしょうか。
(1)~(5)は理解できましたが(6)が理解できません。
わかりやすく解説して頂けると幸いです。

■交互作用のない場合
(1)Aの主効果もBの主効果もない。
→B水準のB1とB2を比較し、差がない。A水準のA1とA2を比較しても、差がない。
つまり、A、Bともに主効果がない...続きを読む

Aベストアンサー

ANo.1へのコメントについてです。

 実際に手を動かしてみれば分かることだと思います。何はさておき、V(a,b)の式において、(a,b)に(-1,-1), (-1,1), (1,-1), (1,1)をそれぞれ代入してみて下さい。すると、4本の式
  V(-1,-1) = -C1-C2+D+E
  V(-1,1) = -C1+C2-D+E
  V(1,-1) = C1-C2-D+E
  V(1,1) = C1+C2+D+E
が得られるでしょう。これをご自分でも計算して、確認してください。

> 2×C1 2×C2の所は、なぜ2をかけることになるのでしょうか。

 要因Aの主効果ってのは、「要因Bがどうであれ、Aがあるかないかで結果にどれだけ差が出るか」ということです。なので、上記の4本の式を利用して、C1については「Aがあるかないかの差」すなわち V(1,-1)-V(-1,-1) および V(1,1)-V(-1,1) を計算してみて下さい。もちろん、C2については「Bがあるかないかの差」すなわち V(-1,1)-V(-1,-1) および V(1,1)-V(1,-1) を計算します。
 さらに、交互作用がない場合について検討するために、この計算で得られた式にD=0を代入してみて下さい。

> この符合が場所により、変化することはいかように解釈すれば良いでしょうか?

 符号が変化するのが不思議だな、と思われたんでしょうね。けれど、それは、ま、どうでも良いことです。
 この回答の冒頭に書いた4本の式の左辺は(測定した値なんですから)値が分かっている定数である。そこで、これら4本の式を「C1, C2, D, Eを未知数とする4元連立方程式」だと思って解くと、C1, C2, DがANo.1の式の通りに得られる、というだけの話です。
 ご自分で検算なさって下さい。たとえば
  D = (V(1,1) - V(1,-1) - V(-1,1) + V(-1,-1))/4
を検算するには、この式の右辺に上記の4本の式を代入して整理するんです。そうすれば、(stomachmanが計算間違いしていなければ、)
  0 = 0
という式が得られる筈です。これは正しい式ですから、この検算によって、 D = … の式が正しいと確かめられたことになります。

ANo.1へのコメントについてです。

 実際に手を動かしてみれば分かることだと思います。何はさておき、V(a,b)の式において、(a,b)に(-1,-1), (-1,1), (1,-1), (1,1)をそれぞれ代入してみて下さい。すると、4本の式
  V(-1,-1) = -C1-C2+D+E
  V(-1,1) = -C1+C2-D+E
  V(1,-1) = C1-C2-D+E
  V(1,1) = C1+C2+D+E
が得られるでしょう。これをご自分でも計算して、確認してください。

> 2×C1 2×C2の所は、なぜ2をかけることになるのでしょうか。

 要因Aの主効果ってのは、「要因Bがどうであれ、Aがあ...続きを読む

Q統計の偏差と分散について質問

「偏差の合計はゼロになる。よってそれを避けるために 個々の偏差を2乗して和をとる」

ここで、なぜ2乗してみるのでしょうか、符号を消し去るのであれば絶対値でもいいと思うのですが、

教えて下さい。絶対値ではいけない理由もお聞かせください。

Aベストアンサー

いけない理由はないです。数学的に取り扱いが面倒なだけで。
参考URLを見てください。

また、距離として、ユークリッド距離の代わりにマンハッタン距離を考える、ということもありますので、それに対応させてとらえても良いと思います。

マンハッタン距離については以下のリンクを参照。
http://ja.wikipedia.org/wiki/%E3%83%9E%E3%83%B3%E3%83%8F%E3%83%83%E3%82%BF%E3%83%B3%E8%B7%9D%E9%9B%A2

参考URL:http://aoki2.si.gunma-u.ac.jp/lecture/Univariate/mean-dev.html

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード


人気Q&Aランキング

おすすめ情報