マンガでよめる痔のこと・薬のこと

偏差を合計するとゼロになるので、偏差の2乗を求めて、その合計から分散や標準偏差を求めていく ということを習いました。
しかし、エクセルで計算をしてみたら、偏差の合計がゼロにならずに、変な表記なりました(エラー?)。
これはなぜですか?
どなたか、詳しい解説お願いします。

このQ&Aに関連する最新のQ&A

A 回答 (3件)

#1 です。



>0にならないわけがありません

は、言いすぎでした。
 エクセルなど、コンピュータで数値処理をするときには精度の限界があるので、

-x.xxxxE-15

みたいな結果になることはあります。「変な表記」とはこのような物でしょうか?

 これは、x.xxxx かける 10の-15乗 ということで、0.000000……xxxx という、非常に小さい数値です。

コンピュータでの誤差の話については

http://oku.edu.mie-u.ac.jp/~okumura/software/exc …

などを参照してください。

ただ、これは、コンピュータの処理の限界の問題であって、「偏差を合計するとゼロになる」ということ自体に誤りはありません。
    • good
    • 1
この回答へのお礼

有難うございました。
大変参考になりました。

お礼日時:2008/06/29 22:24

こんにちは。



Excelをどう使ったか不明ですが、
それは、明らかに使い方を間違えてますね。

下記を丸写しして試してみてください。

データは、1,2,3,4,5,6,7,8,9,10 の10個です。
(平均は5.5、偏差の合計はのはずですよね。)

セルB2に 「平均」と文字記入
セルB3に =AVERAGE(D3:D12) と入力

セルD3に 「データ」 と文字記入
セルD4に 1 と入力
セルD5に 2 と入力
 ・・・・・
セルD13に 10 と入力

セルE3に 「偏差」 と文字記入
セルE4に =D4-$B$3 と入力
セルE4をセルE5~セルE13にコピー
(すると、D列の各データの偏差がE列に出現します。)

セルD15に 「偏差合計」 と文字記入
セルD16に =SUM(E4:E13) と入力
(おしまい)


ちなみに、セルE4に B3 ではなく、絶対座標の $B$3 と入力する理由は、
E5~E13を全部手で打つのが面倒くさいので、
E4からのコピーで発生させるためです。
(平均値としては、どのデータの偏差に対しても、全てセルB3を参照するので。)
    • good
    • 0

>エクセルで計算をしてみたら、偏差の合計がゼロにならずに、変な表記なりました



 どんな計算式であったか、具体的に書いてください。

 ちなみに「偏差」は、「平均値との差」ということですね?この偏差をそのまま合計すると0にならないわけがありません。
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Qエクセル STDEVとSTDEVPの違い

エクセルの統計関数で標準偏差を求める時、STDEVとSTDEVPがあります。両者の違いが良くわかりません。
宜しかったら、恐縮ですが、以下の具体例で、『噛み砕いて』教えて下さい。
(例)
セルA1~A13に1~13の数字を入力、平均値=7、STDEVでは3.89444、STDEVPでは3.741657となります。
また、平均値7と各数字の差を取り、それを2乗し、総和を取る(182)、これをデータの個数13で割る(14)、この平方根を取ると3.741657となります。
では、STDEVとSTDEVPの違いは何なのでしょうか?統計のことは疎く、お手数ですが、サルにもわかるようご教授頂きたく、お願い致します。

Aベストアンサー

データが母集団そのものからとったか、標本データかで違います。また母集団そのものだったとしても(例えばクラス全員というような)、その背景にさらならる母集団(例えば学年全体)を想定して比較するような時もありますので、その場合は標本となります。
で標本データの時はSTDEVを使って、母集団の時はSTDEVPをつかうことになります。
公式の違いは分母がn-1(STDEV)かn(STDEVP)かの違いしかありません。まぁ感覚的に理解するなら、分母がn-1になるということはそれだけ結果が大きくなるわけで、つまりそれだけのりしろを多くもって推測に当たるというようなことになります。
AとBの違いがあるかないかという推測をする時、通常は標本同士の検証になるわけですので、偏差を余裕をもってわざとちょっと大きめに見るということで、それだけ確証の度合いを上げるというわけです。

Qエクセルで計算すると2.43E-19などと表示される。Eとは何ですか?

よろしくお願いします。
エクセルの回帰分析をすると有意水準で2.43E-19などと表示されますが
Eとは何でしょうか?

また、回帰分析の数字の意味が良く分からないのですが、
皆さんは独学されましたか?それとも講座などをうけたのでしょうか?

回帰分析でR2(決定係数)しかみていないのですが
どうすれば回帰分析が分かるようになるのでしょうか?
本を読んだのですがいまいち難しくて分かりません。
教えてください。
よろしくお願いします。

Aベストアンサー

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるための指数表記のことですよ。
・よって、『2.43E-19』とは?
 2.43×1/(10の19乗)で、
 2.43×1/10000000000000000000となり、
 2.43×0.0000000000000000001だから、
 0.000000000000000000243という数値を意味します。

補足:
・E+数値は 10、100、1000 という大きい数を表します。
・E-数値は 0.1、0.01、0.001 という小さい数を表します。
・数学では『2.43×10』の次に、小さい数字で上に『19』と表示します。→http://ja.wikipedia.org/wiki/%E6%8C%87%E6%95%B0%E8%A1%A8%E8%A8%98
・最後に『回帰分析』とは何?下の『参考URL』をどうぞ。→『数学』カテゴリで質問してみては?

参考URL:http://ja.wikipedia.org/wiki/%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるた...続きを読む

Q加重平均と平均の違い

加重平均と平均の違いってなんですか?
値が同じになることが多いような気がするんですけど・・・
わかりやす~い例で教えてください。

Aベストアンサー

例えば,テストをやって,A組の平均点80点,B組70点,C組60点だったとします.
全体の平均は70点!・・・これが単純な平均ですね.
クラスごとの人数が全く同じなら問題ないし,
わずかに違う程度なら誤差も少ないです.

ところが,A組100人,B組50人,C組10人だったら?
これで「平均70点」と言われたら,A組の生徒は文句を言いますよね.
そこで,クラスごとに重みをつけ,
(80×100+70×50+60×10)÷(100+50+10)=75.6
とやって求めるのが「加重平均」です.

Q標準偏差と平均偏差の違い

標準偏差と平均偏差は、数字としての意味は何が違うのでしょうか。(算出方法の違いなどは分かります)
換言すれば、平均偏差でもサンプルのばらつきが表現できるのに、わざわざ計算過程をややこしくして標準偏差を求めることにどのようなメリットがあるのかということです。

『数種類の検体を用いて同一行程の実験を行い、その結果の値の揺れ(ばらつき)を求めたい』

このレポートへのアプローチとして、平均偏差または標準偏差を利用するとき、両者が意味的にどのような違いをもつのか、ご教授ください。

Aベストアンサー

ばらつきの大きさを比較したいなら、どちらでも同じでしょう。

違いを考えるには、平均とは何か?ということが鍵になります。サンプルの平均は m=(x1+...+xn)÷n で求めるのが通例ですが、なぜこうするのがよいか?を考えてみてください。

実は、このようにして求める平均は、標準偏差の2乗和を最小にします。
では、平均偏差を最小にするような値を計算してみましょう。つまり、
  J= |x1-μ|+...+|xn-μ| を最小にするμを求めるわけです。
例えば、データが(1,1,1,0,-3)だったとします。
m=0 となりますが、(2)式を最小にする値は、0ではありませんね。
一方で,標準偏差の2乗和
 V= (x1-μ)^2+...+(xn-μ)^2
を最小にするμはVをμで微分して=0と置いて、とけば
 μ=m であることがわかります。
平均偏差を最小にする値は中央値ですので、そこが違うということになるわけです。

Q標本分散と不偏分散の使い分けについて。

標本分散と不偏分散の使い分けについて。

私はメーカーに勤めており、電子部品のばらつきなどでよく標準偏差σを目にします。
自分で少し調べてみると標準偏差にも標本分散を使うときと不偏分散を使うときがあることを知ったのですが、説明が難しくどのように使い分けていいのか分かりません。

標本分散と不偏分散はどのように使い分ければいいのでしょうか。
例えば電子部品の性能や実験データのばらつきにはどちらが使われているのでしょうか?

ご存知の方、教えてください。
よろしくお願いします。

Aベストアンサー

 母集団から全ての標本を抽出して得た、すなわち、全てのデータを使った分散を標本分散、というようです。しかし、標本分散の文字から、抽出した標本の分散という意味から、不偏分散の意味でも使う(私もそうでした)こともあり、標本分散がどちらなのか、混乱しています。質問者も標本分散をこの意味で使っていると想います。

 母集団のデータを知るのが統計学では目的ですが、それには全数(全サンプル)を利用する必要があります。しかし、製品検査などでは、全数検査だと商品が残らない、あるいは手間がかかり過ぎるので抜き取りを行い、全数検査の替わりにできます。この場合の分散は、不偏分散で代用ができます、というのが推測統計学です。

 すなわち、全数検査(文字通り全数、一つ欠けてもダメ)なら標本分散(この用語は混乱を招くので、私は使いませんが)、抜き取りなら不偏分散を利用しています。

QIF関数を使って3つ以上のある範囲内の条件を満たす場合「A」などと入力

IF関数を使って3つ以上のある範囲内の条件を満たす場合「A」などと入力したいです。

たとえば
100以上110以下はA
110以上120以下はB
120以上ならC

=IF(F3=100<110,"A",IF(F3=110<120,"B",IF(F3=120<???,"C")))

こんな感じでしょうか?
よろしく教えてください。

Aベストアンサー

参考までに。

大きい数値あるいは小さい数値から絞り込む方法ではなく、F3が100以上110未満という限定条件の数式にする場合は(これ数式ならIF関数の順に関係されない)、以下のようにAND関数を利用します。

=IF(AND(F3>=100,F3<110),"A",IF(AND(F3>=110,F3<120),"B",IF(F3>120,"C","100未満")))

Q相関係数についてくるP値とは何ですか?

相関係数についてくるP値の意味がわかりません。

r=0.90 (P<0.001)

P=0.05で相関がない

という表現は何を意味しているのでしょうか?
またMS Excelを使ってのP値の計算方法を教えてください。

よろしくお願い致します。

Aベストアンサー

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場合はp=0.1%でもいいと思いますが)
相関係数においても相関の有無を結論つけるにはそのrが偶然出る確率を出すか、5%の確率ならrがどれぐらいの値が出るかを知っておく必要が有ります。

>r=0.90 (P<0.001)

相関係数は0.90と計算された。相関がないのに偶然r=0.90 となる確率は0.001以下だと言ってます。

>P=0.05で相関がない

相関がないと結論。(間違っている確率は5%以下)だと言ってます。

エクセルでの計算ですが、まず関数CORRELを使ってr値を出します。xデータがA1からA10に、yデータがB1からB10に入っているとして

r=CORREL(A1:A10,B1:B10)

次にそのr値をt値に変換します。

t=r*(n-2)^0.5/(1-r^2)^0.5

ここでnは組みデータの数です。((x1,y1),(x2,y2),・・・(xn,yn))
最後に関数TDISTで確率に変換します。両側です。

p=TDIST(t値,n-2,2)

もっと簡単な方法があるかも知れませんが、私ならこう計算します。(アドインの分析ツールを使う以外は)

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場...続きを読む

Q線形・非線形って何ですか?

既に同じようなテーマで質問が出ておりますが、
再度お聞きしたく質問します。

※既に出ている質問
『質問:線形、非線型ってどういう意味ですか?』
http://oshiete1.goo.ne.jp/kotaeru.php3?q=285400
結局これを読んでもいまいちピンと来なかった...(--;


1.線形と非線形について教えてください。
2.何の為にそのような考え方(分け方)をするのか教えてください。


勝手なお願いですが、以下の点に留意いただけると大変うれしいです。
何せ数学はそんなに得意ではない人間+歳なので...(~~;

・わかりやすく教えてください。(小学生に説明するつもりぐらいだとありがたいです)
・例をあげてください。(こちらも小学生でもわかるような例をいただけると助かります)
・数式はなるべく少なくしてください。

『そんな条件じゃ説明できないよー』という方もいると思いますが、どうぞよろしくお願いいたしますm(__)m

Aベストアンサー

昨日「線形の方がなんとなくてわかりやすくないですか」と書いたんですが、やっぱり理系の人間らしく、もうちょっときちんと説明してみます。昨日は数式をなるべく出さないように説明しようとがんばったんですが、今日は少しだけ出しますが、勘弁してください。m(__)m(あと、長文も勘弁してください)


数学的にはちょっとここまで言えるかわかりませんが、自然界の法則としては、「線形」が重要な意味を持つのは、xの値が変化するにつれて変化するyがあったときに、

(yの増加量)/(xの増加量)=A(一定)

という規則が成り立つからです。

xやyの例としては昨日の例で言う例1だとxがガムの個数、yが全体の金額、例2だとxが時間、yが走った距離です。

この規則が何で役に立つかというと、式をちょっと変形すると、

(yの増加量)=A×(xの増加量)・・(1)

ということがわかります。つまり、Aの値さえわかれば、xが増えたときのyの値が容易に推測できるようになるわけです。


ここで「Aの値さえわかれば」と書いていますが、この意味を今から説明します。

自然界の法則を調べるためには何らかの実験を行います。例えば、りんごが木から落ちる運動の測定を行います。
ここから質問者様がイメージできるかわかりませんが、りんごは時間が経つにつれて(下に落ちるにつれて)落下するスピードが速くなるんです。今、実験として、1秒ごとにりんごのスピードを測定したとします。そしてその結果をグラフにプロットしていくと、直線になることがわかります。(ここがわかりにくいかもしれませんが、実際に実験を行うとそのようになるのです)

数学の問題のように初めから「時速100kmで走る」とか「1個100円のガム」とかいうことが与えられていれば直線になることはすぐにわかります。
しかし、自然界の法則はそうもうまくいきません。つまり、実験を行ってその結果をプロットした結果が直線状になっていたときに初めて「何らかの法則があるのではないか」ということがわかり、上で書いた「Aの値さえわかれば」の「A」の値がプロットが直線状になった結果、初めてわかるのです。

そして、プロットが直線状になっているということは、永遠にそうなることが予想されます。つまり、今現在はりんごが木から落ちたときしか実験できませんが、その結果を用いて、もしりんごが雲の上から落としたときに地面ではどのくらいのスピードになるかが推測できるようになるわけです。ここで、このことがなぜ推測できるようになるかというと、(1)で書いた関係式があるからです。このように「なんらかの法則があることが推測でき、それを用いて別の事象が予言できるようになる」ことが「線形」が重要だと考えられる理由です。

しかし、実際に飛行機に乗って雲の上からりんごを落としたらここで推測した値にはならないのです。スカイダイビングを想像するとわかると思いますが、最初はどんどんスピードが上がっていきますが、ある程度でスピードは変わらなくなります。(ずっとスピードが増え続けたら、たぶんあんなに空中で動く余裕はないでしょうか??)つまり、「線形から外れる」のです。

では、なぜスピードが変わらなくなるかというと、お分かりになると思いますが、空気抵抗があるからなんですね。(これが昨日「世の中そううまくはいかない」と書いた理由です)つまり、初めは「線形」かと思われたりんごを落とすという実験は実際には「非線形」なんです。非線形のときは(1)の関係式が成り立たないので、線形のときほど容易には現象の予測ができないことがわかると思います。


では、非線形だと、全てのことにおいて現象の予測が難しいのでしょうか?実はそうでもありません。例えば、logは非線形だということをNo.5さんが書かれていますが、「片対数グラフ」というちょっと特殊な形のグラフを用いるとlogや指数関数のグラフも直線になるんです。つまり、普通のグラフでプロットしたときに「非線形」になるため一見何の法則もないように見えがちな実験結果が「片対数グラフ」を用いると、プロット結果が「線形」になってlogや指数関数の性質を持つことが容易にわかり、それを用いて現象の予測を行うことが(もちろん単なる線形よりは難しいですが)できるようになるわけです。


これが私の「線形」「非線形」の理解です。つまり、

1) 線形の結果の場合は同様の他の事象の推測が容易
2) 非線形の場合は同様の他の事象の推測が困難
3) しかし、一見非線形に見えるものも特殊な見方をすると線形になることがあり、その場合は事象の推測が容易である

このことからいろいろな実験結果は「なるべく線形にならないか」ということを目標に頑張ります。しかし、実際には先ほどの空気抵抗の例のように、どうしても線形にはならない事象の方が世の中多いんです。(つまり、非線形のものが多いんです)

わかりやすいかどうかよくわかりませんが、これが「線形」「非線形」を分ける理由だと思っています。

やっぱり、「線形の方がなんとなくわかりやすい」くらいの理解の方がよかったですかね(^^;;

昨日「線形の方がなんとなくてわかりやすくないですか」と書いたんですが、やっぱり理系の人間らしく、もうちょっときちんと説明してみます。昨日は数式をなるべく出さないように説明しようとがんばったんですが、今日は少しだけ出しますが、勘弁してください。m(__)m(あと、長文も勘弁してください)


数学的にはちょっとここまで言えるかわかりませんが、自然界の法則としては、「線形」が重要な意味を持つのは、xの値が変化するにつれて変化するyがあったときに、

(yの増加量)/(xの増加量)=...続きを読む

Q母標準偏差・標本標準偏差と標本平均(Xバー)の標準偏差

(聞きたいのは、最後の3行がメインです)
http://oshiete1.goo.ne.jp/qa3478996.html
の質問をしたものです。

標準偏差を求めるとき、(ルートの中の)分母が「n」か「n-1」
の2種類があることはわかりました。
母標準偏差であっても標本標準偏差であっても「n」で求められる
が、標本から母標準偏差を推定するときが「n-1」を使うという
ことで理解しました。

ところで、「n」にしても「n-1」にしてもそんなに値としては
変わらないということなんですよね?

高校の時の教科書で、「標本平均(Xバー)の標準偏差」という
のがありました。
 「母平均m、母標準偏差sの母集団から大きさnの無作為標本
 抽出するとき、標本平均Xバーの標準偏差σ=s/(ルートn)」
というのがありました。
 「標本標準偏差」とこの「標本平均Xバーの標準偏差」というの
は全然違うものなんですよね?(値も全然違うものになってしま
うと思います。)

Aベストアンサー

 統計学での目的は、集団全体のこと、すなわち母集団について知ることです。

 標準偏差は、集団のばらつきの程度を示し、本当に知りたいのは母集団の標準偏差、すなわち、母標準偏差です。しかし、母標準偏差が現実には求められない場合があります。一つは標本数が多すぎる場合、もう一つは蛍光灯の寿命のように全てを調べると商品が残らなくなつてしまう場合です。
 そこで、仕方なくその一部を取り出す(=抽出して)、母集団のバラツキを推定します。母集団を推定するためには、いくつかを標本として選び、その標準偏差、すなわち標本標準偏差(不偏標準偏差ともいう)を代わりに用いることになります。標本は、ランダムサンプリングをするので、選ぶたびに異なり、そのバラツキは母集団とは同一の標本にはなりません
 そこで、母標準偏差はnで割るので、標本標準偏差はn-1で割っておけばやや広い範囲になるので、標本の選択が少々不味くても、広めに取ってあるのでカバーできることになります(数学的には証明できるようですが、私には無理なので、直感的に表現しました)。もちろん、標本数が大きければ、nであろうが、n-1であろうが大差はありません。このようにして、計算が非現実的な母集団のバラツキを推定するわけです。標本標準偏差は、母標準偏差の代理なのです。

>標本平均Xバーの標準偏差
 標準偏差は、母集団のバラツキを示します。標本標準偏差は、母集団のバラツキの推定値です。
 これは、標準誤差で、母集団から抽出した「標本の平均値のバラツキ」を示しています。平均ですから、再度nで割り算することになります。外国人の論文には、バラツキがグラフ上などでは小さく見えるので、標本標準偏差(母集団のバラツキの推定値)ではなく、この標準誤差(標本の平均値のバラツキ)で示したものを見かけます。

 なお、標準偏差は、英語ではStandard Deviation、エクセルではSTDEVPでPの根拠が不明。標準誤差は、英語ではPartial Standard Deviation、エクセルはSTDEVで、Patialの単語の部分が見当たりません。エクセルの関数を使うときは、逆にやりそうで、いつも混乱しています。

 統計学での目的は、集団全体のこと、すなわち母集団について知ることです。

 標準偏差は、集団のばらつきの程度を示し、本当に知りたいのは母集団の標準偏差、すなわち、母標準偏差です。しかし、母標準偏差が現実には求められない場合があります。一つは標本数が多すぎる場合、もう一つは蛍光灯の寿命のように全てを調べると商品が残らなくなつてしまう場合です。
 そこで、仕方なくその一部を取り出す(=抽出して)、母集団のバラツキを推定します。母集団を推定するためには、いくつかを標本として選び、...続きを読む

Q偏差平方和の式

初歩的な質問で恐縮です。相関分析の参考書に
Sx=Σ(xi-xbar)^2=Σxi^2-(Σxi)^2/n
とあります。
この式の証明方法を教えていただけないでしょうか?
この分野はあまり得意でなく困っております。
言葉を添え丁寧に教えていただくと助かります。
勝手申しますが、よろしくお願いします。

Aベストアンサー

個人的な書きやすさのため
xbarをaverage(x)って書き

xiをx(i)と書くことにする。

なお
Σ(x(i))^2は (x(1) + x(2) + x(3))^2を
Σ(x(i)^2)は (x(1)^2 + x(2)^2 + x(3)^2)を
それぞれ意味するものとする。
 平均って,定義から明らかに
average(x) = Σ(x(i))/n ・・・A
だよな。

Σ(x(i) - average(x))^2
=(x(1) - average(x))^2
+(x(2) - average(x))^2
+(x(3) - average(x))^2
+…
+(x(n) - average(x))^2

=(x(1))^2 - 2 * x(1) * average(x) + (average(x))^2
+(x(2))^2 - 2 * x(2) * average(x) + (average(x))^2
+(x(3))^2 - 2 * x(3) * average(x) + (average(x))^2
+…
+(x(n))^2 - 2 * x(n) * average(x) + (average(x))^2

= Σ(x(i)^2) - 2 * average(x) * Σ(x(i)) + n * (average(x))^2

ここでAをaverage(x)に代入すると

Σ(x(i)^2) - 2 * average(x) * Σ(x(i)) + n * (average(x))^2
= Σ(x(i)^2) - 2 * Σ(x(i)) / n * Σ(x(i)) + n * (Σ(x(i)) /n )^2
= Σ(x(i)^2) - 2 * Σ(x(i)) ^ 2 /n + Σ(x(i))^2 / n
= Σ(x(i)^2) - Σ(x(i))^2 / n

個人的な書きやすさのため
xbarをaverage(x)って書き

xiをx(i)と書くことにする。

なお
Σ(x(i))^2は (x(1) + x(2) + x(3))^2を
Σ(x(i)^2)は (x(1)^2 + x(2)^2 + x(3)^2)を
それぞれ意味するものとする。
 平均って,定義から明らかに
average(x) = Σ(x(i))/n ・・・A
だよな。

Σ(x(i) - average(x))^2
=(x(1) - average(x))^2
+(x(2) - average(x))^2
+(x(3) - average(x))^2
+…
+(x(n) - average(x))^2

=(x(1))^2 - 2 * x(1) * average(x) + (average(x))^2
+(x(2))^2 - 2 * x(2) * ave...続きを読む


このQ&Aを見た人がよく見るQ&A

このカテゴリの人気Q&Aランキング