痔になりやすい生活習慣とは?

初歩的な質問で恐縮です。相関分析の参考書に
Sx=Σ(xi-xbar)^2=Σxi^2-(Σxi)^2/n
とあります。
この式の証明方法を教えていただけないでしょうか?
この分野はあまり得意でなく困っております。
言葉を添え丁寧に教えていただくと助かります。
勝手申しますが、よろしくお願いします。

このQ&Aに関連する最新のQ&A

A 回答 (4件)

個人的な書きやすさのため


xbarをaverage(x)って書き

xiをx(i)と書くことにする。

なお
Σ(x(i))^2は (x(1) + x(2) + x(3))^2を
Σ(x(i)^2)は (x(1)^2 + x(2)^2 + x(3)^2)を
それぞれ意味するものとする。
 平均って,定義から明らかに
average(x) = Σ(x(i))/n ・・・A
だよな。

Σ(x(i) - average(x))^2
=(x(1) - average(x))^2
+(x(2) - average(x))^2
+(x(3) - average(x))^2
+…
+(x(n) - average(x))^2

=(x(1))^2 - 2 * x(1) * average(x) + (average(x))^2
+(x(2))^2 - 2 * x(2) * average(x) + (average(x))^2
+(x(3))^2 - 2 * x(3) * average(x) + (average(x))^2
+…
+(x(n))^2 - 2 * x(n) * average(x) + (average(x))^2

= Σ(x(i)^2) - 2 * average(x) * Σ(x(i)) + n * (average(x))^2

ここでAをaverage(x)に代入すると

Σ(x(i)^2) - 2 * average(x) * Σ(x(i)) + n * (average(x))^2
= Σ(x(i)^2) - 2 * Σ(x(i)) / n * Σ(x(i)) + n * (Σ(x(i)) /n )^2
= Σ(x(i)^2) - 2 * Σ(x(i)) ^ 2 /n + Σ(x(i))^2 / n
= Σ(x(i)^2) - Σ(x(i))^2 / n
    • good
    • 6

他の方と同じことをやっているわけですが、このような式の計算は、なるべく記号を簡単にするほうが見やすくなります。

例えば、xiを単にxとし、xbarをAとします。

Σ((x-A)^2)
-----2乗を展開
=Σ(x^2)-2AΣx+Σ(A^2)
-----Aを(Σx)/nと置き換える
=Σ(x^2)-2((Σx)/n)Σx+Σ(((Σx)/n)^2)
-----第3項は定数のΣだからn倍としても同じ
=Σ(x^2)-2(((Σx)^2)/n)+n((Σx)^2)/(n^2)
-----第2項は第3項の-2倍と判明した
=Σ(x^2)-((Σx)^2)/n
    • good
    • 8
この回答へのお礼

皆様懇切丁寧なご指導ありがとうございました。
おかげさまで理解できました。
お二人しか評価できないのが残念です。

お礼日時:2008/07/07 10:02

xbar = Σxj / n なんだけど、xbar はそういう計算結果であって、与式の中では定数なんだな。


だから単純に、
Σ(xi - xbar)^2
= Σ(xi^2 - 2 xbar・xi - (xbar)^2)
= Σxi^2 - 2 xbar Σxi + n (xbar)^2
= Σxi^2 - 2 n (xbar)^2 + n (xbar)^2  (∵ Σxi = n xbar)
= Σxi^2 - n (xbar)^2
= Σxi^2 - (Σxi)^2 / n  (∵ xbar = (Σxi) / n )
    • good
    • 1

自分で書き方変えといて書き間違えてる


Σ(x(i) - average(x))^2
=(x(1) - average(x))^2
ではなく

Σ((x(i) - average(x))^2)
の誤り
    • good
    • 0

このQ&Aに関連する人気のQ&A

計算 記号」に関するQ&A: ルート(√)の計算

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q偏差平方和の計算方法

QC検定に向けて勉強しているところです。

偏差平方和の計算は、
Sx=Σ(xi-xbar)^2=Σxi^2-(Σxi)^2/n
とあります。

Σ(xi-xbar)^2を展開していくときに、最終的に
式が、Σxi^2-n(xbar)^2で終わっていない理由、
つまり、xbarを消している理由って何かあるのですか?

Aベストアンサー

>Sx=Σ(xi-xbar)^2=Σxi^2-(Σxi)^2/n

定義からいうと

Sx=Σ(xi-xbar)^2     (1)

で完ということです。しかし計算手順を考えてみると

xbar=Σxi/n         (2)

ですからxbarはこのデータを足してnで割って得られるわけであって、これを(1)に用いてもう一度n個のデータを計算し直さなければならないという2度手間になっています。

Sx=Σxi^2-(Σxi)^2/n

はxiの和、およびΣxi^2の和を同時に求めつつ進めて、最後にこの式で処理すればよいので一度で済むということです。

表計算をする場合はA欄にxi、B欄にxi^2を入れておいて両者のn個の合計を取ってやればよいことになります。

いずれにしろPCを使う場合大した問題ではありません。

Q平方和、平方差とは?

こんな簡単な質問ですが、
よく、「平方和、平方差」と聞きますが、どういう計算式なんでしょうか?
数学が全くだめなのでわかりやすく教えていただけないでしょうか?

Aベストアンサー

> 平方差についてですが、出てくる数値の順番によって答が違ってきますね。そのあたりは何か決め事があるのでしょうか?

「aとbの差」を a-b の意味で使う場合と |a-b| の意味で使う場合とあり,きちんと断ってないときは文脈で判断するしかないと思います。

「三角形が鋭角三角形になる条件は,1辺の平方が他の2辺の平方和より小さく平方差より大きい」という記述では
|a^2-b^2|<c^2<a^2+b^2
を意味しています。

Q偏差積和の証明

統計学の勉強をしていたのですが、ふと、よくわからない式に遭遇してしまいました。
添付した画像ファイルもご覧になっていただきたいのですが、とある教科書に記載されていた偏差積和の式

Sxy=Σx(i)y(i)-(Σx(i))(Σy(i))/n・・・(1)

が、どうしても理解できません(>_<)
ここ↓
http://web.mac.com/ricebrd/%E3%82%B5%E3%82%A4%E3%83%88_2/Blog/%E3%82%A8%E3%83%B3%E3%83%88%E3%83%AA%E3%83%BC/2008/5/8_%E5%81%8F%E5%B7%AE%E7%A9%8D%E5%92%8C.html
等で、偏差積和に関する大まかな意味は把握し、上記リンク先に記載されている式を展開すれば、(1)式になるのだと思い、展開してみたり試行錯誤してみました。
しかし、どうしてもうまく(1)を導くことができません。また、
偏差平方和↓
http://oshiete1.goo.ne.jp/qa4150278.html
の証明は見つかったのですが、偏差積和の証明は、見つけることができませんでした(ToT)

数学や統計学に自信のある方、お力をお借しいただければ幸いです。
よろしくお願いします<m(__)m>

統計学の勉強をしていたのですが、ふと、よくわからない式に遭遇してしまいました。
添付した画像ファイルもご覧になっていただきたいのですが、とある教科書に記載されていた偏差積和の式

Sxy=Σx(i)y(i)-(Σx(i))(Σy(i))/n・・・(1)

が、どうしても理解できません(>_<)
ここ↓
http://web.mac.com/ricebrd/%E3%82%B5%E3%82%A4%E3%83%88_2/Blog/%E3%82%A8%E3%83%B3%E3%83%88%E3%83%AA%E3%83%BC/2008/5/8_%E5%81%8F%E5%B7%AE%E7%A9%8D%E5%92%8C.html
等で、偏差積和に関する大まかな意味は把握し、上記リ...続きを読む

Aベストアンサー

X = (1/n)Σx(i)
Y = (1/n)Σy(i)

と定義すると、XとYはそれぞれxとyの平均値なので、

Sxy = Σ((x(i)-X)(y(i)-Y))

が偏差積和。これを展開するだけ。やることは偏差平方和の話とまるっきり同じなので、迷うところはどこにもないと思うけど、強いて言えば

Σ(XY) = XYΣ1 = XYn

に注意するってことかな。

Q電卓での二乗のやり方

一般的な安い電卓で二乗の計算は出来るのでしょうか

例えば  5の12乗 の計算は!!

出来るのであれば、教えてください。

Aベストアンサー

No.3ですが、No.4と動きが違うものがあります。ご参考まで。

SHARP
「5」「×」「×」「=」 →25(2乗)
「5」「×」「=」    →25(2乗)
「5」「+」「+」「=」 →5
「5」「+」「=」「=」 →5

Canon
「5」「×」「×」「=」 →25(2乗)
「5」「×」「=」    →25(2乗)
「5」「+」「+」「=」 →10
「5」「+」「=」「=」 →10

Q3σ法による計算式

当方、管理や統計学など全く無知ですのでわかりやすく教えて下さい。

仕事で、管理図を作成するにあたり、3σ法で管理限界線(UCL,LCL)を計算せよとの事を言われましたが、理解出来てません。

3σ法の公式とかあるんでしょうか?あったら教えて下さい。あと、3σとは何か、簡単に教えて下さい

Aベストアンサー

まず、3σというのは、σの3倍のことです。
そして、σというのが、「標準偏差」といわれるもので、これはばらつきの大きさを表すものです。

計算方法などは、
http://www.mbanavi.com/school/stat04.htm
最近では、excel で計算してしまうという手もあります。(が、それでは意味がつかみにくいかも)
基本的には、
1)全体の平均をとる
2)個々のデータと平均との差を求める(この大小がばらつきに相当)
3) 2)でとった個々のデータについての差を2乗する(プラス・マイナスの影響をなくすため)
4)それを、(データの数-1)で割る(気持ちとしては、ばらつきの量を平均した感じ・データの数-1で割るのは、「母標準偏差の推定」という考え方があるから)
5) 3)でばらつきを2乗しているので、それをルートで開いて元に戻す

とうことになります。

統計上いくつかの前提があって、例えば、製造工程で普通にものを作った場合、いろいろなばらつきは、それぞれ独立に出ます。
そこで、結果的には、ある一定の平均値付近のものが多くでき、平均値から外れたものは、少しだけどできるという形になる場合が多いのです。
この場合、誤差が本当の意味での「ばらつき」であれば、これは、「正規分布」という分布(つまり、平均値付近が多く、それから離れると少なくなっていくような)をします。

この「正規分布に従う」という前提で、平均値±3σの間には、全体の、99%強 が含まれるというのが、統計的に知られています。
これを以て、3σで管理という事になります。


さて、「管理図」ということですが、いろいろな種類のものがあります。
そこで、普通は、UCL, LCL は、製品自体の規格値(か、それから算出された値)を使うので、直接、3σは出てこない気がするのですが。
考えられるのは、x-s (平均と、標準偏差の管理図)で、標準偏差に対する上限管理値が3σなのかなと。(この場合、下限の管理値はありません。0が理想なので)

まず、3σというのは、σの3倍のことです。
そして、σというのが、「標準偏差」といわれるもので、これはばらつきの大きさを表すものです。

計算方法などは、
http://www.mbanavi.com/school/stat04.htm
最近では、excel で計算してしまうという手もあります。(が、それでは意味がつかみにくいかも)
基本的には、
1)全体の平均をとる
2)個々のデータと平均との差を求める(この大小がばらつきに相当)
3) 2)でとった個々のデータについての差を2乗する(プラス・マイナスの影響をなくすため...続きを読む

Qカイ2乗検定って何??;;

タイトルのとおりですが…大学で統計の基礎な授業を一般教養で受けています。だけど知らない&説明のない言葉がいっぱぃで、全くついていけません(>_<))
「人が一番選ばなさそうな数字」を何度か投票した結果があって、その数字は無作為に選ばれてるかどうか、有意水準1%としてカイ2乗検定をして判断する、という問題があるのですが、カイ2乗検定自体、授業でちらっと言葉は使ったものの、計算の仕方、使い方の説明等はなく、まったく手がつかずにいます;;ネットでも調べてみましたが、どう使っていいのかまでは分かりませんでした。
知識の無い私でもわかるようなものがあれば教えて下さいっっ!お願いします。

Aベストアンサー

こんにちは.χ2(カイ二乗)検定を厳密に理解するには,数学的素養を持っている状態できっちりと統計学を学習する必要があるのですが,統計データを解析するための手段として統計学を「使う」のであれば,多少の原理を知っておけばよいでしょう.
以下初学者向けにかなり乱暴な説明をしています.正確な理解をしたければ,後で統計学の教科書などで独学して下さい.

χ2検定とは,χ2分布という確率分布を使ったデータ解析法と考えてもらう……のが一番なのですが,多分χ2分布って何? と思われるでしょう.χ2分布とは,二乗値に関する確率分布と考えることができるのですが,この辺もさらりと流して下さい.

例を使って説明します.今,道行く人にA,B,C,Dの四枚のカードの中から好きなもの一枚を選んでもらうとしましょう(ただし,選んでもらうだけで,あげるわけではありません.単にどのカードを選択仕方の情報を得るだけです).一人一枚だけの条件で,160人にカードを選んでもらいました.
さて,ここで考えてみて下さい.4枚のカードには大きな違いはなく,どれを選んでもかまわない.でたらめに選ぶとなれば,どのカードも1/4で,同じ確率で,選ばれるはずですよね? ならば,160人データならば,Aは何枚ほど選ばれる「はず」でしょうか? 同様に,B,C,Dは何枚選ばれる「はず」でしょうか?
……当然,A=B=C=D=40枚の「はず」ですよね? この40枚という数値はでたらめに(無作為に)選ばれたとしたらどんな数値になるかの【理論値】を意味します.

さて,上記はあくまでも理論値であり,実際のデータは異なる可能性があります.というよりはむしろ違っているのがふつうでしょう.そのような実際に観測された数値を【観測値】と呼びます.
仮に理論値と観測値が以下のようになったとします.

        A    B    C    D
(1)観測値   72   23   16   49
(2)理論値   40   40   40   40

当然のように観測値と理論値にズレが生じています.しかし現実と理論が異なるのはある意味当然なのですからぴったり一致することなどありえません.そこで,「ある程度一致しているか(ズレは許容範囲か)」を問題にすることになります.しかし,「ある程度」といわれても一体どのぐらいであれば「ある程度」と言えるのでしょうか? なかなか判断が難しいではないですか?
確かに判断が難しいです.そこで,この判断のために統計学の力を借りて判断するわけで,更に言えばこのような目的(理論値と観測値のズレが許容範囲かどうか)を検討するときに使われるデータ解析法がχ2検定なのです.

        A    B    C    D
(1)観測値   72   23   16   49
(2)理論値   40   40   40   40
(3)ズレ    +32   -17   -14   + 9
(4)ズレ二乗 1024   289   196   81
(5)(4)÷(2) 25.6  7.225  4.9  2.025

 χ2=25.6+7.225+4.9+2.025=49.25

計算過程をさらりと書いていますが,早い話が観測値と理論値のズレの大きさはいくらになるのか,を求めることになります.最終的には「49.25」というズレ値が算出されました.

さて,この「49.25」というズレ値が許容範囲かどうかの判定をするのですが,ここで,χ2分布という確率分布を使うことになります.詳細は統計学教科書を参考してもらうとして,χ2分布を使うと,○○というズレ値が(ある条件では)どのぐらい珍しいことなのか,という「珍しさの確率」を教えてくれます.
かりに「有意水準1%=1%よりも小さい確率で発生することはすごく珍しいと考える(許容範囲と考えられない)」とすれば,「珍しさ確率」が1%以内であれば「許容範囲ではない」と判断します.

以上,長々と書きました.今までの説明を読めばわかるように,χ2検定とはある理論値を想定した時,実際の観測値がその理論値とほぼ一致しているかどうかを調べるための統計解析法のことです.

χ2検定では,理論値をどのように設定するかは分析者の自由です.その設定の仕方で,χ2検定は「適合度の検定」や「独立性の検定」など異なる名称が付与されますが,本質は同じなのです.

質問者さんの場合は

> 「人が一番選ばなさそうな数字」を何度か投票した結果があって、その数字は無作為に選ばれてるかどうか、

これを理論値としてうまく設定することが鍵となるでしょう.

こんにちは.χ2(カイ二乗)検定を厳密に理解するには,数学的素養を持っている状態できっちりと統計学を学習する必要があるのですが,統計データを解析するための手段として統計学を「使う」のであれば,多少の原理を知っておけばよいでしょう.
以下初学者向けにかなり乱暴な説明をしています.正確な理解をしたければ,後で統計学の教科書などで独学して下さい.

χ2検定とは,χ2分布という確率分布を使ったデータ解析法と考えてもらう……のが一番なのですが,多分χ2分布って何? と思われるでしょう.χ2分布...続きを読む

Q電卓の使い方 乗数はどうしたらよい?

長い数字を何乗もするとき、簡単にできる電卓のボタンはあるのでしょうか?電卓にもよるとおもいますが、一般的にどうしたらいいの?

Aベストアンサー

例えば15の2乗は、
15××=

15の3乗は、
15××==

となります。=を繰り返し(連続して)押すことがポイントです。

電卓のメーカーによっては、
2乗は、
15×=

3乗は、
15×==

と、×を二つ連続して押す必要はありません。

お持ちの電卓で試してください。

Q±4σに入る確率について教えてください

ウィキペディアの検索より、
確率変数XがN( μ, σ2)に従う時、平均 μ からのずれがσ以下の範囲にXが含まれる確率は68.26%、2σ以下だと95.44%、さらに3σだと99.74%となる。
と分かりました。

そこで
4σ、


の場合確率はどうなるか教えてください。
よろしくお願い致します。

Aベストアンサー

Excel で NORMDIST を使い、平均 50、標準偏差 10 (いわゆる偏差値)で計算してみましたら、次のようになりました。

 σ 0.682689492137086
2σ 0.954499736103641
3σ 0.997300203936740
4σ 0.999936657516326
5σ 0.999999426696856
6σ 0.999999998026825
7σ 0.999999999997440
8σ 0.999999999999999
9σ 1.000000000000000

Excelの関数の精度がどの程度のものか分かりませんが、9σで100%になりました。

Q集落サンプリングと層別サンプリングの違い

両者ともランダムにサンプリングして、層に分けることは同じですよね?

集落サンプリング:
大学をいくつか選び、そこからサンプリングすること?
層別サンプリング:
大学内を層別し(学年、学部等)、サンプリングをすること?

これで合っているのでしょうか?
何がどのように違うのか分かりません。
どなたか教えてもらえませんか?

また、どのような時に各々のサンプリング方法が適しているのか、例(例えば、大学などの身近な例)
などを挙げて説明してもらえると助かります。


宜しくお願いします。

Aベストアンサー

こんにちは。

集落サンプリング:おっしゃるとおり
層別サンプリング:(大学内とは限らず)学部別とか
  学年別とか。あるいは国公立と私立とか。
  で,層別してサンプリングする
のことではないかと思います。

Q分散の求め方

はじめまして。分散の求め方で質問があります。
おわかりになる方、書き込みをお願いします。

測定値1,2,3,4,5について。

(1) 平均値=3、自乗の平均値=11より
   分散=自乗の平均値-平均値の自乗より
     =11-(3×3)=11-9=2

(2) 平方和=(1×1+2×2+3×3+4×4+5×5)-5×3×3
     =10
  自由度=5-1=4
  分散=平方和÷自由度より
    =10÷4=2.5

(1)、(2) どちらが正しいのでしょうか。

よろしくお願いします。

Aベストアンサー

こんにちは

分散の基本的定義は、「偏差平方和」をデータの自由度で割る、です。
まずそれぞれの値から平均値を引き、2乗したものを足し合わせます(偏差平方和)。
この値を自由度(n-1)で割ったものが分散です。

偏差平方和=(1-3)^2+(2-3)^2+(3-3)^2+(4-3)^2+(5-3)^2=10
自由度=5-1=4
従って、分散=10/4=2.5 となります。

(2)の計算結果と「値」は同じですが、これは「偶然」そうなっただけで、分散を算出する計算式としては間違っています。


人気Q&Aランキング