プロが教える店舗&オフィスのセキュリティ対策術

統計のt検定について分からないことがあるので、どなたか教えてください!!

t検定の計算を行う際には、標本平均の差の分散の値を求める必要がありますよね?

仮に比較する標本Aと標本平Bがあったとすると、その差である(標本平均A-標本平均B)の分散は、「(母分散A/標本数A)と(母分散B/標本数B)を足したものになる」と、当たり前のようにサイトや書籍には書かれているのですがこの理由がわかりません…。

具体的に申し上げますと、差といってるのになんで足すのかが、わからないのです。

「分散=二乗」というのが関係してそうだなとは思うのですが、もやもやします。

高校生でもわかるくらいに、やさしく説明してくださると大変ありがたいです…。

A 回答 (5件)

標本平均A の分散が、母分散A/標本数A になることはよいでしょうか。



あとは、分散の公式(高校で習う公式です)
http://mathtrain.jp/exvarcov
に入れて計算すればいいです。確率変数AとBが無相関なら、AとBの和(差も)の分散は、それぞれの分散を足したものになります。
    • good
    • 0
この回答へのお礼

rabbit-cat様

返信が遅くなり、大変申し訳ありません。

確率変数AとBが無相関の場合、0になるということに気づいて、やっとスッキリできました!

誠にありがとうございます。

お礼日時:2016/09/11 21:49

ウェルチのt検定


https://ja.wikipedia.org/wiki/%E3%82%A6%E3%82%A7 …
についての質問ですよね。
つまり、AとBというのは、2つの異なる母集団を意味しているんですよね。
(母分散Aというのは、単純に母集団Aの母分散、母分散Bは母集団Bの母分散のこと)

(標本平均A-標本平均B)の分散は = (母分散A/標本数A)+(母分散B/標本数B)
は母集団Aと母集団Bが独立(本当は無相関で十分ですが)なら厳密に成り立ちます。(高校の授業で習うはずです)

で、普通は当然ながら母分散は未知なわけで、右辺を計算することはできません。
そこで、ウェルチの検定を使います。
上のページにあるt(これは、標本平均、標本分散から計算できます)が、t分布に従います。
(上のページの式を見ればわかりますが、単純に母分散を不偏分散に置き換えたものではないです。)

ただし、ウェルチのt検定は、2つの母集団がともに正規分布にしたがっていることを前提としているので、正規性が仮定できない場合には、
マン・ホイットニーのU検定
https://ja.wikipedia.org/wiki/%E3%83%9E%E3%83%B3 …
あるいは、Brunner-Munzel検定なんかを使います。
http://oku.edu.mie-u.ac.jp/~okumura/stat/brunner …
    • good
    • 2
この回答へのお礼

rabbit-cat様

二度のご回答誠にありがとうございます。

統計に詳しいかたがgooにいらっしゃってとても助かりました。

また質問が出てくるかもしれませんが、その際は何卒よろしくお願い致します!

お礼日時:2016/09/11 21:53

No.2です。

#3さんの回答に関して。

質問者さんの書いている「母分散A」「母分散B]というのがよく分かりません。(母分散ならAもBもない)
通常、「母分散」は未知なので、「標本分散A」「標本分散B」かと思いますが、その場合には標本平均の分散としては「不偏分散」つまり「標本分散A/(標本数A - 1) 」を使うはずです。(「標本数 - 1」はいわゆる「自由度」)

「t分布」というのは、そういう分布ですから。
    • good
    • 0

>その差である(標本平均A-標本平均B)の分散は、「(母分散A/標本数A)と(母分散B/標本数B)を足したものになる」



ということは言っていないと思います。

 お示しのものは、おそらく「等分散を仮定できない2つの標本の標本平均の検定」(同じ母集団から抽出されたといえるか)に使われる「ウェルチのt検定」における「t値の取り方」を指していると思います。
https://ja.wikipedia.org/wiki/%E3%82%A6%E3%82%A7 …
http://www.aoni.waseda.jp/abek/document/t-test.h …
http://www.geisya.or.jp/~mwm48961/statistics/bun …

 「なぜそうするの」という説明は確かに少なく、「そうすればよい」「ツールにデータを入力すれば、そのように計算してくれる」という説明ばかりですね。
 きっと、説明は難しいのでしょう。私も浅学でできません。

 オリジナルのウェルチさんの論文は下記のようなので、必要なら当たってみてはいかがでしょうか。1938年のものですね。
http://www.stat.cmu.edu/~fienberg/Statistics36-7 …
    • good
    • 0
この回答へのお礼

yhr2様

返信が遅くなり大変申し訳ありません。

なるほど、私はそもそも参照元をコピーし間違えたようですね。大変失礼しました。

もう一度テキストを見直してみます。

オリジナルの論文までご教示いただき、ありがとうございます!

お礼日時:2016/09/11 20:51

地道に計算してみたらどうだろうか.

    • good
    • 0
この回答へのお礼

Tacosanさん

回答ありがとうございます。
地道な計算も重要かと思いますが、理由をとにかく言語化したいのです。

お力お借りできますでしょうか。

お礼日時:2016/09/05 12:36

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!