システムメンテナンスのお知らせ

マイナスのt値

実験の結果を見ていると、t値をマイナスで表記しているものを見ることがあります。
実際に検定をする際には絶対値として使用するから実質的には問題ないのでしょうが、そもそもマイナスがでるような計算をすること自体に強烈な違和感があります。
結果の部分では差があるかどうかだけを問題にすればよいので、必ず平均値が大きい方から小さい方を引くものだと考えていました。

統計ソフトの出力がそうなっているといった結果論ではなく、もう少し理論的に、必ず正の値になるようにするべきだ、いや両方使っていい、いやいやそこは絶対値を書くべきだ、といった説明が知りたいです。
あるいは、このように習ったという例でも結構です。

よろしくお願いします。

gooドクター

A 回答 (1件)

> もう少し理論的に、必ず正の値になるようにするべきだ、いや両方使っていい、いやいやそこは絶対値を書くべきだ、といった説明が知りたいです。



数学的にt分布において、いわゆる検定統計量であるt値はマイナスの値をとりうるので、マイナスの値がt値として得られることに何ら問題はありませんし、そもそもそれが"理論的"でしょう。

私は逆に

> マイナスがでるような計算をすること自体に強烈な違和感があります。

というのが不思議だなぁと思いました(^_^;)

> 統計ソフトの出力がそうなっている

これはプログラマーがどのような式を用いているか(どのように計算させるか)によるものです。ごく一般的な公式としては分子に (X1_bar - X2_bar) という計算式がでてきますから、プログラム中にこの式を記せば、関数の引数にX1のデータベクトル、X2のデータベクトルを指定したとき、X1がX2より大きければプラスのt値が計算されるでしょうし、逆にX1がX2よりも大きければマイナスのt値が得られるでしょう。

Rのt.test()でもそのようになります。

> a <- rnorm(10, mean=100) # 平均が100の正規乱数を10個用意する
> b <- rnorm(10, mean=50) # 平均が50の正規乱数を10個用意する
> t.test(a, b) # aを先に指定するX1_barは変数aの平均値になる

Welch Two Sample t-test

data: a and b
t = 112.9208, df = 13.99, p-value < 2.2e-16 # t値は正の値

> t.test(b, a) # bを先に指定するX1_barは変数bの平均値になる

Welch Two Sample t-test

data: b and a
t = -112.9208, df = 13.99, p-value < 2.2e-16 # t値は負の値

もちろん、質問者さんがご指摘されているように、実質的には符号の正負は関係ないので abs(X1_bar - X2_bar) といったように、計算式に絶対値として書いてしまう場合だってありえるわけです。
    • good
    • 0
この回答へのお礼

色々と調べていたら、私の思い込みが間違っているような気がしてきました。
片側検定と両側検定の使い分けは仮説の時点で決まるものですが、実際に自分が取っていた手順を考えると、自動的にp値まで計算してから仮説を思い出し、そこで必要があれば片側/両側検定に適切な処理をしていました。
要するに使い分けのタイミングが後ろにずれていて、そのせいでt分布のマイナス部分の意味を失念していたように思います。

あと違和感に関しては、t分布の確率表は上側確率のものしか見たことがないので、そのために見慣れないマイナス表記が奇妙に思えるのかもしれません。

ありがとうございました。

お礼日時:2010/07/13 17:51

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

gooドクター

このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング