ウェルチのt検定のやり方と結果

Question

年度別（４年間分）の平均身長を睡眠時間の量によってAグループとBグループに分けて、ウェルチのt検定を行ったところ画像のような結果となりました。こちらはエクセルの分析ツールで「分散が等しくないと家庭した２標本による検定」を行ったものです。
この結果だと帰無仮説「AとBの間に差がない」が棄却できないという結論にしてよろしいのでしょうか。もしくはそもそも検定の仕方などに問題があったのでしょうか。
標本数が十分にないからなのでしょうか。t検定についてぼんやりとした知識しかないです。

kamiyasiro · Accepted Answer

#4です。

＞平均の差が明確な場合はt検定などを行う意義ってあるのでしょうか。

全くありません。多くの論文では検定など行わずに結論を述べています。殆どの学会がそれでも査読を通しています。

検定は、「もしかすると偶然こんな差が出るかもしれない」「こんな結果はたまたまかもしれない」という危惧があるときに、偶然誤差と比較する形で行われ、「偶然誤差であることは確率的には極めて小さい」という結論を導くために用いられます。

よって、差が明確に出ていて、偶然そんなことが起きることはあり得ない場合は検定は不要です。

そのためには、まずは観測の場に影響する系統誤差（5M1Eによる誤差）を徹底的に排除し、次に偶然誤差が薄まるように繰り返し数を増やせば※、検定など行わずとも結論を導くことができます。

※偶然誤差の期待値（平均値）は０なので、観測を繰り返しを行えば、偶然誤差の影響は薄まります（ゼロに漸近します）。

※ただ、検定統計量の分母は、s／√nなので、やみくもにｎ数を増やすと、分母→０、検定統計量→∞となり、検定は常に有意になります。つまり、些細な差でも、ｎ数を増やすと検定上は有意になります。

逆に言えば差が明確なのですが、私がたかだか0.5度の解熱作用のある新薬を開発したとして、あなたはそれを買いたいですか？そんなの放っておいても熱は下がりますよね。そこで、これ以上の差をもって効果とみなす、という「効果量（effect size）」を併記しないと認めないという学会も多いです。それは、自分の主張を通すために、ｎ数を増やして差があるように見せかけるために検定を悪用する著者がいるからです。

話がややこしくなりましたが、検定は「怪しい話の証拠（エビデンス）として使われる」ということですので、「怪しくない話」では検定は不要です。例えば、コロナウィルスによって肺炎を発症するという事象に検定が必要だという人はいません。それは何万もの症例という観測上の証拠があるからです。

kamiyasiro · Answer

#2です。

統計解析の事例として用いるデータは、
・多くの統計のテキストが出版社のホームページにデータを保存しダウンロードできるようにしています。
・各省庁のホームページにはオープンデータと呼ばれる統計データが公開されています。ちなみに下記は、コロナ感染者数等のオープンデータです。

https://www.mhlw.go.jp/stf/covid-19/open-data.html

kamiyasiro · Answer

#2です。

まずは、横軸：睡眠時間、縦軸：身長の散布図を描いてみると良いです。

あるいは、睡眠時間は何時間という計量値で無く、長・中・短というようなカテゴリ値で、散布図が描きにくいのでしょうか。

それでも身長の方が計量値なら、箱ひげ図を並べた図は描けますよね。

それは実施済みで、相関が見られたから検定に進んだのでしょうか。そうであれば、お節介でした。すみません。

kamiyasiro · Answer

企業で統計を推進する立場の者です。

ご質問の趣旨から逸れてしまいますが、大事な研究だと思いますので、老婆心でコメントします。

グループに分けて、それぞれ所定の時間だけ睡眠を取ってもらった訳ではないですよね。

グループに分けて、それぞれ所定の時間だけ睡眠を取ってもらったというコホート研究ではなく、後付けで調べたというのであれば、検定方法が違います。

もし、実験のように原因に介入しているのであれば、ご質問のように結果が異なることを検定すれば良いですが、この研究は後付け研究で、既に結果が出ているのですから、その原因となる仮説を検定すべきです。
つまり、身長が高い群と、身長が低い群に分けて、睡眠時間がどうだったかの比較をすべきです。

また、標本数が各４とは、４年分の４ですか。
AグループBグループに何人含まれるのでしょう。その平均の平均だから均（なら）されてしまって差は出にくいですよね。
また、中学生くらいの伸び盛りで一番ばらつきが大きな年代をサンプルにしていませんか。
４年分のデータは全て別人ですか。男女は同数ですか。
要は、各種の誤差要因はコントロールされていますか。

何を確かめたいのかで、統計解析の設計が決まります。
研究課題に関して、それを誤差に埋もれさせることなく、系統誤差を排除するように設計しないと、「差があるとは言えない」という結果になると思います。

yhr2 · Answer

変数１の「分散」から標準偏差は 0.354
変数２の「分散」から標準偏差は 0.422
ですから、２つの平均
　165.695 と 165.28
の差
　0.415
は「統計誤差の範囲内の差」と判断でき、「有意」と判定するのは難しいでしょうね。

なので『帰無仮説「AとBの間に差がない」が棄却できない』というのは妥当だと思います。

ウェルチのt検定のやり方と結果

#4です。

#2です。

#2です。

企業で統計を推進する立場の者です。

変数１の「分散」から標準偏差は 0.354

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング