重要なお知らせ

「教えて! goo」は2025年9月17日(水)をもちまして、サービスを終了いたします。詳細はこちら>

【GOLF me!】初月無料お試し

年度別(4年間分)の平均身長を睡眠時間の量によってAグループとBグループに分けて、ウェルチのt検定を行ったところ画像のような結果となりました。こちらはエクセルの分析ツールで「分散が等しくないと家庭した2標本による検定」を行ったものです。
この結果だと帰無仮説「AとBの間に差がない」が棄却できないという結論にしてよろしいのでしょうか。もしくはそもそも検定の仕方などに問題があったのでしょうか。
標本数が十分にないからなのでしょうか。t検定についてぼんやりとした知識しかないです。

「ウェルチのt検定のやり方と結果」の質問画像

質問者からの補足コメント

  • 文章中の家庭→仮定です。申し訳ないです。

      補足日時:2021/07/30 16:57

A 回答 (5件)

#4です。



>平均の差が明確な場合はt検定などを行う意義ってあるのでしょうか。

全くありません。多くの論文では検定など行わずに結論を述べています。殆どの学会がそれでも査読を通しています。

検定は、「もしかすると偶然こんな差が出るかもしれない」「こんな結果はたまたまかもしれない」という危惧があるときに、偶然誤差と比較する形で行われ、「偶然誤差であることは確率的には極めて小さい」という結論を導くために用いられます。

よって、差が明確に出ていて、偶然そんなことが起きることはあり得ない場合は検定は不要です。

そのためには、まずは観測の場に影響する系統誤差(5M1Eによる誤差)を徹底的に排除し、次に偶然誤差が薄まるように繰り返し数を増やせば※、検定など行わずとも結論を導くことができます。

※偶然誤差の期待値(平均値)は0なので、観測を繰り返しを行えば、偶然誤差の影響は薄まります(ゼロに漸近します)。

※ただ、検定統計量の分母は、s/√nなので、やみくもにn数を増やすと、分母→0、検定統計量→∞となり、検定は常に有意になります。つまり、些細な差でも、n数を増やすと検定上は有意になります。

逆に言えば差が明確なのですが、私がたかだか0.5度の解熱作用のある新薬を開発したとして、あなたはそれを買いたいですか?そんなの放っておいても熱は下がりますよね。そこで、これ以上の差をもって効果とみなす、という「効果量(effect size)」を併記しないと認めないという学会も多いです。それは、自分の主張を通すために、n数を増やして差があるように見せかけるために検定を悪用する著者がいるからです。

話がややこしくなりましたが、検定は「怪しい話の証拠(エビデンス)として使われる」ということですので、「怪しくない話」では検定は不要です。例えば、コロナウィルスによって肺炎を発症するという事象に検定が必要だという人はいません。それは何万もの症例という観測上の証拠があるからです。
    • good
    • 1

#2です。



統計解析の事例として用いるデータは、
・多くの統計のテキストが出版社のホームページにデータを保存しダウンロードできるようにしています。
・各省庁のホームページにはオープンデータと呼ばれる統計データが公開されています。ちなみに下記は、コロナ感染者数等のオープンデータです。

https://www.mhlw.go.jp/stf/covid-19/open-data.html
    • good
    • 1
この回答へのお礼

ご丁寧にありがとうございます!参考にして再度研究対象から見直して、再度t検定を行いました。そこでなのですが、平均の差が明確な場合はt検定などを行う意義ってあるのでしょうか。再三の質問で申し訳ございません。。

お礼日時:2021/07/31 16:33

#2です。



まずは、横軸:睡眠時間、縦軸:身長の散布図を描いてみると良いです。

あるいは、睡眠時間は何時間という計量値で無く、長・中・短というようなカテゴリ値で、散布図が描きにくいのでしょうか。

それでも身長の方が計量値なら、箱ひげ図を並べた図は描けますよね。

それは実施済みで、相関が見られたから検定に進んだのでしょうか。そうであれば、お節介でした。すみません。
    • good
    • 1
この回答へのお礼

とても丁寧な説明ありがとうございます!なにぶん統計初心者のため、お見苦しい内容で申し訳ないです。
恐縮なのですが、こうした統計で用いるデータなどが載っているサイトや、データの探し方を教えていただくことは可能でしょうか。

お礼日時:2021/07/31 12:09

企業で統計を推進する立場の者です。



ご質問の趣旨から逸れてしまいますが、大事な研究だと思いますので、老婆心でコメントします。

グループに分けて、それぞれ所定の時間だけ睡眠を取ってもらった訳ではないですよね。

グループに分けて、それぞれ所定の時間だけ睡眠を取ってもらったというコホート研究ではなく、後付けで調べたというのであれば、検定方法が違います。

もし、実験のように原因に介入しているのであれば、ご質問のように結果が異なることを検定すれば良いですが、この研究は後付け研究で、既に結果が出ているのですから、その原因となる仮説を検定すべきです。
つまり、身長が高い群と、身長が低い群に分けて、睡眠時間がどうだったかの比較をすべきです。

また、標本数が各4とは、4年分の4ですか。
AグループBグループに何人含まれるのでしょう。その平均の平均だから均(なら)されてしまって差は出にくいですよね。
また、中学生くらいの伸び盛りで一番ばらつきが大きな年代をサンプルにしていませんか。
4年分のデータは全て別人ですか。男女は同数ですか。
要は、各種の誤差要因はコントロールされていますか。

何を確かめたいのかで、統計解析の設計が決まります。
研究課題に関して、それを誤差に埋もれさせることなく、系統誤差を排除するように設計しないと、「差があるとは言えない」という結果になると思います。
    • good
    • 2

変数1の「分散」から標準偏差は 0.354


変数2の「分散」から標準偏差は 0.422
ですから、2つの平均
 165.695 と 165.28
の差
 0.415
は「統計誤差の範囲内の差」と判断でき、「有意」と判定するのは難しいでしょうね。

なので『帰無仮説「AとBの間に差がない」が棄却できない』というのは妥当だと思います。
    • good
    • 3
この回答へのお礼

回答ありがとうございます!!

お礼日時:2021/07/31 12:01

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!