
No.5ベストアンサー
- 回答日時:
#4です。
>平均の差が明確な場合はt検定などを行う意義ってあるのでしょうか。
全くありません。多くの論文では検定など行わずに結論を述べています。殆どの学会がそれでも査読を通しています。
検定は、「もしかすると偶然こんな差が出るかもしれない」「こんな結果はたまたまかもしれない」という危惧があるときに、偶然誤差と比較する形で行われ、「偶然誤差であることは確率的には極めて小さい」という結論を導くために用いられます。
よって、差が明確に出ていて、偶然そんなことが起きることはあり得ない場合は検定は不要です。
そのためには、まずは観測の場に影響する系統誤差(5M1Eによる誤差)を徹底的に排除し、次に偶然誤差が薄まるように繰り返し数を増やせば※、検定など行わずとも結論を導くことができます。
※偶然誤差の期待値(平均値)は0なので、観測を繰り返しを行えば、偶然誤差の影響は薄まります(ゼロに漸近します)。
※ただ、検定統計量の分母は、s/√nなので、やみくもにn数を増やすと、分母→0、検定統計量→∞となり、検定は常に有意になります。つまり、些細な差でも、n数を増やすと検定上は有意になります。
逆に言えば差が明確なのですが、私がたかだか0.5度の解熱作用のある新薬を開発したとして、あなたはそれを買いたいですか?そんなの放っておいても熱は下がりますよね。そこで、これ以上の差をもって効果とみなす、という「効果量(effect size)」を併記しないと認めないという学会も多いです。それは、自分の主張を通すために、n数を増やして差があるように見せかけるために検定を悪用する著者がいるからです。
話がややこしくなりましたが、検定は「怪しい話の証拠(エビデンス)として使われる」ということですので、「怪しくない話」では検定は不要です。例えば、コロナウィルスによって肺炎を発症するという事象に検定が必要だという人はいません。それは何万もの症例という観測上の証拠があるからです。
No.4
- 回答日時:
#2です。
統計解析の事例として用いるデータは、
・多くの統計のテキストが出版社のホームページにデータを保存しダウンロードできるようにしています。
・各省庁のホームページにはオープンデータと呼ばれる統計データが公開されています。ちなみに下記は、コロナ感染者数等のオープンデータです。
https://www.mhlw.go.jp/stf/covid-19/open-data.html
この回答へのお礼
お礼日時:2021/07/31 16:33
ご丁寧にありがとうございます!参考にして再度研究対象から見直して、再度t検定を行いました。そこでなのですが、平均の差が明確な場合はt検定などを行う意義ってあるのでしょうか。再三の質問で申し訳ございません。。
No.3
- 回答日時:
#2です。
まずは、横軸:睡眠時間、縦軸:身長の散布図を描いてみると良いです。
あるいは、睡眠時間は何時間という計量値で無く、長・中・短というようなカテゴリ値で、散布図が描きにくいのでしょうか。
それでも身長の方が計量値なら、箱ひげ図を並べた図は描けますよね。
それは実施済みで、相関が見られたから検定に進んだのでしょうか。そうであれば、お節介でした。すみません。
この回答へのお礼
お礼日時:2021/07/31 12:09
とても丁寧な説明ありがとうございます!なにぶん統計初心者のため、お見苦しい内容で申し訳ないです。
恐縮なのですが、こうした統計で用いるデータなどが載っているサイトや、データの探し方を教えていただくことは可能でしょうか。
No.2
- 回答日時:
企業で統計を推進する立場の者です。
ご質問の趣旨から逸れてしまいますが、大事な研究だと思いますので、老婆心でコメントします。
グループに分けて、それぞれ所定の時間だけ睡眠を取ってもらった訳ではないですよね。
グループに分けて、それぞれ所定の時間だけ睡眠を取ってもらったというコホート研究ではなく、後付けで調べたというのであれば、検定方法が違います。
もし、実験のように原因に介入しているのであれば、ご質問のように結果が異なることを検定すれば良いですが、この研究は後付け研究で、既に結果が出ているのですから、その原因となる仮説を検定すべきです。
つまり、身長が高い群と、身長が低い群に分けて、睡眠時間がどうだったかの比較をすべきです。
また、標本数が各4とは、4年分の4ですか。
AグループBグループに何人含まれるのでしょう。その平均の平均だから均(なら)されてしまって差は出にくいですよね。
また、中学生くらいの伸び盛りで一番ばらつきが大きな年代をサンプルにしていませんか。
4年分のデータは全て別人ですか。男女は同数ですか。
要は、各種の誤差要因はコントロールされていますか。
何を確かめたいのかで、統計解析の設計が決まります。
研究課題に関して、それを誤差に埋もれさせることなく、系統誤差を排除するように設計しないと、「差があるとは言えない」という結果になると思います。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
【困っています!エクセルでのt...
-
対応のあるt検定の結果の書き方
-
数学の微分の応用の問題につい...
-
自由度の3.84と6.63の出し方を...
-
エクセルのグラフから半値幅を...
-
(1)2xの2乗−5x−3≧0 (2)xの2乗−2...
-
全商推薦について教えてください。
-
卒業論文のアンケートの数について
-
【統計】有意に「高い」?「低...
-
XRDその他のグラフ作成について
-
標本が大きくなると帰無仮説は...
-
アンケートの集計分析の基礎(...
-
高校 数学 aを実数の定数とする...
-
下の対数表示のグラフから低域...
-
統計について
-
一元配置分散分析のp値が0になる
-
EXCELにてローパスフィルタを作...
-
電子の比電荷
-
応答速度とサンプリング数の関係
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
EXCELにてローパスフィルタを作...
-
エクセルのグラフから半値幅を...
-
検量線の決定係数について
-
下の対数表示のグラフから低域...
-
最小二乗法を反比例の式を元に...
-
線形なグラフとはひとくちに言...
-
死傷者数と死者数の違いって何...
-
ノンパラメトリック検定の多重...
-
【統計】有意に「高い」?「低...
-
統計について
-
パイロットサンプルって何ですか?
-
エクセルの統計でχ二乗検定の結...
-
検定公差を教えてください!
-
検定統計量の値がマイナス
-
データ点を線で結ぶ場合と結ば...
-
アンケートの集計分析の基礎(...
-
曲面z=log(x^2+y^2)のグラフの...
-
心理機能診断をしたのですが、...
-
理科のグラフで、直線と曲線の...
おすすめ情報
文章中の家庭→仮定です。申し訳ないです。