プロが教える店舗&オフィスのセキュリティ対策術

以下のような場合、「有意に高い」というのか「有意に低い」というのかどちらなのでしょうか?

(例)
9名のマラソン選手にマラソン走行前後で、気分の明るさを1~10の10段階で回答してもらうアンケートを実施し、以下のような結果を得たとします。

(走行前)→(走行後)
Aさん:9 → 10
Bさん:8 → 9
Cさん:8 → 9
Dさん:7 → 8
Eさん:6 → 5
Fさん:3 → 4
Gさん:2 → 3
Hさん:1 → 2
Iさん:1 → 2

次に、走行前と走行後のデータ群に統計学的な差があるかを調べるために検定を行います。ここではデータが順序尺度なのでWilcoxon符号付順位和検定を行います(α=0.05)。
結果、p<0.05(0.039)で走行前後のデータ群は有意に異なるという解析結果が得られます。

分からないのはここからです。

走行前と走行後の中央値は、走行前:6, 走行後:5 で、走行後の方が低いです。
つまり走行前よりも走行後の方が「有意に低い」という解釈をするのでしょうか?

しかし、走行後に低くなっているのは1名のみで、残り8名は上昇しています。
つまり走行前よりも走行後の方が「有意に高い」という解釈をするのでしょうか?

有意差検定は「異なる」ということを示しているだけで「高い」「低い」を言っていないのは分かります。そうではなく、解釈をどうすべきか分からないので教えて下さい。

宜しくお願いします。

A 回答 (3件)

別におかしなことではありません。


対応のあるデータなのですから、前後のデータのそれぞれの中央値を求めた場合そういうこともあるでしょう。
ご質問の例では、前後の差の中央値を求めるべきです。
    • good
    • 1

 データを比較するには、個々ではなく、集団として把握し、全体を考えます。


 全体の性質を表すには、統計学では、代表値を利用します。
 代表値で、一番利用されるのは、平均値です。もっとも、利用している方は、代表値と意識しません。ですから、なんでもかんでも平均したりします。算数と国語の平均点で、成績の順位を決めたりします。しかし、リンゴとミカンの所持個数の平均、なんぞは間違いでしょう。ミカンを高級メロンにすれば、そんな平均の比較の間違いは明確です。すなわち、平均値で比較する場合、異質のものを平均するのは、統計学的(学問的)に誤りですが、世間では通用しています。
 中央値も代表値の一つです。中央値も平均値も、データ数が十分なら、その付近の近くのデータ数が多い、という特徴があります。示されたデータでは、そのような特徴は見られません。
 これは、
1)データ数が不十分、か
2)データを恣意的に集めた、ことが考えられる
 いずれも、代表値の比較には、不適切です。

この回答への補足

たびたびありがとうございます。

中央値なのは、データの特徴がどうかなど関係なく、

「順序尺度でwilcoxon検定、よって中央値表記」という流れです。

また重ねて言いますが、データは例ですので当然恣意的です。。。

ありえそうな分布で示すと分かりづらいため極端なデータ群を作っているのです。

「このような場合、どうするか」という話ですから。

補足日時:2012/02/22 15:01
    • good
    • 1

 このデータで、中央値で比較するのは、間違い。


 データそのものにも、疑問が。というも、明るさで、9の人と1の人がいるとは。また、一般的には、平均値または中央値の人が多いハズ。すなわち、サンプリングが問題。おそらく恣意的。
 さらに、中央値としているEは例外的。

 どうしてもなら、高くなった人が8人、低くなったのが1人。だから高くなった、と結論したい。が、先に述べたように、学会なら「サンプリングに問題」と。また、同点の人がいないのも不自然。

この回答への補足

回答いただきありがとうございます。

>このデータで、中央値で比較するのは、間違い。
??

>サンプリングが問題。おそらく恣意的。
実際のデータではないです。「例」とかいたようにポイントを分かりやすくするための「例」なのですが。。。実際に収集するのであればもう少し計画を立ててから行いますので、このような極端なことには当然ならないと思います。

ただ実際に症例数が十分に多い場合でもこのようなケースが
発生したのを見たことがあります。

そういう場合にどう解釈すべきか、という質問です。

補足日時:2012/02/22 09:43
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!