プロが教える店舗&オフィスのセキュリティ対策術

タイトルの通り、統計を知らない私が統計学的に証明しなければならない立場となりました。
今まで、エクセル-アドイン-分析ツール-基本統計量を利用してデータを見ることはありました。
以前「t検定?」やり方を聞いたことがあったのですが、何のためにやるのか理解していなかった私は、なんために、何を行ったのか?頭に残っていません。

~データ~
同一の母集団30名を検討します
A群:生活指導なし1年後:腹囲変化(cm)2007→2008年比較
B群:生活指導あり1年後:腹囲変化(cm)2008→2009年比較

30名分の腹囲変化量を降順で並べ、グラフで比較すると
B群に腹囲の増加抑制・減少効果があったように見えます。

このことを統計学的に「生活指導の効果」を検証したいです。

(1) 最初は30名の腹囲変化量から、増加・減少・不変の3群に分けて検証するのか?と思いました。だとしたら、どのように行えばいいのでしょう

(2) その後、減少群の中には1cmの減少もあれば15cmの減少もある。これを1まとめに「減少」としていいのか?と素人的な疑問が出てきました。この疑問は解消せず、統計というものを行うのでしょうか?

(3) かつ、30名は同一人物(年齢は違うけど)が引っかかってきました。
  同一ではない母集団なら腹囲増減を降順で並べて、傾向をみることはありだと思うのですが、同一人物なので、一人一人の変化をみるべきなのでしょうか?

と、悩み始めたら、結局何から手をつけていいのか分からなくなってきました。何かきっかけになれば…という思いで「質問」となりました。

最後まで読んでいただきましてありがとうございました。

A 回答 (3件)

ANO.2で



> 対応のある二群の差を比較したかったわけですね。

と書きましたが、今見直してみると勘違いしてしまったようです。
その場合は、上半分無視してください。
    • good
    • 0
この回答へのお礼

ありがとうございます。
おかげさまで、何もかも解決できました。

少しですが、以前より知識も増え
おっしゃっていることが分かるようになりました。
きっかけをいただきまして、大変感謝しています。

お礼日時:2010/01/11 09:45

> 抽出された30名のうち、指導しなかった1年後と指導をした1年後の腹囲を比較・検討します。

と言えば…。

対応のある二群の差を比較したかったわけですね。
それならば、

被験者  試験開始前  試験開始後   後-前
 1     μ(1)   μ(1)+α+ε(1)  α+ε(1)
 2     μ(2)   μ(2)+α+ε(2)  α+ε(2)
 :
 :
 30    μ(30)  μ(30)+α+ε(30)  α+ε(30)
()内の数字は添え字

というモデルになり、後-前について0未満かどうかを検定することになります。
検定方法は誤差が正規分布に従うならば
http://aoki2.si.gunma-u.ac.jp/lecture/Average/Me …
の方法で、そうでなければ
http://aoki2.si.gunma-u.ac.jp/lecture/Average/mp …
の方法で検定することになるでしょう。


> 正直な感想として「よく分からない」です。

ANo.1だけの説明で理解できるとは思ってはいなかったのですが、わかりにくい説明ですみません。
さらに詳しく書こうとすると数式だらけになってしまい、イメージだけにするとわかったようなわからないような説明になるので、難しいところです。
とりあえず、世の中には色々な検定方法があるけど、検定方法によって前提条件が違うということを理解することと、統計的仮説検定の基本だけは理解しておくだけでも十分だと思います。

> ・・・ですが、ハードルが高いですね(笑)

と書かれているように、原理まで理解しようとすると一苦労です。
数式をみるのが苦手な人にとってはかなりの苦行になるでしょうね。
    • good
    • 0
この回答へのお礼

ありがとうございます。
実は今週末に、学術発表をします。
その時に、私がどのような指導をしたのか?の質問には自信がありますが、
統計的にどうだ?! と突っ込まれることが想定できます。

今のままではあぶない!ということが分かりました(笑)
困りましたねぇ…。冷や汗が出てきましたが、発表前で助かりました。

ラストスパート!がんばります。

お礼日時:2010/01/05 00:17

最初に用語について指摘します。



> 同一の母集団30名を検討します

ここは、「同一の母集団に属する30名について、生活指導ありとなしに分けて検討する」というように書くべきです。
あなたの書き方ですと、全ての例について検討することになるので、検定をする意味がなくなってしまいます。


さて質問に対する回答ですが、まず(1)と(2)については、増加・減少・不変で分けるということは、それだけ情報を捨てることになりますので、変化量そのものを使って解析を行ったほうがよいと思います。
次に(3)については、一人ずつ前後の値が得られていると思いますので、この変化量を使って解析することになります。

得られるデータは、

被験者  試験開始前  試験開始後
 1     μ(1)   μ(1)+ε(1)
 2     μ(2)   μ(2)+ε(2)
 :
 m     μ(m)   μ(m)+ε(m)
 m+1    μ(m+1)  μ(m+1)+ε'(1)
 m+2    μ(m+2)  μ(m+2)+ε'(2)
 :
 m+n    μ(m+n)  μ(m+n)+ε'(n)
()内の数字は添え字

というようにモデル化できると思います。
最初のm人が生活指導なし、後のn人が生活指導ありのグループでm+n=30です。


解析するには、α()は被験者間の差がないこと、ε(), ε'()は位置が異なる以外同一の分布に従いかつ独立であることという仮定が必要となります。
つまり、試験開始前の腹囲や年齢或いは性別等で、変化量やバラツキに違いがあってはいけないということです。
(例えば腹囲の大きい人の方が小さい人に比べて腹囲が下がりやすいとか、ばらつきやすいとかがあってはいけないということです)
上のモデルを書き直せば、

被験者  試験開始前  試験開始後
 1     μ(1)   μ(1)+ε(1)
 2     μ(2)   μ(2)+ε(2)
 :
 m     μ(m)   μ(m)+ε(m)
 m+1    μ(m+1)  μ(m+1)+α+ε(m+1)
 m+2    μ(m+2)  μ(m+2)+α+ε(m+2)
 :
 m+n    μ(m+n)  μ(m+n)+α+ε(m+n)

となります。


ここで知りたいのはα<0かどうかなので、一人ずつ前後の差をとれば、

被験者  後-前
 1    ε(1)
 2    ε(2)
 :
 m    ε(m)
 m+1   α+ε(m+1)
 m+2   α+ε(m+2)
 :
 m+n   α+ε(m+n)

となり、これについて二群の平均値(或いは代表値)の差の検定を行えばよいことになります。
検定方法は下記のサイトを参考にしてもらうとして、平均値か代表値のどちらを検定すればいいかという問題があります。
これについては、誤差εの分布が正規分布に従うか否かで決まります。
誤差が正規分布に従うなら平均値の差を、従わなければ代表値の差を検定することになります。

データ採取の前にこれらの仮定が正しいかどうかを確認する必要があります。
もちろん既にわかっているならその必要はありません。
もし、データ採取済みであった場合、追加検討できるならした方がいいでしょう。
できそうになければ、得られたデータから仮定が間違い出ないということを確認する必要があります。


二群の平均値の差の検定方法
http://aoki2.si.gunma-u.ac.jp/lecture/Average/t- …
二群の代表値の差の検定方法
http://aoki2.si.gunma-u.ac.jp/lecture/Average/U- …
    • good
    • 0
この回答へのお礼

ありがとうございます。

正直な感想として「よく分からない」です。
丁寧に教えて頂けていることは分かるのですが…。
現在この件について集中して学習しているので、後で読み返したら
「なるほどね!」 と分かる日が来る!と信じることとします。

最初のグループ分けが多くの方を混乱させてしまうことが分かってきました。
統計学の先生に聞いた時も「?」という顔をしていました。

抽出された30名のうち、指導しなかった1年後と指導をした1年後の腹囲を比較・検討します。と言えば…。


(例えば腹囲の大きい人の方が小さい人に比べて腹囲が下がりやすいとか、ばらつきやすいとかがあってはいけないということです)

おっしゃるとおりです。

今まで、経験やカンで業務をこなしてきました。自信もあります。
しかし、それを客観的に評価する手立てを身につけるため
統計について学んでいきたいと思っています。
・・・ですが、ハードルが高いですね(笑)
ありがとうございました。

お礼日時:2010/01/04 14:17

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!