社会科学論文の統計検定方法について

Question

皆さんこんにちは、今、修士論文まとめの真っ只中で、今週末までに1stドラフトを書き上げなければならずあせっています。
お忙しいところすみませんが、統計関係でちょっと急ぎで教えていただけたらありがたいです。。
本来、Proposalの段階から統計処理手法をきちんと決めておかねばならなかったのですが、時間が間に合わず、見切り発車をした関係で、今大変になってしまいました。
組織コミュニケーションの現状とその改善策を自社を事例にまとめる、ということで、定量調査を質問表により61名（本社6割、海外子会社4割）から入手、定性調査として、質問表のコメント欄に記述と、VP以上の6名のシニアマネジメントへのSemi-structuredインタビュー結果の記述データを合わせて、メッセージを引き出す、というのをやってます。
 統計の知識が余りに足りないことが問題なのですが、簡単な本を3冊ほど買って読んだのですが、自分のケースに当てはめることがうまく出来ず、困ってます。製薬会社に勤務している関係で、治験結果の他剤との比較で有意差があるかどうか、というあたりしか気にしてこなかったので、偏った知識になってるようです。
イギリスの大学院なのですが、担当の先生はｔ－Testを使えとおっしゃるのですが、T-testは本を読むと、2つの母集団がいずれも正規分布に従うと仮定出来る場合の平均が等しいかの検定、とあります。数式が出てくるともうわからなくて。。 
やろうとしている分析は、基本は、本社と海外子会社サンプル合計のそれぞれのファクターの結果を比較しようとしています。サンプリング方法は、テーマがセンシティブだったので、ランダム化ができず、私の知っている同僚の中で信頼できる人をセレクトし事前に依頼してもいいか確認した上でQを送ってるので、75名に送って61名、という高い回答率を得てます（60名前後を獲得するのが一番の目的）。ので、non-probability samplingなので、基本的に母集団の有意性検定につかうT-testは意味がないのですが、先生から、一応T-testをやった結果を記載し、断定せずに、定性調査結果からサポートするようにとの指示がきました。
このあたりから何をどのデータに適用するのが適切なのか、わからなくなってしまい、困っています。。 
分析内容は、
ー組織コミュニケーションの方向性（Upward, Downward, Horizontal)を全体を100％としたときの各％を書いてもらいました）％を本社、海外で、平均値を出す：本社はそれぞれ２２％、２０％、４３％、海外は２６％、２９％、３３％になりました（3つの方向性以外の方向性がある、というコメントつきで全体が１００にならないデータもあり）。これを検定するのは意味があるのでしょうか？
クロス表で結果を明示して、本社はHorizontalが多い傾向、合併で海外とのやり取りが増えたことが要因の一つと考えられる、というような
コメントでもいいように思うのですが。。
 
ーこの方向性の配分は適切と思うか（非常に適切、まあまあ適切、適切、余り適切でない、全く適切でない）
これを本社、海外で分けて回答数を比較。
本社：２；１３；１０；１２；１、海外０：１３：６：４：０　これは回答数で、各カテゴリ（非常に適切、など）をウェイト付けて計算したりはしてません。
ｔ検定を使うのならば、平均についての検定という点を考えて、ウェとづけが必要になるのでしょうか？
それともこのままエクセルで検定して問題ないんでしょうかね？　一応エクセルで、片側検定だと0.056くらいになります。
この片側、両側、というのもよくわかりません。。
このタイプの質問（Informalコミュニケーションは必要と思うか？というような）が他にもあるので、この処理をどのようにするのが
理論的に正しいのか教えていただけたらありがたいです。。
 
ー多国籍コミュニケーションをうまくいかせるコツはなにか（複数回答OKで、カルチャーギャップへの理解、マネジメントのEncouragementなどが並びます、ウェイト付けは意味がないデータ）。この場合は、クロス表で結果を示す（分散を示すのならF検定？）のみですかね？
分散を示すのはF検定、という意味もわかりにくいです。。
 
ーシンプルな質問、多国籍コミュニケーションは必要か（Yes, NO)など。この場合はPie chartで結果を示し、コメントするのみでOKでしょうか？（検定なし）
大学のDissertationガイドラインには、パイチャート、棒グラフ、・・グラフの使い方。。。とか、重回帰分析まで幅広く書いてあり、
それぞれを適切に使えば、むりやり回帰や分散分析などを使う必要はないようです。
 基本的なことばかりですみませんが、ご助言いただけたら大変ありがたいです。。T検定は平均、F検定は分散、という表現もまだ腹に落ちていません何卒ご指導いただければ幸いです、どうぞよろしくお願い申し上げます。

kgu-2 · Accepted Answer

まず、指摘したいのは、このような場でアドバイスを受けること自体が科学者として、マナー違反です。アドバイスに対しては、謝辞を書くのがマナーですが、私の氏名が分からないので、書きようが無い(あなたが)。
　次に、指導者をさしおいて、横から口出しするのは、これも研究者としてするべきでない(私が)。
　というわけで、課題丸投げを禁止していながら、もっと重要な違反をなぜ禁止しないのか不思議。関西弁で言えば、「アホとちゃうか」

　それなのに書き込んでいるのは、お節介な性質と、指導する人が統計を理解していないように感じるからです。あるいは、指導者がいない、なんぞの返答もあります(この場合は、「失礼しました」と返答を書き始める。『私のどこが悪い、質問前に立場、事情を書いておけ』と感じつつ。その上、どうなったか、を書かずに、いきなり締め切る)。
　というわけで、ご質問の書き方に、好感を持てたので、以下独り言。電車の中の独り言なら、周囲の人に迷惑でも、聞いているのは勝手。お礼も不要。

1) 2群のF検定なら、やったことがあるが、3群は多重比較になるので、やったことが無い。カイ2乗検定になるような気がする、が、これも2×3になるので未経験。
2) t検定は、2群で行う。ですから、不適。3群以上は、H検定なるものがあるとか。
　根本的には、適切、まあまあ、・・・、悪い、というのは、数字で表現しても、順番を示すだけ。順序尺度。悪いの1点を5人合計して、5点になっても適切にならない(数学では、1+1+11+1+1=5)。
 データ集めの前に、統計処理を、というのは、この点。統計処理ができるようにデータを収集する必要がある。私なら、t検定、もしくはF検定でできるようにデータ集めをする。ただし、質問の仕方を工夫する必要がある(初心者の私が思いつくくらいなので、簡単)。
　t検定は不適だが、この結果についてのソフトはあるようです。あらたな「ソフト教えて」をなさっては。SPSSかも。
3) これは2群なので入門者の教科書内。カイ2乗検定。35,5と10,10なら、有意差有り。ご確認を。例数が少ないので、イエーツの修正式を使いました。

　我田引水でずか、過去にいくつか答えてあります。学生時代に推計学の答案は白紙も同然。ですから、初心者がどこに、なぜ詰まるのかは理解しているつもりです。ですから、自分では、初心者用に分り易く書いてあるつもりです。よろしけれぱ。

kgu-2 · Answer

AさんとBさん、どちらが身長が高いか、なら測定して、0.1mmでも高い方が高い。
A群3人とB群5人では、全員を測定して、平均値を比較すれば、誰でも同じ答えになり、結論に異存はない。

　しかし、A群とB群の数に該当することが、10万人と1000万人に増えると、全員の調査は不可能。各群から抜き出すサンプリングをします。その場合、aさんとbさんが、石を3つずつ投げても、同じ人に当たる(抜き出す)ことは、まずあり得ません。すなわち、偶然に大きく左右されます。ですから、A群とB群との差はあっても、それは「20回調査をして、19回以上差がある確率と計算できるので、偶然ではない」、これが危険率5%での、有意差の意味です。

>T検定は平均、F検定は分散、
 検定の方法は、A群とB群は、同じ集団である、という仮定(帰無仮説)を立て、計算の結果、こんな差があるのは、偶然とは言えない。それは、帰無仮説が間近い、だから差がある、というのが有意差です。
　この場合、平均値で比較するのがt検定、バラつきで計算するのがF検定です。A群が90,100,110、B群が,50,100,150の場合、平均値はどちらも100ですから、t検定では有意差はありません。しかし、バラつきは大きいので、F検定ではおそらく有意差があります。この場合、F検定の結果を示せばOKです。検定は、使い方さえ間違わなければ、有意差を見出せば、それでOKなのです。

>先生から、一応T-testをやった結果を記載し、断定せずに
　t検定は、多くの人が利用しますが、実験の場合は、正規分布になるよう、あるいは想定できるように計画をたてます。しかし、社会の調査では、正規分布させるには不可能に近いものがあります。
 ですから、先生の言い分は誤りです。ただ、データについては、正規分布しているかどうかの判定法があるようなので、それで
証明してからなら、異存はありません。

>一応エクセルで、片側検定だと0.056くらいになります。
　0.056では、有意は無いので、何も言えません。

>この片側、両側、というのもよくわかりません。
 どちらが大きくなるか不明の場合は、両側を使います。
　薬を投与すると、長いと短いの2つの可能性がありますが、生存期間が長くなる(短くなる、は考えない→片側)ことだけを検定・主張したい、ときに片側を使います。

>本社：２；１３；１０；１２；１、海外０：１３：６：４：０
 これは、多重比較になりますので、初心者の私には無理。というより、私は、工夫して、こんな多重比較をするような計画組みません。
　最近は、コンピュータが発達しており、頭のいい人がやってから、「なんとか・・・」の書き込みを何度も見かけるのですが。
　と書いても、なんの解決もならないので。カイ2乗検定で、可能と思います。これは、2群の5段階ですので、2×5の多重比較に分類できるのでしょうが、やったことはありません。

>、この処理をどのようにするのが
理論的に正しいのか教えていただけたらありがたいです。。
 理論では、データを集める前に、統計処理法を考えて、が基本。私は、「なんとか」という書き込みに、いつも「救いようがない」と書き込んでいます。

社会科学論文の統計検定方法について

まず、指摘したいのは、このような場でアドバイスを受けること自体が科学者として、マナー違反です。

AさんとBさん、どちらが身長が高いか、なら測定して、0.1mmでも高い方が高い。

似たような質問が見つかりました

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング

　まず、指摘したいのは、このような場でアドバイスを受けること自体が科学者として、マナー違反です。