アプリ版:「スタンプのみでお礼する」機能のリリースについて

不適切な表現に該当する恐れがある内容を一部非表示にしています。

公表されている調査結果報告書から相関分析等をすることによって、構造を把握したい。

例えば、x、y、zについて満足、普通、不満足という回答を得て、それぞれに3点、2点、1点を配点して、
それを地区別に集計して平均した数値と、被説明変数についても地区別に集計して平均した数値が、表1として
公表されていた場合。
(もちろん個別のサンプルについての生データを得ることが難しいので、このような公表データで分析をして、
その構造を把握するとともに、今後の改善に役立てたいと思っています。)

x、y、z間の単相関係数の状況
被説明変数とx、y、zの相関の状況
および重回帰分析
を試みたいと思っています。

この場合の、相関分析、重回帰分析などの統計分析を行う場合の問題点、課題、解決方法、留意点などについて、教えてください。
また、このようなことについて、いい本があれば教えてください。

調査結果報告書 表1
***************************************************************
* 項目 * 被説明変数 * x満足度 * y満足度 * z満足度 * 調査者数 *
***************************************************************
*A地区*  15    *  3.5  * 2.1 * 1.3 * 60 *
***************************************************************
**  13   *  2.5  * 2.9 * 3.3 * 30 *
***************************************************************
*C地区*   8   *  1.5  * 2.0 * 2.3 * 10 *
***************************************************************

データに基づく現状分析と改善方策の策定を目指す、文系の統計初心者(経営コンサルタント)より

A 回答 (2件)

> サンプル数は幾つ以上あれば説得力があるのでしょうか。



これはパワーアナリシスについて学ばなければならない内容で、一概に「~という場合に**だ」ということはいえないのです。ただ、サンプルサイズが大きければ(例えば100とか200とか)だと、たとえ小さな相関係数であっても「統計的には有意である」という結論が得られます。重要なことは検定の結果である前に、実質的な価値があるかどうかです。r=0.10で有意だったとしても、相関関係はないわけですからね。

> クロス集計データを使う場合の留意点は何か。

質問にあるのはクロス集計表といえなくもありませんが、単なる表ですね。通常とか普通というのが難しい表現ですが、クロス集計といったら普通は計数データがセルに入力されているようなものをいいます。

これは単に平均をまとめているだけですから、ここからできるのは平均がどうかという考察だけでしょう。

重回帰分析をはじめとする多変量解析のサンプルサイズについては色々と議論されていますが、100件くらいでも十分なこともありますし、50件でも、20件でも問題にならないこともあります。要するに一義的に決まるものでもなく、これだけあれば十分というガイドライン的な助言はそう簡単にできるものではないのです(少なくともそれはリサーチデザインの問題)。
    • good
    • 0

このようなデータから相関係数を計算することも、重回帰分析することも無意味に近いでしょう(無意味というのは、実質的に重要な知見が得られないということです)。

もっとも地区が少なくとも20地区とかあるのであれば、相関係数や重回帰分析をしてもいいでしょうが、たった3つのデータでは。。。

データをプロットしてみて、そこから何か考察するくらいしかないでしょう(^_^;)
「クロス集計の数量データによる相関などの分」の回答画像1
    • good
    • 0
この回答へのお礼

backsさん

回答ありがとうございます。

問題は、サンプル数がどれだけあればよいか、ということですね。調査結果報告書にはいくつかの表が示されています。どの程度のサンプル数のもの使ってみるかということでしょうか。



統計に詳しい方にお聞きしたいのは、より深くお尋ねしたいことは、

(1)
サンプル数は少なくとも、相関分析をした結果において、有意差あり( * または ** と判定)とされればよいとも言えるとも思いますが、サンプル数は幾つ以上あれば説得力があるのでしょうか。統計学的には。単相関分析においては。

(2)
表1のような数量クロス集計データを使う場合の留意点は何か。

(3)
(私が持っている統計に関する本を調べてみると)重回帰分析にする場合には、サンプル数は、説明変数の数+2以上が必要であるとありました。(その本では、実際上は+3以上のサンプル数では重回帰分析をするとありました。)それに該当する表について分析すればよいと思いますが、留意点、課題等について。

当初の質問に加えて、教えていただければ幸いです。

よろしくお願いします。

お礼日時:2010/01/26 21:35

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!