
公表されている調査結果報告書から相関分析等をすることによって、構造を把握したい。
例えば、x、y、zについて満足、普通、不満足という回答を得て、それぞれに3点、2点、1点を配点して、
それを地区別に集計して平均した数値と、被説明変数についても地区別に集計して平均した数値が、表1として
公表されていた場合。
(もちろん個別のサンプルについての生データを得ることが難しいので、このような公表データで分析をして、
その構造を把握するとともに、今後の改善に役立てたいと思っています。)
x、y、z間の単相関係数の状況
被説明変数とx、y、zの相関の状況
および重回帰分析
を試みたいと思っています。
この場合の、相関分析、重回帰分析などの統計分析を行う場合の問題点、課題、解決方法、留意点などについて、教えてください。
また、このようなことについて、いい本があれば教えてください。
調査結果報告書 表1
***************************************************************
* 項目 * 被説明変数 * x満足度 * y満足度 * z満足度 * 調査者数 *
***************************************************************
*A地区* 15 * 3.5 * 2.1 * 1.3 * 60 *
***************************************************************
*B地区* 13 * 2.5 * 2.9 * 3.3 * 30 *
***************************************************************
*C地区* 8 * 1.5 * 2.0 * 2.3 * 10 *
***************************************************************
データに基づく現状分析と改善方策の策定を目指す、文系の統計初心者(経営コンサルタント)より
A 回答 (2件)
- 最新から表示
- 回答順に表示
No.2
- 回答日時:
> サンプル数は幾つ以上あれば説得力があるのでしょうか。
これはパワーアナリシスについて学ばなければならない内容で、一概に「~という場合に**だ」ということはいえないのです。ただ、サンプルサイズが大きければ(例えば100とか200とか)だと、たとえ小さな相関係数であっても「統計的には有意である」という結論が得られます。重要なことは検定の結果である前に、実質的な価値があるかどうかです。r=0.10で有意だったとしても、相関関係はないわけですからね。
> クロス集計データを使う場合の留意点は何か。
質問にあるのはクロス集計表といえなくもありませんが、単なる表ですね。通常とか普通というのが難しい表現ですが、クロス集計といったら普通は計数データがセルに入力されているようなものをいいます。
これは単に平均をまとめているだけですから、ここからできるのは平均がどうかという考察だけでしょう。
重回帰分析をはじめとする多変量解析のサンプルサイズについては色々と議論されていますが、100件くらいでも十分なこともありますし、50件でも、20件でも問題にならないこともあります。要するに一義的に決まるものでもなく、これだけあれば十分というガイドライン的な助言はそう簡単にできるものではないのです(少なくともそれはリサーチデザインの問題)。
No.1
- 回答日時:
このようなデータから相関係数を計算することも、重回帰分析することも無意味に近いでしょう(無意味というのは、実質的に重要な知見が得られないということです)。
もっとも地区が少なくとも20地区とかあるのであれば、相関係数や重回帰分析をしてもいいでしょうが、たった3つのデータでは。。。データをプロットしてみて、そこから何か考察するくらいしかないでしょう(^_^;)

backsさん
回答ありがとうございます。
問題は、サンプル数がどれだけあればよいか、ということですね。調査結果報告書にはいくつかの表が示されています。どの程度のサンプル数のもの使ってみるかということでしょうか。
統計に詳しい方にお聞きしたいのは、より深くお尋ねしたいことは、
(1)
サンプル数は少なくとも、相関分析をした結果において、有意差あり( * または ** と判定)とされればよいとも言えるとも思いますが、サンプル数は幾つ以上あれば説得力があるのでしょうか。統計学的には。単相関分析においては。
(2)
表1のような数量クロス集計データを使う場合の留意点は何か。
(3)
(私が持っている統計に関する本を調べてみると)重回帰分析にする場合には、サンプル数は、説明変数の数+2以上が必要であるとありました。(その本では、実際上は+3以上のサンプル数では重回帰分析をするとありました。)それに該当する表について分析すればよいと思いますが、留意点、課題等について。
当初の質問に加えて、教えていただければ幸いです。
よろしくお願いします。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
N/Rとは何の略
-
この場合中央値は56になるので...
-
統計学的に信頼のあ有効率は、...
-
エクセルで度数分布表やヒスト...
-
SASでカイ二乗値を求めるには
-
フォルダからのデータ抽出方法...
-
正規化についてお聞きしたいで...
-
クロス集計の数量データによる...
-
統計のデータ割付について。
-
心理学で学んだこと、人間関係...
-
フジテレビの第三者委員会では...
-
ココイチはなぜインドに出店し...
-
リサーチ結果掲載のサイトに関して
-
地質調査(ボーリング)は何箇...
-
統計として50人のクラスの満足...
-
探偵という職業について
-
ネットワークデータの衝突回避...
-
マーケティング テスト範囲のプ...
-
日本生命貯蓄型生命保険について
-
どうも借金を背負わせたいよう...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
N/Rとは何の略
-
統計のデータ割付について。
-
【Excel質問】別シートにある複...
-
「重み付け」 と 「カイ二乗検...
-
FDAのデータの入手方法
-
指定した値以上の中で最小値を...
-
フーリエ変換をすることにより...
-
eKYC(Povo、メルカリ、ヤフオク...
-
データを漢字に直すと何になる...
-
統計学的に信頼のあ有効率は、...
-
主成分分析と数量化第3類、ど...
-
limitについて
-
日本人男性(20〜40代)の平均身...
-
データ容量が重いファイルについて
-
MIDI タイムボカンメドレー ★ド...
-
正規化についてお聞きしたいで...
-
データの分析の問題で、元ある...
-
サンプル調査について教えてく...
-
統計解析ソフトRのエクセルデ...
-
主成分分析について
おすすめ情報