数学のカテで同じ質問をしたのですが、なかなか回答がないのでカテを変えて再投稿しました。

 研修課題で、商品イメージと商品魅力の関係を調べています。SD法で商品イメージを測り、主成分分析を行いました。
 そこで、学生時代に因子分析では因子負荷量の絶対値が0.4未満の項目は削除して因子分析を繰り返すようになど習いました。【質問(1)】「主成分分析」でも同じように項目削除→繰り返しを行うものなのでしょうか? また、二重負荷項目の扱いはどうしたらよいのでしょう?
【質問(2)】項目削除して因子分析を繰り返す理由って何ですか? 因子の妥当性だか信頼性だかが上がるから、習った記憶がありますが、“日常会話”で表現するとどういうことですか?
【質問(3)】この調査の目的は、魅力ある商品開発のために人気商品のイメージを探ることです。この動機だと、そもそも主成分分析と因子分析のどちらが適していたのでしょう・・・?
 この後、各主成分得点を説明変数、商品評価(良い―悪い)を目的変数にして重回帰分析を行います。
 ちなみに、Excelで解析しています。
 ドシロートなのにビジネス文書の中で統計プロセスを説明して行かなければならず、四苦八苦しています。親切な回答をどうかよろしくお願い申し上げます。

このQ&Aに関連する最新のQ&A

A 回答 (1件)

 SD法の選好性データ、すなわち人: i、物: j, 項目: kについて得点o[i,j,k]を収集し、イーカゲンに数値化して、それを主成分分析に掛け、多次元尺度(MDS)を適当に構成しようとしている?


 ご質問にストレートに答えるのはstomachmanには難しいし、一律に論じるのはちょっと無理な気がしますが、あえて暴論してみましょう。

 殆ど同義の質問、或いは丁度反対の意味の質問が含まれていたとすると、項目同士に強い相関が生じます。そしてそれぞれ大きい寄与率を持ってしまったりする。こんなのこそ、本来一つだけあれば良いので、せいぜい平均点でも取っておけばよい。こういう事をチェックするために共分散行列上で共通性・独自性の評価をきちんとやらなくてはならない。
 また例えば、しばしば回答者は質問それぞれに勝手に重みを付けてしまいます。どうでも良い、と思われる項目のデータはみんなテキトーに中庸の回答をし、分散が小さくなる。これを機械的に規格化すると、本来存在しないばらつきが恰も重要であるかのように見えてしまいます。ランダムなだけに結構大きい因子に化けてしまうことがあるけれど、実は情報を含んでいない。
 さて、「恣意的に項目を削るのはケシカラン」なんて言って、「0.4未満無視」という風にルール化するのに果たして意味があるのか?どのみち因子分析の基本である「線形」という仮定自体に無理があるから、(学術研究をやってるのでないならば)カンを働かせていけない理由などないように思われます。SD法なら尚更で、質問の言葉使いだけでも非線形性が違ってくる。因子分析と仰っているのがどんな手法を指しているのかは分かりませんが、主成分分析もその一種と捉えるなら、事情はどちらも同じでしょう。

 一方、折角取ったデータを捨てるのは馬鹿げている、という考え方もある。むしろ、データを階層化して解析しなおすのが有効って場合があります。例えば、第一因子が被験者の年収とほぼ同一でしかも寄与率が圧倒的に高い、なんて状況ですと「年収で決まる」以上の情報が得られない。ところが、例えば年齢層ごとに分けてそれぞれ分析してみると、寄与率が変わって「20代は価格と広告で、30代は性能と価格で、40代は広告と性能で選んでる」みたいな、それぞれの特徴が現れてくるかもしれない。全部のデータを一緒くたにしていると、こういう「非線形性」は線形のモデルでは見えてこないことがあります。
 また非線形の成分を積極的に扱うために、項目の得点の2乗、3乗を項目に追加して分析するのも手です。そうすると傾向が見えてくる場合がある。旨く行ったら、ある項目の得点p、p^2、p^3をまとめて、f(p) = Ap^3+Bp^2+Cp という形の項目と再解釈し、項目からp、p^2、p^3を除きf(p) を入れて改めて分析しなおすことができる。pよりf(p)の方がデータを旨く説明するのなら、f(p)という尺度が(暫定的に)得られたことになります。同様に複数の項目の得点の積p q を項目に入れることも可能です。どういう積(p^2とかpqとか)を含めるかを恣意的に選ぶことができるので、これはデータを適当な次元に落として散布し、睨んで考えるんですね。

 人気商品の秘密を探る!という目的だとすると、人気の要因が商品によってバラバラだったりして、こういう分析ではろくな結果が出ないことがあり得ます。例えば高級感も手軽さもそれぞれ人気の要因だったり、何でもいいけどはっきり特徴を持つ(そして好き嫌いが別れる)ことが重要だったりすると、線形モデルでは説明困難でしょう。クラスター分析で商品を分類していくとか、購買層を分類していくとか、仮説を立てて検討するとか、これと思う(非線形の)指標を導入して一緒に分析するとか、様々なアプローチで構造を探り出すのが本道であって、特定の手法にだけ依存するのは虫が良すぎるかもね。
    • good
    • 0
この回答へのお礼

ご回答ありがとうございました。

お礼日時:2002/02/24 20:37

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q因子分析の因子負荷量について

因子負荷量がよくわからないのですが、負荷量が大きいということは、その項目の重要度も大きいということでしょうか?
その因子をより説明している、と聞いた気もするのですが、説明している、というのがよくわからないんです…

5件法で聞いて5が多かったり1が多かったりすると
大きくなったりするのでしょうか?

寄与率についても曖昧な知識しかありませんので、わかりやすく教えていただけるとありがたいです。

Aベストアンサー

bon-chanさん,こんにちは.意欲的に統計法の質問をされていますね.
正統的説明はtem546さんがされていますので,その中継ぎとして,不正確ですがもう少し初心者向けの説明をしたいと思います.

因子分析を単純に言ってしまえば,「複数の変数を,更に少数の【類似した】変数群にまとめるための【視点】を提供する」となります.
例えば次の相関行列を参考にして,「科目A~D」の五つの変数を,類似したもの同士をまとめる際の視点は何かを探ります.

  ── 科目ABCDEの相関行列(架空):1 ────────
       科目A  科目B  科目C   科目D  科目E
   科目A  1.00   -0.34   0.98   -0.44   -0.24
   科目B -0.34   1.00  -0.34   0.53   0.63
   科目C  0.98   -0.34   1.00   -0.35   -0.32
   科目D -0.44   0.53  -0.35   1.00   0.54
   科目E -0.24   0.63  -0.32   0.54   1.00
  ─────────────────────────────

かなり露骨な相関行列なので因子分析を使わなくとも何とかなります.この相関行列を,数値が低いものを消して,あれこれ並べ替えてみると,

  ── 科目ABCDEの相関行列(架空):4 ────
       科目A 科目C 科目B 科目D 科目E
   科目A 1.00  0.98
   科目C 0.98  1.00
   科目B         1.00  0.53  0.63
   科目D         0.53  1.00  0.54
   科目E         0.63  0.54  1.00
  ─────────────────────────

となり,「科目A&C」と「科目B&D&E」という二つの「視点」がみつかりました.この「視点」こそが,因子分析における「因子」です.

因子分析の本来の目的は「因子は何個あるのか?」を探ることでした.無論,一番上の相関行列を見て,「いや,例え相関係数が0.6であっても,両者は違うんだっ!」とこだわりさえすれば「科目B&D&E」は同じ因子にはならないでしょう.この辺は分析者の主観によります.
やがて因子分析を使う人達は,「因子は何個?」という目的だけに満足できずに「それぞれの因子の【内容】についても知りたい」という少し贅沢な要求を出してきました.

この要求は統計を実践で使う人から提出されたものですが,理論家からすれば「それは本来の使い方じゃないから厳密には内容を特定は出来ないんだがなあ」と思わせるものです.とはいえ,理論家は実践家に対してアドバイスを与えます.「因子負荷量に注目すれば因子の内容を(ある程度)特定できるよ(,絶対的じゃないけどね)」と.

一番最初の相関行列を因子分析にかけます.

  ─────────────────────────
     主因子法・バリマックス回転後の因子負荷量
           因子1  因子2  共通性
       科目A -0.20   0.98  1.00
       科目C -0.20   0.97  0.98
       科目B  0.84  -0.17  0.74
       科目D  0.75  -0.29  0.65
       科目E  0.87  -0.09  0.77
       固有値  2.12   2.01
       寄与率 42.36% 40.26%
     累積寄与率 42.36% 82.62%
  ─────────────────────────

このような結果になります.この因子分析結果では二因子解を採用しています.
因子負荷量とは何か? 少し間違った言い方をすれば「因子と項目との間の【相関係数】」……そう考えてもらって構いません.少なくとも直交回転における因子分析ではこの考えはそれほど間違っていないと思います(正確な解釈はtem546さんの説明を参考にして下さい).

では上記の結果から「因子1」と「因子2」の内容を特定しましょう.このままでは特定化できないので以下の情報を提供します(なお上記データは全て架空です).

・科目A:数学 科目C:理科
・科目B:英語 科目D:国語 科目E:社会

いま,「因子2」というのは「数学と理科」科目の項目と,非常に関係が強い(高い相関係数).因子負荷量からそれが読みとれますね? 因子負荷量というのは「重要度」というよりは「関係の強さ」と考えてもらった方が分かりやすいと思います.
因子というのは,関連する複数の項目(数学と理科)に「共通する要素」なわけですから……数学と理科の共通の要素とは何でしょうか? まあどのような名称を与えるかは分析者の命名センスにかかっていますので,ここでは「理系的学力」とします.結果,「因子2=理系的学力」となります.同様に「因子1=文系的学力」となるでしょう.

とりあえず,因子負荷量に関して,使い方に関連した部分だけ簡単に説明させてもらいました.以上の説明を読んでもらって,改めてtem546さんの説明を読んで下さい.私が誤魔化している部分をより正確に説明していらっしゃいます.

最後に,一番最初の相関行列からの説明でわかるように,因子分析というのは「相関係数」を元にしています.
相関係数というのは御存知の通り,一つの変数がどうこうではなく,【二つの変数間の関係】を示しています.

>5件法で聞いて5が多かったり1が多かったりすると
>大きくなったりするのでしょうか?

【直接的には】なりません.
あくまでも二変数関係に注目するものですから,一つの変数が5に集中したからといって因子負荷量が大きくなったりするわけではありません.
ただし……ある変数Aがたいてい5であり,別の変数Bがたいてい5である場合,「AとBとには同じ5になろうとする関係だ」となります.この意味で間接的に「5が多ければ……」因子負荷量が大きくなることがあるかもしれません(これは自分で考えてみて下さい).

bon-chanさん,こんにちは.意欲的に統計法の質問をされていますね.
正統的説明はtem546さんがされていますので,その中継ぎとして,不正確ですがもう少し初心者向けの説明をしたいと思います.

因子分析を単純に言ってしまえば,「複数の変数を,更に少数の【類似した】変数群にまとめるための【視点】を提供する」となります.
例えば次の相関行列を参考にして,「科目A~D」の五つの変数を,類似したもの同士をまとめる際の視点は何かを探ります.

  ── 科目ABCDEの相関行列(架空):1 ─────...続きを読む

Q因子分析で(有効な?)因子負荷量が重なる時

いつもお世話になっております。

因子分析をしている際に、因子負荷量で因子グループを分けていく作業中、「.400」を目安に区切っていくと理解しておりますが、添付の画像のように両方とも「.400」を上回っている場合は、どのように解釈すればよろしいのでしょうか?

そもそも因子負荷量が「.400」以上に両方なるのがおかしいなど、アドバイスを頂けたら幸いです。

たびたび見かけることが有るので、解釈をどうすればよいか困っております。

今後ともよろしくお願いいたします。

Aベストアンサー

もっとも単純な方法としてはその項目を削除することです(常套手段)。あるいは、より因子負荷量が高いほうの因子に含めるとすることですね。

私の知るうちで、最も適切な対処法というものは今のところありません。例えば、けっこう前の論文で

狩野「構造方程式モデリングは因子分析、分散分析、パス解析のすべてにとって代わるのか?」行動計量学 29巻2号 2002

には項目を削除するのがもったいないけど常套手段だと述べていますね(^_^;)

Q因子分析の因子抽出方法と回転方法

いつもお世話になっております。
私は、経営学の修士学位請求論文に取り組んでおります。論文のジャンルはマーケティングです。
現在、400サンプルのアンケートを実施して、因子分析を中心に進めているのですが、因子抽出方法や回転方法に関して疑問に思っております。
主因子法とプロマックス回転でいくつか分析をしているのですが、同じアンケートでも、場合によっては、例えば主因子法バリマックス回転だったり、重みづけの無い最小2乗法とプロマックス回転など、同じ論文(研究)内で、因子抽出方法や回転方法をコロコロと都合よく変えてしまって自分の導きたい結論(仮説通り)に持って行って良いのでしょうか?
そもそも、因子グループの命名が都合よくやってます。

どなたか、アドバイスを頂けたら幸いです。

Aベストアンサー

>因子抽出方法や回転方法をコロコロと都合よく変えてしまって自分の導きたい結論(仮説通り)に持って行って良いのでしょうか?
ダメです。
データの性質上やむをえない場合や特別な仮定をおける場合を除いて、統計手法は一貫しているべきですし、「これがベストだ」と言えるものを選ぶべきです。
同じデータを使っているのに統計手法が変わっていたら、口頭試問でまず突っ込まれます。
そのときに「こうすれば仮説を支持するからです」なんて答えたら、指導教授が泣きますよ。

因子グループの命名(解釈)は自分でやるものですから恣意的になりがちなのは仕方がないです。
ただ命名を優先するあまり、その命名に不都合な項目が入っているのを無視してはいけません(一個ぐらいならスルーも可ですが)。

Q因子分析の因子得点なんですけど。。。--;

こんにちは。
因子分析を行い、因子が2つ見つかりました。
そして、1因子と2因子の、因子得点を出したんですけど、いろんなところに、それは普通の変数と同じように扱えばいい、とは書いてます。
それが、よく分からないんです。
たとえば、性別とか地域とかの差が因子にどういう影響を与えているのかが知りたいんですけど、どうすればいいでしょうか。
もし、T検定をするんだったら、因子得点2つを従属変数に、そして、性別を独立変数にとか、のふうに入れればいいということですか????????
教えてください~~~。

Aベストアンサー

 補足に対する回答です。

 「どういじるのか?」と聞かれましても、当該の変数についてやりたい分析をするとしかお答えできないのですが・・・。

 例えば、性別でt検定を行いたいのでしたら、独立したサンプルのt検定で、グループ変数に性別、検定変数に2つの因子の変数を入れて分析すればよいと思います。

 何だかあまり回答になっていないような気もしますが(^^;

QSPSSによる因子分析を行いましたが、因子数が決定出来ず、困っています

SPSSによる因子分析を行いましたが、因子数が決定出来ず、困っています。
ある画像を見て、質問紙調査で答えてもらう方式です。画像数は58枚なので、項目数は58項目になっています。一つの項目につき、3つのイメージにについてそれぞれ5件法で答えてもらうため、この3つの結果を合計したもので一つの項目としています。(過去の先輩の卒業論文でそうしていたため)
つまり項目の得点の範囲としては3~15となります。
また、頭打ちになるような画像設定のため、回答結果は5件法のうち4~5がほとんどです。おそらく正規分布はしておらず偏りが出ています。
これで得た結果をSPSSで主因子法プロマックス回転にかけたところ、スクリープロットを見ると、第1因子から第2因子への落差が激しく、因子は1つと見れるのですが、カイザー基準では8因子まで取れます。
固有値としては第1因子が33.・・・・くらいあり、第2因子から2.・・・といった感じで第8因子までは1.0以上あります。
この場合、因子数は1つなのでしょうか?7つなのでしょうか?
また、何故このように第1因子の固有値だけが異常に高いのでしょうか。

ちなみに調査協力者は104人です。協力者の少なさも関係しているとは分かっておりますが、協力者不足でこのような結果になっているのかどうかも分からないためご回答お願いいたします。

SPSSによる因子分析を行いましたが、因子数が決定出来ず、困っています。
ある画像を見て、質問紙調査で答えてもらう方式です。画像数は58枚なので、項目数は58項目になっています。一つの項目につき、3つのイメージにについてそれぞれ5件法で答えてもらうため、この3つの結果を合計したもので一つの項目としています。(過去の先輩の卒業論文でそうしていたため)
つまり項目の得点の範囲としては3~15となります。
また、頭打ちになるような画像設定のため、回答結果は5件法のうち4~5がほとんどです。おそらく正...続きを読む

Aベストアンサー

大変失礼ですが、ご質問の意味が分かりません。
おそらく、因子分析についての基本的な理解ができていらっしゃらないのではないかと思います。
つまり、ご質問に書かれた範囲のことで判断すれば、因子分析が実施できるような実験計画になっていないと考えざるを得ません。

>画像数は58枚なので、項目数は58項目になっています。一つの項目につき、3つのイメージにについてそれぞれ5件法で答えてもらうため、この3つの結果を合計したもので一つの項目としています。

ここにそもそも基本的な間違いがあると考えます。
通常の考え方では、画像数(つまり、刺激数)=項目数という設定はしません。
「3つのイメージ」というのが、58枚の画像に対して、共通した測定内容と思われますから、この場合、普通は、1つの刺激に対して、3項目の変数(測定値)があることになるのではありませんか?
もしそうであるとすれば、この実験のデータは、58種類の画像(刺激)に対して、3項目の変数×104人分のデータがあるということになると思います。
この理解が正しければ、この3項目×104人のデータのそれぞれについて因子分析を行い、その結果を58種類の画像について比較を行うことになると思います(実際上、3項目の変数に因子分析を実施することはありませんし、58通りもの因子分析結果の比較はできませんが)。

このままでは、3項目の測定値について、104人分のデータを用いて、58種類の画像のあいだで差があるかどうかという比較しかできないと考えられます。

統計パッケージソフトは、数値を入れて、メニューを選択すれば、計算結果は得られますが、それがそもそも意味のある数値(データと呼べるような数値)であるのか、比較できる(可能という意味と、比較する意味があるという意味の両者で)数値であるのかなどについて、事前によく考える必要があります。

質問者様の場合、そもそも実験の目的が何であるのか、それに対して用いた測定法が適切であるのかどうか、因子分析を実施して何をしたいのかなど、実際のデータ処理以前というよりも、基本的には、実験(質問紙調査)を実施する以前に検討すべき点が多々おありかと思います。

以上、もし、勘違いや誤解を元に回答しているようでしたら、追加説明をお願いします。

大変失礼ですが、ご質問の意味が分かりません。
おそらく、因子分析についての基本的な理解ができていらっしゃらないのではないかと思います。
つまり、ご質問に書かれた範囲のことで判断すれば、因子分析が実施できるような実験計画になっていないと考えざるを得ません。

>画像数は58枚なので、項目数は58項目になっています。一つの項目につき、3つのイメージにについてそれぞれ5件法で答えてもらうため、この3つの結果を合計したもので一つの項目としています。

ここにそもそも基本的な間違いがあると考えま...続きを読む


人気Q&Aランキング

おすすめ情報