アプリ版:「スタンプのみでお礼する」機能のリリースについて

多変量解析を勉強しているものです。
主成分分析とコレスポンデンス分析(数量化3類)の違いは、元データが質的データか量的データかによると思いますが、実際はどのように使い分けられているのでしょうか?
主成分分析、因子分析は量的データが必要ですが、実際は、質的データ(1.非常に満足、2.満足・・・・と言ったデータ)が元データでも使われていると思います。そうなればコレスポンデンス分析は必要ないのでは?と思ったのですが・・。
申し訳ないですが、どなたか詳しい方宜しくお願いします。

A 回答 (2件)

>主成分分析とコレスポンデンス分析(数量化3類)の違いは、元データが質的データか量的データかによると思いますが、実際はどのように使い分けられているのでしょうか?



主成分分析の場合も、量的データをカテゴリカルデータに変換する場合もあるので、データの区別はあまり気にしていないですね。
コレスポンデンス分析は、行ポイントと列ポイントを同一平面上に配置して、関係が一目で分かるよさがあります。

一方、主成分分析(因子分析と似ていますが)は、情報の圧縮がメインですが、最近は因子分析を使用して、あまり主成分分析はしていないですね。
    • good
    • 1

主成分分析


 元データ:サンプル(例えば、人)×定量変数(例えば、身長、体重など、あるいは国語、数学の点数)
 標準化:元データを変量について、中心化するかz得点に変換します(標準化します)。
 変量間でスケールが著しく違うことがあるからです。
コレスポンデンス分析
 元データ:カテゴリ分類(例えば、20代男性、30代女性のような姓年代)×カテゴリ変数(例えば、よく利用するファーストフード店を{マクドナルド、吉野家、松屋、...}から選択)のクロス集計表(度数表)
 標準化:カテゴリ分類とカテゴリ変数の両方について、度数の標準化をします。
 カテゴリ分類間、カテゴリ変数間で度数が著しく異なることがあるからです。

上記の説明では分かりにくいとは思いますが、
 前提とする元データの性質が異なるために、標準化の仕方が違う
ということは憶えておいて下さい。

> 主成分分析、因子分析は量的データが必要ですが、実際は、質的データ(1.非常に満足、2.満足・・・・と言ったデータ)が元データでも使われている
というのは、元々質的データだったのを、非常に満足→2点、満足→1点などと得点化して、さらにその得点の平均値を求めて、主成分分析に入力するデータとして、量的データに変換しているということですね。
これをコレスポンデンス分析では、非常に満足が何人、満足が何人などとそれぞれのカテゴリの度数を集計したものを入力します。

上記のような説明でイメージが湧きますでしょうか?

また、一般に、コレスポンデンス分析と数量化III類は同じ、という説明をされますが、本当に厳密には少し違いがあります。
数量化III類では、前提としている元データは、
 サンプル(例えば、人)×カテゴリ変数(例えば、よく利用するファーストフード店を{マクドナルド、吉野家、松屋、...}から選択)の表(選択したものを1、選択されなかったものを0と数値化した表)
なのです。

正直、言葉だけでは説明が難しいです。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!