重要なお知らせ

「教えて! goo」は2025年9月17日(水)をもちまして、サービスを終了いたします。詳細はこちら>

電子書籍の厳選無料作品が豊富!

Rを用いて主成分分析をしたいと考えています。
37国ある国名を質的変数で表して分析に投入したいんですが、
37ある国名に1番から37番まで順番に番号をつけていき
分析に投入していいんでしょうか。
また、Rが出した分析結果の解釈の仕方がわかりません。
解釈の仕方を教えていただけませんか。
またはそのことが説明されているサイトがあれば教えてください。

A 回答 (2件)

よく分からないけれど、多分駄目なことをしていると思います。


番号をつけるというのが、変数countryを一つだけ作って
第 1 国ならば country = 1, 第 2 国ならば country = 2,..., 第 37 国ならば country = 37、のようにしているならば、大抵は駄目です。

質的変数のモデルへの取り込みにはダミー変数を立てるといいです。37カテゴリーあるので、36個 (例: dum_1, dum_2,..., dum_36) のダミーが必要です。第 37 国を基準にして良ければ
第 1 国ならば dum_1 = 1, dum_2 = dum_3 =...= dum_36 = 0
...
第 j 国ならば dum_j = 1, dum_1 = dum_2 =...= dum_{j-1} = dum_{j+1} =...= dum_36 = 0
...
第 37 国ならば dum_1 = dum_2 =...= dum_36 = 0
のような作り方をします。

カテゴリー数-1のダミー変数が必要だから、説明変数 (独立変数) の数は非常に多くなります。
ダミー変数については、"dummy variable" "index variable"などもキーワードとして少し調べてみてください。

この回答への補足

37は多すぎるので4分類してみました。
Rを使っているんですが、これをカテゴリー変数だと認識させるにはどうしたらいいでしょうか。
青木先生の本を見て真似たのですが、データをインポートした後に
df[,1]<-factor(df[,1],levels=1:4,labels=("a","b","c","d"))と
スクリプトウィンドウに入力すればいいんでしょうか。

補足日時:2009/09/13 23:40
    • good
    • 0

せめてRの実行例を載せましょう。

そうでないと、そもそもどのような関数を用いたのかさえ分からないので、答えようがないでしょう(^_^;)

> 37ある国名に1番から37番まで順番に番号をつけていき

という説明もR上でどのように処理したのか不明なのです。

解釈の仕方というのは、教科書に載っている通りで、問題なのは質問者さんの得たデータに対する結果の解釈なわけですから、その結果が(回答者側が)分からないと答えられませんよね。

この回答への補足

データを添付します。Cも質的変数です。
わかりづらかったら、すみません。

Comp.1 Comp.2 Comp.3 Comp.4 Comp.5
A -0.58351209 -0.1005059 0.42021037 0.36428515 0.5832082
B -0.56861151 0.4433775 -0.02623004 0.26552909 -0.6394557
country -0.26677372 0.1294470 -0.87874163 0.02454546 0.3732103
C 0.04620948 0.7985296 0.22305649 -0.46189028 0.3116380
D 0.51272903 0.3727048 -0.02818129 0.76344320 0.1206665

.PC$sd^2 # component variances
Comp.1 Comp.2 Comp.3 Comp.4 Comp.5
1.3751410 1.1079172 1.0202807 0.8129475 0.6837135

summary(.PC) # proportions of variance
Importance of components:
Comp.1 Comp.2 Comp.3 Comp.4 Comp.5
Standard deviation 1.1726641 1.0525765 1.0100895 0.9016360 0.8268697
Proportion of Variance 0.2750282 0.2215834 0.2040561 0.1625895 0.1367427
Cumulative Proportion 0.2750282 0.4966117 0.7006678 0.8632573 1.0000000

解釈の仕方が載っている良い教科書があれば名前を是非教えてください。
お願いします。

補足日時:2009/09/10 21:20
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!