私は今、ある高原の景観、音、空気成分濃度などをすべて定量化し、各エリアの特徴を見つけたいと思っているものです。
たとえば、このエリアは「静かでガス成分が濃い」などと・・
この分析はクラスター分析を使用すれば求められると、先人の論文を見て見つけたのですが、いまいち方法がわかりません。
エクセルのマクロなどでできることはできるのですが、これでいいのか・・・汗
画像で乗せますが、正規化をしたほうがいいということなのですが、
変数の一つに+と-のデータが入るものがあり、このまま正規化していいのかも疑問です。
何かアドバイスしてくれる方がいましたらよろしくお願いいたします。
No.1ベストアンサー
- 回答日時:
仰る通り、クラスター分析もひとつの手だと思います。
非階層的クラスター分析を使った場合、温泉を幾つかのグループに分類しても、それぞれのグループの特徴を旨く言えるかどうかが問題になるかも知れません。
階層的クラスター分析をやって、分岐が生じるところに着目して「その分岐では、どういう特徴でクラスターを区別しているのか」を言語表現にしてみる方が易しそうに思います。が、何階層も分岐していくと、言語表現が複雑になっちゃいそうです。
一方、主成分分析を使うのも手だろうと思います。データのばらつきを最も良く説明するような共通の尺度(1~3個ぐらい)でサンプルを測った散布図を作る。そうすると、全体の分布の様子と、各温泉の大まかな傾向がとても見やすくなります。
これらの尺度は測定データの線形結合で表される変数であって、尺度同士は互いに直交しています。もともとN個の変数があったものをたとえば2個の尺度だけで表現するということは、N次元空間中の点(ひとつの点がひとつの温泉)を2次元平面に射影することに他なりません。さて、これらの尺度に旨い名前を付けてやれば、温泉を大まかに分類する言葉が構成できたことになります。
次に、各温泉について、これらの尺度では表せない特徴を考えます。それにはN次元空間において、その点から、射影した2次元平面への距離に着目する。この距離が小さい温泉は、(2個の尺度で表される以外の)独自の特徴というものはさして持っていない。しかしこの距離が大きい温泉は(2個の尺度だけでは表せないような)独自の特徴を持っているんで、それを表す標語を作ってみる。
なお、どの手法も、取り上げたサンプル全体の中での相対的な特徴を見ている(だから正規化しても良い)のであって、すなわち、サンプルに何を含めるかで結果が違ってくる。客観的な分析だと言えるほどのものじゃありません。
> このまま正規化していいのか
いいです。
返答遅れてすいません。
アドバイスを参考にして、階層クラスター分析の結果と主成分分析の主成分得点の分布図を照らし合わせて、言語表現による分類分けを行うことができました。
ありがとうございました!!
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- その他(プログラミング・Web制作) 大学のゼミのレポートがムカつきます。 R言語というデータ分析に特化したプログラム言語を用いた授業の課 1 2023/06/29 00:50
- 宇宙科学・天文学・天気 AIが答えた方程式 1 2023/02/20 00:12
- 統計学 ダミー変数の因子分析について質問です 1 2022/03/27 14:31
- 統計学 アンケート調査のデータ比較をする際の統計分析方法の選択に迷っています 5 2022/04/15 01:05
- 統計学 一変量分析(度数分布表)は、結果をもとに特に検定せずに断定してもよいですか? 7 2022/11/24 23:20
- 教育・学術・研究 仕事の方向性を変えたい。経営分析→数値解析 1 2023/06/18 16:51
- MySQL PhpMyAdminで作成して実行せよ。 東京23区を、皇居を中心とした4つのエリア(南東, 南西, 1 2023/06/11 11:58
- 統計学 Rを用いた「繰り返しがある直交表実験計画法」の分析方法 8 2023/08/01 17:58
- 統計学 加重最小二乗法=①「変数を自然対数変換」=②「誤差項の分散の逆数を重み付け」? 8 2022/11/26 11:15
- 心理学 卒業論文の分析について 1 2022/09/05 14:19
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
質的データの中央値の求め方
-
統計データの「タイル値」とは...
-
児童(小学生)の平均身長・体重
-
染色体異常、ダウン症の年齢別...
-
日本で1番暑い日は、例年だと何...
-
課題で、ワードで2枚程度という...
-
大学の課題の提出に3分遅れてし...
-
経済学のレポートで扱いやすい論題
-
単位を懸けた重要なレポートの...
-
大学の課題がめちゃくちゃ多い...
-
事務の論文について
-
一般的に、遅れた課題をメール...
-
昇進論文のを書かないといけな...
-
レポート用紙に3から4枚書け、...
-
大学生です。自己剽窃について...
-
エクセルでのシグモイドのカー...
-
大学のレポートとか課題って生...
-
レポートの指定字数について
-
ゲーム理論のトリガー戦略について
-
ハゲタカ誌
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
統計データの「タイル値」とは...
-
分散分析結果の論文の載せ方
-
統計学:imputed dataset
-
社会学的に論じるとはどのよう...
-
計算式を教えていただけませんか
-
中央値は偶数?奇数?
-
児童(小学生)の平均身長・体重
-
四半期データの移動平均について。
-
携帯電話の年齢別普及率について
-
染色体異常、ダウン症の年齢別...
-
SDと共分散分析とボンフェロー...
-
推計学で言うところの寄与率は...
-
統計学、データの種類について
-
課題で、ワードで2枚程度という...
-
大学の課題の提出に3分遅れてし...
-
大学の課題がめちゃくちゃ多い...
-
経済学のレポートで扱いやすい論題
-
レポートの指定字数について
-
レポートで去年の自分のをコピ...
-
大学のレポートとか課題って生...
おすすめ情報