一回も披露したことのない豆知識

「主成分分析の結果から一次元構造が確認される」とは分かりやすく言うとどういう意味なんでしょうか?

今扱っている論文に「主成分分析の結果から一次元構造が確認される」という言葉が何度か出てきます。
何となく研究の正当性を主張するのに使っているというのは分かるのですが、詳しい意味がよく分かりません。
結局一次元構造とは何なのでしょうか?
分かる方、教えてください><!

A 回答 (3件)

私は数学を普段から使う専門家です。

全体の文章を読まずにこれだけの文章では情報が少な過ぎて、正確な意味は分かりません。しかしながら、これだけの文章で想像出来ることは、以下の通りです。

普通、ある量(変数とかパラメーターと呼ばれる)を横軸に取って変化させるとそれに対してある量が変化するとき、その値を縦軸に取った平面内で、その図が大体一本の直線や曲線の上に乗っている場合に、それは一次元的構造を持つと言います。ところが、直線や曲線ではなく、平面的にぼーっと広がって分布してしまう場合、それは最早一次元的ではなく、2次元以上の多次元的構造を持つと言います。多分、主成分をそのようにある変数なりパラメーターを変えて図示してみたら、直線ないし曲線上に乗っているように分布していたということではないでしょうか。


具体的には例えば、ある集団の人間の身長を年齢を変数と考えて図示してみると、もし身長のその集団での平均値を画くと、年齢を大きくして行くと最初は右上がりに直線状に増えて行きますがそのうち成長が止まって平になって行く。従って全体の図は上に凸向きな一本の曲線を画くはずです。従って、この場合この図は一次元的構造を持っています。ところが、身長の平均値ではなくて、各々の人の身長をその集団に対して一枚の図の中に画くと、与えられた年齢で皆の身長は平均値の回りにばらつきがあるので、一本の曲線上には乗らず、その平均値の回りにぼーっと広がった図になります。この時には、その図は一次元的構造を持っていないと言います。

この説明は、果たしてお役に立っているでしょうか。
    • good
    • 2
この回答へのお礼

回答ありがとうございます。
最初の説明はちょっと難しかったのですが、具体的な説明の方のおかげで何となくわかったような…気がします(すいません、私は数学が本当に苦手なので;)。
つまり、相関関係を図にしてあらわしたときに一本の線で表せられるときに一次元的構造を持っているということでしょうか?

お礼日時:2010/05/06 11:55

多変量データというのは分かりますか? X1, X2, X3, ..., Xpという、要するにたくさんの変数があるようなデータセットのことです。

これを1次元、2次元、3次元、といった言い方をすることができます。

例えばX1という変数1つなら数直線上に表現できますし、X1とX2の2変量ならx軸とy軸の2次元上に表現できます(散布図がこれです)。さらにz軸を加えた3次元(X1, X2, X3という3変量)でも表すことができるでしょう。しかし、残念ながら4次元以上は図として表現できないので(つまり頭の中でも想像できないので)困るわけです。そこでより低次元で多変量データを表現してあげようというのが主成分分析なのです。

仮にX1, X2, X3, X4という変量があったとして、これを図で表現しようとしてもできないでしょう? だから主成分分析でこれらの多変量データから新たな合成変数を作り出すことで、4次元のデータをより低次元(一般的には2次元)で表現しようとするわけです。

だから1次元構造であったということは、多変量データから新たな1つの合成変数が作り出されたということです。なお、この合成変数のことを主成分というので主成分分析といいます。
    • good
    • 3

主成分分析は、多数の変数を、それらが持つ情報をできるだけ損なわずに少数の変数(主成分)に縮約(要約)する手法です。


ご質問のように、「一次元性が確認できた」という場合は、1つの主成分に縮約ができたことを意味しています。
具体的には、1成分を指定して、主成分分析を実施し、固有値、分散ともに十分に高い値が得られ、また、成分行列を見た場合に、各変数がこの1つの成分に対して高い(おおむね、絶対値で0.4以上)負荷を示している場合が、これに相当します。

詳細は、多変量解析についての書物の主成分分析について記述された章をご確認ください。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!