プロが教えるわが家の防犯対策術!

時系列のデータA(サンプル数15000程度)とデータB(サンプル数2500程度)があります。この2種類のデータはサンプリング時間は同じですが、サンプリング周期が異なっています。それぞれのデータはXの値とYの値があります。

このとき、データAについて求めたXとYの相関値Aと、データBについて求めた相関値Bは、そのまま比較することはできますか?サンプル数の違いによって、相関値が大きくぶれてしまうことはあるのでしょうか?データAはデータBと同じ数のデータにすべく、データを間引くべきでしょうか?

教えていただけると幸いです。どうぞよろしくお願いします。

A 回答 (2件)

引き算したり割算したりはできないけれど、大小比較はしてもよいのでは?


相関係数を比較するにあたって、両系列のデータ数が違うことに引っかかっている
ようだけれど、それは気にする必要がない。
相関係数の式を見れば、データ数が影響しないように定義されていることが解かる。
例えば、同じデータ系列の各データを n 回づつ読んでデータ数を n 倍にしても、
相関係数の値は変わらないようにできている。
    • good
    • 0
この回答へのお礼

ご回答ありがとうございます。

お礼日時:2012/01/11 10:29

>そのまま比較することはできますか?


そのままでなくても、相関係数(相関値なんぞは、聞いたことが無いので)を比較するのは、統計学ではありません。あくまでも質問者の趣味です。好きなようにどうぞ。

データの間引き、なんぞは、データのねつ造につながりかねません。私なら『そんな怪しげな作業が必要なら、全体に問題がある』と判断します。
    • good
    • 0
この回答へのお礼

ご回答ありがとうございました。

お礼日時:2012/01/11 10:28

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!