![](http://oshiete.xgoo.jp/images/v2/pc/qa/question_title.png?5a7ff87)
エクセルで下表のデータ1と2との相関関係を調べたいです。
時刻は30秒ごとでデータ1と2をとったのですが、データ1は12時1分30秒に山ができる綺麗な正規分布になっています。データ2はデータ1の1分後に山がくる図が書けます。
このデータ1と2の相関係数はどうしたら出せますか。
単純にデータ1とデータ2を選び分析ツールを使っても駄目で、何分かずらしたものを分析すべきだと思うのですが、(1分なのか2分なのか、それとも)何分ずらしたら相関が高いのかどうやって探したら良いのでしょうか。
素人です。よろしくご教示願います。
連番 時刻 データ1 データ2
1 12:00:00 0 0
2 12:00:30 1 0
3 12:01:00 2 0
4 12:01:30 3 2
5 12:02:00 2 4
6 12:02:30 1 6
7 12:03:00 0 5
8 12:03:30 0 4
9 12:04:00 0 3
10 12:04:30 0 2
11 12:05:00 0 1
No.3ベストアンサー
- 回答日時:
あくまで 一つの考え方ですが、、、
実は、"17秒後にずらしたデータが取得できた場合に、データ1とデータ2の相関が高い"という場合もあれば、"2:08:37だけずらしたデータが取得できた場合に、データ1とデータ2の相関が高い"と言う場合もあると思います。しかし、毎正0秒、30秒の値しかとれていない場合には、データ源1とデータ源2の相関が高い関係を発見するのは困難だと思います。また、反響音が2.4秒後に戻ってくるようなものの場合にも、30秒間隔でデータをとって相関を調べても意味がないと思います。 さらに時間現象で、「データ1は、12:01:30に山ができる綺麗な正規分布」が明らかであるなら、データ2が綺麗な正規分布と見えるかを調べ、正規分布であるとは言いがたいとなれば、とりあえず、相関はないとするのも方法でしょう。
「データ1は一つの山で、データ2も1つの山とみなせるし、データ1もデータ2も、左右対称にやや近いので、それでそのまま単純な相関をとりたいならば、データ1とデータ2の山の時刻を同期させて時刻0として相関をとる方法もあると思います。
しかし、「毎正0秒、30秒の値しかとれていないが、2つの系列データで、高い相関があるという前提で、加工して相関を高く出来る条件を探したい」のであれば、時間軸そのものも調整する方法もあると思います。データ2の時間軸が時刻が進むに従ってより多く遅延して入手されるような電子回路を通じて入手されるのであれば、グラフにした場合、右に延長するデータが入手されると期待できるので、その時間軸を元に戻せば、結果左右対称になるデータになるでしょうから、そのデータ2’とデータ1ならかなり相関は高くなると思います。 こうした手法で相関を高くすることが、現象の説明に新たな意味を持たせるものでなければ、データ加工は単なる遊びになってしまうと思います。
もともとのデータがどういう性質のものであるかは、データの相関を探すときにとても重要なことだと思います。
ご回答をありがとうございました。
確かに連続して毎秒のデータとはなっていませんし、遊びの世界なのかもしれません。
でも上司に納得してもらう説明をするのに、何秒ずらすと相関係数が〇〇でこれは相当相関があると結論づけたいと思っているのですが・・・
No.4
- 回答日時:
>でも私には、1はわかりやすいのですが、2はどう比較したらよいのやら難しくてわかりません。
折れ線グラフにしてみると、分かりやすいです。
グラフの広がりがどれくらいあるか分かります。
うまく使うと、
データ1の結果が、どれくらいの時間差でデータ2に影響を与えるかが分かります。
すなわち、
※データ1とデータ2の標準偏差が同じくらい
…同じような時間で効果が表れます。
※データ1とデータ2の標準偏差が大きくちがう。
…条件によって、効果が表れる時間が変わります。
特に、データ2の方の標準偏差の方が「明らかに」大きい場合、何か別のファクターがあります。
数式だけで、何か結論を出すより、「データが表している意味」を探すようにしてみてください。
http://www.pursue.ne.jp/Document_xls/xls0023.htm
http://www.pursue.ne.jp/jouhousyo/sysad/sysad009 …
https://oshiete.goo.ne.jp/qa/2503346.html
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 数学 ダミー変数での相関係数の算出にやり方(疫学の分析手法について) 14 2023/03/17 11:46
- 数学 数学 2変数データで、「相関係数=−1」の散布図を書く際 写真に これら5組のデータの散布図を描くと 4 2023/02/15 10:46
- 統計学 混合効果モデルについて 3 2022/05/31 21:00
- Visual Basic(VBA) VBA 毎日取得するデータを順番に反映していく方法 6 2023/08/26 16:22
- Excel(エクセル) Excelマクロの差分抽出のコードを教えていただきたいです。 2 2023/03/14 11:40
- C言語・C++・C# C言語プログラム変更 2 2022/12/21 15:03
- その他(学校・勉強) 宿題の所で答えが合ってるか教えて欲しいです!情報Iです! データの分析・利用を行う際の流れについて、 2 2022/07/24 08:17
- Excel(エクセル) エクセルの散布図で新たに入力した値のデータラベルが空欄になる現象 1 2022/04/26 09:31
- 計算機科学 エクセルのデータの表すことについて 2 2023/03/05 20:49
- その他(プログラミング・Web制作) 大学のゼミのレポートがムカつきます。 R言語というデータ分析に特化したプログラム言語を用いた授業の課 1 2023/06/29 00:50
関連するカテゴリからQ&Aを探す
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
下記マクロでMsgBox "空白です...
-
ネットカフェから、メールでき...
-
職務質問で聞かれたデータはど...
-
「未使用」と「不使用」ってど...
-
PCの内蔵メモリにデータは残る?
-
Excelの“並び替え”で文字コード...
-
データ用HDDの別のPCへの乗せ替え
-
FFTにおけるゼロ追加、補間や分...
-
高速フーリエ変換でデータ数が...
-
Ymobile!データ増量オプション...
-
フーリエ変換のデータの補間に...
-
3次元曲面補間方法を探しています.
-
#define F_CPU という設定
-
CD-R(空)のゴミ
-
統計学 データ 正規化 標準...
-
差し込み印刷がうまくできません
-
統計学 メディアンの定義
-
iPod(第2世代)からiPod(第5世代...
-
Excel ドロップダウンリスト(入...
-
Excelでのデータの統合
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
「未使用」と「不使用」ってど...
-
エクセルで年休を管理する方法...
-
PCの内蔵メモリにデータは残る?
-
高速フーリエ変換でデータ数が...
-
アイドルの写真について
-
ネットカフェから、メールでき...
-
3Dプリンターを使う場合 パソコ...
-
【世界はデータで出来ている】...
-
XMLデータってなんですか?
-
Excel Webクエリ
-
ファイザーやモデルナは当時は...
-
Excelの“並び替え”で文字コード...
-
パレート図等で「N=100」とあ...
-
日本通信の当月利用データ量は...
-
データ用HDDの別のPCへの乗せ替え
-
エクセルのグラフのデータ系列...
-
プロ野球の球団別の残塁数を載...
-
インスタの設定について。 イン...
-
スマートウォッチ
-
職務質問で聞かれたデータはど...
おすすめ情報