dポイントプレゼントキャンペーン実施中!

エクセルで下表のデータ1と2との相関関係を調べたいです。
時刻は30秒ごとでデータ1と2をとったのですが、データ1は12時1分30秒に山ができる綺麗な正規分布になっています。データ2はデータ1の1分後に山がくる図が書けます。
このデータ1と2の相関係数はどうしたら出せますか。
単純にデータ1とデータ2を選び分析ツールを使っても駄目で、何分かずらしたものを分析すべきだと思うのですが、(1分なのか2分なのか、それとも)何分ずらしたら相関が高いのかどうやって探したら良いのでしょうか。
素人です。よろしくご教示願います。

連番 時刻 データ1 データ2
1 12:00:00 0 0
2 12:00:30 1 0
3 12:01:00 2 0
4 12:01:30 3 2
5 12:02:00 2 4
6 12:02:30 1 6
7 12:03:00 0 5
8 12:03:30 0 4
9 12:04:00 0 3
10 12:04:30 0 2
11 12:05:00 0 1

A 回答 (4件)

あくまで 一つの考え方ですが、、、


実は、"17秒後にずらしたデータが取得できた場合に、データ1とデータ2の相関が高い"という場合もあれば、"2:08:37だけずらしたデータが取得できた場合に、データ1とデータ2の相関が高い"と言う場合もあると思います。しかし、毎正0秒、30秒の値しかとれていない場合には、データ源1とデータ源2の相関が高い関係を発見するのは困難だと思います。また、反響音が2.4秒後に戻ってくるようなものの場合にも、30秒間隔でデータをとって相関を調べても意味がないと思います。 さらに時間現象で、「データ1は、12:01:30に山ができる綺麗な正規分布」が明らかであるなら、データ2が綺麗な正規分布と見えるかを調べ、正規分布であるとは言いがたいとなれば、とりあえず、相関はないとするのも方法でしょう。
「データ1は一つの山で、データ2も1つの山とみなせるし、データ1もデータ2も、左右対称にやや近いので、それでそのまま単純な相関をとりたいならば、データ1とデータ2の山の時刻を同期させて時刻0として相関をとる方法もあると思います。
しかし、「毎正0秒、30秒の値しかとれていないが、2つの系列データで、高い相関があるという前提で、加工して相関を高く出来る条件を探したい」のであれば、時間軸そのものも調整する方法もあると思います。データ2の時間軸が時刻が進むに従ってより多く遅延して入手されるような電子回路を通じて入手されるのであれば、グラフにした場合、右に延長するデータが入手されると期待できるので、その時間軸を元に戻せば、結果左右対称になるデータになるでしょうから、そのデータ2’とデータ1ならかなり相関は高くなると思います。 こうした手法で相関を高くすることが、現象の説明に新たな意味を持たせるものでなければ、データ加工は単なる遊びになってしまうと思います。

もともとのデータがどういう性質のものであるかは、データの相関を探すときにとても重要なことだと思います。
    • good
    • 0
この回答へのお礼

ご回答をありがとうございました。
確かに連続して毎秒のデータとはなっていませんし、遊びの世界なのかもしれません。
でも上司に納得してもらう説明をするのに、何秒ずらすと相関係数が〇〇でこれは相当相関があると結論づけたいと思っているのですが・・・

お礼日時:2016/10/05 20:38

>でも私には、1はわかりやすいのですが、2はどう比較したらよいのやら難しくてわかりません。


折れ線グラフにしてみると、分かりやすいです。

グラフの広がりがどれくらいあるか分かります。

うまく使うと、
データ1の結果が、どれくらいの時間差でデータ2に影響を与えるかが分かります。

すなわち、
※データ1とデータ2の標準偏差が同じくらい
 …同じような時間で効果が表れます。

※データ1とデータ2の標準偏差が大きくちがう。
 …条件によって、効果が表れる時間が変わります。
  特に、データ2の方の標準偏差の方が「明らかに」大きい場合、何か別のファクターがあります。
  数式だけで、何か結論を出すより、「データが表している意味」を探すようにしてみてください。

http://www.pursue.ne.jp/Document_xls/xls0023.htm
http://www.pursue.ne.jp/jouhousyo/sysad/sysad009 …
https://oshiete.goo.ne.jp/qa/2503346.html
    • good
    • 1
この回答へのお礼

関連HPを教えていただきありがとうございました。

お礼日時:2016/10/06 03:37

こんにちは



>綺麗な正規分布になっています。
実際はご質問のように単純では無いけれど分かりやすい例であげていると思います。

本当に「奇麗な正規分布」ならば
1.ピークの位置と高さ
2.広がり(標準偏差)
の2つを比較するのがいいと思います。

Excelを「万能分析ソフト」と考えるより「電卓の高性能版(普通の関数電卓よりも上)」と思って使ってみてください。
    • good
    • 0
この回答へのお礼

ご回答をありがとうございました。
でも私には、1はわかりやすいのですが、2はどう比較したらよいのやら難しくてわかりません。

お礼日時:2016/10/05 20:35

http://www.ipc.shimane-u.ac.jp/food/kobayasi/exc …
2種類あります。関数と分析ツールと
    • good
    • 0
この回答へのお礼

ご回答をありがとうございました。
分析ツールは便利そうですので使いたいと思います。

お礼日時:2016/10/05 20:34

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!