プロが教えるわが家の防犯対策術!

非常に時間をかけて考えましたが、限界だと思います。
全くの素人、初心者だとお考えください。

添付グラフは、折れ線は4つのデータで時間で推移しています。
棒グラフは4つのデータの平均値です。

濃い青と濃い赤が、同じ計測装置から得たデータです。
薄い青と薄い赤が、同じ計測装置から得たデータです。

濃い青と薄い青は、同じ時刻に測定しました。
濃い赤と薄い赤は、同じ時刻に測定しました。

↑この表現が分かりにくいでしょうか
折れ線グラフの中央で濃い青と赤が重なるように描かれています。
これが、同じ計測装置で得たデータですが、測定した時刻が異なります。
要は、濃い色の測定装置は、時刻を変えても正確にデータが示せました。
一方で、薄い色の測定装置は、あらズレてしまいました。という結果なんですが。

これを統計的に説明したいのですが、
これは時系列のデータなのですが、
詳細はわかりませんが…
素人考えにexcelで、相関をみようと時系列でCORREL関数にかけてみました。

上の右肩上がりの対では、青時刻の相関が0.44、赤時刻の相関が0.83
            濃い青と赤(同じ測定装置)の相関が0.98  
これは、そうなのかも…と理解できますが

真ん中の並行に推移するグラフでは、青時刻の相関が-0.01、赤時刻の相関が0.27
                 濃い青と赤(同じ測定装置)の相関が0.43 
ん。。これが何となく腑に落ちないですね、グラフでは似ていますよね

下の右下がりのグラフでは、青時刻の相関が-0.67、赤時刻の相関が-0.87
                 濃い青と赤(同じ測定装置)の相関が0.95
はぃ。青時刻の相関が-0.67とは似てますかね??
   さっきの真ん中の赤時刻の相関が0.27なのに、今回は-0.83というのも??

こんな解釈をしているのですが、どこか考え方がおかしいでしょうか。
まとまりなく駄文ですが、考え方をたどりたかったので、思った通りに書き起こしてしまいました。

そもそも、このようなグラフにCORRELやPEARSONしていいのでしょうか?
スピアマン?とかも疑問です。

分かりにくいかもしれません
どう表現すればいいかもアドバイスいただければ訂正いたします。
アドバイスお願いします。

「【統計学】比較したい 類似性をみたい? 」の質問画像

質問者からの補足コメント

  • うれしい

    yhr2さま
    ちんぷんかんぷんにもかかわらず、ご回答していただき感謝です。

    補足させてください。
    ✔これは生体内で起きている活動をシミュレーションしたものです。
    ✔2種類の装置(濃・薄)で、タイミングを同期させて測定しました。
    ✔重なっている濃いデータは、同じ装置ですから結果は似通る可能性がありました
     しかし、赤と青では同じ生体活動をシミュレーションしたのですが違う角度からみました
     なので、濃いデータはグラフの傾向は似ていても差があると想像していました。
     結果、類似したのは、あり得ないことではなく、そうなんだ!と感じました。
    ✔濃い装置は、もともと精度が高い装置。薄い装置は、信頼性は未知のものでした。
    ✔そうなると、濃い装置のデータを基準にして、薄い装置について考察したいです。
    ✔薄い装置の青と赤の角度はどちらが精度が高いのか知りたいです。
    ✔3つのデータは測定箇所の違いです。

    No.1の回答に寄せられた補足コメントです。 補足日時:2015/12/17 22:06

A 回答 (3件)

No.1&2です。


全く分からないことに変わりはありませんが、気づいた点だけ少し。

(1)時系列データの「時間変化」には、何か要因がありますか?
 測定対象や環境条件が時系列で何らかの「変化」をしているのなら、その「平均」にはあまり意味がないと思います。

 逆に、その「時間変化」の仕方に、4点のデータに共通性がみられるかどうか、調べられませんか?
 たとえば、その時点ごとの「赤と青」の平均値の時間変化、平均値からの「赤と青」の分散の時間変化とか。
 また、「濃」と「薄」とでは、測定対象や環境条件の時系列の変化の仕方に違いはありませんか?

(2)相関は、「濃いどうし」「薄いどうし」には意味がありそうですが、「赤どうし」「青どうし」には意味がないように見えます。「薄いどうし」の相関は求めていないのですか?
 「濃いどうし」「薄いどうし」の相関は、理由が説明ができるのでしょうか?

 「赤どうし」「青どうし」は、「例えになりますが 10㎝ジャンプしたときと30㎝ジャンプしたときのような違い」とのことですが、データからすると「相関がない」ように見えます。「excelのPEARSON相関」の結果も、それを示していると思います。「相関がない」ことが妥当なのかどうか、の考察もいると思います。

(3)何となくですが、下記のような手順で考えるのかな、と思います。
①「濃・薄」の測定データを「正しい」としたときに、測定対象そのものの動きが妥当か。定性的・定量的に想定したモデルに沿った動きをしているか。少なくとも、「濃」の測定データ(赤、青とも)は妥当な動きであることが条件です。
 「妥当な動き」がどのようなものかは、質問者さんにしか分からないことです。

②a.上記が妥当であれば、「薄」の測定装置は妥当な測定をしていると判断する。
②b.上記が妥当でなければ、「薄」の測定装置が不適当な測定をしていると判断する。

③a.「濃・薄」の測定データが「正しい」として、結果の分析・評価を行う。
③b.「薄」の測定装置のデータが、どのように不適当かを分析する。
 このとき、「濃」の測定データが①によって「正しい」と判定できるという条件で、「濃」の測定データを「真値」と仮定して「薄」のデータを評価する。
 「濃」と「薄」とには、明らかに相関はないので、その理由も含めて、「薄」のデータを評価する。
 ここで、「薄」の「赤と青」の「時系列の相関」とか、「赤と青」の平均値の時間変化や平均値からの「赤と青」の分散の時間変化とかを求めて、「どのように「正しくない」のかを定性的・定量的に評価する。
 つまり
 ・「薄」の「赤と青」どうしで説明できない動きをしているので、「薄」測定装置自体が信用できない。
 ・「薄」の「赤と青」どうしでは相応の動きをしているので、「薄」測定装置自体の問題ではなく、測定方法、測定場所、測定環境・条件などに問題がある。あるいは、測定対象自体が、実際にそのような動きをしているのかもしれない。
などを切り分けて行く必要があるかと思います。

④「③b」の結果から、「薄」のデータの信頼性、使用可否を判断する。


 データの統計処理という技術的側面もさることながら、「問題解決のプロセス」の適切な設定、つまり「システマティックなアプローチ」と、それに基づいて「仮説を立ててそれを検証・反証する」「あり得る選択肢と、あり得ない選択肢を判別して行く」プロセスが大切かと思います。
 「頭の整理」でしょうか。
    • good
    • 0
この回答へのお礼

助かりました

度々の御回答ありがとうございます。
何度も読み返しました。
確かに、相関よりも頭の整理ですね。
結果から、言えそうも無いからと
次に言えそうな事象を探していました。
言えそうもない原因について、
それも考え直してみます。
数ヶ月、そればかり考えましたので、
あれも、これも意見はあるのです。
丁寧に検証しないとな、これが今の気持ちです。
わけわからん者に、ご親切にありがとうございました。
自分ではいくら考えても修正できない、根本な話でした。
感謝申し上げます。

お礼日時:2015/12/20 17:08

No.1です。

補足に書かれたことについて。

>2種類の装置(濃・薄)で、タイミングを同期させて測定しました。

それにしては、あまりに濃・薄で傾向が違いすぎます。全く関連がないように見えます。

>赤と青では同じ生体活動をシミュレーションしたのですが違う角度からみました

ということは、見え方、傾向が違っていてもよいということですか?
それにしては、「濃」の赤・青は、ほとんど傾向が一致しています。
「薄」の方も、値は離れていますが、傾向は似ているように見えます。

「傾向が一致」しているかどうかを、「相関」で見てみてはいかがでしょうか。
「値」と」「傾向」が、どういう関係にあるのか分かりませんが、それによって「薄」のデータの妥当性がある程度評価できるのではありませんか?
「濃」の赤・青間の相関、「薄」の赤・青間の相関、「赤」の濃・薄管の相関、「青」の濃・薄管の相関を、おのおの調べてみてはいかがでしょうか。

>濃いデータはグラフの傾向は似ていても差があると想像していました。
 結果、類似したのは、あり得ないことではなく、そうなんだ!と感じました。

何故そう感じたのか、その辺を論理的に検証して行ってはいかがですか?
その論理に対して、「薄」はどうなのかを考察すれば、「薄」の評価ができるのでは?

>そうなると、濃い装置のデータを基準にして、薄い装置について考察したいです。

はい、それがよいように思えます。「濃」のデータを「正」として、「濃・薄」で何が違うのか、条件や要因を仮定して、上の「論理的」プロセスで「薄」のデータを説明できるか考察するのがよいかと思います。

>薄い装置の青と赤の角度はどちらが精度が高いのか知りたいです。

それは、上記の種々の考察・評価から推定するしかないのでは?

>3つのデータは測定箇所の違いです。

測定箇所の相違によって、データはこうなるはずだ、という要因はありませんか? 「濃」のデータが信頼できそうなら、「濃」のデータはそうなっていますか? それによって、各データの「妥当性」の評価もできると思います。


 以上、よく分からないながらの勝手な意見です。
    • good
    • 0
この回答へのお礼

つらい・・・

ありがとうございます。
「論理的な検証」こそ目指しているところなのですが、現実が付いてこないですね。。
私も、そのおのおのの相関を調べることから始めたいのですが、
それが棒グラフに少し示してあるのですが、これまた表現がいいものかと…
①時系列データを平均値にしました
②時系列データでexcelのPEARSON相関してみたのが、上の数字です
 濃い同士は0.98で納得、赤の濃淡で0.83はぁ~似ているかなぁ~、青の濃淡で0.44ん?赤濃淡より似てないのか??
 さらに、中段だと、濃い同士が0.43えぇ~そんなに似てない!?!?、青濃淡は-0.01離れてるからな~でも傾向にてるのにね、赤濃淡は0.27これ似てないのか!!!!
と、このような心のつぶやきなんですが…
この相関のみかたで気になるのは
・冗談の濃いグラフは直線的じゃないのに平均値にしていいもんか?
・その曲線とほぼ直線の相関をみてしまって、そもそもいいのか?
・これはx軸は正規化された100等分の目盛なんですが、まだギザギザです
 これでもある程度の平滑化をしたものです。それが足りないのかな?とか
・いっその事、データの傾向変動(トレンド)をだして⇒これが近似直線?
 その傾きというのを(方法は不明ですが)比較したら、どうだろうか?
中途半端になりますが、どれも浅く広く調べてしまい、まとまりがつかなくなっています。
まず、PEARSON相関の私の間抜けな解釈について、突っ込みをお願いできますでしょうか。
余裕がありましたら、今後の私の妄想をぶっ潰してください。むしろスッキリ考えが進む気もするのです。

実は、この教えてGooも初使用でして、これ♡お礼を確認するを押していいものか分かりませんが押してみます!

お礼日時:2015/12/18 19:20

事象と測定装置のどちらに「不確実性」があるのか、切り分けはできているのですか?



 記載されたデータの意味が全く分かりませんが、これは2つの計測装置で同じ事象を計測しているということですか? それとも、装置ごとに別の事象を測定している?

「濃い方」の2種類のデータは、ほぼ重なっていますが、同時ではないが再現性のある事象を測定したということですか?
「薄い方」の2種類のデータが大きく食い違っているのは、事象の方に再現性がないということはありませんか?

 こういったことをマトリクスにして整理しないと、何が正しくて何が間違っている(不確実さがある)のか、判別できません。
 申し訳ありませんが、これらのデータだけから、どこが悪いのかを切り分けるのは難しそうです。
この回答への補足あり
    • good
    • 0
この回答へのお礼

ありがとう

ありがとうございます。
無理だよ、無理だよと言われても、まだ?マークがあるので
是非とも、また補足させてください。

濃い装置は、生体から直接データをとっているので、ほぼほぼ正確と言えます。(完全ではないが不確実性は低い)
薄い装置は、生体から得た別のデータから、計算推定により算出されたものです。(不確実性は高く、推定値ともいえるもの)
ひとつの事象を濃い・薄い装置で採取方法が異なりますが、完全に同期させてデータ採取しています。


青と赤については、例えになりますが 10㎝ジャンプしたときと30㎝ジャンプしたときのような違いです。
その時に同じ装置で測定した、血流量は変化するかと考えていたが、データはほぼ重なっていた。
薄い装置での推定だと、10㎝で血流量は多めに差異が生じ、30㎝では少なめに差異が生じてしまった。

データは複数回採取して、誤差が大きいので平均値にはしませんでしたが
グラフの推移としては同等の傾向で、薄いデータとは差異がみられるので、ある1施行を分析しています。
(あまりよくないですが、人体に関することで同じ事象を繰り返しデータ採取は困難という特徴もあります)

濃い装置が実測値とは言い切れませんが、対する薄い装置の予測値との比較をしていて
その差異について、表現をしたいのです。
しかしCORRELやPEARSONだと、時系列でデータが多いから?ばらつくから?の原因かと考えていますが、
相関がうまく出ない。←これが私の最大の疑問

少し表現が整理されてきたでしょうか。(私が…です)

お礼日時:2015/12/18 23:22

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!