非常に時間をかけて考えましたが、限界だと思います。
全くの素人、初心者だとお考えください。
添付グラフは、折れ線は4つのデータで時間で推移しています。
棒グラフは4つのデータの平均値です。
濃い青と濃い赤が、同じ計測装置から得たデータです。
薄い青と薄い赤が、同じ計測装置から得たデータです。
濃い青と薄い青は、同じ時刻に測定しました。
濃い赤と薄い赤は、同じ時刻に測定しました。
↑この表現が分かりにくいでしょうか
折れ線グラフの中央で濃い青と赤が重なるように描かれています。
これが、同じ計測装置で得たデータですが、測定した時刻が異なります。
要は、濃い色の測定装置は、時刻を変えても正確にデータが示せました。
一方で、薄い色の測定装置は、あらズレてしまいました。という結果なんですが。
これを統計的に説明したいのですが、
これは時系列のデータなのですが、
詳細はわかりませんが…
素人考えにexcelで、相関をみようと時系列でCORREL関数にかけてみました。
上の右肩上がりの対では、青時刻の相関が0.44、赤時刻の相関が0.83
濃い青と赤(同じ測定装置)の相関が0.98
これは、そうなのかも…と理解できますが
真ん中の並行に推移するグラフでは、青時刻の相関が-0.01、赤時刻の相関が0.27
濃い青と赤(同じ測定装置)の相関が0.43
ん。。これが何となく腑に落ちないですね、グラフでは似ていますよね
下の右下がりのグラフでは、青時刻の相関が-0.67、赤時刻の相関が-0.87
濃い青と赤(同じ測定装置)の相関が0.95
はぃ。青時刻の相関が-0.67とは似てますかね??
さっきの真ん中の赤時刻の相関が0.27なのに、今回は-0.83というのも??
こんな解釈をしているのですが、どこか考え方がおかしいでしょうか。
まとまりなく駄文ですが、考え方をたどりたかったので、思った通りに書き起こしてしまいました。
そもそも、このようなグラフにCORRELやPEARSONしていいのでしょうか?
スピアマン?とかも疑問です。
分かりにくいかもしれません
どう表現すればいいかもアドバイスいただければ訂正いたします。
アドバイスお願いします。
No.3ベストアンサー
- 回答日時:
No.1&2です。
全く分からないことに変わりはありませんが、気づいた点だけ少し。
(1)時系列データの「時間変化」には、何か要因がありますか?
測定対象や環境条件が時系列で何らかの「変化」をしているのなら、その「平均」にはあまり意味がないと思います。
逆に、その「時間変化」の仕方に、4点のデータに共通性がみられるかどうか、調べられませんか?
たとえば、その時点ごとの「赤と青」の平均値の時間変化、平均値からの「赤と青」の分散の時間変化とか。
また、「濃」と「薄」とでは、測定対象や環境条件の時系列の変化の仕方に違いはありませんか?
(2)相関は、「濃いどうし」「薄いどうし」には意味がありそうですが、「赤どうし」「青どうし」には意味がないように見えます。「薄いどうし」の相関は求めていないのですか?
「濃いどうし」「薄いどうし」の相関は、理由が説明ができるのでしょうか?
「赤どうし」「青どうし」は、「例えになりますが 10㎝ジャンプしたときと30㎝ジャンプしたときのような違い」とのことですが、データからすると「相関がない」ように見えます。「excelのPEARSON相関」の結果も、それを示していると思います。「相関がない」ことが妥当なのかどうか、の考察もいると思います。
(3)何となくですが、下記のような手順で考えるのかな、と思います。
①「濃・薄」の測定データを「正しい」としたときに、測定対象そのものの動きが妥当か。定性的・定量的に想定したモデルに沿った動きをしているか。少なくとも、「濃」の測定データ(赤、青とも)は妥当な動きであることが条件です。
「妥当な動き」がどのようなものかは、質問者さんにしか分からないことです。
②a.上記が妥当であれば、「薄」の測定装置は妥当な測定をしていると判断する。
②b.上記が妥当でなければ、「薄」の測定装置が不適当な測定をしていると判断する。
③a.「濃・薄」の測定データが「正しい」として、結果の分析・評価を行う。
③b.「薄」の測定装置のデータが、どのように不適当かを分析する。
このとき、「濃」の測定データが①によって「正しい」と判定できるという条件で、「濃」の測定データを「真値」と仮定して「薄」のデータを評価する。
「濃」と「薄」とには、明らかに相関はないので、その理由も含めて、「薄」のデータを評価する。
ここで、「薄」の「赤と青」の「時系列の相関」とか、「赤と青」の平均値の時間変化や平均値からの「赤と青」の分散の時間変化とかを求めて、「どのように「正しくない」のかを定性的・定量的に評価する。
つまり
・「薄」の「赤と青」どうしで説明できない動きをしているので、「薄」測定装置自体が信用できない。
・「薄」の「赤と青」どうしでは相応の動きをしているので、「薄」測定装置自体の問題ではなく、測定方法、測定場所、測定環境・条件などに問題がある。あるいは、測定対象自体が、実際にそのような動きをしているのかもしれない。
などを切り分けて行く必要があるかと思います。
④「③b」の結果から、「薄」のデータの信頼性、使用可否を判断する。
データの統計処理という技術的側面もさることながら、「問題解決のプロセス」の適切な設定、つまり「システマティックなアプローチ」と、それに基づいて「仮説を立ててそれを検証・反証する」「あり得る選択肢と、あり得ない選択肢を判別して行く」プロセスが大切かと思います。
「頭の整理」でしょうか。
度々の御回答ありがとうございます。
何度も読み返しました。
確かに、相関よりも頭の整理ですね。
結果から、言えそうも無いからと
次に言えそうな事象を探していました。
言えそうもない原因について、
それも考え直してみます。
数ヶ月、そればかり考えましたので、
あれも、これも意見はあるのです。
丁寧に検証しないとな、これが今の気持ちです。
わけわからん者に、ご親切にありがとうございました。
自分ではいくら考えても修正できない、根本な話でした。
感謝申し上げます。
No.2
- 回答日時:
No.1です。
補足に書かれたことについて。>2種類の装置(濃・薄)で、タイミングを同期させて測定しました。
それにしては、あまりに濃・薄で傾向が違いすぎます。全く関連がないように見えます。
>赤と青では同じ生体活動をシミュレーションしたのですが違う角度からみました
ということは、見え方、傾向が違っていてもよいということですか?
それにしては、「濃」の赤・青は、ほとんど傾向が一致しています。
「薄」の方も、値は離れていますが、傾向は似ているように見えます。
「傾向が一致」しているかどうかを、「相関」で見てみてはいかがでしょうか。
「値」と」「傾向」が、どういう関係にあるのか分かりませんが、それによって「薄」のデータの妥当性がある程度評価できるのではありませんか?
「濃」の赤・青間の相関、「薄」の赤・青間の相関、「赤」の濃・薄管の相関、「青」の濃・薄管の相関を、おのおの調べてみてはいかがでしょうか。
>濃いデータはグラフの傾向は似ていても差があると想像していました。
結果、類似したのは、あり得ないことではなく、そうなんだ!と感じました。
何故そう感じたのか、その辺を論理的に検証して行ってはいかがですか?
その論理に対して、「薄」はどうなのかを考察すれば、「薄」の評価ができるのでは?
>そうなると、濃い装置のデータを基準にして、薄い装置について考察したいです。
はい、それがよいように思えます。「濃」のデータを「正」として、「濃・薄」で何が違うのか、条件や要因を仮定して、上の「論理的」プロセスで「薄」のデータを説明できるか考察するのがよいかと思います。
>薄い装置の青と赤の角度はどちらが精度が高いのか知りたいです。
それは、上記の種々の考察・評価から推定するしかないのでは?
>3つのデータは測定箇所の違いです。
測定箇所の相違によって、データはこうなるはずだ、という要因はありませんか? 「濃」のデータが信頼できそうなら、「濃」のデータはそうなっていますか? それによって、各データの「妥当性」の評価もできると思います。
以上、よく分からないながらの勝手な意見です。
ありがとうございます。
「論理的な検証」こそ目指しているところなのですが、現実が付いてこないですね。。
私も、そのおのおのの相関を調べることから始めたいのですが、
それが棒グラフに少し示してあるのですが、これまた表現がいいものかと…
①時系列データを平均値にしました
②時系列データでexcelのPEARSON相関してみたのが、上の数字です
濃い同士は0.98で納得、赤の濃淡で0.83はぁ~似ているかなぁ~、青の濃淡で0.44ん?赤濃淡より似てないのか??
さらに、中段だと、濃い同士が0.43えぇ~そんなに似てない!?!?、青濃淡は-0.01離れてるからな~でも傾向にてるのにね、赤濃淡は0.27これ似てないのか!!!!
と、このような心のつぶやきなんですが…
この相関のみかたで気になるのは
・冗談の濃いグラフは直線的じゃないのに平均値にしていいもんか?
・その曲線とほぼ直線の相関をみてしまって、そもそもいいのか?
・これはx軸は正規化された100等分の目盛なんですが、まだギザギザです
これでもある程度の平滑化をしたものです。それが足りないのかな?とか
・いっその事、データの傾向変動(トレンド)をだして⇒これが近似直線?
その傾きというのを(方法は不明ですが)比較したら、どうだろうか?
中途半端になりますが、どれも浅く広く調べてしまい、まとまりがつかなくなっています。
まず、PEARSON相関の私の間抜けな解釈について、突っ込みをお願いできますでしょうか。
余裕がありましたら、今後の私の妄想をぶっ潰してください。むしろスッキリ考えが進む気もするのです。
実は、この教えてGooも初使用でして、これ♡お礼を確認するを押していいものか分かりませんが押してみます!
No.1
- 回答日時:
事象と測定装置のどちらに「不確実性」があるのか、切り分けはできているのですか?
記載されたデータの意味が全く分かりませんが、これは2つの計測装置で同じ事象を計測しているということですか? それとも、装置ごとに別の事象を測定している?
「濃い方」の2種類のデータは、ほぼ重なっていますが、同時ではないが再現性のある事象を測定したということですか?
「薄い方」の2種類のデータが大きく食い違っているのは、事象の方に再現性がないということはありませんか?
こういったことをマトリクスにして整理しないと、何が正しくて何が間違っている(不確実さがある)のか、判別できません。
申し訳ありませんが、これらのデータだけから、どこが悪いのかを切り分けるのは難しそうです。
ありがとうございます。
無理だよ、無理だよと言われても、まだ?マークがあるので
是非とも、また補足させてください。
濃い装置は、生体から直接データをとっているので、ほぼほぼ正確と言えます。(完全ではないが不確実性は低い)
薄い装置は、生体から得た別のデータから、計算推定により算出されたものです。(不確実性は高く、推定値ともいえるもの)
ひとつの事象を濃い・薄い装置で採取方法が異なりますが、完全に同期させてデータ採取しています。
青と赤については、例えになりますが 10㎝ジャンプしたときと30㎝ジャンプしたときのような違いです。
その時に同じ装置で測定した、血流量は変化するかと考えていたが、データはほぼ重なっていた。
薄い装置での推定だと、10㎝で血流量は多めに差異が生じ、30㎝では少なめに差異が生じてしまった。
データは複数回採取して、誤差が大きいので平均値にはしませんでしたが
グラフの推移としては同等の傾向で、薄いデータとは差異がみられるので、ある1施行を分析しています。
(あまりよくないですが、人体に関することで同じ事象を繰り返しデータ採取は困難という特徴もあります)
濃い装置が実測値とは言い切れませんが、対する薄い装置の予測値との比較をしていて
その差異について、表現をしたいのです。
しかしCORRELやPEARSONだと、時系列でデータが多いから?ばらつくから?の原因かと考えていますが、
相関がうまく出ない。←これが私の最大の疑問
少し表現が整理されてきたでしょうか。(私が…です)
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 計算機科学 エクセルのデータの表すことについて 2 2023/03/05 20:49
- 統計学 2019年度の毎日朝6時に測定された東京都霞が関における窒素酸化物(Nox)濃度のモニタリングデータ 4 2023/04/24 16:45
- 大学受験 学習院大 数A 確率の問題について質問です。 2 2023/06/02 15:53
- 電気工事士 【クランプメーターの正しい使い方を教えてください】クランプメーターで漏れ電流を測定する 2 2023/03/21 23:29
- バス・高速バス・夜行バス 神姫バスとJRバスの時刻表です。 赤青黒の色分けで 赤青は土日祝、平日だとわかるのですが 運行日が空 1 2022/09/11 03:05
- Excel(エクセル) Excel 2019で質問があります。 計測器のデータをExcelで記録したんですが、1秒刻みで記録 4 2022/09/07 22:46
- 物理学 鏡の中の時計について。 4 2023/01/18 02:32
- 物理学 円運動からみた相手の時刻は定まらないというのは本当ですか。 5 2023/02/27 21:12
- 統計学 お世話になっています. x軸は時間(期間)y軸はある値に対する2つのグラフ比較をしますが、私個人の考 2 2023/03/30 11:42
- 物理学 動き続けたときの双子のパラドックス。 12 2023/02/02 17:29
このQ&Aを見た人はこんなQ&Aも見ています
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
本物とクローンと見分ける方法...
-
0の有効数字
-
高分子の浸透圧法について
-
レポートでの文体について
-
繰り返し測定 3回 の意味
-
誤差について教えてください、...
-
誤差の範囲とは一体どういう意...
-
高校生です。合成抵抗の測定値...
-
物質の同定方法
-
「体重をはかる」は量る?測る?
-
回収率が100%を超える原因について
-
吸光光度法についてです。 なぜ...
-
ジムと自宅で体脂肪率を測定し...
-
RL直列回路とRC並列回路の理論...
-
シャトルランについて
-
真空蒸着した薄膜の厚さについ...
-
活動電位の峰分かれって?
-
放射線関係です。
-
ヤング率の実験(測定)について
-
低圧絶縁抵抗測定について教え...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
おすすめ情報
yhr2さま
ちんぷんかんぷんにもかかわらず、ご回答していただき感謝です。
補足させてください。
✔これは生体内で起きている活動をシミュレーションしたものです。
✔2種類の装置(濃・薄)で、タイミングを同期させて測定しました。
✔重なっている濃いデータは、同じ装置ですから結果は似通る可能性がありました
しかし、赤と青では同じ生体活動をシミュレーションしたのですが違う角度からみました
なので、濃いデータはグラフの傾向は似ていても差があると想像していました。
結果、類似したのは、あり得ないことではなく、そうなんだ!と感じました。
✔濃い装置は、もともと精度が高い装置。薄い装置は、信頼性は未知のものでした。
✔そうなると、濃い装置のデータを基準にして、薄い装置について考察したいです。
✔薄い装置の青と赤の角度はどちらが精度が高いのか知りたいです。
✔3つのデータは測定箇所の違いです。