はじめまして、shigure2005と申します。
現在、いくつか連なる因果関係を持ったデータの
解析をしようと思っているのですが、因果関係を
表現するのに適したモデルの表記法にはどのような
ものがあるのでしょうか?
因果関係は以下のようになってます。矢印の左が
原因、右が結果となります。
100個くらいのデータ→5つくらいのデータ→一つのデータ
また、その表現方法に必要な知識の書かれたお勧めの
本などがありましたら教えてください。現在、
グラフィカルモデリングなるものがこれに当たる
のではないかと考え、宮川氏の「グラフィカル
モデリング」を借り、これから読もうと考えております。
ベイズなどのモデルもあると聞いたのですが、
ご存知の方がいらしたら、どうぞよろしくお願いします。
No.2ベストアンサー
- 回答日時:
グラフィカルモデルはグラフを用いてモデリングをすることの総称のようなものです。
その一つにBayesian Networkもあります。Bayesian Networkは全体の確率を変数間の条件付確率の積(結合確率分布)により表現するモデルになっています。一般的にはこの条件付確率はCPテーブルで計算されるので、変数の属性はカテゴリタイプとなります。
変数の属性が数値変数であれば、共分散構造分析という手法があります。基本的にはパス解析と因子分析の合体したようなものになり、潜在変数を取り扱うことも可能です。(新たな変数というのがこれのことならだが。。。)
共分散構造解析の本は検索すれば色々出てくると思いますので一つだけ。「多変量解析の展開」 岩波書店 統計科学のフロンティア 5を挙げておきます。
Bayesian Networkの本は和書は良く知りません。洋書ですが、「Bayesian Networks and Decision Graphs」 Springer Statistics for Engineering and Information Science. Jensen著
HUGINというソフトウエアを作った人の本です。
ご回答ありがとうございます。
そのような仕組みになっているんですね。私は生物系の研究を
しており、解析の必要性から統計学を勉強し始め、
現在がむしゃらに基礎統計を覚えている状況です。本を引けば
だいたい論文や本は読めるようになったのですが、全体の
体系的な構造や、概念がいまいちつかめていません。
調べていたときに、webで「統計解析では厳密には因果関係を
求めることはできない」というような記述があったので、
多少混乱しております。
2変数間の因果関係を求めるときには回帰分析、多変数間の
複雑な因果のネットワークを解析するときには、質的変数なら
Bayesian Network、量的変数なら共分散構造解析を使うという
理解でよろしいでしょうか?
どうぞよろしくお願いします。
No.3
- 回答日時:
答えになっていないかもしれませんが。
因果関係というのは深遠なものです。その意味で、統計解析では厳密な意味では因果関係はわからないでしょう。そもそも、厳密な意味での因果関係というのも定義できないかもしれません。。。
そうは言ってもある程度のことはわかります。以下に、わからない例を簡単に紹介します。(先に紹介した本の中にあります)
よく当たる天気予報というのが合ったとします。その場合、データを分析すると、天気予報が晴れといえば晴れる。雨といえば雨が降る。ということが判ります。このことから、天気予報が明日の天気の原因になっているといえるか?ということですね。現実のメカニズムを知っていればこのような間違いは犯しませんが、データからはこういう結果が得られることもあるということです。
実際に分析をする時にはこのようなことを気をつける必要があります。実際、Bayesian Networkなどでは確率分布的に等価なグラフを幾つも書くことが可能です。
最後に、回帰分析は単回帰でなく重回帰分析では多変数と1変数との間の関連を求めることが出来ます。本質的な違いは、どの変数でどの変数を回帰するかを最初に使う側が指定するところにあります。
ご回答ありがとうございます。
因果関係は確かに、厳密な定義ということを考えると
なかなか難しいですね。そこにはヒューリスティック
な判断が介在し、「この閾値以上で、かつこれらは実験的にも
因果の関係がありそうだ」ということであれば、因果関係と
いうようになるんですね。
また回帰分析についても、ご指摘ありがとうございます。
非常に参考になりました。
またご質問することがあるかもしれませんが、その際には
どうぞよろしくお願いします。
No.1
- 回答日時:
因果関係をグラフ表現したい という意味でしょうか?
ご質問で書かれているように
100個くらいのデータ→5つくらいのデータ→一つのデータ
となっていることが、すでにわかっているのであれば、あとは変数間の依存関係を統計的手法で明らかにしていくことが、次のステップのように思えます。
とりあえず、グラフィカルモデリングをお読みになれば、よいのではないでしょうか?
ベイズのモデルというのは、おそらくベイジアンネットのことかと思います。ベイジアンネットワークもしくはベイジアンネットで検索してみてください。
構築のための支援ソフトウエアも市販されています。
ご回答ありがとうございます。
やりたいことは、現在わかっているこの因果関係と、
それぞれの変数のデータを用いて、新たな変数間の
因果関係、そして、それらの強さを求めることなのです。
グラフで表現するというのは、それを実現する
ために役に立つかと思って調べている状況です。
すでにわかっているデータ、因果関係を効率よく
利用して、そのようなことを行う方法としては、ほかに
どのようなものがあるのでしょうか?
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 経済 マネタリズムはなんで流行った? 1 2022/07/11 17:26
- 哲学 いかなる座標によっても捉え切れない神::有る無いの経験事象を超えており 因果関係から自由である 15 2023/01/28 05:27
- 統計学 Rを用いた「繰り返しがある直交表実験計画法」の分析方法 8 2023/08/01 17:58
- その他(病気・怪我・症状) 各種の癌について全国の病院の手術件数の統計データを定期的に公開しているサイトはどこでしょうか。 1 2022/11/20 20:25
- 統計学 アンケート調査のデータ比較をする際の統計分析方法の選択に迷っています 5 2022/04/15 01:05
- アプリ uqモバイルについて再度質問させていただきます my uq mobileのデータ使用量・現在量の表示 1 2022/08/13 08:17
- その他(悩み相談・人生相談) 愚かすぎませんか? 2 2022/10/28 03:53
- HTML・CSS WEBサイトの構築。表示データとWEBデザインを分離する考え方を専門用語・業界用語では何と言うか? 8 2022/09/27 09:16
- 統計学 相関と疑相関の違い(因果関係以外で) 4 2022/05/10 09:48
- IT・エンジニアリング 大規模言語モデルは今後どのように進化していくでしょうか? 1 2023/07/20 19:17
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
N/Rとは何の略
-
FDAのデータの入手方法
-
パーセンタイル値の計算方法
-
世界主要国のGDP順位の推移につ...
-
赤羽駅の乗降客数
-
相対関数とはなんなのかいまい...
-
デザイナーズチェアのCADデータ
-
フーリエ変換をすることにより...
-
無期限でデータが保存できるオ...
-
NHK受信料未払いって何件?
-
宮内庁は3親等まで身辺調査が...
-
警察って個人のパソコンやスマ...
-
この歯ブラシ使ったら、虫歯が...
-
なぜ、北総鉄道は運賃値下げが...
-
リサーチャーって言う仕事に就...
-
BSA分析(Benefit Structure An...
-
リファレンスチェックなるもの...
-
W3Techsはどのような会社なので...
-
CRM(セールスフォース)のデー...
-
イスラエル
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
N/Rとは何の略
-
社会福祉調査の基礎
-
FDAのデータの入手方法
-
統計のデータ割付について。
-
Excelのピポットテーブルでピポ...
-
指定した値以上の中で最小値を...
-
日本人男性(20〜40代)の平均身...
-
標本数が50以上のデータが見...
-
SASでカイ二乗値を求めるには
-
【Excel質問】別シートにある複...
-
eKYC(Povo、メルカリ、ヤフオク...
-
統計学的に信頼のあ有効率は、...
-
主成分分析と数量化第3類、ど...
-
「重み付け」 と 「カイ二乗検...
-
統計学の質問です
-
フーリエ変換をすることにより...
-
次元の呪いについて。 次元の呪...
-
訳を教えて下さい
-
サッカー解析システム OPTAに...
-
心理学で学んだこと、人間関係...
おすすめ情報