
A 回答 (2件)
- 最新から表示
- 回答順に表示
No.2
- 回答日時:
こんばんは
MS-EXCELはお持ちではないですか?
お持ちであれば、分析ツールで相関関係を自動分析して
それぞれのカテゴリー値を返してくれますが!
(分析ツール:MS-EXCELの標準付属アドインツールです)
お持ちで無いようでしたら、意味無しレスですね!(スミマセン)
No.1
- 回答日時:
初めから「時系列分析」と決めてかからずに、交通事故の件数、人口、交通量、道路延長、自動車保有率、違反率(取締り件数)と並んで、年というデータもある、というふうに捉えるのが良いかと思います。
多変量解析、特に因子分析、その中でも主成分分析を適用してみるべきであろうと思います。
なお、多変量解析はデータ項目相互の関連の強さを調べるもので、何が何の原因である、というような因果関係は示していない。この点、ご注意下さい。取り締まり件数が増えたのは、交通量が増えたせいではなく、道路事情が変化したため、あるいは警察官が余っているためかも知れない。勝手に因果関係を決めて掛かってはいけません。
はたして項目Xと項目Yの間に相関があるのかどうか、また相関が一次式で近似できるようなものかどうかをチェックするために、まずは散布図を描いてみるべきでしょう。たとえば人口を横軸に、交通事故の件数を縦軸に、という風にして。(散布図にカオスが現れるほど複雑な現象ではなさそうです。)
ひょっとすると自動車保有率ではなく、その2乗に比例して交通事故が増えるらしい、ということだってあり得ます。そういう時には、「自動車保有率の2乗」というデータ項目を追加すればよいのです。
相関の有無のチェックにはカイ二乗検定など検定理論を使います。
次に、因果関係の解析について。
ここでようやく、時系列らしい話になってくるはずなんですが、その前に。原因が結果に先立って統計に現れるかどうか、これは怪しいですね。年単位の統計なんかだと、時間差が出てくれるとはちょっと思えません。交通事故の多くは車を買ってすぐに起こるような気がしますし、それは慣れていない人が運転するからだろうと思われます。だとすれば、同じ年のうちに原因と結果が入ってしまうことがほとんどでしょう。ですから、原因と結果の時間差がデータには現れにくい。時系列で因果関係を導くのは難しいかもしれません。
もしそのようなら時系列解析はあきらめて、むしろ主観的に因果関係のモデル(causal network)を作って、そのパラメータをデータに合うように決められるか、というような研究をするしかないと思います。causal networkはデータ項目の他にも(測定されていない)項目を想定し、項目間に因果関係 A→B (AはBの原因)を描いて、網のような図を作ります。そのそれぞれの" → "はAが増えるとBがどれだけ増えるかを、一次式(aA+b)で表すことにします(線形因果関係)。a,bは未知の係数ですね。" → "ごとに2つづつ未知の係数ができることになります。
このネットワークを実際のデータに当て嵌めて、未知の係数の値を出来るだけうまく決めよう、というわけです。
一次式を幾ら並べても一次式だろうと思ったらそうでもなくて、非線形の連立方程式になります。従って、例えば非線形最小二乗法を使って未知の係数の値を決める必要があります。
時系列に時間差が出ているようなら、相互相関を計算すれば時間差を推定することが出来ます。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
おすすめ情報