![](http://oshiete.xgoo.jp/images/v2/pc/qa/question_title.png?8acaa2e)
おはようございます。
自分は大学4年生で卒業論文に取り組んでいます。
事故とぎりぎり事故を回避した事例を比較して、それらの間の閾値(速度や衝突位置までの距離など)を求めることがテーマで、多くのデータを扱うため統計学が有用になるのではないかと思いました。
しかし周りに聞くことができる人がおらず質問サイトで聞いた次第です。
皆さんならばどのようなアプローチをしますか?
例えば事故において重要な因子はどのようにして求めますか?
今のところ説明変数(速度、距離など)から事故の確率を予測するロジステック回帰分析で回帰係数で比較することを考えています。
稚拙な文章を読んでいただきありがとうございます。
No.1ベストアンサー
- 回答日時:
企業で統計を推進する立場の者です。
多数の要因項目を取り上げ、それらで構成される多次元の空間で、01のラベルがあらかじめ付与してある正例と負例を分類する操作を、分類あるいは識別といいます。
その際に用いる統計手法を分類器・識別器と言い、大別すると線形識別器と非線形識別器があります。
線形識別器は、多次元空間に超平面を差し込む形で両者を識別します。ロジスティック回帰もこれに含まれます。
メリットは、負荷量(超平面の法線ベクトル∝標準偏回帰係数)から識別要因が特定できることです。デメリットは誤判定率が高いことです。
非線形識別器は、多次元空間にグネグネの曲面を差し込んで識別する方法で、サポート・ベクター・マシーン(SVM),k-NN,ランダム・フォレストなど多数あります。
曲面は法線ベクトルが定まらない為、要因解析はできません。ただ、ランダム・フォレストは重要度が出てきます。
誤判定率が低いので予測に適します。
あなたのように、要因を特定したいのであれば、ロジスティック回帰かランダム・フォレストを使えば良いでしょう。両方やって結果を比較しても面白いと思います。また、事故確率ですが、非線形識別器でも、グレーゾーンの事故確率が計算できます。識別境界はy=0.5の曲面ですが、0~1までの等高線を描くことができるからです。分類器回帰とか言います。
ただ、説明変数のうち運転者の年齢などは計量値扱いできますが、車種(スポーツカー,SUVなど)は、ワン・ホット・エンコーディングによって、新たな項を立てますので、そこで線形制約が入ります。また、交互作用も考慮したいですが項数が膨大化します。そのため、正則化したロジスティック回帰を用いなければなりません。Rでは、glmnet()という関数を使うことになります。SVMは線形制約があっても大丈夫です。
周りにサポートしてくれる人がいないそうで・・・。頑張って下さい。
kamiyashiroさん わかりやすい説明をしていただきありがとうございます。
今回の話を聞いてみて非線形の回帰分析にチャレンジしようと思いました。
きっかけを作っていただき感謝いたします。
ありがとうございました!
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 物理学 時間を語るなら、(複数の時間の正体)を知る必要が有る。 1 2023/02/16 22:14
- 教育・学術・研究 仕事の方向性を変えたい。経営分析→数値解析 1 2023/06/18 16:51
- 統計学 加重最小二乗法=①「変数を自然対数変換」=②「誤差項の分散の逆数を重み付け」? 8 2022/11/26 11:15
- 物理学 力学の問題です。質量m1、速度v1の物体Aと質量m2、速度v2の物体Bがx軸上を等速直線運動していて 2 2022/12/24 13:26
- 統計学 統計学、エクセルがわかりません!解答と詳しい解説をお願いします! (1)それぞれの地域別に記述統計量 9 2022/08/21 16:30
- 物理学 特殊相対性理論を、完全否定に成功~ガンマの数式は、成立しない。 2 2023/03/08 19:30
- 政治 日本もラウンドアバウト交差点を増やすべきではないですか? 4 2023/06/26 23:27
- 統計学 確率統計の問題です。 3 2022/04/07 04:39
- 物理学 物理(車関係)について教えて下さい。 2 2022/08/12 16:43
- 統計学 アンケート調査のデータ比較をする際の統計分析方法の選択に迷っています 5 2022/04/15 01:05
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
決定係数がマイナスになる例っ...
-
回帰水を売ってる会社大丈夫か
-
切片あり回帰と切片なし回帰
-
非線形回帰分析の定義が分かり...
-
スパースモデリング
-
データが i.i.d であるとはどう...
-
EXCELで両対数を取った重回帰分...
-
最小二乗法とラグランジェの内...
-
Yハットの出し方やミュートと...
-
four-parameter近似式の求め方
-
統計ソフトStata17SEにおけるリ...
-
回帰式と近似式について
-
回帰モデルの予測精度と回帰デ...
-
重回帰分析・ヘドニックアプローチ
-
negative binomial regression
-
<統計>収量の要因がしりたい...
-
確率統計です。
-
numbersで重回帰分析をしたい
-
修正済み決定係数(R2乗)がマ...
-
原点を通る重回帰式について
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
決定係数がマイナスになる例っ...
-
切片あり回帰と切片なし回帰
-
回帰式と近似式について
-
ある1点で傾きが急激に変化する...
-
修正済み決定係数(R2乗)がマ...
-
回帰水を売ってる会社大丈夫か
-
Excel分析ツールでのポアソン回...
-
原点強制通過させたときの相関係数
-
Yハットの出し方やミュートと...
-
統計用語?
-
最小二乗法の傾きと切片について
-
残差について
-
実験データの分析について
-
重回帰分析で偏回帰係数を全て...
-
numbersで重回帰分析をしたい
-
ロジスティック回帰分析におけ...
-
エクセル 重回帰 グラフ
-
相関分析の相関係数と重回帰分...
-
重回帰分析の定数は、どっちの...
-
確率統計です。
おすすめ情報