アプリ版:「スタンプのみでお礼する」機能のリリースについて

決定木分析(分類木)について



決定木分析において、正分類率は、どの程度(何パーセント)で良好な分析となるのでしょうか?
基準はあるのでしょうか?

A 回答 (2件)

使い物になるかどうか、というのが基準です。

すなわち、応用の目的による、ってことです。分類が間違ってたら100万人死ぬぞという場合と、どの馬券を買うと勝率が上がるかなという場合じゃ、全然違うでしょ。
    • good
    • 0

企業でSQCを推進する立場の者です。

博士(工学)です。

いやいや、使い物になるかどうかではなく、元データの問題です。

Cクラス分類器は決定木であってもランダムフォレストであっても、それらの性能は誤識別率で相対比較はできても絶対評価はできません。なぜなら、元データが空間中に完全に分離して存在していれば、識別境界はしっかりと分離するように布置できますが、元データが空間中で混合して存在していたら、しっかり分離することはできません。例えば、2つの群が平均が同じで分散だけが違う、という2山だったとしたら、これを分離することは不可能です。

ですから、誤識別率が5%以下なら上手く分離できたとかいう言い方は、何ら根拠の無いものです。識別器の性能なのか、データの善し悪しなのか、分からないからです。
    • good
    • 0
この回答へのお礼

回答ありがとうございます。
正分類率が、分析の精度を測れない?のは、わかったのですが、内容が難しくて理解できませんでした。
ご回答の内容を再度勉強させていただきます。

お礼日時:2019/01/19 23:22

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!