dポイントプレゼントキャンペーン実施中!

【急募】
掲題のとおり、Rを使ったはずれ値検出を行っているのですが、現在はプロットして判明した異常値をエクセルから手作業で取り除いています。手作業が入ることにより、ミスする可能性も増えますし、
何より効率が悪いです。
Rのコンソール上で、異常だと判断した値を取り除いて新たなデータを作成する方法をご教示ください。


・参考
現状、以下のような手順で異常値を検出しています。
1.全データの平均を求める
2.全データの分散を求める
3.異常値の除去
4.1~3の作業をあと2回繰り返す。
5.最終的に残った値の平均、分散を正常モデルとする。
6.正常モデルと新たに取得したデータを比較して、異常検知を行う。

A 回答 (1件)

外れ値検出の基準は?


とりあえず3σ外を外れ値としますか。
全データをxとします。質問の1-3は次でできます。
m<-mean(x)
s<-sd(x)
x<-x[(m-3*s<=x)&(x<=m+3*s)]
    • good
    • 1

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!