プロが教えるわが家の防犯対策術!

ヒストグラムの分布形状が二山になったとき、見た目だけではなくエクセル関数を用いた数値として判断する方法はありますか?
よろしくお願いします。

A 回答 (4件)

#1です。



k-means法で分割した後、尤度で判断すると書きましたが、ギャップ関数で評価する方法もありました。

↓こちらに解説があります。しかし問題はエクセルでk-means法ができるかどうかです。VBでプログラムを書けば可能ですが・・・。

https://www.trifields.jp/how-to-decide-number-of …
    • good
    • 0
この回答へのお礼

何度も回答ありがとうございました。
プロの方の知識は難しくて中々理解できませんが、勉強して少しでも役立てたいと思います。

お礼日時:2021/07/27 23:17

こんなんありましたけど。


http://www.palaeo-soc-japan.jp/publications/aa69 …
エクセルでは無理かな?
    • good
    • 0
この回答へのお礼

わざわざリンク付けて頂きありがとうございました。
参考にさせて頂きます。

お礼日時:2021/07/27 23:15

#1です。



もし、異常検知をしたいのであれば・・・、やはり残念ながらエクセルではそんな高度なことはできませんけれども、ご参考まで。

定常的に従来は「ある分布」に従っていることがデータとして得られているとします。

①「ある分布」から200サンプルほど抽出しジョンソン変換によって正規分布に変換し、その変換式を記憶させます。
②その後は、200サンプルの移動窓法を用いながら、記憶したジョンソン変換を掛け、正規確率プロットを行い、逸脱を監視します。
二山目の集団が1割程度混入した段階で警告を出すことができます。

これは、先に回答した方法よりかなり敏感な検知方法となります。

https://www.ism.ac.jp/openhouse/2021/pre_event/2 …

↑この資料のP36~P41に事例が紹介されています。

あと、前の投稿の②の分離結果について、事例データのグラフを添付しておきます。二山かどうかの判断は前にも書いたようにBIC(ベイズ情報量規準)です。こちらの検知能力は保守的になります。
「ヒストグラムの分布形状が二山になったとき」の回答画像2
    • good
    • 0

企業で統計を推進する立場の者です。



Rだと数行のスクリプトで実現できますが、エクセルじゃ無理だと思います。

オーソドックスには2つの方法があります。

①1次元だけど、無理やりk-means法でk=2でクラスタリングし、
1山の正規分布と仮定したときの尤度と2山の正規分布と仮定したときの尤度を比較し、2山と仮定したときの方が尤度が大きければ二山と判断する。

②混合ガウス分布法(EMアルゴリズムを使う方法で、RではMclust()関数)を使って、1群から9群まで(9群というのはRのデフォルトです)分離を掛け、何群に分割したときのBICが一番小さいか(RはBICの逆数を使っていますが・・・)で判断する。

社内教育では②を推奨しています。
クラスター分析は分布の重なりを許容しませんが、混合ガウス分布はすそ野の重なりを許容して2山を検出します。

クラスター分析で2山分離を試みると、真の各平均値よりも互いに遠ざかり、真の各分散より分散は小さくなります。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!