書籍、続・わかりやすいパターン認識の10章p207~208にある凸クラスタリングの実験をpythonで実装して実際にやってみました。その結果書籍の内容と少し違った結果になったところとかもあり、その対応の仕方で疑問の残ったところもあるので質問させていただきました。
まず、図10.6のiter=0の500個の散布図は、pythonのnumpy.random.multivate_normal()関数を使って似たようなものを作りました。また、πiで、(0.001/samples)以下のものは強制的に0にして削除しながら、その都度、式(10.37)で再正規化を行いました。(samplesはπi != 0のπiの個数で500から徐々に減っていきます。)初期条件などは、書籍のものに合わせて行っています。
この結果、私のやってみたものでは、iter=4000で、12クラスタが残りました。これらの点は、5クラスタの中の3クラスタが中心付近に複数の点があります。書籍ではこの段階で5個のクラスタに収束したと書かれています。(また図10.6のiter=4000で3つ円の輪郭線がその他の2つのものより太く描かれているようですが、これはどういう意味なのでしょうか?)12クラスタ残った後の処理をどのようにしたら一番良いものか分かりかねています。ちなみに、σやiterの回数や上の閾値を色々変えてやってみたのですが、私のものでは、5クラスタには収束しませんでした。後この状態で、πi > 0.01の選別を行うと、6クラスタになりました。(真ん中のものだけ中心付近に2点残りました。πi = 0.1701 と πi = 0.0339 で足すと0.2に近い値になり、2点の重心も平均すると(0, 0)に近い値になります。
書籍に書かれているような希望するクラスタ数に収束しなかった場合のその後の処理の仕方について、詳しい方がいられたら、御教示願えればと思います。(他の書籍でも色々調べてみたのですが、この部分に関する記述は見つけることができませんでした。よろしくお願い致します。)
No.1ベストアンサー
- 回答日時:
なにも併合処理しない凸クラスタリングは、そうなりますよ。
書籍で5つにクラスタリングできたというのも、あきらかに併合すべきクラスタを併合すると5つになった、ということです。
凸クラスタリングは、標準偏差σが全クラスタで共通と仮定しているわけですが、
これは、言うなれば解像度がσで固定の虫眼鏡を使って世界を見ることにします、といっているわけで、
原理的に、0.3σ程度以下の2点はそもそも区別できないです。
なんで、単純に、0.3σ程度より近い距離にある2つのクラスタは、併合してしまえばよいです。
そうですよね、
併合したクラスタの正規分布の輪郭線を太線で描いているんですよね。
(併合しなかったものは、普通の線で描いている。)
これですっきりしました。
ありがとうございました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- その他(言語学・言語) 大昔に使われていた和製独語 復活して欲しいと思いませんか? 英語化がどんどん現れてきたため、私がいつ 8 2023/08/15 06:31
- 相続・遺言 遺言執行に法定相続人の戸籍謄本が必要と聞きましたが・・ 5 2023/02/20 12:58
- その他(法律) 共有者と弁護士費用の折半分の金額について、意見が分かれています。 2 2022/04/03 15:11
- インターネットビジネス ペット用品のネットショップ運営で悩んでいる事があります。 詳しい方いらっしゃいましたらご教授の程宜し 2 2022/07/11 12:03
- ネットワーク 回線を体系的に勉強する方法。 ネットワークを勉強している者です。 ネットワークを「体系的に」学習する 3 2022/11/26 20:36
- その他(結婚) 急に結婚話を覆した彼女 どういう心理? 14 2023/02/21 15:48
- 弁護士・行政書士・司法書士・社会保険労務士 相続手続きの各分野における専門家について 1 2022/07/08 16:19
- 戸籍・住民票・身分証明書 改製原戸籍について 6 2022/09/03 09:37
- 新卒・第二新卒 就活 新卒 自己PR 強み 添削お願いします。 以下の文章で自己PRを書いてみたのですが、どこが競争 3 2023/02/25 21:27
- 経済 ドイツ人の平均可処分所得は2017年頃2万2657€(当時レートで290万円)でしたが今いくら? 3 2022/10/06 21:40
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
ディスク上のサイズの乖離が大...
-
新規作成したPostgresqlデータ...
-
ヤフーショッピングでPayPay支...
-
SQLServerへの接続子による違い...
-
Windows版 pg_dumpの結果をログ...
-
tar.gzファイルのリストアについて
-
PostgreSQLについて教えてくだ...
-
Query OK, 0 rows affected
-
LinuxからWindowsへのリストア...
-
pg_restoreでエラー
-
PostgreSQLの再インストールに...
-
複数カラムを跨いだCOUNTができ...
-
SQLiteファイルへの同時アクセ...
-
teraterm上でsqlplusにログイン...
-
IDの払い出し(文字列)
-
ガス給湯器のエラーコードにつ...
-
エクセルVBA_ADO「ファイアホー...
-
リコーimagioneo630 エラーs...
-
Postgres:LinuxからWinへのDB移行
-
EXPORTファイルのINITIAL EXTEN...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
ディスク上のサイズの乖離が大...
-
Windows上のPostgreSQLの完全削...
-
新規作成したPostgresqlデータ...
-
フルバキュームって・・・
-
クラスタと冗長化の違いって何...
-
2拠点間でクラスタリング
-
Postgresql 新規作成したサーバ...
-
pgAdmin3でDB作成時のcollation...
-
ディスクのフォーマットを行う...
-
クラスタ分析 結果の安定性に...
-
凸クラスタリングについて
-
ヤフーショッピングでPayPay支...
-
Windows版 pg_dumpの結果をログ...
-
oracle spool SJIS → UTF-8
-
Query OK, 0 rows affected
-
PostgreSQLについて教えてくだ...
-
ACCESSのフォームだけを起動す...
-
pg_restoreでエラー
-
createdbでいきなりつまづいて...
-
ファイルに記述されている複数...
おすすめ情報