多変量の正規分布同士を(分散異なる)比較するよい方法はないでしょうか。
分布は5次元で、5個の平均、分散を持っています。

分布同士が分離している、重なっていない、
また、重なっているのであればどの程度重なっているか
ということを示したいので、分布間の距離を測ればよいのかとは思って
いますが何を用いるのがよいでしょうか。

また、分布が多数ある場合と少数しかない場合を共通に評価できる
指標はないでしょうか。単純に分布間の距離を測るだけでは、
多数の分布があるとき、分布間距離は短くなり、分布が少数しかないときより
分離性が悪いことになってしまいます。
エントロピーなどを使って曖昧性のような評価ができないものかと
考えています。

何かアイデアをお持ちの方、よろしくお願いします。

このQ&Aに関連する最新のQ&A

A 回答 (2件)

> 5個の平均、分散を持っています


というところ。平均はともあれ、分散が5個というのがよく分からないけれど、共分散行列が対角行列だ、という意味かな?まあいいや。これはどうでも良いことです。

2つの分布の分離がどの位うまくできるかは、線形判別関数を作って、それで何%が誤って分類されるかで評価すれば良いでしょう。
 説明を簡単にするために、分布の分散が、どの次元も独立であって、しかも同じである、という場合を考えましょう。二つの分布の平均がベクトルm1, m2、(√分散)がσ1, σ2とすると、中心をm1とし、半径 kσ1の球と、中心をm2とし、半径 kσ2の球とがある。ここでkを調節して二つの球が接するようにします。この接平面が線形判別関数ですから、そこからはみ出すサンプルが「誤って分類されるサンプル」です。
 沢山の分布が同じ空間にある場合も、その内の2種類づつをペアにして考えれば良いんです。そのペアの分離がどの位うまくできるか。
 あとはご自分でやれそうですか?
    • good
    • 0
この回答へのお礼

回答ありがとうございました。

判別関数でこのように評価できるとは思っていませんでした。
ありがとうございました。
しかし、対象とするデータが「はみだすサンプル」がほとんどないデータ
なのです。そのため、この方法ではあまり有効に評価できないことが
わかりました。
また、分散共分散行列が分布により異なるので、多くの書物にかかれて
いることが、適用しにくくなっています。

まだ、試行錯誤中ですが回答ありがとうございました。

お礼日時:2001/01/16 01:52

サンプルの中には、はみ出す奴がないとしても、分散で議論している以上、理論分布(例えば正規分布)を仮定して居るんでしょう? だったら、何%はみだすか(危険率)は議論できるはず。


 直感的に言えば、その平均と共分散行列をもつデータをモンテカルロ法でうんと沢山生成してやれば、はみ出す奴が出る筈です。
 実用上、本質的には「どの位の危険率で線形判別可能か」以上に重要な指標などないと思いますよ。
    • good
    • 0
この回答へのお礼

ありがとうございました。実際に試してみます。

お礼日時:2001/01/18 20:58

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q確率分布・分散分析表の用語について

確率分布・分散分析表の用語で、
期待値Eの「E」
分散Vの「V」
平方和Sの「S」
平均平方Vの「V」
分散比Fの「F」
修正項CTの「CT」
等、「 」内の元の、(英語?)を知りたいです。

又、これらの一覧表が載っているHP等が有ったら知りたいです。

宜しくお願いします。

Aベストアンサー

私はかつて品質管理関係の仕事をしていた関係で統計用語の書籍を多少もっていますので、それで調べてみました。
ただしあまり数理統計学に強いわけではありませんので、ご容赦下さい。

 【期待値】  expectation (E)
 【分散】    variance (V)
 【平方和】  sum of squares (S)
 【平均平方】 mean square
   * この用語は「不偏分散」 unbiased estimate of variance と
    同じように用いられることもあるみたいで、分散のVかも
    知れません。
 【分散比】 ― 不明 ―
 【修正項】  correction term (CT)

参考URL: http://aoki2.si.gunma-u.ac.jp/Yogoshu/words.html

Q標本分散、普遍分散。t検定がサッパリです

大学の授業で統計を習っています。
今t検定をやっているのですがさっぱり分かりません。
参考に・・ともらったプリントも記号だらけで何が何だか…という具合です。
用語もいっぱいでてきて混乱してしまいました…
できればt検定をやさしく、本当に簡単に教えていただきたい(本を紹介してほしい)のですが、
とりあえず今分からないことを…。

標本分散と普遍分散の違いって何ですか?
同じだと思っているのですが、どうも違うような気がしまして…。

ご回答お願いします。

Aベストアンサー

統計難しいですよね。

数式をあまり使わずにt検定のことを知りたいのであれば、
吉田寿夫 1998 本当にわかりやすいすごく大切なことが書いてあるごく初歩の統計の本 北大路書房

がおすすめです。

個人的には、研究者になられないのでしたら、t検定を使える(解釈できる)レベルで理解していればいいのではないのかと思います。そう考えると、二つの群の平均値を比べて、統計的に差があるかどうかを調べる手法がt検定、と覚えておけば十分です。

標本分散と不偏分散について
標本分散は、標本における分散であり、不偏分散は母集団における分散であると解釈しておけばよいのではないかと思います。標本というのは母集団から取り出した(母集団を表している)サンプルのことです。

例えば、日本人の大学生の平均身長が知りたかったとします。北は北海道から、南は琉球まで、各大学に打診して、健康診断の結果を送ってもらい、平均値を出すというやり方が考えられます。しかし、現実的にはかなり手間がかかりますよね?そこで、現実的にとることが可能である自分の通っている大学の学生のデータから、日本の大学生全体の平均身長を推測するのです。自分の通っている大学の学生が標本にあたり、日本の大学生全体が母集団にあたるわけです。

標本分散は字のごとく、標本における分散のことです。一方、不偏分散は母集団の(推定している)分散のことです。計算式の分母がnとn-1で異なっていますよね?これについては、不偏分散は推定値なので、標本分散から推定するときに1引かれるんだ、ぐらいで理解しとけばいいのではないかと思います。

参考URL:http://www.amazon.co.jp/gp/product/476282125X/ref=pd_sim_b_1/250-5862250-2815410?ie=UTF8

統計難しいですよね。

数式をあまり使わずにt検定のことを知りたいのであれば、
吉田寿夫 1998 本当にわかりやすいすごく大切なことが書いてあるごく初歩の統計の本 北大路書房

がおすすめです。

個人的には、研究者になられないのでしたら、t検定を使える(解釈できる)レベルで理解していればいいのではないのかと思います。そう考えると、二つの群の平均値を比べて、統計的に差があるかどうかを調べる手法がt検定、と覚えておけば十分です。

標本分散と不偏分散について
標本分散は、標本におけ...続きを読む

Q距離を測るセンサについての質問ですが、

距離を測るセンサについての質問ですが、
10センチから20センチぐらいの間でいいので
その間を1ミリ単位の精度で測れるセンサはあるのでしょうか?
また存在したとしたらどれくらいの値段になるのでしょうか?

Aベストアンサー

No1さんのは超音波ですがレーザーの方が精度は良いです。距離は短いですが。
±0.15%フルスケールですから、10cmの時に0.15mmですね。

http://www.keyence.co.jp/appli/appli_sensor/ia/spec/
価格は\68,000とありますが10万円くらいみておけばいいかと。

無償でテスト機を借用できますのでよろしければ連絡してみてください。
ただしその後の営業活動がなかなかにしつこいですけど。


ちなみにNo1さんの回答は、価格は\8,000ではなく\80,000ですよね。
安くてびっくりしました。

参考URL:http://www.keyence.co.jp/appli/appli_sensor/ia/spec/

Q分散学習の効果について 勉強法についての質問 下のURLのような、分散学習やテスト効果を使った勉強法

分散学習の効果について 勉強法についての質問


下のURLのような、分散学習やテスト効果を使った勉強法についてどう思いますか?
皆さんの意見を教えてください!!
http://www.mo-book.com/2017/01/how-to-study.html

Aベストアンサー

博士論文で、英単語の記憶について、かなり似たような研究をした者です。
私の研究は、英単語を最初は、30分後に復習、次は、1日あけて復習し、3回目は、3日後に復習し4回目は一週間後に復習し、というようにだんだんと復習の間隔をあけながら、復習していく、というspaced rehearsalと呼ばれる復習方法の効果の測定です。
結果は、こうした復習方法は非常に効果があることがわかりました。
ですので、分散学習が記憶には効果的というのは大いにうなづけます。
結局、忘れかけてきたところで復習すると効果的なのですよね。分散学習には賛成します。

Q分布図の各プロットから回帰直線までの距離の求め方を教えてください。 例として以下のデータで作ったEX

分布図の各プロットから回帰直線までの距離の求め方を教えてください。
例として以下のデータで作ったEXCEL散布図で求めるの方法が知りたいです。

x y
1 1
2 2
3 3

Aベストアンサー

これでは、回帰直線

 y = x

の上に全て乗りますから、「距離」はすべてゼロです。

仮にデータが

x  y
1  1.1
2  1.8
3  3.2

なら、回帰直線を
  y = x
とすれば

x  y   距離
1  1.1  0.1
2  1.8  -0.2
3  3.2  0.2

となります。

エクセルで散布図と回帰直線を作りたいなら、こんなサイトを参考にしてください。(エクセルのバージョンでやり方が多少変わると思いますが、そこは自分で調べてください)
http://hs-www.hyogo-dai.ac.jp/~kawano/HStat/?2010%2F4th%2FExcel2


人気Q&Aランキング

おすすめ情報