多変量の正規分布同士を(分散異なる)比較するよい方法はないでしょうか。
分布は5次元で、5個の平均、分散を持っています。

分布同士が分離している、重なっていない、
また、重なっているのであればどの程度重なっているか
ということを示したいので、分布間の距離を測ればよいのかとは思って
いますが何を用いるのがよいでしょうか。

また、分布が多数ある場合と少数しかない場合を共通に評価できる
指標はないでしょうか。単純に分布間の距離を測るだけでは、
多数の分布があるとき、分布間距離は短くなり、分布が少数しかないときより
分離性が悪いことになってしまいます。
エントロピーなどを使って曖昧性のような評価ができないものかと
考えています。

何かアイデアをお持ちの方、よろしくお願いします。

このQ&Aに関連する最新のQ&A

A 回答 (2件)

> 5個の平均、分散を持っています


というところ。平均はともあれ、分散が5個というのがよく分からないけれど、共分散行列が対角行列だ、という意味かな?まあいいや。これはどうでも良いことです。

2つの分布の分離がどの位うまくできるかは、線形判別関数を作って、それで何%が誤って分類されるかで評価すれば良いでしょう。
 説明を簡単にするために、分布の分散が、どの次元も独立であって、しかも同じである、という場合を考えましょう。二つの分布の平均がベクトルm1, m2、(√分散)がσ1, σ2とすると、中心をm1とし、半径 kσ1の球と、中心をm2とし、半径 kσ2の球とがある。ここでkを調節して二つの球が接するようにします。この接平面が線形判別関数ですから、そこからはみ出すサンプルが「誤って分類されるサンプル」です。
 沢山の分布が同じ空間にある場合も、その内の2種類づつをペアにして考えれば良いんです。そのペアの分離がどの位うまくできるか。
 あとはご自分でやれそうですか?
    • good
    • 0
この回答へのお礼

回答ありがとうございました。

判別関数でこのように評価できるとは思っていませんでした。
ありがとうございました。
しかし、対象とするデータが「はみだすサンプル」がほとんどないデータ
なのです。そのため、この方法ではあまり有効に評価できないことが
わかりました。
また、分散共分散行列が分布により異なるので、多くの書物にかかれて
いることが、適用しにくくなっています。

まだ、試行錯誤中ですが回答ありがとうございました。

お礼日時:2001/01/16 01:52

サンプルの中には、はみ出す奴がないとしても、分散で議論している以上、理論分布(例えば正規分布)を仮定して居るんでしょう? だったら、何%はみだすか(危険率)は議論できるはず。


 直感的に言えば、その平均と共分散行列をもつデータをモンテカルロ法でうんと沢山生成してやれば、はみ出す奴が出る筈です。
 実用上、本質的には「どの位の危険率で線形判別可能か」以上に重要な指標などないと思いますよ。
    • good
    • 0
この回答へのお礼

ありがとうございました。実際に試してみます。

お礼日時:2001/01/18 20:58

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q√1+√2+√3+…+√nの漸近展開

http://en.wikipedia.org/wiki/Euler-Mascheroni_constant
によると
1+1/2+1/3+…+1/n
=γ+log(n)+(1/2n)-Σ[k=2,∞](k-1)!C(k)/n(n+1)…(n+k-1)
という漸近展開があるそうです。漸近展開とは、簡単に言うと、nが十分に大きい場合の近似式です。

http://en.wikipedia.org/wiki/Stirling%27s_approximation
によると
n!
=√(2πn)*(n/e)^n*e^λ(n)
という漸近展開があるそうです。

ところで、
√1+√2+√3+…+√n
などの漸近展開をご存知の方がいらっしゃれば教えてください。

y=√xのグラフとy=√(x+1)のグラフではさまれた面積と考えることで、
√1+√2+√3+…+√n
=(2/3)n√n+…
となることはわかるのですが、
√1+√2+√3+…+√n
=(2/3)n√n+α√n+…
とさらに精密にしたいとき、αがどういった定数になるのかわかりません。

http://en.wikipedia.org/wiki/Euler-Mascheroni_constant
によると
1+1/2+1/3+…+1/n
=γ+log(n)+(1/2n)-Σ[k=2,∞](k-1)!C(k)/n(n+1)…(n+k-1)
という漸近展開があるそうです。漸近展開とは、簡単に言うと、nが十分に大きい場合の近似式です。

http://en.wikipedia.org/wiki/Stirling%27s_approximation
によると
n!
=√(2πn)*(n/e)^n*e^λ(n)
という漸近展開があるそうです。

ところで、
√1+√2+√3+…+√n
などの漸近展開をご存知の方がいらっしゃれば教えてください。

y=√xのグラフとy=√(x+1)のグラ...続きを読む

Aベストアンサー

ちなみに今の場合は定積分からも「α=1/2」が想像できます.
まず
∫[0→1] √x dx = 2/3
の左辺を矩形公式で和に変換すると
(1/n)Σ(k=1→n) √(k/n) = 2/3
となり, 両辺に n^(3/2) を掛けると
√1+√2+√3+…+√n = (2/3)n^(3/2)
になります. ただし矩形公式では区間の幅に比例する誤差があるので, 実際には
(1/n)Σ(k=1→n) √(k/n) = 2/3 + O(1/n)
です (O(1/n) は「1/n に比例する項」というくらいの意味).
ここで, 左辺の積分を今度は台形公式で和に変換すると精度が上がって
(1/n)Σ(k=1→n) (1/2)(√[(k-1)/n]+√(k/n)) = (2/3) + O(1/n^2)
になります. ここで同じように両辺に n^(3/2) を掛けて左辺を整理すると
√1 + √2 + … + √(n-1) + (1/2)√n = (2/3)n^(3/2) + O(n^(-1/2))
となり, 両辺に (1/2)√n を加えることで
√1+√2+√3+…+√n = (2/3)n^(3/2) + (1/2)n^(1/2)
まで持っていけます.
ああ, たぶん a が正なら自然数かどうかに関係なく
Σk^a = [1/(a+1)]n^(a+1) + (1/2)n^a + …
となると思いますよ.

ちなみに今の場合は定積分からも「α=1/2」が想像できます.
まず
∫[0→1] √x dx = 2/3
の左辺を矩形公式で和に変換すると
(1/n)Σ(k=1→n) √(k/n) = 2/3
となり, 両辺に n^(3/2) を掛けると
√1+√2+√3+…+√n = (2/3)n^(3/2)
になります. ただし矩形公式では区間の幅に比例する誤差があるので, 実際には
(1/n)Σ(k=1→n) √(k/n) = 2/3 + O(1/n)
です (O(1/n) は「1/n に比例する項」というくらいの意味).
ここで, 左辺の積分を今度は台形公式で和に変換すると精度が上がって
(1/n)Σ(k=1→n) (1/2)(√[(k-1)/n]+√(k...続きを読む

Q確率分布・分散分析表の用語について

確率分布・分散分析表の用語で、
期待値Eの「E」
分散Vの「V」
平方和Sの「S」
平均平方Vの「V」
分散比Fの「F」
修正項CTの「CT」
等、「 」内の元の、(英語?)を知りたいです。

又、これらの一覧表が載っているHP等が有ったら知りたいです。

宜しくお願いします。

Aベストアンサー

私はかつて品質管理関係の仕事をしていた関係で統計用語の書籍を多少もっていますので、それで調べてみました。
ただしあまり数理統計学に強いわけではありませんので、ご容赦下さい。

 【期待値】  expectation (E)
 【分散】    variance (V)
 【平方和】  sum of squares (S)
 【平均平方】 mean square
   * この用語は「不偏分散」 unbiased estimate of variance と
    同じように用いられることもあるみたいで、分散のVかも
    知れません。
 【分散比】 ― 不明 ―
 【修正項】  correction term (CT)

参考URL: http://aoki2.si.gunma-u.ac.jp/Yogoshu/words.html

Q漸近展開とテイラー展開

漸近展開とテイラー展開の違いを教えてください。

Aベストアンサー

直感的でよければ、参考URLのグラフを見るとわかります。

参考URL:http://homepage1.nifty.com/gfk/Zenkin_Tenkai.htm

Q標本分散、普遍分散。t検定がサッパリです

大学の授業で統計を習っています。
今t検定をやっているのですがさっぱり分かりません。
参考に・・ともらったプリントも記号だらけで何が何だか…という具合です。
用語もいっぱいでてきて混乱してしまいました…
できればt検定をやさしく、本当に簡単に教えていただきたい(本を紹介してほしい)のですが、
とりあえず今分からないことを…。

標本分散と普遍分散の違いって何ですか?
同じだと思っているのですが、どうも違うような気がしまして…。

ご回答お願いします。

Aベストアンサー

統計難しいですよね。

数式をあまり使わずにt検定のことを知りたいのであれば、
吉田寿夫 1998 本当にわかりやすいすごく大切なことが書いてあるごく初歩の統計の本 北大路書房

がおすすめです。

個人的には、研究者になられないのでしたら、t検定を使える(解釈できる)レベルで理解していればいいのではないのかと思います。そう考えると、二つの群の平均値を比べて、統計的に差があるかどうかを調べる手法がt検定、と覚えておけば十分です。

標本分散と不偏分散について
標本分散は、標本における分散であり、不偏分散は母集団における分散であると解釈しておけばよいのではないかと思います。標本というのは母集団から取り出した(母集団を表している)サンプルのことです。

例えば、日本人の大学生の平均身長が知りたかったとします。北は北海道から、南は琉球まで、各大学に打診して、健康診断の結果を送ってもらい、平均値を出すというやり方が考えられます。しかし、現実的にはかなり手間がかかりますよね?そこで、現実的にとることが可能である自分の通っている大学の学生のデータから、日本の大学生全体の平均身長を推測するのです。自分の通っている大学の学生が標本にあたり、日本の大学生全体が母集団にあたるわけです。

標本分散は字のごとく、標本における分散のことです。一方、不偏分散は母集団の(推定している)分散のことです。計算式の分母がnとn-1で異なっていますよね?これについては、不偏分散は推定値なので、標本分散から推定するときに1引かれるんだ、ぐらいで理解しとけばいいのではないかと思います。

参考URL:http://www.amazon.co.jp/gp/product/476282125X/ref=pd_sim_b_1/250-5862250-2815410?ie=UTF8

統計難しいですよね。

数式をあまり使わずにt検定のことを知りたいのであれば、
吉田寿夫 1998 本当にわかりやすいすごく大切なことが書いてあるごく初歩の統計の本 北大路書房

がおすすめです。

個人的には、研究者になられないのでしたら、t検定を使える(解釈できる)レベルで理解していればいいのではないのかと思います。そう考えると、二つの群の平均値を比べて、統計的に差があるかどうかを調べる手法がt検定、と覚えておけば十分です。

標本分散と不偏分散について
標本分散は、標本におけ...続きを読む

Qe^(1/z)の漸近展開の求め方

独学中のものです。
f(z)~(a_0)+(a_1)/z+(a_2)/z^2+…+(a_n)/z^n …(1)
関数f(z)の漸近展開が(1)のとき、係数(a_0),(a_1),(a_2),…は次のようにして求められる。
『lim[|z|→∞]f(z)=a_0
lim[|z|→∞]z{f(z)-a_0}=a_1
lim[|z|→∞]z^2{f(z)-(a_0)-(a_1)/z}=a_2
 ………………………………………………
          (ただし z∈D )    』…(2)
このようにf(z)が漸近展開を持てば、それは一意的に定められるが、逆は成り立たない。すなわち相異なる二つの関数が同一の漸近展開を持つことがある。
たとえば|argz|<Π/2ならばRe(z)>0であって、そこでlim[|z|→∞]e^z=∞ である。これに注意して(2)を用いると、|z|>0, |argz|<Π/2 において、
e^(1/z)~1+1/(z・1!)+1/(z^2・2!)+…  …(3)
e^(1/z)+e^(-z)~1+1/(z・1!)+1/(z^2・2!)+… …(4)
すなわち、この二つの関数は同一の漸近展開を持っている。以上は教科書からの抜粋です。

(3)式の右辺第二項の係数(1/1!)や第三項の係数(1/2!)が(2)式の第2、第3式からどのような過程で求められるのか、わかりやすく教えて下さい。
分かり辛い書き方ですみませんが、宜しくお願いします。

独学中のものです。
f(z)~(a_0)+(a_1)/z+(a_2)/z^2+…+(a_n)/z^n …(1)
関数f(z)の漸近展開が(1)のとき、係数(a_0),(a_1),(a_2),…は次のようにして求められる。
『lim[|z|→∞]f(z)=a_0
lim[|z|→∞]z{f(z)-a_0}=a_1
lim[|z|→∞]z^2{f(z)-(a_0)-(a_1)/z}=a_2
 ………………………………………………
          (ただし z∈D )    』…(2)
このようにf(z)が漸近展開を持てば、それは一意的に定められるが、逆は成り立たない。すなわち相異なる二つの関数が同一の漸近展開を持つことがある。
たとえば|argz|...続きを読む

Aベストアンサー

|z| → ∞ ってことは, x = 1/z とおくと x → 0 ですね. そこから, 「e^x は何回微分しても e^x である」とか「L'Hospital の定理」とかを使えば
lim z [e^(1/z) - 1] = lim (e^x-1)/x = e^0 = 1 とか
lim z^2 [e^(1/z) - (1 + 1/z)] = lim (e^x - (1 + x))/x^2 = lim (e^x - 1) / (2x) = 1/2 とか
計算できます (z に対する lim は → ∞, x に対する lim は → 0 で).
もっとがんばれば Laurent 展開までいっちゃいますけど....

Q距離を測るセンサについての質問ですが、

距離を測るセンサについての質問ですが、
10センチから20センチぐらいの間でいいので
その間を1ミリ単位の精度で測れるセンサはあるのでしょうか?
また存在したとしたらどれくらいの値段になるのでしょうか?

Aベストアンサー

No1さんのは超音波ですがレーザーの方が精度は良いです。距離は短いですが。
±0.15%フルスケールですから、10cmの時に0.15mmですね。

http://www.keyence.co.jp/appli/appli_sensor/ia/spec/
価格は\68,000とありますが10万円くらいみておけばいいかと。

無償でテスト機を借用できますのでよろしければ連絡してみてください。
ただしその後の営業活動がなかなかにしつこいですけど。


ちなみにNo1さんの回答は、価格は\8,000ではなく\80,000ですよね。
安くてびっくりしました。

参考URL:http://www.keyence.co.jp/appli/appli_sensor/ia/spec/

Q漸近展開について

漸近展開をo(x^3)を用いて書き表せ.

(1+x^2)cosx

という問題なのですが,

cosxのx^3の項までの漸近展開を求め, 用いることで

(1 + x^2) cos(x)
= (1 + x^2) (1 - 1/2 x^2 + o(x^3)) --- (1)

となったのですが, この段階で止まっています...

[答え]としては, ここから更に

= 1 - 1/2 x^2 + o(x^3) + x^2 - 1/2 x^4 + o(x^5) となり,
= 1 + 1/2 x^2 + o(x^3) となっています

どのようにすれば (1) から[答え]の形になるのでしょうか.

よろしくお願いします.

Aベストアンサー

o(xのn乗) というのは、
f(x)/(xのn乗)→0 (質問の場合、x→0 のとき)
となる f(x) の総称です。
ですから、1・o(xの3乗) も o(xの3乗) になるし、
(xの2乗)・o(xの3乗) は o(xの5乗) になります。
f(x)/(xの3乗)→0 なら、
(xの2乗)f(x)/(xの5乗)→0 ですからね。
o(xの3乗)+o(xの5乗) が o(xの3乗) になることも
同様に示せるでしょう。

Q分散学習の効果について 勉強法についての質問 下のURLのような、分散学習やテスト効果を使った勉強法

分散学習の効果について 勉強法についての質問


下のURLのような、分散学習やテスト効果を使った勉強法についてどう思いますか?
皆さんの意見を教えてください!!
http://www.mo-book.com/2017/01/how-to-study.html

Aベストアンサー

博士論文で、英単語の記憶について、かなり似たような研究をした者です。
私の研究は、英単語を最初は、30分後に復習、次は、1日あけて復習し、3回目は、3日後に復習し4回目は一週間後に復習し、というようにだんだんと復習の間隔をあけながら、復習していく、というspaced rehearsalと呼ばれる復習方法の効果の測定です。
結果は、こうした復習方法は非常に効果があることがわかりました。
ですので、分散学習が記憶には効果的というのは大いにうなづけます。
結局、忘れかけてきたところで復習すると効果的なのですよね。分散学習には賛成します。

Q分布ってどう使い分ければ??

特定の時間内に駅の券売機に訪れる人数の確率分布として正しいのは
一様分布 正規分布 ポアソン分布 カイ2乗分布 t分布 標準正規分布
一様分布なわけがないことはわかりますが、ほかはまったくわかりません
何を基準に選んだらよいのでしょうか?
そもそも正規分布と標準正規分布は何が違うのでしょう?

Aベストアンサー

ポアソン分布がそれっぽいですね。
Wikipediaの「ポアソン分布」の説明で例として
「1時間に特定の交差点を通過する車両の台数」
が挙げられていました。
http://ja.wikipedia.org/wiki/%E3%83%9D%E3%82%A2%E3%82%BD%E3%83%B3%E5%88%86%E5%B8%83

ただ、#1様の回答にもあるように、理屈通りに行かないことがあるのが統計学ですから、目的によって(分布形を想定して何らかの検定を行うとか)によっては近似的に他の分布に従うと考えた方が良い場合もあるかと思います。

Q分布図の各プロットから回帰直線までの距離の求め方を教えてください。 例として以下のデータで作ったEX

分布図の各プロットから回帰直線までの距離の求め方を教えてください。
例として以下のデータで作ったEXCEL散布図で求めるの方法が知りたいです。

x y
1 1
2 2
3 3

Aベストアンサー

これでは、回帰直線

 y = x

の上に全て乗りますから、「距離」はすべてゼロです。

仮にデータが

x  y
1  1.1
2  1.8
3  3.2

なら、回帰直線を
  y = x
とすれば

x  y   距離
1  1.1  0.1
2  1.8  -0.2
3  3.2  0.2

となります。

エクセルで散布図と回帰直線を作りたいなら、こんなサイトを参考にしてください。(エクセルのバージョンでやり方が多少変わると思いますが、そこは自分で調べてください)
http://hs-www.hyogo-dai.ac.jp/~kawano/HStat/?2010%2F4th%2FExcel2


人気Q&Aランキング