正規化相関法と正規化相関係数の式の内容について詳しく教えて下さい。

このQ&Aに関連する最新のQ&A

A 回答 (2件)

> 数式自身のもっている意味がよくわかりません



ああ、わかった。「相関係数」が分からないんですね。

「相関係数」は、統計で使う *代表値* のひとつです。
ふたつの標本値がどれくらい似た傾向を持っているかを
あらわす代表値として良く使われます。

式を書くのはかったるいし、テキストだけだとイメージが
わかないので、統計で使う「代表値」を解説している
ページを探してみました(→参考URL)。

真ん中あたりにある「標本相関係数」の定義をみてください。


この式のXを li に、Yを Mi に読み替えて、式を変形した
のが、補足に書いてもらった r(u,v) の式になります。

統計を知らないと、変形が難しいかもしれないので、一部分だけ
解説しておきます。

相関係数の分母の左側、Σ(Xi-XX)^2 の変形を考えます。本当は
_
X と書きたいのだけれど、テキストでは書きにくいので、XX と
書いています。これは、X の平均を表していて、以下の定義に
なります。

  XX = ΣXi ÷ n

で、話を戻して、式の変形です。Σ(Xi-XX)^2 で Σ は全体に
2乗も含めてかかっています。より正確に書くと

 Σ [ (Xi - XX)^2 ]
=Σ [ Xi^2 - 2 Xi XX + XX^2 ]
=Σ Xi^2 - 2 XX Σ Xi + n XX^2

ここで、Σ XX^2 → n XX^2 です。XX^2 は定数ですから、
シグマを取ると ×n ですね。続けます。

さっき書いた平均の定義をみてください。式を変形すると

  n XX = Σ Xi

になるのが分かるでしょうか。これを先ほどの式の第二項に
適用すると、

 Σ Xi^2 - 2 XX Σ Xi + n XX^2
=Σ Xi^2 - 2 XX n XX + n XX^2
=Σ Xi^2 - 2 n XX^2 + n XX^2

で、第二項と第三項が n XX^2 で括れますから、

 Σ Xi^2 - 2 n XX^2 + n XX^2
=Σ Xi^2 - n XX^2

です。平均の定義を思い出して XX を Σ Xi で置きかえると、

 Σ Xi^2 - n XX^2
=Σ Xi^2 - n (Σ Xi ÷ n)^2
=Σ Xi^2 - (Σ Xi)^2 ÷ n

です。同様に、分母の右側、分子を変形して、分母・分子に
n をかけると、補足してもらった式になります。

参考URL:http://econom01.cc.sophia.ac.jp/sda/correg.htm
    • good
    • 0
この回答へのお礼

大変参考になりました。
有り難うございました。

お礼日時:2001/04/19 22:35

あまり詳しくないのですが、画像処理の話をしてます?


たしか、物体の位置検出をするための手法だったはず。

あらかじめ、決まったパターンの画像を用意しておいて、
それと、対象画像との相関係数(*)を求める。

  (*) 相関係数は、統計で使われているものと同じ
    ある画素の位置のパターン画像と対象画像を
    ペアとみなして、相関係数を求めるはず

相関係数はわかります?

この回答への補足

モデルと、画像オフセットでの対応する部分との相関係数rは以下のようになります。

r(u,v)=[NΣIi・Mi-(ΣIi)・(ΣMi)]/[{NΣIi^2-(ΣIi)^2 }・{NΣMi^2-(ΣMi)^2}]^1/2

ここで、N:ピクセルの総数
Ii:(u+xi,v+yi)での画像ピクセル値
(u,v)は画像オフセット
Mi:相対オフセット(xi,yi)での対応するモデルピクセル値

モデルと対象画像が「完全な一致」の場合r=1.0、
「完全な不一致」の場合r=-1.0となるようなんですけど…、
Ii=Miであれば、「完全な一致」し、すべてのピクセル値が同じで
Ii=-Mi であれば「完全な不一致」、つまり明暗が完全に反転している。
ということは分かるんですが、
数式自身のもっている意味がよくわかりません。

補足日時:2001/04/19 18:50
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

QQC活動について教えてください

職場でQC活動を始めることになりました。まだQC活動が立ち上がって間もないので、どのように活動していけばいいのかよくわかりません。
・QC活動のコツ
・QC活動の難しい点
・QC活動の魅力
を教えてください。

Aベストアンサー

私は、工学部出身ですので、品質管理という側面からですが、

QC七つ道具

・特性要因図
・パレート図
・グラフ
・チェックシート
・ヒストグラム
・散布図
・管理図


新QC七つ道具

・連関図法
・系統図法
・マトリックス図法
・親和図法
・アローダイヤグラム法
・PDPC法
・マトリックス・データ解析法

大手企業でないと新QC七つ道具は行使しないのが現実です。

>・QC活動のコツ
>・QC活動の難しい点
>・QC活動の魅力

従業員ひとりひとりの協力が必要であるとともに、協力なくしては意味がありません。
問題・目標などを掲げ、従業員の共通の目標を示すことが必要です。

たくさんの書籍も出版されていますので、書籍を参考にされても良いと思います。

参考までにURLも添付しておきます。

http://www1.harenet.ne.jp/~noriaki/link72-1.html

参考URL:http://www1.harenet.ne.jp/~noriaki/link72-1.html

私は、工学部出身ですので、品質管理という側面からですが、

QC七つ道具

・特性要因図
・パレート図
・グラフ
・チェックシート
・ヒストグラム
・散布図
・管理図


新QC七つ道具

・連関図法
・系統図法
・マトリックス図法
・親和図法
・アローダイヤグラム法
・PDPC法
・マトリックス・データ解析法

大手企業でないと新QC七つ道具は行使しないのが現実です。

>・QC活動のコツ
>・QC活動の難しい点
>・QC活動の魅力

従業員ひとりひとりの協...続きを読む

Q正規分布でないときピアソンの相関係数を使いたいのですが。

文献には、ピアソンの相関係数は
・連続変数
・正規分布に従う。
時に使い、それ以外はスピアマンの順位相関係数を使うとありますが、正規分布をとらないときピアソンの相関係数を使うと問題がありますか?心理学では正規分布の条件は無視した論文もあると聞いたことがあるのですが。どうしてもピアソンで行いたいので、もし、無視できるくぐりぬけかたがあれば教えてください。


都市の「汚染物質排出量」と「イオン濃度」のあいだで相関係数を調べました。
サンプル数は29で「イオン濃度」はおおまかに正規分布をとるのですが「汚染物質排出量」では中央が少なく正規分布をとりませんでした。
相関係数はそれぞれ、ピアソンは、0.67で、スピアマンでは0.56です。
ともにp<0.01水準で有意でした。
どうか、分かる方がいましたら教えてください。お願いします。

Aベストアンサー

今.子供に統計パッケージを作るように話しているので.手持ちがほとんどありません。
簡単な例としては.繰り返し5点以下.計数型.等間隔(だと思いますが.子細忘却)では.
管理図法
が.二項分布とかポアソン分布.(分布名忘却)の場合の相関のようなもの(連)の使い方です。7点連続で同じ傾向(上昇傾向・下降傾向等)がある場合に.有為と見ます。

出展はどうでもいいですね。大体の品質管理関係には載っていますから。

次が.計算したことがありませんので.条件がわかりません。出展が
古川.新版医学への統計学.1993.朝倉.isbn 4-254-12546-1 c3341
p234付近

Jonckheere の順位和検定
Wilcoxon の順位和検定

自分で整列をする気分になれないのであれば.ソフト付きの本として
出版社他不明(手元にCDしかないため)
コンピュータプログラムによるノンパラメトリック統計法

ちっょと.手持ちのデータ(自動収集)に合わせるために.子供にソフトを作るように指示しているので手元に本がないのです。
多分.同名ではないかと思いますので.検索サイトで調べてください。検索サイトとしては
http://www.books.or.jp/
があります。

今.子供に統計パッケージを作るように話しているので.手持ちがほとんどありません。
簡単な例としては.繰り返し5点以下.計数型.等間隔(だと思いますが.子細忘却)では.
管理図法
が.二項分布とかポアソン分布.(分布名忘却)の場合の相関のようなもの(連)の使い方です。7点連続で同じ傾向(上昇傾向・下降傾向等)がある場合に.有為と見ます。

出展はどうでもいいですね。大体の品質管理関係には載っていますから。

次が.計算したことがありませんので.条件がわかりません。出展が
古...続きを読む

Qエクセルの相関性の分析にかんして

エクセルの分析の仕方について質問があります。
以下の図のように、数字ではなく、属性を書き込んだデータベースの任意の項目の相関性を割り出す方法、またはどのような分析方法を用いればいいか教えて下さい。
たとえば、以下のエクセルから”曲調Rの場合、ビートが8分の確率は66%4分の確率は12%・・・”等のように任意の要素の相関性を知りたいと考えています。

Aベストアンサー

》 以下のエクセルから”曲調Rの場合、ビートが8分の確率は66%4分の確率は12%
「以下のエクセルから」どのような計算式からお示しの確率数値が得られるのですか?
単にデタラメに書いてみただけ?

Q相関係数について

相関係数(ピアソンの積率相関係数)のp値とは何ですか?
文献の解釈をする上で、このことが分からなくて困っています。統計学の本などを調べてみたのですが、分かりませんでした。回答お願いします。

Aベストアンサー

心理か教育関係の学生さんですか?
そうだと仮定してあなたが文献解釈に困らない程度のザックリとした説明をします。

まず、相関係数とは、ある2つの事象が相互にどの程度の相関関係を持っているかを示す値だということ、そして、これは-1<α<1の間の値で算出されることは知っていますね。

で、通常、この値が1(または-1)に近いほど、2つの事象には「相関関係がある」と言うわけですが、実はこれだけではデータとしてはダメなのです。ここにp値が出てきます。

p値は「仮に2つの事象が本当はぜーんぜん無関係だとした場合でも、このような相関係数が得られる【確率】はどのくらいあるか」という認定をする数字です。
つまり、2つの事象が、本当は無関係なんだけど、何らかの偶然で高い相関係数が出てしまう場合だってあり得ますよね。それを考慮して下さい、ということです。

例えば、AとBという2つの事象について積率相関係数を求めました。0.85だったとしましょう。
「おおお、両者には強い相関関係があるんだ!」とやってしまいますよね。でも「ちょっと待ったぁ! p値はいくつだい?」と尋ねられます。

p値=0.17だったとしましょう。
そうすると、「AとBの2つが本当は無関係なんだけど、何らかの偶然(とか、データの偏りなど)によって、0.85という相関係数が出てしまう確率が0.17(17%)ありますよ」ということになるのです。

通常p値が0.05(95%以下の有意性)を超えた場合にはそのデータは採用しません。つまりあまりにも偶然が介在する余地が多すぎるからです。さっきの例で言えば、AとBの2つの事象が無関係でも、相関係数が0.85と出てしまう確率が17%もあるとしたら、そんなデータで何かものを言うのはおっかないですよね。

初心者が混乱するのは、p値が大きくなる=データの有意性が小さくなる、という関係であるにもかかわらず、「有意確率」という表現が使われるためです。
まぁ、「文献に出てきた相関係数の怪しさの度合い」を示していると思っていれば、とりあえず文献を読む程度なら良いでしょう。だからp値は小さいほど良いデータなのです。

心理か教育関係の学生さんですか?
そうだと仮定してあなたが文献解釈に困らない程度のザックリとした説明をします。

まず、相関係数とは、ある2つの事象が相互にどの程度の相関関係を持っているかを示す値だということ、そして、これは-1<α<1の間の値で算出されることは知っていますね。

で、通常、この値が1(または-1)に近いほど、2つの事象には「相関関係がある」と言うわけですが、実はこれだけではデータとしてはダメなのです。ここにp値が出てきます。

p値は「仮に2つの事象が本当はぜーんぜ...続きを読む

Q相関係数の求め方で質問

相関係数の求め方について教えて下さい><

例えば、運転での交通違反の有無と性別のデータで

交通違反の経験     男      女     計
あり         3122  2255  5377
なし         3958  4695  8653
計          7080  6950  14030

(1)上記のようなデータの場合の相関係数の求め方(手計算可)
(2)あと、できればこのデータをつかってエクセルかJMPで相関係数を求める場合どのようにデータを入力すればいいのでしょうか?

Aベストアンサー

 求めようとする理由を書いてください。何かの課題だと違反になります。
もっとも、こんなアホな課題を出す教員もいないと想うので、事情が分からず・・・。

(2) このデータでは、相関係数を計算することは、統計学的には無意味です。だから、こんなアホナ課題をだす・・・と書き込んだのですが。

 エクセルで回帰式と相関係数を出すには、
1) 計算できるように、データを集める(身長と体重など、<体重と身長の関係は誤り>)。
2) グラフの中から、散布図を描く
3) 近似式を書く、というのをメニューなどから探し出す(office 20030と2007で異なる)
4) 数式とR2にチェックを入れる。R2の平方根が相関係数。

 という手順になります。
 なお、「相関係数を手で計算試用」なんぞは、無謀です。おそらく電卓ででしょうが、キーを打ち込む回数が多いので、おそらく死にます。パソコンが無い時代に、電卓でやりました。が、10回やっても、3桁目は一致しませんでしたので、有効数字は2桁で提出しました。死ぬ覚悟ならどうぞ。

 なお、書き込まれているデータでは、
「男女の交通違反に差はあるか」というのが、まっとうな疑問です。カイ2乗検定をします。

 求めようとする理由を書いてください。何かの課題だと違反になります。
もっとも、こんなアホな課題を出す教員もいないと想うので、事情が分からず・・・。

(2) このデータでは、相関係数を計算することは、統計学的には無意味です。だから、こんなアホナ課題をだす・・・と書き込んだのですが。

 エクセルで回帰式と相関係数を出すには、
1) 計算できるように、データを集める(身長と体重など、<体重と身長の関係は誤り>)。
2) グラフの中から、散布図を描く
3) 近似式を書く、というのをメニュー...続きを読む

Q相関係数の計算

指数関数

 y = B * e^ax  式(*)

で近似できるデータがあります。
その近似がどのくらい正しいかを調べたいのですが
曲線の相関係数というのが分かりません。そのために
上式の対数を取って直線関係にしました。
相関係数をエクセルで計算できるからです。

ln(y) = ax + ln(B)

この場合の相関係数は、式(*) の相関係数として使えるので
しょうか? 適当な方法があるのだと思いますが
ご存じの方がいらっしゃいましたら教えてください。

Aベストアンサー

私は統計については素人なので直接答えることはできませんが、参考URLのサイトの「統計学関連…何でも掲示板」に質問してみてはいかがでしょうか?統計のプロがかなりいらっしゃるようです。私もちょくちょくお世話になっています。

参考URL:http://aoki2.si.gunma-u.ac.jp/

Q相関係数と回帰分析

大学でSPSSの使い方の授業を受けていますがわからないことがあるので教えてください。

私は都道府県別のコンビニの数について調べようと思いました。

・コンビニ数と人口
・コンビニ数と県民所得
・コンビニ数と県内総生産

という3つの関係について調べています。
先生から教えていただいた内容ですと・・・

相関係数を求める⇒回帰分析を行う⇒t検定をする
という順番で分析すると教えて頂きました。

しかし、この場合は、
相関係数は3つそれぞれ求めてから1度の重回帰分析をしたらよいのか、それともそれぞれを回帰分析したらよいのかわかりません。
また、相関係数を求めて相関がない(0)となった場合であっても回帰分析は行うものなのでしょうか?

SPSSは勉強開始したばかりなのでなかなか理解できません。
また、分析の仕方についてアドバイスありましたらよろしくお願いします。
どうか教えてください。

Aベストアンサー

>大学でSPSSの使い方の授業を受けています
それは,なかなか立派な大学ですね。普通はゼミで院生にしごかれながら覚えるものですが。

論文レベルの話をすると,Excelで解析したら笑いもの(こいつは統計解析ソフトも使えないのか,研究室に金が無いのか等々)です。SPSSなりSASなりを使って書くのが常識の世界。是非習熟すると良いでしょう。専門のソフトでは,相関分析と回帰分析は全然別の話ですからね。

>相関係数は3つそれぞれ求めてから1度の重回帰分析をしたらよいのか、それともそれぞれを回帰分析したらよいのかわかりません。

結論から言えば,どちらでも良いです。というよりも,勉強ですから両方やってみることをお勧めします。2つは別のことだからです。意味は後で説明します。

データ数は47でしょうから,それぞれのデータを入力して,コンビニの数を「目的変数」に設定し,それぞれの相関分析をします。ピアソンでいけると思いますが,必要ならスピアマンでもケンドールでも使えば良いですね。
相関係数がどの程度出るかは,分かりませんが

>相関係数を求めて相関がない(0)となった場合であっても回帰分析は行うものなのでしょうか?

いいえ。有意な相関が見られない以上,回帰分析をやる意味はありません。回帰分析は,「相関の質」を表現するものですから,無いものの「質」を表現しても意味がありません。
ただ,あなたの表現で気になる箇所は「相関がない(0)」という箇所です。正確にはp値(α>0.05)ということで,相関自体は出ますよ。

その上で,それぞれ(県民所得など)を説明変数とする単回帰分析と,3つの変数を使う重回帰分析をやってみれば良いでしょう。(ただし,当たり前のことですが,相関の見られない変数は外しておくこと)
また,R二乗値はきちんと出しておきましょう。

さて,ここで2つの分析は別々のこと,という意味です。単回帰分析は,それぞれの要因がコンビニの件数にどの程度関係しているか,を考えるものですが,重回帰の場合,単純にその総和ということではないのです。

「相乗効果」という言葉があるでしょう? つまり,実際にはそれぞれの説明変数は別個に寄与するものではなくて,複合的にコンビニの件数に影響を与えている可能性があります。そうすると,単純に重回帰分析をしただけでは,どの要因がコンビニの件数にもっとも影響を与えているかが分かりません。

その辺りの処理をどうするかは,先生の授業の進め方と関係するので,ここでは述べません。ただ,あなたがやろうとしている2つのことは,別々のことなのだ,という点だけおさえておいて下さい。

>分析の仕方についてアドバイス

思いつきですが,コンビニの件数に影響を与えそうな要因として
・都道府県の面積(広いほど多くなる?)
・人口の集中度(100人の村が10個よりも1000人の町一つの方が?)
・消費動向(同じ収入でも金の使い方は違う?)
などがあるかもしれません。

>大学でSPSSの使い方の授業を受けています
それは,なかなか立派な大学ですね。普通はゼミで院生にしごかれながら覚えるものですが。

論文レベルの話をすると,Excelで解析したら笑いもの(こいつは統計解析ソフトも使えないのか,研究室に金が無いのか等々)です。SPSSなりSASなりを使って書くのが常識の世界。是非習熟すると良いでしょう。専門のソフトでは,相関分析と回帰分析は全然別の話ですからね。

>相関係数は3つそれぞれ求めてから1度の重回帰分析をしたらよいのか、それともそれぞれを回帰分...続きを読む

Q相関係数

こんにちは。

現在統計学を学んでいるのですが、相関係数についていまいちよくわかりません。

「2つのデータの関連性が強ければ相関係数は1に近づき、関連性が低ければ0に近づく」とは、下記のような例の場合、具体的にはどのようなことをいうのでしょうか。
この相関係数から得られる知見はどのようなものがあるのでしょうか。

教えていただけると助かります。



教科ごとの相関係数
(1)英語、理科  0.1453
(2)数学、社会  0.6489
(3)国語、英語  0.2948
(4)国語、数学  0.3092
(5)数学、英語  0.4893




国語と

Aベストアンサー

相関係数の目安の一例は下記のとおりです。

  -1  ~  -0.7      強い負の相関 
 -0.7  ~  -0.4      かなりの負の相関
 -0.4  ~  -0.2      やや相関あり
 -0.2  ~   0       ほとんど相関なし
  0   ~  0.2      ほとんど相関なし
  0.2  ~   0.4      やや相関あり
  0.4  ~   0.7      かなりの正の相関
  0.7  ~   1      強い正の相関

よって


(1)英語、理科  0.1453  : ほとんど相関はない。
(2)数学、社会  0.6489  : かなり強い相関がある。つまり数学ができる子は社会もできる。
(3)国語、英語  0.2948  : やや相関がある
(4)国語、数学  0.3092  : やや相関がある
(5)数学、英語  0.4893  : かなり強い相関がある。数学のできる子は英語もできる。

あくまでこのデータの意味するところで、一般論を言っているのではありません。

Qタスクの相関図のわかりやすい図解について

タスクの設計をしています。
各タスクの機能を考えながら、
タスク間の相関図を作成したいのですが
わかりやすい相関図の書き方をご存知の方、アイデアのある方、
教えてください。

タスクA、タスクB、タスクC・・・があれば、
それぞれを矢印か線で繋ぎ、
タスク間の関係を示すようなものをイメージしています。

よろしくお願いします。

Aベストアンサー

本当にパッと見で誰が見ても分かりやすい
とか
複雑でなかなか図に出来ない関係だがこれなら分かりやすい
というものを望んでいるのであれば
その都度頭をひねるしかないでしょうね。

一般に分かりやすい図とはなにかというと書き方にコンセンサスが取れているかどうか書き方が統一されているかどうかでしょう。
であれば、デファクトスタンダードのUMLをオススメします。

Q有意差検定と相関係数について

最近ちょっと統計学に興味を持ち出して自分なりに勉強し始めたのですが、頭が悪く有意差検定と相関係数が今一つ理解できません。わかりやすくそして詳しく教えていただければ幸いです。

Aベストアンサー

簡単な説明なので,表現は厳密ではありません。

1.有意差検定
同じ種類のデータ(たとえば身長とか,液の濃度とか)が,複数組あって,それらが同一の母集団から採られたものと考えてよいか,そう考えないほうがよいか,を統計学の理論に基づいて判断する方法が有意差検定です。検定の方法としては t検定,F検定,カイ2乗検定 などがあり,データの種類によって適した検定方法を採用します。
詳しくは,専門の書物等をご覧になるのがいいです。

2.相関係数
相関関係にある2つのデータ群にどの程度強い関係があるかを示す値です。-1から+1までの値をとります。相関係数が0(ゼロ)のとき,無相関と言い,2つのデータ群には相関関係がないと考えます。計算方法はお分かりですか?

参考URL:http://w3.cc.nagasaki-u.ac.jp/contrib/Excel/yougo.html


人気Q&Aランキング