【先着1,000名様!】1,000円分をプレゼント!

実は会社での説明に苦慮しています。
例えば、携帯電話の(1)メーカー/(2)デザイン/(3)機能の(4)購入意向、に対する影響度を見たい、という時に、重回帰分析における偏回帰係数で(1)(2)(3)の(4)に対する影響度を測ろうとしているのですが、「(4)と(1)(2)(3)それぞれの相関の高さで見るのと何が違うのか?」と聞かれてしまい、回答に窮しています。あまり統計に詳しくない人(私もそうですが)に対し、うまく説明する方法はないでしょうか。
どなたかお知恵をいただきたく、よろしくお願いします。

このQ&Aに関連する最新のQ&A

A 回答 (3件)

相関分析と重回帰分析の違いは、説明変数を一つとするか複数にするかの違いです。


 目的とするもの(従属変数、数式ではy)に影響するものが、説明変数(数式ではx)です。

 プロ野球を例に取ると、野球はピッチャーだ、といわれます。そこで、過去数年間について、ピッチャーのチーム防御率だけをXとし(説明変数が単数)、その年の順位をyとして、分析するのが単回帰分析です。
 しかし、いくらピッチャーが良くても、打てなければ勝てません。そこで、バッターの打率も考える必要があります。すなわち、チームの防御率をX1、チームの打率をx2、すなわち、説明変数を複数(2つ以上)採り、順位yの推定を行うのが、重回帰分析です。
 このように、単回帰分析よりも、重回帰分析の方が、必ず相関係数が高くなります。すなわち、結果の推定の確実性が増すわけです。相関係数が、1.0になれば、説明変数の事柄だけで、従属変数の事柄が決定できます。すなわち、100%的中します。

 単回帰では、防御率、打率とも、相互の影響は考慮されていません。従って、防御率と打率のどちらが影響力が強いのかは、相関係数から予測はできるものの、決定できません。選手をとる場合、同じ年俸を払うのに、ピッチャーとバッターのどちらを補強したら効果的かは、判断が困難です。
 このとき、どちらの影響が強いかを推定できるのが、重回帰分析です。そのために利用するのが、偏回帰係数ですが、変数の単位に左右されるので、注意を要するところです。

 「単回帰では、(1)(2)(3)のどれが最も効果的かは、判断できません」が答えでしょうか。
 釈迦に説法の点は、ご容赦を。
  
    • good
    • 0
この回答へのお礼

わかりやすい例えでご説明いただき、ありがとうございます。そのまま引用させてもらいたいところですが、もう一度自分で整理したいと思います。

お礼日時:2004/11/04 13:26

こんにちは.相関係数と偏回帰係数の違いのご質問ですね?



この質問に答えるためには,(1)相関係数/回帰係数の違い,(2)「偏」あり/「偏」なし,に分解して考える必要があります.

────────────────────────────
X 061 072 084 095 097 098 100 113 126 130
Y 083 082 099 096 115 108 095 111 114 135
────────────────────────────

(1)相関係数/回帰係数
上記のXとYのデータがあります.Excelなどの表計算で実際に相関係数や回帰係数で求めてみましょう.

回帰係数とは,回帰式の「傾き」のことですが,Excel関数「=SLOPE(範囲1, 範囲2)」を,そして相関係数はExcel関数「=PEARSON(範囲1, 範囲2)」使うことで算出できます.
さて,回帰係数と相関係数は,二変数の関係性ですので,実際に範囲1と範囲2に,「X」と「Y」のデータを代入してみましょう.

<回帰係数>
範囲1=X,範囲2=Yの場合(X→Y) 回帰係数 1.19
範囲1=Y,範囲2=Xの場合(Y→X) 回帰係数 0.65

<相関係数>
範囲1=X,範囲2=Yの場合(X-Y) 相関係数 0.88
範囲1=Y,範囲2=Xの場合(Y-X) 相関係数 0.88

統計学を勉強されている方は今更でしょうが,回帰係数は,同じXとYのデータを使う場合でも,範囲1と範囲2のいずれにXとYを設定するかで係数の値が異なります.相関係数の場合は,変わりません.これは,回帰係数の場合は,「X→Y」あるいは「Y→X」という方向性が重要になるため,どちらの方向性の回帰係数かによって異なる数値がでるわけです.

そうすると,「X→Y」の回帰係数とは,XからYへの影響性を,「Y→X」の回帰係数とは,YからXへの影響性を意味しています.では,両方向の影響性を平均して,XとYとの間の(両方向の)影響性を求めてみましょう.
普通の(算術)平均ではなく,掛け算の後ルート計算をするという幾何平均を行ってみます.

√(0.65×1.19)=0.88

この「0.88」という数値どこかで見覚えはありませんか? そう,「XとY」との間の【相関係数】と同値です.実は,XとYの相関係数とは,X→Yの回帰係数とY→Xの回帰係数の(幾何)平均を意味しています.

このように考えると,

回帰係数:方向性のある影響力
相関係数:双方向の影響力を平均した総合的類似度指標

と,考えることができます.

(2)「偏」あり/「偏」なし
相関係数であれ,回帰係数であれ,普通の相関係数/回帰係数の他に,偏相関係数/偏回帰係数というものがあります.「偏」というのは何かというと,一般の人々にわかりやすく言えば「純粋な」と言い換えても大きな間違いではないでしょう.
そうすると,普通の相関係数や回帰係数などの「偏」がついていないものは,純粋ではない相関/回帰係数ということを意味します.相関であれ,回帰であれ,二変数の関係性の指標ですが,実は,それ以外の変数の要素が混在している可能性が除去できないのです.


 事柄A ←直接的関係→ 事柄B
  ↑           ↑ ┐
  │           │ │間接的関係
  └─── 事柄C ───┘ ┘

 ※図表がずれている場合は,コピー&ペーストの等幅フォントで対応して下さい

この図のように,AとBとの間に,Cの要素が仲介して関係性を与えている【可能性もありえる】のです.普通の相関係数は「直接的関係+間接的関係」の療法を含んでいることになります.
この間接的関係を削除した部分,つまりは直接的関係が,「純粋な=偏」相関/回帰係数ということになります.


以上のことを踏まえて,普通の相関係数を求めた場合と,重回帰分析を使った偏回帰係数では何が違うか……もうおわかりですね?
No1さんやNo2さんの回答と合わせて参考にして下さい.
    • good
    • 5
この回答へのお礼

ご回答いただき、ありがとうございます。非常に詳細な説明で、よく理解できました。自分自身の勉強にもなりました。

お礼日時:2004/11/04 13:29

(1)・(2)・(3)の相互作用がある場合は、単回帰を複数


行っても正確な判定を下せません。

例えば、特定のメーカーは、特定のデザインが多い
という傾向がある場合に、単回帰を行い、
メーカーA→購入意欲高い
デザインA→購入意欲高い
という結果がでたとしても、

メーカーA→デザインAが多い→購入意欲高い
という関係が存在すると、メーカのために購入意欲が
高いのか、デザインのために購入意欲が高いのか分離
することができません。本当はデザインよりも、メー
カーのネームバリューで売れていたとしても、偽の関
係によって、デザインでも強い相関がでたりします。

このようなとき、それぞれの因子を分離したい場合、
多変量を用いる方が正確といえます。

文章で説明するのは、むずかしいですが、いかがでしょう?

参考URL:http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc …
    • good
    • 0
この回答へのお礼

ご回答ありがとうございます。
言葉での説明はなかなか難しいと思いますが、参考になりました。

お礼日時:2004/11/04 13:23

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q相関係数についてくるP値とは何ですか?

相関係数についてくるP値の意味がわかりません。

r=0.90 (P<0.001)

P=0.05で相関がない

という表現は何を意味しているのでしょうか?
またMS Excelを使ってのP値の計算方法を教えてください。

よろしくお願い致します。

Aベストアンサー

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場合はp=0.1%でもいいと思いますが)
相関係数においても相関の有無を結論つけるにはそのrが偶然出る確率を出すか、5%の確率ならrがどれぐらいの値が出るかを知っておく必要が有ります。

>r=0.90 (P<0.001)

相関係数は0.90と計算された。相関がないのに偶然r=0.90 となる確率は0.001以下だと言ってます。

>P=0.05で相関がない

相関がないと結論。(間違っている確率は5%以下)だと言ってます。

エクセルでの計算ですが、まず関数CORRELを使ってr値を出します。xデータがA1からA10に、yデータがB1からB10に入っているとして

r=CORREL(A1:A10,B1:B10)

次にそのr値をt値に変換します。

t=r*(n-2)^0.5/(1-r^2)^0.5

ここでnは組みデータの数です。((x1,y1),(x2,y2),・・・(xn,yn))
最後に関数TDISTで確率に変換します。両側です。

p=TDIST(t値,n-2,2)

もっと簡単な方法があるかも知れませんが、私ならこう計算します。(アドインの分析ツールを使う以外は)

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場...続きを読む

Q重回帰と偏相関の違い

重回帰分析も偏相関分析もともに、複数の説明変数と1つの従属変数が登場人物となって、その関係を分析するものと認識しています。

が、大きな違いとして、重回帰は多重共線性を示す説明変数を同時投入した分析はできないのに対し、偏相関分析は寧ろそういう変数たちを同時に取り扱って分析することに使うと聞きました。

どういう理由で、両者にこのような違いがあるのか、ご教示頂けないでしょうか。

Aベストアンサー

なかなか回答がないので私から,
私は,企業の品質管理の部門に在籍し,SQCを推進する立場にあります.
応用統計で学位を取っています.

重回帰分析は説明変数で目的変数(こちらは従属)を説明することに用いられますが,
相関分析や偏相関分析は,回帰分析や因果分析をやるまえに,
変数間の関係を見るために行われます.

相関係数と偏相関係数の違いは分かりますか?
相関係数行列の逆行列をとったのもが偏相関係数行列になります.
偏相関は,擬相関を取り除いた関係を示しており,「真の関係」と言えます.

今,小学生(例えば1~6年各30名くらいずつ)のデータがあるとします.
データは各人について
学年,靴のサイズ,覚えている漢字数の3変数とします.
このとき,覚えている漢字数を目的変数として,重回帰分析を行いなさい
という問題があったとします.

学年が決まれば,おおよそ靴のサイズと,覚えている漢字数が決まります.
でも,靴のサイズと覚えている漢字数には擬相関があり,
重回帰分析を行うと,学年と,靴のサイズに多重共線性の問題が発生します.

偏相関分析を行うと,靴のサイズと覚えている漢字数の関係が消えますので,
覚えている漢字数は,学年を説明変数として回帰式が立てられることが分かります.

偏相関係数をもっと積極的に使ったモデル化手法として
「グラフィカル・モデリング」があります.

ただ,注意が必要です.統計は万能ではありません.
今,粗暴犯の収監者と一般人が,子供の頃にマクドナルドのような
ジャンクフードをどれだけ食べていたかというデータがあったとします.
このデータから,小さい頃にマクドナルドを食べると
キレやすくなるという回帰分析の結果が得られます.

このときは,偏相関分析を行って擬相関を取り除こうにもデータは
ほかにありません.では,この結論は「真」なのでしょうか?

実は,観測していないデータに「貧困度合い」というのがあるのです.
貧困家庭は,親が共働きして子供に外食をさせていたということです.
むしろ,貧困による劣等感や遊び仲間が影響していると思われます.

話が逸れてしまいましたが,

多くの変数を取り上げ,多重共線性で悩む前に
とりあえずは,本当は関係の無い擬相関を取り除こう,というのが偏相関分析.
ただ,万能ではなく,観測変数として重要なものを上げることを
忘れていれば,お手上げ,
ということです.

データ解析の前に,しっかり仮説を検討して,どのようなデータを採取するか
十分検討することが必要です.

なかなか回答がないので私から,
私は,企業の品質管理の部門に在籍し,SQCを推進する立場にあります.
応用統計で学位を取っています.

重回帰分析は説明変数で目的変数(こちらは従属)を説明することに用いられますが,
相関分析や偏相関分析は,回帰分析や因果分析をやるまえに,
変数間の関係を見るために行われます.

相関係数と偏相関係数の違いは分かりますか?
相関係数行列の逆行列をとったのもが偏相関係数行列になります.
偏相関は,擬相関を取り除いた関係を示しており,「真の関係」と言えます.
...続きを読む

Q標準化係数と非標準化係数

お世話になります7772です。重回帰分析での標準化係数、非標準化係数の意味合いは、標準化係数が、ある変数が他の変数に比べてどのように影響しているかを比べるもので、非標準化係数が、他の変数の影響を一定にして、一つの変数にのみ絞ったその変数の全体への影響を示したものと認識しています。
 私が疑問に思うのは、これらの係数が負の値をとるときです。そのときは正の値のものよりも影響しないということでしょうか?具体的には、標準化係数が0.2のものと-3.3のものでは、0.2のほうがより影響していると言うことなのでしょうか?
 それとも、判断は絶対値で行い、上のような場合、-3.3のほうが影響しているけれど、それは変数が増えれば全体が増えるのではなく、変数が増えると全体が減る。の用に影響していると言う意味合いなのでしょうか?

Aベストアンサー

こんにちは。SPSSの用語は独特な表現のものが多いので注意しましょう。

最初に「標準化係数」と「非標準化係数」の認識が間違っている点を指摘します。
一般的な用語を使えば,回帰係数と偏回帰係数,そして標準偏回帰係数というものがあります。

・ある変数が他の変数に比べてどのように影響しているかを比べるもの → これは「回帰係数」のことであり,重回帰分析では表示されません。

・他の変数の影響を一定にして、一つの変数にのみ絞ったその変数の全体への影響を示したもの → 「偏回帰係数」のことです(SPSSの用語で言えば「非標準化係数」)。重回帰分析で表示されるのはこの「偏回帰係数」系の指標です。

それでは,残った「標準化係数」とは何かというと,一般用語では「標準偏回帰係数(β)」であり,標準化,すなわち「偏回帰係数」を平均0,分散1に標準化したものです。通常は-1≦β≦+1の範囲を取るので,絶対値「1」に近いほど影響力がある(「0」に近いほど影響力がない)と解釈されるとよいでしょう。

係数の符号の解釈についてです。一般に係数は「正負の方向性」と「絶対値」の二つの観点から解釈を行います。絶対値が大きいほど,影響力が強いことを意味します。「正負の方向性」とは,その影響が「+」に影響を与えているか,「-」に影響を与えているかを意味します。

> 具体的には、標準化係数が0.2のものと-3.3のものでは、
> 0.2のほうがより影響していると言うことなのでしょうか?

【標準化】係数で「-3.3」になったのですかっ!?
一般には「±1」を超えることは珍しいのですが,これはかなり超えています。何か特別の事情があるかもしれませんね……

こんにちは。SPSSの用語は独特な表現のものが多いので注意しましょう。

最初に「標準化係数」と「非標準化係数」の認識が間違っている点を指摘します。
一般的な用語を使えば,回帰係数と偏回帰係数,そして標準偏回帰係数というものがあります。

・ある変数が他の変数に比べてどのように影響しているかを比べるもの → これは「回帰係数」のことであり,重回帰分析では表示されません。

・他の変数の影響を一定にして、一つの変数にのみ絞ったその変数の全体への影響を示したもの → 「偏回帰係数」...続きを読む

Q相関分析と回帰分析ではどのように違うのでしょうか?

相関分析と回帰分析ではどのように違うのでしょうか?

Aベストアンサー

相関では,2つの変数の関係を分析します。
回帰では,1つの変数を別の(ひとつあるいは複数の)変数で説明できるような関係を見つけます。

なお,相関関係があってもそれは因果関係があることを意味しません。2つの変数が独立ではないということだけです。
擬相関というのは相関関係があるのに因果関係がない場合のことです。

回帰モデルは適切につくらねばなりません。適切なモデルであるというのは,説明変数によって
株価などを回帰式で予想した場合でも地獄を見るのは,回帰式が適切ではないか,回帰式の適用できる範囲を超えて適用しようとしているのです。

Q回帰関係の有意性と回帰係数の有意性の意味

「回帰関係の有意性」と「回帰係数の有意性」についての質問です。

この2つなんですが、それぞれ何故こんなことをするのでしょうか?
また何がわかるのでしょうか?

式を見たりしてもイマイチ理解ができず、困っています。
簡潔に説明して頂けると大変有り難いです(><;)

よろしくお願いします。

Aベストアンサー

>式を見たりしてもイマイチ理解ができず
統計学を数式で説明できるヒトなら可能です。私は、もっぱら国語で理解していますので。それと、回帰分析を何度もやればなんとかなります。といっても、回帰分析の解釈は、専門家でも間違っている例をいくつも知っています。

>「回帰関係の有意性」
有意性の判定を相関係数で行うのなら、x軸とy軸の両者の関係は偶然なのか否かの判定をします。有意であれば、回帰式も適切である、と考えます

>「回帰係数の有意性」
 回帰係数は、重回帰分析の時に、どの因子の影響が強いか、の判断に使えます。総合的なテストをして、国語と数学の点数との重回帰分析をすれば、どちらの能力が有利の判定は、回帰係数の大きいほうが有利、と判断します。

 回帰係数の有意性を利用するような検討は、想定しがたいのですが、間違いありませんか。有意性ではなく、有用性なら、回答は上記です。
 ご質問に忠実に解答すれば、数学と国語の関係の回帰式を日米2カ国で算出、この回帰式が異なること(日米では異なること)を示したい、なんぞの判定は、回帰係数の有意性から判断できます(同じであることは、主張できません)。すなわち、AとBの回帰式は異なる、ことを主張したいときには利用できますが、私の分野では使われた論文を読んだ記憶はありません。
 

>式を見たりしてもイマイチ理解ができず
統計学を数式で説明できるヒトなら可能です。私は、もっぱら国語で理解していますので。それと、回帰分析を何度もやればなんとかなります。といっても、回帰分析の解釈は、専門家でも間違っている例をいくつも知っています。

>「回帰関係の有意性」
有意性の判定を相関係数で行うのなら、x軸とy軸の両者の関係は偶然なのか否かの判定をします。有意であれば、回帰式も適切である、と考えます

>「回帰係数の有意性」
 回帰係数は、重回帰分析の時に、どの因子の...続きを読む

Q相関係数と重回帰分析

心理学専攻の大学生です。

卒業論文作成のため、質問紙を製作し配り、集計しました。
検定はほとんど先生がSPSSを使ってやったので、どういう結果なのか聞いただけです。
検定結果をエクセルに貼り付けてもらったのですが、見方が分からず論文にすることができません。

ピアゾンの相関係数を求め、重回帰分析をしたのはわかるのですが、それからどう見ればいいのかわかりません。
諸事情により先生に直接聞くことができなくなったもので…
もしよろしければこちらから結果をファイル送信しますのでどなたか分かる方がいらしたら教えてください。

Aベストアンサー

こんにちは.
そろそろ卒論の締め切りが間近になり大変だと思います.卒論は大学生活の勉強面における集大成なので,No.1のperu-peruさんがおっしゃっているように自分で勉強する,という態度を貫いてください.

……といってもせっぱ詰まった状況で,これで終えるのは何なので,少しばかりアドバイス・回答らしきものを.
とりあえずは,統計法に関する参考書を開いて「相関係数」「重回帰分析」を調べてみてください.No.1の方が参考書としてあげられているものは,結果の書き方の例があるので,かなり重宝すると思います.

さて「相関係数」と「重回帰分析」についてですね.
相関係数とは何か? 多くの統計学の教科書に説明がなされています.それを読めばわかると思いますが,ひとまず,過去に私が回答したものを挙げておきます.

<相関係数についての基礎知識>
http://oshiete1.goo.ne.jp/kotaeru.php3?q=316865

相関についての大雑把な理解ができましたか? 具体的な相関係数の数値を解釈する場合には,以下の基準を参考にしてください.

─────────────────────────────
 a)「数値は正の数・負の数のどちらか?」
  → 正の数:正の相関係数(変化する方向が同じ)
  → 負の数:負の相関係数(変化する方向が逆向)
 b)「数値の【絶対値】はどれだけ『1』に近い値か」
  → 二変数の関係の強弱の程度(目安)
    0.0 ≦|r|≦ 0.2 ⇒ 「ほとんど相関なし」
    0.2 <|r|≦ 0.4 ⇒ 「弱い相関あり」
    0.4 <|r|≦ 0.7 ⇒ 「比較的強い相関あり」
    0.7 <|r|≦ 1.0 ⇒ 「非常に強い相関あり」
─────────────────────────────

<重回帰分析についての基礎知識>

過去ログの私の回答で適当なものがなかったので,ごく簡単に書きます.
心理学を含み科学とは,基本的にある現象を「原因・結果」という観点から分析を行おうとします.何かの原因があることで結果が発生する,のように「原因→結果」の観点を用いるわけです.ある結果が生じるための原因としていろいろな原因を考えることはできますが,【本当に】効果のある原因は何だろう,その本当の原因を調べたい!
……このようなときに「重回帰分析」は使われます.

┏━━━━━重回帰分析の【モデル★】━━━━━┓
┃             ̄ ̄ ̄ ̄      ┃
┃ 原因候補1 ────??───────┐ ┃
┃                    │ ┃
┃ 原因候補2 ────??─────┐ │ ┃
┃                  ↓ ↓ ┃
┃ 原因候補3 ────??───→ 結 果 ┃
┃                    ↑ ┃
┃   |                │ ┃
┃                    │ ┃
┃ 原因候補n ────??───────┘ ┃
┃                      ┃
┃(独立変数)          (従属変数)┃
┃(説明変数)          (目的変数)┃
┃                      ┃
┗━━━━━━━━━━━━━━━━━━━━━━┛
※上図は図がゆがむので,コピー&ペーストをしてMSゴシックなどで復元してください.

重回帰分析では,上記のように「一つの結果を発生させる原因の候補」の中から「本当の原因」がどれか,また,どの程度の影響力があるかがわかります.上図における「??」部分が,十回分咳をすることで「×(関係ない)」か「○(関係ある)」かどうかを判定してくれます.
これ以上の説明は余白が足らないので,省略させていただきます.とりあえず結果の読み方の参考になるものを下に乗せておきます.

http://oshiete1.goo.ne.jp/kotaeru.php3?q=470539
↑の「No.5」に書いている図です.


───────────────────────────────
       有効かの判定   有効度の指標
変数レベル  t値(確率)   標準偏回帰係数(β)
全体レベル  F値(確率)   重相関係数(R),重決定係数(R2)
───────────────────────────────

……とりあえず,最低限のことはこのぐらいでしょう.

参考URL:http://oshiete1.goo.ne.jp/kotaeru.php3?q=316865, http://oshiete1.goo.ne.jp/kotaeru.php3?q=470539

こんにちは.
そろそろ卒論の締め切りが間近になり大変だと思います.卒論は大学生活の勉強面における集大成なので,No.1のperu-peruさんがおっしゃっているように自分で勉強する,という態度を貫いてください.

……といってもせっぱ詰まった状況で,これで終えるのは何なので,少しばかりアドバイス・回答らしきものを.
とりあえずは,統計法に関する参考書を開いて「相関係数」「重回帰分析」を調べてみてください.No.1の方が参考書としてあげられているものは,結果の書き方の例があるので,かなり重宝す...続きを読む

Qデータが正規分布しているか判断するには???

初歩的なことですが。。急いでいます。
おわかりになる方 教えてください。
サンプリングしたデータが正規分布しているかどうかを確認するにはどうすればよろしいでしょうか。
素人でも分かるように説明したいのですが。。
定性的にはヒストグラムを作り視覚的に訴える方法があると思います。今回は定量的に判断する方法を知りたいです。宜しくお願いします。

Aベストアンサー

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区間距離、度数区分数は、正規的なグラフになるように試行錯誤で行うことが多い(区間距離や度数区分数を本来の分布に則するようにいろいろ当てはめて解釈する。データ個数の不足や、データの取り方、または見かけ上の分布によりデータのばらつきが正しく反映されて見えないことがあるため)のですが、度数区分数は、機械的に、
=ROUNDUP(1+LOG10(データ個数)/LOG10(2),0):エクセル計算式
で区分数を求める方法があります。
 また、区間距離は、=ROUND((データの最高値-最低値)/(度数区分数値-1),有効桁数)で求め、区分の左端は、
=ROUNDUP(データの最低値-区間距離/2,有効桁数)
右端は=ROUNDUP(データの最高値+区間距離/2,有効桁数)
とします。
 区間がと度数区分数が出たら、その範囲にあるデータ数を数えて、ヒストグラムができます。
 
>最小側、最大側は 最小値、最大値を含んだ値としなければならないのでしょうか。
 ヒストグラム作成の処理に関しては、上記を参考にしてください。
 その前に、データの最小値と最大値が、正しくとれたデータか検討するため、棄却検定で外れ値が存在するか否かを検定し、外れ値が存在しないと結論づけられたら、正規分布の検定を行ってみてください。もし外れ値が存在する可能性があれば、そもそも、そのデータの信頼性が失われます。サンプリング手法の再検討(データの取り方に偏りがなかったか、無作為に設定してデータを取っていたか等)をして、再度データを得る必要があります。また、そもそも検定する以前に、データ数が少ないと判断が付かなくなってしまいますので、データ数は十分揃える(少なくとも20~30個)必要もあります。

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区...続きを読む

Q重回帰分析の影響度について

重回帰分析で目的変数に対する説明変数の影響を順位付けしたいのですが、影響度は標準化係数とt値で見ると書いてありましたが、標準化係数で絶対値の大きい順とt値の順位では結果が違ってしまいます。どちらでみたほうがよいのでしょうか。

Aベストアンサー

詳しい内容は分からないので、ごく一般的な見方からすると

(1)回帰モデルが妥当かどうか。(「決定係数」とか「修正R2乗」とか「R^2」などが「1」に近いほどよい)

(2)各「説明変数」が有意であるか。(t値に基づく「P値」が0.05以下)

(3)上記で有意と判定された説明変数の「標準化係数」の絶対値の大きい順に影響度の順位付け

ということかと思います。

「t値」は、その「説明変数」の「影響力がない」という帰無仮説を棄却するための有意水準を示しているものであり、(2)の判断に使うだけで、その値で影響度の順位付けをするものではありません。

Q修正済み決定係数(R2乗)がマイナスです

修正済みの決定係数がマイナスになりました。

まあ、その回帰モデルが無意味であるのは間違いないのですが、
マイナスになるのはどうしてなのか疑問に思ったので、
ご存知の方がいたら教えてください

Aベストアンサー

こんにちは。

最初に確認なのですが、
重回帰分析のことですよね?

ワタシもただいま勉強中で、
あまり詳しいことは分からないのですが、
多重共線性のあるデータで,偏回帰係数(標準化偏回帰係数)と相関係数の符号が一致しないような場合には,ある変数の寄与率がマイナスになってしまう(別の変数の寄与率が1を越える)こともあるそうです。

説明変数同士で散布図を作成してみて、
多重共線性のあるデータがないか確認してみて下さい。

Qエクセルで計算すると2.43E-19などと表示される。Eとは何ですか?

よろしくお願いします。
エクセルの回帰分析をすると有意水準で2.43E-19などと表示されますが
Eとは何でしょうか?

また、回帰分析の数字の意味が良く分からないのですが、
皆さんは独学されましたか?それとも講座などをうけたのでしょうか?

回帰分析でR2(決定係数)しかみていないのですが
どうすれば回帰分析が分かるようになるのでしょうか?
本を読んだのですがいまいち難しくて分かりません。
教えてください。
よろしくお願いします。

Aベストアンサー

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるための指数表記のことですよ。
・よって、『2.43E-19』とは?
 2.43×1/(10の19乗)で、
 2.43×1/10000000000000000000となり、
 2.43×0.0000000000000000001だから、
 0.000000000000000000243という数値を意味します。

補足:
・E+数値は 10、100、1000 という大きい数を表します。
・E-数値は 0.1、0.01、0.001 という小さい数を表します。
・数学では『2.43×10』の次に、小さい数字で上に『19』と表示します。→http://ja.wikipedia.org/wiki/%E6%8C%87%E6%95%B0%E8%A1%A8%E8%A8%98
・最後に『回帰分析』とは何?下の『参考URL』をどうぞ。→『数学』カテゴリで質問してみては?

参考URL:http://ja.wikipedia.org/wiki/%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるた...続きを読む


人気Q&Aランキング