教えて!gooにおける不適切な投稿への対応について

あるデータから散布図を書きました。横軸が長さで縦軸が長さに対する回数です。データの性質的に切片は間違いなくゼロです。散布図をエクセルで書いたところ、右肩あがりのようでしたので、直線回帰してみましたら、Rの2乗が0.7くらいで有意な直線関係が得られました。ただ、よくよくみますと、一番Y軸のさきの方でプラトーに達するような二次曲線のようにみえなくもありません。つまり、直線回帰してその傾きどうしを比較して、違うデータと比べて考察していましたが、そもそも直線でない可能性がることを指摘され、困っています。
そこで質問なのですが、得られた散布図で一番フィットする線を書くためにモデルを選択するにはどうすればよいのでしょうか?また、そこから近似曲線の性質(たとえば傾きなど)はどうやって求めたらいいか、参考となるURLや書籍があれば同時に教えて頂きたいのです。
わかりにくい説明で申し訳ありませんが、宜しくお願いします。

gooドクター

A 回答 (4件)

No1です。

他の方の回答と一部重複するでしょうが、また、長文でずか。

>因果関係は明らかにしなくてもよさそうなのですが

 因果関係を考慮しないと、とんでも無い結論になりかねません。何故そうなるのか、この場合、直線なのか否かを考えるには、理論的な根拠、すなわち、因果関係がキーになるでしょう。もっとも、短期の予想なら、回帰分析で式を出すだけで十分ですが。

 現実には、一次式である直線の回帰式を、高次式にすると、通常、相関係数は高くできます。しかし、「なぜ高次式になるのか」「その方が正しいのか」の問いには答えられません。一次式なら、なんとか現実から解釈できます。
 理論式が想定できるのなら、その式の係数を当てはめるだけですので、悩むことも無いのですが、理論そのものが新発見のようですし、理論式が予め分かっている場合は、皆無に近いかと・・。

 私の場合、平均寿命がその国の経済水準と密接に関連することを見つけ、考え込みました。「天寿」という言葉があるように、寿命は神か仏が決める、というイメージがあったからです。考え込んで、「先進国の方が長生き」という現実に気づき、「天寿」という言葉が誤りに気づき、スッキリしました。
 因果関係を考えないと、新聞の部数と平均寿命は関係するので、「新聞を読んで長生きしよう」の結論も可能です。「新聞には、健康に関する記事が多いので、長生きできる」という主張に反論できません。

>もしエクセルで可能でしたら
回帰式と相関係数は、散布図があれば、簡単に表示できます。
 グラフのウィンドをクリック>メニューバのグラフ>近似曲線の追加>種類(ここで、高次式を選ぶことも可能)、を確認後、オプションのタグ>グラフに数式を表示する、と、グラフにR-2乗値を表示する、のボックスにチェックをいれれば、グラフ上に回帰式と決定係数が表示されます。
 R-2乗値は、決定係数と言いますが、相関係数はその平方根です。
 以上は、直線回帰を想定していますが、指数回帰などは、グラフで散布図を選択したあと、どの回帰式にするかの選択画面がありますので、グラフを作成してしまえば、同様に操作して下さい。

この回答への補足

有り難うございました。大変参考になりました。
前半部分は別の方にもご指摘いただいております。
もう少し勉強しないといけないですね。。
エクセルの使い方は、本当に参考になりました!
これからも何かまた質問させて頂くかもしれませんが、宜しくお願いします。

補足日時:2004/11/18 11:08
    • good
    • 0

モデルの式の選択は.数値処理に基づく当てはめ以外の方法(理論計算等)から導入。



>もそも直線でない可能性がることを指摘され
誤差分析をして結果ですか?。何から指摘されたか.不明に月回答不能。

>デルを選択するにはどうすればよいのでしょうか?
理論計算からモデルの式を導入する。

>はどうや って求めたらいいか、
東京大学出版かい
小泉(疑問).UPおうよう選書.さいしょうにじょうほうなんとか.という本

この回答への補足

有り難うございました。
もう少し勉強してからでないと、この問題には取り組めないこともわかりましたので、十分な返答ができないまま締め切らせて頂きます。申し訳ありません。
今後とも宜しくお願いします。

補足日時:2004/11/18 11:06
    • good
    • 0

まず第一にエクセルにデータを入れてグラフを描いたなら近似曲線の追加→Rー2データの描写で相関係数が出るはずです。


直線回帰なら=CORREL関数で計算できます。=SLOPEと=INTERCEPTで切片と傾きも出ます。累乗回帰や指数回帰する時、私の場合はセル内のデータを別のセルに変換して直線回帰してみています。
後、文献、HP等ではありませんが、総当り的にデータ解析してフィットする回帰を見つけるソフトを見たことがあります。古いPCだと2,3日がかりでしたが。。。
(Y=a+bX+cX^2・・・・+ne^X・・・plnX・・・等のデータが出てきます。時間がかかるはずです)

この回答への補足

情報を有り難うございました。大変参考になりました!

補足日時:2004/11/18 11:00
    • good
    • 1

>一番Y軸のさきの方でプラトーに達するような二次曲線のようにみえなくもありません


 混乱があります。二次曲線は、無限大になり、プラトーにはなりません。理論上、例えば化学反応など、プラトーに達することが分かっているなら、その式を使うべきです。ただ、その式は、残念ながら、エクセルには入っていません。

 肝心なことを書きませんでしだか、近似式を選ぶ場合は、試行錯誤によって、相関係数が高いものを選べば、それでOKです(正確には、決定係数か?)。というより、それしか方法は、ありません。

>直線でない可能性がることを指摘され
 どの回帰を選ぼうと、他の可能性は、あります。特に、2次式、3次式、・・・と、次数を増すと、相関係数が1により近づく場合が少なくありません。
 しかし、多項式の場合、「なぜ多次式なの」と訊かれると、回答は不可能です。
 ですから、私の場合、因果関係が問われる、すなわち、「何故そうなるの」「どんな意味があるの」なんぞを訊かれそうな場合は、理由が必要なので、直線にできる直線回帰、指数回帰、累乗回帰、対数回帰のうちから選んでいます。

 回帰式から、何かを単に予測する場合(因果関係が訊かれない)は、多次式の相関係数が高いなら、それを選びます。

>参考となるURLや書籍があれば同時に教えて頂きたいのです。
近似式の選び方については、見たことがありません。書き方は、載っていても、どれを選ぶかは、本人が決定することです。

この回答への補足

有り難うございました。それから、失礼しました。二次曲線はプラトーにはなりませんね。そうでした。
やっぱり、相関係数が高いものを選ぶべきですか。それなら私にも理解できそうです。
今回の場合、出てきた係数を違うサンプリングを行ったデータと比較して、大きい小さいなどを論じたいと考えています。直線関係が出そうだということ自体初めての発見なので、前例を調べて参考にすることができません。因果関係は明らかにしなくてもよさそうなのですが、係数を比較する際に「本当に直線回帰でいいの?」とつっこまれますと困りますので、質問させて頂きました。
再び質問になってしまって申し訳ありませんが、
直線回帰、指数回帰、累乗回帰、対数回帰を行うには、エクセルでは無理でしょうか?少しだけ調べてみましたが見つかりませんでした。もしエクセルで可能でしたら簡単に方法を教えて頂けませんか?エクセル統計は持っています。
質問を重ねてしまって恐縮ですが、宜しくお願いします。

補足日時:2004/11/15 19:15
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

gooドクター

人気Q&Aランキング