統計学の外挿が合っているか教えてほしいです。
添付データは、エクセルデータです。
数値はNo.100までありますがNo.1からNo.90の数値データをエクセルの重回帰分析を使って、次の回帰式を得ました。
家賃=ー814.26×駅からの距離+2971.77×面積ー1025.89×築年数+1449.13×階数ー1610.88×南向きー3294.77×バストイレ別+2383.76×駐車場+35656.70 (小数第3位を四捨五入して第2位まで求めた。)
この時、自由度修正済み決定係数は、0.903になった。
駅からの距離、面積、築年数、階数、南向き、バストイレ別、駐車場のうちでP値が0.05よりも大きいのは、南向き0.4181、バストイレ別0.197、駐車場0.306であり、この3つの項目は除外すべきだと思われる。
これらの3つの項目を除外した後のエクセルによる重回帰分析における自由度修正済み決定係数は、0.902であり、
それら3つの項目を除外した後の重回帰分析における回帰式は、
家賃=ー907.69×駅からの距離+2952.11×面積ー1047.20×築年数+1408.36×階数+34482.75 となり、この回帰式を用いて、No.100の家の予測値を求めると90037.72 となる。
No.100の家賃は、92000円で予測値は、90037.72円で92000円の範囲内だから、 外挿に問題なしということで宜しいでしょうか?
A 回答 (4件)
- 最新から表示
- 回答順に表示
No.4
- 回答日時:
> 外挿は、保証されておらず・・・、
外挿は保証されていませんが、内挿はOKです。
> 外挿が問題ないか判断するには、複雑な予測区間の計算を行う必要があるということでしょうか。
回帰線を引くことが出来る範囲(内挿範囲)と、予測区間の計算とは関係ありません。
そうなる理由は、
回帰線を引くことが出来る範囲はx(説明変数)に依存し、信頼区間・予測区間はy(目的変数)に依存するというか、y軸方向の残差に依存するからです。
No.3
- 回答日時:
(残差変動+切片変動+回帰変動)のうち、回帰変動のみが説明変数に依存します。
予測区間の式に、予測に使った説明変数の値を代入すると、その時その時の予測区間の幅が計算されます。
予測区間は、座標(x重心,y重心)の時に最も小さく、両側に行く程、広がっていく傾向があります。
よって、今回のような判断を行うには、No.100のデータに関して、
予測値±●●
の値を計算する必要があります。
~~~~~~~~~~~~~~~~~~~~~~~
ちょっと脱線ですが・・・、
「南向き」と「バス・トイレ別」って「〇・×」の質的変数ですよね(駐車場は駐車台数だと考えれば量的変数かも)。このような問題は「数量化Ⅰ類」で解くべきだと思います。
予測値は変わりませんが、因子の寄与度が変わってきます。
もしかすると、変数選択が変わってくるかもしれませんよ。
No.2
- 回答日時:
その言い方は誤りです。
「実測値は、予測値の上下○○の範囲にある」という言い方ならOKですが、ご質問文はその逆の表現でしたね。ここは良いとして・・・、
その範囲の計算方法は補足コメントに書かれたものとは全く違います。値も±5%ではなく、分布の95%範囲です。
予測区間は、(残差変動+切片変動+回帰変動)の平方根に、自由度(nー使用した変数の数ー1)のt値(外側±2.5%)を掛けたものです。
とても手計算でできるような値ではありません。
https://qiita.com/sakaikosuke/items/75ba95337ccd …
私が前の回答で示した「逆」とは・・・、
ご質問文のように「実測値の上下幅の中に予測値が含まれる」と考えると、元々ばらついている各実測値の上下に各々エラーバーを付けるようなものであり、全体としてはトンデモない許容幅を持ってしまうからです。
No.1
- 回答日時:
> No.100の家賃は92000円で、予測値は90037.72円で、92000円の範囲内だから・・・、
逆ですね。予測値90037.72円の上下に予測区間が付きます。
その95%予測区間内に実測値があれば、予測は上手くいったと考えます。
ちなみに、回帰線の上下には「信頼区間」と「予測区間」という2つの誤差範囲が設けられます。
信頼区間は回帰線の存在範囲、予測区間はデータの存在範囲です。
> 外挿に問題なしということで宜しいでしょうか?
一般に回帰分析では外挿は保証されていません。
そもそも、説明変数・目的変数の分布から逸脱するようなデータがあれば、外れ値として除外しなければなりません。その状態はテコ比という値で示されると思います。
理由は、外れた点があると、見かけ上のフィッティングが良くなってしまうからです。
傾きも無いようなダンゴ状のデータ空間に、離れた点を1点加えるだけで、その点を通るような回帰線が出来てしまうのです。
説明変数の分布の範囲内の値を代入するのであれば構いません。
> 自由度修正済み決定係数(自由度修正済み寄与率)
これは、変数選択の基準であり、フィッティングの指標ではありません。
また、2重調整済みのものを使うべきです。
フィッティングの指標は、調整されていない「重相関係数」やその2乗値である「重決定係数(寄与率)」を使います。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
このQ&Aを見た人はこんなQ&Aも見ています
-
ちょっと先の未来クイズ第2問
9月9日(月)に発表される「第3回子どもマネー川柳」に入賞する川柳を考えてこちらに投稿してください。
-
フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
あなたが普段思っている「これまだ誰も言ってなかったけど共感されるだろうな」というあるあるを教えてください
-
映画のエンドロール観る派?観ない派?
映画が終わった後、すぐに席を立って帰る方もちらほら見かけます。皆さんはエンドロールの最後まで観ていきますか?
-
海外旅行から帰ってきたら、まず何を食べる?
帰国して1番食べたくなるもの、食べたくなるだろうなと思うもの、皆さんはありますか?
-
天使と悪魔選手権
悪魔がこんなささやきをしていたら、天使のあなたはなんと言って止めますか?
-
数学の研究室ってお金あるんですか?そもそもお金必要なのですか?
数学
-
統計学の問題を教えてほしいです。
統計学
-
【プログラム】プログラミングで0と1はデータ量は
計算機科学
-
-
4
消費税10%の税抜き計算と10%OFFの計算法がなぜ違うのか教えて下さい。
統計学
-
5
2の810乗はいくつですか?
数学
-
6
ノンアルコール飲料
数学
-
7
数学の問題で 2つの数において、和が8、積が10のとき、これらの数をもとめなさい。 x+y=8 xy
計算機科学
-
8
わかりませんでした。
数学
-
9
計算の問題を解いていただきたいです。 轢き逃げの犯罪白書に2020年は 被害者が死亡した事件の検挙率
数学
-
10
相加相乗平均を使って最小値を求めたい時は積が定数になるようにしないといけませんか?
数学
-
11
簡単な算数の質問です。 例えば一年でインフルエンザになる人が10人に1人だとします。そして一年でコロ
数学
-
12
(3)のグラフがなぜこうなるのかわかりません。マイナスがついていないから反比例のグラフが反対にならな
数学
-
13
NPU付きのPCを買ったのですが、これは数学的な計算に応用することができますか?
計算機科学
-
14
本体価格500円で1ポイント捺印されるポイントカードがあります。 このポイントカードは、スタンプ欄が
数学
-
15
基本情報の過去問(A問題)の解き方について。 数学の問題なのですが、 こちらの問題の解き方わかる方い
計算機科学
-
16
iに絶対値がつくとどうなるのかを教えてください
数学
-
17
サイコロを投げて6が連続して100回出ました。このサイコロは細工がされていますか?
統計学
-
18
√0.25=±0.5である。 これはなぜ正しく無いのですか?
数学
-
19
今は、割合が入った数学の問題の解くため、小学生から大学生まで、「く・も・わ」という図が使われているの
数学
-
20
n 個のサイコロを同時に振る。 ただし、nは正の整数とする。 出た目の数の積が6の倍数となる確率を求
数学
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・【お題】絵本のタイトル
- ・【大喜利】世界最古のコンビニについて知ってる事を教えてください【投稿~10/10(木)】
- ・メモのコツを教えてください!
- ・CDの保有枚数を教えてください
- ・ホテルを選ぶとき、これだけは譲れない条件TOP3は?
- ・家・車以外で、人生で一番奮発した買い物
- ・人生最悪の忘れ物
- ・【コナン30周年】嘘でしょ!?と思った○○周年を教えて【ハルヒ20周年】
- ・ハマっている「お菓子」を教えて!
- ・最近、いつ泣きましたか?
- ・夏が終わったと感じる瞬間って、どんな時?
- ・10秒目をつむったら…
- ・人生のプチ美学を教えてください!!
- ・あなたの習慣について教えてください!!
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・都道府県穴埋めゲーム
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
切片あり回帰と切片なし回帰
-
修正済み決定係数(R2乗)がマ...
-
ある1点で傾きが急激に変化する...
-
決定係数がマイナスになる例っ...
-
回帰式と近似式について
-
最小二乗法の傾きと切片について
-
重回帰分析について(緊急)
-
重回帰分析で偏回帰係数を全て...
-
Yハットの出し方やミュートと...
-
二つのデータの波形が似てるか...
-
サンプル数の違うものの比較
-
質的データと量的データの相関...
-
相関係数Rの2乗について
-
決定木分析(分類木)について ...
-
判別分析について
-
アクセス2003 レポートの総ペ...
-
xとyの間には次のうち何がある...
-
変動係数(SD/平均)を有意差検定...
-
信号長が2の累乗以外のFFTがや...
-
仮説の設定の仕方
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
決定係数がマイナスになる例っ...
-
切片あり回帰と切片なし回帰
-
統計学の外挿を教えてほしいです。
-
回帰式と近似式について
-
ある1点で傾きが急激に変化する...
-
回帰水を売ってる会社大丈夫か
-
原点強制通過させたときの相関係数
-
残差について
-
修正済み決定係数(R2乗)がマ...
-
numbersで重回帰分析をしたい
-
統計用語の和訳について
-
Yハットの出し方やミュートと...
-
相関係数と回帰直線の使い分け
-
ロジスティック回帰分析におけ...
-
重回帰分析をし、コントロール...
-
複素数同士の回帰式をエクセル...
-
統計用語?
-
重回帰分析・ヘドニックアプローチ
-
Rを使った非線形最小二乗について
-
エクセルで系列5までを同じ相...
おすすめ情報
お言葉を返すようで大変申し訳ありませんが
実測値92000円は、予測値90037.72円の上下5%、
すなわち上は105%の94,538.85円、下は、85,535.15円の範囲内に入っているので外挿に問題なし
という言い方で宜しいでしょうか?
宜しくお願いします。
大変詳細な回答を戴き、本当に有り難う御座います。
戴いたご教授内容から察しますと、
外挿は、保証されておらず、外挿が問題ないか判断するには、複雑な予測区間の計算を行う必要があるということでしょうか。
宜しくお願いします。