最小自乗法で求められた傾きの誤差

Question

データ列(x,y)がｎ個あって、それを最小自乗法でフィッティングして
y=ax+bにおける傾きaが得られました。

そこで、yの測定誤差が例えば±10％あったとき、
傾きaの誤差δaはどのように求められるのでしょうか？

データ数nが多いほどδaは小さくなるとは思いますが・・・。
よろしくお願いいたしますm(_ _)m

noname#11476 · Accepted Answer

ごめんなさい、まだ続きがあるのとちょっと間違いがありました。＿ｏ＿

>今ｙの誤差を考えているのでxi→yiでしょうか？ 
いいえこちらは、xiで間違いありません。

<訂正部分>
まず、σa と　σb が入れ替わっていました。
つまり、
σa^2 = N / Δ
σb^2 = Sxx / Δ 
です。
が、さらに追加があって、この式ではσi=1 (一定)と仮定して計算しましたので、その分の補正をかけなければならないことを忘れていました。
得られたσa, σbにたいして、

sqrt[ Χ^2 / (N-2)]

をかけて、その値をσa,σbとしてください。

ここでΧ^2は回帰したときの平方和です。（つまり (y - yi)^2 をi=1,,Nで和をとったもの）

今度は間違いがあるといけないので、お示しのデータで検算しました。

傾き---- 0.143341085
切片---- 0.237704298

が68.3%誤差範囲です。
今度はExcelのLinest関数と答えあわせして、ＯＫでしたので間違いないでしょう。
((ΔΧv)^2の数値はLinestでは出てきませんけど。σa, σb は計算してくれます）

では。

sen-sen · Answer

統計学の教科書には、実験を繰り返すことによって得られる回帰直線の傾き推定値aが正規分布に従うことが知られているなどと記載されています。これを信じると、ｔ分布を使い回帰係数の推定を行うことができます。
実際に統計学の教科書には問題の例などがあって、それに従って計算すると、この場合では回帰係数aの95％信頼区間が(-0.92<a<-0.32)で示せることがわかるでしょう。統計解析ソフトウエアを使えば答えを出すのに１分もかからないでしょう。

より実際的には他のグループで推計された回帰係数aを集めて標本を作り、その分布から母集団のaの値を推定するのもよいかもしれません。
（ここでの「a」はそれぞれ定義が違うので表現法を変えた方がよいかもしれません）


＞そこで担当教官に「aの誤差を評価しなさい」と言われたわけです。 

「誤差」を計算するには、aの真の値が必要です。
それを教官から教えてもらいましょう。
そうすると、その真値と今回の実験で得られた回帰直線の傾き推定値aとの差の絶対値が「aの誤差」となるでしょう。


＞データ数nが多いほどδaは小さくなるとは思いますが・・・。

実験回数が多いと疲れていい加減になるかもしれないので一概には言えないかも。

noname#11476 · Answer

いま得られるデータxi, yi の yi の不確かさ、つまり分散がどの yi でも同一であるとします。
このとき、データ数をNとして、

Sxx = Sum(i =1, N) { xi^2 }
Sx  = Sum(i =1, N) { xi }

Δ = N * Sxx - (Sx)^2

とします。
ここで、Sum(i =1, N) は {}内の数値をi=1,2,3....,Nまで加算するΣの記号とします。
また、”^”の記号は x^2 = X * X と累乗をあらわすとします。

パラメータa、bの標準偏差σa, σbは、

σa^2 = Sxx / Δ
σb^2 = N / Δ

で与えられます。
さて、a, bの 68.3%, 95.4%, 99.99%などの信頼区間を求めるには、その信頼区間を表す自由度vの(ΔΧv)^2（カイ２乗と呼ばれます）の数値を用いて、

δa = sqrt[ (ΔΧv)^2 ] * σa
δb = sqrt[ (ΔΧv)^2 ] * σb

つまり誤差を含んだ表記としては、(a ± δa)[95.4%] のようになります。

今直線回帰の場合は自由度が２なので、代表的な信頼区間における(ΔΧ2)^2は、

68.3 % ... 2.30
95.4 % ... 6.17
99.0 % ... 9.21
99.99 % .. 18.4

となります。
ただしa, bの同時信頼域（ａ，ｂがともにある信頼度以内にある範囲）を求めたい場合はさらにややこしくなりますのでここでは割愛させていただきます。

これ以上は統計学などの本をお読みください。

sen-sen · Answer

＞yの測定誤差が例えば±10％

誤差の定義が真値と測定値の差とすると、真値はどのようにして得られたのでしょうか？また、その差の大きさはいつも真の値の10％と固定されているのでしょうか？

＞傾きaの誤差δaはどのように求められるのでしょうか？ 
傾きaの不確かさδaは、yの測定不確かさの分布によって決まりそうなので、シミュレーションしてその大きさの分布を求めてみるのはいかがでしょうか。

noname#21649 · Answer

場所によって異なります。平均値付近を極しょうちとして．左右で発散するとつ関数（おう関数かも．名称が疑問）になります。
回帰分析では．最小値と最大値の間だけ使用可能であり．がいそうは原則（例外としてひょうてん方．ただし別の方法で線形性を調べてから使用するので．外装はんいが線形になっていることがわかっていますから）として使用してはならないといわれている原因です。

134 · Answer

手元に一覧表がないので、「回答」にはなりかねます…

データーが多いほど、データは正規分布に近い分布を形成しますので、±10％でどれくらいの信頼度があるか、確認してみるとよいと思います。

　ちなみに、得られた直線を中心とする漸近線で表されると思います…

最小自乗法で求められた傾きの誤差

ごめんなさい、まだ続きがあるのとちょっと間違いがありました。

統計学の教科書には、実験を繰り返すことによって得られる回帰直線の傾き推定値aが正規分布に従うことが知られているなどと記載されています。

いま得られるデータxi, yi の yi の不確かさ、つまり分散がどの yi でも同一であるとします。

この回答への補足

＞yの測定誤差が例えば±10％

この回答への補足

場所によって異なります。

手元に一覧表がないので、「回答」にはなりかねます…

似たような質問が見つかりました

このQ&Aを見た人はこんなQ&Aも見ています

関連するカテゴリからQ&Aを探す

このQ&Aを見た人がよく見るQ&A

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング

　手元に一覧表がないので、「回答」にはなりかねます…