現在、「統計学実践ワークブック」という参考書を用いて統計学の勉強を行っているのですが、どうしてもt統計量とF統計量の関係性が理解できません。具体的な不明点としては、t統計量の2乗はF統計量に等しくなるという関係の数理的な理解です。
具体的な問題としては、単回帰モデル:
Yi = a + b Xi + εi, i = 1,…,n
において、βとσ^2(β)をそれぞれβの最小二乗推定量とその分散とする。このとき、
①帰無仮説: b = 0 を検定する F 検定統計量がF=β^2/σ^2(β)と表せることを示しなさい。
②問題2のF検定統計量は(Se(B)-Se(A))/(Se(A)/(n-2))と表せることを示しなさい。ただし、Se(A)は制約のない残差平方和、Se(B)は帰無仮説の下での残差平方和とする。
以上の問題を数式として導出できれば、納得がいくのですが、なかなかうまくいきません。ご教授よろしくお願いします。
A 回答 (9件)
- 最新から表示
- 回答順に表示
No.9
- 回答日時:
ところで、最初の疑問であった、t値とF値の関係は解決できましたか?
t統計量の2乗はF統計量に等しくなるというのは、『2つの平均値の差のt検定と、一元配置の分散分析(F検定)とは、同じ結果を与える』という検定の初歩の段階で教えている内容ですが、その理由は↓をご参照下さい。
https://bellcurve.jp/statistics/blog/14147.html
あと、①②それぞれの統計量の算出ですが、解説してある参考書は、
①については、
永田、棟近(2001)『多変量解析法入門』,サイエンス社,p50
t値、F値とも出ています。2乗すれば良い、なんてやっつけの説明ではないです。
②については、
蓑谷(2017)『回帰診断』,朝倉書店,p22
残念ながら導出は出ていませんが、(全変動)ー(誤差変動)から回帰の有意性を求める方法は「重回帰分析」で使うので、ネットで重回帰分析の解説を探せば出てくると思います。
ただし、②の検定は個々の回帰係数の有意性ではなく、「回帰そのもの」の有意性を調べる方法ですので、この問題のように①に関連付けて出題するのはマズいと思います。
②は定数項もコミコミで検定していますから。
Se(A)は(線形)制約のない残差平方和→普通は全変動と言います。
Se(B)は帰無仮説(回帰式たる線形制約が掛った状態)の下での残差平方和→普通は誤差変動と言います。
②の帰無仮説はβ=0ではありませんので要注意です。問題文、おかしいです。
No.8
- 回答日時:
No.6へのコメントについて。
> リンクのほうは講義資料ですから、詳細は省いたのかもしれません。
いやそれは資料作成者の言い訳にはならんと思いますよ。むしろ「一体何を仮定しているか」(ご質問の場合には、データの生成モデルと、fittingするモデルとの区別)に無自覚になるように誘導している、かのように見えちゃいます。
手法に振り回されて変なことやる人がいっぱいいますが、それは大抵「一体何を仮定しているか」を忘れている(あるいは、そもそも知ってもいないで格好だけ真似している)からです。
せっかく丁寧に学んでいらっしゃるんですから、手法の計算の細々したこと(は機械がやってくれるんで、それ)よりも、キホンとなる考え方にこそ重きを置くのがよろしかろうと思います。
No.7
- 回答日時:
>実務で、最初に「ざっくりこんな感じ?」というんで簡単なモデルをfittingしたとして、さて残差に変なクセがないかしらん、と観察することもせずに検定とかやりますかねえ?
おっしゃる通りです。
社内では、必ず残差プロットを見るように教育していますし、普通の統計パッケージソフトであれば、残差プロットは簡単に見えますから、習慣になっていると思います。(検定結果(p値)も回帰結果と一緒に自動的に表示されますが、多くの技術者は見ていません。残差プロットを見ます。)
そのうえで、残差には「もう何も説明するものは残っていない」ことを確認しています。でないと、2乗の関係があっても見落としてしまいますから・・・。
No.6
- 回答日時:
No.5へのコメントについて。
③いずれでもない
が近いかな、ってところですね。
データの生成メカニズムが厳密に分かっていてパラメータの推定だけが課題だ、という場合もあれば、メカニズムは全く不明でデータだけが頼りだという場合もあり、その中間もある。
ご質問の問題では、その辺の設定が書いてないんで「データだけが頼り」として扱うしかありません。(リンクのテキストでは、fittingしたモデルは書いてあるけれど、それはデータの生成メカニズムのことではありません。混同しちゃダメです。)だから「パラメータ」と言っているのは、あくまでも分析者が勝手に選んだモデルのパラメータのことであって、データの生成メカニズムが持つ(かもしれない何らかの)パラメータとは別物です。
結果の用途によって、モデルのパラメータの信頼区間はせいぜいこんなもんというのをザックリ示せば足りる場合もあるし、誤差なんか気にしたってしょうがない場合すらもある。検定をやるのが適切な場合ってのは、データの生成メカニズム(i.e., 正しいモデル)が分かっている時ぐらいじゃないかなあ。
No.4< (質問に対してちょっとレベル高すぎる気がしますが、それはさておき)実務において残差に関する仮定を暗黙裡に使うという話と、初学者に基本をきちんと教えないテキストばっかり多くてアカンという話は別件だろうと思います。
実務で、最初に「ざっくりこんな感じ?」というんで簡単なモデルをfittingしたとして、さて残差に変なクセがないかしらん、と観察することもせずに検定とかやりますかねえ?
ありがとうございます。実務上、データの生成メカニズムや残差に対する分析が重要であって、場合によっては検定が必要ない状況がままあるということはなんとなく理解しました。現在私が使っている参考書には、残差の仮定や真のモデルに関する仮定もなされており、私の記入漏れです。申し訳ありません。リンクのほうは講義資料ですから、詳細は省いたのかもしれません。
現在の私の目的としましては、とりあえず実務上の諸問題はさておいて、検定の手法や考え方を理解しておきたいと考え、今回の質問をさせていただきました。いろいろ拙い点が多く、申し訳ありません。
No.5
- 回答日時:
No.3へのコメントについて。
頑張るおつもりなら、もうちょっと:
まず、N, Xi (i=1~N)はそれぞれ既知の定数。これは単に事実であって、帰無仮説には含まれない。そして、
H:「Yi (i=1~N)はそれぞれ独立で、どれも平均A, 分散s^2の正規分布に従う。(ただしA, sは未知の定数)」
というのが、ご質問の統計量で検定する帰無仮説Hです。さて、Hが棄却されたら、その否定¬Hを主張する。その主張が実際どうなるかを書いてみれば、「帰無仮説はb=0」だなんてイーカゲンだなと思えてくるんじゃないかしらん。
ありがとうございます。こちらの勉強不足で理解が追いついていないので再度お聞きしたいです。
①F統計量で個々の説明変数の有意性を検定することが不適切
②そもそも個々の説明変数の有意性を検定することが不適切
③いずれでもない
以上の3つのうちどれが回答者様の回答内容として正しいのでしょうか。よろしくおねがいします。
No.4
- 回答日時:
横からすみません。
誤差に関する下記の4つの条件は「ガウス・マルコフの定理」として知られ、回帰分析を行うときの暗黙の了解なので、一概に端折ったテキストだとは言えません。他も似たようなものです。
①②の条件は強い条件なので、#2さんも①②は大前提として考えておられ、「最小二乗法」が成立するために③④が必要だとおっしゃっているのだと思います。言い換えれば、③④が無くても「最尤法」で解けば良いからです。
誤差の(残差)の満たすべき条件は、
①不偏性 :E(εi)=0(誤差の期待値は0)
②外生性 :Cov(Xi,εi)=E(εi|Xi)=0(誤差は説明変数とは無相関であり不偏)
③等分散性:Var(εi)=σ^2(誤差分散はどこでもσ^2)
④独立性 :Cov(εi,εj)=0(誤差どおしは無相関)
①②で解が不偏推定量に
③④で解がBLUE(最良線形不偏推定量)になる。というものです。
BLUEとは、簡単に言えば、最小2乗法で求めた解(OLS)が最尤法で求めた解と一致するということです。
残差が正規分布するとの条件は、③等分散性に含まれます。最小二乗法の残差(平方損失の最小化)がσになるのは正規分布だからです。
なお、①~④が回帰分析つまり一般線形モデルの条件ですが、この条件を逸脱すると、一般線形モデル→一般化線形モデル→一般化加法モデルへと拡張されていきます。
ありがとうございます。残差の仮定については質問する側として、もう少し丁寧に表記しておくべきであったと反省しております。
BLUEについては自分も最近学習したばかりですが、回答者様の説明が非常にわかりやすくまとまっていて、より理解が深まりました。ありがとうございます。
No.1
- 回答日時:
分布の話と、その応用としての検定の話とは、切り離してお考えになった方が良さそうに思います。
> t統計量の2乗はF統計量に等しくなるという関係の数理的な理解
「tが自由度nのt分布に従うなら、その2乗sは自由度(1,n)のF分布に従う」って話ですね。tの確率密度関数をf(t)とします。sの分布g(s)は、s<0ならg(s)=0である。t>0とt≦0にわけて考えると、どっちについても
g(s) = f(t) (dt/ds)
である。だから
g(s) = 2 f(√s) / (2√s)
で、これが自由度(1,n)のF分布になることは、f(t)を定義通りに展開してからF分布の確率密度関数と比べてみればわかります。
母集団が平均m、分散σ^2の正規分布のとき、サンプルN個から得られる母集団の分散の不偏推定量をS^2、母集団の平均の不偏推定量をXとすると、
(√N)(X-m)/S
は自由度N-1のt分布に、また
(N(X-m)^2)/S^2
は自由度(1,N-1)のF分布に従う。これはS^2が自由度N-1のχ2乗分布に従うことと、F分布の定義とから、簡単に示せるでしょう。
なおお示しの問題は、帰無仮説①がもし棄却されたって、b=0が否定される訳じゃないです。なぜなら、帰無仮説中には明示されていないけれども、残差の分布および独立性についての仮定が入っているからで、何だかイーカゲンなテキストっぽいなと思います。
ご回答ありがとうございます。F分布の定義とt分布の定義を考えることで、F統計量とt統計量の関係が理解できました。
一方で、この事実を実際に重回帰分析の検定に利用するとなると、まだ理解ができていません。そこで先に示した問題がその理解の役に立つかなと思ったのですが、既存の問題を自分が書き換えたものなので、抜けがあるかもしれません。元のリンクを提示させていただきます。該当の問題は下記リンクの最後のページの演習問題になっています。お忙しいなか申し訳ありません。
「回帰分析(F検定)」長倉大輔
http://user.keio.ac.jp/~nagakura/zemi/F_test.pdf
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 大学・短大 大学 統計学 1 2022/09/14 11:27
- 統計学 統計学が分かりません!詳しい解説と回答を教えてくださる方お願いいします! 5 2022/08/23 03:10
- 統計学 統計学の問題です。よろしくお願いします。 ある部品の重量は正規分布に従うとされており,過去の経験から 1 2023/01/19 03:36
- 統計学 母平均の検定(両側t検定)の問題 2 2023/03/14 20:02
- 統計学 t値の計算方法 1 2022/11/29 18:37
- 統計学 統計学の質問【帰無仮説】 高校の新学習指導要領では、統計的仮説検定の基本的な考え方が必修単元となった 5 2023/05/23 21:00
- 統計学 並べ替え検定について教えてください。 群Aか群Bの平均を検定統計量にすると思うのですがどのような場合 3 2023/05/13 17:23
- 統計学 統計学を独学で勉強してます。 ページ左上に誤差分散の推定量の指揮があると思いますが(青いペン) 例題 2 2023/02/12 12:34
- 統計学 統計学を独学で勉強してます。 ページ左上に誤差分散の推定量の指揮があると思いますが(青いペン) 例題 5 2023/02/12 15:39
- 統計学 確率統計の問題です。 3 2022/04/07 04:39
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・【大喜利】【投稿~11/22】このサンタクロースは偽物だと気付いた理由とは?
- ・お風呂の温度、何℃にしてますか?
- ・とっておきの「まかない飯」を教えて下さい!
- ・2024年のうちにやっておきたいこと、ここで宣言しませんか?
- ・いけず言葉しりとり
- ・土曜の昼、学校帰りの昼メシの思い出
- ・忘れられない激○○料理
- ・あなたにとってのゴールデンタイムはいつですか?
- ・とっておきの「夜食」教えて下さい
- ・これまでで一番「情けなかったとき」はいつですか?
- ・プリン+醤油=ウニみたいな組み合わせメニューを教えて!
- ・タイムマシーンがあったら、過去と未来どちらに行く?
- ・遅刻の「言い訳」選手権
- ・好きな和訳タイトルを教えてください
- ・うちのカレーにはこれが入ってる!って食材ありますか?
- ・おすすめのモーニング・朝食メニューを教えて!
- ・「覚え間違い」を教えてください!
- ・とっておきの手土産を教えて
- ・「平成」を感じるもの
- ・秘密基地、どこに作った?
- ・【お題】NEW演歌
- ・カンパ〜イ!←最初の1杯目、なに頼む?
- ・一回も披露したことのない豆知識
- ・これ何て呼びますか
- ・初めて自分の家と他人の家が違う、と意識した時
- ・「これはヤバかったな」という遅刻エピソード
- ・これ何て呼びますか Part2
- ・許せない心理テスト
- ・この人頭いいなと思ったエピソード
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・好きなおでんの具材ドラフト会議しましょう
- ・餃子を食べるとき、何をつけますか?
- ・あなたの「必」の書き順を教えてください
- ・ギリギリ行けるお一人様のライン
- ・10代と話して驚いたこと
- ・大人になっても苦手な食べ物、ありますか?
- ・14歳の自分に衝撃の事実を告げてください
- ・家・車以外で、人生で一番奮発した買い物
- ・人生最悪の忘れ物
- ・あなたの習慣について教えてください!!
- ・都道府県穴埋めゲーム
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
エクセルのグラフから半値幅を...
-
検量線の決定係数について
-
EXCELにてローパスフィルタを作...
-
極値をもつ時と持たない時、単...
-
【統計】有意に「高い」?「低...
-
下の対数表示のグラフから低域...
-
x=2分の3のグラフはどのように...
-
統計について
-
一次関数 グラフや式それぞれ...
-
アンケートの集計分析の基礎(...
-
心理学の統計について
-
少ない母数に対するアンケート...
-
一元配置分散分析のp値が0になる
-
理科のグラフで、直線と曲線の...
-
統計学のサンプル数2000の根拠は?
-
統計学の質問【帰無仮説】 W大...
-
変化率のみで、有意差の検定は...
-
卒業論文のアンケートの数について
-
エミッタ接地トランジスタの静...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
EXCELにてローパスフィルタを作...
-
検量線の決定係数について
-
エクセルのグラフから半値幅を...
-
下の対数表示のグラフから低域...
-
心理学の統計について
-
一次関数 グラフや式それぞれ...
-
統計について
-
【統計】有意に「高い」?「低...
-
理科のグラフで、直線と曲線の...
-
エクセルの統計でχ二乗検定の結...
-
卒業論文のアンケートの数について
-
x=2分の3のグラフはどのように...
-
線形なグラフとはひとくちに言...
-
最小二乗法を反比例の式を元に...
-
極値をもつ時と持たない時、単...
-
統計学のサンプル数2000の根拠は?
-
一元配置分散分析のp値が0になる
-
検定統計量の値がマイナス
-
パイロットサンプルって何ですか?
おすすめ情報
先に示した問題の元のリンクを提示させていただきます。該当の問題は下記リンクの最後のページの演習問題になっています。よろしくお願いします。
「回帰分析(F検定)」長倉大輔
http://user.keio.ac.jp/~nagakura/zemi/F_test.pdf