統計の初心者です。
分散分析の理論でご質問があります。
例えば一元配置実験で
要因aの特性に対する効果を見たい場合、
誤差eとの分散比Va/VeでF検定しますが、
このVa、Veの分散の期待値E(V)はそれぞれ
Va=σe^2+nσa^2
Ve=σe^2
となり、σa^2は0以上なので
VaはVeより小さくなることはない、
つまりVa/Veは1以上となる
と各参考書でよく見かけます。
しかし、実際に分散分析で、
VaがVeより小さく、F値が1以下のものも
あります。
例をあげるとA1とA2で5回ずつサンプリングして
A1:5, 5.1, 4.9, 5.1 ,4.8
A2:5, 5.3, 4.8, 5.2 ,4.8
の場合
Va=0.0040
Ve=0.0345
F=0.12
となります。
あきらかに先ほどの説明と矛盾していますが
これはどういうことでしょうか?
できるかぎりわかりやすくお願いします。
No.3ベストアンサー
- 回答日時:
>繰り返し数nを増やせば、Vaも大きくなるので、aを有意にどうしてもしたければnを増やせば有意にできてしまうということになりませんか?
>(繰り返し数を増やせば誤差の自由度は上がりますが、因子aの自由度は繰り返し数には関係ないのでSaは増える一方ですよね)
>これではσaがどんなに小さくてもnを大きくすれば有意にできる???どこが間違っているのでしょうか?
間違ってはいません。因子Aの効果があるならば、効果を検出できるようになります。
逆に因子Aの効果がなければ、誤差が小さくなっても、存在しないはずのA1とA2の差も小さくなり、有意さは出ないはずです。
では、n数を増やせば良いでは確実では無いか、と思われるかも知れませんが、n=5くらいで、有意さが出なかったわずかな効果でも、あるかもしれないと期待して、この先検討を進める事に意味があるのかどうかという点に関わってきます。このへんは検討する技術分野の固有問題です。
他に効果の大きい因子があるかもしれないのに、効果があるかどうか分からないような因子にこだわるのか、ということですね。
薬効や人命に関わる微妙な問題だったらこだわるかも知れませんね。
とりあえず効果のありそうな因子を見つけたいのなら、2元、3元配置法、実験計画法、パラーメータ設計などの出番です。
割合少ないn数で、如何に効率よく効果がありそうな因子を見つけるか、という手法です。この過程でプーリングして消していった因子は、効果が無いのではなく、効果があるとはいえないから、とりあえず消して消して、他の効果の大きそうな因子に絞って行くのです。
どんな対策が効果的かわからないような問題では、この方が効率的ですね。多変量解析もいいかも知れません。
厳密にどれくらいn数を取ればよいか、検出力とn数の関係は、、、私も勉強中で理解しきれていません。
参考URL:http://www4.ocn.ne.jp/~murakou/anova.htm,http:// …
>n=5くらいで、有意さが出なかったわずかな効果でも、あるかもしれないと期待して、この先検討を進める事に意味があるのかどうかという点に関わってきます。
なるほど!とう感じです
つっかえていたものが取れたようです。
統計は奥が深いですね。私もよく勉強します。
今回は丁寧な回答ほんとうにありがとうございます。
No.4
- 回答日時:
No3の日本語変ですね。
途中でボタン押してしまいました。申し訳ありません。のついでにもう一言。
αとβはトレードオフの関係にあるので、
P値を見れば、効果があるかないか、大体想像つきます。
No.2
- 回答日時:
No1です。
気になったので、追記させていただきます。>数学的な意味を明確にする意図のようですが、統計ソフトを使う実務ではべつに分散の期待値なんて分からなくてもできますね。
>それらが全くの別物だと、素人は混乱してしまいそうですね。
素人が統計ソフトの結果だけから、効果がある無いと判定すると危険ですよ。という意味で、
分散の期待値:E(V) σe^2+nσa^2
が記載してあるのだと思います。
統計の勉強をなさっているようなのでわかるとおもいますが、
第2種の誤りβ(ぼんやり者の誤り)
に気をつけなさいといっているのだと思います。
帰無仮説H0が棄却された時に、H1が実は正しい確率(第1種の誤り)は、有意水準αなので、αを小さくすればまず問題ありませんが、帰無仮説H0が棄却されない時に、実は対立仮説H1が正しい(第2種の誤り)確率βはどれくらいか分かりません。
効果の分散の構造式に繰り返しの数nがあることからも分かるとおり、nが大きければ、第2種の誤りは低減できます。
すなわち、nが少ない場合に、H0を採択するした場合、本当は効果がるのに、ばらつきが大きいだけで、見逃している場合があるのです。
だから統計の本ではなぜこのような分析をしているのかという理屈の部分に力を割いているのだと思います。
つまり、データにはばらつきがありますよ。
でも、誤差のばらつきの影響は、n数を増やせば小さくできますよ。
って事を忘れないでね。ということだと思います。
補足ありがとうございます。ソフトの解析結果を鵜呑みにするのは危険ですよというのは納得です。
ただ、1点混乱しています。
繰り返し数nを増やせば、Vaも大きくなるので、aを有意にどうしてもしたければnを増やせば有意にできてしまうということになりませんか?
(繰り返し数を増やせば誤差の自由度は上がりますが、因子aの自由度は繰り返し数には関係ないのでSaは増える一方ですよね)
これではσaがどんなに小さくてもnを大きくすれば有意にできる???どこが間違っているのでしょうか?
No.1
- 回答日時:
Va=0.0040、Ve=0.0345の値は分散分析表のVに出てくる値ですね。
すなわち、Va=Sa/φa、Ve=Se/φe
これに対して分散の期待値
σe^2+nσa^2、σe^2
は上記とは別のものです。私は下記のように理解しています。
Ve=σe^2、Va=nσa^2(Vaの方は正確で無いかも知れません)
σe^2に対してnσa^2が有意であるかをF検定にて分析します。
では、なぜ分散の期待値があるかというと
データxの構造式は
xij=μ+ai+εij
μは母平均、aiは水準Aの時の効果、εijは誤差~n(0,σe^2)
ただし、Σai=0、σa=(Σai^2)/(m-1)・・・mは水準の数
残差平方和は、St=Sa+Se ですので、
因子Aと誤差のデータに与える影響は、純粋なAの効果と誤差の効果の影響で決まるため、分散の期待値は σe^2+nσa^2 と書けます。
ポイントは、aiの平均値とεijの平均値がともに0だという点で、行列式で考えてみると分かりやすいです。
分散の期待値は、特に詳しい統計の教科書に出てきます。
数学的な意味を明確にする意図のようですが、統計ソフトを使う実務ではべつに分散の期待値なんて分からなくてもできますね。
丁寧な回答ありがとうございます。
おおむね理解できました。
統計の教科書を何冊か読んだのですが
分散分析表のVaやVeの欄の一番右に分散の期待値の構造式が併記してあるのがほとんどでした。
それらが全くの別物だと、素人は混乱してしまいそうですね。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 物理学 電気磁気測定の整流形電圧計の問題についてです。 写真の問題についてで、正弦波での実効値Ve、最大値V 2 2023/02/16 11:12
- 物理学 高1力学の運動量の問題です。問題を一通り解いたのですが、行き詰まってしまったのでご回答頂ければ嬉しい 3 2022/06/29 11:20
- 統計学 加重最小二乗法=①「変数を自然対数変換」=②「誤差項の分散の逆数を重み付け」? 8 2022/11/26 11:15
- 統計学 Rを用いた「繰り返しがある直交表実験計画法」の分析方法 8 2023/08/01 17:58
- 日本語 不得要領という四字熟語 4 2022/11/15 16:48
- 物理学 Va=1/4πε × (q1/a + q2/b + q3/c) Vc=1/4πε × (q1+q2+ 2 2023/04/16 14:08
- 物理学 2物体の単振動 1 2023/08/17 20:27
- 統計学 t検定について教えてください 2 2023/02/23 16:35
- 物理学 電磁気学 次の文の①②③に当てはまるものを教えてほしいです。 自己インダクタンスLのコイルと抵抗値R 2 2023/01/30 22:13
- 統計学 統計学を独学で勉強してます。 ページ左上に誤差分散の推定量の指揮があると思いますが(青いペン) 例題 2 2023/02/12 12:34
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
ランダム出力の数値をコントロ...
-
分散が大きいとデータの偏りが...
-
統計学の問題です。 ある駅の売...
-
金融資産1億円以上持っている...
-
正規化された確率分布を合成す...
-
ネットワーク分散エンコーダを...
-
写真の問題の分散を求めたいで...
-
K回同期加算すると、雑音が1/K...
-
コインゲームの利得をエクセル...
-
皆さんはNISAしてますか?
-
重荷分散の為に敷く板には木製...
-
確率変数列の期待値分散
-
数学(ほぼ統計)について、教...
-
判別分析
-
標準化の意味を教えて下さい
-
1〜6の目が等しい確率で出るサ...
-
期待値と参加率の計算
-
標準偏差
-
統計学でいうRSD%とは何ですか。
-
統計学における有効数字につい...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
22歳新卒でNISAを始めてみまし...
-
重荷分散の為に敷く板には木製...
-
2つの正規分布を合成したらど...
-
正規分布の加法性について
-
エクセルのF検定
-
私は現在障がいがありながらも...
-
確率変数の商の分散
-
K回同期加算すると、雑音が1/K...
-
ニーサで全世界派の人達は分散...
-
数学(ほぼ統計)について、教...
-
統計の分散のイメージ
-
分散が大きいとデータの偏りが...
-
確率の問題で、平均値と分散に...
-
数A データの分析の問です。 次...
-
長期投資で年率7%で指数関数的...
-
金融資産1億円以上持っている...
-
体重分散用のベニヤ板って販売...
-
期待値と分散の問題です。ある...
-
正規化された確率分布を合成す...
-
ネットワーク分散エンコーダを...
おすすめ情報