急いでいます！

一元配置分散分析のｐ値が０になる

解決済

質問者：統計のひよこ
質問日時：2019/10/01 23:30
回答数：2件

データAが標本数200，データBが標本数1000，データCが標本数2000のデータがあり、Excelの分析ツールで一元配置分散分析をしています。
しかし、ｐ値が０になってしまいます。
ｐ値が０となるのはあり得るのでしょうか。
それとも標本数に差がありすぎてうまくできないのでしょうか。

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (2件)

ベストアンサー優先
最新から表示
回答順に表示

No.1ベストアンサー

回答者： kamiyasiro
回答日時：2019/10/01 23:59

企業でSQCを推進する立場の者です。

これは全標本数が多すぎることが原因です。

分散分析表で、誤差の自由度を確認してみて下さい。
3150とかなっていませんか。
つまりA因子B因子C因子が何水準で振られているか分かりませんが、
因子の水準で消費される自由度はせいぜい50です。
すると、誤差の自由度が大きくなり、Se／φ＝Veですので、Veがめちゃくちゃ小さくなります。
そんなVeで検定したら、些細な差でも有意になって当たり前です。

「Yaho××」のなんちゃって系データサイエンティストが、
「検索窓」のサイズを「6ピクセル」多くしたら、何だったか忘れましたが「0.64％」増えた。
これは、金額に直すと何億という額に相当する。と発表していました。
（「」のワードでググれば出てきます。こっ恥ずかしい記事です）

サンプル数10万人で検定すれば、0.64％の違いでも有意になります。
でも、そんな値、日々の変動に埋もれる程度の値ですよね。

これは、基礎統計の基本のキです。
でも以前、教えてgooで、佐伯・松原「実践としての統計学」東大出版会、に書かれていた
「サンプルサイズが大きければ些細な差でも有意になるというのが分からない」
https://oshiete.goo.ne.jp/qa/10009682.html
という質問に対して、殆どの回答者が異を唱えていたのにはびっくりしました。
高名な先生が本に書かれているのに、ここの回答者は否定するのですよ。
本当にびっくりです。