アプリ版:「スタンプのみでお礼する」機能のリリースについて

データAが標本数200,データBが標本数1000,データCが標本数2000のデータがあり、Excelの分析ツールで一元配置分散分析をしています。
しかし、p値が0になってしまいます。
p値が0となるのはあり得るのでしょうか。
それとも標本数に差がありすぎてうまくできないのでしょうか。

A 回答 (2件)

企業でSQCを推進する立場の者です。



これは全標本数が多すぎることが原因です。

分散分析表で、誤差の自由度を確認してみて下さい。
3150とかなっていませんか。
つまりA因子B因子C因子が何水準で振られているか分かりませんが、
因子の水準で消費される自由度はせいぜい50です。
すると、誤差の自由度が大きくなり、Se/φ=Veですので、Veがめちゃくちゃ小さくなります。
そんなVeで検定したら、些細な差でも有意になって当たり前です。

「Yaho××」のなんちゃって系データサイエンティストが、
「検索窓」のサイズを「6ピクセル」多くしたら、何だったか忘れましたが「0.64%」増えた。
これは、金額に直すと何億という額に相当する。と発表していました。
(「」のワードでググれば出てきます。こっ恥ずかしい記事です)

サンプル数10万人で検定すれば、0.64%の違いでも有意になります。
でも、そんな値、日々の変動に埋もれる程度の値ですよね。

これは、基礎統計の基本のキです。
でも以前、教えてgooで、佐伯・松原「実践としての統計学」東大出版会、に書かれていた
「サンプルサイズが大きければ些細な差でも有意になるというのが分からない」
https://oshiete.goo.ne.jp/qa/10009682.html
という質問に対して、殆どの回答者が異を唱えていたのにはびっくりしました。
高名な先生が本に書かれているのに、ここの回答者は否定するのですよ。
本当にびっくりです。
    • good
    • 3

#1です。



ごめんなさい、
一元配置ですから、因子の自由度は僅かに2、誤差の自由度は3197ですね。
    • good
    • 1

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!