アプリ版:「スタンプのみでお礼する」機能のリリースについて

t検定と分散分析に関しての質問です。

比率に関する統計をt検定や分散分析を用いてもいいのでしょうか?

例えばテストの正答率などです。ダメみたいなことを聞いたことがあって教えていただきたいです。

A 回答 (3件)

一定の条件を満たせばOKです。



母比率に関する検定も、二つの比率の違いに関する検定も、n>30くらいで、pがゼロ漸近しないp>0.01くらいであれば、正規分布近似できますのでt検定が可能となります。

分散分析で用いるF検定とt検定は親戚のようなものですから、上記の条件を満たせば分散分析も可能です。

しかし、nが小さい時(n<30)は、正規分布近似ができないためF分布を使った変形を行い検定します。
参考図書:上田拓治(2009)「44の例題で学ぶ統計的検定と推定の解き方」,オーム社,p107

また、pがゼロ漸近するとき、例えば、0.1%の工程内不良が0.01%に低減したというような違いを検定したいときは、ロジット変換や逆正弦変換を使いt検定に持ち込みます。

あるいは、適合度検定などではχ^2検定を使用せず、フィッシャーの正確確率検定を行います。

ゼロに近いpの違いを検定するケースの参考図書を蔵書から探しましたがありませんでした。このケースの実施例はQC検定の解説書で見たことがあります。
    • good
    • 0
この回答へのお礼

ありがとうございます!みてみます!

お礼日時:2022/02/06 01:01

#1です。



なんと、教えて!gooの中に「逆正弦変換」の記述が見つかりました。

https://oshiete.goo.ne.jp/qa/1664514.html

この回答には間違いがあって、「正規分布を仮定しているのは誤差」です。間違いというか、端折っているだけだと思います。弁護する訳ではありませんが、私の#1の回答も、そういう視点では間違いですね。

検定とは、
ある値が観測された。もし同様の観測を何度も何度も繰り返すと、誤差があるから「こんな分布になる」。今回の観測は、その95%内に入らないため、偶然に生じたとは考えられない。だから違いは有意である。というロジックです。

そのとき、一般的にパラメトリック検定の前提とされるのが誤差の正規性です。たとえ比率の値であっても、複数回観測した際の偶然による分布が正規分布に近似できれば、t検定などに持ち込むことができます。

話を元に戻すと、この変換によって「分散の加法性」言い換えれば「二乗和の分解」が担保されます。よって分散分析が可能になります。

他のネット上の解説では、確率が0と1に漸近する部分は著しい非線形性があることを変換の理由としてますが、それも正解です。


要は、「比率のt検定や分散分析がダメみたいなことを聞いた」は、
n数が小さいと、誤差分布が離散的で正規分布に近似できないからダメ。
確率pが0漸近していると、著しい非線形性により誤差分布が正規分布に近似できないからダメ。
ということですね。

ただ、適切な変換をしてやれば、パラメトリックな検定方法に持ち込むことができます。
    • good
    • 0

#2です。



「n数が小さいと、誤差分布が離散的」について、

例えば、テストの正答率を考えてみましょう。
5問の場合、5問中0問正答から5問中5問正答まで、6目盛の上にしか確率質量Pが出てきません。

偶然の正答率をp=1/2とすれば、偶然に何問正解できるかという分布が二項分布で計算できますが、その6本の棒グラフを正規分布で近似するって無理がありますよね。

だから、A君が全問正解したときに、それは偶然ではないと言えるか、という検定は、直接t検定で行うことが出来ないのです。
    • good
    • 0
この回答へのお礼

ご丁寧にありがとうございます!理解しました!

お礼日時:2022/02/06 01:01

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!