アプリ版:「スタンプのみでお礼する」機能のリリースについて

こんにちは。
統計初心者です。
アプリの企画をしているものです。

今、2つのデザイン案があり、どちらのデザインが良いかを統計的に判断しようと思っております。
その際の必要サンプル数が知りたいです。

デザイン案1を見る集団をA, デザイン案を見る集団をBとして、それぞれをクラスタA,クラスタBに分けます。
クラスタA,クラスタBに対して、ある行動をとったか、とっていないかという2値の数を取り、
その差をカイ二乗検定で評価したいと思っています。
それぞれのユーザーは、完全に独立しており、他のユーザーへの行動には影響を及ぼしません。
危険域は0.05で設定します。

初心者の為に説明が足りない部分があるかもしれません。。。
その際の最小サンプル数を教えていただけますと幸いです。

どうぞ宜しくお願いします。

A 回答 (1件)

「サンプル数は最低いくつ必要か」というご質問は、問いとして成立していません。


 Aの刺激を与えたときに反応する人の比率がa、Bの刺激を与えたときに反応する人の比率がbだとしましょう。で、「a = b」という帰無仮説を検定するのがカイ二乗検定です。N人にAの刺激を与えたときに反応する人は平均aN人いるはずですが、サンプル数が少ないほど、実際に反応する人の数nがばらつきます。nの出現確率は(もしランダムにサンプリングしたのなら)正確に二項分布に従うわけです。このことを使って、「aの推定値の分布」を描くことができます。bについても同様。そして、カイ二乗値は、両者の分布がどのぐらい重なり合っているか、を測ったものに他なりません。サンプル数が多いほど、「a,bの推定値の分布」の幅がそれぞれ狭くなるので、a,bのわずかな違いまで検出できる可能性がある。

 ですが、ご質問の状況においてそんなことをやってどうするんでしょ。「わずかでも違いがあるのかどうか」ということを知るのがホントに重要ですか?
 むしろa, bの推定値の分布そのものを描いてみて、「両者がどのぐらい違うか」を見る方が、カイ二乗検定で「違いがあると言えるかどうか」だけを結論するよりも、せっかく取ったデータを活かせるんじゃありませんかね。
    • good
    • 2

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!