この人頭いいなと思ったエピソード

カイ二条検定で、標本が4つでカテゴリー数が3のとき、自由度は6とありました。
自由度はn-1で求めるのではないのですか…?
次の問題ではカイ二条検定で、標本が1つでカテゴリー数が4のとき、自由度は3であるとありました。
どのようにして求めているのでしょうか…

A 回答 (1件)

カイ二乗分布とはどういうものか、それを使った「標本の分散の検定」の意味(何をやっているのか)をもう一度復習した方がよいと思います。



たとえば「ハンバーガー統計」
http://kogolab.chillout.jp/elearn/hamburger/inde …
「カイ二乗分布」は第3章
http://kogolab.chillout.jp/elearn/hamburger/chap …


>標本が4つでカテゴリー数が3のとき

このときの「カテゴリー」って何ですか?
たとえば、「ある学校の、5つのクラスの、各々の血液型の人数」のように各カテゴリーに「度数」があって、一種の「標本のひとつ」なのではありませんか? (この場合には、5つのクラスが5つの標本で、「血液型」(4種)がカテゴリーでカテゴリー数は4)
これを「データ表」として書けば、縦方向に5行(クラス)、横方向に4列(血液型)の「5 × 4 の表」になりますよね。各々の欄に、該当する人数が書かれます。
つまり、データの数は「標本の数」ではなく、「5 × 4 の表」の「欄の数」なのです。

ここで「カイ二乗分布」の復習はテキストを見てもらうとして、「データの平均値からの偏差を標準偏差で割ったもの」の二乗和(=カイ二乗値)です。「自由度」の意味合いもテキストに書いていると思いますが、平たく言えば「データの平均を求めるのにデータを使うので、「各々の値」の自由度は1つ少なくなる」という感じ。
上の「5 × 4 の表」では、「クラスの人数の平均」と「各血液型の割合の平均」をどちらも求めないといけないので、「クラス数5」から1を引いたものと、「血液型の種類4」から1を引いたものとから、データの自由度が決まります。
この場合の自由度は、
 (5 - 1) × (4 - 1) = 4 × 3 =12

質問文に書かれた「標本が4つでカテゴリー数が3」の場合には、データは「4 × 3 の表」になるので、自由度は
 (4 - 1) × (3 - 1) = 6
なのです。


>標本が1つでカテゴリー数が4のとき、自由度は3であるとありました

標本が1個では、比べる相手がなくて検定はできないので、この場合にはおそらく別に「基準値」「標準値」があるのではありませんか?
「血液型」の例であれば、「日本人の標準的な血液型の比率」のようなもの。
この場合には、上に書いたような「「データの平均を求めるのにデータを使う」必要がないので、「標本数1」からは「1を引く」必要がありません。あるいは、標本は1つではなく、もうひとつ「標準的な日本人グループから採取した標準サンプル」をもってきて並べた「2 × 4 の表」と考えてもよいです。
 なので、自由度は
  1 × (4 - 1) = 3
または
  (2 - 1) × (4 - 1) = 3
なのです。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!


おすすめ情報