タイトルのとおりですが…大学で統計の基礎な授業を一般教養で受けています。だけど知らない&説明のない言葉がいっぱぃで、全くついていけません(>_<))
「人が一番選ばなさそうな数字」を何度か投票した結果があって、その数字は無作為に選ばれてるかどうか、有意水準1%としてカイ2乗検定をして判断する、という問題があるのですが、カイ2乗検定自体、授業でちらっと言葉は使ったものの、計算の仕方、使い方の説明等はなく、まったく手がつかずにいます;;ネットでも調べてみましたが、どう使っていいのかまでは分かりませんでした。
知識の無い私でもわかるようなものがあれば教えて下さいっっ!お願いします。
No.2ベストアンサー
- 回答日時:
こんにちは.χ2(カイ二乗)検定を厳密に理解するには,数学的素養を持っている状態できっちりと統計学を学習する必要があるのですが,統計データを解析するための手段として統計学を「使う」のであれば,多少の原理を知っておけばよいでしょう.
以下初学者向けにかなり乱暴な説明をしています.正確な理解をしたければ,後で統計学の教科書などで独学して下さい.
χ2検定とは,χ2分布という確率分布を使ったデータ解析法と考えてもらう……のが一番なのですが,多分χ2分布って何? と思われるでしょう.χ2分布とは,二乗値に関する確率分布と考えることができるのですが,この辺もさらりと流して下さい.
例を使って説明します.今,道行く人にA,B,C,Dの四枚のカードの中から好きなもの一枚を選んでもらうとしましょう(ただし,選んでもらうだけで,あげるわけではありません.単にどのカードを選択仕方の情報を得るだけです).一人一枚だけの条件で,160人にカードを選んでもらいました.
さて,ここで考えてみて下さい.4枚のカードには大きな違いはなく,どれを選んでもかまわない.でたらめに選ぶとなれば,どのカードも1/4で,同じ確率で,選ばれるはずですよね? ならば,160人データならば,Aは何枚ほど選ばれる「はず」でしょうか? 同様に,B,C,Dは何枚選ばれる「はず」でしょうか?
……当然,A=B=C=D=40枚の「はず」ですよね? この40枚という数値はでたらめに(無作為に)選ばれたとしたらどんな数値になるかの【理論値】を意味します.
さて,上記はあくまでも理論値であり,実際のデータは異なる可能性があります.というよりはむしろ違っているのがふつうでしょう.そのような実際に観測された数値を【観測値】と呼びます.
仮に理論値と観測値が以下のようになったとします.
A B C D
(1)観測値 72 23 16 49
(2)理論値 40 40 40 40
当然のように観測値と理論値にズレが生じています.しかし現実と理論が異なるのはある意味当然なのですからぴったり一致することなどありえません.そこで,「ある程度一致しているか(ズレは許容範囲か)」を問題にすることになります.しかし,「ある程度」といわれても一体どのぐらいであれば「ある程度」と言えるのでしょうか? なかなか判断が難しいではないですか?
確かに判断が難しいです.そこで,この判断のために統計学の力を借りて判断するわけで,更に言えばこのような目的(理論値と観測値のズレが許容範囲かどうか)を検討するときに使われるデータ解析法がχ2検定なのです.
A B C D
(1)観測値 72 23 16 49
(2)理論値 40 40 40 40
(3)ズレ +32 -17 -14 + 9
(4)ズレ二乗 1024 289 196 81
(5)(4)÷(2) 25.6 7.225 4.9 2.025
χ2=25.6+7.225+4.9+2.025=49.25
計算過程をさらりと書いていますが,早い話が観測値と理論値のズレの大きさはいくらになるのか,を求めることになります.最終的には「49.25」というズレ値が算出されました.
さて,この「49.25」というズレ値が許容範囲かどうかの判定をするのですが,ここで,χ2分布という確率分布を使うことになります.詳細は統計学教科書を参考してもらうとして,χ2分布を使うと,○○というズレ値が(ある条件では)どのぐらい珍しいことなのか,という「珍しさの確率」を教えてくれます.
かりに「有意水準1%=1%よりも小さい確率で発生することはすごく珍しいと考える(許容範囲と考えられない)」とすれば,「珍しさ確率」が1%以内であれば「許容範囲ではない」と判断します.
以上,長々と書きました.今までの説明を読めばわかるように,χ2検定とはある理論値を想定した時,実際の観測値がその理論値とほぼ一致しているかどうかを調べるための統計解析法のことです.
χ2検定では,理論値をどのように設定するかは分析者の自由です.その設定の仕方で,χ2検定は「適合度の検定」や「独立性の検定」など異なる名称が付与されますが,本質は同じなのです.
質問者さんの場合は
> 「人が一番選ばなさそうな数字」を何度か投票した結果があって、その数字は無作為に選ばれてるかどうか、
これを理論値としてうまく設定することが鍵となるでしょう.
ありがとうございますっっっ!お礼が遅くなってごめんなさぃ、本当に、本当に助かりましたm(_)m
考えやすいよう丁寧に回答下さったので、順に沿ってやってくことができました♪本当にありがとうございました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 統計学の質問【帰無仮説】 B大学の卒業生の平均年収について調査するため、100人の卒業生を無作為に選 1 2023/05/25 23:36
- 統計学 統計学の質問【帰無仮説】 昨年度のA大学卒業者の平均初任給(月額・万円)について調べるために、昨年度 1 2023/05/25 23:30
- 統計学 統計:アンケート結果の読み解き方法(カイ二乗検定の必要性の有無) 13 2022/12/03 23:13
- 統計学 統計学の質問【帰無仮説】 高校の新学習指導要領では、統計的仮説検定の基本的な考え方が必修単元となった 5 2023/05/23 21:00
- 統計学 確率統計の問題です。 3 2022/04/07 04:39
- 統計学 アンケート分析で用いる検定について 2 2022/09/03 14:40
- 統計学 統計学の質問【帰無仮説】 W大学のP学部において、自宅通学者の比率にについて調べたい。 P学部から1 8 2023/05/25 23:28
- 大学・短大 大学 統計学 1 2022/09/14 11:27
- 労働相談 有給休暇使用時の賃金の計算方法について 5 2022/04/04 00:02
- その他(職業・資格) 来年、仕事の都合でエネルギー管理士の資格試験を受験しようと考えているのですが、難易度について教えて下 1 2022/09/24 12:14
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
効果量のマイナス表示に関して
-
調査結果は、標準誤差率が何%...
-
統計学的に信頼できるサンプル...
-
T検定とMann-WhitneyのU検定の...
-
スミルノフ・グラブス検定の有...
-
t 検定について。統計学
-
検定の仕方教えて
-
SPSSを使ったカイ2乗検定につい...
-
回帰曲線の有意差の検定
-
有意差が無いことを証明(危険...
-
Fold Change間の有意差検定
-
一様最強力検定の求め方について
-
パラメトリック検定か、ノンパ...
-
一標本t検定とウィルコクソン検...
-
英語論文に出てくる「independe...
-
SPSS McNemar検定
-
検定で出てしまった有意差を認...
-
t検定における有意差ありとは?
-
ROC曲線のAUCの分析方法
-
サンプルサイズの大きく違うF検定
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
調査結果は、標準誤差率が何%...
-
統計学的に信頼できるサンプル...
-
効果量のマイナス表示に関して
-
T検定とMann-WhitneyのU検定の...
-
p値の計算式
-
サンプルサイズの大きく違うF検定
-
サンプルサイズが極端に少ない...
-
統計のt検定について
-
英語論文に出てくる「independe...
-
有意差が無いことを証明(危険...
-
2群間平均の差の検定 差が“な...
-
スミルノフ・グラブス検定の有...
-
統計学のP検定とt検定につい...
-
同等性の検定について
-
データの分析方法
-
Mann-WhitneyのU検定をspss統計...
-
母集団の違う2つの平均値の優...
-
統計論文:ノンパラメトリック...
-
同等性の検定について
-
最小有意差とは?
おすすめ情報