性別とタバコは関連(関係)しているかを調べています。
喫煙者/以前喫煙していた人/禁煙者
男性9 8 5
女性18 12 13
期待値は以下の通りです。
喫煙者/以前喫煙していた人/禁煙者/合計人数
男性 9 8 5 22
期待値 9.14 6.77 6.09
女性 18 12 13 43
期待値 17.86 13.23 11.91
合計人 27 20 18 65
このとき得られたχ2は
Chi-Sq = 0.002 + 0.224 + 0.196+0.001 + 0.114 + 0.100 = 0.637
P-Value は 0.727でした。
この期待値とχ2の数値の意味を説明したいのですが何を表しているのかが分かりません。
例えば、χ2の一番数値の高い0.224は何を意味しているのですか?期待値は全体的に女性の方が高いのですが、これは何を意味しているのですか?
分かるか方是非教えて下さい。物凄く困ってます!
No.2ベストアンサー
- 回答日時:
こんにちは.
χ2検定とは,期待値と実測値のズレが有意に大きなものかを統計的に調べるデータ解析法です……このような統計学をある程度勉強している人向けの説明はともかくとします.
χ2検定では質問者が述べられているように,ある変数(喫煙者)とある変数(性別)との間に統計的に有意な違いがあるかを調べるために使われます.
では,ある変数とある変数が関連がある,とはどういうことでしょうか? 以下,質問者が挙げられた「性別/喫煙」を例とします.
「性別と喫煙に関係がある」……これは,性別によって喫煙率が異なるということを意味します.
つまり
「男性の喫煙者:男性の既喫煙者:男性の非喫煙者」
「女性の喫煙者:女性の既喫煙者:女性の非喫煙者」
二つの比率が【異なって】いれば,性別によって喫煙率に違いがある,ということになります.
では,この比率はどうやって求めるのか……
既に期待値を算出されているのならば,わかりますね? 「もし,両者の比率が同じであるならば,それぞれの数値
はどのようになるか?」……これが期待値です.
※「9.14:6.77:6.09=17.86:13.23:11.91」と比率が同一であることを確認して下さい.
さて,この「もし同比率であれば……」の期待値と実際の数値を比べてみましょう.この「期待値-実測値」のズレがχ2(Chi-Sq)にて個別に計算されます(ズレの具体的な計算式は手持ちの資料で確認して下さい).
もし,このズレが全くなければ「0」となり,ズレが大きければ大きいほど数値が大きくなります.この合計値を求めることによって,全体の「性別と喫煙」との間に有意に,統計的に大きなズレがあるか(性別と喫煙の間に有意に関連があるか)を調べることができます.
χ2=0.637というズレの大きさが,「性別による喫煙の比率に違いは【ない】」という仮定の下で何%の確率で起こりうるか(珍しい現象か)を判断します(χ2分布の表を参考にして……詳しくは統計学の教科書参照です).結局確率P-Valueが「0.727=72.7%」となり,
「性別と喫煙に関係が【ない】と仮定した場合で,このズレが偶然でも72.7%で発生する現象」→
「データ的には多少ズレがあるように見えるが,この程度は偶然で起きうる範囲のものである」→
「統計的には『性別と喫煙には関係【ない』」という仮定を否定する根拠がない」→
「性別と喫煙には関係ない」
と判断を下すことになります.
このようにまず全体で判断をして,結局単なる偶然で片づけられてしまいます.よって今回の場合では「χ2の一番数値の高い0.224は何を意味しているのですか?期待値は全体的に女性の方が高いのです」に対しては,統計的には偶然そうなっただけで,意味はなし,ということになります.
もし,全体で有意であれば,上記の疑問については,それぞれのセルで特徴的なものはどれか,男性と女性とではどの喫煙タイプで顕著に異なるかを調べる,という詳細な分析に繋がりますが……
この回答への補足
丁寧な説明有難うございました。
もう一つ質問です。
もし、χ2の数値が一つだけ非常に高い場合
例:0.224→0.80の場合でも、それは偶然生じた事でよいのでしょうか?この場合はどのような意味があるのですか?
宜しければ教えて下さい。
No.3
- 回答日時:
再度登場です.
χ2検定は,あくまでも「全体のズレが有意であるかどうか」を調べるものです……
ここで注意してもらいたいのは,質問者さんが挙げられた例題のようなクロス集計表(下記のA/B×α/β/γの表)を分析する手法は,χ2検定だけではありません.代表的なものがχ2検定で,他にも分析方法はあるのです.
α β γ
A
B
数ある統計法の中で,χ2検定は「全体で有意なズレか」を検討する手段であるために,ココのセルが極端なズレを見せたとしても,それが最終的に全体のズレに結びつかないので有れば,やはり偶然と処理されてしまいます.
少なくとも,χ2検定では全体でどうであったかを述べるだけで,個別のセル(例えば0.80のセル)が特徴的であるかどうか)を調べる術はありません.
このようにχ2検定は非常に狭い目的に沿った結果しか出してきませんので,データ解析者は望みの目的を検討したいのならば,ある程度,準備が必要となります.
>例:0.224→0.80の場合でも、
>それは偶然生じた事でよいのでしょうか?
>この場合はどのような意味があるのですか?
質問者さんのこのような疑問「あるセルが特徴的に見えるが,これは偶然なのかどうか」を調べたいとします.
「どのセルが特徴的か?」という疑問は調べることができます.がχ2検定では調べることはできません(あくまでも,全体のズレを調べるの目的なので).そのために,別のデータ解析法である,残差分析を使うことによってどのセルが特徴的であるかどうかを調べることができます.
興味があるならば「残差分析」を調べてください.但しネットで検索しても,重回帰分析における残差分析の説明はありますが,クロス集計表における残差分析の説明は少なくとも私は見たことないのですが……
クロス集計表における残差分析の使用法を説明したものとして次の資料が参考になります.
内田治『すぐわかるExcelによる統計解析』東京図書
詳しく分析する場合には他のデーター解説法=残差分析を使用。でも、この場合はやはり偶然ということで処理されてしまうのですね。
何度も丁寧なご回答有難うございました。
No.1
- 回答日時:
うまく説明できないので、期待値の出し方だけ。
(自信ないですけど)
(9+18)/(22+43)*22=9.14
(9+18)/(22+43)*43=17.86
(8+12)/(22+43)*22=6.77
(8+12)/(22+43)*43=13.23
(5+13)/(22+43)*22=6.09
(5+13)/(22+43)*43=11.91
回答有難うございます。
期待値などの計算方法はわかるんですが、その数値の意味が分からないんです。うーーん、どうしよう。分かる方/説明していただける方いないでしょうか?
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 生活習慣・嗜好品 タバコにまつわるデマ4選。 . ①『喫煙者本人よりも周囲で副流煙を吸わされる人の方が健康被害は大きい 8 2023/01/15 09:17
- 病院・検査 現在32才の男性です。先日の健康診断の結果、胸部レントゲンに白い影があり再検査の指示を受けているので 6 2023/06/17 16:32
- 生活習慣・嗜好品 2019年男性喫煙率平均27% 40代36% こんなに男はたばこを吸っていますか?(実感がわかない) 5 2023/08/22 08:38
- 生活習慣・嗜好品 喫煙者の人が付き合うのは 4 2022/11/26 15:40
- 電動歯ブラシ・電子タバコ タバコを吸ってる男性の印象 マッチングアプリの男性からご飯に誘われ、今度会う予定です。 しかしお相手 12 2023/08/22 07:23
- ホテル・旅館 どう部屋を割り振りますか? 1 2023/04/17 20:09
- 生活習慣・嗜好品 最近、急激に増えている肺がんの主原因は何なのでしょうか 2 2022/06/21 14:00
- その他(ニュース・社会制度・災害) 喫煙者の方に質問です。 喫煙者の皆さんは平気でポイ捨てや路上喫煙をしますが、それは周りに迷惑をかけた 4 2023/08/11 01:08
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
検量線の決定係数について
-
EXCELにてローパスフィルタを作...
-
統計学の基本的なことについて...
-
サンプル数の異なる2群間にお...
-
エクセルのグラフから半値幅を...
-
下の対数表示のグラフから低域...
-
溶解度の問題 理科
-
最小二乗法を反比例の式を元に...
-
心理機能診断をしたのですが、...
-
統計学のサンプル数2000の根拠は?
-
統計学の問題でわからないので...
-
対数グラフの対数とは・・・?
-
標準偏差の分母にルートをかけ...
-
z値p値とはなんですか?
-
心理学の統計について
-
検量線の作り方
-
全商推薦について教えてください。
-
相関係数
-
v-xグラフのようなものは描けま...
-
物理 波
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
EXCELにてローパスフィルタを作...
-
サンプル数の異なる2群間にお...
-
心理機能診断をしたのですが、...
-
エクセルでランダム関数で乱数...
-
ブラック・ショールズ方程式を...
-
複数の集団の全体平均が0より有...
-
検量線の決定係数について
-
ポアソン回帰でのカウントデー...
-
青い下線部分はなぜそうなるの...
-
統計学の問題でわからないので...
-
[Excel] リストからの無作為抽出
-
x^2+y^2はどのような分布をする?
-
エクセルのグラフから半値幅を...
-
統計について
-
極値をもつ時と持たない時、単...
-
エクセルで正規分布かどうかを...
-
パイロットサンプルって何ですか?
-
データが正規分布しているか判...
-
回帰分析の回帰係数のt検定
-
正規分布について
おすすめ情報