12万作品が月額500円(税別)で見放題なのはdTVだけ!! >>dTV(外部リンク)

女子大生です

統計学の講義があったのですが、
カイ二乗検定の目的がイマイチはっきりしないので、
こちらで質問させて頂きました

カイ二乗検定とは、一言で表せば、
定性データに相関関係があるらしいことを示すためのテストみたいなもの
で理解しておけばOKでしょうか?

このQ&Aに関連する最新のQ&A

A 回答 (1件)

>カイ二乗検定とは、一言で表せば、


>定性データに相関関係があるらしいことを示すためのテストみたいなもの
>で理解しておけばOKでしょうか?

まあ、近いと言えば近い。ただし「相関」ではなく、「差の有無」「独立性の有無」ということ。
そもそも「カイ二乗分布」というのは、「統計変量の2乗和が従う分布」なので、統計量の中の「分散」や「差の大小」に関する推定や検定に使います。
「定性データ」といっているのは、おそらく「クロス集計表」のイメージだと思いますが、分類上は「カテゴリーデータ」と呼びます。下記のような「血液型の人数」が「日本人の標準比率」と「あるグループの血液型の人数構成」とで同じといえるかという検定や、「改良前」のデータと「改良後」のデータを採取して「改良の効果の差」が出ているかどうかを検定するときなど、応用範囲は広いと思いますよ。
http://www.geisya.or.jp/~mwm48961/statistics/kai …

下記の「ハンバーガー統計」にも「他店との売り上げに差があるか」という例で出てきますので、気軽に読んでみてはいかがでしょうか。
http://kogolab.chillout.jp/elearn/hamburger/
    • good
    • 0
この回答へのお礼

そうなんですか、統計学って急に難しくなりますよね汗

T検定は平均値に差があるか、F検定は分散に差があるか、
を調べるとも理解していますが、こんがらがっちゃいます...

参考URLも読んでみたいと思います
ありがとうございました!

お礼日時:2017/03/11 10:34

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aと関連する良く見られている質問

Qカイ2乗検定って何??;;

タイトルのとおりですが…大学で統計の基礎な授業を一般教養で受けています。だけど知らない&説明のない言葉がいっぱぃで、全くついていけません(>_<))
「人が一番選ばなさそうな数字」を何度か投票した結果があって、その数字は無作為に選ばれてるかどうか、有意水準1%としてカイ2乗検定をして判断する、という問題があるのですが、カイ2乗検定自体、授業でちらっと言葉は使ったものの、計算の仕方、使い方の説明等はなく、まったく手がつかずにいます;;ネットでも調べてみましたが、どう使っていいのかまでは分かりませんでした。
知識の無い私でもわかるようなものがあれば教えて下さいっっ!お願いします。

Aベストアンサー

こんにちは.χ2(カイ二乗)検定を厳密に理解するには,数学的素養を持っている状態できっちりと統計学を学習する必要があるのですが,統計データを解析するための手段として統計学を「使う」のであれば,多少の原理を知っておけばよいでしょう.
以下初学者向けにかなり乱暴な説明をしています.正確な理解をしたければ,後で統計学の教科書などで独学して下さい.

χ2検定とは,χ2分布という確率分布を使ったデータ解析法と考えてもらう……のが一番なのですが,多分χ2分布って何? と思われるでしょう.χ2分布とは,二乗値に関する確率分布と考えることができるのですが,この辺もさらりと流して下さい.

例を使って説明します.今,道行く人にA,B,C,Dの四枚のカードの中から好きなもの一枚を選んでもらうとしましょう(ただし,選んでもらうだけで,あげるわけではありません.単にどのカードを選択仕方の情報を得るだけです).一人一枚だけの条件で,160人にカードを選んでもらいました.
さて,ここで考えてみて下さい.4枚のカードには大きな違いはなく,どれを選んでもかまわない.でたらめに選ぶとなれば,どのカードも1/4で,同じ確率で,選ばれるはずですよね? ならば,160人データならば,Aは何枚ほど選ばれる「はず」でしょうか? 同様に,B,C,Dは何枚選ばれる「はず」でしょうか?
……当然,A=B=C=D=40枚の「はず」ですよね? この40枚という数値はでたらめに(無作為に)選ばれたとしたらどんな数値になるかの【理論値】を意味します.

さて,上記はあくまでも理論値であり,実際のデータは異なる可能性があります.というよりはむしろ違っているのがふつうでしょう.そのような実際に観測された数値を【観測値】と呼びます.
仮に理論値と観測値が以下のようになったとします.

        A    B    C    D
(1)観測値   72   23   16   49
(2)理論値   40   40   40   40

当然のように観測値と理論値にズレが生じています.しかし現実と理論が異なるのはある意味当然なのですからぴったり一致することなどありえません.そこで,「ある程度一致しているか(ズレは許容範囲か)」を問題にすることになります.しかし,「ある程度」といわれても一体どのぐらいであれば「ある程度」と言えるのでしょうか? なかなか判断が難しいではないですか?
確かに判断が難しいです.そこで,この判断のために統計学の力を借りて判断するわけで,更に言えばこのような目的(理論値と観測値のズレが許容範囲かどうか)を検討するときに使われるデータ解析法がχ2検定なのです.

        A    B    C    D
(1)観測値   72   23   16   49
(2)理論値   40   40   40   40
(3)ズレ    +32   -17   -14   + 9
(4)ズレ二乗 1024   289   196   81
(5)(4)÷(2) 25.6  7.225  4.9  2.025

 χ2=25.6+7.225+4.9+2.025=49.25

計算過程をさらりと書いていますが,早い話が観測値と理論値のズレの大きさはいくらになるのか,を求めることになります.最終的には「49.25」というズレ値が算出されました.

さて,この「49.25」というズレ値が許容範囲かどうかの判定をするのですが,ここで,χ2分布という確率分布を使うことになります.詳細は統計学教科書を参考してもらうとして,χ2分布を使うと,○○というズレ値が(ある条件では)どのぐらい珍しいことなのか,という「珍しさの確率」を教えてくれます.
かりに「有意水準1%=1%よりも小さい確率で発生することはすごく珍しいと考える(許容範囲と考えられない)」とすれば,「珍しさ確率」が1%以内であれば「許容範囲ではない」と判断します.

以上,長々と書きました.今までの説明を読めばわかるように,χ2検定とはある理論値を想定した時,実際の観測値がその理論値とほぼ一致しているかどうかを調べるための統計解析法のことです.

χ2検定では,理論値をどのように設定するかは分析者の自由です.その設定の仕方で,χ2検定は「適合度の検定」や「独立性の検定」など異なる名称が付与されますが,本質は同じなのです.

質問者さんの場合は

> 「人が一番選ばなさそうな数字」を何度か投票した結果があって、その数字は無作為に選ばれてるかどうか、

これを理論値としてうまく設定することが鍵となるでしょう.

こんにちは.χ2(カイ二乗)検定を厳密に理解するには,数学的素養を持っている状態できっちりと統計学を学習する必要があるのですが,統計データを解析するための手段として統計学を「使う」のであれば,多少の原理を知っておけばよいでしょう.
以下初学者向けにかなり乱暴な説明をしています.正確な理解をしたければ,後で統計学の教科書などで独学して下さい.

χ2検定とは,χ2分布という確率分布を使ったデータ解析法と考えてもらう……のが一番なのですが,多分χ2分布って何? と思われるでしょう.χ2分布...続きを読む

Q1次元混合正規分布の等高線の描き方

書籍、「続・わかりやすいパターン認識」のp182の図9-3の「混合正規分布のパラメータ推定」
の図でμ1とμ2の等高線を描きたいのですが、この図のμ1とμ2の関係式はどのようにして導かれる
のでしょうか?p181の図9.31の説明では、式(9.17)により計算される対数尤度logp(x;θ)の
等高線が描かれているとあります。

この書籍勉強されている方で、分かる方、御教示でがえればと思います。

Aベストアンサー

企業で統計を推進する立場にある者です。

まず、等高線を描くRスクリプトを投稿します。
機械学習を学ばれている方なら、Rくらいは使えますよね。

次の投稿で、対数尤度の部分の解説をしたいと思います。

~~~~~~~~~~~~~~~~~~~~~~

rm(list=ls())
par(ask=T)

# 1次元混合モデルの尤度の等高線を描く
# μ1,μ2は未知数としてパラメータ扱いする

n <- 500
Pr1 <- 0.6
Pr2 <- 0.4

# 500個のデータを乱数生成しヒストグラムを描く

x <- c(rnorm(n * Pr1,3,1),rnorm(n * Pr2,-1,1))
bk <- seq((-5-1/6),(7+1/6),by=1/3) # 図9.2の区切り方
hist(x,breaks=bk,xlim=c(-4,6))

# 等高線図を作るためのグリッドを生成する

mu1 <- mu2 <- seq(-4,6,by=0.2)
z <- expand.grid(mu1,mu2)
len <- nrow(z)

# 500個のデータの対数尤度を、格子点毎に計算する

y <- NULL
for(i in 1:len){
l <- sum(log(dnorm(x,z[i,1],1) * Pr1 + dnorm(x,z[i,2],1) * Pr2))
y <- append(y,l)
}

# 格子点データを等高線図,外観図として描く

y <- matrix(y,ncol=sqrt(len))
contour(mu1,mu2,y,nlevels=50,drawlabels=FALSE)
persp(mu1,mu2,y,theta=-20,phi=45,expand=0.5,col="lightblue",shade=0.75)

# 最尤値

index <- which(y == max(y))
z[index,]
max(y) # そのときの対数尤度

企業で統計を推進する立場にある者です。

まず、等高線を描くRスクリプトを投稿します。
機械学習を学ばれている方なら、Rくらいは使えますよね。

次の投稿で、対数尤度の部分の解説をしたいと思います。

~~~~~~~~~~~~~~~~~~~~~~

rm(list=ls())
par(ask=T)

# 1次元混合モデルの尤度の等高線を描く
# μ1,μ2は未知数としてパラメータ扱いする

n <- 500
Pr1 <- 0.6
Pr2 <- 0.4

# 500個のデータを乱数生成しヒストグラムを描く

x <- c(rnorm(n * Pr1,3,1),rnorm(n * Pr2,-1,1))
bk <...続きを読む

Q統計学の不思議

国政選挙の特番で開票率が低い段階で当選確実を出せるのはなぜ。
正確な結果を出せる仕組み。
健康診断基準値の仕組み。
平均寿命と生命保険のからくり。

Aベストアンサー

どこが不思議ですか?

>国政選挙の特番で開票率が低い段階で当選確実を出せるのはなぜ。

ほとんどの場合には、その時点の開票結果そのものではなく、事前の世論調査や投票所での出口調査の結果から、「得票率」を予測して出します。
だから、投票締め切り直後に、まだ開票が始まってもいないのに「当選確実」が出ることもあります。ただ、これは選挙管理委員会が出している「正式」なものではなく、あくまで報道機関などが出している「判断」「予測」です。「天気予報」と同じです。

1000~2000人程度のデータがあれば「誤差5%」ぐらいで「最終得票率」が予測できます。通常、その誤差以上の得票率の差で当選しますから。
最終得票率が「僅差」(5%未満、あるいは昨年のアメリカ大統領選挙のように1%未満)の場合には、「予想」が出せない、あるいは直前までの予想が逆転することもあり得ます。
↓ とりあえず参考サイト
https://www.web-research.net/column/article25/
http://www.stat.go.jp/koukou/trivia/careers/career8.htm

「正規分布」の「平均値」と「標準偏差」を勉強してください。


>健康診断基準値の仕組み。

これは「統計」ではなく「医学的根拠」があるのでは?


>平均寿命と生命保険のからくり。

「平均寿命」ではなく、各年齢の「平均余命」ですね。(「平均寿命」は0歳児の「平均余命」)
契約期間(保険期間)内に亡くなる確率から、保険金の「期待値」を計算して、「会社のもうけ」を上乗せして保険料を決めているのでしょう。
詳しいことは、生命保険会社の「ノウハウ」でしょうか。

どこが不思議ですか?

>国政選挙の特番で開票率が低い段階で当選確実を出せるのはなぜ。

ほとんどの場合には、その時点の開票結果そのものではなく、事前の世論調査や投票所での出口調査の結果から、「得票率」を予測して出します。
だから、投票締め切り直後に、まだ開票が始まってもいないのに「当選確実」が出ることもあります。ただ、これは選挙管理委員会が出している「正式」なものではなく、あくまで報道機関などが出している「判断」「予測」です。「天気予報」と同じです。

1000~2000人程度のデータ...続きを読む

Q高校数学 点と直線の距離の公式の証明についての質問です。

とあるサイトを拝見させて頂いたところ、点と直線の距離の公式の証明の途中経過で、A^2+B^2≠0であることを自明のように使っていたのですが、その理由を教えて下さい!
http://mathtrain.jp/tentotyokusen
証明1の下の方です。
また、Ax+By+C=0の式で、AかつBがゼロになるときは座標平面上でどのような点の集合を表しますか?
自分の考えでは、c=0ならば、(∀x、∀y)を表し、c≠0ならば、上式を満たす点は存在しないと思います。
お手数お掛け致しますが、ご回答宜しくお願いします<(_ _)>

Aベストアンサー

>>等式が成立しないのに、なぜ∀(X,Y)を表せるのですか

余り深く考えないで下さい。

① (Ax+By+C=0 ∩ C=0) → (X,Y)は実数
② (Ax+By+C=0 ∩ C≠0) → (X,Y)は実数

①は前提は真
②は前提が偽。前提が偽なら結論は全て正しい。

A,Bは0なんだから、全ての実数(X,Y)についてC=0が成り立ちますよ。
この後の議論が、それを満たすCが幾つになるか、です。

Q統計学は国際物流業界では必須でしょうか?

教えてください。

国際物流(国際宅配便)の業界で品質管理的な仕事をしています。品質の維持向上を目的に、貨物の発送や配達などのデータの分析もしています。さて質問ですが、「統計学はこの業界では必須である」とものの本で読みました。勉強不足でお恥ずかしいのですが、正直どれだけ役に立つのかわかりません。

どなたか具体的にご教示いただけるとありがたいです。
よろしくお願いいたします。

Aベストアンサー

➀品質の維持向上を目的に ②貨物の発送や配達などのデータの分析も

統計なしに、貨物の発送や配達などのデータの分析ができますか。
物流業務の品質、その品質管理、品質の維持、品質の向上とは、どういうものをイメージしていますか。
物流の手法、手段の種類や量、その経路、料金、コスト分析、採算性分析、要員の手配や教育訓練の必要性の判断はどうしてます。
季節変動や物流市場動向の分析はどうしてます。

単に比率を出して比較するというのでは、どう比率を出すのが適当か、どう比較するのが適当かわからないのではないでしょうか。
実態や予想を考える上で、統計の手法で何が得られるのかを知っていることは大事だと思います。
また他人、同僚、後輩、上司が何かを根拠にして改善提案をしてきた場合に、その提案を評価するにも統計の知識は必要だと思います。

Q標準偏差について

標準偏差に関する質問です。

標準偏差を算出する際にはサンプル数が2では、
計算できるが、統計的に意味はないと習ったのですが、
これはどういうことなのでしょうか。

統計に関してまだ学び始めたばかりで、
調べてみたのですが、わかりませんでした。

もしよろしければ、ご回答よろしくお願いいたします。

Aベストアンサー

標準偏差というのは、分布の特徴を集約した数値の一つで、平均の周りへの集中の程度を表すものです。
分布が一様ならば、標準偏差は大きくなり、平均の近くに分布しているならば、標準偏差は小さくなります。

サンプル数が2では、標本標準偏差 √[{Σ(標本値 - 平均値)^2}/(標本数 - 1)] の計算の分母(の値1)を見ても意味がありそうな気がしないと思います。
どのくらいのサンプルが必要かということについては、上記の式の分母の (- 1) が無視できるくらいのサンプル数が必要と考えるのが普通です。サンプル数が少ない場合の議論も、統計学の講義や教科書で扱っているのではないかと思います。

今の場合、分布の特徴を論じる以前に、統計的に扱って、分布の特徴を調べるような対象を扱っているのかの検討が必要なのではないかと思わざるを得ません(そもそも対象が少ないならば、悉皆調査をするなどということも可能かもしれません)。

Q【統計学の衝撃】女性に「あなたは朝風呂、朝シャン派ですか?夜風呂、夜シャン派ですか?」と質問した最新

【統計学の衝撃】女性に「あなたは朝風呂、朝シャン派ですか?夜風呂、夜シャン派ですか?」と質問した最新の調査結果が「夜風呂派」と出た。

「先生!最近の若者は朝派から夜派に戻ってますよ!」

「これって若者の自動車離れ調査で30代は自動車離れだけど20代は自動車に興味がある自動車回帰現象が起こってるのと同じで、20代に異変が起こってます!間違いないです!」

と言った。

すると先生は

「その調査は何月調査だね?」

と聞いた

生徒は「3月発表なんで2月か1月じゃないですかね!」

と言ったら

先生は

「それは寒い時期に聞いたからだよ。冬にアンケート調査したら夜派が増えて、夏にアンケートを取ったら朝派が増えるだろうね」

と言った。

「じゃあ、この風呂の朝派と夜派のアンケートは・・」

「気候によって変わるので意味がないアンケートだね」

なるほど。

と唸った。

ちなみにお酒が健康に良いという論文が多いのは酒造メーカーが大学や研究機関にお金を払って作ってもらっているから物凄い数のデータから良いものが出たら発表しているだけであってお酒を呑んで吐く人がいるってことはどう考えてもアルコールは人間にとって害があるんだ。

お酒1杯なら健康に良いっていうのは酒造メーカーのステマに過ぎない。

それを本気に捉えて「お酒は1、2杯なら健康に良いんだよ」と真顔で言われても苦笑いしか出来ない。

考える力がない猿にはなりたくない。

【統計学の衝撃】女性に「あなたは朝風呂、朝シャン派ですか?夜風呂、夜シャン派ですか?」と質問した最新の調査結果が「夜風呂派」と出た。

「先生!最近の若者は朝派から夜派に戻ってますよ!」

「これって若者の自動車離れ調査で30代は自動車離れだけど20代は自動車に興味がある自動車回帰現象が起こってるのと同じで、20代に異変が起こってます!間違いないです!」

と言った。

すると先生は

「その調査は何月調査だね?」

と聞いた

生徒は「3月発表なんで2月か1月じゃないですかね!」

と言ったら

...続きを読む

Aベストアンサー

posttruth2017さんは、質問文を投稿したのか、ただの感想を質問サイトに書き込んでしまったのかは、考えて行動されたでしょうか。 考える力がある猿にとどまっても、あまり好ましい状態ではないと思います。
統計を読むなら、いつの、だれがをどう選んでアンケートしたのか、そのアンケート結果の検討にあたって、対照群とするものはなにかを考えることが、質問内容やアンケートの内容の検討と同時に大事なことは考えた方がイイですね。 
アンケートで、「朝風呂、朝シャン派ですか?夜風呂、夜シャン派ですか?」「お酒1杯なら健康に良かったですか?4杯程度なら健康に良かったですか?」(内容はどうでもイイですが)の集計を見て、「夜風呂、夜シャン派が良い」「お酒は2杯が健康に良い」などと判断するのは、お馬鹿さんです。

Qヒストグラムの区間の幅について

ヒストグラムの区間の幅は、「最大値から最小値を引いたものを区間の数で割り、『測定単位の整数倍に丸める』」とされています。

この場合の丸めるとはどのように理解したら良いですか。

例えば、測定単位が「0.2」だった場合、
最大値から最小値を引いたものを区間の数で割った数が「1.1」となったら
区間の幅は、1.0 とするのか、1.2 とするのか、どちらなんでしょうか。

「1.11」であれば、1.2 とするのが正しいと思いますし、
「1.09」であれば、1.0 とするのが正しいのではないかと思っていますが、ちょうど真ん中に
なってしまった場合はどうしたらよいのでしょうか。

「丸める」という言葉が曖昧で悩んでいます。

Aベストアンサー

No.3です。ああ、「公式」は『測定単位の整数倍に丸める』なのですね。この条件を忘れていました。
しかも「「1.09」であれば近い方の「1.2」でしょう」は誤記だし。

No.3の最後に書いたのは間違いで、

測定単位が「0.2」の場合

「1.11」であれば近い方の「1.2」
「1.09」であれば近い方の「1.0」
ちょうど真ん中の「1.10」なら「1.0」「1.2」ともに可能

ということですね。

「丸める」は、実務的には「四捨五入」「切り上げ」「切り捨て」の中から適切なものを選んでふさわしい数値にする、ということです。
上の回答では、「四捨五入」を選んでいます。

しつこく言いますが、実社会では、正当な理由があれば「四捨五入」「切り上げ」「切り捨て」のいずれでも正解になり得ます。

Q【数学】ユークリッドの互除法のごじょほうってどういう意味ですか? ユークリッドの互除法を考えたユーク

【数学】ユークリッドの互除法のごじょほうってどういう意味ですか?

ユークリッドの互除法を考えたユークリッドってユークリッド幾何の人と同じ人物ですか?別人ですか?

ユークリッドってどんな人だったのか教えてください。偉伝の伝説が聞きたいです。

あとユークリッド幾何とユークリッドの総除法ってどんなことなのか教えてください。簡単に。

Aベストアンサー

「互除法」は、文字通りの意味です。「互」は、「お互いに」の意味、「除」は、「除算をする」の意味、「法」は、「方法」の意味です。
それをまとめて、「(2つの数について)お互いに割り算をしていく方法」という意味になります。

ユークリッド幾何学のユークリッドと同じ人です。ユークリッドの「(幾何学)原論」」の中に、幾何学も、数論(互除法も書かれている)も書かれている(そうです。私は読んだことがないので、、、)。

ユークリッド幾何学は、われわれが体験する幾何学的な事実を厳密な形で整理したものです。
ユークリッド幾何学だけを説明するより、非ユークリッド幾何学と一緒にして違いを説明した方が分かりやすいと思いますので、3つまとめて説明します。
これらの幾何学は、平行線の公理が成立するかどうかによって特徴付けられます。まず、平行線の公理は、次のように述べられます。

[公理] 1本の直線と、その直線上にない1点に対して、その点を通るその直線に平行な直線がただ1本だけ存在する。

この公理が成立する幾何学が、ユークリッド幾何学です。

この公理が成立しない幾何学が、非ユークリッド幾何学です。公理の否定の形によって、2つの幾何学が考えられます。
公理の前半部分は同じですので、省略して後半だけ書きます。
1つ目は、
  .....、平行な直線は存在しない。
2つ目は、
  ......、平行な直線が2本(以上)存在する。
となります。

ユークリッドの互除法(もともとの記述は、互減法だそうですが)は、2つの自然数 m, n の最大公約数を求める方法です。以下のように表されます。

 a: 2つの数の大きい方を小さいほうで割った余り r を求める。
 b:  r が 0 ならば、割った数が、最大公約数として終了する。
 c: そうでなければ、割った数を大きい方の数とし、余りを小さい    方の数として、a に戻る。
(互減法の場合は、a のところの割り算の代わりに、引けなくなるまで引き算を繰り返す、に変わります。結果として、余りを求めていることになります。)

ユークリッドの伝記は、自分で調べてください。

「互除法」は、文字通りの意味です。「互」は、「お互いに」の意味、「除」は、「除算をする」の意味、「法」は、「方法」の意味です。
それをまとめて、「(2つの数について)お互いに割り算をしていく方法」という意味になります。

ユークリッド幾何学のユークリッドと同じ人です。ユークリッドの「(幾何学)原論」」の中に、幾何学も、数論(互除法も書かれている)も書かれている(そうです。私は読んだことがないので、、、)。

ユークリッド幾何学は、われわれが体験する幾何学的な事実を厳密な形で整理...続きを読む

Q仮説検定

仮説検定が分かりません。有意水準、p値、両側片側検定もなんとなく意味は分かっているような感じなんですが、実際の問題で分からなくなってしまいます。

例題を使って教えて下さい。
お願いします。

Aベストアンサー

詳しい説明は、#2 さんがされていますので、ここでは「検定の考え方」を補足します。

「検定」は、基本的には「正規分布」の特性を利用します。(正規分布以外の「カイ二乗分布」などを使うものもありますが、基本的な考え方は同じです)

 ご承知は思いますが、「正規分布」とは、平均値をピークに、左右にダラ下がりの分布です。標準偏差を「σ」として、
  平均値± σ の範囲に、全体のデータの 68.3% が入る
  平均値±2σ の範囲に、全体のデータの 95.4% が入る
  平均値±3σ の範囲に、全体のデータの 99.7% が入る
という特性があります。
↓ こちらなどを参考に。
http://www.stat.go.jp/koukou/howto/process/p4_3_2_1.htm

 「検定」では、上のような「95.4%」「99.7%」という中途半端な数値では使いづらいので、σ側ではなく「全体の○○%」の方を基準にして
  平均値± 1.65σ の範囲に、全体のデータの 90.0% が入る ←これが「信頼度90%」
  平均値± 1.96σ の範囲に、全体のデータの 95.0% が入る ←これが「信頼度95%」
  平均値± 2.57σ の範囲に、全体のデータの 99.0% が入る ←これが「信頼度99%」
という特性にして使います。
 「有意水準」とは、この「信頼度」を逆にした言い方で、
   信頼度90% = 有意水準10%
   信頼度95% = 有意水準5%
   信頼度99% = 有意水準1%
という感じです。
 例えば、
  有意水準5%
  = 全体のデータのうちの「平均値から大きく離れた」 5% に入る
  =確率5%程度でしか起こり得ない低い確率のデータである
  =めったに起こらない低い確率(5%)なので平均値との「差」には何か理由がある
  =有意な差がある
  = 有意である
ということです。

 この「1.96σ」や「2.57σ」の数値部分のような「標準偏差の何倍」の数値に相当する「変数」が、「検定統計量」とか「Z値」などと呼ばれます。
 「有意水準」が、通常は「p値」と呼ばれます。「有意水準 5%」の場合には、「p<0.05」が判定基準になります。

 「正規分布」は、平均地を中心に「左右対称」の分布です。
 「平均値から、大きく外れても、小さく外れてもダメ」ということなら「両側検定」で、「± 1.96σ」を判断基準にします。
 「精度の分布」のように、「大きく外れたらダメだが、小さければ小さいほど高精度なので小さい方は許容」というようなものなら、「+ 1.96σ」だけを判断基準にし、「- 1.96σ」は判断基準にはしないので「片側検定」です。

 検定では、一般に「統計的に同じである(「平均値が等しい」とか「同じ母集団から採取したもの」など)という「帰無仮説」を前提として統計処理し、その結果が「平均値± 1.96σ の範囲内に入っているか」を見ます。
(逆の「統計的に異なっている」のは、「どう違うのか」を定義しないと統計処理ができないので、「帰無仮説」にすることはありません)

 「帰無仮説」に基づく「正規分布」に対して、検定しようとする事象が「平均値± 1.96σ の範囲内に入っている」なら、「統計的によくあること」「その程度のばらつきは十分ありうる」ということで「違いには理由はない=有意差なし=有意でない」ということです。その検定事象は「統計的にはあり得る」ということで「帰無仮説」を否定できません。

 「平均値± 1.96σ の範囲内に入っていない」なら、「確率5%以下という、めったに起こらないことが起こっている」「通常の誤差の範囲から大きく外れている」ということで「何かしら相違の理由がある=「差」には意味がある=有意な差がある=有意である」ということです。その検定事象は「めったに起こり得ない」ということで「帰無仮説」を否定できます。(ただし、確率5%で間違えた判断かもしれない)
 この場合には、「帰無仮説」を否定して、その反対である「統計的に異なる(「平均値が明らかに異なる」とか「異なった母集団から採取したもの」など)」と結論付けるわけです。

 少し厳密さには目をつぶって言えば、「検定」とは上のようなことをやっているのです。
 プロセスから分かるように、「絶対的」「論理的必然」ではないので、その限界を理解した上で行う必要があります。

 注意すべきは、上に書いたような「有意水準(その逆の「信頼度」)」に相当する「間違う確率」を内在していることです。
 また、「帰無仮説が否定できない」ときであっても、最大で「平均値± 1.96σ」に近いバラつきがある場合も含むので、「統計的に等しいと判断できる」ということではありません。あくまで「有意な差があるとまではいえない」という「二重否定」が言えるだけです。
 この辺は、教科書にも書いてあると思いますが。

詳しい説明は、#2 さんがされていますので、ここでは「検定の考え方」を補足します。

「検定」は、基本的には「正規分布」の特性を利用します。(正規分布以外の「カイ二乗分布」などを使うものもありますが、基本的な考え方は同じです)

 ご承知は思いますが、「正規分布」とは、平均値をピークに、左右にダラ下がりの分布です。標準偏差を「σ」として、
  平均値± σ の範囲に、全体のデータの 68.3% が入る
  平均値±2σ の範囲に、全体のデータの 95.4% が入る
  平均値±3σ の範囲に、全体のデータ...続きを読む


人気Q&Aランキング