プロが教えるわが家の防犯対策術!

統計学を独学で勉強しています
いろいろな書籍やネット検索し混乱していますので
どうか優しくご教授下さい。

検定統計量のことをp値
棄却限界点をt値、F値、カイ2乗値と思っていましたが
書籍に検定統計量t値は・・・と書いてあるのをみて混乱しています。
私は大きな勘違いをしているのでしょうか

初心者ですので簡単な解説をしていただけてらと有難いです

どうかよろしくお願いします。

A 回答 (2件)

私も浅学者なので、分かる範囲で。



通常、統計や検定の基本は「正規分布」です。
標準正規分布の確率分布グラフは、中央が「平均値」でピーク、両側がだら下がりの形をしています。「統計量」とは、このグラフの横軸で、標準正規分布では「z値」と呼ばれます。縦軸は「確率密度」で、実際の確率は「z値」のある範囲が形成する「面積」に相当します。

ご承知とは思いますが、「正規分布」では、標準偏差を「σ」として、
  Z=平均値± σ の範囲に、全体の度数の 68.3% が入る(=0.683の確率でこの範囲に入る)
  Z=平均値±2σ の範囲に、全体の度数の 95.4% が入る(=0.954の確率でこの範囲に入る)
  Z=平均値±3σ の範囲に、全体の度数の 99.7% が入る(=0.997の確率でこの範囲に入る)
という特性があります。
↓ たとえばこんなサイトを参照
http://www.stat.go.jp/koukou/howto/process/p4_3_ …

ここで、たとえば「Z=平均値± σ の範囲に入らない確率」(この範囲の「外側」にある確率)が「 1 - 0.683 = 0.317 」であり、この確率値を「p値」と呼びます。つまり、ある確率分布で、統計量(横軸)の値を指定すれば、「その外側にある」確率「p値」が決まるということです。

通常の検定で「有意水準 5%」といったときには、「統計量が平均値周りのある範囲に入る確率が 0.95、そこに入らない確率が 5%」という条件下で、得られた「統計量」がどちら側に入るかを調べます。「0.95の側」なら「統計的変動の範囲内(=有意ではない)」、「0.05の側」なら「統計的変動では起こり得ないので、それが起こるには理由・意味がある(=有意である)」と判定するわけです。その意味で、検定では「p値」を「有意水準」と比較するのです。
これは、上の書き方をすると
  Z=平均値±1.96σ の範囲に、全体の度数の 95.0% が入る(=0.950の確率でこの範囲に入る)
ということであり、「 p値<0.05 」は「z値 > 1.96」と同じ意味の判定条件になります。
(統計量の議論の中で「1.96」という数値が出てくるのは、それが「有意水準 5% (p値=0.05)」に相当する「統計量の値」だからです)

上記は「正規分布」に基づく検定の場合ですが、同様に他の分布に基づく検定もあり得ます。
・「t分布」に基づく検定が「t検定」 →この場合、確率分布の横軸は「t値」
・「F分布」に基づく検定が「F検定」 →この場合、確率分布の横軸は「F値」
・「カイ二乗分布」に基づく検定が「カイ二乗検定」 →この場合、確率分布の横軸は「カイ二乗値」
というわけです。

「検定」とは、あくまで何らかの分布を前提にして、その分布の「確率分布」から「まあまあ起こりうる(=有意ではない)」か「めったに起きない(=有意である)」かを判定するものです。分布で「確率(p値)」を決定するには、横軸である「(その分布における)統計量」を求めなければなりません。それが「t値」「F値」「カイ二乗値」などです。
当然、検定に使う「分布」によって変わります。


統計の本はいろいろありますが、基本部分を丁寧に(しかし簡潔に)書かれた下記の本をお勧めします。「正規分布」と「検定の基本」までしか書かれていませんが、それ以上の勉強を進めるうえでの確固たる基礎になります。
https://www.amazon.co.jp/%E5%AE%8C%E5%85%A8%E7%8 …
    • good
    • 0
この回答へのお礼

yhr2様
早々のご教授ありがとうございました。
また長文でご丁寧な説明に感謝いたします。
大分理解できました。
また参考文献までご紹介いただきありがとうございました。
もう一度勉強いたします。

お礼日時:2017/12/09 00:26

企業でSQCを推進する立場の者です。



『検定統計量』
分布の仮定に基づいてある尺度(ものさし)を作り、現在の観測値が、それらの尺度上でどんな値を取るかという値です。
・平均値が従う一般的な正規分布の何σかに相当するz値あるいはu値、
・母分散が未知の場合の平均値が従うt分布の横軸の値、t値、
・2乗和の期待値であるχ2乗値、
・分散比であるF値、
他にも、二重非心F分布とか、上記以外に特殊なものがあります。
検定の目的に従って必要な値を使います。

『p値』
pはプロバビリティ(確率)の頭文字です。p値は上記の検定統計量の出現確率です。現在の観測値の検定統計量が分布の裾野に居れば、p値は小さな値になります。なぜなら、p値は一般的に上側確率が当てられるからです。
検定統計量が一般化してあるので、p値によって、普通に起きることなのか、極めてレアなことが起きているのか分かります。

『有意、高度に有意』
p値が0.05以下のとき現在の観測は5%しか起きない、つまり20回に1回しか起きないことが観測されているということになります。この状態を有意と言います。p値が0.01以下のとき高度に有意と言います。
    • good
    • 0
この回答へのお礼

kamiyasiro様
早々のご教授ありがとうございました。
大変勉強になりました。
「p値は上記の検定統計量の出現確率です。」とのご説明に
イメージがつかめました。
もう一度勉強します。
今回はご丁寧にありがとう御座いました。

お礼日時:2017/12/09 00:10

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!