適合度検定について教えてください
測定結果の分布がある種の確立密度関数に従うかどうかをカイ二乗検定で調べます。測定値の度数と理論度数の比較です。このとき確立密度関数の母数によって、検定時の自由度が変わるといわれたのですが。
母数と自由度の関係を教えてください。
たとえば
p(x)=(x/a)・exp{-x^2/(2a)}:2aがxの2乗平均
で示されるレイレイ分布の場合はどうなるのでしょうか。
いろいろ文献を調べたのですがわかりません。統計に関しては素人です、よろしく
お願いします。

このQ&Aに関連する最新のQ&A

A 回答 (5件)

> 最初具体的な確率密度関数の型(例えば正規分布とかレイリー分布とか)はわかりません。


>したがって母数は未知となります。
この時点では「分布が未知」なんですね。

 次に、帰無仮説H1「このデータは母数aのレイリー分布に従う」を立てる。これを一旦信じる。ここで初めて分布の型が決まり、従って、母数の自由度は1に決定。そして、分布が一番データに良く合うように(数値計算で)a=a0を決めてやる。fittingと言います。これで分布が決定。この段階で帰無仮説はH2「このデータは母数a0のレイリー分布に従う」になっており、自由度は1減っている。だからこの仮説H2を検定するには、自由度は(k-2)にしなくちゃいけません。
 で、検定してみたらH2がアキラカに棄却されたとしましょう。つまりこの分布じゃないのが確定。

 では、帰無仮説H3「このデータは母数m, σ^2の正規分布に従う」を立てる。母数の自由度は2ですね。これをfittingしてm=m0, σ=σ0を得る。これで分布が決定。帰無仮説はH4「このデータは母数m0, σ0^2の正規分布に従う」になっており、自由度は2減っている。この仮説H4を検定するには、自由度は(k-3)にしなくちゃいけません。
で、今度は棄却されなかったとする。でも、

「だからこのデータは正規分布(m0, σ0^2)だ。」なんて結論しちゃいけません。帰無仮説は、棄却されないときは「何も言えない」。つまり「仮説H4はデータとはっきりした矛盾を示さない」という事が分かっただけです。(σの真値がσ0より0.1%大きくてもH4は偽なんですよ。)

 時系列データを分布として検定するというのは重要ですね。理論的に予想される分布と比較する訳ですね。この場合線形に近いシステムのようだから、予測するには、信号処理分野の理論、特にinputが分かっていればフーリエ変換などによるフィルター理論で、確率過程とするなら定常過程の理論が旨く行くだろうと思います。なお非線形性が強い場合(振幅が大きいなど)はひょっとするとカオスの理論を使うことになるかな?と思います。
    • good
    • 0
この回答へのお礼

お礼が送れて申し訳ありません。とても参考になりました。
しつこい質問でもう分けないのですが、もう少し教えてください。
いくつかの文献ではレイリー分布の母数を時系列データのスペクトルの0次モーメントとしていたり、極値の二乗平均値の半分としていたのですが、やはり実データに当てはめるときは、そのデータの特性を反映させるように、最急降下法のような勾配法で母数を推定し、fittingを行うのがよいのでしょうか。
 素人の質問で申し訳ないのですが、実データに対して、勾配法などを使って、最適化を行った場合、測定誤差の分まで含んでfittingを行ってしまうので、個々の計測値にはよく合うのですが、現象を一般的に論じる場合客観性が失われる可能性があると思えます。たびたび申し訳ないのですがご教示いただければ幸いです。
 それとご回答の中で指摘されているように
復元力がf=-kxであてられるような線形バネでなく
硬化バネf=-(k1x+k3x^3)
軟化バネf=-(k1x-k3x^3)
の場合はカオス的な挙動を示すようで、位相平面上にストレンジアトラクタが現れました。

お礼日時:2001/02/03 21:04

下記ご参照下さい。



参考URL:http://oshiete1.goo.ne.jp/kotaeru.php3?q=24627,h …
    • good
    • 0
この回答へのお礼

ご紹介ありがとうございました。
今後ともよろしくお願いします。

お礼日時:2001/02/03 22:20

 fittingをする結果として自由度を犠牲にする訳ですから、ばっちりfittingやって良いです。

fittingしてパラメータを最適化したモデルは、誰が計算しても再現する。これこそが客観的なんじゃありませんか。
 最急降下法は余りうまい方法とは言えませんが、探すパラメータの数が少なければ差し支えないのかな?

 ストレンジ・アトラクタ。やっぱり出てきましたか。最終的にアトラクタの再構成が出来ると面白いですね。頑張ってください。
    • good
    • 0
この回答へのお礼

 早速回答いただきましてありがとうございます。
統計はまだかじりかけたばかりでわからないことが多いので、また疑問が生じたときはよろしくお願いします。
 本当に助かりました、教官のなかには教科書の例題で似たようなものを見つけて検定すればよいなどといって、意味も考えずに平気なことをやっている連中がいます。stomachman先生のような方が教育の現場に大勢いれば、今日の理数系教育の問題も解消されると思います。
 最後の質問ですが「最急降下法」はあまりよくないとのことですが、私自身勉強不足でどの最適化手法がよいのか悪いのかはわかりません。他の準ニュートン法や共役勾配法などと比較して使いやすいので使っているのですが・・・。
これに関しては単に質問するのでなく、じっくり勉強したいと思いますので是非お勧めの教科書があればご紹介ください。

お礼日時:2001/02/03 21:46

とりあえず、自由度の概念については下記URLを。



N個のサンプル、という制約条件があるので、度数n[1], n[2], ..... , n[k-1]を決めたらあと一つは決まってしまう。だから自由度は(k-1)である。という事です。

また
> 確率密度関数に当てはまるかを調べるときは(k-1-母数の数)が自由度
というのは、ちょっと間違い。そうじゃなくて、
 「確率密度関数の型(例えば正規分布とかレイリー分布とか)は仮定しているがその母数(パラメータ)のうちのr個の値が未知である」という場合に、測定した度数になるべく旨く合うようにr個の母数を推定し、その上で、検定を行う、という時には、つまり辻褄が一番合うようにr個の自由度(度数のデータ)を「消費」しちゃったので、残っている自由度はr個減る。それで、この場合の
χ^2 = Σ{(n[j]-m[j])^2}/m[j]
は自由度(k-1-r)のχ二乗分布で近似できる、という事になります。

参考URL:http://oshiete1.goo.ne.jp/kotaeru.php3?q=17226

この回答への補足

深夜にもかかわらず度重なる回答をいただきましてまことにありがとうございます。私のつまらない質問に親切に回答してくださってとても感謝しています。
2回の回答で少しずつわかってきましたのでもう少し質問させてください。

測定されたデータに関しては、最初具体的な確率密度関数の型(例えば正規分布とかレイリー分布とか)はわかりません。したがって母数は未知となります。
この場合レイレイ分布では母数は1つですから自由度は(k-1-1)=k-2
正規分布では母数が2つありますから自由度は(k-1-2)=k-3
となるのでしょうか。

 それと今回の質問にいたったいきさつを申し上げます。学生だけでやっている自主ゼミで次のようなことがありました。

 スペクトルの帯域幅パラメータが1に近いような広帯域の不規則強制力をバネ振り子のような固有周期を持つものに与えたときの質点の変位の時系列データの極値の分布を想定しています。この場合、固有周期をもつことからある種のバンドパスフィルターのように作用し、質点の変位の時系列データは狭帯域のスペクトルを示しました。この結果に対して、うちの研究室の先輩の修士課程の院生はレイリー分布を仮定して検定を行ったのですが、単純に自由度(k-1)としていました。これに対して私の友人がどこで聞きかじったのか(私もその友人も学部生です)母数を考えないといけないといって議論になりましたが、統計の素人集団の浅学なもの同士でやっているため結論がでず、この質問にいたった次第です。その友人も母数の数を引くということをどっかで聞いただけで根拠はありませんでした。素人ゆえ上記の文中に誤りがありましたらご指摘ください。
 stomachman先生、今後ともご教授お願いします。

補足日時:2001/02/03 01:26
    • good
    • 0

 測定値の母数、度数と仰るからには離散分布の話、と思ったらレイリー分布ですか。

これはどういうことかな?xを適当な区間に分けて、その中に入ったサンプルの数を数えた、という意味でしょうか?
 その場合、一つの区間の度数が最低でも数個以上になるように区分けをします(こうしないとχ二乗検定が使えません)。k個に分けるとしましょう。各区間は同じ幅である必要はありません。たとえば区切りをx[1]=0,x[2],....,x[k],x[k+1]=∞とし、j番目の区間を[x[j], x[j+1])とします。
帰無仮説「N個のサンプルが確率密度関数fの分布からランダムに採られた」を検定できます。具体的には区間jの理論度数
m[j] = N integral {x=x[j]~x[j+1]} f(x) dx
を計算し、実測した度数n[j]と比べます。すなわち
χ^2 = Σ{(n[j]-m[j])^2}/m[j]  (Σはj=1,2,....,kについて取る)
は自由度(k-1)のχ二乗分布で近似できる。

 さて、母数とは何か。レイリー分布
p(x)=(x/a)・exp{-x^2/(2a)} (x≧0)
の場合、aが母数です。つまりこの確率密度関数(確立じゃないですヨ)のパラメータのこと。これを決めると初めて、具体的な分布の形が決まる訳です。
 「aが違えば、分布が違い、同じサンプル数Nであっても区間の設定の仕方が違ってくる。従って、区間の数kも(従って自由度も)変わりうるし、理論度数m[j]も違う。」ということですね。

 まずは良い教科書を手に入れては如何でしょう。ハンドブック的なものだけでなく、きちんとした教科書を持っていると、こういう時に便利ですよ。

この回答への補足

早速の回答ありがとうございました。「確立」はミスタイプでしたすみません。
ご指摘のとおり”xを適当な区間に分けて、その中に入ったサンプルの数を数えた”ということです。

そこで再度質問ですが、多くの教科書がご回答のように自由度(k-1)のχ二乗分布で近似できる。と記しています。多くの教科書でも自由度(k-1)とした場合の
検定については記されていました。
 ただ確率密度関数に当てはまるかを調べるときは(k-1-母数の数)が自由度にな
るというようなことを聞きました。このことに関して詳しく記された文献があればご紹介ください。
 それと今一つ自由度というものがつかめません。そのへんのところを教えてください。


 

補足日時:2001/02/03 00:03
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q自由度の高いアプリゲームを教えてください

Apple Storeで購入可能な放置系でない、自由度の高いアプリゲームを探しています。
Wiiの「王だぁ」やDSの「頂きストリート」のようなゲームを探しているのですが、自分では見つかりませんでした。
普段はあまりゲームをやらないのですが、1年に1回くらいの頻度で無性に上記のようなゲームをプレイしたくなります。ちなみに、上記2つのゲームは現在は手元にありません。
できれば無料がいいですが、有料でも500円までで経営系でなおかつ自由度が高く、放置系でないアプリゲーム(Apple Storeで購入可能)がありましたら教えてください。よろしくお願いします。

Aベストアンサー

近いものならカイロの豊富なソフト群のなかから見つかるかもしれません。
http://kairosoft.net/index.html

どの内容のゲームでも共通して1周目はスローですが、1度エンディングさせると次回からは倍速が選べるようになります。
また、『引継ぎ』の要素があるので、2周目よりも3周目、あるいはそれ以降と、やり込むほどにハイスコアが出やすくなります。

Qカイ二乗による適合度検定におけるカイ二乗値の分布

カイ二乗による適合度検定で、期待度数と観測度数の差からカイ二乗値を計算するんですが、帰無仮説が正しい(すべての期待度数が観測度数と一致する)場合は、この検定統計量のカイ二乗値の分布はその自由度のカイ二乗分布になります。

帰無仮説が正しくなく、実際にある乖離(たとえば効果量w=0.3とか)があった場合、計算された検定統計量のカイ二乗値はどんな分布をすると理論的には言えるのでしょうか?

全体の総度数によってもかわるように思うのですが、いまいちわかりません。

平均の差の検定ではたとえば、t検定統計量が帰無仮説が成立しない場合非心t分布をとるのですが、カイ二乗検定ではこれは非心カイ二乗分布なのでしょうか? であったらその非心パラメタはどういうものなのでしょうか?

カイ二乗による適合度検定で、検出力の計算をどうやるんだろうかと考えていたら、こういう疑問がわきました。

Aベストアンサー

ある帰無仮説Hが成り立たない、というだけじゃデータDのカイ二乗値の確率分布は決まりません。
そうじゃなくて、「ある既知の確率モデルMに従っているランダムなデータD'のカイ二乗値はどんな確率分布に従うか」と問うと、これなら答が存在するでしょう。
つまりMをはっきり決めないことには話が始まらないわけです。ここで、「Mをはっきり決める」ってのは、実際に乱数を使ってデータD'の例をいくつでも生成するようなプログラムMが書ける、というほどの意味です。
なお、上記の問いに答えることの難しさは、Mの複雑さに依っておおいに違うでしょう。

QAccessの演算フィールドでのパラメータ設定について教えて下さい

Accessについて質問です。クエリで「金額:[価格]*[数量]」などの演算フィールドで、パラメータを使って抽出しようと「>=[金額を入れる]」のような条件を設定しました。すると、パラメータに10000と入力すると、10000以上のものが抽出はされますが、1000以上のものまで抽出されてしまいます。どうも先頭の数字に反応しているようです。どういうことなのでしょうか?どなたかよろしくお願いします。

Aベストアンサー

>価格フィールドは通貨型、数量フィールドは数値型なのです
で、演算は掛け算だけですか?
関数を使っていたりすると戻される型が変わってしまうということもありますよ

式のほうは数値型で間違いなければ
パラメータのデータ型を指定してやってください

クエリデザインビューなら[クエリ][パラメータ]で
パラメータのデータ型指定ができます

Q適合度の検定の時、カイ二乗値 = Σ{((観測度数)-(期待度数))^2/(期待度数)}とカイ二乗分

適合度の検定の時、カイ二乗値 = Σ{((観測度数)-(期待度数))^2/(期待度数)}とカイ二乗分布の値(例えば自由度5、有意水準5%の時の値11.07)が比較できるのは何故ですか?

すいません。宜しくお願いします。

Aベストアンサー

「検定」の考え方を、正しく理解できていないようですね。

「検定」の考え方とは
(1)「検定対象のデータ」が、ある母集団から採取したものと仮定する。(通常、これを「帰無仮説」と呼ぶ)
(2)このとき、この母集団の特性(平均値、標準偏差)から、「検定対象のデータ」が「起こりうる確率」を求める。それが「p値」。
(3)この「p値」が、通常あり得ないほど小さい(例えば0.05以下)なら、最初に仮定した「帰無仮説」(「検定対象のデータ」が、その母集団から採取したものという仮定)が間違っていると判断する。
(4)従って、「検定対象のデータ」は、その母集団からのサンプルデータではない、その母集団とは別ものと結論する。
ということです。「背理法(反証法)」というやつです。

 カイ二乗検定に場合には、上記の「確率」を求めるのではなく、「確率0.05」(これが「有意水準5%」に相当)となる「カイ二乗値」を、検定データから計算したものと、カイ二乗分布表(あるいは母集団のデータからの計算値)とを比較するという手順になっているだけで、考え方は同じです。

 「比較できるのは何故ですか?」って、検定データから計算したものが「判定対象」(被告)、カイ二乗分布表(あるいは母集団のデータからの計算値)が「判定値」(裁判官あるいは六法全書)ですから、比較することで「検定したいこと」の白黒を判定するのです。

 前の質問の回答したように、きちんと「検定」の考え方と、知りたいのであればその数学的意味を、本を読むなどして勉強してください。こんな掲示板に書けるほど簡単ではありませんので。
https://oshiete.goo.ne.jp/qa/9343988.html

「検定」の考え方を、正しく理解できていないようですね。

「検定」の考え方とは
(1)「検定対象のデータ」が、ある母集団から採取したものと仮定する。(通常、これを「帰無仮説」と呼ぶ)
(2)このとき、この母集団の特性(平均値、標準偏差)から、「検定対象のデータ」が「起こりうる確率」を求める。それが「p値」。
(3)この「p値」が、通常あり得ないほど小さい(例えば0.05以下)なら、最初に仮定した「帰無仮説」(「検定対象のデータ」が、その母集団から採取したものという仮定)が間違ってい...続きを読む

Qそもそも検定試験って何?(漢字検定事件を振り返って)

お世話になります。
漢字能力検定試験事件については現在もニュース報道が続いています。
それはさておき、そもそも検定試験って何なのでしょうか?

現在、世の中には検定試験と名の付くものがあふれています。
検定に向けての勉強自体が受験勉強や入学試験、就職試験に役立ちそうなもの(例 漢字検定、英検、秘書検定、簿記検定など)から
趣味のレベルを他人に示す指標となりそうなもの(時刻表検定、各地の観光地検定など)
お遊び・同好の志のお楽しみのようなもの(けん玉検定、そばうち検定など)までいろいろあります。

こういうものは誰でも勝手に”検定協会”を立ち上げて、勝手に検定試験を実施してもよいものなのでしょうか?
とくに疑問に思うのは、今回の”漢字検定”です。漢字って”誰の物”ですか?誰の物でもありませんよね。
なぜ、かのオオクボ理事長親子はあたかも”漢字はわれわれの物だ”と言わんばかりに”漢字界を牛耳る”(?)ことができたのでしょうか?

もちろん、漢字検定について地道に宣伝活動し、クイズ番組における漢字クイズブーム、清水寺での「今年の漢字」、各種TVゲームでの漢字ソフト発売、入学試験における漢字検定有資格者の優遇ブームにまで盛り上げた功績は認めます。

しかし、もう一度原点に立ち返って考えたいのは、漢字って誰のもの? ってことです。

もし、誰の物でもなければ、僕が明日から「新・漢字能力検定協会」を立ち上げて、「新・漢字能力検定試験」を実施してもいいのでしょうか?

お世話になります。
漢字能力検定試験事件については現在もニュース報道が続いています。
それはさておき、そもそも検定試験って何なのでしょうか?

現在、世の中には検定試験と名の付くものがあふれています。
検定に向けての勉強自体が受験勉強や入学試験、就職試験に役立ちそうなもの(例 漢字検定、英検、秘書検定、簿記検定など)から
趣味のレベルを他人に示す指標となりそうなもの(時刻表検定、各地の観光地検定など)
お遊び・同好の志のお楽しみのようなもの(けん玉検定、そばうち検定など)...続きを読む

Aベストアンサー

>勝手に検定試験を実施してもよいものなのでしょうか?

別に問題はないと思います。
本家漢字検定、新漢字検定、元祖漢字検定
皆が認めればそれでいいのでは。


>”漢字界を牛耳る”(?)ことができたのでしょうか?

そこがやはり公益法人としてのメリットだったのでしょう。
また、最初はだれもがそこまで流行するとも考えていなかったのでは。


あの問題は税制で優遇される公益法人でありながら、
莫大な利益を出し、おかみのいうことを聞かなかったことが問題であって、
通常の民間企業ならば、儲けた金をどのように使おうが経営者の勝手だった
ということです。

Qカイ二乗分布の「カイ二乗値」について

カイ二乗分布について、下記のような説明がよく見受けられます。
(a)カイ二乗値=Σ{(観測値)-(期待値)/期待値}
(b)カイ二乗値=(標本サイズ*標本分散)/母分散
どちらもカイ二乗値という同じ値を表す数式だと思うのですが、
この二つはどのような関係にあるのでしょうか?
「カイ二乗値って何?どうやって求めるの?」と聞かれたとき、どちらが正解なのでしょうか?

漠然とした聞き方で申し訳ありませんが、宜しくお願いします。

Aベストアンサー

a)のカイ2乗値は適合度検定などに用いられる時のカイ2乗値になっています。
b)のカイ2乗値は標準正規分布に従う母集団の母分散の検定に用いられる指標になっています。

ですので、
標準正規分布から無作為に選んだ大きさnの標本値の2乗値の合計は自由度nのカイ2乗分布に従う。

というこは、
標準正規分布から無作為に選んだ大きさnの標本値の2乗値の合計をAとでもしますと、このAはカイ2乗分布に従うので、カイ2乗値ということになります。

Aを定式化すると、(x-μ/σ)で変数の標準化を行い、それの2乗和を取ればよく、

 A=Σ(x-μ/σ)^2
 μはbの平均、σは母標準偏差

となります。

どちらも、検定で用いる指標がカイ2乗分布となることから、カイ2乗値という呼び方をしています。適合度検定で用いられるカイ2乗値はピアソンの適合度基準という呼び方もあるようです。共通するのはどちらもデータのばらつきに関する検定で用いられていることでしょうか。

Q秘書検定

こんばんは!takochikoと申します。

6月19日に行われる秘書検定を受けようと考えています。
その次の週の26日にAFTの色彩検定も受ける予定です。

優先順位としては・・・
(1)色彩検定
(2)秘書検定
               です。

秘書検定を受けたことのある友達に秘書検定を受けることを話したら、
「3級は簡単だから2級と併願したら?」とアドバイスをくれました。

どちらの検定も初めて受けるので、不安がいっぱいです。
同じ月に2つの検定を受けるので、秘書検定は3級のみにした方がいいのでしょうか?

ちなみに独学で土日中心にのみ勉強する予定です。

Aベストアンサー

こんばんわ。
就職などに秘書検定は必要ですか?
でしたら2級以上とらないと意味がないので
2級を狙ったほうがいいですよ。次回の2級でも間に合うのであれば3級を今回受けたらいいと思います。
正直、秘書検定は独学で十分1級とれます。
ただ他のかたが書いていらっしゃるように素質があるかでも変ってきますので質問者さんが向いているかはここではわからないですね・・

下記の出版社から出ている秘書検定の過去問題を解いてみて点数を出してみてください。
自分の今たてるべき目標が決まりますよ!

4ヶ月もあります!二頭も追えると思いますが
計画立てて頑張ってください。

早稲田教育出版

Q3群間の検定について(カイ二乗検定→事後比較)

A 群、B 群、C 群の 3 群をカイ二乗検定により同時に比較し、少なくともどれかの群は多の群と異なることが分かったとします。

その後それぞれの群間(A vs B、B vs C、C vs A)で再びカイ二乗検定を行い、A 群のみが B、C 群と異なることが分かった、といった解析を行いました。

このような解析方法は統計学的に妥当なものでしょうか(間違った方法ではないでしょうか)?
なお、それぞれの群間での対比較の際はボンフェローニ法により有意水準を補正してあります。

Aベストアンサー

サンプルサイズが極端(例えば A は 2 つしかデータがない、など)でなければ、妥当だと思いますよ。

Q各種簿記検定の難易度及び知名度について

 ひと握りに簿記検定といっても数々の資格があります。もっといえばありすぎてよくわかないぐらいです・・・。

 そこで、私自身が知っている簿記検定試験についての難易度と知名度について教えてください。

質問1 次にあげる簿記検定の難易度の順番に教えてください。<日商簿記検定試験2級(日本商工会議所主催)、全商簿記実務検定試験1級(財団法人全国商業高等学校協会主催)、全経簿記能力検定試験1級(社団法人全国経理教育協会主催)、建設業経理士2級(財団法人建設業振興基金主催)>

質問2 次にあげる簿記検定の世の中における知名度の順番を教えてください。<日商簿記検定試験2級(日本商工会議所主催)、全商簿記実務検定試験1級(財団法人全国商業高等学校協会主催)、全経簿記能力検定試験1級(社団法人全国経理教育協会主催)、建設業経理士2級(財団法人建設業振興基金主催)>

 もちろん、回答者様が思っておられる意見で結構です。真摯に考えていただかなくてもかまいません。
 よろしくお願いします。

Aベストアンサー

私見で良いと言う事なので

1について
 日商と全商は、私の受験経験から言うと、「日簿2級(易)<全商1級(難)」でした。
 全経や建設簿記は受験した事が無いので聞きかじりでは有りますが、4つの試験の難易度は、次のように考えます。
 全経1級>全商1級>日商2級>建設経理2級

2について
 建設業に勤めるのであれば、建設経理が必要なので認識が高いと思いますが、それは業界特有の簿記だからであり、銀行簿記や農業簿記の検定資格があれば、やはり、夫々の業界ではそれなりに評価される。と言う事で、建設経理は比較の対象とするのは不向き。
 世間一般で考えた場合、なんと言っても日商簿記検定が1番でしょう。そして、日商と同じく税理士受験資格が与えられる全経簿記が続き、全商は3番目。

Q仮説検定とカイ二乗検定の使い分けについて

すみません、統計学を学び始めたばかりで、仮説検定とカイ二乗検定の使い分けについて少々混乱しております。

私の理解では、

仮説検定ではHoを立てるときに実際に調べたい事項の逆接をHoとして立て、それが棄却されればH1の実際に調べたかった事項が正しかった証明される。

カイ二乗検定では、実際に調べたい事項をHoとし、その結果が棄却されるか否かを検定する

だと思っているのですが、間違っているでしょうか?

なお、これにより、p値から判断する基準が、

仮説検定→p値が小さいほどHoが正しくない可能性が高い
カイ二乗検定→p値が大きいほどHoが正しくない可能性が高い

ということになると思うのですが、合っていますでしょうか。。。?


問題が出たときの仮説の立て方がだんだんとわからなくなってきてしまい、ますます頭がこんがらがっています。

どなたかアドバイスをいただけるとありがたいです。

Aベストアンサー

> 仮説検定ではHoを立てるときに実際に調べたい事項の逆接をHoとして立て、それが棄却されればH1の実際に調べたかった事項が正しかった証明される。

 「仮説検定」とは検定のこと、「逆接」とは否定のこと、「Ho」とは帰無仮説のことですね。それなら仰る通りです。
 なお、
(1) 帰無仮説Hoが棄却されなかったときには何も言えない(つまり、話は無に帰す。「帰無仮説Hoを採用する(認める)」なんてのは間違い。)
(2) 帰無仮説Hoが棄却された時には、Hoの否定(¬Ho)が言える。
 だったら「実際に調べたい事項」の否定を帰無仮説にすればいいかというと、いつもそう旨く行くとは限らなくて、
(3) 帰無仮説Hoは統計に関する具体的な予言を導くものでなくては使い物にならない。例えば、「ラーメン屋Aとラーメン屋Bのラーメンは量が同じだ」や「ラーメン屋Aの量はラーメン屋Bの量の1.2倍以上ある」ならば帰無仮説として使えますが、「ラーメン屋Aとラーメン屋Bのラーメンは量が異なる」ではだめ。
ってことには注意すべきです。

> 仮説検定→p値が小さいほどHoが正しくない可能性が高い

 その通りです。p値とは『「Hoが棄却できる(ゆえにHoの否定(¬Ho)が成り立つ)」という判断が間違っている確率』のことです。

> カイ二乗検定では、実際に調べたい事項をHoとし、その結果が棄却されるか否かを検定する

 違います。上記(1)(2)の通り、帰無仮説Hoは否定(棄却)されるか無視される(無に帰す)かのどちらかしかありえませんから、「実際に調べたい事項」(つまり結論として言いたいこと)をHoにしても駄目です。

> 仮説検定とカイ二乗検定の使い分け

 「仮説検定」と「カイ二乗検定」をわざわざ区別する必要はありません。検定において、帰無仮説から「×××は、あるカイ二乗分布に従う」という予言が導けて、それを使って検定する場合を「カイ二乗検定」と呼ぶ。つまり「カイ二乗分布を使った検定」を略して言ってるだけのことです。

=========================

 例えば、「お昼にカレーを食べると、午後の講義で居眠りするような気がする」という意見について考えます。
 ランダムにサンプリング調査をして
x[1,1] = お昼にカレーを食べ、午後の講義で居眠りした回数
x[1,2] = お昼にカレーを食べ、午後の講義で居眠りしなかった回数
x[2,1] = お昼にカレーを食べず、午後の講義で居眠りした回数
x[2,2] = お昼にカレーを食べず、午後の講義で居眠りしなかった回数
のデータを得たとします。

帰無仮説Ho:「お昼にカレーを食べる」という事象と、「午後の講義で居眠りする」という事象は独立である(無関係である)。

を立てると、この帰無仮説から
a[i]=x[i,1]+x[i,2]
b[j]=x[1,j]+x[2,j]
N = a[1]+a[2]
χ^2 = Σ((x[i,j]-a[i]b[j]/N)^2)/(a[i]b[j]/N)  (Σはi=1,2、j=1,2の総和)
とすると、χ^2が自由度1のχ二乗分布に従う、という予言が得られます。

Case 1: 計算してみたらχ^2が3になったとすると、自由度1のχ二乗分布に従うものが偶然3以上になる確率は10%以下である。つまり「Hoが成り立っている場合に、データの偶然のばらつきでたまたまχ^2が3になった」ということが起こる確率(p値)は10%以下である。なので、有意水準10%でHoは棄却でき、Hoの否定:

Ho: 「お昼にカレーを食べる」という事象と、「午後の講義で居眠りする」という事象は関係がある

が言えます。
 両者の関係が正の相関であっても、負の相関であっても、χ^2は大きな値になる。(χ^2が大きいんだから、データを見ればどっちなのか簡単に区別できる訳ですが。)
 また、「お昼にカレーを食べるのが原因で、その結果、午後の講義で居眠りする」とまでは言えない。というのは、両方に共通の原因(例えば、「寝不足でだるくてさー。お昼に並ぶのがいやだから、一番手っ取り早い激マズカレーにしよっと」)があるのかもしれない。あるいは、因果関係が逆(例えば、「今日の午後の講義は寝てても大丈夫だし少々遅刻してもOK。よおし、超人気激ウマカレーの長蛇の列に並ぼう!」)かもしれない。

Case 2: χ^2が0.45になったとすると、自由度1のχ二乗分布に従うものが偶然0.45以上になる確率(p値)は50%ぐらい。なので有意水準10%ではHoは棄却できず、何も言えない。せいぜい「お昼にカレーを食べることと、午後の講義で居眠りすることの関係は、このデータからは分からん。関係があるとしても、その程度の弱い関係しかない。」としか言えない。

Case 3: χ^2が0.02になったとすると、自由度1のχ二乗分布に従うものが0.02以上になる確率は90%ぐらい。ちっとも珍しいことではない。
 しかし、自由度1のχ二乗分布に従うものが0.02以下になる確率は10%ぐらいしかない訳で、これは珍しい。Hoが正しいと仮定しても説明できないほどχ^2が小さすぎるのです。だから、有意水準10%でHoは棄却でき、その否定

¬Ho: 「お昼にカレーを食べる」という事象と、「午後の講義で居眠りする」という事象は関係がある

が言える。でも、2つの事象の相関が強いほどχ^2は大きくなるのですから、ここで言う「関係がある」というのは相関関係ではありえない。そうじゃなくて、「χ^2が小さくなるように(x[1,1]x[2,2] ≒ x[2,1]x[1,2] となるように)行動している。そうなるような何らかの調節なり規則なりが働いている」という関係なんです。たとえば、「学食のメニューはいつも月火水はカレーだけ、木金はラーメンだけ。月曜と木曜の午後の講義は出席点だけで単位が貰えるのでいつも全員居眠りする」なら、こういうことが起こります。

> 仮説検定ではHoを立てるときに実際に調べたい事項の逆接をHoとして立て、それが棄却されればH1の実際に調べたかった事項が正しかった証明される。

 「仮説検定」とは検定のこと、「逆接」とは否定のこと、「Ho」とは帰無仮説のことですね。それなら仰る通りです。
 なお、
(1) 帰無仮説Hoが棄却されなかったときには何も言えない(つまり、話は無に帰す。「帰無仮説Hoを採用する(認める)」なんてのは間違い。)
(2) 帰無仮説Hoが棄却された時には、Hoの否定(¬Ho)が言える。
 だったら「実際に調...続きを読む


人気Q&Aランキング