統計学なんですけど、最近勉強をはじめた文系の人間です。

次のような記述研究をしたいのですが、データの分析方法がよく分かりません。
英語の先生が生徒の間違いに対してどのような指導をするか、と言うテーマで、ベテランの先生と新米先生の授業を比較するつもりです。あらかじめカテゴリーを6つ用意して、二人の先生の授業を観察しながら、そのカテゴリーにチェックを入れていきます。そしてそれぞれのカテゴリーごとの出現回数を求めます。

そこで、その結果を二人の先生で比較して、有意な差があるかどうかを見たいのですが、カイ二乗検定で良いのでしょうか?名義尺度なのでノンパラメトリック検定を使う、と本で読んだので。
ぜひ、教えていただきたいので、よろしくお願いします。

このQ&Aに関連する最新のQ&A

A 回答 (2件)

私も少し…。

テーマに関してはstomachmanさんが詳細に述べていますので、
使い方の面を。

χ2乗検定が使えるどうかは「出現回数」の捉え方によります。
1回と2回の差が2回と3回の差と等しいと考えられるならば、
尺度水準は間隔水準以上になりますのでχ2乗検定が使えます。

只そのとき判るのは、その2人の先生に対してのカテゴリーの差が
有意かどうかが判るだけなので、テーマにどの様に利用できるかは
ちょっと思い付きません。

只、モンゴロイドとコーカソイドはパラメータを増やしすぎると
分類できなくなるそうです。盲滅法に変数を増やすのではなく、
自分のテーマに何が必要かを考えて適切な項目を吟味してみるのが
よいと私も思います。
偉そうなことを書きました。参考になればと思います。
    • good
    • 0
この回答へのお礼

とりあえずカイ二乗検定がつかえるとわかっただけでも、うれしかったです。たしかにカテゴリーのどこに有意差があるかが分からないのは問題だと思いますが、現在の僕の乏しい知識ではそれしか思いつきましんでした。
アドバイスありがとうございます。

お礼日時:2001/08/13 23:21

僭越ながら、統計処理技法の問題以前に、何を測ろうとしているのか、その目的に於いて実験のデザインが適切か、そのへん再考なさってみるのも宜しいかと思います。



 以下では「生徒の間違いに対してどのような指導をするか」ということが問いである、という前提としますが、
 これ自体も再検討の余地があるかも。生徒の間違いに対して行う指導を「どのような指導」かで分類し、分類項目の発生頻度と「ベテランと新米」の違いとの相関を見ようということですから、「ベテランと新米では、生徒の間違いに対して、指導の行動が違うか」と言う意味だと解釈できます。しかし…
 ベテランと新米の二人と仰いますが、この二人の違いはそれだけではない。だから例えば授業回数と行動との相関を、多数の教師の観察結果から証明しなくちゃ「ベテランと新米」という区分に意味があるとは言えません。言い換えれば観察対象がたった二人じゃ、ベテランも新米もなく、この場合には教師Aと教師Bの行動の違いを調べているに過ぎないのであって、その違いが何に(経験年数?準備に掛けた時間?語学力?性別?国籍?出身地?宗教?支持政党?声の大きさ?背の高さ?血糖値?体力?)由来するかについては何も言えない。言っちゃいけません。二人のデータから「だから新米にはこういう傾向があり…」なんて結論するのは、「だから自民党員は…」なんて結論するのと同様の、「統計の嘘」の典型です。
 一歩間違えば似非科学に陥りかねない。そういう危ないテーマにニアミスしていること、認識していらっしゃれば良いのですが。

 さて、次は実験デザインの話です。
 生徒が間違える頻度、これがそもそも先生によってカナリ違うと思われます。そうすると、事象の母集団がそもそも共通でない可能性が大きい。同じ事態に二人の教師がどう対処するか、を比較しているのではない。
 ここを無視して行動のカテゴリーにばかり注目すると、解釈不能になる。或いは因果関係を転倒して捉えてしまうという誤りに容易に陥りそうです。
 生徒の間違いが発生する頻度を決める要因をざっと考えてみても、
(1)生徒がどの位分かってないか、
(2)生徒にどの位発表機会があるか、
(3)分かってない生徒と分かってる生徒のどちらに発表機会があるか。
 さらにこの間違いに対して指導を行う頻度を決める要因としては、
(4)教師がどの位の頻度で間違いに気付くか、
(5)その間違いに対して、教師がどの位の頻度で反応するか、
などなどがすぐ思いつきます。
 例えば(2)については、間違えさせる事を通して教える教授法を採るか、よく解説してから演習させる教授法かによって全然違うでしょう。(この意味で「英語」は適切な選択かどうか微妙です。)また(3)については、全体を底上げしようと考えている教師なのか、できる子中心で気持ちよく授業を進めたいのかでは、きっと全然違ってくるでしょう。つまり、同じ学級を対象にして((1)は共通)観察を行っても、発生する間違いの中身と頻度が教師によって全く違うということは容易に予想されます。
 純粋に「生徒の間違いに対してどのような指導をするか」という観点に立つためには、((5)は指導の一種と考えることにしても)少なくとも(1)~(4)までの条件はコントロールしておかなくちゃいけない。この場合、(2)以降の要因はすべて教師の教授法の影響下にあるわけですから、単に多数の教師のデータを取っても均質化できないでしょう。まして僅か二人の教師を観察するのであれば
・授業中の発表回数を同じにし、しかも
・生徒に均等に発表機会を与える(乱数表をきちんと使って発表者を選ぶのが理想的ですが)、
・教師が生徒の間違いに気付いたら(反応するしないにかかわらず)カウントして貰う、
というような制約を課すのでないと、複雑な現象のうちのどうでもいい一部分を観察していることになりかねません。

 さらにカテゴリーの問題があります。6つの項目についてYes, Noを記録して、6次元の2値データを採るということだと思います。でもこの実験では観察と判定はヒトが行うんですから、カテゴリーの定義が適切かどうかが重要です。
 カテゴリーをどう定めるか。つまり、観察者の主観が入りにくい具体的で明確な観察ポイントを使って定義できるか、これは何度か予備実験を行って慎重に検討すべき問題です。何人もの観察者が観察して、観察者によって分類がばらつく事象を詳しく調べる必要があるでしょう。
 次に、二つのカテゴリーの間に相関が認められたとして、行動の特徴としての相関なのか、カテゴリーの設定に内在する相関なのかは、僅かな教師を観察したのでは区別できません。つまり、カテゴリー同士がどのぐらいカブッているか、ということが、結果を解釈をする段階では重要です。例えば
「ニヤリと笑って間違いを指摘したか」Yes/No
「ニンマリ笑って間違いを指摘したか」Yes/No
なんてカテゴリーがあったとすると、試行を何度も繰り返せば両者は相関が大きくなるでしょ?比較的独立な特徴でなくては情報が少ない。
 そうしますと、一回の指導の仕方を6つもの次元で綺麗に分類できるなんて、ホンマカイナ、と思えます。

 最後に統計処理技術の話。最も簡単なのは、カテゴリー間の関係は考えずに、それぞれのカテゴリーごとにYes/Noの頻度を比べることです。H:「教師AとBとは、あるカテゴリーXについてYesの行動を取る確率は同じである」という帰無仮説を立てて、検定します。Hが棄却できれば「Hの否定」が言え、棄却できなければ何も言えない。それだけです。(統計の結論としてはそこで沈黙しなくてはならない。その先に続けて「だから…」と解釈を積み重ねることは、この実験では担保されない論述・考察に過ぎません。)
 カテゴリー間の相互相関を調べると、カテゴリー同士の関係が見えてきます。二つのカテゴリーP,Qが同時にYesになる確率を調べ、「PとQは独立である」という帰無仮説を検定する訳ですね。P,Qは一緒にYesになる確率が高いことが言えたとしても、(既に述べたように)これがカテゴリーの類似性に起因するのか、教師の行動の特徴なのかは、高々二人を観察した位じゃまだ何も言えないでしょう。

 なお、もし沢山の教師を観察して多変量解析を行えば、このあたりの関係を明確にできるかもしれません。また、教師の授業経験時間数も一緒に調べたとすると、行動から経験時間数を推定する実験式を構成する問題は数量化理論I類に該当します。でもこの実験式を、経験時間数から行動の発生頻度を予想するのに使ったら間違い。これをやりたかったら、行動の発生頻度を目的変数とする数量化理論III類の解析を行います。
    • good
    • 0
この回答へのお礼

なるほど。脱帽してしまいます。
たしかにこの実験と言うか記述研究は非常に詰めが甘いものでした。この結論に関して一般化するつもりはありませんが、それでもかなり統計的に危ういもであるとわかりました。実験そのものを再考したいとおもいます

実験で使用するカテゴリーは先行研究に基づいたものを用いる予定でしたが、ご指摘をいただいたようにさらに綿密な予備調査を行う事にします。観察自体は複数の観察者を置ければよいのですが、予算やスタッフの関係上それが出来ません。その分さらに綿密な予備調査を行う事にします。

ありがとうございました。

お礼日時:2001/08/13 23:17

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aと関連する良く見られている質問

Q3群間の検定について(カイ二乗検定→事後比較)

A 群、B 群、C 群の 3 群をカイ二乗検定により同時に比較し、少なくともどれかの群は多の群と異なることが分かったとします。

その後それぞれの群間(A vs B、B vs C、C vs A)で再びカイ二乗検定を行い、A 群のみが B、C 群と異なることが分かった、といった解析を行いました。

このような解析方法は統計学的に妥当なものでしょうか(間違った方法ではないでしょうか)?
なお、それぞれの群間での対比較の際はボンフェローニ法により有意水準を補正してあります。

Aベストアンサー

サンプルサイズが極端(例えば A は 2 つしかデータがない、など)でなければ、妥当だと思いますよ。

Qカイ二乗検定とマクネマー検定について

例えば、肺がんの発生と喫煙の関係の研究をするために、ケースコントロール研究をする場合、ケースとコントロールを性や年齢でマッチングした場合は、ピアソンにカイ二乗検定を使用できないのはなぜなのでしょうか?
清書にそのような時はマクネマー検定を使うのがのぞましいとあるのですが・・・・
統計学の知識が少なく、その理由がわかりません。
よろしければ、教えてください。

Aベストアンサー

基本的にはPearsonのχ2検定は行側と列側に対応のない場合、McNemar検定は対応のある場合に用いられる方法だからということですが、なぜ対応のない場合の方法を、形式的には適用できるのに、そのまま用いてはいけないかということについてお話します。

ケースコントロール研究においてマッチングを行った場合、マッチング要因が交絡要因になっていると(実際においては程度の差はあれほとんどそうだと思いますが)マッチングを考慮しない解析では結果にバイアスが生じる事が知られています。これはケースコントロール研究の場合、コントロール群における暴露割合が対象集団における暴露割合を表すと考えることに起因します。マッチングを行うとマッチング要因が対象集団の分布とは異なったものになってしまうのです。極端な例では、暴露要因と完全に相関する要因、即ち暴露要因そのものでマッチングを行い、マッチングを考慮しないで解析すると暴露要因のオッズ比の推定値は必ず1になります。逆に暴露要因と全く相関のない要因でマッチングを行った場合はバイアスは生じません。

このような理由から、ケースコントロール研究ではマッチングを行った場合は必ずマッチングを考慮した解析を行うべきとされます。一般的には層別解析のMantel-Haenszel法が応用され、1:1マッチングの場合は結果的にMcNemar検定と同一になりますので、できればMantel-Haenszel法を学習された方が応用が利くかと思います。

念のため申し上げると、ご質問の内容とχ2分布の適用可能性は関係ありません。検定したい帰無仮説(今の場合は対応のあるデータの暴露要因に関するオッズ比が1に等しいという)、に応じた検定統計量を用いなければならないということです。その統計量がどのような分布に従うかはまた別の問題になります。Pearsonのχ2検定、McNemar検定、Mantel-Haenszel法のいずれも検定統計量が帰無仮説の下で近似的にχ2分布に従うことを利用していますし、最近の統計ソフトではχ2近似を用いずに直接確率や経験分布関数といった方法を用いてP値を求めることもできるようになっているものもあります。

基本的にはPearsonのχ2検定は行側と列側に対応のない場合、McNemar検定は対応のある場合に用いられる方法だからということですが、なぜ対応のない場合の方法を、形式的には適用できるのに、そのまま用いてはいけないかということについてお話します。

ケースコントロール研究においてマッチングを行った場合、マッチング要因が交絡要因になっていると(実際においては程度の差はあれほとんどそうだと思いますが)マッチングを考慮しない解析では結果にバイアスが生じる事が知られています。これはケースコント...続きを読む

QFisherの正確確率検定とカイ二乗検定

最近卒論で検定をしていますが、分からないことが多いので誰か教えてください。よろしくお願いします!

Fisherの正確確率検定とカイ二乗検定でカイ二乗検定を使う方が好ましい場合はありますか?

カイ二乗検定はゼロ項がある場合使えないと聞きましたが本当ですか?

fisherの正確確率検定と直接確率計算法は同じものですか?

Aベストアンサー

Fisherの正確確率検定(f)と、カイ二乗検定(x)ともに、独立2試料の検定の場合という前提でお話しします。
 ともに類別変数について独立2試料(2群の各試料が、それぞれの群の個々の試料に対応していない)の場合、両方とも適用可です。

 ただし、(f)の場合、前提条件として類別変数が2種類のみに分類され、かつ観察値は必ずこの2種のどちらか一方にならなければならない。
 本法は、2つの試料を用いて2種類の処理の結果を比較しようとする場合、または処理区を対照区と比較しようとする場合、もしくは離散的な類別変数との間で、ある性質の比較をしようとする場合に用いられる。
 また、2×2分割表において,4つの桝目のいずれかの期待値が5以下のときには,「χ2 分布を利用する独立性の検定」は不適当である。そのような場合には本法により独立性の検定を行う。(この段落は下記URLの引用)
 逆に期待値が大きい場合、組み合わせ計算が膨大になるので、そのような場合はカイ二乗検定を行う。
 一方、(x)の場合、前提条件は類別変数が2種類以上に分類されるときに使用できる。
 期待値が1以下になるようなことがあってはいけない。
 本法は、独立した2つの試料の間で各変数値の属する個体の比較に有意な差があるかどうかを調べるために用いられる方法である。
 連続性の補正(イエーツの補正):分割表から得られる χ20 は跳び跳びの値しかとらない。一方,χ2 分布は連続分布である。このため,2×2分割表の場合には連続性の補正をしたほうがよい。(この段落は下記URLの引用)

 検出力はほぼ同等と考えて差し支えないでしょう。よって、条件に当てはまる方法を選択して使い分けてください。
 
 最後の質問は、同じものです。

参考URL:http://aoki2.si.gunma-u.ac.jp/lecture/tests.html

Fisherの正確確率検定(f)と、カイ二乗検定(x)ともに、独立2試料の検定の場合という前提でお話しします。
 ともに類別変数について独立2試料(2群の各試料が、それぞれの群の個々の試料に対応していない)の場合、両方とも適用可です。

 ただし、(f)の場合、前提条件として類別変数が2種類のみに分類され、かつ観察値は必ずこの2種のどちらか一方にならなければならない。
 本法は、2つの試料を用いて2種類の処理の結果を比較しようとする場合、または処理区を対照区と比較しようとする場合、もしくは...続きを読む

Qspssのカイ二乗、有意差検定について

SPSSでカイ二乗検定をしたところ、
『0セル(0%)は期待度が5未満です。』とのメッセージがありました。
この場合有意差はfisherの直説法の数値でよいのでしょうか?

『●セル(100%)は期待度が5未満です。』となった場合、
peasonのカイ二乗の数値が有意差となるということでしょうか?

セルとその%表示が理解できていません。

お手数をお掛けしますが教えてください。
よろしくお願い致します。

Aベストアンサー

回答します。
その場合は、fisherの直接法のところの有意確率を見てください。

>peasonのカイ二乗の数値が有意差となるということでしょうか?
いいえ。上記のとおりです。

セルとその%は、人数やその割合を示しているクロス表です。

Qエクセルでのカイ二乗検定の仕方について

いつもご利用させて頂いております。

大変、親切に教えて頂けますので、ありがたいです。

さて、エクセルで、統計のカイ二乗検定のやり方を教えてください。

行いたいことは、
はじめる前と、終わりでの変化です。

カイ二乗検定で、「有意さがある」とうことは、どういうことでしょうか??


よろしくお願い致します。6才の子どもでも分かるようにお願い致します。

よろしくお願いします。

Aベストアンサー

ひとつ、言い忘れていたことがありました。

t検定は、母集団が正規分布していることを仮定しています。
標本の数が多いときは、(一応50~100個以上の数量データが無難かな)正規分布しているとみなしていいのですが、、、

母集団が正規分布しているとみなせない場合や、標本数が著しく少ない(20個以下とか)なら、正規分布を仮定しないでも行える【ノンパラメトリック検定】を使う方がいいと思います。

前後の比較なら、ノンパラメトリック検定の【ウイルコクスン符号付順位検定】がいいでしょう。

その場合も有意確率が算出されて、解釈の仕方は同じです。


人気Q&Aランキング

おすすめ情報