プロが教える店舗&オフィスのセキュリティ対策術

 あるクラスで生徒の1ヶ月の勉強時間合計とテストの点数について調査し、グラフにしたところ対数関数に近似することができました。エクセルを使って、近似式と決定係数を出しています。
 この決定係数が有意であるかどうかを検定したいのですが、どのようにすればよいでしょうか。

 

A 回答 (1件)

 おっしゃるところの「決定係数が有意」とは何のことか、はっきりしません。

有意性を問題にするのは「○○と##は無相関だ」などの帰無仮説を検定する場合であり、帰無仮説を棄却した場合に、その棄却という判断が誤っている確率を計算するんです。
 もし「xとyの間には、
  y = a log(x) + b + 誤差
という関係があり、 誤差の分布は□□分布に従う筈だ」と考える理論的根拠があって回帰分析を行った場合には、パラメータa, bの信頼性範囲を計算します。
 しかし、ご質問の場合、テストの作り方(テスト問題の揃え方)によって、曲線が変わるでしょう。たとえば、もっと難しい問題が多いテストなら、あるいは、もっと易しい問題が多いテストなら、散布図の形が(「概ね右上がりである」ということは同じだろうけど)かなり変わるに違いありません。つまり、単に「今回のテストでは、散布図がたまたま対数のグラフに似た形になった」というだけに過ぎません。対数関数を使って回帰することには何ら根拠がないのです。この場合、点数の代わりに順位を手がかりにして相関を分析する(ノンパラメトリックな)方法が適切でしょう。
 「テストの作り方」の影響を消すためによく行われるのは、テストの点数xを単調増加関数z=f(x)で変換するというやり方で、ただしf(x)は、zの分布が標準正規分布φ(z)になるような関数です。
 点数の累積分布のヒストグラム
  p(x) = (点数がx以下である人数)/(全体の人数)
を作って、これと累積正規分布
  q(z) = ∫[t=-∞~z] φ(t) dt
の逆関数invQとを組み合わせて
  f(x) = invQ(p(x))
が作れます。
 こうして出したzの値が、いわゆる「偏差値」です。もちろん、(正規分布を仮定する根拠なんかないのだから)偏差値そのものも順位としての情報しか持っていません。

 ついでながら、一つの注意点は、「勉強時間の長さが原因、テストの点数が結果」というような因果関係は、ご質問の調査では証明できないということです。因果関係が逆(「普段テストの点数が低いんで、勉強やる気が出ない」)だとか、勉強時間と点数の両方に共通の別の原因がある(「テストの点数に一喜一憂し勉強しろとうるさく言う親もいれば、放任主義で無関心の親もいる。前者では生徒がテストを真剣に受けるのでミスが少ないが、後者では生徒がテストを真剣に受けない」)ということかも知れないからです。
    • good
    • 0
この回答へのお礼

わかりやすく教えていただき、ありがとうございます。
大変参考になりました。

お礼日時:2013/07/07 18:31

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!