アプリ版:「スタンプのみでお礼する」機能のリリースについて

手元にある資料によると「レンジ効果」とは「要素間に実際には強い相関関係があっても、ある範囲の標本が欠如してしまうことで、相関係数が小さくなってしまうこと」とあります。

しかし、ある範囲の標本が欠如してしまうことで、相関係数が逆に大きくなってしまうことがあると思うのですが、これはレンジ効果とは言わないのでしょうか。もし言わないとしたら、この現象を説明する統計学的・心理学的用語は何なのでしょうか。

具体例:ある資格受験講座があります。そして、その資格試験の合格者1000人から、その講座の評判についてアンケートをとったところ95%が、「講座の受講が資格合格に役立った」という回答を得ました。で、講座の受講と試験の合格は相関が高いと結論づけることはできるでしょうか。-勿論できません。「講座を受けて不合格だった人」のデータがないからです。

例は「擬似相関」とはまた違うような気がします。あくまで「標本の欠如」が原因なのですから。

今回お聞きしたいのは、この現象を表す専門用語であり、「このようないいかげんな統計が行われている世相についてどう思うか」ということではありませんので、よろしくお願いします。

A 回答 (1件)

まず、相関を誤解なさっているのではないでしょうか。



そもそも、具体例の示す「講座の受講と試験の合格の相関」は、「試講座を受講した・していない」と「試験の合格・不合格」の相関なので、講座を受講していない人のデータが無ければ意味がありません。
また、「試験が役に立った」云々は一体何の意味があるのでしょうか。「講座受講の満足度と試験合格の相関」等であれば別ですが。
具体例はそもそも、何と何の相関を出したいのかがわかりません。
95%が満足したから相関が高いというのは、どういう意味でしょうか。
数値以外でも相関を出すことはできますが、具体例の場合どのような散布図が描けますか?データを欠如していない状態、そこから欠如してしまっているデータがどこなのか、考えてみてください。

標本の欠如による相関係数の増大は、そもそも性質の異なる標本であることが予測されます。
その場合は疑似相関ですね。
ある群では相関が認められず、ある群では強い相関が認められる。双方の群を込で相関を求めたら、中程度の相関が出ます。
このとき、相関が認められない群の欠如により相関が強くなる、ということはあります。
このような場合は、双方を含めて相関を求めること自体に問題があります。

標本の欠如による相関係数の増大。
理屈ではなく、散布図で考えてみるとわかりやすいですよ。
    • good
    • 0
この回答へのお礼

回答ありがとうございます。

「相関」とは2変数間の関係であると考えておりました。

例えば、気温が上がれば→アイスクリームの売り上げが上がる。という法則があるとしたら、この時、気温とアイスクリームの売り上げには正の相関があるということですね。

で、例は 講座を受ければ→試験に受かる という法則がなりたてば相関はあるのではと考えたのです。しかし、この時「講座を受けなかった時に比べ、受けた時の方が試験に受かる可能性が高い」という変数が必要になりますから、「受けなかった」データがなければ「相関」は検討できないない、というのはもっともなご指摘です。

しかし、現実にはこのような検討の仕方は数多くあります。例えばこのサイトでも「公務員試験に受かった人にお聞きします。どんなテキストを使っていましたか?」などといった質問がよく見られます。この時、落ちた人もそのテキストを使っていたかもしれない、ことについては考慮されていません。かと言って、この質問が全く無意味であるとはいえないでしょう。

また「不合格者」は声を上げにくいといった事情があるかもしれません。その時、明らかに標本が欠如していると判っていても、ある程度の法則性を見つけたいと思うのではないでしょうか。具体的には、合格者の満足度が高い講座は、そうでないものより合格との相関が高いのではないかという仮定です。

さて、結局は具体例について批判を加えようとするならば、レンジ効果だの何だのというより、「標本が欠如している」「標本のサンプリングに問題がある」という以外ないようですね。

お礼日時:2009/05/28 18:07

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!