重要なお知らせ

「教えて! goo」は2025年9月17日(水)をもちまして、サービスを終了いたします。詳細はこちら>

【GOLF me!】初月無料お試し

Y(業績評価5段階)に対して、X1(性別、2値の名義尺度)とX2(所属チーム、4値の名義尺度)X3(営業成約金額、数値)の影響を知りたいと思い、
重回帰分析を実施する前に相関分析を行いました。
サンプル数は150です。

X1とY、X2とYはポリコリック相関係数、X3とYはポリシリアル相関係数を算出しました。
X1-Y, X2-Y, X3-YYとの相関係数はいずれも0.5程度だったのですが、p値はX3-Yだけが0.01以下になりました。X1-YやX2-Yにおけるp値は0.1程度の大きい値でした。

サンプル数や相関係数は同程度であったのに、p値だけがX1・X2とX3で大きな違いがあったことから、
ポリコリック相関係数よりもポリシリアル相関係数のほうがp値が小さくなりやすい性質があるのかなと思ったのですが、間違いでしょうか。

A 回答 (2件)

企業で統計を推進する立場の者です。



r=0.5なのに、相関が有意なんて、ちょっとヤバいですよね。
でも、「性質」とかいう問題ではなく、どんな無相関性の検定をやっているかの問題です。
もっと数学的に考えないと、間違いのもとです。

ところで、かなり前に回答したと思いますが、Yが順序尺度なので、回帰は重回帰分析ではなく順序ロジット回帰が良いですよ。
それと、所属チームはA,B,C,Dという変数列を作って、そこに所属していれば1を立てるという方法で数量化しないとダメですよ。やっていますか?
その上で、チームAと業績の相関、チームBと業績の相関、と処理していきます。
また、数量化の際に、所属チーム間に線形制約が入るから、正則化回帰をするか1変数外すかちょっと難しい問題ですね。
ちなみに、順序ロジットの正則化回帰なんてRでしか見たこと無いです。

相関係数の算出、p値の算出は、どんなソフトを用いましたか?
それを伺ってから調べて回答します。

実は、私も、各ソフトがどうやってp値を出しているか、興味があります。
ピアソンの積率相関なら、ネットを見れば「無相関性の検定のt値」の計算方法が出ていますけど、ポリコリックの場合、どうしているのかと思った次第です。まさか同じじゃないと思います。ただ、ピアソンの積率相関はデータ量を増やせば、おのずと有意になりますけどね。それと同じでしょうか。

自宅にある本の中に書いてあるのが見つかれば良いですが、見つからなかった場合、今、コロナで殆ど在宅勤務なので会社の図書館で調べることが出来ません。
そのときは、お許しください。
    • good
    • 1
この回答へのお礼

kamiyasiro様、ご回答ありがとうございます。

相関係数の算出、p値の算出は、Rのpolycorパッケージのhetcor関数を用いました。
以下のウェブページを参考にしました。
http://www.okadajp.org/RWiki/?polycor%E3%83%91%E …

回帰はまだできていませんが、する際は順序ロジット回帰にしようと思います。ありがとうございます。

「所属チームはA,B,C,Dという変数列を作って、そこに所属していれば1を立てるという方法で数量化しないとダメですよ。やっていますか?」
Rにおけるこの処理ができていなかったのですが、以下の方法は過ちでしょうか。
ご存知でしたらご教示いただけますでしょうか。

Y(業績評価5段階)列のデータは1,2,3,4,5いずれかの値からなり、
data$hyouka<-as.ordered(data$hyouka)
と順序付き因子であることを定義しました。
X1(性別)列のデータは0,1いずれかの値、X2(所属チーム)の列のデータは0,1,2,3いずれかの値からなり、それぞれ
data$gender<-as.factor(data$gender)
data$team<-as.factor(data$team)
と順序なし因子であることを定義しました。
その後、
result<-hetcor(data,use="pairwise.complete.obs")
と入力したところ、相関係数とp値が出力されました。

お礼日時:2020/08/26 15:30

#1です。



清水先生のページに、Wald検定か尤度比検定だと書いてあったので、それをヒントに調べてみます。少なくとも、ピアソンの積率相関のようにt検定でないことは確かです。
    • good
    • 1

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!