
Y(業績評価5段階)に対して、X1(性別、2値の名義尺度)とX2(所属チーム、4値の名義尺度)X3(営業成約金額、数値)の影響を知りたいと思い、
重回帰分析を実施する前に相関分析を行いました。
サンプル数は150です。
X1とY、X2とYはポリコリック相関係数、X3とYはポリシリアル相関係数を算出しました。
X1-Y, X2-Y, X3-YYとの相関係数はいずれも0.5程度だったのですが、p値はX3-Yだけが0.01以下になりました。X1-YやX2-Yにおけるp値は0.1程度の大きい値でした。
サンプル数や相関係数は同程度であったのに、p値だけがX1・X2とX3で大きな違いがあったことから、
ポリコリック相関係数よりもポリシリアル相関係数のほうがp値が小さくなりやすい性質があるのかなと思ったのですが、間違いでしょうか。
No.1ベストアンサー
- 回答日時:
企業で統計を推進する立場の者です。
r=0.5なのに、相関が有意なんて、ちょっとヤバいですよね。
でも、「性質」とかいう問題ではなく、どんな無相関性の検定をやっているかの問題です。
もっと数学的に考えないと、間違いのもとです。
ところで、かなり前に回答したと思いますが、Yが順序尺度なので、回帰は重回帰分析ではなく順序ロジット回帰が良いですよ。
それと、所属チームはA,B,C,Dという変数列を作って、そこに所属していれば1を立てるという方法で数量化しないとダメですよ。やっていますか?
その上で、チームAと業績の相関、チームBと業績の相関、と処理していきます。
また、数量化の際に、所属チーム間に線形制約が入るから、正則化回帰をするか1変数外すかちょっと難しい問題ですね。
ちなみに、順序ロジットの正則化回帰なんてRでしか見たこと無いです。
相関係数の算出、p値の算出は、どんなソフトを用いましたか?
それを伺ってから調べて回答します。
実は、私も、各ソフトがどうやってp値を出しているか、興味があります。
ピアソンの積率相関なら、ネットを見れば「無相関性の検定のt値」の計算方法が出ていますけど、ポリコリックの場合、どうしているのかと思った次第です。まさか同じじゃないと思います。ただ、ピアソンの積率相関はデータ量を増やせば、おのずと有意になりますけどね。それと同じでしょうか。
自宅にある本の中に書いてあるのが見つかれば良いですが、見つからなかった場合、今、コロナで殆ど在宅勤務なので会社の図書館で調べることが出来ません。
そのときは、お許しください。
kamiyasiro様、ご回答ありがとうございます。
相関係数の算出、p値の算出は、Rのpolycorパッケージのhetcor関数を用いました。
以下のウェブページを参考にしました。
http://www.okadajp.org/RWiki/?polycor%E3%83%91%E …
回帰はまだできていませんが、する際は順序ロジット回帰にしようと思います。ありがとうございます。
「所属チームはA,B,C,Dという変数列を作って、そこに所属していれば1を立てるという方法で数量化しないとダメですよ。やっていますか?」
Rにおけるこの処理ができていなかったのですが、以下の方法は過ちでしょうか。
ご存知でしたらご教示いただけますでしょうか。
Y(業績評価5段階)列のデータは1,2,3,4,5いずれかの値からなり、
data$hyouka<-as.ordered(data$hyouka)
と順序付き因子であることを定義しました。
X1(性別)列のデータは0,1いずれかの値、X2(所属チーム)の列のデータは0,1,2,3いずれかの値からなり、それぞれ
data$gender<-as.factor(data$gender)
data$team<-as.factor(data$team)
と順序なし因子であることを定義しました。
その後、
result<-hetcor(data,use="pairwise.complete.obs")
と入力したところ、相関係数とp値が出力されました。
No.2
- 回答日時:
#1です。
清水先生のページに、Wald検定か尤度比検定だと書いてあったので、それをヒントに調べてみます。少なくとも、ピアソンの積率相関のようにt検定でないことは確かです。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
下の対数表示のグラフから低域...
-
サンプル数の異なる2群間にお...
-
EXCELにてローパスフィルタを作...
-
信号処理系の分野に詳しい方に...
-
物理学実験のグラフの描き方に...
-
統計学の検定の領域に関する質...
-
エクセルのグラフから半値幅を...
-
線形なグラフとはひとくちに言...
-
最小二乗法を反比例の式を元に...
-
aを実数の定数とする。二次関数...
-
統計について
-
JMPを使った数量化第1類の統計...
-
検量線の決定係数について
-
この問題を教えてください 1000...
-
投稿論文を作成にあたり数年前...
-
標準正規分布表の確率で、上位...
-
理系のグラフで原点は無くても...
-
死傷者数と死者数の違いって何...
-
正規分布でない対象にウェルチ...
-
対数グラフの対数とは・・・?
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
EXCELにてローパスフィルタを作...
-
下の対数表示のグラフから低域...
-
検量線の決定係数について
-
エクセルのグラフから半値幅を...
-
線形なグラフとはひとくちに言...
-
最小二乗法を反比例の式を元に...
-
【統計】有意に「高い」?「低...
-
死傷者数と死者数の違いって何...
-
曲面z=log(x^2+y^2)のグラフの...
-
片対数グラフで…
-
物理学実験のグラフの描き方に...
-
パイロットサンプルって何ですか?
-
統計について
-
高校 数学 aを実数の定数とする...
-
数3の問題です y=x+cosx 0≦x≦2π...
-
理科のグラフで、直線と曲線の...
-
心理学の統計について
-
データ点を線で結ぶ場合と結ば...
-
正規分布でない対象にウェルチ...
おすすめ情報