アプリ版:「スタンプのみでお礼する」機能のリリースについて

100人の社員向けに、価値観に関する設問を作り回答してもらいました。
具体的には、
・12個の価値観の選択肢の中から3つを選んでもらう。
・必ず3つに絞って選択するように注意書きを書く。
・Googleフォームのチェックボックスで作成⇒3つより多くまたは少なく選択できてしまう。
・結果を見ると、1割程度の社員が、3つより少なくまたは多く選択している。

このような場合、その1割の回答者も含めて分析すべきか、その1割は除くべきか、どのように処理すべきか迷っています。アドバイス頂ければ幸いです。

A 回答 (6件)

データ解析屋としては、無効回答にすると回答した者です。



12の価値観の間の関連性を見ることもできますし、
データの行・列を入れ替えると、100人のセグメンテーションもできます。

Rでクラスター分析をやると出てきます。

そのときに使用する距離は、二値データですので、マンハッタン距離かキャンベラ距離を用いることになります。

特に、12の価値観を行として解析するときは、ゼロ過剰のデータですので、キャンベラ距離が良いでしょう。

興味深いです。
    • good
    • 0
この回答へのお礼

詳細な回答誠にありがとうございます。教えて頂きましたことをやりたいのですが、当方、エクセルしかないのですが、エクセルの場合、どのようなことが可能となりますでしょうか。12の価値観の関連性やセグメンテーションに興味がありまして。

お礼日時:2023/11/27 09:33

#1さんに1票。



データ解析屋としては、無効回答として除外します。

理由は、多く選択した人の回答に偏るからです。


解析としては、
・単純には得票率や順位付け、
・共起性グラフやワードクラウド、
・あるいはテトラコリック相関やオッズ比
を見るのでしょうが、今のデータを用いて解析するなら、その際にデータの補正が必要になってきます。

合計の得点は予定なら300点のハズが、それがずれているのですよね。だったら300点に調整しなければなりません。

評価者1人の持ち点は合計3点です。
1つ多めの回答をした人の解答は、1点ではなく3/4点とか、重みを下げます。

もし、人事考課でこんないい加減な(ルールを守らない)評価をする人は除外した方が良いです。その方がみんな納得します。
    • good
    • 1

100人の社員の中には、


(1) 3つより少なくまたは多く選択した人
(2) 選択肢の内容だけ考えたら3つより少なくまたは多くあてはまったが、
  アンケートの指示に従って3つ選択した人
(3) 指示は無視して選択肢の内容だけ考えたが、
  たまたま3つあてはまった人
が混在しているわけです。
(1) の回答を除外しても、(2) と (3) の区別はつきません。

こうなっては、もう
「必ず3つに絞って選択するように注意書きを書く」という指示を加えたことを
後悔しつつ、アンケートの方法に問題があることは飲み込んで
100人全員のデータを集計する以外、できることがありません。
    • good
    • 0

そもそも


「必ず3つに絞って選択するように」
と指示したら

(a) 選びたいものがないまたは1~2個しかないのに、無理やり「あまり選ぶ気のない3つ目」を選ぶ

(b) 本当に選びたいものが4つ以上あるのに、泣く泣く選択から外さざるを得なかった

ようなものが混じるので、かえって「正確性」に欠けるデータが収集されることになりかねません。
むしろ「1割程度の社員が、3つより少なくまたは多く選択している」方が、本当に選びたいものを選択していると考えることも可能です。

どのような内容をどのように処理して、どのような結果を得たいのか分かりませんが、上記のような事情があると考えれば「3つより少なくまたは多く選択している」ものを除外するとかえって「正確性」を低下させる結果になりかねないと思います。
目的に沿って、含めるか除外するかを決める必要があると思います。

上のようなことを考慮した一般論としては「含める」方を選択すべきかと思います。
    • good
    • 0

人を調査するんだと思っているようですが、この場合には12個の価値観について調べているんです。


 それぞれの「価値観」単独での支持のされ具合を、「何人が選んだか」で測るものとすると、一人が何個選択したかなんてことは無視して数えればいいわけです。そのためには単に「複数選択可」としておけば良かったんですけど、

> 3つに絞って

だなんて余計な指示をしたせいで、4つ目を選ぶのを諦めた人がいるかもしれない。なので調査結果には変なバイアスが入っています。
 また、この指示では「0〜3個を選べ」という意味にしか解釈できません。だから、3個未満を選択した人は指示に正確に従っている。

 でも、調査はやっちゃったんで、しょうがない。この余計な指示はなかったことにして、単に「複数選択可」だったと思うしかないでしょう。

 さて、各「価値観」について、それぞれ何人が選択したか、はとりあえず(バイアスはあるけど)測れたことにする。
 次に、「価値観」同士の関係を調べたいでしょう。たとえば「価値観Aを選ぶひとは価値観Bも選ぶ傾向が強い」ということがわかれば、価値観Aと価値観Bはある意味似た性格を持っている、というようなことが考えられる。
 これをやるには共分散行列を作るんです。そして共分散行列を主成分分析に掛けて2〜3次元程度に圧縮した因子空間を構成しますと、価値観同士の関係が可視化されます。さらに、この因子空間に人をプロットすることによって、個人の傾向を分類することもできます。
 ここで、共分散行列を作るにはデータ行列X(X[i,j] = 人iが選択肢jを選択した=1, しない=0)の行列を作り、正規化した上で、Xの転置をXに左から掛ける。でも、その人が何個の選択をしたか、という情報が(余計な指示のせいで)激しく毀損されています。もうしょうがないんで、n個選択した場合、各選択に1/nの重みを与えてデータ行列を作るしかないでしょうね。
    • good
    • 0

100人ということは、その中の10人程度が誤回答ということですね。


外してしまっても統計上問題はないでしょう。
逆に入れてしまったら、正しい回答90サンプルと正しくない回答10サンプルが混在して、データの説明力が落ちます。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています


このQ&Aを見た人がよく見るQ&A