プロが教える店舗&オフィスのセキュリティ対策術

1200個あるデータを中央値で高値群と低値群にわけたのに、nが600と700になってしまいました

中央値でわけたらn数は同じになるはずではないのですか?

A 回答 (4件)

No.2です。

ちょっと書き方が違っていましたね。

>中央値をとる個数が100個あって、それを「高値群」と「低値群」のどちらかに入れてしまったのでしょう?

  ↓

中央値をとる個数が100個あって、それを「高値群」と「低値群」の両方に入れてしまったのでしょう?

ですね。

いずれにせよ、「中央値のとり方」と、それによる「高値群と低値群の分け方」のどちらか、または両方に間違いがあるということです。
もし、何らかの計算機処理でやったのだとすると(エクセルの関数とか、自作のプログラムなど)、そのアルゴリズムや判定条件が間違っているということです。
    • good
    • 0

ごめん、質問をしっかり読まずに回答してしまいました。


600+700=1300ですから、100個は重複して分類されていることになりますし、
さらに、何か変則的な分類があったため、違う数になったと思われます。
中央値の代わりに平均値を使うと、正規分布でない場合は起こり得るかもしれません。
    • good
    • 0

高値群と低値群の分け方がそうなっているのでしょう。



中央値をとる個数が100個あって、それを「高値群」と「低値群」のどちらかに入れてしまったのでしょう?
    • good
    • 0

中央値自体が複数ある場合は、それを全部片側に振り分けてしまうと、こういった偏りが起きてしまうこともあります。



例えば{1,1,2,2,2,3,3}の場合に、
低値群を{1,1,2,2,2}としてしまったりするとおかしなことになりますけどね。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!