プロが教える店舗&オフィスのセキュリティ対策術

データの散らばり度合いを調べる時、なぜ範囲ではなく四分位範囲で比べるのですか?

A 回答 (5件)

「四分位範囲」も範囲ですよ。


データの散らばりを調べる時は、何処かに基準が必要ですね。
25%づつ 4つに分けて比べるのが 四分位範囲 です。
或いは 四分位偏差 のことですか。
これは データのバラツキを 表す値で、
多分 教科書や参考書に書いてある筈です。
    • good
    • 0

標準偏差や3∑も同じですよ。

「範囲」だから。
    • good
    • 0

統計用語である範囲(レンジ、記号:R)は、最大値-最小値です。



最大値や最小値は、突発的な理由で外れ値となっていることもあります。そのため、観測のたびに、範囲Rは大きく変動します。

そのため、データの散らばり度合いを表す「頑健な値」として95%範囲(おおよそ±2σ)や四分位範囲(50%範囲)が使用されます。
    • good
    • 1

日本語がおかしかったので、訂正させて下さい。

すみません。

統計用語である範囲(レンジ、記号:R)は、最大値-最小値です。

最大値や最小値は、突発的な理由で外れ値となっていることもあります。そのため、観測のたびに、範囲Rは大きく変動します。

そんなとき、データの散らばり度合いを表す「頑健な値」として95%範囲(おおよそ±2σ)や四分位範囲(50%範囲)が使用されます。
    • good
    • 0

あるデータの集まりの「特徴」を捉えるには、いろいろな見方があります。


具体的な例で考えてみましょう。

たとえば「5人のテストの点数」を見るときに、
 0点、20点、40点、60点、80点
だったら、
・平均は 40点
・範囲は 0~80点

5人の点数が
 0点、0点、40点、80点、80点
でも
・平均は 40点
・範囲は 0~80点

で同じです。

それを四分位範囲で見れば、四分位範囲は「下から2番目と4番目の範囲」なので

上の場合:20~60点
下の場合:0~80点

で変わります。

上の場合には「全体にばらついている」ので四分位範囲が「20~60点」ですが、
下の場合には「上と下に極端に寄っている」ので四分位範囲が「0~80点」になります。

さらに5人の点数が
 0点、40点、40点、40点、80点
の場合には、
・平均は 40点
・範囲は 0~80点
・四分位範囲は 40~40点(同じ点数)
となり、「真ん中(平均点付近)に集中している」という特徴がよく分かりますね。

四分位範囲で見ると、「全体の範囲」で見るよりも、全体の分布のしかたの特徴がよく現れます。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!