プロが教えるわが家の防犯対策術!

度数分布表を作成するときの「階級幅」の決め方についての質問です。

JIS規格には
「R(レンジ)を1,2,5(または10,20,50や0.1,0.2,0.5など)で除し、その幅が5~20になるものを選ぶ。これが2通りになった場合、サンプル数が100以上のときに級幅の小さいほうを、99以下のときに級幅の大きいほうを用いる。」
とあるらしいのですが、いまいちよくわかりません。

サンプル数100個 R=6.4 の場合どのようになるのでしょうか?

よろしくお願いします。

A 回答 (4件)

#1 です.



> JIS 規格は
> 『1,2,5(または10,20,50や0.1,0.2,0.5など)の3つから適切な階級幅を
> 選びなさい (中略)』と言っていると考えてもいいんでしょうか?

要するに JIS 規格が言いたいのは,

「階級幅は10進数で切りのよい値にせよ」

ということですね.1,2,5 はどれも10の約数ですから.
階級幅を一般的に書くと,次のようになります.

m × 10のn乗 (仮数部mは10の約数 (つまり1,2,5),指数部nは任意の整数)

したがって,JIS 規格の要旨は次のようになるでしょう.

・階級幅は10進数で切りのよい値にする.
・階級数が 5~20 の範囲内に収まるようにする.
(この5と20も10進数で切りのよい値だ….)
・1つの階級に含まれるサンプル数があまり変動しないようにする.
(サンプル数が多ければ階級幅を小さくし,少なければ大きくして
変動を抑える.)


>(今回の場合、0.2,0.5,1.0から1つを選ぶ。0.2は問題外。)』

「問題外」というと語弊があると思いますが.(笑)
今回の場合は JIS の基準に照らして「範囲外」ですね.


■余談

JIS Z 9041-1 は10進法が前提となっていますが,それ以外の場合の規格は
ないんでしょうか?

例えばコンピュータがらみの統計だったら2進法ベースの方が都合がいいですし.
その場合,mは常に1だから,階級幅は2の冪乗ということになりますね.
    • good
    • 0
この回答へのお礼

何度もありがとうございます。

>JIS 規格の要旨は次のようになるでしょう.
とてもわかりやすいです!

お礼日時:2006/10/31 19:51

#2です。


級幅を決定する時には3,4,6,7,8,9などを用いるなと言っているのだと
思いますよ。それを表現で表したのが
『1,2,5(または10,20,50や0.1,0.2,0.5など)』なのでしょう。

・・・0.01,0.02,0.05,0.1,0.2,0.5,1,2,5,10,20,50,・・・

これらから分類数が5-20になるものを選びなさいと言っているのではないですか。
で、2つ候補が出たときは、サンプル数が多い時は分類数が多いほう(幅が狭い方)を、
サンプル数が少ない時は分類数が少ない方(=幅が広い方)を選べと言ってますね。
    • good
    • 0
この回答へのお礼

何度もありがとうございます。

>級幅を決定する時には3,4,6,7,8,9などを用いるなと言っているのだと
思いますよ。

私が#1さんに言いたかったことです!!ありがとうございます。

お礼日時:2006/10/30 23:21

#1さんが言われる通りでしょう。



JIS Z 9041-1:1999
5.2.2 a) 2)級幅の決定

最小値と最大値を含む級を5~20の等間隔の級に分けるように区間の幅を決める。
級幅はRを1,2,5(又は10,20,50;0.1,0.2,0.5など)で除し、その値が5~20に
なるものを選ぶ。これが・・・以下省略。

要は5~20個に分割して集計できるように幅を決定せよと言うことですね。
測定値が幾つだったかは書いてませんが、例えば0.7-7.1だったのなら
0.5-1未満,1-1.5未満,・・・,7-7.5未満
と分ければいいのではいいのではないですか。
    • good
    • 0
この回答へのお礼

回答ありがとうございました。

正しいJIS規格を教えていただきありがとうございました。

お礼日時:2006/10/30 16:50

> R(レンジ)を1,2,5(または10,20,50や0.1,0.2,0.5など)で除し、


> その幅が5~20になるものを選ぶ。

この「幅が5~20」という部分は「階級数が5~20」の間違いではないでしょうか?
何の度数分布かにより,レンジの値はオーダーさえ異なってくると思うのですが.
例えば「人の体重分布」と「リンゴの重さの分布」では全然桁が違います.
さらに「釣った魚の体長分布」となると,桁どころか物理的次元も異なります.

以下,「階級数が5~20」という前提で書きます.

階級幅を Wc,階級数を Nc とすると,

5 ≦ Nc = R / Wc ≦ 20

∴ R / 20 ≦ Wc = R / Nc ≦ R / 5

R = 6.4 なので 0.32 ≦ Wc ≦ 1.28

Wc の取り得る値は

> 1,2,5(または10,20,50や0.1,0.2,0.5など)

だから,Wc=0.5 または Wc=1.0.
サンプル数が100だから,階級幅の小さい Wc=0.5 の方を選ぶことになります.


もし「幅が5~20」が正しいとすると,上の計算で Nc と Wc を入れ替えて,

0.32 ≦ Nc ≦ 1.28

したがって Nc=1 (したがって Wc=6.4) となり,度数分布表を作る意味がなくなります.


度数分布にも JIS 規格があるというのは初めて知りました.
丁度今,画像処理でヒストグラムを扱っているので私も勉強になりました.

この回答への補足

回答ありがとうございました。

noocyteさんにうまく伝わるかわかりませんが
JIS 規格は
『1,2,5(または10,20,50や0.1,0.2,0.5など)の3つから適切な階級幅を選びなさい(今回の場合、0.2,0.5,1.0から1つを選ぶ。0.2は問題外。)』
と言っていると考えてもいいんでしょうか?

補足日時:2006/10/30 16:44
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!