プロが教えるわが家の防犯対策術!

食品メーカー勤務です。。。とても困っています。
タイトル通り、正規分布のグラフをプラスに平行移動する方法についてご存知の方、教えて下さい。

ハンバーグを作るところを想像してみて下さい。1kgのひき肉があり、50粒の枝豆があります。混ぜて30gずつ小分けにし、ここで1つあたりのハンバーグに入る枝豆の数を数えるとします。
枝豆の個数をグラフにすると正規分布になりますが、ここで-3σを計算すると、マイナス値になってしまいました。つまり「枝豆が1つも入っていないハンバーグ」を無くすため、正規分布のグラフを右に平行移動して-3σをプラスにしたいのですが、どの様な方法を取ればよいでしょうか?

下記考えてみました。

(1)平均値に-3σを足すと、現在の平均値の1.5倍になるので、枝豆の全体量を1.5倍にする 
 → シュミレーションしてみましたが、平均値、標準偏差ともに1.5倍になるため、-3σがマイナスであることには変わらず、むしろ0個のものが増える計算になります。

上記が無理となると、

(2)-3σが-にならない範囲までN数を増やす。→ できるかどうかはわかりませんが・・
(3)もともと0個のものが生じる設計だと妥協する。
(4)混ぜる時間を延長する(例えば)など、工程上の変更でバラつきを減らせるようなら減らす。
 → おそらく難しいです・・。

くらいしか、-3σをプラスにする方法が思いつきませんが、(1)の様な方法で解決できればベストです。。


すみませんが、どうかよろしくお願いします。

このQ&Aに関連する最新のQ&A

A 回答 (7件)

No. 5に追加です。



枝豆が入っていないハンバーグの出現確率を下げようと枝豆の総数を増やすと、ハンバーグ1個あたりの枝豆の個数の期待値は増え(No. 4で書いた通りです)、同時に、枝豆が「たくさん」入ったハンバーグの出現確率も増えます。(当然ですね。)

添付図は、枝豆なしハンバーグの許容確率を0.1%としたときの、ハンバーグ1個あたりの枝豆個数の分布予測です。ポアソン分布と二項分布の両方を示してあります。図を見るとおわかりになると思いますが、「0.1%」が無視できる数値なのだとすると、例えば、枝豆が10個以上入っている確率は無視できない数値になります。

肉に枝豆を入れて混ぜるという確率的な工程をとる限りは、枝豆が入っていないハンバーグの出現確率とともに、ハンバーグ1個あたりの枝豆個数の最大値とそれを超える個数を含むハンバーグの出現確率の許容値も考える必要がありそうです。

もしかしたら、2つの許容値は両立しないかもしれません。その場合、ご質問にある「(4)混ぜる時間を延長する」などの確率論的に理想的な状況に向かうような工程変更は意味をなさないことになります。(「両立しない」という結論がそもそも理想的な状況を仮定して出てきた結果であるためです。)
「正規分布のグラフを平行移動する方法」の回答画像7

この回答への補足

申し訳ございません。
二項分布式の件ですが、
P(N)={(1-N)/1000}^30と勘違いしておりました。
なので問題ないです。ありがとうございました。

補足日時:2011/01/17 18:37
    • good
    • 0
この回答へのお礼

グラフまでありがとうございます。
良く理解できました。この場合、工程上の予測できない要因を加味したら仰るとおり「二項分布」と「ポアソン分布」のどちらをモデルとするかはそう変わらない気もしています。
ただこの工程を取る場合、「許容値」を下に振るか、上に振るかは判断する必要がありそうです。

たびたび申し訳ございません。
1点のみ教えて頂きたいのですが、この場合の二項分布の式(No.4に記載)は
P(N)=(1-N/1000)^30 ではなく
P(N)=(1000-N/1000)^30 でしょうか?

私の計算に間違いがあるのかもしれませんので、
確認のためにもご教示頂けるとありがたいです。

お礼日時:2011/01/17 16:19

#3です。


疑問をお持ちになった点について説明します。

(1) ポアソン分布は、確率が非常に小さい場合のことか?
答:確率が非常に小さくて、試行回数が非常に多く、その結果、出現数がそれほど小さすぎたり大きすぎたりしない場合に使う分布です。例えば、北海道で高額当選が多く出た!という場合「驚くか」「さほど驚かないか」という問題です。
宝くじは、なかなか当たりませんが、非常にたくさん買えば、そこそこの当選数になるはずです。ですから、どこかの売り場でたくさんの当選が出ても、統計学者は、そんなに驚きません。

(2) ポアソン分布と二項分布の使い分け
答:宝くじを1億枚買ったときでも、厳密には2項分布なので、(0.99999999+0.00000001)^100000000 を2項展開するのが本道です。しかし、展開式の最初のほうは、(0.999999+0.000001)^1000000と、ほとんど同じであり、百万でも10億でも1兆でも変わりありません。ですから展開式の端のほうだけ見るときはポアソン分布で、真ん中寄りも問題にするときには二項分布という使い分けをします。使い分けは、精度と労力の兼ね合いで決めるのです。さらに、日本中の宝くじの半分も買ってしまうような人がいたら、今度は、二項分布も労力がもったいないので、正規分布の出番となります。
    • good
    • 0
この回答へのお礼

重ね重ね、ありがとうございます。

■(1)について
宝くじの話は何となくわかりました。
試行回数が非常に多いと言うのは、ある程度結果にブレがないことが前提と言う事でしょうか。今回の「枝豆」の問題では、皆さん真っ先に「ポアソン分布」をアドバイスして下さいましたが、その根拠がいまいち理解しきれていなかったため、ご質問させて頂きました。
■(2)について
精度と労力の兼ね合いですか。
何をどの程度正確に知りたいかで変わってくると言うことですね。今回のケースでは、工程上予測できない要因も後々多く関わるため「二項分布」も「ポアソン分布」も同程度と見なして取り組んでみます。


ありがとうございました。

お礼日時:2011/01/17 15:24

二項分布だとすると・・・1000gの肉を「適度に」(*)広げた後、1gずつ1000個の等面積なセルに区切っておき、その上から枝豆50個をランダムにばらまいた、という状況を考えればよいのかもしれません。

1つのセルには1個の枝豆が乗っているかいないかのどちらかであるとします。

(*)肉を極端に薄く広げると1つのセルに2つ以上の豆が入り得ることになります。そうはならずに1gの肉からなる1つのセルに入る枝豆の個数は最高1個であるように広げることを「適度に」と表現しています。

このとき、あるセルに枝豆が乗っている確率pは50/1000=1/20です。このようなセル30個からなる集団(1個30gのハンバーグに相当します)に含まれる枝豆の個数の分布は p = 1/20, n = 30 の二項分布になるでしょう。

グラフを描いてみるとわかりますが、p = 1/20, n = 30 の二項分布と、m = 1.5 のポアソン分布はよく似ています。実際にハンバーグを作ってみた結果がどちらの分布になるのかおそらく区別はつかないだろうと思います。

どちらの分布であるか区別をつける必要があるとすれば、枝豆の総数Nを増やしたときの、枝豆が入っていないハンバーグの出現確率P(N)が大きく異なる場合です。

ポアソン分布の場合は、No. 4にも書いた通り、P(N) = exp(-3N/100) です。一方、上記のような考え方の二項分布では P(N) = (1-N/1000)^30 となります。この二項分布の場合には

P = 0.01 にするには N ~ 143
P = 0.001 にするには N ~ 206

となります。つまり、ハンバーグ1個あたりの枝豆の個数は二項分布であると仮定した場合の方が、枝豆が入っていないハンバーグの出現確率を低くするのに必要な枝豆の総数が少ないことになります。工業的な生産規模の場合には、両者の予測の差は無視できないほど大きな利益の差を生むことになるのでしょうか?そうだとすると、私のような素人の数字遊びではなく、もっと統計に通じた人の責任ある回答を得るべきだと思います。


以前に回答を書いたときにも疑問に思ったのですが、枝豆が入っていないハンバーグの許容確率はどの程度なのでしょうか?

仮に0.1%(P=0.001)だとします。すると、ハンバーグ1個あたりの枝豆の個数の期待値は6.18(二項分布)あるいは6.9(ポアソン分布)となります。つまり、ハンバーグ1個当たり6-7個の枝豆が入っていることになります。ご質問にあるケースでは1.5個だったわけですから、実に4倍です。こうなるとハンバーグの味などが変わってくるのではないかと想像します。こうなると、0.1%を許容できても、肝心のハンバーグの味が許容できない、ということにはならないでしょうか?そうだとすると、枝豆をハンバーグに入れる工程を工夫する必要がある、ということになるのかもしれません。
    • good
    • 0
この回答へのお礼

重ね重ね、ご丁寧にありがとうございました。

>枝豆が入っていないハンバーグの許容確率はどの程度なのでしょうか?

このご質問についてですが、メーカーによって異なるとも思いますが、私の回りだと「0.3%」程度です。数字の根拠は3σの「99.7%」から来ておりますが、明確に「どの程度までならOK」と言った取り決めがあるわけではありません。(実際に0.3%を逸脱するものもあります。)

つまり、Kaorineさんの仰る通りなのですが、「ハンバーグの味」「食感」と言った「品質」と天秤にかけ、どの程度まで許容できるか?と言った判断をその都度することになります。
例えば今回のケースなら、設計時に「枝豆なしハンバーグ」の発生率を推測できたとして、その後に
 (1)枝豆の絶対量は変更しない。枝豆をカットしてパーツ数を増やす。
 (2)枝豆の絶対量を増やし、品質が許容できるか判断する。
 (3)全てのハンバーグに枝豆が入るように、手作りで2粒ずつ入れるなど大幅な工程変更をする。
などの中から選択する事になります。

今回の問題の解決にあたり統計の本をいくつか読んだ中に記載されていたことですが、「全ての事象はN数(側定数)を増やせば正規分布で説明できる」と言ったいわゆる「正規分布信奉」のようなものが私の周りにもあり、他の分布について考慮することができておりませんでした。

今回のケースなどは側定数をいくら増やしたところで「1つあたりに含まれる枝豆個数の期待値」を増やさなければ分布は正規分布(正確には離散型の分布なので「ぽい」形ではありますが)には近づかないわけですから、いかに上記の様な信奉が役に立たないか痛感した次第です。

重ね重ね、ありがとうございました。

お礼日時:2011/01/17 15:09

枝豆を入れて混ぜた肉からハンバーグを作るという工程を取る限りは、枝豆の入っていないハンバーグが出現する確率は0にはならないでしょう。

しかし、小さくすることは可能だと思います。

ポアソン分布で考えてよい(少なくとも、よい近似になっている)とします。すると、枝豆が一つも入っていないハンバーグが見つかる確率は P = exp(-λ)になります。λはハンバーグ1個あたりの枝豆の個数の平均値、

λ = N/(1000/30) = 3N/100

です。N は枝豆の総数です。つまり、P は N の関数として

P(N) = exp(-3N/100)

と表されることがわかります。ご質問の N = 50 の場合では、P ~ 0.22 です。5個に1個くらいは、枝豆が入っていないハンバーグがあることになります。

では、P を小さくするには N をどれくらい大きくすればよいでしょう?計算してみると、
P = 0.01 にするには、N ~ 154
P = 0.001 にするには、N ~ 230
ということがわかります。
    • good
    • 0
この回答へのお礼

遅くなり大変申し訳ございません。
ご丁寧なご回答、誠にありがとうございました。

これを機会に、ポアソン分布、2項分布についても調べてみましたが、両者をどういった場合に使い分けたらよいのか、いまいち分かりません。

二項分布の式においてm=npの値(m=n回の試行の間に確率pの事象が起こる回数の平均値)を固定したまま、pを0.1以下に、nを50以上にした場合「ポアソン分布」が成立するらしいのですが、
今回の枝豆の場合はn=50、p=3/100で良いのでしょうか?
(ポアソン分布式をP(r)=m^r/r!*exp^-m とする)

もしお読みになられましたら、ご教示頂けたら幸いです。

お礼日時:2011/01/11 16:23

> 枝豆の入っていないハンバーグの割合を、予測する事はできるのでしょうか


できます。

平均は50*0.03=1.5粒ですよね。
ポアソン分布表から、μ=1.5、x=0を調べると
p=0.223
となります。

参考URL:http://www.sci.kagoshima-u.ac.jp/~ebsa/wakimoto0 …
    • good
    • 0
この回答へのお礼

遅くなり大変申し訳ございません。
ポアソン分布についても調べたら、上記のようになりました。
ありがとうございました。

ただ、ポアソン分布は「極めて小さい確率の場合」とのことなので、
今回のケースが「小さい」と言えるのか疑問はやや残ります。

お礼日時:2011/01/11 16:14

No. 1の方も指摘されていますが、枝豆の個数は正規分布ではありませんね。

ポアソン分布が近いでしょう。

参考URLはWikipediaの説明です。「事象」の欄に書かれている例と比較すると、枝豆の例もこれらと類似していることがお分かりになると思います。

ハンバーグ一つあたりの枝豆の個数の期待値は1.5個ですから、実際にハンバーグを作ってその中にある枝豆の個数の分布を作ると、λ=1 と λ=2 の間のような分布になるのではないでしょうか。

参考URL:http://ja.wikipedia.org/wiki/%E3%83%9D%E3%82%A2% …

この回答への補足

参考URLありがとうございます。
仰るとおり、「ポアソン分布」が近いかと思います。
この場合、「枝豆が入っていないハンバーグ」の推測と、
発生しなくなる方法について求めることはできないでしょうか。

補足日時:2010/12/09 10:24
    • good
    • 0

確認したいのですが, 1 kg のひき肉の中に 50個の枝豆を入れて混ぜたあと 30 g ずつ小分けにした場合, 本当に「枝豆の個数をグラフにすると正規分布になります」か? 実際に試したんでしょうか?


なんとなくですが, 「正規分布である」という前提が既におかしな気がします. 「枝豆が 0.9個入っている」とか「こっちには 1.4個入っている」とかいう状況が想像できないのですが....

この回答への補足

ありがとうございます。
実際、枝豆はもう少し大目の数で実験しましたが、「正規分布っぽい」分布にはなります。
仰るとおり、「離散型の分布」の方が考え方としては合っているのかもしれません。
「離散型の分布」に関しては知見が浅くて申し訳ないのですが、その場合「枝豆の入っていないハンバーグ」の割合を、予測する事はできるのでしょうか?

補足日時:2010/12/09 09:35
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Qデータが正規分布しているか判断するには???

初歩的なことですが。。急いでいます。
おわかりになる方 教えてください。
サンプリングしたデータが正規分布しているかどうかを確認するにはどうすればよろしいでしょうか。
素人でも分かるように説明したいのですが。。
定性的にはヒストグラムを作り視覚的に訴える方法があると思います。今回は定量的に判断する方法を知りたいです。宜しくお願いします。

Aベストアンサー

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区間距離、度数区分数は、正規的なグラフになるように試行錯誤で行うことが多い(区間距離や度数区分数を本来の分布に則するようにいろいろ当てはめて解釈する。データ個数の不足や、データの取り方、または見かけ上の分布によりデータのばらつきが正しく反映されて見えないことがあるため)のですが、度数区分数は、機械的に、
=ROUNDUP(1+LOG10(データ個数)/LOG10(2),0):エクセル計算式
で区分数を求める方法があります。
 また、区間距離は、=ROUND((データの最高値-最低値)/(度数区分数値-1),有効桁数)で求め、区分の左端は、
=ROUNDUP(データの最低値-区間距離/2,有効桁数)
右端は=ROUNDUP(データの最高値+区間距離/2,有効桁数)
とします。
 区間がと度数区分数が出たら、その範囲にあるデータ数を数えて、ヒストグラムができます。
 
>最小側、最大側は 最小値、最大値を含んだ値としなければならないのでしょうか。
 ヒストグラム作成の処理に関しては、上記を参考にしてください。
 その前に、データの最小値と最大値が、正しくとれたデータか検討するため、棄却検定で外れ値が存在するか否かを検定し、外れ値が存在しないと結論づけられたら、正規分布の検定を行ってみてください。もし外れ値が存在する可能性があれば、そもそも、そのデータの信頼性が失われます。サンプリング手法の再検討(データの取り方に偏りがなかったか、無作為に設定してデータを取っていたか等)をして、再度データを得る必要があります。また、そもそも検定する以前に、データ数が少ないと判断が付かなくなってしまいますので、データ数は十分揃える(少なくとも20~30個)必要もあります。

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区...続きを読む


人気Q&Aランキング