アプリ版:「スタンプのみでお礼する」機能のリリースについて

よろしくおねがいします。

例えば、1~50までの数値が測定できるが、記録時に30より大きな値は30として記録され、結果的に1~30の範囲でデータが取れているため、30の値が非常に多くなる、上側に大きく偏ったデータが記録されているとします。

この場合に、25以下の値が発生する確率を求める場合、どのような分布型を仮定すればよいのでしょうか?
適切な検索ワードを設定できなかったのか、Google・教えてGoo内でも類似の内容を見つけることができませんでした。

分かりづらい説明かとは思いますが、ご教授のほどよろしくお願いいたします。

A 回答 (2件)

企業でSQCを推進する立場の者です。

博士(工学)です。

ご質問のようなデータを不完全データと呼び、特別な統計学が確立しています。

①色の明度1~256があり、それより明るい場合でも256になります。溶接強度も同じです。溶接強度が母材より上回るときは、母材で破壊しますので、上限は母材強度です。このようなデータを「トランケートされたデータ(切断されたデータ)」といいます。分布形は元が正規分布なら正規分布です。岩崎学先生の「不完全データの統計解析」という本をお薦めします。

②原子炉の炉壁にはピッティング・コローション(孔食)という腐食が生じます。各区域の最大腐食深さは、といったとき、最大値より小さなデータは記録されません。この最大腐食深さの取る分布は「極値分布」といいます。ガンベル分布、フレシェ分布などがあります。ガンベル著の「極値統計学」という本が名著ですが絶版です。その他はあまりありません。

③20台の製品で寿命試験をやっていて、途中、別原因で試験継続できなかったりして試験打ち切りが発生します。これは「打ち切りのあるデータ」として解析します。このときの分布は「ワイブル分布」です。ワイブル分布は信頼性工学の本に出ています。

ご質問のケースは①ではないかと思われます。分布形は元の分布と同じ形で良いです。ただし切断されていますので、トランケートされたデータの解析を行わなければなりません。
    • good
    • 0

実際に観測して確率を求めるということですか?



だったら、「25以下の度数」と「25超の度数」を観測して確率を求めればよいので、分布型は関係ないですよね?
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!