プロが教えるわが家の防犯対策術!

騒音値の「90%レンジの上端」では毎秒100個のデータだと5番目に大きい騒音値がその時間帯の騒音値になると思います。40個のデータだと2番目になると思います。40個以下のデータだと騒音値は計算できないことになりますが、正しいのでしょうか?

質問者からの補足コメント

  • 毎秒一個の100個のデータでした。
    私が間違っていました。
    例えば毎秒1個のデータが100個だと5番目に大きいデータが「90%レンジの上端」。データが40個だと2番目に大きいデータが「90%レンジの上端」。20個だと一番大きい値が「90%レンジ上端」になります。
    データが20個の場合の一番大きなデータが「90%レンジの上端」というのはおかしいですから、このため40個が最低のデータ数かなと。。。思ったのです。

      補足日時:2016/06/19 15:40

A 回答 (6件)

毎秒の最大サンプル数が100


ってことですか?
で、0.4秒で計算できるかどうかということでしょうか。

サンプル数が40の時の計算をすればよいだけ。
サンプル数に縛られることなく、手元のサンプル数を基に計算すればよい。
ただし、得られた結果の信頼性はサンプル数100に比べるとサンプル数40の場合は低い。
こんな評価になるだけです。
    • good
    • 0
この回答へのお礼

ありがとうございます。文章がおかしかったので補足で訂正しました。

お礼日時:2016/06/19 16:51

いや、だから、極端な話、まったく安定したデータが40個ある場合と100個ある場合では、計算結果は同じになりますよ。


実際にはサンプルにバラつきがあるためデータに偏りが生じる。
その偏りをどう補正するかと言う話なはずだ。
そしてその偏りはどこで生じるのか不明なのだから、サンプル数の多い方が信頼性がある。
(計算は母数を40にするか100にするかの違いなだけ)
それだけの事。
    • good
    • 0
この回答へのお礼

ありがとうございます。騒音値の信頼性が大きいか小さいかだけなので、騒音値は機械的に計算で求めればよいということでしたか。
確かにいろいろな測定データがあるでしょうから、こういう条件のデータから騒音値を計算したということ明示すれば信頼性が分かりますね。

お礼日時:2016/06/19 16:51

「90%レンジの上端」の正しい意味、定義が理解できていませんが。



もし「本来の全体のデータ(母集団)の90%の相当する値」(上から10%に相当する値)が知りたいということであれば、得られたサンプルデータから「母集団」を推定し、その「90%値」をとればよいのです。
得られたデータはあくまで「サンプル値」であって、それから「母集団」の特性を「推定」するためのデータですから、データは何個であっても構わないはずです。(さすがに1個、2個ではどうしようもありませんが)

サンプルの大きさは、母集団の推定がどれだけの精度でできるか、ということに影響します。当然、データ数が多いほど精度は高くなります。究極的には「母集団と等しいデータ数」(たとえば「世論調査」で日本国民全員のデータを取る)であれば正確な母集団のデータが得られます。(通常の世論調査では、1000人ぐらいのサンプルで日本全体を推定しています)
    • good
    • 0
この回答へのお礼

ご回答ありがとうございます。「90%レンジの上端」の意味は以下ですか?
騒音量などの事象数値は正規分布で発生することが多いので、「90%レンジ」とは騒音数値集団(母集団)の中心から90%の数値の集団を残し、大きい側と小さい側のそれぞれ5%を切り捨てる。
「90%レンジの上端」とは、大きい側の切り捨てられた切り口に相当する数値(切り捨てられた側の下端)という意味なのでしょうか?

お礼日時:2016/06/21 07:44

No.3です。

「お礼」に書かれたことについて。

>騒音量などの事象数値は正規分布で発生することが多いので、「90%レンジ」とは騒音数値集団(母集団)の中心から90%の数値の集団を残し、大きい側と小さい側のそれぞれ5%を切り捨てる。
>「90%レンジの上端」とは、大きい側の切り捨てられた切り口に相当する数値(切り捨てられた側の下端)という意味なのでしょうか?

 ご承知は思いますが、「正規分布」とは、平均値をピークに、左右にダラ下がりの分布です。標準偏差を「σ」として、
  平均値± σ の範囲に、全体のデータの 68.3% が入る
  平均値±2σ の範囲に、全体のデータの 95.4% が入る
  平均値±3σ の範囲に、全体のデータの 99.7% が入る
という特性があります。
http://www.stat.go.jp/koukou/howto/process/p4_3_ …

 質問者さんのおっしゃる「90%レンジ」は、統計でよく言われる「信頼区間90%」ということで
  平均値± 1.65σ の範囲に、全体のデータの 90.0% が入る ←これが「信頼区間90%」
  平均値± 1.96σ の範囲に、全体のデータの 95.0% が入る
  平均値± 2.57σ の範囲に、全体のデータの 99.0% が入る
という意味ですね。(σ側ではなく「全体の○○%」の方を基準にした言い方)

 つまり、40個でも80個でも100個でも、サンプルデータを持って来て、その「平均値」と「標準偏差」(またはその二乗の「分散」)から母集団の「正規分布」を推定し、その母集団の「90%信頼区間」(平均値 ± バラツキ)の上側の値(プラス側のバラツキ)を求めるということなのでしょう。

 興味があれば、下記の「母平均の区間推定」などの考え方を見てください。
https://blog.apar.jp/data-analysis/4632/
http://www.tamagaki.com/math/Statistics502.html
    • good
    • 0
この回答へのお礼

ありがとうございます。
リンクを見ました。
不勉強なまま返事をして申し訳ありませんでした。
また、分かり易く教えていただき感謝。いたします

お礼日時:2016/06/21 17:00

No.3です。

読み返してみると、No.3の文章はちょっと不正確ですね。

 つまり、40個でも80個でも100個でも、サンプルデータを持って来て、その「平均値」と「標準偏差」(またはその二乗の「分散」)から母集団の「正規分布」を推定し、その母集団の「90%信頼区間」(平均値 ± バラツキ)の上側の値(プラス側のバラツキ)を求めるということなのでしょう。

 ↓ 正確には、下記とすべきでしょう。

 つまり、40個でも80個でも100個でも、サンプルデータを持って来て、その「平均値」と「標準偏差」(またはその二乗の「分散」)から、母集団の「平均値」を推定してその母集団の平均値が「90%の信頼度で存在する区間」を求め、その「上側の値」(サンプルデータから推定される、母集団の平均値が90%の信頼度でとり得るだ最大値)を求めるということなのでしょう。
    • good
    • 0
この回答へのお礼

ありがとうございます。
「90%レンジの上端」とは100個のデータだと大きいほうから5個目だぐらいしか理解していませんでした。
難しいものですね。

お礼日時:2016/06/21 17:02

No.5です。

すみません、訂正するのは「No.3」ではなく「No.4」ですね。二重のミスでした。
    • good
    • 0
この回答へのお礼

ありがとうございます。

お礼日時:2016/06/21 17:04

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!