
No.4ベストアンサー
- 回答日時:
No.3です。
「お礼」に書かれたことについて。>騒音量などの事象数値は正規分布で発生することが多いので、「90%レンジ」とは騒音数値集団(母集団)の中心から90%の数値の集団を残し、大きい側と小さい側のそれぞれ5%を切り捨てる。
>「90%レンジの上端」とは、大きい側の切り捨てられた切り口に相当する数値(切り捨てられた側の下端)という意味なのでしょうか?
ご承知は思いますが、「正規分布」とは、平均値をピークに、左右にダラ下がりの分布です。標準偏差を「σ」として、
平均値± σ の範囲に、全体のデータの 68.3% が入る
平均値±2σ の範囲に、全体のデータの 95.4% が入る
平均値±3σ の範囲に、全体のデータの 99.7% が入る
という特性があります。
http://www.stat.go.jp/koukou/howto/process/p4_3_ …
質問者さんのおっしゃる「90%レンジ」は、統計でよく言われる「信頼区間90%」ということで
平均値± 1.65σ の範囲に、全体のデータの 90.0% が入る ←これが「信頼区間90%」
平均値± 1.96σ の範囲に、全体のデータの 95.0% が入る
平均値± 2.57σ の範囲に、全体のデータの 99.0% が入る
という意味ですね。(σ側ではなく「全体の○○%」の方を基準にした言い方)
つまり、40個でも80個でも100個でも、サンプルデータを持って来て、その「平均値」と「標準偏差」(またはその二乗の「分散」)から母集団の「正規分布」を推定し、その母集団の「90%信頼区間」(平均値 ± バラツキ)の上側の値(プラス側のバラツキ)を求めるということなのでしょう。
興味があれば、下記の「母平均の区間推定」などの考え方を見てください。
https://blog.apar.jp/data-analysis/4632/
http://www.tamagaki.com/math/Statistics502.html
ありがとうございます。
リンクを見ました。
不勉強なまま返事をして申し訳ありませんでした。
また、分かり易く教えていただき感謝。いたします
No.5
- 回答日時:
No.3です。
読み返してみると、No.3の文章はちょっと不正確ですね。つまり、40個でも80個でも100個でも、サンプルデータを持って来て、その「平均値」と「標準偏差」(またはその二乗の「分散」)から母集団の「正規分布」を推定し、その母集団の「90%信頼区間」(平均値 ± バラツキ)の上側の値(プラス側のバラツキ)を求めるということなのでしょう。
↓ 正確には、下記とすべきでしょう。
つまり、40個でも80個でも100個でも、サンプルデータを持って来て、その「平均値」と「標準偏差」(またはその二乗の「分散」)から、母集団の「平均値」を推定してその母集団の平均値が「90%の信頼度で存在する区間」を求め、その「上側の値」(サンプルデータから推定される、母集団の平均値が90%の信頼度でとり得るだ最大値)を求めるということなのでしょう。
ありがとうございます。
「90%レンジの上端」とは100個のデータだと大きいほうから5個目だぐらいしか理解していませんでした。
難しいものですね。
No.3
- 回答日時:
「90%レンジの上端」の正しい意味、定義が理解できていませんが。
もし「本来の全体のデータ(母集団)の90%の相当する値」(上から10%に相当する値)が知りたいということであれば、得られたサンプルデータから「母集団」を推定し、その「90%値」をとればよいのです。
得られたデータはあくまで「サンプル値」であって、それから「母集団」の特性を「推定」するためのデータですから、データは何個であっても構わないはずです。(さすがに1個、2個ではどうしようもありませんが)
サンプルの大きさは、母集団の推定がどれだけの精度でできるか、ということに影響します。当然、データ数が多いほど精度は高くなります。究極的には「母集団と等しいデータ数」(たとえば「世論調査」で日本国民全員のデータを取る)であれば正確な母集団のデータが得られます。(通常の世論調査では、1000人ぐらいのサンプルで日本全体を推定しています)
ご回答ありがとうございます。「90%レンジの上端」の意味は以下ですか?
騒音量などの事象数値は正規分布で発生することが多いので、「90%レンジ」とは騒音数値集団(母集団)の中心から90%の数値の集団を残し、大きい側と小さい側のそれぞれ5%を切り捨てる。
「90%レンジの上端」とは、大きい側の切り捨てられた切り口に相当する数値(切り捨てられた側の下端)という意味なのでしょうか?
No.2
- 回答日時:
いや、だから、極端な話、まったく安定したデータが40個ある場合と100個ある場合では、計算結果は同じになりますよ。
実際にはサンプルにバラつきがあるためデータに偏りが生じる。
その偏りをどう補正するかと言う話なはずだ。
そしてその偏りはどこで生じるのか不明なのだから、サンプル数の多い方が信頼性がある。
(計算は母数を40にするか100にするかの違いなだけ)
それだけの事。
ありがとうございます。騒音値の信頼性が大きいか小さいかだけなので、騒音値は機械的に計算で求めればよいということでしたか。
確かにいろいろな測定データがあるでしょうから、こういう条件のデータから騒音値を計算したということ明示すれば信頼性が分かりますね。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
高校 数学 aを実数の定数とする...
-
サンプル数の異なる2群間にお...
-
ヒストグラムの分布形状が二山...
-
下の対数表示のグラフから低域...
-
エクセルのグラフから半値幅を...
-
投稿論文を作成にあたり数年前...
-
数学の微分の応用の問題につい...
-
パイロットサンプルって何ですか?
-
対数グラフ用紙に収まらない場...
-
EXCELにてローパスフィルタを作...
-
統計について
-
線形なグラフとはひとくちに言...
-
二項分布B(n,p)の中央値(メデ...
-
グラフの軸の説明
-
検定統計量の値がマイナス
-
対照群vs多群との割合の比較
-
統計 RSD%について教えて下さい。
-
グラフの"eye guide"について
-
対数目盛の読み方を教えてください
-
分布図の各プロットから回帰直...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
EXCELにてローパスフィルタを作...
-
エクセルのグラフから半値幅を...
-
検量線の決定係数について
-
下の対数表示のグラフから低域...
-
最小二乗法を反比例の式を元に...
-
線形なグラフとはひとくちに言...
-
死傷者数と死者数の違いって何...
-
ノンパラメトリック検定の多重...
-
【統計】有意に「高い」?「低...
-
統計について
-
パイロットサンプルって何ですか?
-
エクセルの統計でχ二乗検定の結...
-
検定公差を教えてください!
-
検定統計量の値がマイナス
-
データ点を線で結ぶ場合と結ば...
-
アンケートの集計分析の基礎(...
-
曲面z=log(x^2+y^2)のグラフの...
-
心理機能診断をしたのですが、...
-
理科のグラフで、直線と曲線の...
おすすめ情報
毎秒一個の100個のデータでした。
私が間違っていました。
例えば毎秒1個のデータが100個だと5番目に大きいデータが「90%レンジの上端」。データが40個だと2番目に大きいデータが「90%レンジの上端」。20個だと一番大きい値が「90%レンジ上端」になります。
データが20個の場合の一番大きなデータが「90%レンジの上端」というのはおかしいですから、このため40個が最低のデータ数かなと。。。思ったのです。