Excelで正規分布に従う乱数を発生させたいと考えています。
例えば,生成したサンプルが、平均が100,標準偏差が10の正規分布に従うように大きさ1000のサンプルデータをExcelで生成したいと考えています。そこで、
数式 100+10*NORMINV(RAND(),0,1) として1000個のセルに乱数を発生させサンプルを得たところ、平均は100程度と期待した値になったのですが、分散が10.13,標準偏差が 3.18 程になりました。
なぜ、生成された1000個のデータの標準偏差は10に近い値をとらないのでしょうか?
No.3ベストアンサー
- 回答日時:
1000個ならそれなりに10に近い標準偏差が得られるはずです。
数式に間違いがないか確認してください。
(9.5~10.5位の値が得られるはずです)
そんなことはないとは思いますが、例えば、その分散は
STDEV.S, STEDEV.PSTDEV, STDEVP, STDEVA, STDEVPA, DSTDEV, DSTDEVP
のどれかで求めたもので、標準偏差はそのルートをとったものではないでしょうね?
回答ありがとうございます!
>その【分散】はSTDEV.S, STEDEV.PSTDEV, STDEVP, STDEVA, STDEVPA, DSTDEV, DSTDEVPのどれかで求めたもので、標準偏差はそのルートをとったものではないでしょうね?
すみません!まさにその通りでした。分散の計算を誤ってSTEDEVで行っていました。感謝に尽きます。
No.6
- 回答日時:
#5です。
まだ閉じられていなくて良かったです。お詫びです。
線形変換の場合は歪みません。100まわりにいるデータを、0を基準に拡大しても何ら問題ありません。
私の勘違いでした。
そんなこと言ったら、100+10*(標準正規乱数)の変換が成立しませんよね。とんだ間違いをしていました。お恥ずかしい。
回答ありがとうございます。
線形変換では分布の正規性(正規分布かどうか)が変わらないこと、承知いたしました。
正規分布曲線の定義式f(x)=k*Exp(g(x)) ←大雑把な表記ですみません
のxに線形変換ax+bを代入しても、その関数が正規分布曲線の関数の形のままだからではないか、これが証明? と考えています。もっと本質的な証明があるような気がして、何だか不安です。
No.5
- 回答日時:
#1です。
あと、データを歪ませるのは、100まわりにいるデータを、0を基準に拡大するせいです。
0まわりにいる標準正規分布のデータを、0を基準に拡大するときは歪みません。
ソルバーのせいではありません。あしからず。
No.1
- 回答日時:
それは生成数が少ないからです。
F9ボタン(再計算)を押すたびに値が変わると思います。
10万個くらい生成しないと、毎回狙い通りの値が出ないと思います。
高々1000個で狙い通りの分散を持つデータを作りたい場合は、エクセルのソルバー機能を使います。
① まず、RAND()の数式の入っているセルの値を、別の場所に「値」でコピーします。それをB列とします。(RAND()の式を含んでいるとソルバーが動くたびに値が変わり、うまく収束しないため)
② 空いているセルに1を入力します。これをD1とします。
③ 空いている列にB列*$D$1 の計算結果を入れます。これをC列とします。
④ 別の空いているセルにC列の分散var.p(C1:C1000)の計算結果を入れます。これをD2とします。
⑤ ソルバーを起動し、D2を目的セル、値を10に指定し、変更セルをD1としてソルバーの解決ボタンを押します。これで分散が10に調整されます。
⑥ 最後に平均(バイアス)を調整します。
これで小数点以下5桁までの精度が得られます。
この注意点は、尖りの値が若干劣化する点です。
回答ありがとうございます!
No3 qas2021様の回答で本QAは私の初歩的な誤りによるものであることがわかりましたが、 kamiyasiro 様の回答にも感謝いたします。
教えていただいたことを実践してみました。
「ソルバー機能」に目からウロコです (鱗□鱗)!!
こんな便利な機能があるとは、エクセルすごいです!
また、ソルバー機能はデータに歪みを与えてしまうなど、注意して使わなければならないことも肝に銘じようと思います。
たびたびお付き合いいただき、ありがとうございます。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 信頼区間についての質問です。 6 2023/06/25 17:34
- 数学 以下の数学の問題を教えてください。 確率変数Xは標準正規分布N(0、1)に確率変数Yは平均3のポアソ 3 2022/12/02 19:13
- 統計学 ある会社の製品全体の質量mを推定したい。その製品をn個無作為に選んで測ったところn個の平均はm0であ 3 2022/07/29 12:18
- 統計学 【Excel統計】任意の確率におけるσの係数を求める方法? 3 2023/06/15 19:28
- 大学・短大 大学 統計学 1 2022/09/14 11:27
- 統計学 統計学の問題です。よろしくお願いします。 ある部品の重量は正規分布に従うとされており,過去の経験から 1 2023/01/19 03:36
- 数学 【大至急】数学のレポートの問題ですが、どうしても分からなくて書けません。数学ができる方がいらっしゃい 4 2022/07/24 01:16
- 統計学 以下の問題の解き方が分からないので式と使用した数字の求め方を教えてください 全国の中小企業の取締役か 8 2023/01/13 17:13
- 統計学 確率統計の問題です。 4 2022/07/26 23:37
- 統計学 風速を1秒刻みで推定する方法 6 2023/03/03 11:58
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
EXCELにてローパスフィルタを作...
-
曲面z=log(x^2+y^2)のグラフの...
-
サンプル数の異なる2群間にお...
-
下の対数表示のグラフから低域...
-
検量線の決定係数について
-
統計学の問題です。 どなたか分...
-
心理学の統計について
-
エクセルのグラフから半値幅を...
-
エクセルの統計でχ二乗検定の結...
-
標準偏差と標準誤差について 標...
-
心理機能診断をしたのですが、...
-
データが正規分布しているか判...
-
統計学の問題です。 ある番組の...
-
IQ100が平均らしいんですが、こ...
-
【統計】有意に「高い」?「低...
-
対応のあるt検定の結果の書き方
-
統計について
-
t検定と因子分析
-
母分散の求め方について教えて...
-
デジタル信号がカクカクになる...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
EXCELにてローパスフィルタを作...
-
サンプル数の異なる2群間にお...
-
下の対数表示のグラフから低域...
-
エクセルのグラフから半値幅を...
-
検量線の決定係数について
-
心理機能診断をしたのですが、...
-
統計について
-
エクセルの統計でχ二乗検定の結...
-
心理学の統計について
-
ノンパラメトリック検定の多重...
-
アスピリンの加水分解のPHプロ...
-
自由度(1,m)のF値は自由度mのt...
-
死傷者数と死者数の違いって何...
-
検定統計量の値がマイナス
-
極値をもつ時と持たない時、単...
-
最小二乗法を反比例の式を元に...
-
パイロットサンプルって何ですか?
-
【統計】有意に「高い」?「低...
-
対応のあるt検定の結果の書き方
-
片対数グラフで…
おすすめ情報