人に聞けない痔の悩み、これでスッキリ >>

「平均値と標準偏差から(正規分布する)テストデータの作成」をしようと試みております。数年前に、web上のプログラムで、「平均値」「標準偏差」「データの個数」を入力すると、ランダムに作成されたサンプルデータを返してくれるというのを使っていたのですが、リンクを消失し、半日以上googleなどで検索しましたが、たどり着けません。(正規分布する・しないも選べたような気がします。)

どなたか、ご存じないでしょうか?あるいは、エクセルなどで同様のことができませんでしょうか?NormInvだと、個数が指定できないので困っています。よろしくお願いします。

このQ&Aに関連する最新のQ&A

A 回答 (3件)

標本平均と標本標準偏差を指定したいということですよね。


それならば、Excelでもできます。

標本平均がで標本標準偏差であるテストデータを作成したいとします。
まず、必要な個数の正規乱数を発生させます。
次に、得られた乱数の平均mと標準偏差sを計算します。
最後に、得られた乱数xを次式によりテストデータXに変換します。
X = {(x-m)/s}*S+M
    • good
    • 3
この回答へのお礼

使い慣れたエクセル上でできるのがありがたいです。
なるほど、おっしゃるとおりでできました!
ありがとうございました。
考えればわからないわけでもないのに、思考停止しておりました(恥)。
以前使っていたweb上のappletが簡便すぎたので。

しかし、どこに消えたんでしょうか?
どなたかweb上で一発でできる所をご存知でしたら教えてください。

お礼日時:2009/06/22 20:10

Rを使えばできますよ。



# 平均50、標準偏差5の正規分布から3個のデータを発生
> rnorm(3, mean=50, sd=5)
[1] 60.46173 51.59773 48.30931

# 平均0.5、標準偏差1の正規分布から5個のデータを発生
> rnorm(5, mean=0.5, sd=1)
[1] 2.17056135 0.22419181 0.17922626 1.35423465 -0.04105815

この回答への補足

Rをインストールして試してみました。できました!

補足日時:2009/06/22 20:05
    • good
    • 1
この回答へのお礼

「R」ですね。敬遠してたのですが、ちょっと調べてみるとやはりいろいろできますね。当方、ExcelとStatView位しか使った事がありませんでして(恥)。Rだと関数一個ですむ簡単なことなのですね。どうも、お騒がせしました。RjpWiki でも読んで出直してきます。ありがとうございます。

お礼日時:2009/06/22 19:46

正規乱数ですね。



速さを考えなければ、0~1の一様乱数12個を足して6を引くと
標準正規分布N(0,1)に従う正規乱数ができます。

ほかにもボックス=ミューラー法というのもあるそうですが、
使ったことがないので。

いろいろ読んだ限りでは後者のほうがいいようです。

http://ja.wikipedia.org/wiki/%E4%B9%B1%E6%95%B0% …
    • good
    • 0
この回答へのお礼

「正規乱数」です。そうです。初学者というか、生物系の者なもので、至らない質問でどうもすいません。理論から勉強させていただきます。ありがとうございました。

お礼日時:2009/06/22 19:21

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q相関係数についてくるP値とは何ですか?

相関係数についてくるP値の意味がわかりません。

r=0.90 (P<0.001)

P=0.05で相関がない

という表現は何を意味しているのでしょうか?
またMS Excelを使ってのP値の計算方法を教えてください。

よろしくお願い致します。

Aベストアンサー

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場合はp=0.1%でもいいと思いますが)
相関係数においても相関の有無を結論つけるにはそのrが偶然出る確率を出すか、5%の確率ならrがどれぐらいの値が出るかを知っておく必要が有ります。

>r=0.90 (P<0.001)

相関係数は0.90と計算された。相関がないのに偶然r=0.90 となる確率は0.001以下だと言ってます。

>P=0.05で相関がない

相関がないと結論。(間違っている確率は5%以下)だと言ってます。

エクセルでの計算ですが、まず関数CORRELを使ってr値を出します。xデータがA1からA10に、yデータがB1からB10に入っているとして

r=CORREL(A1:A10,B1:B10)

次にそのr値をt値に変換します。

t=r*(n-2)^0.5/(1-r^2)^0.5

ここでnは組みデータの数です。((x1,y1),(x2,y2),・・・(xn,yn))
最後に関数TDISTで確率に変換します。両側です。

p=TDIST(t値,n-2,2)

もっと簡単な方法があるかも知れませんが、私ならこう計算します。(アドインの分析ツールを使う以外は)

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場...続きを読む

Qパーセンテージの平均の出し方は?

1月:90%
2月:90%
3月:86%

1月~3月までの平均のパーセンテージは?
という時に、(90+90+86)÷3
という計算方法が間違いである理由がどうしてもわからないのですが、わかりやすく教えていただけませんか?

宜しくお願いいたします。

Aベストアンサー

はじめまして。
単純に割合の平均は求めてはいけません。
割合は全体に対するものです。
例えば
1月
本が100冊売れた。 漫画本はその内50冊。
(漫画本の割合は50%ですよね)
2月
本が10冊売れた。 漫画本はその内10冊。
(漫画本の割合は100%ですよね)
3月
本が1000冊売れた。 漫画本はその内0冊。
(漫画本の割合は0%ですよね)

さて、1・2・3月トータルで漫画本の割合は
(50+100+0)/3=50でいいのでしょうか?
本当にトータルで50%も漫画本は売れたでしょうか?
本当は
1110冊売れて、内60冊が漫画本ですから、
60/1110*100=約5.4%になります

ですから、割合を出すときは
とにかく分母は全体です。
(この場合1~3月の全体が分母になります)


似た問題でAからBまで150kmを1時間、
BからCまで150kmは2時間
かかりました。
問題1.AからBの時速は
  2.BからCの時速は
  3.AからCの時速は

ここで3を求めるとき同じ距離だから、
1と2の平均を出す人がいるのですが・・・・
答えは300kmを3時間なので・・・・。
と言うことになり、単純に平均を取ればよいと言う問題ではないのです。

はじめまして。
単純に割合の平均は求めてはいけません。
割合は全体に対するものです。
例えば
1月
本が100冊売れた。 漫画本はその内50冊。
(漫画本の割合は50%ですよね)
2月
本が10冊売れた。 漫画本はその内10冊。
(漫画本の割合は100%ですよね)
3月
本が1000冊売れた。 漫画本はその内0冊。
(漫画本の割合は0%ですよね)

さて、1・2・3月トータルで漫画本の割合は
(50+100+0)/3=50でいいのでしょうか?
本当にトータルで50%も漫画...続きを読む

Q確率と平均値と標準偏差

教えてください。
確率で数値を出した場合に、その確率の値から標準偏差は出せますか?
barを挿入した場合に0%や100%を超える事になったりして、意味のある数値なのか気になりました。

で、標準偏差の値は平均値にそのまま足したり引いたりしたのが範囲となるのですよね?
標準偏差で出た数値の中心を平均値にもってくるのは間違いですよね?(つまり、こうすると標準偏差で出る値の半分が上限、下限となりますが)

Aベストアンサー

他の回答者の方々がおっしゃっているように、標準偏差はデータのばらつきを表すものです。
なんらかの計算をして確率を出しても、数値1個では標準偏差は出せません。
データが複数あって、平均や標準偏差が計算できます。

barはvarの誤りでしょうか。varは一般に分散を表現するキーワードですね。Excelを使っているのでしょうか?
varは(データ - データの平均値)の2乗の和をデータ数で割ったものなので、非常に大きく(データが小数点以下なら小さく)なります。

2乗のデータをそのまま足すことに意味はありません。
長さに面積を足すようなものです。
通常、varのルートを取ったものを平均に足します。
これで同じ次元のデータになります。
これが標準偏差の考え方です。

また、
      平均値±標準偏差(√分散)
はデータの最大値と最小値の範囲を指すものではありません。(通常、範囲といえば最大値と最小値の差になります)
"平均的な存在範囲"とでも表現するのが適切だと思います。

標準偏差で出た数字は範囲ですので
>標準偏差で出た数値の中心を平均値にもってくるのは間違いですよね?
という考えは合っています。
標準偏差という言葉で”平均値+標準偏差”や”平均値ー標準偏差”の値を使っている人やソフトウェアがあると、こういう風に思ってしまうのかもしれません。

(この説明では確率を単に割合として観測されたデータとして解釈しています。確率にはもっと違う意味がありますので、適当に使うと誤解を生みやすい表現になります。)


以上、確率や統計の世界に少しでも興味をもっていただけたらなぁ・・・と期待するharisenbonでした。

他の回答者の方々がおっしゃっているように、標準偏差はデータのばらつきを表すものです。
なんらかの計算をして確率を出しても、数値1個では標準偏差は出せません。
データが複数あって、平均や標準偏差が計算できます。

barはvarの誤りでしょうか。varは一般に分散を表現するキーワードですね。Excelを使っているのでしょうか?
varは(データ - データの平均値)の2乗の和をデータ数で割ったものなので、非常に大きく(データが小数点以下なら小さく)なります。

2乗のデータをそのまま足すことに...続きを読む

Qエクセル STDEVとSTDEVPの違い

エクセルの統計関数で標準偏差を求める時、STDEVとSTDEVPがあります。両者の違いが良くわかりません。
宜しかったら、恐縮ですが、以下の具体例で、『噛み砕いて』教えて下さい。
(例)
セルA1~A13に1~13の数字を入力、平均値=7、STDEVでは3.89444、STDEVPでは3.741657となります。
また、平均値7と各数字の差を取り、それを2乗し、総和を取る(182)、これをデータの個数13で割る(14)、この平方根を取ると3.741657となります。
では、STDEVとSTDEVPの違いは何なのでしょうか?統計のことは疎く、お手数ですが、サルにもわかるようご教授頂きたく、お願い致します。

Aベストアンサー

データが母集団そのものからとったか、標本データかで違います。また母集団そのものだったとしても(例えばクラス全員というような)、その背景にさらならる母集団(例えば学年全体)を想定して比較するような時もありますので、その場合は標本となります。
で標本データの時はSTDEVを使って、母集団の時はSTDEVPをつかうことになります。
公式の違いは分母がn-1(STDEV)かn(STDEVP)かの違いしかありません。まぁ感覚的に理解するなら、分母がn-1になるということはそれだけ結果が大きくなるわけで、つまりそれだけのりしろを多くもって推測に当たるというようなことになります。
AとBの違いがあるかないかという推測をする時、通常は標本同士の検証になるわけですので、偏差を余裕をもってわざとちょっと大きめに見るということで、それだけ確証の度合いを上げるというわけです。

Q標準偏差について詳しい方お願いします

お世話になります。
標準偏差は平均からのばらつき・・とききますが、「標準偏差が大きい」「小さい」という、その目安がわかりません。

たとえば、50人の集団で平均年齢30歳、標準偏差1.2だったらどうでしょうか?

また、平均年齢が同じぐらいでも、標準偏差が1.0と10.0と違う2つの集団についていろんなデータを比べると、何か問題がありますか?

どちらかでもいいので、わかるかたがいましたらおねがいいたします。

Aベストアンサー

とりあえず、「標準偏差」の定義はURLを読んでいただくとして。

標準偏差は「分散」の平方根ですから、その集団の標準偏差が大きい
ということは、その集団のデータのばらつきが大きいということです。

とりあえず、以下の話は母集団が正規分布をするという仮定で行います。

仮に平均年齢が同じ30歳で、標準偏差が1の集団の場合、その集団には
28歳~32歳の人しかいない(95%程度の確率でその中にデータがある)
ということですし、標準偏差が10ならば35歳の人も結構フツーにその
中にいる(同じ確率では10~50歳になります)ということです。

逆に、例えばテストの点などを考えますと、同じ60点でも平均65点、
標準偏差5、の場合と平均70点、標準偏差10の場合では、どれだけ
違うか直接には比較出来ません。これらを「平均50、標準偏差10」
に換算して比較するのが「偏差値」の考え方です。
(上記の場合、どちらも同じ偏差値40になります)

ということで標準偏差は、ばらつきの度合いを平均値と同時にチェック
する時に使う値です。標準偏差の違う集団を直接に比較するかどうかは
その母集団の性質によって違いますよ。

参考URL:http://ja.wikipedia.org/wiki/%E6%A8%99%E6%BA%96%E5%81%8F%E5%B7%AE

とりあえず、「標準偏差」の定義はURLを読んでいただくとして。

標準偏差は「分散」の平方根ですから、その集団の標準偏差が大きい
ということは、その集団のデータのばらつきが大きいということです。

とりあえず、以下の話は母集団が正規分布をするという仮定で行います。

仮に平均年齢が同じ30歳で、標準偏差が1の集団の場合、その集団には
28歳~32歳の人しかいない(95%程度の確率でその中にデータがある)
ということですし、標準偏差が10ならば35歳の人も結構フツーにその
中にいる(同じ確率...続きを読む

Qサンプル数の異なる2群間におけるT検定について

サンプル数の異なる(50,15)2群間の身長の比較を行うのに、T検定をするよう指示を受けました。これは、長男と次男での出産時の身長に差があるかを調べるためですが、長男50人分と次男15人分(母親は異なる)のデータのため、サンプル数が違います。またT検定は私の理解では平均の比較(2群の場合)を行うものであるため、平均ではないこれらにどうしてT検定が良いのか、また統計ソフト(STATISTICAかエクセル)を使う場合にどのようにデータを入力すれば良いのかわかりません。
どなたかご存知の方がいらっしゃればアドバイスをいただけたらうれしいです。
よろしくお願いします。

Aベストアンサー

>平均ではないこれらにどうしてT検定が良いのか
 t検定は、2つの集団の平均値の差について検定する、すなわち、有意差があるかどうかを判定します。平均ではないように見えても、検定の計算式の中に、2群の平均値を用いています。
 ただ、前提時要件があって、2群が正規分布していることが必要です。サンプルを選んだときに、無作為抽出していたり、サンプル数が1000ほどあれば、正規分布を想定できます。

 検定法は、どの方法を選ぶかは、研究者の自由です。わたしがt検定を多用するのは、正規分布を想定でき、計算式が分かりやすく、サンプル数が2群で異なっても良い、その数も少なくて良い(大差があるので、1群3例でも有意差をだしています)、そして有意差が出やすいからです。

 この場合は、正規分布しているという条件を満たしているとはいえないだろうと判断します。その場合は、F検定をしてください。これは、2群の平均値ではなく、バラツキによって検定する方法です。正規分布している必要は無いとされています。
 F検定で有意差があれば、問題ありません。t検定では有、F検定ではなし、になると方針が定まりませんが(現在このデータで悩んでいます)。

>どのようにデータを入力すれば良いのか
 t検定を指示した人は、身近にいないのでしょうか。その人に訊くのが一番です。身近にいないのなら、いないと返答があれば、書き込みますが。 というのも、大学などの研究テーマだと、指導教員をさしおいて、はマズイノデ。もしも、このテーマに興味を持てば、私が実施して先に発表します。こんな研究内容がハッキリ分かる書き込みを4年生がやったら、研究室は追放ですね。
 長男、次男だけではなく、三男、四男となると多重比較という方法になります。この場合、H検定(エクセルだけでは無理でしょう)を使います。

>平均ではないこれらにどうしてT検定が良いのか
 t検定は、2つの集団の平均値の差について検定する、すなわち、有意差があるかどうかを判定します。平均ではないように見えても、検定の計算式の中に、2群の平均値を用いています。
 ただ、前提時要件があって、2群が正規分布していることが必要です。サンプルを選んだときに、無作為抽出していたり、サンプル数が1000ほどあれば、正規分布を想定できます。

 検定法は、どの方法を選ぶかは、研究者の自由です。わたしがt検定を多用するのは、正規分布を想...続きを読む

Q±4σに入る確率について教えてください

ウィキペディアの検索より、
確率変数XがN( μ, σ2)に従う時、平均 μ からのずれがσ以下の範囲にXが含まれる確率は68.26%、2σ以下だと95.44%、さらに3σだと99.74%となる。
と分かりました。

そこで
4σ、


の場合確率はどうなるか教えてください。
よろしくお願い致します。

Aベストアンサー

Excel で NORMDIST を使い、平均 50、標準偏差 10 (いわゆる偏差値)で計算してみましたら、次のようになりました。

 σ 0.682689492137086
2σ 0.954499736103641
3σ 0.997300203936740
4σ 0.999936657516326
5σ 0.999999426696856
6σ 0.999999998026825
7σ 0.999999999997440
8σ 0.999999999999999
9σ 1.000000000000000

Excelの関数の精度がどの程度のものか分かりませんが、9σで100%になりました。

Q2つの正規分布を合成したらどうなるのでしょうか?

現在大学の研究の過程で統計学を学ぶ必要がでてきました。僕自身は統計学に詳しくはないので知識のある方の回答は非常に助かります。
どうかご教授よろしくおねがいします。


平均μ、分散σで表される正規分布はf(x)=1/((√2π)σ) exp-{((x-μ)^2)/2σ^2}で表されますが



例えば互いに独立で

国語の平均点、分散を(μ1,σ1)としての正規分布f(国語)
数学の平均点、分散を(μ2,σ2)としての正規分布f(数学)

とした時の国語と数学の合計得点の分布f(国語+数学)はどのように表せばよいのでしょうか?

もしμ3=μ1+μ2,σ3=σ1+σ2のように平均も分散も和で考えてよいのなら

f(国語+数学)=1/((√2π)σ3) exp-{((x-μ3)^2)/2σ3^2}

が答えだと思っているのですが、それとは別のやり方で



f(国語)=1/((√2π)σ1) exp-{((x-μ1)^2)/2σ1^2}と
f(数学)=1/((√2π)σ2) exp-{((x-μ2)^2)/2σ2^2}をたたみこみ積分すれば答えがでるのではないかと考えています。

しかし、僕の数学の知識ではこれができなくて困っています。ガウス積分の公式を使ったりしなければいけないのではないかとも考えいるのですが行き詰っています。

アドバイスよろしくお願いいたします。

現在大学の研究の過程で統計学を学ぶ必要がでてきました。僕自身は統計学に詳しくはないので知識のある方の回答は非常に助かります。
どうかご教授よろしくおねがいします。


平均μ、分散σで表される正規分布はf(x)=1/((√2π)σ) exp-{((x-μ)^2)/2σ^2}で表されますが



例えば互いに独立で

国語の平均点、分散を(μ1,σ1)としての正規分布f(国語)
数学の平均点、分散を(μ2,σ2)としての正規分布f(数学)

とした時の国語と数学の合計得点の分布f(国語+数学)はどのように表せばよいのでしょうか?

...続きを読む

Aベストアンサー

> 平均μ、分散σで表される正規分布はf(x)=1/((√2π)σ) exp-{((x-μ)^2)/2σ^2}で表されますが
一般的には分散をσ^2と表し、標準偏差はその平方根でσと表します。
質問者さんが示された確率密度関数は、平均 μ、分散 「σ^2 」の正規分布のものです。分散と標準偏差の扱いをもう少しきちんとしましょう。

> μ3=μ1+μ2, σ3=σ1+σ2のように平均も分散も和で考えてよいのなら
2つの確率変数 X, Y があり、それぞれの平均と「分散」がμ1, (σ1)^2, μ2, (σ2)^2 であるとします。確率変数 Z を Z = X + Y で定め、Z の平均と「分散」をμ3, (σ3)^2 とすると・・・

μ3 = μ1 + μ2
は、X, Y がどのような分布であっても(X, Y が異なる分布であっても)成立しますし、X, Y が互いに独立であるか否かに関わらず成立します。
また、X, Y が互いに独立であれば(それらの分布によらず)、
(σ3)^2 = (σ1)^2 + (σ2)^2
が成立します。(このとき Z = X + Y の「標準偏差」σ3 は、σ3 = √( (σ1)^2 + (σ2)^2 ) )

> f(国語+数学)=1/((√2π)σ3) exp-{((x-μ3)^2)/2σ3^2}
> が答えだと思っているのですが
X, Y が互いに独立な確率変数であり、共に正規分布に従うならば、X + Y もまた正規分布に従うという事実は確かにありますが、これは正規分布の「再生性」と呼ばれる特別な性質であることを理解していなければなりません。その点、大丈夫ですか?

> それとは別のやり方で
> f(国語)=1/((√2π)σ1) exp-{((x-μ1)^2)/2σ1^2}と
> f(数学)=1/((√2π)σ2) exp-{((x-μ2)^2)/2σ2^2}をたたみこみ積分すれば答えがでるのではないかと考えています。
上述したように、正規分布の再生性を示す必要があるならば、畳み込み積分でそれを示すのが一法なのであって、何も「別のやり方」ではありません。
案ずるより計算するが易しです。式の整理が面倒なだけで、特別な知識は不要です。
f(x) = 1/((√2π)σ1) exp-{((x-μ1)^2)/2σ1^2}
g(x) = 1/((√2π)σ2) exp-{((x-μ2)^2)/2σ2^2}
h(x) = ∫f(t) g(x - t) dt
  = 1/(2πσ1 σ2) ∫exp{ - (t - μ1)^2 / (2σ1^2) - (x - t - μ2)^2 / (2σ2^2) } dt
  epx( ) の指数部を t で平方完成して
  = 1/(2πσ1 σ2) ∫exp{ - (t - 何ちゃら )^2 / (2σ1^2 σ2^2 / (σ1^2 + σ2^2)) - (x - μ1 - μ2)^2 / 2 (σ1^2 + σ^2) } dt
  = 1/(2πσ1 σ2) exp{ - (x - μ1 - μ2)^2 / 2 (σ1^2 + σ^2) } ∫exp{ - (t - 何ちゃら )^2 / (2σ1^2 σ2^2 / (σ1^2 + σ2^2))} dt
  = 1/√(2π(σ1^2 + σ2^2)) exp{ - (x - μ1 - μ2)^2 / 2 (σ1^2 + σ^2) }
  (∵ ∫ exp ( - (t - A)^2 / 2B^2 ) dt = √(2π) B )
μ3 = μ1 + μ2, σ3^2 = σ1^2 + σ2^2 とおけば
h(x) = 1/(√(2π) σ3) exp( - (x - μ3)^2 / 2 σ3^2 )
途中、「何ちゃら」の部分は省略してますので、興味があれば追っかけてみてください。

なお、本件は確率論において、ごくごく基本的な事項です。
もし、これから確率統計を使って研究をされるのならば、このような件を簡単に質問して済ませるのは危うい感じがします。ちゃんと書籍を読まれ、その上で質問されるのが宜しいでしょう。

> 平均μ、分散σで表される正規分布はf(x)=1/((√2π)σ) exp-{((x-μ)^2)/2σ^2}で表されますが
一般的には分散をσ^2と表し、標準偏差はその平方根でσと表します。
質問者さんが示された確率密度関数は、平均 μ、分散 「σ^2 」の正規分布のものです。分散と標準偏差の扱いをもう少しきちんとしましょう。

> μ3=μ1+μ2, σ3=σ1+σ2のように平均も分散も和で考えてよいのなら
2つの確率変数 X, Y があり、それぞれの平均と「分散」がμ1, (σ1)^2, μ2, (σ2)^2 であるとします。確率変数 Z を Z = X + Y で定め、Z ...続きを読む

Q標準偏差が小さすぎると何が問題?

受験業界には「標準偏差」という言葉があるそうです。

標準偏差は,その値が大きいと成績の分散度が大きく,その逆は逆だそうです。

学校(教員)が見た場合,自校の生徒=受験者の分散度合いは小さいほうがよさそうに思えるのですが(理解が生徒に均一に浸透している証),小さすぎると何が問題として挙げられるのでしょうか?

Aベストアンサー

 どうやら、ANo.4は的を外してるようです。「標準偏差が小さい」というのは学力の分布のことではなくて、専ら試験の性能に関するご質問なのですね?

 平均点が高いということは試験が易しすぎるということ。平均点が低いということは試験が難しすぎるということ。これはま、誰でも分かってる話です。

 さて、標準偏差がやたら小さい試験は、易しすぎる問題と難しすぎる問題だけでできている(問1.1+1=? 問2.フェルマーの最終定理を証明せよ)に違いありません。実力の違いを測っていない試験だということであり、標準偏差が小さいのは適切な試験ではない。
 じゃあ、標準偏差が大きければいいのか。問題数が少なくて、しかも運に頼るしかないような試験(問1.コインをトスして表か裏かを選べ。どっちかが正解である。)であっても、標準偏差が大きくなります。たとえば、運に頼るしかない2択問題を10個並べれば、成績は平均が50点、標準偏差が15点ぐらいの正規分布になります(大数の法則)。
 なので、成績の分布が綺麗だからと言って、それだけじゃ試験が妥当な(実力を測っている)ものだとは言えない。

 結果を使って受験者を分別する側からすれば、リクツの上では、得点の分布が一様分布になるのが理想的(最も分解能が高い)と言えましょう。さらに得点が学力を反映していることが望ましい。
 すると、各受験者の「学力」が1個の数値xで代表できるようなものであると仮定すれば(データを見ると、この仮定は残念ながらかなり真実に近いのですが)、xの分布を一様分布に写像するような試験が理想的ということです。そういう試験は
(1) 運で答を当てるということは滅多にできず(選択式の問題でこれを実現するには、同じレベルの問題をいくつも並べておけば良いのです)、
(2) 問題数はとても多く、
(3) ごく易しい問題からかなり難しい問題まで揃っていて、
(4) うんと難しい問題や、うんと易しい問題に比べ、中間の難しさの問題の個数が多い。
(5) 試験時間は十分に余裕があって、早く解けるかどうかは成績にあまり関係ない。
という特徴を持つでしょう。

 どうやら、ANo.4は的を外してるようです。「標準偏差が小さい」というのは学力の分布のことではなくて、専ら試験の性能に関するご質問なのですね?

 平均点が高いということは試験が易しすぎるということ。平均点が低いということは試験が難しすぎるということ。これはま、誰でも分かってる話です。

 さて、標準偏差がやたら小さい試験は、易しすぎる問題と難しすぎる問題だけでできている(問1.1+1=? 問2.フェルマーの最終定理を証明せよ)に違いありません。実力の違いを測っていない試験だという...続きを読む

Qエクセル指定した範囲からランダムで一つ抽出

エクセルの関数についての質問なのですが、

B1~B5に値がならんでいたとして、B1~B5の中からランダムに一つ抽出したものをA3に表示する関数はありますか?

Aベストアンサー

A3に次の式を入力すればよいでしょう。

=INDEX(B1:B5,RANDBETWEEN(1,5))


人気Q&Aランキング