個人事業主の方必見!確定申告のお悩み解決

次の言葉は、通常、概ね次のように定義されていると思います。

(1)標本:統計において、母集団から抜き出した要素の集合。例えば、日本の全家庭の預金高という母集団から無作為に抜き出した100家庭の預金高。
(2)標本空間:標本点全体の集合。例えば、1個のさいころを1回投げたときに出る目の数の集合{1, 2, 3, 4, 5, 6}。
(3)標本点:試行の結果生じ得る1つひとつの現象。例えば、1個のさいころを1回投げたときに出る目の数。{1}、{6}など。

これに関連して次のQ1、Q2についてお教えいただけないでしょうか。

Q1:「標本」は母集団からの抽出の話であり、「標本点」は試行の話です。「標本」と「標本点」とは、たった1文字違うだけなのに、なぜこのように定義内容が大きく異なるのでしょうか。

Q2:「標本」は抽出したもの(つまり、一部分)の話であるのに、「標本空間」は試行の結果の全体(つまり、全体)の話です。。「標本」と「標本空間」とは、たった2文字違うだけなのに、なぜこのように定義内容が大きく異なるのでしょうか。

そもそもの疑問は、「標本点」と「標本」は1文字違うだけなので、「標本点」の定義は「標本」という言葉を用いて定義できるのではないかと思ったことにあります。例えば、「預金高」と「預金」は1文字違うだけなので、「預金高」は「預金の金額」のように「預金」という言葉を用いて定義できるようにです。

これらは全く異なる概念だと言われれば観念して覚えますが、何か腑に落ちないのです。

このQ&Aに関連する最新のQ&A

A 回答 (1件)

確率論と統計学での用語の使い方の問題だと思いますが、いずれにせよ、もともと確率論で使われていた用語を統計用に特殊に解釈したために紛らわしくなっているだけだと思います。



まず「標本空間」ありきだと思ってください。直感的には今考えている確率モデルのすべての事象を集めた空間です。ですが、現代数学流の解釈では単なる確率空間(あるいは測度つき可測空間)を指します。要するに集合であれば何でもよいという感じです。サイコロを一回投げるモデルなら、普通は{{1},…,{6}}からなる6元モデルを考えますが、これ以外にも{9}とかあり得ない元を加えても別に問題ありません。P({9})=0とすればいいだけですからね(9の目が出る確率は0!)

そして確率論ではこの標本空間の元を「標本」とか「標本点」とか「見本」とか英語では「sample」や「sample point」と呼びます。強調しておきますが、これらは“すべて同じものを指しています”。

いろいろ述べるべきこともあるのですが、Q1,Q2に対する答えを簡潔に述べるならば、Q1には「定義内容は実はまったく一緒」、Q2には「標本の集まりを標本空間と呼んでいるだけ(数学でいう空間という用語はその全体を表す意味に用いる;たとえばベクトルの全体をベクトル空間と呼び、ベクトル空間のひとつの元をベクトルと呼ぶ、など)」ということです。

あなたが例で挙げられていることを確率論に基づいてきちんと解釈すると次のようになります。
(1)標本:統計において、母集団から抜き出した要素の集合。例えば、日本の全家庭の預金高という母集団から無作為に抜き出した100家庭の預金高。
→たとえば日本の家庭が5000万世帯であるとして、各家庭の預金高をa_n(n=1~50,000,000)とするとき、この中からランダムに(意味は一様分布に従ってという意味)100個の元を取り、それをX=(a_{n_1},…,a_{n_100})とする。より正確にはn_1,~,n_{100}を1~5000万の異なる数字として、それが実現する確率を1/{50,000,000C100}で与えたものです。これは百元からなる確率ベクトルと解釈されます。すなわち標本空間は1~5000万の異なる数字100個を取ってそれをn_1,~,n_{100}としたときの、X=(a_{n_1},…,a_{n_100})と書かれるもの全体、そしてその中の元がいわゆる無作為標本に当たるXなわけです。「標本空間」と「母集団」はまったく別の意味で使われていることに注意してください。

標本点、標本空間の解釈はあたなのおっしゃる例でばっちりです。一回の試行というとき、100個の無作為標本を選ぶという行為も「5000万個の中から百個無作為に選ぶ」という一つの試行の結果と思うとまさに「標本点」と思える、というわけですね。

この回答への補足

早速に、有り難うございます。

>もともと確率論で使われていた用語を統計用に特殊に解釈したために紛らわしくなっているだけだと思います。

そういうことなんですか。普通なら素人が決して窺い知ることのできない内容を御教示いただきました。天の声にも似た響きにただただ感激しております。

それ以下の御教示、私にとっては目から鱗、青天の霹靂、宇宙の崩壊、只ただ絶句のことばかりです。

でも、たいへんによく分かりました。御礼の申し上げようもありません。有り難うございます。

ところで、あと1つだけお聞きしてよいでしょうか。

標本と標本点ですが、これらは同じものなのでしょうか。というのは、「共立数学公式改訂増補(共立出版1969)」p418には、「試行の結果現れる個々の事象を標本点という」旨の定義があります。つまり、標本点は「個々の事象」とあります。
一方、「チャート式数学C(数研出版)」p.165に「母集団から抜き出された要素の集合を標本という」とあります。つまり、標本は「集合」とあります。

これらを見ると、標本と標本点は異なるように思えるのですが、どうなのでしょうか。

よろしくお願いいたします。

補足日時:2006/08/12 19:36
    • good
    • 0
この回答へのお礼

補足させていただきます。

「補足」に述べた質問の要点は、「共立数学公式改訂増補」には標本点は「個々の事象」とあるので、これは「標本点は1個の数値である」と言っているように思え、一方、「チャート式数学C」には「集合を標本という」とあるので、これは「標本は複数の数値である」と行っているように思え、1個と複数とが矛盾していると感じられることです。

よろしくお願いします。

お礼日時:2006/08/13 15:30

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q「標本」と「標本点」の意味

「標本」と「標本点」という言葉の意味が分かりません。

(1)一般に「標本」と「標本点」は同じ意味だと思うのですが、これは正しいでしょうか。

(2)「共立数学公式改訂増補(共立出版1969)」p418には、要旨、「試行により現れる個々の結果を標本点または要素事象という」旨の定義があります。
一方、「チャート式数学C(数研出版)」p.165には、「本来調べたい対象全体の集まりを母集団、調査のために母集団から抜き出された要素の集合を標本という」とあります。

「共立数学公式改訂増補」には標本点は「個々の結果」とあるので、これは「標本点は1個の数値である」と言っているように思えます。一方、「チャート式数学C」には「集合を標本という」とあるので、これは「標本は複数の数値である」と行っているように思えます。すると、一方では1個であるとされ、他の一方では複数であるとされ、矛盾していると感じられるのですが、これはどう考えたらよいのでしょうか。同じ「標本」あるいは「標本点」という言葉が、場面によって異なる意味で用いられるということでしょうか。

よろしくお願いします。

「標本」と「標本点」という言葉の意味が分かりません。

(1)一般に「標本」と「標本点」は同じ意味だと思うのですが、これは正しいでしょうか。

(2)「共立数学公式改訂増補(共立出版1969)」p418には、要旨、「試行により現れる個々の結果を標本点または要素事象という」旨の定義があります。
一方、「チャート式数学C(数研出版)」p.165には、「本来調べたい対象全体の集まりを母集団、調査のために母集団から抜き出された要素の集合を標本という」とあります。

「共立数学公式改訂増補」には標本点...続きを読む

Aベストアンサー

♯3です。

おそらく母集団に相当する確率論の用語はありません。母集団というのは統計独特の用語だと思います。前回の日本の家庭の預金高のモデルを例に再度簡単に説明をします。

簡単のため、日本には5家庭しかないとしましょう。それをたとえば{A,B,C,D,E}とすることもできますが、今の場合は預金高しか気にしていないのだから、たとえば{100万,1億,50万,200万,500万}としたほうがわかりやすいかも知れません。この場合、母集団={100万,1億,50万,200万,500万}です。ここから無作為に抜き出した2家庭の預金高を考える確率モデルを考えます。このとき、標本空間は{(100万,1億),(100万,50万),(100万,200万),(100万,500万),(1億,50万),(1億,200万),(1億,500万),(50万,200万),(50万,500万),(200万,500万)}の10個の2家庭の預金高の組と考えるのが妥当です。またもし1家庭の預金高を調べるというより単純なモデルであるなら、標本空間は母集団そのものと考えてもよいわけです。標本空間は考える確率モデルを変えると別のものになります。いずれにせよ今考えている確率モデルで、起こりうるすべての結果を集めたものが標本空間と考えていて問題ないと思います。

いくつか値の決まっているデータがあって、そこから抽出を行うという行為は確率モデルにはなりますが、データそのものを何の工作もしないのであれば、それはなんらランダムネスはないわけで、したがって確率論では母集団そのものには何の興味もないんですね。(少し余談ですが、母集団の平均(母平均)とか母集団の分散(母分散)とかを統計では気にしたりしますが、これらは確率変数の期待値や分散とはまったく異なるものです。ところが母集団から何かサンプルを一つ抽出するというランダムな操作をしたときの得られる値(それはランダムなのだから確率変数である)の期待値や分散というのはいわゆる確率論の期待値、分散そのものなのです。そして抽出が無作為である(一様分布に従って抽出する)とき、それらが母平均、母分散に一致するんですね。ややこしければここに書いたことは無視してください)

(強引に意味づけするとしたら、上にも書きましたが、母集団とはただひとつだけを無作為抽出する確率モデルの標本空間のこと、と解釈してもよいかも知れません。)

♯3です。

おそらく母集団に相当する確率論の用語はありません。母集団というのは統計独特の用語だと思います。前回の日本の家庭の預金高のモデルを例に再度簡単に説明をします。

簡単のため、日本には5家庭しかないとしましょう。それをたとえば{A,B,C,D,E}とすることもできますが、今の場合は預金高しか気にしていないのだから、たとえば{100万,1億,50万,200万,500万}としたほうがわかりやすいかも知れません。この場合、母集団={100万,1億,50万,200万,500万}です。ここから無作為に抜き出した2家庭の預金...続きを読む

Q確率変数とは

確率変数P{X=x}のXとxの違いがよく分かりません。というか確率変数の概念自体がよく分かりません。またなぜP{X=x}=P(x)なのかもわかりません。助けてください。

Aベストアンサー

まず、Xとxが紛らわしいですね。
P{X=x}=P(x)
を、
P{A=t}=f(t)
のように置き換えても、同じ意味ですので、こう置き換えて説明してみます。
確率変数というのは、最初に決めた、現象の集合と、実数との対応です。サイコロの例がよく出されますが、逆にわかりにくくしている面もあります。各面に、{a,b,c,d,e,f}という文字が書かれたサイコロを想像してみてください。さて、このサイコロで、{a,b,c}の文字が出る確率を知りたいとしますね。ところが、数学は「数」を扱う世界なので、文字は直接は扱えません。そこで、現象と数の対応を確率変数とします。この場合、確率変数Aを、
サイコロを振ってaが出たら、A=1
サイコロを振ってbが出たら、A=2
サイコロを振ってcが出たら、A=3
サイコロを振ってdが出たら、A=4
サイコロを振ってeが出たら、A=5
サイコロを振ってfが出たら、A=6
となる変数であると決めてしまいます。これで、現象->数への変換が出来ました。確率変数は、このように、本来数学では扱えない「現象の集合」を、数の集合に変換するのに使うのです。
P{A=t}のtは、正確に書くと、t∈実数です。つまり、実数を適当に一つ持ってきたのが、tです。
P{A=t}=f(t)は、現象の集合を確率変数Aで数に置き換えてやった時の値がtである確率が、f(t)という値と同じだよ。という意味です。

まず、Xとxが紛らわしいですね。
P{X=x}=P(x)
を、
P{A=t}=f(t)
のように置き換えても、同じ意味ですので、こう置き換えて説明してみます。
確率変数というのは、最初に決めた、現象の集合と、実数との対応です。サイコロの例がよく出されますが、逆にわかりにくくしている面もあります。各面に、{a,b,c,d,e,f}という文字が書かれたサイコロを想像してみてください。さて、このサイコロで、{a,b,c}の文字が出る確率を知りたいとしますね。ところが、数学は「数」を扱う世界なので、文字は直接は扱えません。...続きを読む

Qe^-2xの積分

e^-2xの積分はどうしたらよいのでしょうか…。e^xやe^2xsinxなどはのってるのですがこれが見つかりません。お願いします。

Aベストアンサー

いささか、思い違いのようです。

e^-2x は、 t=-2x と置いて置換してもよいけれど、牛刀の感がします。

e^-2x を微分すると、(-2)*( e^-2x )となるので、

e^-2x の積分は、(-1/2)*( e^-2x )と判明します。

Q期待値と平均

確率で期待値を学習しました。
平均のことを期待値と言うんですよね?

どちらも同じ意味なのに、なぜ使い分けるのですか?
どのようにして使い分けるのですか?

解答をよろしくお願いいたします。

Aベストアンサー

「期待値」と言えば、意味は明確ですが。
「平均」には、No.1 さんが書いているように、いろいろな種類があり、
期待値だけが平均ではないんですよ。
正確には「○○平均」と書かねばならないところを、文脈上通じそうなら、
略してただ「平均」と書いてしまうだけ。うるさく言えば、曖昧です。
期待値とは、正確には「確率による加重(算術)平均」のことですね。

No.4 さんの例
> 確率1/3で10になり
> 確率2/3で20になる
の「平均」も、確率の話で平均と言や期待値のつもりだろ!という意味では
(1/3)10+(2/3)20 でしょうが、実は、単純平均 (10+20)/2 のつもりだった
というオチが隠れていないとは言いきれないのです。(天邪鬼ですが。)

数学用語は正確に使ったほうがいい。「期待値」がオススメです。

Qeのマイナス無限大乗

lim(t→∞) 1-e^(-t/T)
T:定数

というのがあって、極限値が1になることは手計算で分かったのですが、
数学的に1になる理由が分かりません。

e^(-∞)=0になる理由を数学的に教えてください。

Aベストアンサー

e^(-n) = (1/e)^n
であり、
0<|1/e|<1
だから

Q金属、半導体の抵抗の温度変化について

金属は温度が高くなると抵抗が大きくなり、半導体は温度が高くなると抵抗が小さくなるということで、理論的にどうしてそうなるのでしょうか。
金属については、温度が上がると粒子が熱振動し自由電子が流れにくくなるというようなことを聞いたことがありますがあっていますか?
半導体についてはまったく理由がわからないので詳しく教えて頂くとありがたいです。
あと自分で調べていたところ「バンド理論」というのを目にしました。
関係があるようでしたらこれも教えて頂くとありがたいです。

Aベストアンサー

こんにちは。

>>>金属については、温度が上がると粒子が熱振動し自由電子が流れにくくなるというようなことを聞いたことがありますがあっていますか?

だいたい合っています。
金属については、温度が上がると正イオン(自由電子が引っこ抜かれた残りの原子)の振動が激しくなるので、自由電子が正イオンに散乱されます(進路を乱されます)。
それをマクロで見たとき、電気抵抗の上昇という形で現れます。

>>>半導体についてはまったく理由がわからないので詳しく教えて頂くとありがたいです。

半導体の中において金属の自由電子に相当するものは、電子とホールです。この2つは電流を担う粒子ですので、「キャリア」(運ぶ人)と言います。
ホールは、半導体物理学においてプラスの電子のように扱われますが、その実体は、電子が欠けた場所のことを表す「穴」のことであって、おとぎ話の登場人物です。
電子の濃度とホールの濃度に違いがあったとしても、一定の温度においては、両者の濃度の積は一定です。
これは、水溶液において、H+ と OH- の濃度の積が一定(10^(-14)mol^2/L^2)であるのと実は同じことなのです。

中性の水溶液の温度が高くなると、H2O が H+ と OH- とに解離しやすくなり、H2O に戻る反応が劣勢になります。
それと同様に、真性半導体においても、温度が上がると電子とホールが発生しやすくなるのに比べて、両者が出合って対消滅する反応が劣勢になるため、両者の濃度の積は増えます。
キャリアが増えるので、電流は流れやすくなります。

こんにちは。

>>>金属については、温度が上がると粒子が熱振動し自由電子が流れにくくなるというようなことを聞いたことがありますがあっていますか?

だいたい合っています。
金属については、温度が上がると正イオン(自由電子が引っこ抜かれた残りの原子)の振動が激しくなるので、自由電子が正イオンに散乱されます(進路を乱されます)。
それをマクロで見たとき、電気抵抗の上昇という形で現れます。

>>>半導体についてはまったく理由がわからないので詳しく教えて頂くとありがたいです。

半導体...続きを読む

Q密度関数の求め方(確率論)

問題
X,Y:標準正規分布N(0,1)を分布にもつ独立な実確率変数とします
このときZ=X/Yの分布は1/π(1+x^2)を密度関数に持つことを示せ

というものなんですが、
これはいわゆるCauchy分布です
Zの分布関数を地道に計算すればいいんですが、
どうもうまくできません。
計算の経過も丁寧に解説してくれる人がいたらどうかお願いします

ただ、公式を適用するとかいうのはなしでお願いします

Aベストアンサー

 なんだか難しい話をなさってますが、単なる変数変換の問題でしょう?超関数を使わなくても計算できますし、分布関数を微分する必要もないと思います。
 確率変数X,Yの関数であるZ(X,Y)の確率密度を求めるには、
p(X,Y)dXdY = f(Z,U)dZdU
となるように(X,Y)を(Z,U)に写像してやって、
q(Z)=∫f(Z,U)dU (U=-∞~∞)
を計算すれば良い。それだけです。

dXdY = |(∂X/∂Z)(∂Y/∂U)-(∂X/∂U)(∂Y/∂Z)| dZdU
ですから、
U=Y
とおくと(X,Y)と(Z,U)は1対1の写像であり、
dXdY = |Y|dZdU
従って、
f(Z,U)=|Y|p(X,Y)
であり、
q(Z)=∫|Y|p(X,Y) dY (Y=-∞~∞)
の計算です。
P(X,Y)=φ(X)φ(Y), φ(x)=(1/√(2π)) exp(-x^2/2)
だから、
P(X,Y)=exp(-(X^2+Y^2)/2)/(2π)
よって、
q(Z)=(1/(2π))∫|Y| exp(-(1+Z^2)(Y^2)/2) dY (Y=-∞~∞)
=2(1/(2π))∫Y exp(-(1+Z^2)(Y^2)/2) dY (Y=0~∞)
= 1/(π(Z^2+1))

 なんだか難しい話をなさってますが、単なる変数変換の問題でしょう?超関数を使わなくても計算できますし、分布関数を微分する必要もないと思います。
 確率変数X,Yの関数であるZ(X,Y)の確率密度を求めるには、
p(X,Y)dXdY = f(Z,U)dZdU
となるように(X,Y)を(Z,U)に写像してやって、
q(Z)=∫f(Z,U)dU (U=-∞~∞)
を計算すれば良い。それだけです。

dXdY = |(∂X/∂Z)(∂Y/∂U)-(∂X/∂U)(∂Y/∂Z)| dZdU
ですから、
U=Y
とおくと(X,Y)と(Z,U)は1対1の写像であり、
dXdY = |Y|dZdU
従って、
f(Z,U)=|Y|p(...続きを読む

Q全事象と事象全体の解釈の違いとは??

統計数学ででてきたんですが、全事象と事象全体の解釈、意味の違いがどうもわかりません。友達に聞いたんですが、たとえばサイコロ1個の目の出方は、全事象では「1~6のどれか」が出る目だけど、事象全体になると、「7でも8でもいい」といわれてますます、パニックになりました。どうか、分かりやすく、例を使って教えてください。ちなみに、全事象と事象全体がでてきたのは、確立の広義のところででてきました。よろしくおねがいします。

Aベストアンサー

「事象全体」という数学用語は聞いたことがありませんので、「考えられる事象全体の集まり」と解釈させてもらいます。

事象というのは、起こりうるもの・起こりえないもののどちらでもいいのです。たとえにあったサイコロのことで言えば、「出る目は7」という事象も考えられます。あと、「目が偶数」とか「目が3の倍数」なんていうのも、もちろん事象です。

根元事象ってご存じですか?
サイコロであれば、
「1の目が出る」「2の目が出る」「3の目が出る」「4の目が出る」「5の目が出る」「6の目が出る」
の6個が根元事象です。すなわち根元事象全体の数=全事象ということです。

お分かりになりました?

Qchar型にint型の数値を代入する。

たとえば、
int num;
char box; 

numに何らかの整数値が入っているときに、そのnumの中に入っている値をchar型に文字列として代入したいときはどのようにすればいいのでしょうか?

Aベストアンサー

sprintf()っていう関数がありますよ。書式は

sprintf(char型の配列の先頭ポインタ,フォーマット,変数...)

二番目の引数以降はprintf()の引数と同じです。たとえば

int num;
char box[256];
num=100;
sprintf(box,"%d",num);
printf("%s",box);

→100と出力される

Q偏差値から順位を求めるには

2000人の試験で偏差値42の場合、試験得点は正規分布になることがわかっているとき、この者の順位はどのように求めたらよいのでしょうか。

Aベストアンサー

>>標準正規分布表でなぜ0.80とわかるんですか。また、標準正規分布の面積の表とは違うんですか。

偏差値=(得点-平均)/標準偏差×10+50

で求めるので、偏差値から50引いて10で割ると、
平均0、分散1の標準正規分布上の値になります。

それで、偏差値42なら-0.8になるので、下側21%、ということです。


人気Q&Aランキング