プロが教えるわが家の防犯対策術!

統計学に関する質問です。よく「確率変数Xは~分布に従う」と表現されることがあります。今までは深く考えずにスルーしてきたのですが、「分布に従う」とは具体的にどういう意味でしょうか?大変初歩的な質問で恐縮ですが、噛み砕いての説明、宜しくお願いします。

このQ&Aに関連する最新のQ&A

A 回答 (1件)

渋いところをツッコミますねえ。



簡単に答えてしまうと、「確率変数Xは~分布に従う」とは、
「~分布」を表す累積確率分布関数 F(X) が存在して、
X が X≦A の範囲の値をとる確率が F(A) であることです。
これが、統計学的な答え。単純ですね。

では、「X が X≦A の範囲の値をとる」とは、どういうことか?
それ以前に、確率変数とは何か?
…この辺の問題は大変ややこしくて、
考えだすと、数学と哲学の境界が曖昧になるし、
春日三球が不眠症になってしまいます。(古すぎて伝わらないか)

そこで、数学的には、「確率変数」を定義することを放棄して、
累積分布関数または確率密度関数そのものを指す比喩的表現だと
開き直ってしまうのです。その意味では、
「確率変数Xは~分布に従う」とは、「~分布の累積分布関数 F を
引数つきで書き表すとき、引数に X の文字を使って F(X) と書く」
というだけのことです。
    • good
    • 2
この回答へのお礼

ご返答有難うございます。「確率変数」など深く考えるとむしろ混乱する統計用語って結構ありますね。

お礼日時:2010/10/29 11:57

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Qデータが正規分布しているか判断するには???

初歩的なことですが。。急いでいます。
おわかりになる方 教えてください。
サンプリングしたデータが正規分布しているかどうかを確認するにはどうすればよろしいでしょうか。
素人でも分かるように説明したいのですが。。
定性的にはヒストグラムを作り視覚的に訴える方法があると思います。今回は定量的に判断する方法を知りたいです。宜しくお願いします。

Aベストアンサー

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区間距離、度数区分数は、正規的なグラフになるように試行錯誤で行うことが多い(区間距離や度数区分数を本来の分布に則するようにいろいろ当てはめて解釈する。データ個数の不足や、データの取り方、または見かけ上の分布によりデータのばらつきが正しく反映されて見えないことがあるため)のですが、度数区分数は、機械的に、
=ROUNDUP(1+LOG10(データ個数)/LOG10(2),0):エクセル計算式
で区分数を求める方法があります。
 また、区間距離は、=ROUND((データの最高値-最低値)/(度数区分数値-1),有効桁数)で求め、区分の左端は、
=ROUNDUP(データの最低値-区間距離/2,有効桁数)
右端は=ROUNDUP(データの最高値+区間距離/2,有効桁数)
とします。
 区間がと度数区分数が出たら、その範囲にあるデータ数を数えて、ヒストグラムができます。
 
>最小側、最大側は 最小値、最大値を含んだ値としなければならないのでしょうか。
 ヒストグラム作成の処理に関しては、上記を参考にしてください。
 その前に、データの最小値と最大値が、正しくとれたデータか検討するため、棄却検定で外れ値が存在するか否かを検定し、外れ値が存在しないと結論づけられたら、正規分布の検定を行ってみてください。もし外れ値が存在する可能性があれば、そもそも、そのデータの信頼性が失われます。サンプリング手法の再検討(データの取り方に偏りがなかったか、無作為に設定してデータを取っていたか等)をして、再度データを得る必要があります。また、そもそも検定する以前に、データ数が少ないと判断が付かなくなってしまいますので、データ数は十分揃える(少なくとも20~30個)必要もあります。

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区...続きを読む

Q確率変数とは

確率変数P{X=x}のXとxの違いがよく分かりません。というか確率変数の概念自体がよく分かりません。またなぜP{X=x}=P(x)なのかもわかりません。助けてください。

Aベストアンサー

まず、Xとxが紛らわしいですね。
P{X=x}=P(x)
を、
P{A=t}=f(t)
のように置き換えても、同じ意味ですので、こう置き換えて説明してみます。
確率変数というのは、最初に決めた、現象の集合と、実数との対応です。サイコロの例がよく出されますが、逆にわかりにくくしている面もあります。各面に、{a,b,c,d,e,f}という文字が書かれたサイコロを想像してみてください。さて、このサイコロで、{a,b,c}の文字が出る確率を知りたいとしますね。ところが、数学は「数」を扱う世界なので、文字は直接は扱えません。そこで、現象と数の対応を確率変数とします。この場合、確率変数Aを、
サイコロを振ってaが出たら、A=1
サイコロを振ってbが出たら、A=2
サイコロを振ってcが出たら、A=3
サイコロを振ってdが出たら、A=4
サイコロを振ってeが出たら、A=5
サイコロを振ってfが出たら、A=6
となる変数であると決めてしまいます。これで、現象->数への変換が出来ました。確率変数は、このように、本来数学では扱えない「現象の集合」を、数の集合に変換するのに使うのです。
P{A=t}のtは、正確に書くと、t∈実数です。つまり、実数を適当に一つ持ってきたのが、tです。
P{A=t}=f(t)は、現象の集合を確率変数Aで数に置き換えてやった時の値がtである確率が、f(t)という値と同じだよ。という意味です。

まず、Xとxが紛らわしいですね。
P{X=x}=P(x)
を、
P{A=t}=f(t)
のように置き換えても、同じ意味ですので、こう置き換えて説明してみます。
確率変数というのは、最初に決めた、現象の集合と、実数との対応です。サイコロの例がよく出されますが、逆にわかりにくくしている面もあります。各面に、{a,b,c,d,e,f}という文字が書かれたサイコロを想像してみてください。さて、このサイコロで、{a,b,c}の文字が出る確率を知りたいとしますね。ところが、数学は「数」を扱う世界なので、文字は直接は扱えません。...続きを読む

Qデータが i.i.d であるとはどういう意味を持つ?

まず,i.i.d についての自分の理解が正しいか確認させてください。
(この時点で理解を誤っている可能性もあるので。)
i.i.d は,独立に同一の確率分布に従うということなので,ある n個のデータ{X1,・・・,Xn}がi.i.d であるとは,
例えば,平均μ,標準偏差σのガウス分布から取り出され(同一の確率分布に従う),
各Xiは,その他のXj(i≠j)からの影響を受けない(独立である)。
これらが満たされるとき,i.i.d である。
この理解でいいでしょうか?

また,重回帰においては,以下の資料の3ページに書かれているように
(http://www.econ.hit-u.ac.jp/~bessho/lecture/06/econome/060524MOLS2.pdf)
X,Yは,i.i.d である必要があるといわれていますが,なぜ,i.i.d でなくてはならないのでしょうか?
i.i.d である場合とそうでない場合とで何が違うのでしょうか?

Aベストアンサー

i.i.d.の定義についてはそれでいいのでは。
http://en.wikipedia.org/wiki/Independent_and_identically-distributed_random_variables

後半について。
別に、i.i.d.でなくても、形式的に回帰を考えることは可能ですが。
もともと、回帰を考えるのは、
ある集団があるとして、そいつらの、平均的な性質を知りたいからでしょう。
とすれば、
・「独立であること」はつまり、考えている集団からサンプルを偏りなく選んだ、ということです。世論調査するときに、特定の年齢層ばかり集めてくれば(サンプルの間に相関がある)、でてきた結果もおかしいでしょう。
・「同分布であること」は、そもそも、サンプルを考えている集団からとってきた、てことです。日本の世論調査をしているときに、アメリカ人に聞いたらダメでしょう。

Q期待値と平均

確率で期待値を学習しました。
平均のことを期待値と言うんですよね?

どちらも同じ意味なのに、なぜ使い分けるのですか?
どのようにして使い分けるのですか?

解答をよろしくお願いいたします。

Aベストアンサー

「期待値」と言えば、意味は明確ですが。
「平均」には、No.1 さんが書いているように、いろいろな種類があり、
期待値だけが平均ではないんですよ。
正確には「○○平均」と書かねばならないところを、文脈上通じそうなら、
略してただ「平均」と書いてしまうだけ。うるさく言えば、曖昧です。
期待値とは、正確には「確率による加重(算術)平均」のことですね。

No.4 さんの例
> 確率1/3で10になり
> 確率2/3で20になる
の「平均」も、確率の話で平均と言や期待値のつもりだろ!という意味では
(1/3)10+(2/3)20 でしょうが、実は、単純平均 (10+20)/2 のつもりだった
というオチが隠れていないとは言いきれないのです。(天邪鬼ですが。)

数学用語は正確に使ったほうがいい。「期待値」がオススメです。

Q統計学的に信頼できるサンプル数って?

統計の「と」の字も理解していない者ですが、
よく「統計学的に信頼できるサンプル数」っていいますよね。

あれって「この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる」という決まりがあるものなのでしょうか?
また、その標本数はどのように算定され、どのような評価基準をもって客観的に信頼できると判断できるのでしょうか?
たとえば、99人の専門家が信頼できると言い、1人がまだこの数では信頼できないと言った場合は信頼できるサンプル数と言えるのでしょうか?

わかりやすく教えていただけると幸いです。

Aベストアンサー

> この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる・・・
 調べたいどの集団でも、ある一定数以上なら信頼できるというような決まりはありません。
 何かサンプルを集め、それをなんかの傾向があるかどうかという仮説を検証するために統計学的検定を行って、仮設が否定されるかされないかを調べる中で、どの検定方法を使うかで、最低限必要なサンプル数というのはあります。また、集めたサンプルを何か基準とすべき別のサンプルと比べる検定して、基準のサンプルと統計上差を出すに必要なサンプル数は、比べる検定手法により計算できるものもあります。
 最低限必要なサンプル数ということでは、例えば、ある集団から、ある条件で抽出したサンプルと、条件付けをしないで抽出したサンプル(比べるための基準となるサンプル)を比較するときに、そのサンプルの分布が正規分布(正規分布解説:身長を5cmきざみでグループ分けし、低いグループから順に並べたときに、日本人男子の身長なら170cm前後のグループの人数が最も多く、それよりも高い人のグループと低い人のグループの人数は、170cmのグループから離れるほど人数が減ってくるような集団の分布様式)でない分布形態で、しかし分布の形は双方とも同じような場合「Wilcoxon符号順位検定」という検定手法で検定することができますが、この検定手法は、サンプルデータに同じ値を含まずに最低6つのサンプル数が必要になります。それ以下では、いくらデータに差があるように見えても検定で差を検出できません。
 また、統計上差を出すのに必要なサンプル数の例では、A国とB国のそれぞれの成人男子の身長サンプルがともに正規分布、または正規分布と仮定した場合に「t検定」という検定手法で検定することができますが、このときにはその分布を差がないのにあると間違える確率と、差があるのにないと間違える確率の許容値を自分で決めた上で、そのサンプルの分布の値のばらつき具合から、計算して求めることができます。ただし、その計算は、現実に集めたそれぞれのサンプル間で生じた平均値の差や分布のばらつき具合(分散値)、どのくらいの程度で判定を間違える可能性がどこまで許されるかなどの条件から、サンプル間で差があると認められるために必要なサンプル数ですから、まったく同じデータを集めた場合でない限り、計算上算出された(差を出すために)必要なサンプル数だけサンプルデータを集めれば、差があると判定されます(すなわち、サンプルを無制限に集めることができれば、だいたい差が出るという判定となる)。よって、集めるサンプルの種類により、計算上出された(差を出すために)必要なサンプル数が現実的に妥当なものか、そうでないのかを、最終的には人間が判断することになります。

 具体的に例示してみましょう。
 ある集団からランダムに集めたデータが15,12,18,12,22,13,21,12,17,15,19、もう一方のデータが22,21,25,24,24,18,18,26,21,27,25としましょう。一見すると後者のほうが値が大きく、前者と差があるように見えます。そこで、差を検定するために、t検定を行います。結果として計算上差があり、前者と後者は計算上差がないのにあると間違えて判断する可能性の許容値(有意確率)何%の確率で差があるといえます。常識的に考えても、これだけのサンプル数で差があると計算されたのだから、差があると判断しても差し支えないだろうと判断できます。
 ちなみにこの場合の差が出るための必要サンプル数は、有意確率5%、検出力0.8とした場合に5.7299、つまりそれぞれの集団で6つ以上サンプルを集めれば、差を出せるのです。一方、サンプルが、15,12,18,12,21,20,21,25,24,19の集団と、22,21125,24,24,15,12,18,12,22の集団ではどうでしょう。有意確率5%で差があるとはいえない結果になります。この場合に、このサンプルの分布様式で拾い出して差を出すために必要なサンプル数は551.33となり、552個もサンプルを抽出しないと差が出ないことになります。この計算上の必要サンプル数がこのくらい調査しないといけないものならば、必要サンプル数以上のサンプルを集めて調べなければなりませんし、これだけの数を集める必要がない、もしくは集めることが困難な場合は差があるとはいえないという判断をすることになるかと思います。

 一方、支持率調査や視聴率調査などの場合、比べるべき基準の対象がありません。その場合は、サンプル数が少ないレベルで予備調査を行い、さらにもう少しサンプル数を増やして予備調査を行いを何回か繰り返し、それぞれの調査でサンプルの分布形やその他検討するべき指数を計算し、これ以上集計をとってもデータのばらつきや変化が許容範囲(小数点何桁レベルの誤差)に納まるようなサンプル数を算出していると考えます。テレビ視聴率調査は関東では300件のサンプル数程度と聞いていますが、調査会社ではサンプルのとり方がなるべく関東在住の家庭構成と年齢層、性別などの割合が同じになるように、また、サンプルをとる地域の人口分布が同じ割合になるようにサンプル抽出条件を整えた上で、ランダムに抽出しているため、数千万人いる関東の本当の視聴率を割合反映して出しているそうです。これはすでに必要サンプル数の割り出し方がノウハウとして知られていますが、未知の調査項目では必要サンプル数を導き出すためには試行錯誤で適切と判断できる数をひたすら調査するしかないかと思います。

> どのような評価基準をもって客観的に信頼できると判断・・・
 例えば、工場で作られるネジの直径などは、まったくばらつきなくぴったり想定した直径のネジを作ることはきわめて困難です。多少の大きさのばらつきが生じてしまいます。1mm違っても規格外品となります。工場では企画外品をなるべく出さないように、統計を取って、ネジの直径のばらつき具合を調べ、製造工程をチェックして、不良品の出る確率を下げようとします。しかし、製品をすべて調べるわけにはいきません。そこで、調べるのに最低限必要なサンプル数を調査と計算を重ねてチェックしていきます。
 一方、農場で生産されたネギの直径は、1mmくらいの差ならほぼ同じロットとして扱われます。また、農産物は年や品種の違いにより生育に差が出やすく、そもそも規格はネジに比べて相当ばらつき具合の許容範囲が広くなっています。ネジに対してネギのような検査を行っていたのでは信頼性が損なわれます。
 そもそも、統計学的検定は客観的判断基準の一指針ではあっても絶対的な評価になりません。あくまでも最終的に判断するのは人間であって、それも、サンプルの質や検証する精度によって、必要サンプルは変わるのです。

 あと、お礼の欄にあった専門家:統計学者とありましたが、統計学者が指摘できるのはあくまでもそのサンプルに対して適切な検定を使って正しい計算を行ったかだけで、たとえ適切な検定手法で導き出された結果であっても、それが妥当か否か判断することは難しいと思います。そのサンプルが、何を示し、何を解き明かし、何に利用されるかで信頼度は変化するからです。
 ただ、経験則上指標的なものはあります。正規分布を示すサンプルなら、20~30のサンプル数があれば検定上差し支えない(それ以下でも問題ない場合もある)とか、正規分布でないサンプルは最低6~8のサンプル数が必要とか、厳密さを要求される調査であれば50くらいのサンプル数が必要であろうとかです。でも、あくまでも指標です。

> この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる・・・
 調べたいどの集団でも、ある一定数以上なら信頼できるというような決まりはありません。
 何かサンプルを集め、それをなんかの傾向があるかどうかという仮説を検証するために統計学的検定を行って、仮設が否定されるかされないかを調べる中で、どの検定方法を使うかで、最低限必要なサンプル数というのはあります。また、集めたサンプルを何か基準とすべき別のサンプルと比べる検定して、基準のサンプルと統計上差を出すに必要な...続きを読む

Q標本分散と不偏分散の使い分けについて。

標本分散と不偏分散の使い分けについて。

私はメーカーに勤めており、電子部品のばらつきなどでよく標準偏差σを目にします。
自分で少し調べてみると標準偏差にも標本分散を使うときと不偏分散を使うときがあることを知ったのですが、説明が難しくどのように使い分けていいのか分かりません。

標本分散と不偏分散はどのように使い分ければいいのでしょうか。
例えば電子部品の性能や実験データのばらつきにはどちらが使われているのでしょうか?

ご存知の方、教えてください。
よろしくお願いします。

Aベストアンサー

 母集団から全ての標本を抽出して得た、すなわち、全てのデータを使った分散を標本分散、というようです。しかし、標本分散の文字から、抽出した標本の分散という意味から、不偏分散の意味でも使う(私もそうでした)こともあり、標本分散がどちらなのか、混乱しています。質問者も標本分散をこの意味で使っていると想います。

 母集団のデータを知るのが統計学では目的ですが、それには全数(全サンプル)を利用する必要があります。しかし、製品検査などでは、全数検査だと商品が残らない、あるいは手間がかかり過ぎるので抜き取りを行い、全数検査の替わりにできます。この場合の分散は、不偏分散で代用ができます、というのが推測統計学です。

 すなわち、全数検査(文字通り全数、一つ欠けてもダメ)なら標本分散(この用語は混乱を招くので、私は使いませんが)、抜き取りなら不偏分散を利用しています。

Q統計学 t値の表を見るときの自由度

自由度Φ は (データ数-1) か、(データ数-2)のどちらを選ぶべきか、基準を教えて下さい。
t値の表を見るとき、迷っています。
データ数によってなのか、母平均に対応のあるないと関係があるのか・・・

Aベストアンサー

こんにちは.
t検定はその使用目的から三つの場合で自由度を見分ける必要があります.

1)ある条件の平均値と定数との差の検定の場合
 例えば,ある学級集団のIQが102であり,全国平均のIQ100よりも有意に高いといえるかどうか.このような場合にt検定を使う場合は次の計算で自由度を求めます.

 自由度=データ数-1

2)対応がない二つの条件の平均値の差の検定
 質問者さんは対応なし/ありの区別がついているようなので,以下簡単に説明をします.
 A条件で10人,B条件で8人のデータにおいてAとBの二つの平均値の差を調べる場合では次のようになります.

 自由度=Aデータ数+Bデータ数-2
 例) 16

3)対応がある二つの条件の平均値の差の検定
 この場合では,AB条件ともに同数データとなります.いまA条件データ数(=B条件データ数)が9とします.

 自由度=一方の条件データ数-1
 例) 8

Qカイ2乗検定って何??;;

タイトルのとおりですが…大学で統計の基礎な授業を一般教養で受けています。だけど知らない&説明のない言葉がいっぱぃで、全くついていけません(>_<))
「人が一番選ばなさそうな数字」を何度か投票した結果があって、その数字は無作為に選ばれてるかどうか、有意水準1%としてカイ2乗検定をして判断する、という問題があるのですが、カイ2乗検定自体、授業でちらっと言葉は使ったものの、計算の仕方、使い方の説明等はなく、まったく手がつかずにいます;;ネットでも調べてみましたが、どう使っていいのかまでは分かりませんでした。
知識の無い私でもわかるようなものがあれば教えて下さいっっ!お願いします。

Aベストアンサー

こんにちは.χ2(カイ二乗)検定を厳密に理解するには,数学的素養を持っている状態できっちりと統計学を学習する必要があるのですが,統計データを解析するための手段として統計学を「使う」のであれば,多少の原理を知っておけばよいでしょう.
以下初学者向けにかなり乱暴な説明をしています.正確な理解をしたければ,後で統計学の教科書などで独学して下さい.

χ2検定とは,χ2分布という確率分布を使ったデータ解析法と考えてもらう……のが一番なのですが,多分χ2分布って何? と思われるでしょう.χ2分布とは,二乗値に関する確率分布と考えることができるのですが,この辺もさらりと流して下さい.

例を使って説明します.今,道行く人にA,B,C,Dの四枚のカードの中から好きなもの一枚を選んでもらうとしましょう(ただし,選んでもらうだけで,あげるわけではありません.単にどのカードを選択仕方の情報を得るだけです).一人一枚だけの条件で,160人にカードを選んでもらいました.
さて,ここで考えてみて下さい.4枚のカードには大きな違いはなく,どれを選んでもかまわない.でたらめに選ぶとなれば,どのカードも1/4で,同じ確率で,選ばれるはずですよね? ならば,160人データならば,Aは何枚ほど選ばれる「はず」でしょうか? 同様に,B,C,Dは何枚選ばれる「はず」でしょうか?
……当然,A=B=C=D=40枚の「はず」ですよね? この40枚という数値はでたらめに(無作為に)選ばれたとしたらどんな数値になるかの【理論値】を意味します.

さて,上記はあくまでも理論値であり,実際のデータは異なる可能性があります.というよりはむしろ違っているのがふつうでしょう.そのような実際に観測された数値を【観測値】と呼びます.
仮に理論値と観測値が以下のようになったとします.

        A    B    C    D
(1)観測値   72   23   16   49
(2)理論値   40   40   40   40

当然のように観測値と理論値にズレが生じています.しかし現実と理論が異なるのはある意味当然なのですからぴったり一致することなどありえません.そこで,「ある程度一致しているか(ズレは許容範囲か)」を問題にすることになります.しかし,「ある程度」といわれても一体どのぐらいであれば「ある程度」と言えるのでしょうか? なかなか判断が難しいではないですか?
確かに判断が難しいです.そこで,この判断のために統計学の力を借りて判断するわけで,更に言えばこのような目的(理論値と観測値のズレが許容範囲かどうか)を検討するときに使われるデータ解析法がχ2検定なのです.

        A    B    C    D
(1)観測値   72   23   16   49
(2)理論値   40   40   40   40
(3)ズレ    +32   -17   -14   + 9
(4)ズレ二乗 1024   289   196   81
(5)(4)÷(2) 25.6  7.225  4.9  2.025

 χ2=25.6+7.225+4.9+2.025=49.25

計算過程をさらりと書いていますが,早い話が観測値と理論値のズレの大きさはいくらになるのか,を求めることになります.最終的には「49.25」というズレ値が算出されました.

さて,この「49.25」というズレ値が許容範囲かどうかの判定をするのですが,ここで,χ2分布という確率分布を使うことになります.詳細は統計学教科書を参考してもらうとして,χ2分布を使うと,○○というズレ値が(ある条件では)どのぐらい珍しいことなのか,という「珍しさの確率」を教えてくれます.
かりに「有意水準1%=1%よりも小さい確率で発生することはすごく珍しいと考える(許容範囲と考えられない)」とすれば,「珍しさ確率」が1%以内であれば「許容範囲ではない」と判断します.

以上,長々と書きました.今までの説明を読めばわかるように,χ2検定とはある理論値を想定した時,実際の観測値がその理論値とほぼ一致しているかどうかを調べるための統計解析法のことです.

χ2検定では,理論値をどのように設定するかは分析者の自由です.その設定の仕方で,χ2検定は「適合度の検定」や「独立性の検定」など異なる名称が付与されますが,本質は同じなのです.

質問者さんの場合は

> 「人が一番選ばなさそうな数字」を何度か投票した結果があって、その数字は無作為に選ばれてるかどうか、

これを理論値としてうまく設定することが鍵となるでしょう.

こんにちは.χ2(カイ二乗)検定を厳密に理解するには,数学的素養を持っている状態できっちりと統計学を学習する必要があるのですが,統計データを解析するための手段として統計学を「使う」のであれば,多少の原理を知っておけばよいでしょう.
以下初学者向けにかなり乱暴な説明をしています.正確な理解をしたければ,後で統計学の教科書などで独学して下さい.

χ2検定とは,χ2分布という確率分布を使ったデータ解析法と考えてもらう……のが一番なのですが,多分χ2分布って何? と思われるでしょう.χ2分布...続きを読む

Q偏微分の記号∂の読み方について教えてください。

偏微分の記号∂(partial derivative symbol)にはいろいろな読み方があるようです。
(英語)
curly d, rounded d, curved d, partial, der
正統には∂u/∂x で「partial derivative of u with respect to x」なのかもしれません。
(日本語)
ラウンドディー、ラウンドデルタ、ラウンド、デル、パーシャル、ルンド
MS-IMEはデルで変換します。JIS文字コードでの名前は「デル、ラウンドディー」です。

そこで、次のようなことを教えてください。
(1)分野ごと(数学、物理学、経済学、工学など)の読み方の違い
(2)上記のうち、こんな読み方をするとバカにされる、あるいはキザと思われる読み方
(3)初心者に教えるときのお勧めの読み方
(4)他の読み方、あるいはニックネーム

Aベストアンサー

こんちには。電気・電子工学系です。

(1)
工学系の私は,式の中では「デル」,単独では「ラウンドデルタ」と呼んでいます。あとは地道に「偏微分記号」ですか(^^;
その他「ラウンドディー」「パーシャル」までは聞いたことがあります。この辺りは物理・数学系っぽいですね。
申し訳ありませんが,あとは寡聞にして知りません。

(3)
初心者へのお勧めとは,なかなかに難問ですが,ひと通り教えておいて,式の中では「デル」を読むのが無難かと思います。

(4)
私はちょっと知りません。ごめんなさい。ニックネームは,あったら私も教えて欲しいです。

(2)
専門家に向かって「デル」はちょっと危険な香りがします。
キザになってしまうかどうかは,質問者さんのパーソナリティにかかっているでしょう(^^

*すいません。質問の順番入れ替えました。オチなんで。

では(∂∂)/

Q「ノルム、絶対値、長さ」の違いについて

あじぽんと申します。よろしくお願いします。

ベクトルや複素数などに出てくる「ノルムと絶対値と長さ」というのは同じことを違う言葉で表現しているのでしょうか?
手元にある書籍などには全てが同じ式で求められています。
同じ式で表現されていても意味は少しづつ違っていたりするのでしょうか?

よろしくお願いします。

Aベストアンサー

どれも同じような性質を持ちますが、違いの1つとして定義される空間が違います。

「絶対値」は、実数や複素数といった「数」に対して定義されます。
定義は、一通りしかありません。
ベクトルに対して、絶対値を求めるという言い方をする場合もあるかもしれませんが、それはベクトルの長さを表す記号に絶対値の記号を利用する場合があるからであり、参考書にも文章として「ベクトルの絶対値」という言い方はあまりされていないのではないでしょうか?



「長さ」というのは、空間にある「線」に対して定義できます。
数に対しては「長さ」という言い方はあまり聞かないと思います。
例えば、「3」の長さというような言い方は耳になじまないと思います。
一方、ベクトルの場合は、「矢印」という「線」になりますので「長さ」が定義できます。



最後の「ノルム」は、線形空間に対して定義できます。(もちろん実数、複素数やベクトルも線形空間です)
ノルムの条件を満たせばノルムになるため、複数のノルムが考えられます。
そのため、「(1,1)というベクトルに対するノルムは?」
という質問に対しては、「どのノルムを使うか?」という条件が欠けているため厳密に言うと「解答はできません」。
例としてよく扱われるノルムは「ユークリッドノルム」と言われ、通常のベクトルの長さと等しくなります。

ベクトルに対するノルムでは、「最大値ノルム」というのが他の例としてよく使われます。
これは、ベクトルの各要素の最大値で定義されます。
(例:(3,1,5)というベクトルの最大値ノルムは、3つの数字の最大値である5になります)

ノルムというと、線形空間であれば定義できるため、
f(x) = 3x^2+5x
という数式に対するノルムというのも考えられます。
(数式は、定数倍したり、足し算したりできますよね)
数式に対して「絶対値」とか「長さ」と言ってもピンと来ないですよね。

しかし、まだやられていないかもしれませんが、数式に対するノルムというのは存在します。


そうすると、なんでこんなんがあるねん。って話になると思います。

ここで、ベクトルに対してある定理があったとします。

それがさっきのような数式など他の線形空間でも成り立つんだろうか?
というのを考えるときに「ノルム」の登場です。

その定理の証明で、「ベクトル」として性質を使わずに「ノルム」の性質だけを使って証明ができれば、
それは「ベクトル」に対する証明でなくて「ノルムを持つもの」に対する証明になります。
(ちょっと難しいかな?)


このようにして、定理の応用範囲を広げるために「長さ」や「絶対値」の考え方をベクトルだけでなく「線形空間」という広い考え方に適用できるようにしたのが「ノルム」になります。

どれも同じような性質を持ちますが、違いの1つとして定義される空間が違います。

「絶対値」は、実数や複素数といった「数」に対して定義されます。
定義は、一通りしかありません。
ベクトルに対して、絶対値を求めるという言い方をする場合もあるかもしれませんが、それはベクトルの長さを表す記号に絶対値の記号を利用する場合があるからであり、参考書にも文章として「ベクトルの絶対値」という言い方はあまりされていないのではないでしょうか?



「長さ」というのは、空間にある「線」に対して...続きを読む


人気Q&Aランキング