アプリ版:「スタンプのみでお礼する」機能のリリースについて

確率統計のテキストの読み方わからないのでお尋ねします。
”確率変数Xの分布”というような言い方があります。
あるいは、中心極限定理の説明の出だしの部分で、"x1, x2,...,xn,...が独立同分布で、"
とかいう書き出しがあります。私はいつもここで躓きます。

確率変数Xと言ったとき、何を具体的に想像すればいいでしょうか。逆にXにはなり得ないものは何でしょうか。数学は具体的な対象を想定して理解するのはあまり高級ではないかも知れませんが、事例として示してもらいたいのです。
18歳の日本人男子の身長はXになりうるでしょうか。また、先の中心極限定理で出てきたx1,x2...xn..とはその個別のデータ(nの個人個人)の値という意味でしょうか。もしそうなら、x1,x2...xnが独立同分布とはどういう風に考えればいいでしょうか。x1,x2...は各個人の身長ですから当然独立ですね(日本限定という従属性は残るかも知れませんが)。x1,x2..の分布とはどういうことなのでしょうか。Xに分布がある、というのならわかります。Xは集合なので。しかし個別のx1,x2...xnに対して分布という言葉を与えると例えば"Xの中からn個を無作為抽出する"、という行為をm回繰り返したときのm個のx1の分布という意味になるのでしょうか。分布とか確率というのは集合(複数のデータの塊)に対して与えられるものであり、そこから個別に取り出した事象に対しては言えないように思うのですが。
確率変数Xというのもよくわからないところがあります。人間の体重は確率変数でしょうが、A君の体重は確率変数ではありませんね(1つの値だから)。そういう意味で人間の身長は確率変数Yになりうると思います。確率変数とは集合に対して与える(つまりその言葉に対して多くの具体的なデータがある)という理解は正しいでしょうか。
さらに確率変数Xkなどと書かれるともう意味不明となってしまいます。k=1は1990年の日本人の18歳男子の身長の集合、k=2は1991年の...ということなのか、k=1は北海道○○市の18歳男子田中仁くんの身長...なのかが分からないのです。どっちでもいいというのであれば、普通の微分積分学・線形代数学と同じ(x=1.0でxは何でもいいのだから)ですが、確率統計はそれが峻別されていると思うのですが。

”○○分布に従う”というのも確率統計の慣用語ですが、”そういう分布になっている母集団から取り出されたものである”という意味なのでしょうか。

”確率分布”というところにも少し引っ掛かりを覚えます。確率分布というのは最小から最大までの間の値の存在割合の分布ということですね。それしかないということにもなりますが、テキストでちゃんと説明してないように思うのですが。

数学の中でも確率統計は具体的な現場との対応関係がある分野なので逆に理解しにくい感じがあるのです。

長文ですみませんが、よろしくお願いします。

A 回答 (3件)

確率変数をなんかわからいけど、観測するたびに、いろんな数をとりえる変数(尺度)、みたいな理解の仕方をしていると、いつまでたってもちゃんとした理解はできないです。


ちゃんと理解したいなら、確率変数を標本空間Ωから実数への関数としてとらえる、という考え方をマスターする必要があります。

「確率」という考え方の、基本的な思想は、高校の数学で一番最初に習う
  確率 =(注目するイベントに含まれる根源事象の数)/(起こりえる全ての根源事象の数)…(☆)
です。これが全ての基本です。
(実際には、根源事象の数が無限個になる場合も考えるので、「数」ではなくて「測度」というものを使いますが)

ポイントは、分母の「起こりえる全ての根源事象」で列挙した事象は、それ以上分解できない「根源的な」事象である、ということです。
で、神様が、この全ての根源事象を1つずつ書いたボールがつまった袋から、1つのボールを取り出すわけです。
(したがって、全ての根源事象は等確率で起こる)

で、たとえば、「人間の体重」の確率分布を考えるとき、人間の体重は、例えば、60kg近辺になる可能性が高くて、100kg以上になる可能性は低い、わけです。
ということは、体重の値それ自身は、上の式で書いた「根源的な事象」ではありません。
なぜなら、根源事象であれば、当然全てが等確率で起こらないといけないので。

じゃあ、体重の確率分布の根源事象は何なのか?、というと、それが標本空間Ωの元ωなわけです。
神様が、大量のボールがつまった袋Ω(全てのボールは完全に区別できるとする)から、ボールを1つ取り出してきます。
取り出したボールをωとします。
このとき、全てのボールに60kgとか70kgとかいった実数値が書かれているとします。
数学的に言えば、ボールωを与えられて、体重という実数値を返す関数X(ω)があらかじめ与えられているということです。
神様がボール(根源事象)ωを1つ取り出す ⇒ ボールに書かれた数字(=関数X(ω)の値)で実数値が1つ定まる
という形で体重の実現値が定まることになります。

ごちゃごちゃ書きましたが、とにかく、(☆)が全ての基本であるということは絶対に忘れてはいけません。
高校で連続分布(正規分布など)を初めて教えるときには、無限集合を避けるために、あえて根源事象が何なのかを曖昧にして教えているので、(☆)が頭からすっかり抜けてしまう人が多いのですが。。
(連続分布の根源事象の集合Ωは無限集合になる)

体重の値それ自体は根源事象ではない
(神様がくじ引きをするのは、根源事象ωであって、体重の値そのものではない)
ということを常に念頭に置くべきです。
    • good
    • 1

テキストに、分かりやすいテキストと分かりにくいテキストがありますからねえ・・・。

「名著」とか「定番」と呼ばれているものは「分かりにくい」ものが多いです。
「分かりやすい参考書」を手に入れて、まず概念や考え方を把握してみてはいかがでしょうか。

・確率変数:要するに「データの測定尺度」ですね。身長も、体重も、点数、金額、満足度といったものすべて。

 身長や体重だと、個々の人がどういう「測定尺度」を持っているか(それが x1, x2, ・・・ということ)、「分布」はその「測定尺度」の度数(人数)がどうばらついているかということです。

 ただし、「確率」が付いていると、「全データを足し合わせたものが1になるように規格化」というイメージがあるので、単に「変数」でよいように思います。

 また、統計で「データ」といった場合に、個々人の「測定尺度」( x1, x2, ・・・)だったり、その測定尺度に該当する度数(人数)だったり、はたまた「サンプルの大きさ」のことをいったり、いろいろかもしれませんね。
 でも、それは、その場その場で何を指しているか、何を意味しているかを解釈しながら読まないといけないのでしょうね。

>18歳の日本人男子の身長はXになりうるでしょうか。

なり得ます、十分に。

>x1,x2...xn..とはその個別のデータ(nの個人個人)の値という意味でしょうか。

サンプル対象である1番目の人の身長が x1, 2番目の人の身長が x2, ・・・ n番目の人の身長が xn ということです。「x1」は人の名前ではなくその人の持つ「測定尺度」の値ということです。

>もしそうなら、x1,x2...xnが独立同分布とはどういう風に考えればいいでしょうか。

サンプル対象の n 人は、「同じ分布」(平均値や標準偏差が同じ正規分布など)の属していて、1人1人はそれぞれ独立(特定の家系や地域に偏っていないというような)ということでしょう。

>x1,x2..の分布とはどういうことなのでしょうか。Xに分布がある、というのならわかります。Xは集合なので。

 ここでいう「X」はおそらく「母集団」を意味していますね。上の例だと「18歳の日本人男子の身長」という。
 これに対して、x1,x2..,xn というサンプルの集団にも「分布」があります。ヒストグラムを作ればある分布をしますよね。そして、n をどんどん増やせば「母集団 X 」の特性にだんだん近づき、n が「18歳の日本人男子全員」になったら完全に一致することは分かりますね?

 「母集団」と「サンプル(標本)」の違いは、統計においては本質的なものです。これは混同せずにきっちりと区別して理解することが大切です。
 たとえば、日本の有権者全体の政党支持率や内閣支持率は、本当は全員に意見を聞かないと分かりません(これが母集団)。それを1000人とか2000人にアンケート調査して(これがサンプル)、日本全体の数値を推定します。製品の抜き取り調査をして、全体の品質を推定するのもの同じです。(一般に母集団の特性は「分からない」、ただし「数が多ければ正規分布すると仮定する」ということが多い)

>しかし個別のx1,x2...xnに対して分布という言葉を与えると例えば"Xの中からn個を無作為抽出する"、という行為をm回繰り返したときのm個のx1の分布という意味になるのでしょうか。

 いいえ。上に書いたように、1回のサンプル数 n 個(x1,x2...xn)の分布ということです。この「n このデータの塊」の中の分布ということです。
 x1とかx2は、仮に付けたサンプル値ですから、「m個のx1の分布」などというものに意味はありません。

>確率変数とは集合に対して与える(つまりその言葉に対して多くの具体的なデータがある)という理解は正しいでしょうか。

 いいえ。「変数」とは、上に書いたように、単なる「データの測定尺度」ということです。体重も身長も「変数」になり得ます。データが1個でも「変数」です。(その意味で、「x1」とは1人のサンプルの「変数」の具体値)


 こんな説明で、少しは疑問が解けたでしょうか?

 ネット上に、こんなサイトもあるので、「用語の定義」というよりは「考え方」「概念」の理解に、ちょっと覗いてみてはいかがでしょうか。
http://kogolab.chillout.jp/elearn/hamburger/
    • good
    • 1

実際のところ、数学の教科書なんかでは、


確率変数Xと、その実現値x、を同じ記号で表記していることはよくあります。読者が文脈によってどちらの意味なのか読み取らないといけないです。

初学者向けの教科書では、なんの断りもなく記号を混用していることもあります。
一方で専門の教科書になると、最初の方に(初学者にとっては)意味がわからない定義が羅列された後、「これ以降記号Xを確率変数とその実現値の両方の意味で用いる(から読者が文脈からどちらの意味か読み取ってね)」の一文で済まされることが多いですね。


>確率変数とは集合に対して与える(つまりその言葉に対して多くの具体的なデータがある)という理解は正しいでしょうか。
>確率分布というのは最小から最大までの間の値の存在割合の分布ということですね。

実は、このような解釈は、数学的にはどちらも間違っています。直感的には、こういう解釈をしたくなるんですが、質問者自身も混乱しているように、この解釈だと、きちんと数学的に矛盾のない状態で、確率変数やその実現値、あるいは、確率分布といったものを定義することができません。

数学的には、確率変数というのは、標本空間Ωと呼ばれる得体のしれない(神様のみが知る)集合の要素を与えられたときに実数値を返す「関数」として定義されています。

例えば、サイコロを考えます。
直感的な理解(質問者の解釈)だと、サイコロの目を表す確率変数Xは1〜6のどれかを取る変数?となるわけですが、じゃあ、いつ値が変わるのか、とか考えだしたらワケワカランくなるでしょう。

そうではなくて、まず、(関心のあるなしに関わらず)起こる可能性のある全ての出来事を集めてきた集合Ωを考えます。Ωのことを標本空間と呼びますの
Ωは、イメージとしては、

・サイコロが10時10分10病に、東経135.124度、北緯38.1234度で振られて、10.3回転した後、真北の向きに、1の目を上に向けて止まった
・サイコロが10時10分10秒に、東経135.124度、北緯38.1234度で振られて、10.3回転した後、真北の向きに、1の目を上に向けて止まった
・サイコロが10時10分11秒に、東経135.123度、北緯38.124度で振られて、15.1回転した後、真北から0.3度の向きに、2の目を上に向けて止まった

みたいな、「起こる可能性がある出来事全て」を厳密に区別して列挙した集合です。
で、神様が、この集合Ωから、要素ω∈Ωを一つ選びます。このωのことを「標本」と呼びます。
ωにな、上に書いたように、サイコロがどう転がって落ちたのか全ての情報がつまっていますが、我々にとって興味があるのはサイコロの目だけなわけです。
そこで、ωから、サイコロの目に関する情報だけを取り出す関数X(ω)を考えます。つまり、X(ω)は、標本空間Ωの元ωを与えられて、1〜6までの整数を返す関数です。この関数のことを「確率変数」と呼びます。

とりあえず、これくらいのイメージを前提として持った上で、専門書の最初の方にある定義を読み直すと、だいぶ感じが違うんではないですかね。
    • good
    • 1
この回答へのお礼

回答ありがとうございます。まだ十分消化できていませんが、前段のところだけの感想なのですが。筆者が読者に論旨を想像させるという考え方にどうしても違和感があるのです。つまり、”読者はある程度、そのことについて知識がある”ということを筆者が前提としているように感じます。言語というものはどうしてもある程度まで詰めたところではもう想像力に任せるしかないかもしれません。しかし、確率変数の定義とか変数の意味の説明がないのは筆者の手抜きのように思えてしまうのですが。何度も説明する必要はありませんが、1回はあって然るべきと思えるのです。

お礼日時:2016/12/01 15:32

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!