現在大学で統計解析関係のゼミに所属しているものです。
現在はカイ二乗検定をしているのですが、
その時に「期待度数」が出ていたのですが、
この言葉の意味は多少わかるのですが、
公式の 横計×縦計÷総計=期待度数 
によってなぜ期待度数が出てくるのかが分かりません。
よろしかったら教えていただけませんか?
申し訳無いのですが、私は統計学の表面しか知らない者です。
なるべく分かりやすく教えて頂けると光栄です 

このQ&Aに関連する最新のQ&A

A 回答 (2件)

具体的なデータが合った方が話し易いので、


例えば、「性別と購入する本のジャンルは
独立である」という帰無仮説を、下のような
ある本屋での1日の本の販売冊数から検定
するとします。
         男 女 横計
マンガ      10  8  18
ノンフィクション  8  6  14
エッセイ      5  8  13
小説       12 14  26
---------------
縦計       35 36  71

 ここで、1行1列(マンガ、男)の期待度数を
考えます。
 仮説では男女の購入冊数の割合は、ジャンルに
よって変化しません。ですから、各ジャンルにおける
男女の購入冊数の割合は、全ジャンルの男女別合計
購入冊数の割合に等しくなります。したがって、
仮説に則れば、どのジャンルにおいても、
男:女=35:36になっていることが期待されます。
これは即ち、男はどのジャンルにおいても、
ジャンル毎の合計販売冊数の35÷71=0.49だけの
冊数を購入していることになります。
 で、マンガについて考えると、マンガは全体で
18冊売れた訳ですから、男性に対するマンガの
販売冊数の期待度数は、18×35÷71=8.9となり
ます。
 この、18×35÷71というのは、横計×縦計÷総計
になってませんか?
 まとめると、縦計÷総計で、縦列項目(男、女)の
観測値が横計中で占める割合の期待値を求め、
それに横計を掛けているのが、問題の式である訳です。
 もちろん、横計×縦計÷総計 = 縦計×横計÷総計
ですから、上記の説明の「男女」と「ジャンル」、
「横計」と「縦計」を入れ替えても、全く同じです。
    • good
    • 0
この回答へのお礼

とても丁寧に教えて頂き、ありがとうございました。
例を挙げて説明して頂けたのでとても良く分かりました。
これから統計解析の勉強をしていく上で、
ハ-ドルを一つ越せたような気がします。
本当にどうもありがとうございました。

お礼日時:2001/07/19 21:54

専門ではありませんが推測で。

違っていたらごめんなさい。
n行m列の表とします。各区画の期待度数(平均度数)をaとすると、横計はma、縦計はnaです。一方、総計をSとするとS=mnaです。
ここで、横計×縦計を計算するとmna^2=Saですね。
これからa=横計×縦計/Sではありませんか。
    • good
    • 0
この回答へのお礼

とても良い説明、期待度数のことが理解できたと思います。
本当にどうもありがとうございました。

お礼日時:2001/07/19 21:57

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q微分方程式の質問です。 dy/dx=f([ax+by+c]/[dx+ex+f]) 型の微分方程式につ

微分方程式の質問です。

dy/dx=f([ax+by+c]/[dx+ex+f])

型の微分方程式について、解き方は

連立方程式
ax+by+c=0
dx+ex+f=0
の解がx=p,y=qと求まったら

x=s+p
y=t+q

と変数を(x,y)から(s,t)に変換して、
f([ax+by+c]/[dx+ex+f])
=f([as+bt]/[ds+et])

と変形できるのもわかります。

質問は、なぜ
dy/dx=dt/ds
の変形ができるのですか?

Aベストアンサー

合成関数の微分の公式から
dy/dx=dy/dt*dt/ds*ds/dx=d(t+q)/dt*dt/ds*d(x-p)/dx=1*dt/ds*1=dt/ds

Q全数調査でもカイ二乗検定?

社会調査法のテキストで、「統計的検定」なるものをお勉強しています。いま「クロス集計の検定」のところまできました。

それで、「カイ二乗検定」なるものが出てきたんですが、これは全数調査のデータでも使えるんでしょうか?

私の理解では、そもそもカイ二乗検定が必要なのは、標本でみられた数値の特性が、そのまま母集団にもあてはまるかどうかを確率的に確かめるため、ですよね。
なら、標本調査でクロス集計をしたときだけ、やるんですよね?
母集団すべてを調べた全数調査では、この検定をする必要は、ないんですよね?

初歩的な質問ですいません。「期待度数で周辺度数を、なんちゃら、かんちゃら・・・」と計算する前に、この素朴な疑問に、テキストは答えていない・・・。すみません、どなたか教えてください。

Aベストアンサー

 検定の目的は、母集団について、何かを明らかにしたい。しかし、全数は調査できないから、標本のデータから推定します、ということです。私が例に出した1年生と2年生は、全員を調査することが可能でしょうから、検定は不要です。例えば、身長の平均値は、測定ミスが無ければ、誰がやっても同じ結果になるからです。

>組合員が100名弱で、アンケートの回収率が8割ぐらいをみこんでいるのですが
 この場合は、全数調査にはなりません。1名欠けても統計学上は文字通りで全数にはなりません。すなわち、残りの2割が入ると、異なる結果になるからです。身長だと、今日と明日では誤差範囲でしょうが、この場合は今日と明日の回答者が異なる可能性が大きいので、差があることを主張するには、検定が必要です。
 回答率100%なら、検定は不要です。

 有意差は、学術論文では必要不可欠ですが、現実の社会の価値とは無関係です。例えば、所持金はわ調べたら、Aグループは10±1、Bグループは100±1だった。100人も調べれば有意差はでますが、単位が円ならばどちらでも気にしませんが、億円であればBグループとお友達になりたい、と思います。
 有意差を出したあとの現実的な応用については、どこにも書いてありません。有意差が出ると鬼の首を取ったような印象がありますが、・・・。

 検定の目的は、母集団について、何かを明らかにしたい。しかし、全数は調査できないから、標本のデータから推定します、ということです。私が例に出した1年生と2年生は、全員を調査することが可能でしょうから、検定は不要です。例えば、身長の平均値は、測定ミスが無ければ、誰がやっても同じ結果になるからです。

>組合員が100名弱で、アンケートの回収率が8割ぐらいをみこんでいるのですが
 この場合は、全数調査にはなりません。1名欠けても統計学上は文字通りで全数にはなりません。すなわち、残りの...続きを読む

Qメガネ度数 近視S-5.75

メガネ度数 近視S-5.75 乱視Cー1.50

そこに老眼を加えてレンズを薄くした場合、歪みのないスタンダートレンズで和真メガネはレンズの値段(1.74)だけで6万円しました。他で作ってもそのくらい高くなりますか?どこか安くなるところありますか?

Aベストアンサー

安さなら、安売りで宣伝しているお店に行かれるのがいいと思います。

ただ、対応の仕方、売られて居るフレームなどのデザインなど、値段相応の物しかありませんので、だめになるのも早いですけどね。

私の使い方だと、だいたい安いメガネ屋で作ると1~2年でフレームの塗装が剥げたり、溶接が外れます。

また、安いメガネ屋は、レンズだけ交換などを受け付けていない店も多いので、レンズ、フレームセットでないと買えない店もあります。

きっちりとしたサービスのお店で作れば、それ位の値段にはなるでしょうね。

Qエクセルの統計でχ二乗検定の結果の5.19415E-10のEとは?

統計の初心者です。
タイトルにあるとおり、エクセルでχ二乗検定をしているのですが、
CHITESTの結果にEという文字が出てきます。
このEとは、何を意味するのでしょうか。
また、5.19415E-10は有意差を示しているのでしょうか。

変な質問で申し訳ないのですが、大変困っておりますので、どなたかお答え頂ければ本当に助かります。
お忙しいと存じますが、どうぞご回答よろしくお願い致します。

Aベストアンサー

χ2検定では「男女の喫煙率に差がない」と【仮定したとき】,すなわち「期待値」が本来の姿であると仮定したときに,実際の測定値のような男女に喫煙率の差があるようなデータになることが,どの程度ありえるか……

その確率が有意確率として算出されているわけですね.
今回,非常に小さな確率で,つまり

> 男女の喫煙率に差がないことは、めったに起こらない

と判断できるので,最初の「男女の喫煙率に差がない」の仮説が間違っていたと判断することになります.こうして

> 男女の喫煙率には差がある

と解釈できます.

なお,レポートなどでは,その仮説を棄却する確率,つまりどの程度の珍しさは許容範囲であるかの確率を示す必要があるわけですが

1) p<.05 (p<「設定した有意確率」)
2) p=?? (直接p値を書きます)

のいずれかの書き方になります.伝統的には(1)の書き方がされます.

> (P<5.19415E-10)と示し方はおかしいでしょうか。

おかしいです.
この書き方では,判断基準が「p<0.000000000519415(=5.19415E-10)」つまり,
「0.000000000519415」以下よりも更に珍しい・更に有意確率が小さいときに,「偶然ではない」と判断して最初の仮説の棄却を行うことになります.
普通は0.05や0.01であり,5%や1%よりも小さい確率の時は,それは非常に珍しい,偶然ではおきえないとします.

χ2検定では「男女の喫煙率に差がない」と【仮定したとき】,すなわち「期待値」が本来の姿であると仮定したときに,実際の測定値のような男女に喫煙率の差があるようなデータになることが,どの程度ありえるか……

その確率が有意確率として算出されているわけですね.
今回,非常に小さな確率で,つまり

> 男女の喫煙率に差がないことは、めったに起こらない

と判断できるので,最初の「男女の喫煙率に差がない」の仮説が間違っていたと判断することになります.こうして

> 男女の喫煙率には差が...続きを読む

QD<0とax^2+bx+c=0について


y=ax^2+bx+cの頂点が(-b/2a,-D/4a)よりD<0の場合ax^2+bx+c=0(a≠0)にはなりませんが

x=(-b±√D)/2aがD<0となるとxが虚数となるので、ax^2+bx+c=0にならないという解釈でもよいでしょうか?後、x軸、y軸上に取るものはすべて実数で虚数ということはx軸上に存在しないということですよね?

Aベストアンサー

> x=(-b±√D)/2a が D<0 となると x が虚数となるので、ax^2+bx+c=0 にならない

という考えで辻褄が合うのは、「a, b を実数に限れば」のほうだと思いますがね。

> どっちかわからないので x もしくは a, b に虚数だとかの表記がなければ
> 実数と考えていいですよね?

貴方が中学生以下であれば、そう考えても無理はないでしょう。
高校生以上であれば、a, b, c の範囲が指定されていないことを不自然または
粗末だと感じられたほうがよいです。
また、大学生以上であれば、実数と断っていないから複素数だというのも、早合点と
言われかねません。代数学の舞台となるのは、複素数体だけとは限らないからです。
いずれにせよ、式を書きっぱなしにして説明文も付けず、それで何かが定義できたと
思うのは、数学とは相容れない考えかたです。

Q標準偏差についてです。 今度、テストで期待値がテストに出ます。 その期待値と分散まではしっかりと理

標準偏差についてです。
今度、テストで期待値がテストに出ます。

その期待値と分散まではしっかりと理解してるのですが
最後の標準偏差のところが分かりません。
なぜ、√がとれるのか、
それまでの過程の計算が全くわかりません。
先生も電卓を使って答えを求めていたのに
電車は使ってはいけないと言っています。

お願いします。
なぜ、標準偏差では√なしの答えになるのか教えてください。

Aベストアンサー

こういう質問をしているのに、分散はしっかり理解しているとおっしゃるのが良くわかりませんが…

平均値に対するデータのばらつきを評価するには、平均値と各データの差をトータルして評価すればよいわけですが、平均値に対しての差を単純に足せば、ゼロになります。
当たり前ですよね。ゼロになるように計算したのが、平均値ですから。
要するに差が正であったり負であったりするからゼロになるわけで、負の数にならないようにすればいいわけです。
ということは、平均値との差を2乗すれば正の数になりますから、この数の平均を取れば、データのばらつきが評価できるわけです。
これが「分散」ですね。

でもこれは、差を2乗しているので、元のデータと次元が変わっています。
(体重のデータを取っていたなら、分散の単位はkg^2になります。)
ということで、分散の平方根を計算すれば次元が合わせられるわけです。
これが標準偏差です。
分散が9なら√9を計算するわけですね。
根号を付けたままだと不便ですよね。だから取っ払います。

√9 = 3

Q非負整数a,b,c,x,yで、ax+byとcが互いに素でなくなるのは?

非負整数a,b,c,x,yで、ax+byとcが互いに素でなくなるのは?
a,b,cは互いに素でa^2+b^2=c^2、またx,y,cも互いに素であるとします。
例えば、(a,b,c)=(3,4,5)、(x,y)=(-1,7)ならば、
ax+by=25となって、cと素でなくなりますが、
どういった条件が成り立てば良いのでしょうか?

任意の整数の組(x,y)が与えられた時に、
(ax+by)/c≠0が約分できるような(a,b,c)の組を知りたいのです。

よろしくお願いします。
ちなみに以前の質問↓の続きです。
http://oshiete.goo.ne.jp/qa/6158436.html

Aベストアンサー

仮定よりa,b,cは互いに素ですから、gcd(a,b)=1で
  aX + bY = 1
を満たす整数X,Yが存在しますね。

いまcのある約数をdとして両辺にdを掛けると
  d*(aX + bY) = d
  a(dX) + b(dY) = d
となります。

  x = dX
  y = dY
と置き換えると、不定方程式
  ax + by = d
の解の一つが
  x = dX
  y = dY
であるということになります。
しかし、現段階では解(x,y)はどちらもcと共通な約数dを持ちますから、(x,y)は我々の求めている解ではありません。

さて、上の不定方程式の性質として、既知の解(x,y)と任意の整数nを用いて
  x' = x +nb
  y' = y -na
とすると、(x',y')もまた不定方程式の解になります。
このとき整数nをうまく取ることで、x',y',cを互いに素にできます。

  x' = x +nb = dX +nb
  y' = y -na = dY -na
より(dX+nb),(dY-na),cが互いに素であれば良いのですが、いまdがcの約数であることより、nb,na,cが互いに素でない場合、(dX+nb),(dY-na),cも互いに素でないとわかります。

逆にnb,na,cが互いに素であれば、(dX+nb),(dY-na),cも互いに素になります。
また仮定よりa,b,cが互いに素より、nとcが互いに素であればnb,na,cは互いに素になります。


以上より、
  aX + bY = 1
となる(X,Y)を求め、cの約数dと、cと互いに素な任意の整数nを用いて、
  x = dX +nb
  y = dY -na
とすれば、x,y,cは互いに素で、しかも
  ax + by = d
とるような整数(x,y)が構成出来ます。

仮定よりa,b,cは互いに素ですから、gcd(a,b)=1で
  aX + bY = 1
を満たす整数X,Yが存在しますね。

いまcのある約数をdとして両辺にdを掛けると
  d*(aX + bY) = d
  a(dX) + b(dY) = d
となります。

  x = dX
  y = dY
と置き換えると、不定方程式
  ax + by = d
の解の一つが
  x = dX
  y = dY
であるということになります。
しかし、現段階では解(x,y)はどちらもcと共通な約数dを持ちますから、(x,y)は我々の求めている解ではありません。

さて、上の不定方程式の性質として、既知の解(x,y)...続きを読む

Q【統計学】最小二乗法を子供でも分かるように説明して頂けませんでしょうか?

WIKIを読んだら、たったの2行で挫折しました。
簡単に説明して頂ける方はいらっしゃいますか・・・
https://ja.wikipedia.org/wiki/%E6%9C%80%E5%B0%8F%E4%BA%8C%E4%B9%97%E6%B3%95

Aベストアンサー

(x, y) のようは「対」になったデータがあるときに、2つの量 x と y の関係としても、最も「近い」関係を見つけるための手法の一つです。

ふつうは「2つの量 x と y の関係を直線で表す」のですが、直線よりも「二次曲線」とか「対数」の方がよく関係を表せることもあります。
「2つの量の関係を表す直線」の場合には、実際の (x, y) までの「離れ度合い」が最小になるように「直線」を決めます。その「離れ度合い」として、直線と実際の (x, y) の「ずれ」を二乗して合計したものを使います。

詳しくは、こんなところを見てください。上の方の「考え方」だけでよいと思います。Wikiは「正確さ」を優先させていて「内容が難しい」ことが多いです。
http://hooktail.sub.jp/computPhys/least-square/

QHP 4320sとFUJITSU A540/AX

HP 4320sとFUJITSU A540/AXを持っています。

大きく性能の差があるように思えないのですが、結構OS起動時間、Firefoxの起動時間が違います。

4320s:
OS起動時間=約2分
Firefoxの起動時間=約1分

A540/AX:
OS起動時間=約1分
Firefoxの起動時間=約25秒

A540/AXの方が2倍速い感じです。
4320sをA540/AX程度の速度に改善の為、4320sのCPUをi3 330M(2.13GHz/L2 3M、中古で1000円以下)へ交換しようかと考えています。
これで改善するものでしょうか?
不安がある為、ご意見をお願いします。

4320s仕様:
OS Windows7 Pro 32bit SP1
CPU Celeron P4600(2.0GHz/2コア/L2 256Kx2/L3 2M/TDP 35W)
MEM PC3-10600 2Gx1
VIDEO Intel HD Graphics(CPU内臓)
HD WD1200BEVS(120G/S-ATA)
光学ドライブ:無し(外付USB接続)
LAN Atheros 9285G(無線11nで利用)

A540/AX仕様:
OS Windows7 Pro 32bit SP1
CPU Core2Duo T8300(2.4GHz/2コア/L2 3M/TDP 35W)
MEM PC3-8500 2Gx1
VIDEO GMA4500M(チップセット内臓)
HD WD2500BEVT(250G/S-ATA)
光学ドライブ:DVDマルチ
LAN -(有線100BASE-TXで利用)

HP 4320sとFUJITSU A540/AXを持っています。

大きく性能の差があるように思えないのですが、結構OS起動時間、Firefoxの起動時間が違います。

4320s:
OS起動時間=約2分
Firefoxの起動時間=約1分

A540/AX:
OS起動時間=約1分
Firefoxの起動時間=約25秒

A540/AXの方が2倍速い感じです。
4320sをA540/AX程度の速度に改善の為、4320sのCPUをi3 330M(2.13GHz/L2 3M、中古で1000円以下)へ交換しようかと考えています。
これで改善するものでしょうか?
不安がある為、ご意見をお願いします。

4320s仕様:
OS Wind...続きを読む

Aベストアンサー

性能はボトルネックで決まります。
ボトルネックを改善することが効率よく性能をアップすることになります。

ボトルネックがどこにあるのかは非常に難しいです。
CPUの性能の違いは仕様で一目瞭然ですが、では4320Sのボトルネックになっているのか?
と言われると疑問を感じます。
私の予感としてはHDDも非常に怪しいです。

実際の性能を見るにはベンチマークテストが一番でしょう。
ベンチマークテストで、CPU、メモリ、HDD等の実際の速度を数値化するわけです。
その上で性能アップに着手されるといいでしょう。

Q電磁流量計・超音波流量計

液体の流量を測定する電磁流量計・超音波流量計について教えて下さい。また、その仕組みや原理などが分かるサイトがあれば教えて下さい。

Aベストアンサー

 電磁流量計
磁界中を導体が横切ると、その速度に応じて電圧が発生
する(ファラデヘーの電磁誘導則)を応用して、導電体
流体の体積流量を測定します

http://www3.toshiba.co.jp/sic/seigyo/find/emf/emf_tokutyou.htm

 超音波流量計
パイプの両端に圧電素子を置き、流体の速度を検出します


参考URL:http://www3.toshiba.co.jp/sic/seigyo/find/emf/emf_tokutyou.htm


人気Q&Aランキング

おすすめ情報