【先着1,000名様!】1,000円分をプレゼント!

たびたびお世話になっています。
t分布における「自由度」のうまい(=なるほど、と思えるような)説明方法がなかなか思いつきません。
ものの本で「自由度とは『標本の数から、作業に必要な平均値の数を引いたもの』と考えると汎用性がある」と知り、事実、「値を自由に選べるのは(n-1)個までで、最後のひとつはおのずと決められてしまう。だから我々に与えられた”自由”度は(nー1)である」という説明もなるほど、と思えます。
ただなぜそんな自由度がt分布で出てくるのか?t分布において、値が自由に選べるとか選べないとかはどこでどうからんでくるのか、そこが頭の中でうまく結びつかなくて困っています。
どなたかご教授ください。

このQ&Aに関連する最新のQ&A

A 回答 (2件)

うまい説明はわかりませんが。


「計算したらそうなるから」というのが本当のところですが。

しいて言えば、t分布の自由度がn-1になるのは、分散の不偏推定量で、n-1が出てくるからですね。実際、t分布の分布関数を導出する途中で、n-1で割る分散が不偏推定量になっているという性質を使います。

じゃあ、「なんでn-1で割ると不偏推定量になるの?」っていわれると、「計算するとそうなる」としかいえないです。ヒマなら実際に計算してみてください。

http://case.f7.ems.okayama-u.ac.jp/statedu/lisps …
    • good
    • 0

こんにちは.とりあえず,ここでいうt分布を,よく使われる「student化されたt分布」だとして話を進めます.


また,以下は厳密な説明と言うよりは,イメージ的説明をしています.その点御了承下さい.

御指摘の「t分布において自由度という数値は何を意味するのか?」については,統計法を実務的に勉強されている人は,「理屈はともかくそんなものである」とブラックボックス的に理解するのが第一段階でしょう.質問者さんは,次の段階に進まれているようですね.

まず,t分布というのは,「ある数値が確率論的に散らばっているとして,特定の期待値を基準として,どのように散らばっているか」ということを考えるときに使う分布です.言わずもがなですが,分布という道具を持ち出すときには「あるデータは必ず『散らばり』がある」と考えていることになります.

さて,分布には,「分布の基準点=期待値」と「数値の散らばり具合=分散」という情報が最重要となります.
例えば,「2」という数値が期待値であるとしても,これを基準としてどのように数値が散らばっていくかで分布の形は異なってきます.分散が「4」に比べて,分散が「9」の時の方が分布が横に広がることになります.

t分布における自由度は,この分散と密接に関連があります.

        z分布
 t分布=──────────
      自由度aのχ2分布

t分布というものは,上記のようにz分布とχ2分布によって構成されています.さて,注目してもらいたいのは,分母の「自由度aのχ2分布」の部分です.χ2分布というのは「二乗和の分布」といえるもので,自由度が大きくなればなるほど,χ2分布の形が広がっていきます(よくわからなければ,「自由度が大きくなればなるほど,分母部分の数値が大きくなるんだ」と漠然とお考え下さい).一方z分布の方は,自由度に影響されない,いわば定数扱いとなります(実際は確率論的に分布しているわけですが).
そうすると,どうなるでしょう? 分子は定数,分母は変数です.不正確ですがイメージとして説明を続けます.

 定数/変数(aの関数.ここでは倍数とする)

a=1のとき, b/c=b
a=2のとき, b/(c×2)=(b/c)×(1/2)
a=3のとき, b/(c×3)=(b/c)×(1/3)

aが大きくなるほど「定数/変数」の数値は小さくなっていきますね?

あくまでも上記の「定数/変数」の例はイメージとして理解してもらいたいわけですが,t分布についても似たようなことになります.

すなわち,自由度(aに相当)が大きくなるほど,分母部分(χ2部分)が大きくなり,「分子/分母」の数値が小さくなる.これは,t分布の形状としては「分布の横幅が小さくなる」ということなります.最終的に,aが∞に大きくなる場合は,t分布の形が最も小さくなるわけですが,これはz分布と一致します(自由度∞のt分布=z分布).

話をまとめると,t分布における自由度とは,数値の散らばり具合=分散をどの程度許容するか,という問題であり,形状としては,分布の広がりとして表現されます.

統計学の専門家ではなく,実務統計家の観点からは上記のよう説明できると思います.
いずれにしろ,分布の仕組みに言及しなければならないので,「t分布の仕組みがどのようなものか,ちょっと難しめの話をしてもいいか?」を被説明者に確認を取るべきでしょう.
    • good
    • 1

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q統計学 t値の表を見るときの自由度

自由度Φ は (データ数-1) か、(データ数-2)のどちらを選ぶべきか、基準を教えて下さい。
t値の表を見るとき、迷っています。
データ数によってなのか、母平均に対応のあるないと関係があるのか・・・

Aベストアンサー

こんにちは.
t検定はその使用目的から三つの場合で自由度を見分ける必要があります.

1)ある条件の平均値と定数との差の検定の場合
 例えば,ある学級集団のIQが102であり,全国平均のIQ100よりも有意に高いといえるかどうか.このような場合にt検定を使う場合は次の計算で自由度を求めます.

 自由度=データ数-1

2)対応がない二つの条件の平均値の差の検定
 質問者さんは対応なし/ありの区別がついているようなので,以下簡単に説明をします.
 A条件で10人,B条件で8人のデータにおいてAとBの二つの平均値の差を調べる場合では次のようになります.

 自由度=Aデータ数+Bデータ数-2
 例) 16

3)対応がある二つの条件の平均値の差の検定
 この場合では,AB条件ともに同数データとなります.いまA条件データ数(=B条件データ数)が9とします.

 自由度=一方の条件データ数-1
 例) 8

Qカイ2乗検定って何??;;

タイトルのとおりですが…大学で統計の基礎な授業を一般教養で受けています。だけど知らない&説明のない言葉がいっぱぃで、全くついていけません(>_<))
「人が一番選ばなさそうな数字」を何度か投票した結果があって、その数字は無作為に選ばれてるかどうか、有意水準1%としてカイ2乗検定をして判断する、という問題があるのですが、カイ2乗検定自体、授業でちらっと言葉は使ったものの、計算の仕方、使い方の説明等はなく、まったく手がつかずにいます;;ネットでも調べてみましたが、どう使っていいのかまでは分かりませんでした。
知識の無い私でもわかるようなものがあれば教えて下さいっっ!お願いします。

Aベストアンサー

こんにちは.χ2(カイ二乗)検定を厳密に理解するには,数学的素養を持っている状態できっちりと統計学を学習する必要があるのですが,統計データを解析するための手段として統計学を「使う」のであれば,多少の原理を知っておけばよいでしょう.
以下初学者向けにかなり乱暴な説明をしています.正確な理解をしたければ,後で統計学の教科書などで独学して下さい.

χ2検定とは,χ2分布という確率分布を使ったデータ解析法と考えてもらう……のが一番なのですが,多分χ2分布って何? と思われるでしょう.χ2分布とは,二乗値に関する確率分布と考えることができるのですが,この辺もさらりと流して下さい.

例を使って説明します.今,道行く人にA,B,C,Dの四枚のカードの中から好きなもの一枚を選んでもらうとしましょう(ただし,選んでもらうだけで,あげるわけではありません.単にどのカードを選択仕方の情報を得るだけです).一人一枚だけの条件で,160人にカードを選んでもらいました.
さて,ここで考えてみて下さい.4枚のカードには大きな違いはなく,どれを選んでもかまわない.でたらめに選ぶとなれば,どのカードも1/4で,同じ確率で,選ばれるはずですよね? ならば,160人データならば,Aは何枚ほど選ばれる「はず」でしょうか? 同様に,B,C,Dは何枚選ばれる「はず」でしょうか?
……当然,A=B=C=D=40枚の「はず」ですよね? この40枚という数値はでたらめに(無作為に)選ばれたとしたらどんな数値になるかの【理論値】を意味します.

さて,上記はあくまでも理論値であり,実際のデータは異なる可能性があります.というよりはむしろ違っているのがふつうでしょう.そのような実際に観測された数値を【観測値】と呼びます.
仮に理論値と観測値が以下のようになったとします.

        A    B    C    D
(1)観測値   72   23   16   49
(2)理論値   40   40   40   40

当然のように観測値と理論値にズレが生じています.しかし現実と理論が異なるのはある意味当然なのですからぴったり一致することなどありえません.そこで,「ある程度一致しているか(ズレは許容範囲か)」を問題にすることになります.しかし,「ある程度」といわれても一体どのぐらいであれば「ある程度」と言えるのでしょうか? なかなか判断が難しいではないですか?
確かに判断が難しいです.そこで,この判断のために統計学の力を借りて判断するわけで,更に言えばこのような目的(理論値と観測値のズレが許容範囲かどうか)を検討するときに使われるデータ解析法がχ2検定なのです.

        A    B    C    D
(1)観測値   72   23   16   49
(2)理論値   40   40   40   40
(3)ズレ    +32   -17   -14   + 9
(4)ズレ二乗 1024   289   196   81
(5)(4)÷(2) 25.6  7.225  4.9  2.025

 χ2=25.6+7.225+4.9+2.025=49.25

計算過程をさらりと書いていますが,早い話が観測値と理論値のズレの大きさはいくらになるのか,を求めることになります.最終的には「49.25」というズレ値が算出されました.

さて,この「49.25」というズレ値が許容範囲かどうかの判定をするのですが,ここで,χ2分布という確率分布を使うことになります.詳細は統計学教科書を参考してもらうとして,χ2分布を使うと,○○というズレ値が(ある条件では)どのぐらい珍しいことなのか,という「珍しさの確率」を教えてくれます.
かりに「有意水準1%=1%よりも小さい確率で発生することはすごく珍しいと考える(許容範囲と考えられない)」とすれば,「珍しさ確率」が1%以内であれば「許容範囲ではない」と判断します.

以上,長々と書きました.今までの説明を読めばわかるように,χ2検定とはある理論値を想定した時,実際の観測値がその理論値とほぼ一致しているかどうかを調べるための統計解析法のことです.

χ2検定では,理論値をどのように設定するかは分析者の自由です.その設定の仕方で,χ2検定は「適合度の検定」や「独立性の検定」など異なる名称が付与されますが,本質は同じなのです.

質問者さんの場合は

> 「人が一番選ばなさそうな数字」を何度か投票した結果があって、その数字は無作為に選ばれてるかどうか、

これを理論値としてうまく設定することが鍵となるでしょう.

こんにちは.χ2(カイ二乗)検定を厳密に理解するには,数学的素養を持っている状態できっちりと統計学を学習する必要があるのですが,統計データを解析するための手段として統計学を「使う」のであれば,多少の原理を知っておけばよいでしょう.
以下初学者向けにかなり乱暴な説明をしています.正確な理解をしたければ,後で統計学の教科書などで独学して下さい.

χ2検定とは,χ2分布という確率分布を使ったデータ解析法と考えてもらう……のが一番なのですが,多分χ2分布って何? と思われるでしょう.χ2分布...続きを読む

Qt検定で自由度がn-1の場合と、n-2の場合の違いは??

t検定で自由度がn-1の場合と、n-2の場合の違いは、なんでしょうか??対応があるものの検定は、n-1で、対応がない場合には、n-2なのでしょうか??
(対応がある時にも、n-2を使っているようだったのでよくわかりませんでした。)

あと、t検定の前には、F検定を必ずしなければいけないのでしょうか?
あまり詳しくないのでわかりやすく教えていただけると助かります。
よろしくお願いいたします。

Aベストアンサー

平均値の差の検定ですね。
最近は全部計算気任せなので計算方法を覚えていません。
何かの推定値を求めると求めた数だけ自由度が減ります。
これがn-1とn-2の違いです。

F検定は分散ヒの検定ですね。
対応がない場合には.2つの分布がとう分散である必要があります。従って分散比の検定が必要です。
対応がある場合には.とう分散である必要はありませんから.とう分散の検定はしません。

Q相関係数についてくるP値とは何ですか?

相関係数についてくるP値の意味がわかりません。

r=0.90 (P<0.001)

P=0.05で相関がない

という表現は何を意味しているのでしょうか?
またMS Excelを使ってのP値の計算方法を教えてください。

よろしくお願い致します。

Aベストアンサー

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場合はp=0.1%でもいいと思いますが)
相関係数においても相関の有無を結論つけるにはそのrが偶然出る確率を出すか、5%の確率ならrがどれぐらいの値が出るかを知っておく必要が有ります。

>r=0.90 (P<0.001)

相関係数は0.90と計算された。相関がないのに偶然r=0.90 となる確率は0.001以下だと言ってます。

>P=0.05で相関がない

相関がないと結論。(間違っている確率は5%以下)だと言ってます。

エクセルでの計算ですが、まず関数CORRELを使ってr値を出します。xデータがA1からA10に、yデータがB1からB10に入っているとして

r=CORREL(A1:A10,B1:B10)

次にそのr値をt値に変換します。

t=r*(n-2)^0.5/(1-r^2)^0.5

ここでnは組みデータの数です。((x1,y1),(x2,y2),・・・(xn,yn))
最後に関数TDISTで確率に変換します。両側です。

p=TDIST(t値,n-2,2)

もっと簡単な方法があるかも知れませんが、私ならこう計算します。(アドインの分析ツールを使う以外は)

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場...続きを読む

QエクセルのF検定

エクセルでF検定をすると,検定結果が表として出ます。その中で,上から平均,分散,観測数,自由度とあり,その下に観測された分散比,P(F<=f)両側,F境界値両側が表示されます。下3段の「答えを出した式」と「意味」を簡単に教えて下さい。

Aベストアンサー

こんにちは.「分析ツール」を使って「F検定」をした場合の結果の解釈法ですね.

F検定とは,二つの変数の分散がどの程度異なっているかを統計的に調べる方法です.
二つの変数を仮に変数Aと変数Bとします.

変数A:変数Aの分散を「分散A」,変数Aの個数を「個数A」
変数B:分散B,個数B(※上と同様)

<観測された分散比>
いわゆるF値のことです.
このF値とは
[個数A×分散A×(個数B-1)]/[個数B×分散B×(個数A-1)]
という計算式から産出されます.上の式がごちゃごちゃしてよくわからない場合は,変数AとBの個数が同じ,すなわち「個数A=個数B」である場合を考えてみると,すっきりするでしょう.つまり……

分散A/分散B

となるわけです.まさに「(観測された)分散比」,分散の比なわけです.

<P(F<=f) 両側>
上記で産出されたF値が(F=1,「すなわち二つの変数は同じ」を基準にした場合と比べて)どの程度珍しい現象なのかを,F分布を使って確率を計算したものです.
この確率の計算式は……統計学の専門書を見てもらわないことにはどうにもなりません.ただし単純に数値を算出するのであれば,Excelの関数「fdist」を使えば産出できます(ただしfdistは,二つの分散のうち大きな数値の方を自動的に分母として確率計算をします).

<F 境界値 両側>
分析ツールで入力するときに,「α(有意水準)」を設定する欄に「0.05」がデフォルトになっていたと思います.これは「統計的に有意水準(あるいは危険率)が5%である場合の」有意に,個数Aと個数Bにおけるこのデータにて二変数の分散が有意に異なるというためのぎりぎりのF値,という意味です.F値がこれ以上であれば,統計的に分散は異なる,という判断をすることができます.ただし確率が直接算出されているので,この情報はあまり意味はないですが
……(ただし,分散Aが分散Bに比べて小さい場合は,このF値は逆の解釈をしなければならないのかな? とにかく確率を直接参照する方がよいです)

さて,以上のことを踏まえて,結局F検定は何を調べるかというと,変数AとBの分散である分散Aと分散Bが統計的に異なっているかどうかを判断するための検定です.

もし分散Aと分散Bが同じ値であるならばF値は「1」になる,少なくともそれに近い値になるはずです.だけど,F値が2とか1.4とかである場合,両者の分散は同じであると判断して良いのかどうか,なかなか悩むところです.そこで統計学の力を使って判断をしようというわけです.
一般に確率が小さければ,αの数値(たいていはα=0.05)よりも小さければ,その分散比は「同じとは言えない→異なる」と判断をするようになっています.
詳細は,統計学の教科書の「F検定」を参照してください.

こんにちは.「分析ツール」を使って「F検定」をした場合の結果の解釈法ですね.

F検定とは,二つの変数の分散がどの程度異なっているかを統計的に調べる方法です.
二つの変数を仮に変数Aと変数Bとします.

変数A:変数Aの分散を「分散A」,変数Aの個数を「個数A」
変数B:分散B,個数B(※上と同様)

<観測された分散比>
いわゆるF値のことです.
このF値とは
[個数A×分散A×(個数B-1)]/[個数B×分散B×(個数A-1)]
という計算式から産出されます.上の式がごちゃごちゃしてよくわからない...続きを読む

Q正規母集団の標本平均と標本分散の独立性

X_1,…,X_nを正規母集団から取った大きさnの標本とします。
簡単のため、母集団の平均は0、分散は1と仮定します。

このとき標本平均X=(X_1+…+X_n)/nと
標本(不偏)分散s=((X_1-X)^2+…+(X_n-X)^2)/(n-1)
を考えます。

Xは平均0、分散1/nの正規分布に、
(n-1)sは自由度n-1のχ^2分布に従うと思いますが、
このXとsの独立性の証明はどうやったらよいのでしょうか?

結合分布の計算にX_i^2が混じるので大変に面倒です。
非芯χ^2分布の特性関数の計算などを使うのでしょうか。
方針は立つものの、あまりに煩雑な計算になりそうで尻込みしています。
簡便な計算法をご存知であれば教えていただきたく思います。
よろしくお願いします。

Aベストアンサー

申し訳ありませんが、行列を使って書きます。あと、ちょっと難しめです。

u, v を正規分布に従う平均0の確率変数(スカラー)とします。この2つが独立である条件は、E[uv]=0 であることはご存じだと思います。

今、x=(x1,x2,...,xn)' を標準正規分布に従う確率変数ベクトルとします。したがって、E[x]=0, E[xx']=I です。また、i=(1,..,1)' とします。すると
平均 X = 1/n i'x
分散 s = 1/(n-1) (x-iX)'(x-iX)
と書けることが分かります。ここで
x-X = x - 1/n ii'x
= (I - 1/n ii')x
であり、
(I-1/n ii')'(I-1/n ii') = (I-1/n ii')
であることから
(n-1)s = x'(I-1/n ii')'(I-1/n ii')x
と書くことが出来ます。ここで u=i'x, v=(I-1/n ii')x とおくと、u, v 共に正規分布に従い、
E[uv'] = E[i'xx' (I-1/n ii')']
= i'E[xx'](I-1/n ii')'
= i'(I-1/n ii')' = 0
となるため、u, v は独立であることが分かります。
したがって、独立な確率変数から計算された統計量はやはり独立なので、X と s は独立になります。

申し訳ありませんが、行列を使って書きます。あと、ちょっと難しめです。

u, v を正規分布に従う平均0の確率変数(スカラー)とします。この2つが独立である条件は、E[uv]=0 であることはご存じだと思います。

今、x=(x1,x2,...,xn)' を標準正規分布に従う確率変数ベクトルとします。したがって、E[x]=0, E[xx']=I です。また、i=(1,..,1)' とします。すると
平均 X = 1/n i'x
分散 s = 1/(n-1) (x-iX)'(x-iX)
と書けることが分かります。ここで
x-X = x - 1/n ii'x
= (I - 1/n ii')x
であり、
(I-1...続きを読む

Q統計学・検定の問題です、特に有意水準について

ある製薬会社が、その特許新薬は、9割の患者についてアレルギー症状を治すことができると広告した。

200人について試用の結果、170人については治った。

この製薬会社のいうことは正しいといえるか。有意水準1%で検定せよ。


 という問題なのですが、X0の-2,36は導き出せるのですが、この場合の有意水準X0.01(?)が-2.33になるのがよくわかりません;。

 有意水準自体よくわかってません;。5%なら倍になって90%の1.64を使うのは両側検定だから、になるんですよね?90%の1.64と95%の1.96と99%の2,58だけで良いものと思ってたのですが。

 ごめんなさい。かなりわかってないと思います。こんな質問でわかるでしょうか?よろしくお願いします。
 

Aベストアンサー

>5%なら倍になって90%の1.64を使うのは両側検定だから、になるんですよね?

書かれていることが曖昧なのですが、両側検定用の分布表を用いているのなら
両側検定の時は95%のところを見て、片側検定の時には90%のところを見ます。

-1.96以下の確率 -1.96~1.96の確率 1.96以上の確率が、

2.5% 95% 2.5%

両側検定の時は

有意水準5%→両方足して5%→真ん中が95%なので95%のところを見る。


5% 90% 5%

片側検定の時は片方が5%→『両側検定用の表で90%と書いてあるところを見ましょう。そうすれば片側が5%のところが分かります。』
ということなのです。
この問題の場合、片側検定をしていると思われます。有意水準1%の片側検定なら

1% 98% 1%

で98%のところを見てください。2.33になってませんか?

Q両側検定と片側検定の違い

t分布表を用いた検定をする時の、両側検定と片側検定の違いは何ですか???

教えてください!!お願いします。

Aベストアンサー

平均値の差の検定を行うときにt分布を利用したりしますが,例えば「2群の母平均値に差はない」とか「標本平均値は母平均値と同じである」のように標本から得られた平均値と母集団の平均値が同じかどうか(差があるかどうか)を確かめるときは両側検定。

一方,「標本平均値は母平均値よりも小さい(大きい)」のように標本から得られた平均値が母集団の平均値よりも小さいか大きいかを確かめるときには片側検定。

と,理解しておけばよろしいかと思います。ただし,2群の平均値の差の検定は両側検定だけでなく片側検定も定義できるようですが,そのような例はあまり見たことがありません。なので,前述したように覚えておいても問題ないでしょう。

Q前年比の%の計算式を教えてください

例えば前年比115%とかよくいいますよね?

その計算の仕方が分かりません・・・
例えば 前年度の売り上げ2.301.452円
    今年度の売り上げ2.756.553円
の場合前年比何%アップになるのでしょうか?計算式とその答えを
解りやすく教えて下さい・・・
バカな質問でゴメンなさい(><)

よろしくお願いします。

Aベストアンサー

 
(今年の売上÷前年の売上×100)-100=19.8%の売上増加

 

Qフーリエスペクトルの振幅について

ある時間関数を離散フーリエ変換して得られるフーリエスペクトルの
振幅値について教えて下さい。

今想定している離散フーリエ変換の式は一般的なもので
Σ(k=0~N-1) f(k)exp(-2πkni/N)
を考えています。
また、離散フーリエ変換して得られるスペクトルは
√(Re^2+Im^2)
で計算します。

離散フーリエ変換を適用する関数を、
振幅1の直流、及び振幅1で周波数5[Hz]の正弦波とします。
(この2つの信号は別々の信号で合成されていません。)
サンプリング周波数を20[Hz]とした場合、
サンプリングして得られるデータ列はそれぞれ、
直流: 「1, 1, 1, 1」
正弦波: 「0, 1, 0, -1」
となると想定されます。
(正弦波をサンプリングする場合は位相が関わってきますが、
今回は気にしないで下さい。)

このデータ列に対して上記の離散フーリエ変換を適用した場合、
得られるフーリエスペクトルの振幅値はそれぞれ、
直流: 「4」(直流のフーリエスペクトルの振幅値値)
正弦波: 「2」(5[Hz]のフーリエスペクトルの振幅値)
となります。
(データ点数は上の通り4点)

ここで質問なのですが、
離散フーリエ変換して得られるスペクトルの振幅値から
元の関数の振幅値を求める場合、
フーリエスペクトルをサンプリングの総データ点数で割ることは
数学的に納得できます。
しかしこの例の場合、フーリエスペクトルを総データ点数で割ると、
直流: 「4 -> 1」
正弦波: 「2 -> 0.5」
となってしまい、直流は正しいのですが、
正弦波の元の振幅値を正確に求めることは出来ません。
フーリエスペクトルの振幅値から正弦波の振幅値を正しく求めるには、
「フーリエスペクトルの振幅値*2/データ点数」
としてやらなければいけません。

上記のことに関して、
なぜこのようになるのかを(2をかける理由を)教えて頂けないでしょうか。

ある時間関数を離散フーリエ変換して得られるフーリエスペクトルの
振幅値について教えて下さい。

今想定している離散フーリエ変換の式は一般的なもので
Σ(k=0~N-1) f(k)exp(-2πkni/N)
を考えています。
また、離散フーリエ変換して得られるスペクトルは
√(Re^2+Im^2)
で計算します。

離散フーリエ変換を適用する関数を、
振幅1の直流、及び振幅1で周波数5[Hz]の正弦波とします。
(この2つの信号は別々の信号で合成されていません。)
サンプリング周波数を20[Hz]とした場合、
サンプリングし...続きを読む

Aベストアンサー

離散フーリエ変換というのは、実質離散フーリエ級数展開なので、
フーリエ級数展開を考えます。

f(t) = a0/2 + Σ[n=1→∞] { an cos (nωt) + bn sin (nωt) }

f(t)の周期をTとして、ω=2π/Tです。

直流成分の振幅といっているのはこの第1項a0/2のことで、
サイン成分の振幅はbnのことです。

問題文の離散フーリエ変換の式

>Σ(k=0~N-1) f(k)exp(-2πkni/N)

は複素フーリエ級数展開なのでオイラーの公式

cos nωt = [e^{inωt}+e^{-inωt}]/2
sin nωt = [e^{inωt}-e^{-inωt}]/2i = = -i [e^{inωt}-e^{-inωt}]/2

を使って書き直すと、

f(t) = a0/2 + Σ[n=1→∞] { ([an -i bn]/2) e^{nωt} + ([an +i bn]/2) e^{-inωt} }

an = a(-n), bn = -b(-n)の関係があるので、

cn = ([an -i bn]/2), c(-n) = ([an +i bn]/2)

と置くことができ、a0/2をc0と定義し直せば、

f(t) = Σ[n=-∞→∞] cn e^{nωt}

したがって、複素フーリエ係数が求めているのはcn = (an-ibn)/2で、その実数部はan/2、虚数部は-bn/2です。

こうなる理由は、サイン、コサインのときは正の整数だったnを複素数で取り扱うときにマイナス側に拡張したことで、同じ係数が+側と-側にわかれたためです。

離散的な場合は和が-N/2~N/2の範囲の有限項で打ち切られ、
-N/2~0の範囲が一周期ずらされてN/2~Nになっています。

離散フーリエ変換というのは、実質離散フーリエ級数展開なので、
フーリエ級数展開を考えます。

f(t) = a0/2 + Σ[n=1→∞] { an cos (nωt) + bn sin (nωt) }

f(t)の周期をTとして、ω=2π/Tです。

直流成分の振幅といっているのはこの第1項a0/2のことで、
サイン成分の振幅はbnのことです。

問題文の離散フーリエ変換の式

>Σ(k=0~N-1) f(k)exp(-2πkni/N)

は複素フーリエ級数展開なのでオイラーの公式

cos nωt = [e^{inωt}+e^{-inωt}]/2
sin nωt = [e^{inωt}-e^{-inωt}]/2i = = -i [e^{inωt}...続きを読む


人気Q&Aランキング