今だけ人気マンガ100円レンタル特集♪

英語論文に出てくる「independent t-test」という言葉の意味がわからずに困っています。t-testはt検定のことだと思いますが、独立t検定という方法があるのでしょうか? 論文は米国の大学図書館で利用者調査を行ったもので、該当する文は「専攻科目と場所としての図書館についての質問は、independent t-testを用いてIC-4(設問番号)と比較された」と訳せます。統計についてはまったくの初心者です。わかりにくい質問ですみません。ご教示のほど、お願いいたします。

このQ&Aに関連する最新のQ&A

A 回答 (1件)

independent t-testとは、


対応のないt検定(独立k標本のt検定、
独立2標本の平均値の差の検定)のことです。

対応のない場合というのは、
2つの群が独立している場合であり、
男と女というように性別で平均値の
差の検定を行おうという場合には
対応のないt検定を用います。

対応のあるt検定の典型的な例は、
事前と事後とで享受効果の有無を
比較しようとするような場合です。
この場合同一の被験者に事前と事後のデータを取り、
その平均値差を比較するため、
データ間に対応があるといえます。
    • good
    • 2
この回答へのお礼

わかりやすく教えていただき、ありがとうございました!

お礼日時:2010/07/13 08:18

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q対応のないt検定について

「Independent sample T test」というのは
「unpaired t test」と同じでしょうか?

Aベストアンサー

同じです。

日本語でも「独立k標本のt検定」といったり、「対応のないt検定」といったりするのと同じです。

日本語の場合、より正確にいえば「独立2標本の平均値の差の検定」などという表現もできますがね(^_^;)

Qt検定をしたときの論文の書き方

不等分散のt検定(ウェルチのt検定)をしました。
論文には、ウェルチであることを書くべきなのでしょうか?

これまで読んだ論文では、単純にt検定を行ったことのみが記述されていたように記憶しています。
しかし、等分散なのか不等分散なのかを記述しなくていいのだろうか…??とふと疑問に思いました。

Aベストアンサー

書いておいた方が親切だと思う. それまでの論文で書かれていないなら書かなくてもいいのかもしれんけど, 書いておいてレフェリーの判断に投げてしまっていいんじゃないかな.

Q相関係数についてくるP値とは何ですか?

相関係数についてくるP値の意味がわかりません。

r=0.90 (P<0.001)

P=0.05で相関がない

という表現は何を意味しているのでしょうか?
またMS Excelを使ってのP値の計算方法を教えてください。

よろしくお願い致します。

Aベストアンサー

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場合はp=0.1%でもいいと思いますが)
相関係数においても相関の有無を結論つけるにはそのrが偶然出る確率を出すか、5%の確率ならrがどれぐらいの値が出るかを知っておく必要が有ります。

>r=0.90 (P<0.001)

相関係数は0.90と計算された。相関がないのに偶然r=0.90 となる確率は0.001以下だと言ってます。

>P=0.05で相関がない

相関がないと結論。(間違っている確率は5%以下)だと言ってます。

エクセルでの計算ですが、まず関数CORRELを使ってr値を出します。xデータがA1からA10に、yデータがB1からB10に入っているとして

r=CORREL(A1:A10,B1:B10)

次にそのr値をt値に変換します。

t=r*(n-2)^0.5/(1-r^2)^0.5

ここでnは組みデータの数です。((x1,y1),(x2,y2),・・・(xn,yn))
最後に関数TDISTで確率に変換します。両側です。

p=TDIST(t値,n-2,2)

もっと簡単な方法があるかも知れませんが、私ならこう計算します。(アドインの分析ツールを使う以外は)

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場...続きを読む

Q母平均の検定と推定・・・対応の「ある」「なし」の使い分け

母平均の推定や検定において、対応の「ある」場合と「ない」場合の使い分けが分かりません。
たとえば、ある製品の部位Aと部位Bの厚みを比べるような場合は、対応が「ある」のだと思いますが、同じ部位をメーカーの異なる2つの装置でそれぞれ測定した場合、対応は「ある」のでしょうか?「ない」のでしょうか?

Aベストアンサー

「対応のある」方法は、個々のデータに比べたい相手がはっきり決まって
いるときに使います。これは、対になったデータの差を1系列のデータと
みなして、その平均がゼロであるかどうかを検定しているのです。この方法
が使えるかどうかは、データを対にすることの「もっともらしさ」で決まり
ます。

例えば、あるダイエット法に効果があるかどうか調べるときに、20人の
人間にそのダイエット法をやってもらい、前後の体重を量るとします。
このとき、同じ人間の前後の体重差を1つのデータとして扱うことは非常に
もっともらしいでしょう。このようなとき「対応のある」検定方法を使い
ます。

「対応のない」方法は、2つのデータ系列をA、Bと呼ぶと、A全体の
平均値とB全体の平均値が同じといえるかどうかの検定です。上の
ダイエットの例をこの方法で検定することは間違いではありませんが、
ダイエット効果による体重差が、20人の体重のバラツキの中に埋もれて
しまって、検出しずらくなります。


>同じ部位をメーカーの異なる2つの装置でそれぞれ測定した場合

これは2つの測定装置の差を見たいわけですよね。全く同じ物を測った
結果を比較するのが最もいいでしょうから、「同じ物の同じ部位」を
測定したデータを対にするのはもっともらしいと言えるのではないで
しょうか。すなわち、「対応のある」方法がよさそうです。


>ある製品の部位Aと部位Bの厚みを比べるような場合は

これは、「同一物」の部位Aと部位Bが同じ厚さになっていて欲しいと
いう要件があれば、「対応のある」方法がふさわしいでしょう。いや、
そこまでは求めない、製品群全体として部位Aの平均と部位Bの平均
が同じになれば構わない、程度ならば「対応のない」方法でも差し支え
ないでしょう。

edogawaranpo さんがお書きになったように、データを取るときから
「対応」を意識しなければなりません。どれとどれが対応するか分から
なくなってしまったら、「対応のない」方法を使うしかありません。

「対応のある」方法は、個々のデータに比べたい相手がはっきり決まって
いるときに使います。これは、対になったデータの差を1系列のデータと
みなして、その平均がゼロであるかどうかを検定しているのです。この方法
が使えるかどうかは、データを対にすることの「もっともらしさ」で決まり
ます。

例えば、あるダイエット法に効果があるかどうか調べるときに、20人の
人間にそのダイエット法をやってもらい、前後の体重を量るとします。
このとき、同じ人間の前後の体重差を1つのデータとして扱う...続きを読む

Qデータが正規分布しているか判断するには???

初歩的なことですが。。急いでいます。
おわかりになる方 教えてください。
サンプリングしたデータが正規分布しているかどうかを確認するにはどうすればよろしいでしょうか。
素人でも分かるように説明したいのですが。。
定性的にはヒストグラムを作り視覚的に訴える方法があると思います。今回は定量的に判断する方法を知りたいです。宜しくお願いします。

Aベストアンサー

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区間距離、度数区分数は、正規的なグラフになるように試行錯誤で行うことが多い(区間距離や度数区分数を本来の分布に則するようにいろいろ当てはめて解釈する。データ個数の不足や、データの取り方、または見かけ上の分布によりデータのばらつきが正しく反映されて見えないことがあるため)のですが、度数区分数は、機械的に、
=ROUNDUP(1+LOG10(データ個数)/LOG10(2),0):エクセル計算式
で区分数を求める方法があります。
 また、区間距離は、=ROUND((データの最高値-最低値)/(度数区分数値-1),有効桁数)で求め、区分の左端は、
=ROUNDUP(データの最低値-区間距離/2,有効桁数)
右端は=ROUNDUP(データの最高値+区間距離/2,有効桁数)
とします。
 区間がと度数区分数が出たら、その範囲にあるデータ数を数えて、ヒストグラムができます。
 
>最小側、最大側は 最小値、最大値を含んだ値としなければならないのでしょうか。
 ヒストグラム作成の処理に関しては、上記を参考にしてください。
 その前に、データの最小値と最大値が、正しくとれたデータか検討するため、棄却検定で外れ値が存在するか否かを検定し、外れ値が存在しないと結論づけられたら、正規分布の検定を行ってみてください。もし外れ値が存在する可能性があれば、そもそも、そのデータの信頼性が失われます。サンプリング手法の再検討(データの取り方に偏りがなかったか、無作為に設定してデータを取っていたか等)をして、再度データを得る必要があります。また、そもそも検定する以前に、データ数が少ないと判断が付かなくなってしまいますので、データ数は十分揃える(少なくとも20~30個)必要もあります。

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区...続きを読む

Qエクセルで計算すると2.43E-19などと表示される。Eとは何ですか?

よろしくお願いします。
エクセルの回帰分析をすると有意水準で2.43E-19などと表示されますが
Eとは何でしょうか?

また、回帰分析の数字の意味が良く分からないのですが、
皆さんは独学されましたか?それとも講座などをうけたのでしょうか?

回帰分析でR2(決定係数)しかみていないのですが
どうすれば回帰分析が分かるようになるのでしょうか?
本を読んだのですがいまいち難しくて分かりません。
教えてください。
よろしくお願いします。

Aベストアンサー

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるための指数表記のことですよ。
・よって、『2.43E-19』とは?
 2.43×1/(10の19乗)で、
 2.43×1/10000000000000000000となり、
 2.43×0.0000000000000000001だから、
 0.000000000000000000243という数値を意味します。

補足:
・E+数値は 10、100、1000 という大きい数を表します。
・E-数値は 0.1、0.01、0.001 という小さい数を表します。
・数学では『2.43×10』の次に、小さい数字で上に『19』と表示します。→http://ja.wikipedia.org/wiki/%E6%8C%87%E6%95%B0%E8%A1%A8%E8%A8%98
・最後に『回帰分析』とは何?下の『参考URL』をどうぞ。→『数学』カテゴリで質問してみては?

参考URL:http://ja.wikipedia.org/wiki/%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるた...続きを読む

Q平均averageとmeanの違い

数学の場の中でもaverageとmeanの意味は共に平均を指しますが

両者の違いは何なのでしょうか?

Aベストアンサー

面白いご質問と思いましたので、参加します。

Averageもmeanも日本語に直すと平均と訳されると思いますので、意味は大きく捉えれば同じと思います。

しかしAverageという意味は数学で述べるところ算術平均にとどまらず、そのデータ郡の典型的な姿を述べるている場合平均的(つまりAverageに近い)と述べると思います。

一方meanは統計用語として用いられてきておりますので、例えばmode(最も多く出現する数値)とかmedian(中央値、小から大へと数値をならべて、その中心にある数字)とかいう言葉を連想させます。つまりこれらの最頻値や中央値も英語の感覚で言えばAverageを表しております。

従いまして、違いは統計を学んだ方の発言か、そうでないかの違い程度の差なのだと思います。つまり述べようとすることはほとんど同じと思います。 たしかにmedianを辞書で調べてみましたら、Averageと出ておりました。

Q統計のp値 = 1.000って?

統計ソフトでFisherの正確検定(両側検定)を行ったところ、p値 = 1.000でした。ある24人と12人のグループでそれぞれ1人ずつに異常があり、各グループ間に違いがあるのかを分析したつもりなのですが、統計学的にあり得ることなのでしょうか?その場合、発表などで表にp = 1.000と書いて良いものでしょうか?

Aベストアンサー

p値は「真の発生確率が両グループでまったく同じ」という帰無仮説の下で実現したデータと同じかより極端なことが起きる確率の統計量です.
今回(Fisherの正確確率検定)の場合,周辺割合(各群の割合(12例と12例)と異常の発生割合(2/24))を与えたもとで,「両グループでまったく同じ」という今回のデータと同じか,より極端に両軍の発生割合が乖離する確率は1となりますから,両側p値は1となります.
したがって,書いていただいても問題ありません.
ただ,1/12と1/12で有意差がないことは自明ですから,わざわざ書く必要があるかと思う人もいるかもしれませんが.
取り急ぎ

Q統計のt検定について

t検定は何人から可能なのですか?また、t検定の精度は7、8人でも可能ですか

Aベストアンサー

 t検定は、2つのグループ(データ(数値)の集まり)間で、統計上差があるかどうかを検定するために用います。
 しかし、本検定方法を適用できるかどうかは、そのデータ分布が正規分布(例えば身長の分布などのような釣鐘型の分布)する前提ですので、正規分布かどうか不明な場合、適用できません。
 また、どちらか一方のグループのデータの分散値が大きい場合、統計上有意な差を検出できません。
 データの分布が正規分布であることが仮定できる場合には、分散値が小さい場合ならば7~8個のデータ数でも、t検定を用いて検定することは可能です。できれば20~30個のデータが揃えば、信頼性が高まります。
 正規分布が仮定できない分布の場合には、t検定よりノンパラメトリック検定の中のウィルコクソンの符号和順位検定か、Mann-Whitney検定など、条件により適用できる検定手法を選択することになります。正規分布でない分布の検定を行う場合には、これらノンパラメトリック検定を用いたほうが検出力が高くなります。なお、この検定は、検定手法によりグループの最低データ数がそれぞれあります。
 データ数については、ひとつのグループに、データが2個しかないと、標準偏差を出せませんので検定できません。3個でも、取り出したデータはそのグループの飛びぬけて離れた値を取り出している可能性があるので、あまり信頼性がないと判断されるでしょう。いくつあればいいのかは、データの分布により異なりますので、一概に言えません。
 t検定の精度という言い方は間違った言い方です。有意な差を検出できるかという意味かと思いますので、そのつもりで述べますが、差の検定は、取り出すデータの元のグループから、いかにまんべんなくデータを取り出せたかにかかっていますので、まんべんなく取り出せていれば少ないデータでも検定して有意な差が得られることもありますし、偏ったとり方をしてしまえば、間違った結果を導きかねませんので、いかにデータを抽出するか、その手法にかかっています。
 また、データをどのような目的で調べるかによっても必要なデータ数が変わります。5%の有意差で調べるのか、1%の有意差で調べるのかで変わりますので、まずは、予備調査を行い、それにより必要なデータサンプル数をそろえて本調査を行ってみてください。

 t検定は、2つのグループ(データ(数値)の集まり)間で、統計上差があるかどうかを検定するために用います。
 しかし、本検定方法を適用できるかどうかは、そのデータ分布が正規分布(例えば身長の分布などのような釣鐘型の分布)する前提ですので、正規分布かどうか不明な場合、適用できません。
 また、どちらか一方のグループのデータの分散値が大きい場合、統計上有意な差を検出できません。
 データの分布が正規分布であることが仮定できる場合には、分散値が小さい場合ならば7~8個のデータ数で...続きを読む

Q統計論文:ノンパラメトリック検定は?平均値or中央値?

正規分布を仮定できない分布の集団で検定をするとき、ノンパラメトリック検定を使いますよね?

例えば、独立2群で母平均に差があるか検定したいとき、t検定が使えない場合マンホイットニーU検定をしますが、

記述は、平均と標準偏差とP値を書くべきですか?

それとも、中央値とかを書くのですか?

論文の書き方の統計の質問です。。。

Aベストアンサー

マンホイットニーのU検定を行ったのであれば平均値ではなく中央値を書くのが正しいでしょう。そして中央値に加えてp値を記します(単にp<0.05とかではなくp=0.00145などのように)。場合によってはp値だけで中央値を書く必要もないかと思います。


このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング