医学データを用いる研究をしているのですが、例えば50人の個々人の血液検査の検査結果から、血清アルブミンと尿素窒素を比較したいときは、対応のある、ノンパラ法(ウィルコクソンの符号付順位検定)を利用するべきなのか、そうではないのか・・・

恥ずかしい話、統計解析の「対応」についての理解ができていないからだとは思いますので、そこら辺りからお教えいただけでばありがたく思います。

よろしくお願いいたします。

このQ&Aに関連する最新のQ&A

A 回答 (3件)

「血清アルブミンと尿素窒素を比較」


といいますが、これらはまったく別の測定値なので「比較」ということは意味をなさないと思います。

もしかしておっしゃりたいのは
「血清アルブミンが高い人は尿素窒素も高い(が低い)傾向があるかどうかの検定」→「血清アルブミンと尿素窒素の値には正(負)の相関関係があるかどうかの検定」ということですか?

だったらピアソンの相関係数(両データ群が正規分布に近いとき)またはスピアマンの順位相関係数(両データ群が正規分布から遠いとき)を用います。

ウィルコクソンの符号付順位検定(または paired-t-test)はこの50人の一つのパラメータ(例えばアルブミン)が、ある治療薬の投与前/投与後で有意な変化を示したか、などの検定に用います。

具体的に何を知りたいと思っているのかもう少し補足してください。

統計ソフトにStat Viewを用いておられるなら、下記の解説書がお勧めです。読めば誰でも分かるように書いてあります。

「StatView 医学統計マニュアル」 長田 理 著 真興交易医書出版部

この回答への補足

早速の回答ありがとうございました。

おっしゃるように、求めたいのは、「血清アルブミンが高い人は尿素窒素も高い傾向があるかどうかの検定」です。

回答から推測すると、タンパク質付加によるアルブミン値やBUNの変化といったものは、対応があるということになり、ウィルコクソンでも大丈夫ということになりますね。

一応お奨めの「StatView 医学統計マニュアル」は持っておりますが、データに見合った統計処理の適切な方法がわからず、このような質問をさせていただくことになった次第です。
勉強不足で申し訳ありません。

補足日時:2001/11/20 12:10
    • good
    • 0

「対応」という一般論ではお答えしにくいですが・・・。



同一の対象群の同一のパラメータ(例えばアルブミン)を時系列で比較する場合、「対応がある」と考えます。

それに対し、パラメータが一種類でも対象群が複数ある場合(例:男30人と女20人の各群間におけるBUN値の比較;この場合「対応のないt-検定」を用いる)、または対象群が同一でもパラメータが複数ある場合(この質問のケース)などは「対応なし」と考えます。

うまく一般化して説明できないのですが(もしかしたら間違っているかも)、大体こういうことだと思います。
    • good
    • 0
この回答へのお礼

何度も丁寧なお答えありがとうございました。
とてもわかりやすい解説でした。

統計処理は難しい上、それにばかり時間をとるわけにもいかないのが現状です。今後も、また、質問をさせて頂くこともあるかと思いますが、どうぞよろしくお願いいたします。

お礼日時:2001/11/20 14:16

☆☆☆追加です☆☆☆



>回答から推測すると、タンパク質付加(負荷?)によるアルブミン値やBUNの変化といったものは、対応があるということになり、ウィルコクソンでも大丈夫ということになりますね。

そのとおりです。(^_^)v

件の本での該当部分は6章と11章です。

「ウィルコクソン」と「対応のあるt検定」の使い分けについても6章に書いてあるはずです。

ちょっと#1回答の仕方が失礼だったかもしれません。お詫びします。m(_ _)m
    • good
    • 0
この回答へのお礼

本当に素早い回答ありがとうございました。

お詫びなんてとんでもないです。
甘えてしまい、申し訳ないのですが、結局、「対応」というのは何なのでしょう?

よろしくお願いします。

お礼日時:2001/11/20 13:06

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

QエクセルのT検定

エクセルでT検定をしたいのですが「等分散」と「分散が等しくない」の使い分けがわかりません 分かる方教えてください

Aベストアンサー

A列のデータとB列のデータがあったときに
=FTEST(A1:A10,B1:B7)
のように計算した結果が0.1より大きければ,等分散を使います。
そうでないときは分散が等しくないを使います。

Qウィルコクソンの符号順位検定の表をみています。

http://aoki2.si.gunma-u.ac.jp/lecture/Average/mpsr-table.html
の欄でずーと考えています。
NとTは、何とか理解できたのですが、有意水準のところの数字が全く理解できません。
又、この欄に記載していることも分かりません。

Aベストアンサー

α=x.xxは,その表が片側検定の場合にその有意水準で
有意である場合の表であることを示しています.

例えばα=0.05の表(左端の表)は,
 N = 5で, T = 0以下の時,5%水準で有意,
 N = 6で, T = 2以下の時,5%水準で有意,
  …
という意味になります(片側検定であることに注意).

更に,この表でN = 5, T = 0の時の0.03125は,実際のこのときの確率値(p値)が0.03125であることを示しています.
つまり,N = 5の時,Tが0以下になる確率は3.125%であるということになります.

ですから,N = 5,T = 0の時には,実際の確率値は3.125%であり,それが5%を下回っているから,5%水準で有意だといえる,という結論になるわけです.

QT検定(エクセル関数)の数値の大きさ

エクセル関数のTTESTにて
9.89・9.90・9.91・ 9.92・ 9.93

9.84・ 9.88・9.98・ 9.88・ 9.90
でのTTESTは0.678(検定の種類は3です)でした。
0.05より大きいので、有意差はないのはわかりましたが、
この0.678という数値の大きさの度合いには意味があるので
しょうか?
大きいほど、差がないといえるのでしょうか?
統計初心者です。検討違いのコトを言っていたらすみません。

ご返答よろしくおねがいします。

Aベストアンサー

大きさの度合いに意味はあると思いますよ。

TTESTの関数値を p とします。(今の場合は p = 0.678。しかし示されたデータで計算すると p= 0.59 ほどになったけど計算はあっているかな)

すると、

「p が大きいほど、サンプルにおいて両群の平均が近いか又は分散が大きい」

ということが言えます。このことは、原点に立ち返って t 検定の手順を眺めると見えてきます。 t 検定というのは、次の t を計算し、それを t 分布にあてはめて p を計算します(両群の分散が異なる想定の場合)。

t = |m1 – m2|/(v1/n1 + v2/n2)^0.5

ここで、 m1 と m2 は両群のサンプル平均、v1 とv2 は両群のサンプル分散、n1 と n2 はサンプルにおける両群の客体数です。

p は、t の単調減少関数です。したがって、

p が大きい
⇔ t が小さい
⇔ |m1 – m2| が小さいか又は v1/n1 + v2/n2 が大きい

となって、上のことが言えるわけです。

この結論は、あくまでサンプルについてのもので、母集団についてのものではありません。この点でけちをつけようと思えばつけられます。しかし、だからといって、 p の大きさの度合いに意味がないとするのは、言い過ぎだと思います。

大きさの度合いに意味はあると思いますよ。

TTESTの関数値を p とします。(今の場合は p = 0.678。しかし示されたデータで計算すると p= 0.59 ほどになったけど計算はあっているかな)

すると、

「p が大きいほど、サンプルにおいて両群の平均が近いか又は分散が大きい」

ということが言えます。このことは、原点に立ち返って t 検定の手順を眺めると見えてきます。 t 検定というのは、次の t を計算し、それを t 分布にあてはめて p を計算します(両群の分散が異なる想定の場合)。

t = |m1 – m2|/(v1/n1 ...続きを読む

Qハフマン符号 情報源記号と符号語の対応表

S=(a1 0.15 , a2 0.3 , a3 0.05 , a4 0.2 a5 0.25 , a6 0.05)
この情報源Sに対するハフマン符号をハフマン符号の木を構成することにより、情報源記号と符号語の対応表を示せ。
という問題があるのですが、これについて質問です。

符号の木は、これらのa1~a6が二進数でどうなるのかがわからないと書けないと思うのですが、この問題にはその二進数の割り当てがしてありません。
これは最初からa1ならば0やa2ならば01という風に決まっていたり、また、勝手に割り当ててもいいのでしょうか?

どなたかご教授お願いします。

Aベストアンサー

順序が逆じゃない? 記号の出現頻度を元に木を構築して、木の構造から符号を構成する。ハフマン符号はそういう手順だと記憶している。
木の各分岐のどちらに0,1を割り当てるかは勝手に決めれば良いと思うけど。

Qエクセルで(対応ある)t検定がしたい

ネットで調べて2013年バージョンのものにはT.TESTを使えばできると書いてあったので数値を当てはめてやってみたのですが、結果が「6.1908E-05」みたいなよくわからない数値と記号?が出て来ました…どこがいけないのでしょうか……
分かる方、教えて頂きたいです。

Aベストアンサー

No.1 です。

> 結果の数字の意味は理解できたのですが、この数字は何を意味しているのでしょうか…?
> t値ですか?それともこれは0.1%水準で有意ですよ、ということを示しているのですか?

下記URLのページの「Excelの関数で算出するt検定」の項に、次のように書かれていますので、帰無仮説が棄却できる確率(p値)のようです。
『 ttest関数は検定結果として帰無仮説が棄却できる確率(p値)を算出する』

「平均値の検定」
http://www.aoni.waseda.jp/abek/document/t-test.html


ご参考

「T.TEST関数/TTEST関数でt検定を行う」
https://dekiru.net/article/4597/

「対応のある場合のt検定…例題・問題」
http://www.geisya.or.jp/~mwm48961/statistics/ttest_question1.htm

Q三角関数の問題です。どうしても解けません。おしえていただけたらありがた

三角関数の問題です。どうしても解けません。おしえていただけたらありがたいです。
次の方程式を解け、ただし0≦x<2πとする。

(1)(cosx-1)(2cosx-1)=0

(2)(tanx+1)tanx=0

(3)4sin2x=3

わかりやすく説明していただけると助かります。
よろしくお願いいたします。

Aベストアンサー

>どうしても解けません。
何が分からないのでしょう。
どのように思考して考えたかの経過を補足にお書き下さい。

(1)
cosx=1 または cosx=1/2

0≦x<2πの範囲で 上の cosx の値になるxを求めれば良いでしょう。

(2)
tanx=-1 または tanx=0

0≦x<2πの範囲で 上の tanx の値になるxを求めれば良いでしょう。

(3)
>4sin2x=3
これは 4(sinx)^2=3 ですか?
そうであれば
4(sinx)^2-3=0
(2sinx-√3)(2sinx+√3)=0
sinx=√3/2 または sinx=-√3/2

0≦x<2πの範囲で 上の sinx の値になるxを求めれば良いでしょう。

Qサンプル数の異なる2群間におけるT検定について

サンプル数の異なる(50,15)2群間の身長の比較を行うのに、T検定をするよう指示を受けました。これは、長男と次男での出産時の身長に差があるかを調べるためですが、長男50人分と次男15人分(母親は異なる)のデータのため、サンプル数が違います。またT検定は私の理解では平均の比較(2群の場合)を行うものであるため、平均ではないこれらにどうしてT検定が良いのか、また統計ソフト(STATISTICAかエクセル)を使う場合にどのようにデータを入力すれば良いのかわかりません。
どなたかご存知の方がいらっしゃればアドバイスをいただけたらうれしいです。
よろしくお願いします。

Aベストアンサー

>平均ではないこれらにどうしてT検定が良いのか
 t検定は、2つの集団の平均値の差について検定する、すなわち、有意差があるかどうかを判定します。平均ではないように見えても、検定の計算式の中に、2群の平均値を用いています。
 ただ、前提時要件があって、2群が正規分布していることが必要です。サンプルを選んだときに、無作為抽出していたり、サンプル数が1000ほどあれば、正規分布を想定できます。

 検定法は、どの方法を選ぶかは、研究者の自由です。わたしがt検定を多用するのは、正規分布を想定でき、計算式が分かりやすく、サンプル数が2群で異なっても良い、その数も少なくて良い(大差があるので、1群3例でも有意差をだしています)、そして有意差が出やすいからです。

 この場合は、正規分布しているという条件を満たしているとはいえないだろうと判断します。その場合は、F検定をしてください。これは、2群の平均値ではなく、バラツキによって検定する方法です。正規分布している必要は無いとされています。
 F検定で有意差があれば、問題ありません。t検定では有、F検定ではなし、になると方針が定まりませんが(現在このデータで悩んでいます)。

>どのようにデータを入力すれば良いのか
 t検定を指示した人は、身近にいないのでしょうか。その人に訊くのが一番です。身近にいないのなら、いないと返答があれば、書き込みますが。 というのも、大学などの研究テーマだと、指導教員をさしおいて、はマズイノデ。もしも、このテーマに興味を持てば、私が実施して先に発表します。こんな研究内容がハッキリ分かる書き込みを4年生がやったら、研究室は追放ですね。
 長男、次男だけではなく、三男、四男となると多重比較という方法になります。この場合、H検定(エクセルだけでは無理でしょう)を使います。

>平均ではないこれらにどうしてT検定が良いのか
 t検定は、2つの集団の平均値の差について検定する、すなわち、有意差があるかどうかを判定します。平均ではないように見えても、検定の計算式の中に、2群の平均値を用いています。
 ただ、前提時要件があって、2群が正規分布していることが必要です。サンプルを選んだときに、無作為抽出していたり、サンプル数が1000ほどあれば、正規分布を想定できます。

 検定法は、どの方法を選ぶかは、研究者の自由です。わたしがt検定を多用するのは、正規分布を想...続きを読む

Qハミング符号 ブロック符号を求める

授業で分からないところがあるので教えてください。

ブロック符号Wを情報ビット行列Uと生成行列Gの積で表す。
W=U*G

例えば、
U=(1100)

   1000111
G= 0100011
   0010101
   0001110

のとき、W=U*G=[1100100]

となるそうなのですが、なぜそうなるのか分かりません。
どういうふうにUとGを掛けてるのか教えてください。

Aベストアンサー

> W=[a*e+b*f+c*g+d*h a*i+b*j+c*k+d*l c*m+…]
この各要素の計算は mod 2(2で割った余り)の計算をします。
「+」をEOR(排他的論理和)で計算することと同じです。

> この2でmodというの使って、余りが0なら0に置き換えるということですか?
その通りです。
2 mod 2 = 0です。

3 mod 2 = 1
1 mod 2 = 1
0 mod 2 = 0
4 mod 2 = 0
と言う計算になります。
EOR(+をEORの演算子とする)では
1+1=0 (2 mod 2=0に対応
0+0=0 (0 mod 2=0に対応)
0+1=1+0=1(1 mod 2=1に対応)
1+1+1=0+1=1(3 mod 2=1に対応
1+1+1+1=0+0=0(4 mod 2=0に対応)

mod 2の演算では
> W=[1100122]
=[1 1 0 0 1 0 0]
これがブロック符号の計算で使われる演算則です。

Qexcelの対応のないt検定について

こんにちは。統計について質問させてください。

対応のないt検定を行おうと思っているのですが、比較しようとしている集団Aと集団Bの被験者の人数が異なっています。(例 集団A=68名 集団B=48名)

(1)この場合、t検定は行えますか?
(2)エクセルで行う場合、データタブのデータ分析、t検定等分散を仮定した2標本による検定でよろしいでしょうか?

宜しくお願いいたします。

Aベストアンサー

http://www.geisya.or.jp/~mwm48961/statistics/bunsan1.htm
この辺を見たら幸せになれるでしょう。

Q2乗値をルートした値に符号をつけるとすれば 絶対値に符号を付けるとすれば?

中学数学レベルから統計の勉強をしているものです。そこから派生した数学の質問です。
宜しくお願いします。
 統計の中で 偏差の合計値が0になるので 偏差を2乗してルートした正の値を利用するというのがあります。
 その逆の事で ルートした値を 元の値に戻したいとした場合 値に+か-をつけることになりますがこの時 どんな考え方(どんな詰め方)で +-の符号をつけていけばいいんでしょうか?  

 もう少しわかりやすく言い換えますと  複数のデータ(例えば1000個あります、中には同じ数値も有るかもしれません)があって、それぞれ1000個の値は +(プラス)か-(マイナス)だけなんだけれども、どちらかわかりません。ただ合計すると0になる事がわかっています。 その時それぞれの値が+か-かを判定するにはどんな手順で考えればいいかという事です。
エクセルとかでやってますので何か使えそうな関数、やり方とかもあれば教えて下さい。
本当に簡単なマクロも少しだけ解ります。
基本は足し引き掛け割り算しかわかりませんので できるだけわかりやすくお願いします。

簡単な例(6個)
例 2,4,5,6,8,9 (順に前からA、B、C、D、E、F)
答 B,C,Eがマイナス(プラス)  A、D,Fがプラス(マイナス)   ←これを導く手順です

中学数学レベルから統計の勉強をしているものです。そこから派生した数学の質問です。
宜しくお願いします。
 統計の中で 偏差の合計値が0になるので 偏差を2乗してルートした正の値を利用するというのがあります。
 その逆の事で ルートした値を 元の値に戻したいとした場合 値に+か-をつけることになりますがこの時 どんな考え方(どんな詰め方)で +-の符号をつけていけばいいんでしょうか?  

 もう少しわかりやすく言い換えますと  複数のデータ(例えば1000個あります、中には同じ数値...続きを読む

Aベストアンサー

基本的に、符合を元に戻す確実な方法はありません。
質問にある「簡単な例」でも、質問の答とは別に

2,4,5,6 が同符号
8,9 がそれとは反対の符合
でも、OKです。
※ついでにいえば、本質的には、その2組しかありません(しらみつぶしで確認)

一応、ある程度、それらしい答えを導く方法はあります。

・すべての数字を合計する。質問の例では、34
・だから、+の符号がつく数字を合計したら、34/2 = 17 で -の符号がつく数字を合計しても、同じく 17(-17)
・だから、合計して 17(元の数字の合計の1/2)になる組合せを見つけるという問題に帰着できます。

その方法は、データを大きい方から順に試してゆくと、比較的成功しやすいとはいわれています。

あと、その参考書の説明も少し違います。
確かに、計算上は、

・ばらつきを求めるのだから基準値(多くの場合は平均)との差が大きい方がばらつきは大きいだろう
・でも、基準値からの差(偏差)の合計は0になる

のは事実です。
ただ、意味の上では、「これでは計算上不便なので、偏差を正にする」ために、絶対値をとったり二乗したりするのではないのです。
「偏差」というのは、「基準値からの隔たり」です。ばらつきというのは、個々のデータが、基準値からどれだけ隔たっているかを計算するためのものですから、意味的には、もともと正の数字なのです。

距離を示すのに、方向を含めて考えれば、東に-100メートルという表現は意味がありますが、「距離」は、あくまでも100メートルなのです。

それを、計算上便利なように、絶対値をとったり二乗したりするので、本質的には、「足し合わせるとゼロになるのを避ける」のが目的ではありません。

ついでにいえば、「偏差を正にそろえる」ためなら、絶対値をとった方がわかりやすいです(そういう方法で計算したのが絶対偏差)でも、あえて二乗して平均して開方する(こちらは、標準偏差ですね)のは、このあと、分布の形(正規分布とか)を調べるのに、こちらの方が便利に使えるからです。

基本的に、符合を元に戻す確実な方法はありません。
質問にある「簡単な例」でも、質問の答とは別に

2,4,5,6 が同符号
8,9 がそれとは反対の符合
でも、OKです。
※ついでにいえば、本質的には、その2組しかありません(しらみつぶしで確認)

一応、ある程度、それらしい答えを導く方法はあります。

・すべての数字を合計する。質問の例では、34
・だから、+の符号がつく数字を合計したら、34/2 = 17 で -の符号がつく数字を合計しても、同じく 17(-17)
・だから、合計して 17(元の数字の合計...続きを読む


人気Q&Aランキング

おすすめ情報