【大喜利】【投稿~9/18】 おとぎ話『桃太郎』の知られざるエピソード

統計学に関しては全くの初心者です。現在、ある疾患の原因究明の研究に携わっています。具体的には、死後脳を使って候補遺伝子の発現量の違いを疾患群と健常者群とで比較検討を行います。そこで、データの解析法について御指導していただきたく存じます。論文など参考にするのですが、結果のみでそこにいきつくまでの考え方、解析の流れなどが判然といたしません。
得られた発現データと診断にてT検定を行うだけならクリアカットですが、死後脳を扱うために種々の影響を考えないといけないのではないかと思っています。実際、論文にはPMI(死後、脳摘出までの時間)、pH、死亡年齢などを考慮したように書いてあります。私の扱っているサンプルも調べてみると疾患群と健常者群でPMIなど有意な差があります。そのため、診断以外の変数が遺伝子の発現に影響している可能性を考える必要があるかと思います。素人なりに考えたのですが、それは重回帰分析をすればよろしいのでしょうか。それで発現量に影響を及ぼしている変数が見つかれば、それを共変量としてANCOVAを行う。発現量に影響を与える変数が見つからなければ、T検定もしくはOne-way ANOVAを行う。こういった考え方でよろしいでしょうか。統計ソフトはSTATISTICAを使う予定です。何卒、御指導の程よろしくお願いします。

A 回答 (2件)

最終的な目的は「遺伝子の発現量が疾患者と健常者とで異なるかどうか」ということ,そして遺伝子の発現量以外の変数としてPMI,pH,死亡年齢などがある。

そこで遺伝子の発現量を目的変数,PMI,pH,死亡年齢を説明変数として重回帰分析を行う。のように解釈しましたが間違ってませんかね。

私はまず遺伝子の発現量を疾患者と健常者とでt検定(2群の平均値の差の検定)を行い,その後,疾患者群のデータと健常者群のデータにおいて重回帰分析をすればよろしいのかと考えました。そうすれば疾患者群の発現量(または健常者群の発言量)にはどの変数が大きく影響しているかがわかるので,発現量に大きく影響を与えていると考えられる変数をt検定すればよい。

ただ,重回帰分析を行うといっても,それほど多くのサンプルサイズが得られるわけはありませんよね。極端な話,死体を何百体も解剖するわけにはいきませんでしょうから,そのような小さなサンプルサイズでは重回帰分析を行っても信頼できるものかどうかは不明です。

変数がそう多くないので,単純に各変数についてt検定を行えばよろしいのではないかとも思われます。他の人の回答も聞いてみましょう。

ちなみに,STATISTICAを使うのであればhttp://www.statsoft.com/textbook/stathome.htmlなど参考になると思います。
    • good
    • 0
この回答へのお礼

早々の御指導ありがとうございます。STATISTICAのサイト早速勉強させていただきます。まず疾患群と健常者群で発現量のT検定を行い、次に疾患群で説明変数のT検定を行い、有意な変数が見つかれば、その変数と発現量でT検定を行う。という流れでしょうか。この場合、結論は、ある説明変数が疾患群の発現量に有意な影響を与えているということでしょうか。私は、疾患以外の発現量に影響する変数を同定し、そしてその変数による影響を除外(補正)したうえで疾患と発現量との関係を調べたいのですが、そういった結論は導き出せますでしょうか。この辺りを補足していただけると助かります。

お礼日時:2006/10/23 09:47

> 結論は、ある説明変数が疾患群の発現量に有意な影響を与えているということでしょうか。



発現量を目的変数として回帰分析を行えばそのようなこともいえるでしょうが,t検定(2群の平均値の差の検定)では「差が認められる」ということしか分かりません。

> 疾患以外の発現量に影響する変数を同定し、そしてその変数による影響を除外(補正)したうえで疾患と発現量との関係を調べたい

疾患と発現量との関係についてですが,これは単純に相関係数を出してあげればよいのではないかと思います("思います"は少し無責任か、、、)。あるいは因果関係を支持したいのであれば,共分散構造分析などという手もあります。
    • good
    • 0
この回答へのお礼

再びの御指導ありがとうございます。共分散分析をしてみようと思います。統計学は奥が深く難しいです。

お礼日時:2006/10/24 20:18

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!