急いでいます！

看護研究でサンプルサイズが異なるデータの比較

締切済

質問者：キミビッシュ
質問日時：2022/11/05 15:48
回答数：7件

取り急ぎ教えて頂きたいです！
このサイトで、他の方も質問してる回答を見てたりはしてたんですけど、よくわからなくて。
看護研究でアセスメントシート導入前と導入後の比較をしたいんですが、データの取る期間も導入前は1年半のデータで、導入後は4ヶ月間のデータで、対象者も月数によって総患者数が違うので、それを比較するのに、どの統計を使ったらいいかわかりません。
データ取ってる期間が違うから、そこで比較しても正確さに欠けると思いまして。
導入前後の期間を同じに揃えてやった方がいいのか、そのままでも出来る統計があるのか、またどのようにしていったらいいのか統計も素人なのでわかりません。
どなたか詳しい方教えて頂けませんか？
期限も迫ってて焦ってます。

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (7件)

最新から表示
回答順に表示

No.7

回答者： stomachman
回答日時：2022/11/07 16:39

No.2についてです。

　専門家の先生が本格的に解説なさっているのに鑑みて、No.2にもひとこと注意書きを加えておくかなと。

[A] まずはNo.2の分析をやってみて、帰無仮説Hが否定されたとすると、それは、m個の「導入前」のデータと、n個の「導入後」のデータには違いがある、ってことです。が、これは「導入によって違いが生じた」ということを意味しているわけではありません。単に、文字通り「これら2組のデータには違いある」というだけです。
　「導入」の前後でいろんな事情が異なる（「導入」したということ自体も「前後で異なる事情」のうちのひとつですが、他にも、COVID-19の流行がどうだったとか、疾患の種類の割合が変わってきただとか、季節の違い、窓口負担金額の変化、美人の看護師が産休に入っちゃったとか、その他いろいろあるでしょう）から、違いを生じた原因が何なのかは、これだけじゃわからない。ですから次に、それら様々な「事情の違い」は、「これら2組のデータの違い」にそれぞれどの程度寄与したのか、という分析に進みたい。
　
[B] やってみたらHを否定するどころか「これら2組のデータ」にさしたる違いはないじゃないのさ、となった場合は、単に「今回のデータでは何も言えませんでした。以上、終わり」でもいいんですが、いやそれで終わりにするには忍びない、ということもあります。すなわち、「「導入」によってコウいうことが生じるにキマッテる(と思う)から、違いが出ないはずはない(と思う)。なのにその（あるにちがいない）違いがデータに現れなかったのは、「導入」の前後でいろんな事情が異なる、それらの影響によって違いが埋もれてしまったり打ち消されてしまったりしたのではないだろうか」と喰い下がりたい。

　[A][B]いずれにしても、その先を続けるには、まず「これら2組のデータの違い」に対して「どんな要因が考えられて、それぞれがどんな因果関係を持つ(と思う)か」を記述するモデル（理論）を明確にした上で、「導入」単独の効果がどれだけあったかを分析しなくちゃなりません。それには、モデルに含まれる各要因について、その要因が各データに関してどうなっていたか、の情報が不可欠です。そういう情報がもしいくらかでもあるのなら、No.3〜に書かれたような様々な検討をやってみる余地があるわけです。
　すなわち、「個々データのそれぞれにおいて各要因がどうだったか（たとえば、どんな疾患だったか、例の美人ナースが担当だったか）」という情報が付いていると良いですが、いや単に、個々のデータが得られた日付が分かっているだけでも、いくらか前に進めるかもしれません。

- 0
- 件

通報する

No.6

回答者： kamiyasiro
回答日時：2022/11/06 03:31

#3です。

↓ちょうど良いサイトがありました。
ケースコントロールでは、調査全数（ｍ＋ｎ）に占める割合が意味を持たないことが分かると思います。

https://mylife-portfolio.work/cohort-casestudy/# …

- 1
- 件

通報する

No.5

回答者： kamiyasiro
回答日時：2022/11/06 02:48

#3です。

計量値であれば・・・、

傾向スコア分析は、交絡している年齢・性別・人種・職業などに関して、処置群と対照群でマッチングさせて、アセスメントシートの導入効果を測ることができます。

- 1
- 件

通報する

No.4

回答者： kamiyasiro
回答日時：2022/11/06 02:39

#3です。

サンプルサイズが異なるデータの比較で、間違いを起こす例としては「シンプソンのパラドックス」が有名で、たぶん学生時代に授業でやったと思います。

この事例（計数値）では、最小二乗平均（調整された平均）でオッズ比を取れば、男女をマージしても治療効果が認められます。

最小二乗平均も授業でやっていませんか？

- 1
- 件

通報する

No.3

回答者： kamiyasiro
回答日時：2022/11/06 02:22

正例負例両方でなく、正例しか集めていないとか、根本的な問題があるのですか？

コホート研究ですか、ケースコントロール研究ですか。
読んだところ、ケースコントロールのようですが・・・、

アウトカムは、計数値ですか、計量値ですか。

ケースコントロールでは、計数値であれば、リスクは使えません。オッズを使います。フィッシャーの正確確率検定も、ピアソンの適合度検定も趣旨は同じ（リスクを計算している）で、ケースコントロールには使えません。
計量値であれば、傾向スコアを使う必要があるでしょう。RCT（無作為化比較試験）が使われていませんから、交絡がかなりありそうですね。

群間のサンプルサイズの違いの原因や、アセスメントシート導入有無以外の因子は、調査期間（治療期間）だけですか。
その期間がアウトカムに影響があることを心配されているのですね。

操作変数法などの方法でその内生性バイアスを消すことができるか、がポイントです。

私だったら、まず、期間の影響から調べますね。

- 1
- 件

通報する

No.2

回答者： stomachman
回答日時：2022/11/05 17:14

まずは

　　H：m個の「導入前」のデータと、n個の「導入後」のデータには、何の違いもない。
を帰無仮説として、Hを否定できるかどうか、という検討をする。月数によって総患者数が違うとか、データ取ってる期間が違うとか、そういう違いを全部コミコミにした上で、それでも「違いはない」という帰無仮説です。
　帰無仮説Hが何を主張しているかというと、「導入前」か「導入後」かの区別にはそもそも意味がない、ということ。さらに言い換えれば、(m+n)個のデータからm個をテキトーに選んで「導入前」というタグをつけ、残りに「導入後」というタグを付けただけに過ぎない、というのが、帰無仮説Hの主張です。

　このことを使って、Hに関するp値を計算する。「フィッシャーの正確検定法」は何の仮定もいらない、全く言い訳のない計算方法です。どうやるかというと：
(1)実際の「導入前」のデータm個による何らかの統計量（たとえば平均値とか）vを計算する。（「データがHに従っているとき、ただの偶然のマグレでこのv（あるいはそれ以上の値）が出る確率」を表すのがp値ですね。）
(2) データm+n個を「導入前」m個と「導入後」n個に振り分けるやりかたN通り全てについて、以下を繰り返す：
　(2-1) その分け方による「導入前」m個の統計量を計算し、それがv以上になったら「成功」とする。
(3) 「成功」の回数をMとすると、p値 = M/N

　さて、もしpが0（あるいは1）にものすごく近い値であれば、「マグレにもホドがある！」というんで、「Hは否定できる」と判断するでしょう（その「ホド」を表すのがα値です）。さもなければ、「マグレでも起こりうること」だから、Hを否定できないでしょう。（この、Hを否定（棄却）するかどうかの判断を行うことを「検定」と言います。「フィッシャーの正確検定法」がやるのは、検定に必要なp値を計算するところまでです。一方、検定自体は、人が自分の価値観と判断によって行うんです。）
　特に注意すべきは、Hを否定できない場合には、「Hが正しい」ということも言えないという点で、つまり結論は「これだけのデータでは何も言えない」である。（ここを間違えているヒドイ教科書が結構多くてですね、いやもう、実に嘆かわしいことです。）

　ところが「フィッシャーの正確検定法」にはひとつ、大問題がある。というのは、N = (n+m)!/(n! m!) 通りであり、n, mがわずか数十程度であっても、スパコンを使ってもいつ終わるかわからんような膨大な計算になっちゃう。つまり、現実には実行不可能、という致命的な問題があるんです。

　そこで、(2)(3)のところを「ランダム化したフィッシャーの正確検定法」（どうやら、正式な名前はないらしい）で代用します。すなわち、
(2') N' = 10万とか1000万とかに決めて、以下をN’回繰り返す：
　(2'-1) データ(m+n)個から「導入前」m個を乱数を使ってランダムに選び、
　(2'-2)そうして選んだ「導入前」m個の統計量を計算し、それがv以上になったら「成功」とする。
(3') 「成功」の回数をM'とすると、p値 ≒ M'/N' でp値が推定できる。

　これなら楽勝で実行可能。もちろん、(2')の計算をやるには（たとえばExcelのマクロなどを使って）ちょっとしたプログラムを書く必要がありますが。また、N'をどう決めるかというと、p値の推定誤差の分散はp(1-p)/N'になるので、N'が大きいほど、正確なp値の推定ができる（代わりに時間がかかる）わけです。