被験者数20人ほどから300ほどの異なる項目に関してデータをとりました。
この20人を2つの群、AとBに分けて、
この300ほどの項目に関して、どのような違いがあるか見たいときに、
対応のないt検定、p<0.05で有意性を見たいと思った場合に、
300項目の5%、つまり15個は項目数の多さからランダムに有意になってしまうということでしょうか?
あるいはこの300ほどの項目間に相関があるかどうかを見たいときも、
15個の項目では、ランダムに有意になってしまうかもしれないのでしょうか?
項目数が膨大の場合に、どの項目が2群で差があるか、あるいは項目同士の相関の有無
を見るときにどのような解析方法をするのがふさわしいのでしょうか?
A 回答 (2件)
- 最新から表示
- 回答順に表示
No.2
- 回答日時:
項目がどっさりだけどサンプル数がかなり少ない状況である。
A,Bの間にどんな違いがあるか、あるいは(A, Bの区別を付けるという目的に於いて)項目間にどんな関連がありそうか。これはいきなり検定を考えるよりも、A, Bをできるだけ旨く切り分けるような判別関数を構成する、というアプローチが良さそうな気がします。
特別な準備なしにやるとすると、ええと、まずはA,Bの区別なしにデータの因子分析をし、主要な因子2~3個に絞った因子空間を構成する。この空間にA, Bのサンプルを散布して、両者が分離できそうかどうか、ともかく観察する。散布結果があんまりぐちゃぐちゃ入り交じるようなら、その因子はゴミっぽいから無視して、他の因子を取り上げ、また散布図を描いてみる。観察の結果イケそうな気がするのなら、せいぜい数次元程度の因子を使った線形判別関数を構成してみる。(support vector machineというアルゴリズムが使えます。)
判別関数を眺めて、判別に主に寄与する項目がどれなのか、ドーデモ良さそうな項目はどれなのかを推測する。そして選別した項目だけを使って、またやってみる。
判別関数をさらに単純化していくわけで、この単純化作業は「次元(パラメータの個数)を減らしても、A, Bの区別を付ける性能がさほど落ちない(判別ミスをする頻度が余り増えない)」という風に進めたい。どこまで減らした所で止めとくかがポイントであり、その判断にはAIC(赤池の情報量規範)が使えるかも。
もし首尾よくここまでイケたとすると、「A,Bの区別」と近似的に同一視できるような、比較的簡単な判別関数が得られた。判別関数の構造を見れば、「A,Bの区別」に強く関連するような因子を構成する成分として、各項目がどのように判別関数に寄与しているかが分かるでしょう。
No.1
- 回答日時:
> 被験者数20人ほどから300ほどの異なる項目に関してデータをとりました。
項目数に対して被験者数が少なすぎではないでしょうか。
多重比較をしたとしても、今度は有意となる項目が出てこなくなりそうですね。
> この20人を2つの群、AとBに分けて、
> この300ほどの項目に関して、どのような違いがあるか見たいときに、
> 対応のないt検定、p<0.05で有意性を見たいと思った場合に、
> 300項目の5%、つまり15個は項目数の多さからランダムに有意になってしまうということでしょうか?
二つの群に差がなかったとしても、15項目程度は有意な結果が得られてもおかしくはありません。
相関の方も多分同じでしょう。
> 項目数が膨大の場合に、どの項目が2群で差があるか、あるいは項目同士の相関の有無
> を見るときにどのような解析方法をするのがふさわしいのでしょうか?
1.解析をする意義のある項目間に絞って解析する。
2.今回の実験を相関のありそうな項目のスクリーニングという位置づけにして、有意となった項目について、今回の結果から必要なサンプルサイズを設定し改めて実験を行う。
他に良い方法がありますかね?
あと、「次元ののろい」について調べてみてください。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 環境学・エコロジー 井戸水の水質の質問。 水質検査で窒素の項目で飲料不可と判定されました。 窒素の項目は硝酸アンモニウム 3 2022/09/17 12:05
- Excel(エクセル) ExcelVBAでリストの項目に必要数と同じ手配数を分配していくマクロを作りたいです。 1 2022/07/29 18:36
- Visual Basic(VBA) VBAで、1つのエクセルで、2つのシートからもう1つのシートに条件のある転記コードを教えてください。 1 2023/03/16 18:07
- 不動産業・賃貸業 賃貸契約契約の解除 1 2022/11/07 18:02
- Windows 10 ウィンドウズ11でスリープの設定は? 1 2022/05/26 02:41
- Excel(エクセル) エクセルの関数 2 2023/01/17 15:24
- その他(Microsoft Office) マクロについて教えてください、、 5 2023/06/06 22:07
- その他(IT・Webサービス) google サイトの目次表示について 1 2023/06/17 23:24
- 医学 肝臓についてお聞きします。癌で肝臓が侵された場合、血液検査のどの項目で分かるのですか? 有害物質の蓄 4 2022/12/16 17:04
- 病院・検査 血液検査、婦人科に詳しい方教えてください。 7 2022/08/27 19:00
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
相関係数Rの2乗について
-
アンケート調査と重回帰分析に...
-
散布図の近似曲線の傾きがマイ...
-
判別分析について
-
変数AとBは相関あり、BとCも相...
-
相依相関の読みと意味を教えて...
-
SQLの副問い合わせと相関副問い...
-
質的データと量的データの相関...
-
VBAのFormulaArrayについて
-
自己相関と相互相関
-
二つのデータの波形が似てるか...
-
切片あり回帰と切片なし回帰
-
決定係数がマイナスになる例っ...
-
ある1点で傾きが急激に変化する...
-
回帰式と近似式について
-
エクセルでANOVA
-
JCLでのプロシージャの変数設定...
-
DataSetの内容がDataGridViewに...
-
アクセス2003 レポートの総ペ...
-
Yハットの出し方やミュートと...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
おすすめ情報