プロが教えるわが家の防犯対策術!

統計解析について質問があります。どなたかお答えいただければとても助かります。。実際の対象は全く異なりますが、分かりやすい例に置き換えて質問せて頂きます。

例えば母集団は体重がA:40キロ以下、B:40-50キロ、C:50キロ以上のいずれかに分類される13人で、その13人の1日平均の間食が0, 1, 2, 3回のいずれかとします。この場合、体重と間食の回数に相関関係があるかどうか(例えば、Aだと間食回数が少ない、Cだと間食回数が多い)を調べるにはどのような統計解析が適当なのでしょうか。稚拙な質問で申し訳ないのですが、お力を貸していただければ幸いです。

A 回答 (5件)

データを度数分布表のように階級化したとき、計算上の分散が増えるという量子化誤差については、「シェパードの補正」を検索してご確認ください。



小中学校で教えているヒストグラムのごとくカテゴリ値として集計する方法は、一見すると見やすく、素人受けしますが、量子化誤差を伴っていますので実は解析屋泣かせなのです。

また、ご質問のようなデータで論文化するとなると、信頼区間の併記が必要となりますが、カテゴリ値はすそ野の値を求めることが一筋縄ではいきません。ブートストラップ補間などを用いて連続分布に直す必要があります。
(イメージとしては前に投稿したバブルチャートが、富士山型の等高楕円に変換されるのですが、面倒な計算が必要です。)

そうすることにより、間食3回のときの体重の点推定・区間推定が出来るようになります。
    • good
    • 0

もし、体重をA, B, C などに分類せずに、13人の体重が連続値で与えられる場合では、連続尺度 対 順序尺度(カテゴリ値)となります。



この場合もピアソンの積率相関を用いるのは不適切です。
「ポリシリアル相関」を使って下さい。

お節介ですがまとめておきます。

連続値 対 連続値・・・ピアソンの積率相関
連続値 対 カテゴリ値・・・ポリシリアル相関
カテゴリ値 対 カテゴリ値・・・ポリコリック相関
二値 対 二値・・・テトラコリック相関

以上のように、用いる相関係数が違いますのでご注意下さい。
Rでは、2番目以降は、ライブラリpolycorで自動判定して計算してくれます。

なお、データとしては、「クロス集計表」のような集計値ではなく、n個の「縦持ちデータ」を用いる必要があり、縦持ちでなければ縦持ちに変換する必要があります。(「クロス集計表 縦持ちデータ 変換」で検索)

また、前の投稿のバブルチャートは単にクロス集計表から作成することはできず、一旦、全格子点データ(expand.grid)を作る必要があります。単純なクロス集計ですと、「項目飛び」が発生することがあるからです。

肥満と間食と血圧と血糖値のような複数の値の相互の関連性は、連続値の場合では「パラレル・コーディネート・プロット(単にパラレル・プロットで検索)」で関連性を表示しますが、カテゴリ値の場合は、「パラレル・カテゴリ・プロット」という比率を表すようなグラフを用いる必要があります。これも専用のソフトが必要です。

https://towardsdatascience.com/processing-and-vi …

このようなカテゴリ値の統計解析は結構面倒で解析屋泣かせです。
    • good
    • 1

適当に作ったデータです。


n=13で、下図のようなケースで計算してみます。
ピアソンの積率相関(普通に用いられる相関)は0.6ですが、ポリコリック相関は0.76となります。

カテゴリ値として、データが量子化すると、量子化誤差が加わりますので、ピアソンの積率相関で計算すると、分母が大きくなり、相関の値としては小さくなります。
「統計解析」の回答画像3
    • good
    • 1

もともとこのデータしか無いのであれば、カテゴリ値対カテゴリ値なので、「ポリコリック相関」を使います。



手計算ではできません。私はRを使ってやっています。
    • good
    • 0

A, B, C などに分類せずに、単に13人の「体重と間食回数」を調べて、その間の相間を調べればよいだけでは?



ただし、そもそも「体重」そのものには個人差、ばらつきがありますから性別・身長・年齢などから「標準体重」を算定して、「標準体重に対する比率と間食回数」のような形にしないとあまり意味がないと思います。

要するに、「何と何の関係を調べたいのか」を明確にして、そのために必要なパラメータを集め、対応させたいパラメータ間の「相関」の有無を分析する、ということかと思います。
「統計解析」と大上段に振りかざすほどのことではないような気がします。
    • good
    • 1

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!