プロが教える店舗&オフィスのセキュリティ対策術

独学で統計を学んでいるものです。
参考書や、ネットで調べるとパラメトリック検定は母集団を正規分布と仮定し、ノンパラメトリックは仮定しないとありました。この「母集団を正規分布と仮定する」というのはつまりどういうことなのでしょうか?

独学なりに、母集団と正規分布の言葉の意味そのものはわかっているつもりです。分析対象を得点とするか度数とするかの違いはわかりました。

よろしくお願いします。

A 回答 (1件)

連続的に分布する数値のようなものが「パラメトリック・データ」。

例えば、ある学校の生徒の「身長」「体重」のデータのようなもの。

それに対して、「好きな教科のランキングデータ」「今週のJ-POPベストテン」とか「『好き』『どちらともいえない』『嫌い』の3段階評価のアンケート結果」のようなデータは、数値として計算できないので「ノンパラメトリック・データ」です。
そもそも、「ノンパラメトリック・データ」に「分布」という考え方はマッチしません。

「パラメトリック・データ」であっても、正規分布するとは限りません。あくまで、独立でランダム事象であるなど、そのデータの特性から「正規分布」を仮定しているだけです。「正規分布」とは異なる分布をする場合には、その分布を仮定して処理をします。(中には、どんな分布をするかを前提にせずに処理する手法もあります)
「検定」にしても、「カイ二乗検定」「t検定」とか、「ウェルチの検定」「マン・ホイットニーのU検定」とか、いろいろな検定がありますよ。

>分析対象を得点とするか度数とするかの違い

「得点」も「度数」も、普通に考えれば「パラメトリック・データ」ですよ。
「『好き』『どちらともいえない』『嫌い』の3段階評価」を勝手に「5点、3点、1点」とした場合も、疑似的に「パラメトリック・データ」として扱えます。
    • good
    • 0
この回答へのお礼

勉強になりました。回答ありがとうございました。

お礼日時:2017/11/19 01:19

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!