アプリ版:「スタンプのみでお礼する」機能のリリースについて

統計の尺度について質問です。
以下3つの理由を教えてください。
①最頻値ははなぜ名義尺度なのか
②中央値はなぜ順序尺度なのか
③平均値はなぜ間隔尺度なのか
よろしくお願いします。

A 回答 (6件)

No.2に一票。

    • good
    • 1

知恵袋に投稿されたみたいですが、どんな回答が付くか、私も楽しみです。

    • good
    • 0

#2です。



何度もすみません。再度訂正させて下さい。

最頻値は、カテゴリ化して作られたヒストグラムの最大頻度のビンの階級値だから、カテゴリ値。だから名義尺度とも言えなくもない。
と前回書きました。

今回は、最頻値を決めるために、必ずしもカテゴリ化されている必要はない、という主張です。

なぜなら、連続な数値に対して、密度関数を当てはめることができるのであれば、密度関数を微分して0と置いて解けば、最頻値が与えられるからです。

同様に、密度関数を積分し累積密度にして1/2と置いて解けば、中央値が与えられます。

よって、最頻値も中央値も横軸である連続な間隔尺度上の値であると明確に主張できます。
    • good
    • 2

#2です。



stomachman先生には1票頂いたけど、訂正してもいいですか。

最頻値がどうやって出てくるか考えると、ヒストグラムから出てくる訳で、各ビンはカテゴリ化されているんですよね。
てことは、最頻値は、というか「ヒストグラムの階級値」は全て名義尺度(カテゴリ値)だと言うのも間違いではないと思った次第です。
そういう反論が出れば、それも正解でしょう。

しかし、カテゴリ値=名義尺度って短絡的な教え方には反対です。
カテゴリ値には、名義尺度と順序尺度があり、順序尺度のうち等間隔と考えられる順序尺度(アンケートの満足度など)は計量値的に扱ってもよいし、cm単位で身長が書いてあるときは小数点以下を丸めたカテゴリ値だから名義尺度だとは誰も言わないでしょう。でもここから最頻値って出てくるんですよね。

ということは、ヒストグラムの各階級値は最頻値も含めて等間隔的だから、計量値に準じて扱っても良いと思います。でないと、(ヒストグラムの階級値×確率)の総和は平均値だって学校で教えられているけど、めちゃくちゃ矛盾すると思います。

メディアンは小学校ではどう教えているか知らんけど、これも間隔尺度でしょうね。じゃあ、四分位点とか95パーセンタイルの数値は順序尺度かってことですよね。

ネットでざっくり調べてみたら、ご質問の内容は東進とかのサイトに出ていたけど、ひどいなと思いました。
    • good
    • 0

集団の特徴量として考えたときは、全部間隔尺度だと思いますがね。


間隔尺度とは、得られた数値の「差」、まさに数値の「間隔」が意味を持つということです。

例えば、各市町村の所得を最頻値で比較する、ってときに、その最頻値って名義尺度じゃないですよ。ちゃんと差が出ますから。
同様に中央値でも差の比較が意味を持ちます。

では、何を名義尺度と言うかですが、仕入れ先A社,B社,C社を数値処理上1,2,3としたときに、A社とB社の差も、A社とC社の差も1と考えなければなりません。単純に数値上の差を使ってはいけませんよ、A社とC社の差が2なんて意味がありませんよ、という数値が名義尺度です。一般には、ワン・ホット・エンコーディングという処理をして統計分析に掛けます。

順序尺度は、着順みたいな値で、到着時刻で表してあれば、差の大小が評価できるけど、もし着順だと1位と2位の差は僅差かもしれませんし、2位と3位の差は大差かもしれません。このように、単純に順位差を評価する意味はありませんよ、という警鐘の意味ととらえるべきです。勝負の世界では違うかもしれませんがね。

ちなみに、箱の中の個数が何個かという計数値は、比率尺度(比例尺度)と言います。10個と20個の差は10個、1000個と1010個の差も10個、この10個は「差」として意味を持ちますか。この違いは全体に占める比率で考えるべきですよね。
    • good
    • 0

テキストに載っている「用語の定義、概念」ですから、自分で理解して「こういうものを指す」という具体的なイメージを持たないとどうしようもありません。


他人に解釈してもらって教わったって、何の意味もありませんよ。あなたの「理解」が問われているのですから。

>①最頻値ははなぜ名義尺度なのか

「名義尺度」なのかなあ? 「順序尺度」のような気がするけど。「一番」だから。

>②中央値はなぜ順序尺度なのか

だって「順序」で並べて「順序が真ん中のもの」だもの。

>③平均値はなぜ間隔尺度なのか

等間隔の目盛(点数とか長さとか)で測って計算するから。
でも「平均値は」というのはちょっとおかしい。もとになるが「比例尺度」なら、その平均も「比例尺度」じゃないのかな。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!