EXCEＬ関数で数字の正規化を行うには

Question

購入額アンケートの集計分析をします。サンプルの優劣を分析したいのですが、回答値（購買金額）のばらつきが大きく、そのまでは比較できません。

こうした時は数値の「正規化」（平均値の差の2乗の平均？？？とか）を行うそうなのですが、
　・EXCEL関数でどのように実行すれば良いのか、やり方もしくは参考情報の所在をお知らせください。

ちなみに現状の構造は下記2列のシンプルなものです
　・サンプルＩＤ列、　回答購買額列

kgu-2 · Accepted Answer

正規化の意味は、正規分布に変換する、ということでしょうか。そうすると、二つのグループの優劣は、出ないのではないでしょう。

>」（平均値の差の2乗の平均？？？とか）
のような操作をすると、なんとなくそうなりますが。
たとえば、受験のときに、理科の点数は、10、15、25点で、国語は60、70、98の試験の場合、理科で試験を受けた者は不利になります。この場合、正規化(標準化?)という変換をします。すなわち、グループが正規分布するように変換するわけです。そうすると、差がなくなり、どちらで試験をうけても、有利不利は補正できる、というのが利点です。
これは、ご質問の趣旨と、まったく逆のような印象があります。


グループAは、10、20、100、1000だった。グループBは、1000、2000、100000だった、という場合というケースでしょうか(有意差があるかもしれませんが)。この場合は、正規分布していないでしょうから、t検定は使えません。

この場合は、F検定をするのが一般的だと思います。あるいは、順位差検定、というのもありますが、これはパソコン用のソフトを思いつきません。以前やったときには、BASICでプログラミングしましたが、２０年も昔のことで、・・・。

　ご質問の意図を取り違えていれば、ご容赦を。もしあっていれば、続きを書きます。

selfer · Answer

こんにちは．
ｔ検定を始めとする多くの統計解析法・データ解析法は「正規分布」を仮定していますね．

ただ，この「正規分布」の仮定について，多くの方が誤解しているように思える気がしてならないのは「正規分布の仮定とは，標本データの正規性ではなく，標本データの【平均値】の正規分布」を理解しているか，ということです．おそらく，母集団と標本データの区別をしていないため，このような誤解を招くのだと思います．

で，この勘違いが更に進んでしまうと次のようなことがおきます．

ある集団と別の集団の二つの集団を標本集団としてデータを採取しました．そしてｔ検定を行うとします．ｔ検定は正規分布を仮定しているとして，それぞれの集団データが正規分布しているかを調べました．その結果，それぞれの集団データは正規分布していませんでした……

さあ，どうしましょう？
勘違いしている人は「うわっ，標本集団データが正規分布していないから，正規分布を仮定しているｔ検定は適切じゃない！」としてｔ検定の使用を断念するかもしれません．

が，それは間違いです．何を間違っているかわかりますか？
先程も言ったように，ｔ検定をはじめとする多くの統計法は，標本集団データそのものではなく，集団の代表値である平均値を対象としているのです．調べるのは平均値であって，個々のデータではないのです．そしてその平均値の数値が，平均値の分布の中で統計的に珍しいものであるかどうかを調べているのです．「標本集団データの正規分布」ではなく，「標本集団の【平均値】の正規分布」が問題になるのです．

ここで興味深い原理を紹介しましょう．
それは中心極限原理と呼ばれるものです．この原理とは「十分大きなデータの【標本の平均値】は，その標本の母集団がどのような分布をしていても，正規分布に近似する」というものです．

……前置きが長くなりました．
無論，Excelで正規化をすることはできますが，その前に！

・標本データのデータ数が少なくとも，そのものが正規分布であれば，その標本のもとなった母集団も正規分布であると考えられる．よって通常の正規分布を仮定した統計解析法が使える．

・標本データのデータ数が大きければ（n＝50あるいは100；研究者によって見解が異なる），その標本データが正規分布でなくとも，「中心極限原理」によって，母集団データは正規分布であると考えられる．よって通常の正規分布を仮定した統計解析法が使える．

となります．ゆえに「データ数が充分であれば」，ごく普通に正規分布を仮定した統計解析が使えます．
データ数が少なければ，「正規化」を行うか，あるいは順位和検定などのノンパラメトリック検定法を使うなどを行う必要があります．

EXCEＬ関数で数字の正規化を行うには

正規化の意味は、正規分布に変換する、ということでしょうか。

こんにちは．

似たような質問が見つかりました

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング