
No.1ベストアンサー
- 回答日時:
正規化の意味は、正規分布に変換する、ということでしょうか。
そうすると、二つのグループの優劣は、出ないのではないでしょう。>」(平均値の差の2乗の平均???とか)
のような操作をすると、なんとなくそうなりますが。
たとえば、受験のときに、理科の点数は、10、15、25点で、国語は60、70、98の試験の場合、理科で試験を受けた者は不利になります。この場合、正規化(標準化?)という変換をします。すなわち、グループが正規分布するように変換するわけです。そうすると、差がなくなり、どちらで試験をうけても、有利不利は補正できる、というのが利点です。
これは、ご質問の趣旨と、まったく逆のような印象があります。
グループAは、10、20、100、1000だった。グループBは、1000、2000、100000だった、という場合というケースでしょうか(有意差があるかもしれませんが)。この場合は、正規分布していないでしょうから、t検定は使えません。
この場合は、F検定をするのが一般的だと思います。あるいは、順位差検定、というのもありますが、これはパソコン用のソフトを思いつきません。以前やったときには、BASICでプログラミングしましたが、20年も昔のことで、・・・。
ご質問の意図を取り違えていれば、ご容赦を。もしあっていれば、続きを書きます。
No.2
- 回答日時:
こんにちは.
t検定を始めとする多くの統計解析法・データ解析法は「正規分布」を仮定していますね.
ただ,この「正規分布」の仮定について,多くの方が誤解しているように思える気がしてならないのは「正規分布の仮定とは,標本データの正規性ではなく,標本データの【平均値】の正規分布」を理解しているか,ということです.おそらく,母集団と標本データの区別をしていないため,このような誤解を招くのだと思います.
で,この勘違いが更に進んでしまうと次のようなことがおきます.
ある集団と別の集団の二つの集団を標本集団としてデータを採取しました.そしてt検定を行うとします.t検定は正規分布を仮定しているとして,それぞれの集団データが正規分布しているかを調べました.その結果,それぞれの集団データは正規分布していませんでした……
さあ,どうしましょう?
勘違いしている人は「うわっ,標本集団データが正規分布していないから,正規分布を仮定しているt検定は適切じゃない!」としてt検定の使用を断念するかもしれません.
が,それは間違いです.何を間違っているかわかりますか?
先程も言ったように,t検定をはじめとする多くの統計法は,標本集団データそのものではなく,集団の代表値である平均値を対象としているのです.調べるのは平均値であって,個々のデータではないのです.そしてその平均値の数値が,平均値の分布の中で統計的に珍しいものであるかどうかを調べているのです.「標本集団データの正規分布」ではなく,「標本集団の【平均値】の正規分布」が問題になるのです.
ここで興味深い原理を紹介しましょう.
それは中心極限原理と呼ばれるものです.この原理とは「十分大きなデータの【標本の平均値】は,その標本の母集団がどのような分布をしていても,正規分布に近似する」というものです.
……前置きが長くなりました.
無論,Excelで正規化をすることはできますが,その前に!
・標本データのデータ数が少なくとも,そのものが正規分布であれば,その標本のもとなった母集団も正規分布であると考えられる.よって通常の正規分布を仮定した統計解析法が使える.
・標本データのデータ数が大きければ(n=50あるいは100;研究者によって見解が異なる),その標本データが正規分布でなくとも,「中心極限原理」によって,母集団データは正規分布であると考えられる.よって通常の正規分布を仮定した統計解析法が使える.
となります.ゆえに「データ数が充分であれば」,ごく普通に正規分布を仮定した統計解析が使えます.
データ数が少なければ,「正規化」を行うか,あるいは順位和検定などのノンパラメトリック検定法を使うなどを行う必要があります.
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 Excelによるサンプルの拡大について 6 2023/08/22 16:03
- Excel(エクセル) 別シートに毎回異なるデータをコピーする 7 2022/06/24 09:02
- 統計学 お世話になっています. x軸は時間(期間)y軸はある値に対する2つのグラフ比較をしますが、私個人の考 2 2023/03/30 11:42
- 統計学 統計分析とExcelに詳しい方、何卒よろしくお願いいたします。 6 2022/05/27 10:30
- 統計学 確率統計の問題です。 3 2022/04/07 04:39
- 統計学 加重最小二乗法=①「変数を自然対数変換」=②「誤差項の分散の逆数を重み付け」? 8 2022/11/26 11:15
- 統計学 回帰分析検証不一致 5 2022/05/04 20:48
- 統計学 生物統計学の質問 3 2022/11/11 21:14
- Excel(エクセル) スプレッドシートの関数 2 2022/11/16 17:36
- C言語・C++・C# [C言語] コメント文字列を無視して、数値データを読み込むプログラム部分について 5 2022/10/05 11:03
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
グレースケールがカラーになる...
-
iPad版Illustratorでaiデータを...
-
教えてください!
-
色校正後の訂正データ入稿のしかた
-
弥生給与で月次更新後に過去デ...
-
郵便番号(7桁)=>市区町村コ...
-
ネットカフェのPCで、iCloudに...
-
PCの買い替えを検討してるので...
-
itune以外で mp3データを ipo...
-
EXCEL関数で数字の正規化を行...
-
PCでミュージックデータプレ...
-
携帯買い時?
-
FOMA新機種はいつごろ?
-
MOTHER3 について
-
FOMA新機種について・・・。
-
NECユーザーの方に質問。
-
gigファイルについて
-
写真の修整方法を教えてください
-
Panasonicブルーレーレコーダー...
-
パソコンからFOMAへの音楽の転送
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
グレースケールがカラーになる...
-
ネットカフェのPCで、iCloudに...
-
郵便番号(7桁)=>市区町村コ...
-
弥生給与で月次更新後に過去デ...
-
イラストレーターで作ったデー...
-
ディスクアットワンスとトラッ...
-
PDFファイルをJwwに取り込む
-
PCの買い替えを検討してるので...
-
CDRやRWはプラスチックですか?
-
データ圧縮とICCプロファイルの...
-
HEXデータで1ビットずらしたHEX...
-
東方妖々夢、CDに焼いてCDプレ...
-
RPGツクールXP セーブデータ改...
-
Photoshop Elements7でイラスト...
-
aiデータをpdfに変換するとサイ...
-
ファイルメーカーでパラドック...
-
「メモリ(RAM)が足りないため...
-
Photoshopで作ったロ...
-
RGBデータのプリントについて
-
色校正後の訂正データ入稿のしかた
おすすめ情報