連続変数についてノンパラメトリック検定の多重比較(steel-dwass)を行った場合の優位差を示すアルファベットの付け方を教えて下さい。
連続変数のパラメトリックな検定の場合は、平均値の大きい順に並べ、以下のサイトに示すような方法でアルファベットがつけられるかと思います。
https://hymd3a.hatenablog.com/entry/2021/05/06/1 …
steel-dwassの場合、中央値の大きい順に並べ、後は上記と同じ考え方でアルファベットをつけるという考え方であっていますか?
A 回答 (9件)
- 最新から表示
- 回答順に表示
No.8
- 回答日時:
No.4では(No.6, 7と同様)添える記号が同じであることを「"同じグループ"的なものを表す印なのかな」と思ったので、そんなの役に立たないばかりか危険だよ、とコメントしたんですが、No.4への質問者氏のコメントで納得し、No.5の回答となりました。
…というのはさておき、手持ちの資料をいろいろ見てますが、「アルファベットを付け」ているものはまだ見つからんです。何の分野なんでしょうかね。
No.7
- 回答日時:
同じグループだと言うのは検定上ルール違反なので、差があるグループを見つけるという議論だとしましょう。
1区から5区まで少しの差で並んでいるとき、隣同士と比較する今の方法だと連続併合が起きます。
クラスター分析では、「生成されたグループの平均」との比較を行いますが、それでも連続併合が起きるので、ウォード法という1対比較が導入されました。
リンクされたHPの方法は、1区と5区まで少しの差で並んでいるとき、1区から併合を始めると全てaグループになるのに、1区と5区は大きく異なる、という事態が起きます。
この事態への対処としてacとかいう新たなグループ作りで対処していますが、それは危険です。
なぜなら5区から併合を始めると、違う結果が生じるからです。
つまり、総当たりだけでは不足で、123区と45区の差の検定とか、考えられる全ての切り分け方の検定が必要になるのです。
リンクされたHPは、それを怠っています。
No.6
- 回答日時:
> どのグループとどのグループの平均値等に差があるか
やはり、群間の比較なんですね。
「長さなどの連続変数(比率尺度?)の場合」の比較って何なのか理解に苦しみましたよ。
さて、
aと同じグループでも、その端っこのものは、bグループにも入るということが起きるので、どのサンプルをaグループの主とするかでそれぞれの所属グループが違ってきますね。
主との比較にしないと、境界が曖昧になります。
両方に入るものは、abとかいう新たなグループを作っているようですが、それは、端っこどおしというか、異端どおしというか、aやbとはギリギリ「差があるとは言えない」というものですよね。
そもそも、帰無仮説とは採択されるものではなく保留されるものであり、保留されたとしても「同等である」とは言えないのに「同じグループである」と言っていることに、大いに違和感を感じます。
分野が違うと、検定の解釈にも違いが出るのでしょうか?
本来、「同じグループ」と見なすには、「差がある」ことを帰無仮説にして積極的にそれを否定しに行かなければなりません。同等性の検定と言います。
No.5
- 回答日時:
No.4へのコメントについて。
> 異なる異文字間には、有意差があることを示し、同じ文字が入るもの同士には有意差がない
なるほど、そういう意味ですか。「異文字」ってのは、2文字くっついていた場合には1文字ごとにバラして考えるんでしょうね。(そうだとしてもやはり、繰り返し申し上げている通り、「有意差の有無をどうやって判定したか」という事情なんぞは全く無関係であるには違いない。なので、ご質問の趣旨がどうにも納得いかないということには変わりありませんが。)
例えばNo.2にある束のグラフでやってみますと、とりあえずは矢印をたどって繋がっている経路を調べた上で、
1区と2区をつなぐ経路がないので、両者には同じ文字"a"が入る
3区と4区をつなぐ経路がないので、同じ文字"b"が入る。
3区と5区をつなぐ経路がないので、同じ文字"c"が入る。
4区と5区をつなぐ経路がないので、同じ文字"d"が入る。
2区と3区をつなぐ経路がないので、同じ文字"e"が入る。
とやると、
1区は"a"だけに関わるから、「1区(a)」
2区は"a"と"e"だけに関わるから、「2区(ae)」
3区は"b"と"c"と"e"だけに関わるから、「3区(bce)」
4区は"b"と"d"だけに関わるから、「4区(bd)」
5区は"c"と"d"だけに関わるから、「5区(cd)」
と記号をつければ、ご質問の条件は満たしているんじゃないかしらん。
ところがこれを
1区と2区をつなぐ経路がないので、両者には同じ文字"a"が入る。
2区と3区をつなぐ経路がないので、両者には同じ文字"e"が入る。
3区と4区と5区には互いをつなぐ経路がないので、これらには同じ文字"x"が入る。
と整理し直せば
1区は"a"だけに関わるから、「1区(a)」
2区は"a"と"e"だけに関わるから、「2区(ae)」
3区は"x"と"e"だけに関わるから、「3区(ex)」
4区は"x"だけに関わるから、「4区(x)」
5区は"x"だけに関わるから、「5区(x)」
という風に文字の種類を節約できる。
で、「どうやれば最も少ない種類の文字で済ませられるか」という数学(グラフ理論)のアルゴリズムの問題だと思えばいいのかしらん。言い直すと
有向グラフのnode全部の集合が「nodeの部分集合 Xであって、Xのどの二つの要素の間にも経路がないようなもの」の和になっていて、かつ、それらの部分集合の個数が最小であるような、部分集合族を構成せよ。
この例の場合なら、{{1区,2区}, {1区,3区}, {3区,4区,5区}}が答になり、同じ部分集合に属する要素には同じ記号(それぞれ"a","e","x")が付く。…と、そういう話なのかしらん?
No.4
- 回答日時:
> アルファベットでどこに有意差(優位差は単なる記述ミスです。
すみません。)があるかを示すのは、私の分野の論文などで普通に行われること(私の知る範囲の「自然科学系」では見たことないですが、ま)そうであるんなら、その「アルファベット」の読み方もよくご存知のはず。ならば、その読み方で読んだときに適切になるように「アルファベット」をつければ良いだけの話でしょう。その際には、もちろん(戦績表の場合と同様に)「有意差がある」ことを示すのに使った方法がどうであるかは、(どれも同じ方法でありさえすれば)まるで関係ない。
…となると、ご質問の意図がわからんですね。
もっとも、そういう「符号」から一体何が読み取れてどう役に立つんだか、ちょっと想像がつきません。かのblogを見た限りでは、例えば5区と4区に同じ符号が付くと言うんですから、符号は誤解の元(せいぜい強弁の材料)になる以外には意味がなさそうな気がします。
もしかしたら、私の専攻分野が特殊なのかもしれません。確かに、私も他の分野(それでも近しい分野)を専攻していたときは、アルファベットで有意差を示すのを見たことがなかった気がします。
異なる異文字間には、有意差があることを示し、同じ文字が入るもの同士には有意差がないことを示します。グラフや表にアルファベットを付して、どの群同士に有意差があるかを示す方法です。
分野が違うと学術論文の当たり前が違うということで、それぞれの分野の先人達が築いた表記の仕方かと思います。
No.3
- 回答日時:
検定の一つ一つは介入群(treat)と対照群(control)とが対象ですよね。
介入群、対照群が正規分布ではないため、ノンパラで行っているのかと。多重比較は、総当たりで行われているかと・・・。
アルファベットはその各群間の関連の強さに応じて付ける仮のグループ名ではないのですか?
群が名義尺度ではなく、連続値というところが分かりません。
ごめんなさい。お手上げです。
No.2
- 回答日時:
そもそも「優位差」なんて用語はない。
(「優位」や「優劣」や「有意差」ならあるけど。)なので「優位差を示すアルファベットの付け方」なるものは、リンク先の著者が勝手に思いついた用語や記法の話に違いない。それだけじゃ意味が分からんので、リンク先を眺めてみました。まずは「対照区と比べて有意な差のある範囲をグラフに示したら」が何言ってんだかはっきりしない。そう「示したら」さて一体何がどう嬉しいと言うんだろうか? さらに「アルファベット(符号)」を付けることでどんな情報を表そうとしていて、どんなご利益があるんだか、こちらもさっぱり分からんですね。符号の用途はどうやら「グラフや別の表に記載する」ということらしいが、それがどういう状況でのどんな目的においてどう使うとどう嬉しいという話なのかも不明。
つまりこのblogは単なる私的な備忘録に過ぎず、論理的に意味のある文章(ヒトサマに読ませる文章)にはなっていない。ですから、「合ってる」かと尋ねること自体がナンセンスです。(どうしても尋ねるのなら、このblogの著者に訊いてみろ、ってことです。)「アルファベット」を付けてみたところで、誰にも通じないんで無意味(それどころか、「何だこの変な記号?」と問い質されて、答に窮するのは結局ご自分)だからです。
ところで、blogに「一覧表にした方が良いとの意見もあることは重々承知」と書いてあるのは、おそらくblogの"3"のテーブルのことなのだろう。このテーブルはスポーツのリーグ戦(総当たり戦)の戦績表とよく似ている。5つのチーム("チーム1区"から"チーム5区"まで)が戦って、*が入っているマス目は、例えば「"チーム5区"は"チーム1区"に勝った」ということを表し、何も書いてないマス目は例えば「"チーム2区"は"チーム1区"と引き分けた」を表す、と思えばそっくりでしょ。こういう戦績表は野球だろうが将棋だろうがどんな種類の試合かには関係なく作れる。言い換えれば、戦績表を眺めるにあたって、"チーム1区"なるものがどういうシロモノなのか、「勝つ」というのが何がどうなったことを意味しているのか、などはまるで気にする必要がない。だから、勝敗(優劣)が「有意差があること」で決まるという事情はどうでもいいことで、まして、それが連続変数なのかどうか、どんな検定法を使うか、それがパラメトリックなのかどうか、なんて話は全く無視してよろしい。
ただ、スポーツの戦績表とは際立った違いがある。それは「推移律」が成り立つこと。すなわち「AがBに勝ち、BがCに勝つ」のであれば、試合(検定)をするまでもなく「AがCに勝つ」と決まるという性質がある。(スポーツの試合だと、これは言えない。)この性質を持つ「XがYに勝つ」という関係を数学の用語では「半順序関係(semi-order relationship) 」と呼びます。(集合同士の包含関係 Y⊂Xは、半順序関係の一例。)
さて、比較的少数の対象の間にある半順序関係を可視化する典型的なやり方は、directed graph(有向グラフ)である「Hasse図」を描くこと。(ただし、ここで言う「グラフ」は数学の用語であり、折れ線グラフとか棒グラフとかの「グラフ」とは全く関係ありませんのでご注意。)どうやるかと言いますと:
● 仮想的に「すべてのチームに勝つ最強チーム」と「すべてのチームに負ける最弱チーム」を追加して考える。こうすると、lattice(束, ソク)という数学的構造になる。束にしておくと、全チームの部分集合S(いくつかのチームを選んだもの)に対して、「Sの構成員のいずれにも勝つ奴はどれか」、「Sの構成員のいずれにも負ける奴はどれか」という問いが必ず答を持つようになって、ナニカと便利である。
●各チームをnode(節点, ノード)で表す。そして
●「XがYに勝つ」をnode Yからnode Xへ向かう矢印で表す。ただし、推移則で導ける矢印は削除する。すなわち、A→B, B→Cの矢印があるとき、A→Cの矢印は描かない。
並べ方のルールはこれだけなのだが、さらに例えば
● nodeの上下の配置は数値(それが何を意味するかはどうでもいい)の順になるように並べる(左右の配置はテキトーに見やすくなるようにする)
と、矢印がどれも上向きになって、優劣の関係が直感的にわかる。この図には「1区が最弱とは言えない」とか「5区が最強とは言えない」という情報も表現される。というわけで、blogにある関係をHasse図にすると添付図のような感じ。加えて、それぞれの矢印にp値を添えておけば、検定結果の総まとめの図として万全でしょう。
No.1
- 回答日時:
検定対象が名義尺度の場合を言ってみえますか?
まず、リンク先の方法は、ひゃまださんという方の個人的見解ではないでしょうか。参考文献もありませんし。
さらに、有意差(×優位差)の図示ではなく、グループ分けしたように思います。対照区がどこかも示されていません。
さらにさらに、この1区2区というのは、順序尺度ではないですねぇ。一見そう見えますが・・・。
ですから、平均値の順に並べ順序尺度的に図示するこの図は間違っていると言えます。
どの水準間に差があるか、という図示方法になっているからです。
しかし、検定は全てのペアで行われています。だから名義尺度であると分かるのですが、名義尺度であればボルツマンマシンのような図にすべきだと思います。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Excel(エクセル) 数値から名前が作成できなくなっているッ!? 2 2023/12/06 21:11
- Excel(エクセル) Excelの並び替え(先頭の文字以外を基準に並び替えたい) 3 2023/07/07 22:21
- Access(アクセス) capeofdragonと申します。 Access2016を使っております。 あるフォームがあり、テ 2 2022/09/09 13:18
- 統計学 適合性の検定の同等性の検定 15 2022/09/24 00:36
- Visual Basic(VBA) EXCEL VBAで教えてください。 1 2022/12/22 04:20
- 政治 私の発明した「二階建て漢字」は使えるでしょうか? 3 2023/02/08 16:40
- 統計学 応答で層別した場合の検定について 3 2024/05/12 14:36
- Visual Basic(VBA) ExcelのVBAコードについて教えてください。 2 2023/05/23 16:28
- 統計学 分析、統計学について。 ある実験を行いました。 ①②③の3条件において、②と③には同様の刺激を与えま 3 2023/11/24 08:56
- Excel(エクセル) SUMIF関数について 4 2023/06/14 13:13
このQ&Aを見た人はこんなQ&Aも見ています
-
あなたの「必」の書き順を教えてください
ふだん、どういう書き順で「必」を書いていますか? みなさんの色んな書き順を知りたいです。 画像のA~Eを使って教えてください。
-
【大喜利】【投稿~1/9】 忍者がやってるYouTubeが炎上してしまった理由
【お題】・忍者がやってるYouTubeが炎上してしまった理由
-
【お題】逆襲の桃太郎
【大喜利】桃太郎が1回鬼退治に失敗したところから始まる新作昔話「リベンジオブ桃太郎」にはこんなシーンがある
-
洋服何着持ってますか?
洋服を減らそうと思っているのですが、何着くらいが相場なのかわかりません。
-
「これいらなくない?」という慣習、教えてください
現代になって省略されてきたとはいえ、必要性のない慣習や風習、ありませんか?
-
標準偏差バーをグラフに入れた時にマイナスの範囲にエラーバーが達する場合
数学
-
この問題のときかたをおしえてください
数学
-
数学的帰納法の意味・意義について
数学
-
-
4
写真の問題について質問なのですが、 ①微分方程式というものがよくわかりません。 g(a)=ce^(-
数学
-
5
高校の微分の問題で、g(x)=x^3-3bx+3b^2のグラフはなぜ画像のようになるのですか? h(
数学
-
6
サイコロを投げて6が連続して100回出ました。このサイコロは細工がされていますか?
統計学
-
7
2の累乗の枚数のトランプやカルタはありますか?
システム科学
-
8
円1:x²+y²=4と円2:(x-2)²+y²=1の交点を求めようと思って円1の方程式を変形してy²
数学
-
9
高校数学についてで、帰納法をたとえば数列で使うときにn=kとおいて、kで示したいものが成り立つと仮定
数学
-
10
この画像において、なんで奥にいる人達の方が大きく見えるんですか? 普通遠近法って近くの人が大きく見え
その他(形式科学)
-
11
RAMはなぜ複雑な計算になるほど性能低下か起こりやすくなりますか?
計算機科学
-
12
多重検定について
生物学
-
13
NPU付きのPCを買ったのですが、これは数学的な計算に応用することができますか?
計算機科学
-
14
(3)のグラフがなぜこうなるのかわかりません。マイナスがついていないから反比例のグラフが反対にならな
数学
-
15
基本情報の過去問(A問題)の解き方について。 数学の問題なのですが、 こちらの問題の解き方わかる方い
計算機科学
-
16
動画のエイリアシングについて
物理学
-
17
途中式で使われているΛ記号の意味を教えて下さい。 読んでいて突然出て来たので分からなくなってしまいま
物理学
-
18
5x+2のx=1,2,…50の平均について
統計学
-
19
アブソモータのエンコーダリセットについて アブソモータのエンコーダリセットとは、保持しているアブソデ
工学
-
20
自作スピーカーのボックスをアルミで作りたますが、メーカー品や自作品もみんな木製ですよね。 アルミじゃ
スピーカー・コンポ・ステレオ
おすすめ情報
- ・「みんな教えて! 選手権!!」開催のお知らせ
- ・漫画をレンタルでお得に読める!
- ・【大喜利】【投稿~1/20】 追い込まれた犯人が咄嗟に言った一言とは?
- ・洋服何着持ってますか?
- ・みんなの【マイ・ベスト積読2024】を教えてください。
- ・「これいらなくない?」という慣習、教えてください
- ・今から楽しみな予定はありますか?
- ・AIツールの活用方法を教えて
- ・【選手権お題その3】この画像で一言【大喜利】
- ・【お題】逆襲の桃太郎
- ・自分独自の健康法はある?
- ・最強の防寒、あったか術を教えてください!
- ・【大喜利】【投稿~1/9】 忍者がやってるYouTubeが炎上してしまった理由
- ・歳とったな〜〜と思ったことは?
- ・ちょっと先の未来クイズ第6問
- ・モテ期を経験した方いらっしゃいますか?
- ・好きな人を振り向かせるためにしたこと
- ・【選手権お題その2】この漫画の2コマ目を考えてください
- ・【選手権お題その1】これってもしかして自分だけかもしれないな…と思うあるあるを教えてください
- ・スマホに会話を聞かれているな!?と思ったことありますか?
- ・それもChatGPT!?と驚いた使用方法を教えてください
- ・見学に行くとしたら【天国】と【地獄】どっち?
- ・これまでで一番「情けなかったとき」はいつですか?
- ・この人頭いいなと思ったエピソード
- ・あなたの「必」の書き順を教えてください
- ・14歳の自分に衝撃の事実を告げてください
- ・人生最悪の忘れ物
- ・あなたの習慣について教えてください!!
- ・都道府県穴埋めゲーム
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
カイ二乗検定
-
EXCELにてローパスフィルタを作...
-
統計について
-
検量線の決定係数について
-
エクセルのグラフから半値幅を...
-
心理学の統計について
-
【統計】有意に「高い」?「低...
-
下の対数表示のグラフから低域...
-
卒論でアンケート結果を引用す...
-
検定統計量の値がマイナス
-
片対数グラフで…
-
最小二乗法を反比例の式を元に...
-
エクセルの統計でχ二乗検定の結...
-
変化率のみで、有意差の検定は...
-
【統計】T検定の有意確率
-
グラフの"eye guide"について
-
統計で、信頼区間のマイナス値...
-
エクセルで正規分布かどうかを...
-
珠算の資格を履歴書に書こうと...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
検量線の決定係数について
-
EXCELにてローパスフィルタを作...
-
下の対数表示のグラフから低域...
-
エクセルのグラフから半値幅を...
-
統計について
-
心理学の統計について
-
【統計】有意に「高い」?「低...
-
一元配置分散分析のp値が0になる
-
対応のあるt検定の結果の書き方
-
極値をもつ時と持たない時、単...
-
エクセルの統計でχ二乗検定の結...
-
統計学についてです。 抽象的で...
-
検定統計量の値がマイナス
-
線形なグラフとはひとくちに言...
-
変化率のみで、有意差の検定は...
-
最小二乗法を反比例の式を元に...
-
ノンパラメトリック検定の多重...
-
卒論でアンケート結果を引用す...
-
理科のグラフで、直線と曲線の...
おすすめ情報
ご回答ありがとうございます。
検定対象は、名義尺度や順序尺度ではなく、長さなどの連続変数(比率尺度?)の場合が知りたいです。
分野や人によって、統計は考え方が異なるので、もしかしたら回答者さまの分野ではナンセンスな可能性があるかもしれませんが、私の専攻分野(自然科学系)での場合としてお答えさせて頂きます。
正規分布、等分散が確認されるデータの場合には、tukeyなどの多重比較をし、リンク先のような考え方でアルファベットをつけるのは、一つの方法として一般的かと思います。どの水準間に差があるかを図示する考え方で間違えはないと思います。
私が知りたいのは、連続変数のデータが正規分布でなく、変換をしても正規分布に近づけなかった場合に、ノンパラメトリック検定を行った場合の多重比較後のアルファベットの付け方です。
詳細なご回答ありがとうございます。
おそらく分野が違うとかなり考え方、表記の仕方が違うようです。
アルファベットでどこに有意差(優位差は単なる記述ミスです。すみません。)があるかを示すのは、私の分野の論文などで普通に行われることなのですが、分野が違うとこんなにも伝わらないのかと驚愕しております。
ありがとうございます。
多重比較は、総当たりで行う場合であっております。
アルファベットは、連続変数のパラメトリックな検定の場合には、どのグループとどのグループの平均値等に差があるかを示す記号になりますが、私の分野では普通に使われる表記でして、分野が違うと簡単には伝わらないのかと驚いております。
ご回答ありがとうございました。