統計学、とりわけ実験計画法の「枝分かれ実験」に詳しい方に質問です。
素人ながら実験計画法の習得を目指しています。
添付画像の左にあるような4段の枝分かれ実験を行いました。A1からB1,B2に、B1からC1,C2に枝分かれしていくイメージです。
ひとまず、あるHPで見た手順に従って計算していったところ、なぜか要因Aの分散の期待値がマイナスになってしまいました。
どこかに間違いがあるはずなのですが、今のところ辿り着きません。正しい計算方法についてご教授ください。
A 回答 (9件)
- 最新から表示
- 回答順に表示
No.9
- 回答日時:
原因が分かりました。
このデータが特殊で、A,B,C,D主効果より、AB交互作用、BC交互作用が異常なほど大きいのです。
(分散分析表は一番下にあります)
そのため、枝分かれ実験では、次のような奇妙な現象を生んでしまいます。
① A因子はAB交互作用を生んでいるハズで、総合的には効果大なのですが、大きなAB交互作用は「枝分かれ実験の性質上」、B因子の効果に繰り入れられて、A因子がかき消されます。
② 次にA因子を単純繰り返しにして実験から取り除くと、B因子の効果が出てくるハズなのですが、B因子が生んでいる大きなBC交互作用は、これまたC因子の効果に繰り入れられて、B因子がかき消されます。
この先、C→D→Mをやっても、今度はD因子の主効果がC因子の主効果に比べ大きい為に、結局D因子にしか効果が見られないという結果になるでしょう。
【Rによる通常の分散分析結果(全ての2因子交互作用あり)】
> df <- data.frame(matrix(c(
+ 1, 1, 1, 1, 18.82,
+ 1, 1, 1, 2, 5.91,
+ 1, 1, 2, 1, 5.34,
+ 1, 1, 2, 2, 5.15,
+ 1, 2, 1, 1, 8.15,
+ 1, 2, 1, 2, 8.39,
+ 1, 2, 2, 1, 17.43,
+ 1, 2, 2, 2, 11.53,
+ 2, 1, 1, 1, 16.43,
+ 2, 1, 1, 2, 13.84,
+ 2, 1, 2, 1, 12.34,
+ 2, 1, 2, 2, 12.32,
+ 2, 2, 1, 1, 8.11,
+ 2, 2, 1, 2, 8.18,
+ 2, 2, 2, 1, 10.29,
+ 2, 2, 2, 2, 5.00),
+ ncol = 5, byrow = T))
>
> colnames(df) <- c("A", "B", "C", "D", "y")
>
> A <- as.factor(df$A)
> B <- as.factor(df$B)
> C <- as.factor(df$C)
> D <- as.factor(df$D)
> y <- as.numeric(df$y)
>
> summary(aov(y ~ A + B + C + D + A:B + A:C + A:D + B:C + B:D + C:D))
Df Sum Sq Mean Sq F value Pr(>F)
A 1 2.10 2.10 0.111 0.753
B 1 10.68 10.68 0.565 0.486
C 1 4.44 4.44 0.235 0.648
D 1 44.19 44.19 2.338 0.187
A:B 1 70.69 70.69 3.740 0.111
A:C 1 1.43 1.43 0.076 0.794
A:D 1 7.47 7.47 0.395 0.557
B:C 1 61.11 61.11 3.233 0.132
B:D 1 1.46 1.46 0.077 0.792
C:D 1 0.90 0.90 0.047 0.836
Res 5 94.51 18.90
No.8
- 回答日時:
> 要因効果として見込めないためプールすれば良いとのことで再計算していますが・・・、
長畑秀和先生のテキストの枝分かれ実験の項を見ますと、効果の無い因子は「単純繰り返し:M」という扱いをすれば良いことが分かります。
ご質問者様も、たぶんそうされたと思います。
B→C→D→M です。
ところが、やってみたら、なんとB因子も「効果が見られない」になってしまいますね。
これについては、私も面喰っています。
吟味してみます。
No.7
- 回答日時:
stomachman様、ご指摘ありがとうございます。
実験は、一般的に「特性変動の要因を解析をしたい」という目的で行われる場合が多いです。
このとき、ご指摘のとおり、取り上げなかった要因があれば、全体の寄与率が低い、というか誤差の寄与率が50%を超えていて、現象の全体像を説明しきれていない(たとえ有意な因子があったとしても真因は未だ闇の中である)、という問題が生じ得ます。
この実験の分散分析表は、偶然誤差を基準に検定します。
一方、それとは異なる実験もあります。
タイヤの摩耗量を把握するため、設定条件を振って測定したい、というような実験です。このときは、考慮したい条件しか取り上げません。もちろん、他の温度など5M1Eの系統誤差は一定となるよう管理する必要があります。
実験は、「用意する車両→位置(1,2,3,4)→タイヤメーカー」というように、枝分かれ的に条件を与えていきます。用意する車両と取り付け位置には、明らかに交互作用があり、摩耗量に影響を与えます。
Yijk = Ai + Bij + Cijk
というような添え字の付いたモデルを考えます。+ε は考えません※。分散分析表も、それを考慮して作る必要があります。
例えば、取り付け位置Bより車両Aの影響の方が有意に大きいかどうかという検討をしたいとき、検定は、Aを誤差で検定するのではなく、AをBで検定します。
これが枝分かれ実験の特徴です。
※ 実験の形は「繰り返しの無い三元配置」と同じで、一般的には二因子交互作用まで検出できますが、枝分かれ実験では三因子交互作用まで考えますので、誤差の自由度が無くなります。
kamiyasiro様、stomachman様
高いレベルで議論いただき、私が質問者にもかかわらずただただ横から勉強させていただいています。ありがとうございます。
さて、要因効果として見込めないためプールすれば良いとのことで再計算していますが、早速つまづいています。本件の場合、因子Aは因子D(A:B:C:D)にプールすべきでしょうか?それとも因子B(因子A:B)にプールすべきでしょうか?
不勉強でとてもとても反省です。
申し訳ありませんが再度教えてもらえるとうれしいです。
No.5
- 回答日時:
No.4です。
「枝分かれ実験の分散分析表は、面倒な計算をしなくても多元配置実験の分散分析表を変形して作ることができます。」と書きました。
なんと、ピッタリな動画↓を見つけました。
既にご存じだったかもしれませんね。
てか、Rの出力、平均平方の計算結果は、
> summary(aov(y ~ A / B / C / D))
_____Df Sum Sq Mean Sq
A 1 2.10 2.10
A:B 2 81.36 40.68
A:B:C 4 97.38 24.34
A:B:C:D 8 118.13 14.77
なんですが、因子はA,B,C,Dではなく、A:B・・・なんですよね。
Rの表記のA:Bは、AB交互作用の意味なんです。
追伸、
私はRでやってしまうので、平均平方の計算をまともにやったことがありませんでした。
そもそも、平均平方の計算があんなに面倒だったとは、関連動画を見るまで知りませんでした。
枝分かれ実験の分散分析表は、動画にある「裏技」の表で分散成分を習いました。
また、下位の分散を基準に検定することまでしか習っていませんでした。
ですから、平均平方の期待値の計算を知りませんでした。
ご質問者様のおかげで、勉強になりました。
こちらも大変勉強になりました。
たとえば要因B行の分散の期待値にはC、Dの分散成分が含まれているのに、平均平方はVBと表して計算を進めることに少し違和感をもっていました。
そもそも要因Bの平均平方ではなく、要因BCDの平均平方と考えたらなんとなくすっきりした気がします。
まだまだ勉強が必要です笑 先のご回答ともあわせて、ありがとうございます。
No.4
- 回答日時:
あと、枝分かれ実験は、「A, B, C, Dがそれぞれ独立に測定値に効果をもたらす」とは考えていません。
それは多元配置実験です。この点、No.1様の回答はちょっとヘンです。悪しからず。
枝分かれ実験や分割実験は、下位の因子は上位の因子の水準の影響を受けると考えられるときに用いる実験です。
下位に行けば行くほど、上位との交互作用を取り込んだ変動となります。
ですから、枝分かれ実験の分散分析表は、面倒な計算をしなくても多元配置実験の分散分析表を変形して作ることができます。
No.3
- 回答日時:
計算間違いはありません。
確かに計算は合っています。(下記はRで行った結果です。分散の期待値は一番下に結果があります)
こういう時の対処法は、Aの平均平方2.10が他より小さい時点で、Aの効果は無いと分かるので、誤差にプールすれば良いです。つまり、B→C→Dの枝分かれ実験として処理すれば良いです。
> # 教えてgoo!の事例
>
> df <- data.frame(matrix(c(
+ 1, 1, 1, 1, 18.82,
+ 1, 1, 1, 2, 5.91,
+ 1, 1, 2, 1, 5.34,
+ 1, 1, 2, 2, 5.15,
+ 1, 2, 1, 1, 8.15,
+ 1, 2, 1, 2, 8.39,
+ 1, 2, 2, 1, 17.43,
+ 1, 2, 2, 2, 11.53,
+ 2, 1, 1, 1, 16.43,
+ 2, 1, 1, 2, 13.84,
+ 2, 1, 2, 1, 12.34,
+ 2, 1, 2, 2, 12.32,
+ 2, 2, 1, 1, 8.11,
+ 2, 2, 1, 2, 8.18,
+ 2, 2, 2, 1, 10.29,
+ 2, 2, 2, 2, 5.00),
+ ncol = 5, byrow = T))
>
> colnames(df) <- c("A", "B", "C", "D", "y")
>
> A <- as.factor(df$A)
> B <- as.factor(df$B)
> C <- as.factor(df$C)
> D <- as.factor(df$D)
> y <- as.numeric(df$y)
>
> summary(aov(y ~ A / B / C / D))
Df Sum Sq Mean Sq
A 1 2.10 2.10
A:B 2 81.36 40.68
A:B:C 4 97.38 24.34
A:B:C:D 8 118.13 14.77
>
> a <- summary(aov(y ~ A / B / C))
> phi_A <- do.call(rbind, a)[1,1]
> phi_B <- do.call(rbind, a)[2,1]
> phi_C <- do.call(rbind, a)[3,1]
> phi_D <- do.call(rbind, a)[4,1]
>
> var_A <- (do.call(rbind, a)[1,3] - do.call(rbind, a)[2,3]) / phi_D
> var_B <- (do.call(rbind, a)[2,3] - do.call(rbind, a)[3,3]) / phi_C
> var_C <- (do.call(rbind, a)[3,3] - do.call(rbind, a)[4,3]) / phi_B
> var_D <- do.call(rbind, a)[4,3]
>
> var_A
[1] -4.823256
> var_B
[1] 4.084294
> var_C
[1] 4.78865
> var_D
[1] 14.76683
No.2
- 回答日時:
実験計画法や重回帰分析が活用できる典型的な場面と言えば、品質の最適化や管理ですね。
製造工程で調節できるパラメータがいくつかあるとき、それぞれのパラメータをどう設定すると目的とするコトが最適になるか、各パラメータについて、最適状態からのズレがどのぐらいの範囲に入れば、目的とするコトを妨げないか。要するに、目的とするコトはすでに大体実現できている、という状況における最後のファインチューニングの段階です。どのパラメータもいじる程度はわずかであることが想定され、また、いじる範囲が、「ある値を超えたら全くダメになってしまう」というようなクリティカルなポイントを含んでいない。そうすると、パラメータをいじる程度とその影響との間の関係は1次式でよく近似できるだろう。実験計画法では「制御できるパラメータの設定の組み合わせをシステマティックに網羅するために、なるべく少ない回数の実験で済ませるにはどうするか」を考える。枝分かれ実験を全部やるんじゃなく、直交変換(例えば離散フーリエ変換やアダマール変換)を利用して、複数のパラメータの変更をミックスするわけですが、それはパラメータが目的とするコトに与える影響が(いじる範囲の内であれば)精密に1次式で表せる、ということが前提できる場合にだけ意味を持つ。
この前提、現実には精密に成り立つわけではなく、「実験計画法を使ってみたら訳わかんないデータが出ちゃった」なんてことにもなりかねない。それは、非線形効果が無視できない、すなわちパラメータをいじる程度とその影響との間の関係は2次以上の項を使わないとよく近似できない、ということです。
最も簡単な場合としてパラメータがx, yの二つ、目的がE(x,y)だとして、
E(x,y) = ε + a[0,0] + a[1,0]x + a[0,1]y + a[2,0]x² + a[1,1]xy + a[0,2]y² + a[3,0]x³ + a[2,1]x²y + a[1,2]xy² + a[0,3]y³ + ....... (ただしε はランダムな変動)
と展開した時のa[2,0]以降の部分が「2次以上の項」です。
こういう状況で、E(x,y)を最大にする、という問題をどう扱うか。|ε|が小さいとき(もちろん、同じ状態で何度も実験して平均をとれば|ε|を小さくできる)非線形の極値探索(非線形最小二乗法)のアルゴリズムを直接利用する方が良いでしょう。すなわち、実験の結果に基づいて次にどんな実験をするかを決めるわけです。
そういう探索をやった結果、パラメータの設定範囲がかなり絞られた段階に至ると、ようやく、2次以上の項の影響がほぼ無視できる状態、すなわち
E(x₀+Δx,y₀+Δy) ≒ ε + b[0,0] + b[1,0]Δx + b[0,1]Δy
となっているでしょう。そこでいよいよ最後のファインチューニング。それには実験計画法が使えるかもしれない。
No.1
- 回答日時:
元々が「A, B, C, Dがそれぞれ独立に(他がどうなっているかに関係なく)測定値に一定の効果をもたらす」という仮定が前提になっている話です。
その仮定が成り立っていないってことでしょうね。例えばNo.1とNo.2、あるいはNo.15とNo.16を比べると、どうもDが大きな違いをもたらしているようですが、No.3とNo.4、あるいはNo.13とNo.14ではDによる違いは認められない。となると、Dの効果はA,B,Cがどうなっているか(あるいは見落としている別の要因がどうなっているか)に依存しているのかもしれない。もしそういう相互作用があるなら、上記の仮定は成り立っていないということです。
回答有難うごさいます
ということは分散分析表から分散の推定値を求めた結果がマイナスになることは(計算上は)あり得るということなんですか。
それでマイナスになったら要因ごとの効果の独立を疑うということで合ってますか?
もしこの手の記述に詳しい文献あれば教えてほしいです。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 Rを用いた「繰り返しがある直交表実験計画法」の分析方法 8 2023/08/01 17:58
- 中途・キャリア さて、社会人になってから13年目。 今まで、機械設計、機械製品の品質管理、部門の経営企画をやってきま 4 2023/07/17 08:59
- 統計学 統計学の質問【帰無仮説】 高校の新学習指導要領では、統計的仮説検定の基本的な考え方が必修単元となった 5 2023/05/23 21:00
- その他(学校・勉強) 来年4月から経済学部の大学一年生になる予定の者です。 私は将来入りたい企業があり、そこに入社するため 8 2022/08/23 04:49
- その他(悩み相談・人生相談) 小さな欲望の抑え方、長期的な学習目標を確実に達成する方法が知りたいです。 毎月の学習計画を立て、毎日 3 2024/02/18 23:20
- 弁護士・行政書士・司法書士・社会保険労務士 来年の予備試験を目指すものです。基礎力がついたか見るために3か月弱準備して、行政書士を受験しましたが 1 2022/11/15 20:40
- その他(ソフトウェア) F-BASICで計算中の実行が中途で勝手に止まり、大変困っています。 2 2023/03/02 16:15
- その他(教育・科学・学問) 大学研究室での男女学生の寝泊り 3 2022/11/21 03:16
- 統計学 母平均の検定(両側t検定)の問題 2 2023/03/14 20:02
- Excel(エクセル) Excel(エクセル)でフィルター抽出後、非表示の行を計算しないで、合計を算出する方法 【内容】 添 4 2023/01/30 17:17
このQ&Aを見た人はこんなQ&Aも見ています
-
10代と話して驚いたこと
先日10代の知り合いと話した際、フロッピーディスクの実物を見たことがない、と言われて驚きました。今後もこういうことが増えてくるのかと思うと不思議な気持ちです。
-
「平成」を感じるもの
「昭和レトロ」に続いて「平成レトロ」なる言葉が流行しています。 皆さんはどのようなモノ・コトに「平成」を感じますか?
-
遅刻の「言い訳」選手権
よく遅刻してしまうんです…… 「電車が遅延してしまい遅れました」 「歯医者さんが長引いて、、、」 「病院が混んでいて」 などなどみなさんがこれまで使ってきた遅刻の言い訳がたくさんあるのではないでしょうか?
-
牛、豚、鶏、どれか一つ食べられなくなるとしたら?
牛肉、豚肉、鶏肉のうち、どれか一種類をこの先一生食べられなくなるとしたらどれを我慢しますか?
-
好きな和訳タイトルを教えてください
洋書・洋画の素敵な和訳タイトルをたくさん知りたいです!【例】 『Wuthering Heights』→『嵐が丘』
-
サイコロを投げて6が連続して100回出ました。このサイコロは細工がされていますか?
統計学
-
【数学】確率変数の畳み込みによる積分範囲の求め方について
統計学
-
確率の求め方
統計学
-
-
4
ランダム出力の数値をコントロールし期待値50%、期待値200%になるロジックを作れません
統計学
-
5
統計学に詳しい方助けてください
統計学
-
6
この写真のようにアンケートに対する答えが同じ人が多いとその分だけ文字が大きくなる アンケートの無料サ
統計学
-
7
指数関数と階乗。グラフで表したらどっちが強いですか?
数学
-
8
統計
統計学
-
9
仕事をクビになり会社の門で憔悴していたらババアがいきなり話しかけてきました。 「この大きい袋に7で割
数学
-
10
相関係数は重複すると確率が増しますか?
統計学
-
11
10代で死ぬ確率ってどのくらいですか?
統計学
-
12
我が家の新築の豪邸にネズミが出ました。ちょうどエクササイズ中だったので、フラフープをぶん投げました。
数学
-
13
Σを含んだ式変形
数学
-
14
高校数学についてで、帰納法をたとえば数列で使うときにn=kとおいて、kで示したいものが成り立つと仮定
数学
-
15
チンパンジーの生息する山に数直線の0以上の部分を設置しました。 この山に転がっている石の表面には正の
統計学
-
16
仮説検定でコインが公平かどうか
統計学
-
17
ある物を作るのに3%材料が必要で、その材料の数量が100キロだった場合、ある物の数量は何キロになりま
数学
-
18
消費税10%の税抜き計算と10%OFFの計算法がなぜ違うのか教えて下さい。
統計学
-
19
旧課程数学B 確率分布と統計的な推測について
統計学
-
20
得点率について
数学
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・プリン+醤油=ウニみたいな組み合わせメニューを教えて!
- ・タイムマシーンがあったら、過去と未来どちらに行く?
- ・遅刻の「言い訳」選手権
- ・【大喜利】【投稿~11/12】 急に朝起こしてきた母親に言われた一言とは?
- ・好きな和訳タイトルを教えてください
- ・うちのカレーにはこれが入ってる!って食材ありますか?
- ・好きな「お肉」は?
- ・あなたは何にトキメキますか?
- ・おすすめのモーニング・朝食メニューを教えて!
- ・「覚え間違い」を教えてください!
- ・とっておきの手土産を教えて
- ・「平成」を感じるもの
- ・秘密基地、どこに作った?
- ・【お題】NEW演歌
- ・カンパ〜イ!←最初の1杯目、なに頼む?
- ・一回も披露したことのない豆知識
- ・これ何て呼びますか
- ・初めて自分の家と他人の家が違う、と意識した時
- ・「これはヤバかったな」という遅刻エピソード
- ・これ何て呼びますか Part2
- ・許せない心理テスト
- ・この人頭いいなと思ったエピソード
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・ハマっている「お菓子」を教えて!
- ・【大喜利】【投稿~11/1】 存在しそうで存在しないモノマネ芸人の名前を教えてください
- ・好きなおでんの具材ドラフト会議しましょう
- ・餃子を食べるとき、何をつけますか?
- ・あなたの「必」の書き順を教えてください
- ・ギリギリ行けるお一人様のライン
- ・10代と話して驚いたこと
- ・つい集めてしまうものはなんですか?
- ・自分のセンスや笑いの好みに影響を受けた作品を教えて
- ・【お題】引っかけ問題(締め切り10月27日(日)23時)
- ・大人になっても苦手な食べ物、ありますか?
- ・14歳の自分に衝撃の事実を告げてください
- ・【大喜利】【投稿~10/21(月)】買ったばかりの自転車を分解してひと言
- ・ホテルを選ぶとき、これだけは譲れない条件TOP3は?
- ・家・車以外で、人生で一番奮発した買い物
- ・人生最悪の忘れ物
- ・【コナン30周年】嘘でしょ!?と思った○○周年を教えて【ハルヒ20周年】
- ・あなたの習慣について教えてください!!
- ・都道府県穴埋めゲーム
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
ユニバース25は本当にあった実...
-
「被験者」と「被検者」の使い...
-
ろ紙に裏表はあるのですか?
-
プランク定数の実験で‥
-
高一の国語で 魔術化する科学技...
-
RC直列回路の実験で理論値と測...
-
欠席したらやばいことを知らず...
-
フリードリヒ2世の赤ん坊の実験...
-
紙が7回以上折れないワケ
-
数学科は楽という噂は本当ですか?
-
科学の実験手順・操作のフロー...
-
70%エタノールを使う理由
-
(自由研究)凍らせた砂糖水が...
-
10E+3は報告書に使えますか
-
大学科学_リュードベリの式
-
1cal=4.2Jなんてどうやって求め...
-
界磁&直列抵抗制御の長所・短...
-
増幅回路
-
自動販売機
-
標準偏差と標準誤差
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
ユニバース25は本当にあった実...
-
「被験者」と「被検者」の使い...
-
ろ紙に裏表はあるのですか?
-
高一の国語で 魔術化する科学技...
-
紙が7回以上折れないワケ
-
欠席したらやばいことを知らず...
-
RC直列回路の実験で理論値と測...
-
プランク定数の実験で‥
-
デーモンコアってどうして安全...
-
無色透明な油・オイルで手頃な...
-
数学科は楽という噂は本当ですか?
-
ファクターについて
-
学生実験で行う中和滴定のレポ...
-
科学の実験手順・操作のフロー...
-
アイスの種類による溶け方の違い
-
70%エタノールを使う理由
-
パルス波形では紫外線ありとな...
-
「予想とおおよそで一致した」...
-
大学の留年理由、これってあり?
-
ヨウ素の色が消えた理由
おすすめ情報