プロが教える店舗&オフィスのセキュリティ対策術

混合戦略のナッシュ均衡の求め方について
B
L R
T(6.0)(0.6)
A
M(3.2)(6.0)

のような2×2の利得表のゲームでは、
(AがTを選んだ時の期待利得)=(AがMを選んだ時の期待利得)
という式でナッシュ均衡を求められると教わりました。

また、 B
L R
T(6.3) (4.2)
A M(8.3) (3.4)
B(2.0) (5.5)

のような2×3のゲームでは、均衡になりうる混合戦略の候補を7通りで場合分けしてそれぞれについて考えました。

それでは、3×3のゲームの利得表ではどうなのでしょうか?そのゲームには強く支配される戦略は存在しません。2×3の場合のように全ての場合に対して場合分けを行って解くのでしょうか?

質問者からの補足コメント

  • すみません
    混合戦略のナッシュ均衡の求め方について
    B
    L R
    T(6.0)(0.6)
    A
    M(3.2)(6.0)


    B
    L R
    T(6.3) (4.2)
    A M(8.3) (3.4)
    B(2.0) (5.5)

      補足日時:2019/06/26 14:12

A 回答 (4件)

質問にある2×2の利得行列場合も解いてみましょうか。

このときAとBのきたい期待利得はそれぞれ
EπA=PT(6PL) + (1-PT)[3PL + 6(1-PL)]

EπB=PL[2(1-PT] + (1-PL)(6PT)

となるから、それぞれPTとPLで微分(偏微分)して、一階の最大化条件(クーン・タッカー条件)を用いると

∂EπA/∂PT=9PL - 6 ≦0 ただし、PT>0なら等式が成立
∂EπB/∂PL=2 - 8PT≦0ただし、PL>0なら等式が成立
を得る。
いま、PT>0と仮定すると、最初の不等式は等式となるので、
PL=6/9=2/3
を得る。よって、PLは正、2番目の不等式は等式となるので、
PT=2/8=1/4
を得る。こうして得られたPT=1/4は正で、最初の仮定(PT>0と仮定したことに注意!)を満たすので、PT=1/4とPL=2/3は最大化の解である。よって、(PT,PB)=(1/4,3/4)、(PL,PR)=(2/3,1/3)は混合戦略ナッシュ均衡であることが示された。

このように、とくに簡便法を覚えなくても、期待利得を戦略変数であるPT,PLで最大化するという正攻法で、混合戦略ナッシュ均衡解は簡単に求まる。
    • good
    • 1

2×2、3×2の利得行列だけでなく、3×3の利得行列に対応する混合戦略ナッシュ均衡の解き方を知りたいのなら、3×3の利得行列の例を出してくださいよ。

前者の2つの例と同じように解いてみますから!!沈黙しているだけでは、分かったのか、分からないのか、回答者はわからない!!
    • good
    • 1

No1で、微分して0とおくとしましたが、PT等はゼロの値をとる可能性があるので、厳密にいうと、Kuhn-Tucker条件を使わないといけないかもしれない。

この条件のことは習いました?
例として、あなたの質問の3×2の利得行列のケースを考えてみましょう。AとBの期待利得はそれぞれ

EπA=PT[6PL + 4(1-PL)] + (1-PT-PB)[8PL+ 3(1-PL)] + PB[2PL + 5(1-PL)]

EπB=PL[3PT + 3(1-PT-PB)] + (1-PL)[2PT + 4(1-PT-PB) + 5PB]

となることはよろしいですか?Aの期待利得の式とPTとPBについて偏微分して最大化の一階の条件を求めると

∂EπA/∂PT=-3PL +1 ≦0 ただし、PTが正なら、等式が成立
∂EπA/∂PB= -8PL + 2 ≦0 ただし、PBが正なら、等式が成立

同様に、Bの期待利得の式をPLについて偏微分して最大化の一階の条件を求めると

∂πB/∂PL=2PT - 4PB - 1≦0 ただし、PLが正なら、等式が成立

となる。いま、PT>0と仮定してみる。すると、1番目の一階の条件は等式が成立するので、PL=1/3となる。これを2番目の式に代入すると、右辺は(-8)×(1/3)+2=-2/3と負、よってPB=0となる(なぜ?)PL=1/3と正の値だから、3番目の式は等式で成立。この式の右辺にいま求めたPB=0を代入すると、PT=1/2を得る。よって、(PT,PM,PB)=(1/2,1/2,0)と(PL,PR)=(1/3,2/3)は混合戦略ナッシュ均衡ということになる(なぜ?)
    • good
    • 0

・もとの問題と補足したものとはどこが違うの?もしかして、ドットがコンマになってる?そのくらいなら、すぐわかるよ。


・正攻法ではなく、簡便法を求めているということ?3X3ぐらいまでだったら、とくに簡便法をつかわなくても正攻法でもすぐ解けるでしょう。
・正攻法は、Aの戦略を(PT,,1-PT-PB, PB)とし、Bの戦略を(PL,1-PL-PR, PR)とし、まず、EΠA=Aの期待利得、EΠB=Bの期待利得をPT,PB,PL,PRの関数としてあらわす。つぎに、
(1)EΠAをPTとPBについて最大化する。つまり、0=∂EΠA/∂PT=∂EΠA/∂PBを解く。
(2)EΠBをPLとPRについて最大化する。つまり、0=∂EΠB/∂PL=∂EΠB/∂PRを解く。
(3)4つの、PT,PB,PL,PRについての4元一次方程式が得られるので、それを解けばよい。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!