アプリ版:「スタンプのみでお礼する」機能のリリースについて

   D    E
A(2,2)  (4,8)
B(5,6)  (3,3)

という利得表の同時手番ゲームを考える問題についてなのですが、この場合の純粋戦略って(4,8)(5,6)ですよね。
そして混合戦略ナッシュ均衡を含めて考えた時、プレイヤー1と2の最適反応(赤=1、青=2)を図示したのですが以下のようになりました。(プレイヤー1がAを取る確率p、2がDを取る確率q)
下の図で丸を付けた箇所が均衡なのは知っているんですが、この場合答えの表記の仕方はどうなるんでしょうか・・?また、純粋戦略で求めた以外での混合戦略ナッシュ均衡において実現する量プレイヤーの期待利得を求めよ。との問いもあるのですが、だんだんわからなくなってきました・・。お時間のある方どうぞよろしくお願いいたします。

「混合戦略ナッシュ均衡について」の質問画像

A 回答 (1件)

均衡は利得の組ではなく、戦略の組で表わすから、このゲームの純粋戦略ナッシュ均衡は(A、E)と(B、D)の2つだ。

つまり、(A、E)は、プレイヤー1(縦プレイヤー)が戦略Aを、プレイヤー2(横プレイヤー)が戦略Eをとる、という意味である。(4,8)では何のことだかわからない。

混合戦略がからんでいるときは、プレイヤー1の戦略はAをとる確率pで、プレイヤー2の戦略はDをとる確率qで表されるので、戦略の組も(p,q)で表わされる。したがって、ナッシュ均衡は(1/3,1/4),(0,1),(1,0)の3つである。プレイヤー1の期待利得関数をF(p,q)で、プレイヤー2の利得関数をG(p,q)で表わすと、

F(p,q) = 2pq +4p(1-q) +5(1-p)q + 3(1-p)(1-q)
G(p,q) = 2pq +8p(1-q) + 6(1-p)q +3(1-p)(1-q)

となるから(なぜ?)、各プレイヤーのナッシュ均衡における期待利得はこの期待利得関数から求められる。たとえば、混合戦略ナッシュ均衡(p,q) = (1/3,1/4)におけるプレイヤー1と2のの期待利得はそれぞれ

F(1/3,1/4) = 2(1/3)(1/4) + 4(1/3)(3/4) +5(2/3)(1/4) + 3(2/3)(3/4) =・・・
G(1/3,1/4) = 2(1/3)(1/4) + 8(1/3)(3/4) +6(2/3)(1/4) + 3(2/3)(3/4) =・・・

となる(・・・の部分の計算を自分で完成させてください!)
なお、グラフはpを横軸に、qを縦軸にとって描いたほうが(すくなくとも私には)わかりやすい(あなたの図は逆になっている)。
    • good
    • 4
この回答へのお礼

なるほど・・!均衡の書き方勘違いしてたみたいです。期待利得の部分も丁寧に解説していただきありがとうございました!

お礼日時:2015/01/26 07:52

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!