プロが教える店舗&オフィスのセキュリティ対策術

行列ゲームの2人ゲーム問題を解いていて最後のところで詰まってしまいました。

得点行列で与えられる2人ゲームのゲーム値と最適戦略を求める問題で、

1 -1 -1
-1 -1 3
-1 2 -1

シンプレックス法を用いて、次のように求めました。

1 0 0 1/2 0 0 1/2
0 0 1 0 1/4 0 1/4
0 1 0 0 0 1/3 1/3
0 0 0 1/2 1/4 1/3 7/12


ゲーム理論の本を読みながらここまで頑張ってみたのですが、
どの部分がゲーム値と最適戦略になるのかが理解できませんでした。

どなたかご教授お願いいたします。

A 回答 (4件)

まず、前回の回答の訂正をします。



x1 = 6/13 , x2 = 3/13 , x3 = 4/13 , y1 = 6/13 , y2 = 4/13 , y3 = 3/13

が正しい値です。
そして、この値のとき、均衡状態になります。
もしAさんもBさんもこの値の通りの確率で選択肢を選べば、

f(x1,x2,x3,y1,y2,y3)
= 1x1y1 -1x1y2 -1x1y3 -1x2y1 -1x2y2 +3x2y3 -1x3y1 +2x3y2 -1x3y3
≒ -0.0769

となりますので、Aさんは、ゲーム1回当り、平均で 0.0769 点 程度、損をすることになります。
逆にいえば、Bさんは、ゲーム1回当り、平均で 0.0769 点 程度、得をすることになります。

さて、x1,x2,x3,y1,y2,y3 にいろいろな値を入れてみました。
(ご自分でも試してみて下さい。ただし、x1 + x2 + x3 = 1 , y1 + y2 + y3 = 1 にして下さい。)
その結果として、少なくともこの問題に限っては、次のことがわかりました。

・Bさんが上記の戦略を採用すれば、Aさんがどんな戦略をとったとしても、
  Bさんは平均で 0.0769 点 程度、得をする → Bさんにとってはこの戦略が最適
・Aさんが上記の戦略を採用すれば、Bさんがどんな戦略をとったとしても、
  Aさんは平均で 0.0769 点 程度、損をする → Aさんがこの戦略をとるメリットはあまりない

ということは、Bさんは、相手の戦略を知らなくても得をすることができます。
(もちろん、相手の戦略を知っていればもっと得ができるでしょう。)
しかし、Aさんは、Bさんが正しい戦略をとる限り、勝ち目はありません。
しかも、Bさんが正しい戦略をとらないとしても、
Bさんの戦略をAさんが読めなければ、Aさんは勘で勝負するしかありません。


私がこの問題を最初に見たとき、AさんとBさんの勝率は5分5分だろうと思っていました。
でも、実はこのゲームはBさんが有利なんですね。
yatukoさんのおかげで、私も少し賢くなれました。ありがとうございます。
    • good
    • 0
この回答へのお礼

分かりやすく書かれていたので、この計算の考え方が理解できたと思います!
自分で頑張って計算してみました。
長々と本当にありがとうございました!!

お礼日時:2007/12/26 23:09

>> x1 + x2 + x3 = 13/12 ですから、x1,x2,x3 に 12/13 をかけると、


> のところは、逆数にしてからかけるということでいいのでしょうか?

はい、その通りです。x1 + x2 + x3 = 1 になるように、そうします。

> この値がゲーム値ということになるのですか?

ではありません。
はっきりはわかりませんが、シンプレックス表にゲーム値は書いていないのかもしれません。


では、リクエストがありましたので、続きを書くことにします。

Aさんは選択肢1,2,3のどれかしか選べませんから、x1 + x2 + x3 = 1 、
同様にBさんについて、 y1 + y2 + y3 = 1 です。

1回ゲームをするときAさんが得られる得点の期待値は、
f(x1,x2,x3,y1,y2,y3) = 1x1y1 -1x1y2 -1x1y3 -1x2y1 -1x2y2 +3x2y3 -1x3y1 +2x3y2 -1x3y3
です。

均衡状態では、x1 + x2 + x3 = 1 を保った状態で
x1 を少しだけ増やして x2 を少し減らしても f の値は変わりません。
これを数式で表すと、
∂f/∂x1 - ∂f/∂x2 = 0
となります。(これは偏微分というものです。)

同様にすると4つの式が得られ、
∂f/∂x1 - ∂f/∂x2 = 0
∂f/∂x2 - ∂f/∂x3 = 0
∂f/∂y1 - ∂f/∂y2 = 0
∂f/∂y2 - ∂f/∂y3 = 0
が成り立ちます。

計算すると、
∂f/∂x1 = y1 - y2 - y3
∂f/∂x2 = - y1 - y2 + 3y3
∂f/∂x3 = - y1 + 2y2 - y3
∂f/∂y1 = x1 - x2 - x3
∂f/∂y2 = - x1 - x2 + 2x3
∂f/∂y3 = - x1 + 3x2 - x3
となり、これを4つの式に代入すると、

2y1 - 4y3 = 0
-3y2 + 4y3 = 0
2x1 - 3x3 = 0
-4x2 + 3x3 = 0

となります。
これに x1 + x2 + x3 = 1 と y1 + y2 + y3 = 1 を加え、
6変数で6つの式の一次連立方程式を解きます。
その結果、
x1 = 4/13 , x2 = 2/13 , x3 = 3/13 , y1 = 4/13 , y2 = 3/13 , y3 = 2/13
が得られます。

(申し訳ありませんが字数制限上、補足をお願いします。)

この回答への補足

長々とありがとうございます。

ここまでの計算の流れはわかりました。
また続きをお願いします!

補足日時:2007/12/20 22:57
    • good
    • 0

なぜ+αすると計算がうまくいくのか、


なぜ補足の線形計画問題を解けばよいのかについては、
私にはわかりません。
質問者さんの本を読めばたぶんわかると思うのですが、
そういうわけにもいきませんし…
満足な答えができなくてすいません。

でも、解いた結果のシンプレックス表は、

1x1 + 0x2 + 0x3 = 1/2
0x1 + 0x2 + 1x3 = 1/4
0x1 + 1x2 + 0x3 = 1/3

を表しています。
つまり、x1 = 1/2 , x2 = 1/3 , x3 = 1/4 です。

x1 + x2 + x3 = 13/12 ですから、x1,x2,x3 に 12/13 をかけると、

x1 ' = 6/13 ≒ 0.461
x2 ' = 4/13 ≒ 0.308
x3 ' = 3/13 ≒ 0.231

とすると、x1 ' + x2 ' + x3 ' = 1 となります。

どうもこの解は、
Aさんは 6/13 の確率で選択肢1(1,-1,-1)を選び、
Aさんは 3/13 の確率で選択肢2(-1,-1,3)を選び、
Aさんは 4/13 の確率で選択肢3(-1,2,-1)を選べばよい
Bさんは 6/13 の確率で選択肢1(1,-1,-1)を選び、
Bさんは 4/13 の確率で選択肢2(-1,-1,2)を選び、
Bさんは 3/13 の確率で選択肢3(-1,3,-1)を選べばよい
ことを表しているようです。


実は、私は別の方法でこの問題を解いて、上記のことがわかりました。

もしBさんが等確率で選択肢1,2,3を選ぶとすれば、
Aさんは選択肢2を選び続けるのが最適です。
でも、Bさんはそのことがわかっていますから、
選択肢3を避け、選択肢1,2のどちらかを選ぶでしょう。
では、AさんとBさんは、どの確率でどの選択肢を選べばいいのでしょうか。

Aさんが選択肢1,2,3を選ぶ確率をそれぞれ x1 , x2 , x3 とします。
Bさんが選択肢1,2,3を選ぶ確率をそれぞれ y1 , y2 , y3 とします。
すると、…

この辺で字数制限に引っかかります。
分割投稿は禁止ですが、もし続きをお知りになりたいなら、
コメントして頂ければ回答できると思います。

この回答への補足

ありがとうございます!
表の意味が分かりました。

それから少し疑問に思ったのですが、

>x1 + x2 + x3 = 13/12 ですから、x1,x2,x3 に 12/13 をかけると、

のところは、逆数にしてからかけるということでいいのでしょうか?
この値がゲーム値ということになるのですか?

続きが気になるので、
よろしければぜひ解説をお願いします。

補足日時:2007/12/16 22:39
    • good
    • 0

得点行列とは何でしょうか。


AさんとBさんが対戦して、Aさんが2番目の選択肢、
Bさんが3番目の選択肢を選択したら、
Aさんが+3点、Bさんが-3点になる、という意味で間違いないでしょうか。

それから、シンプレックス法は、制約条件と目的関数があり、
それを解いた結果が質問内容の表になっていると思います。
最初に立てた制約条件と目的関数を、式の形で書いて頂けないでしょうか。

この回答への補足

AさんとBさんの得点のその意味で合ってます。
この行列のゲーム値と、AとBの最適戦略を求めたいのです。
まぎらわしく書いてしまい、すみませんでした。

まず問題の行列の成分をすべて+1しました。
解説によると行列の中を0以上なるように+αすると計算がうまくいくと書かれていたので。
それを線形計画問題化したのが下です↓

2 0 0
0 0 4
0 3 0

2x1<=1
4x3<=1
3x2<=1
x1,x2,x3>=0の下で
z=x1+x2+x3 
を最大にする

ちなみに縦の列ごとにx1,x2,x3と表しています。

そもそもこの考え方とやり方が合っているのかが不安ですが・・・
よろしくお願いいたします。

補足日時:2007/12/14 01:13
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!