【最大10000ポイント】当たる!!質問投稿キャンペーン!

A,Bの2人がいる非ゼロ和ゲームにおいて
(A,B)
(ドラマ、ドラマ)=(7,3)
(ドラマ、バラエティ)=(4,6)
(バラエティ、ドラマ)=(5,5)
(バラエティ、バラエティ)=(6,4)
という利得行列があります。
これについて、混合戦略を求めたいのですが、
Aがドラマを選択する確率をp、バラエティを1-p
Bがドラマを選択する確率をq、バラエティを1-q
とすると、

E(A)=7pq+5(1-p)q+4p(1-q)+6(1-p)(1-q)
=7pq+5q-5pq+4p-4pq+6-6q-6p+6pq
=4pq-q-2p+6
=(4p-1)q-2(p-3)

∴0≦p≦1/4

とここまでは分かったのですが、答えをどう出せばいいのかわかりません。
qの範囲も出した方がいいのでしょうか?
そして、このpの範囲は、何の意味があるのでしょうか?

どなたか、教えて下さい!!

このQ&Aに関連する最新のQ&A

A 回答 (5件)

大きな間違いをしてしまいました。

すみません。

playerAが動かせる変数はpなので、E(A)をpでまとめます。すなわち、
E(A)=(4q-2)p-q+6
で、あとはこれを最大にすることを考えるので
4q-2>0でp=1
4q-2<0でp=0
4q-2=0でp=なんでもいい。∴q=1/2

ということで、
>pもqも1/2になりましたが・・・
あってそうですね。
    • good
    • 1
この回答へのお礼

ありがとうございました
テストは無事おわりました。

お礼日時:2003/07/29 20:12

ERIeriERIさん、こんばんは。


ゲーム理論については、全く知らないのですが、
下記の参考URLは参考にならないでしょうか。

これによると、
P0={(p1,p2)|0≦p1≦1,0≦p2≦1,p1+p2=1}
Q0={(q1,q2)|0≦q1≦1,0≦q2≦1,q1+q2=1}
を、各プレーヤーの戦略をとりうる確率の集合とすると、
ここでは、P=(p,1-p)ですが、これがP0の中から選択されたときに
Bは、これに対抗して、E(A)が最小となるQ=(q,1-q)をQ0の中で選ぶということになるそうです。
それを、
min{E(P,Q)|Q∈Q0}
この最小を
minE(P,Q)
Q
とかくと、Aはこれに対抗して、利益を最大になるように戦略を選ぶので
max minE(P,Q)
P   Q

一般に、
max minE(P,Q)≦min maxE(P,Q)
P   Q       Q   P

が成り立つようです。
また、フォン・ノイマンのミニマックス定理より

max minE(P,Q)=min maxE(P,Q)
P   Q       Q   P

となる解が存在し、これを最適戦略というようです。

少しでも参考になればと思ったのですが、ここまでしか分かりません。
「非ゼロ和ゲーム」「ゲーム理論」「利得行列」
などで検索してみますと、参考になりそうなページがいくつかありますので
見てみてください。
試験のほう、頑張ってください。あまりお役に立てずにすみません。

参考URL:http://ysserve.cs.shinshu-u.ac.jp/Lecture/Optimi …
    • good
    • 1
この回答へのお礼

回答ありがとうございます。
テストは無事終わりました。

お礼日時:2003/07/29 20:08

ANo.#1の方のご指摘どおりですが、もう少し説明を加えるとAが戦略を立てる場合に、Bがどう出るかを考慮するのが混合戦略なので、Aの期待利得E(A)をBがどう出るかに関する確率qの方程式と考え、方程式の最大化問題と捉えます。



この問題設定はそのまま「ゲーム理論入門」日経文庫―経済学入門シリーズ・武藤 滋夫 (著)
にあるのでそちらを参照するのが良いでしょう。
#試験に間に合うのであれば、ですが。
    • good
    • 1
この回答へのお礼

ありがとうございました、
テストは無事終わりました

お礼日時:2003/07/29 20:10

どうでもいいつけたしで間違えました。



×ゼロサムですがコンスタントサムなので本質はゼロサムですね。
○非ゼロサムですがコンスタントサムなので本質はゼロサムですね。

この回答への補足

#3の方の本を借りに行ったのですが、図書館は休館日、本屋にはなかったので、、、
去年違う授業で習った方法でやってみました。

pもqも1/2になりましたが・・・
これで合ってるのでしょうか・・

補足日時:2003/07/28 18:52
    • good
    • 1

ゼロサムですがコンスタントサムなので本質はゼロサムですね。


ま、本筋には関係ないのでどうでもいいですが。
それと、なぜいきなり
∴0≦p≦1/4
という結論が出てくるのか分かりませんが、

E(A)=(4p-1)q-2(p-3)
がどこで最大になるか考えてみると、
4p-1が正ならq=1
4p-1が負ならq=0
4p-1が0ならqはどの値でも最適戦略
ということで、横軸p、縦軸qとして
どこの点で最良戦略が取られているかを図示すれば
よいでしょう。

この回答への補足

回答ありがとうございます。

混合戦略をあまりよく理解できていないのですが、
明日テストのため、何かパターンがあれば・・・と思っています。
Aの最適戦略を求めるときは、qの最大値を求めればいいということでしょうか?
逆にBのときはpの最大値を求めることになりますか?

確かにこの問題の最後に図示して解答するように と書いてありますので、
図示する方が考えやすいということなのでしょうか。

本質を理解していない上で質問しているので、
何言ってるんだ?とお思いになるかと思いますが。。。
よろしくお願いします。

補足日時:2003/07/28 15:14
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q混合戦略ナッシュ均衡について

   D    E
A(2,2)  (4,8)
B(5,6)  (3,3)

という利得表の同時手番ゲームを考える問題についてなのですが、この場合の純粋戦略って(4,8)(5,6)ですよね。
そして混合戦略ナッシュ均衡を含めて考えた時、プレイヤー1と2の最適反応(赤=1、青=2)を図示したのですが以下のようになりました。(プレイヤー1がAを取る確率p、2がDを取る確率q)
下の図で丸を付けた箇所が均衡なのは知っているんですが、この場合答えの表記の仕方はどうなるんでしょうか・・?また、純粋戦略で求めた以外での混合戦略ナッシュ均衡において実現する量プレイヤーの期待利得を求めよ。との問いもあるのですが、だんだんわからなくなってきました・・。お時間のある方どうぞよろしくお願いいたします。

Aベストアンサー

均衡は利得の組ではなく、戦略の組で表わすから、このゲームの純粋戦略ナッシュ均衡は(A、E)と(B、D)の2つだ。つまり、(A、E)は、プレイヤー1(縦プレイヤー)が戦略Aを、プレイヤー2(横プレイヤー)が戦略Eをとる、という意味である。(4,8)では何のことだかわからない。

混合戦略がからんでいるときは、プレイヤー1の戦略はAをとる確率pで、プレイヤー2の戦略はDをとる確率qで表されるので、戦略の組も(p,q)で表わされる。したがって、ナッシュ均衡は(1/3,1/4),(0,1),(1,0)の3つである。プレイヤー1の期待利得関数をF(p,q)で、プレイヤー2の利得関数をG(p,q)で表わすと、

F(p,q) = 2pq +4p(1-q) +5(1-p)q + 3(1-p)(1-q)
G(p,q) = 2pq +8p(1-q) + 6(1-p)q +3(1-p)(1-q)

となるから(なぜ?)、各プレイヤーのナッシュ均衡における期待利得はこの期待利得関数から求められる。たとえば、混合戦略ナッシュ均衡(p,q) = (1/3,1/4)におけるプレイヤー1と2のの期待利得はそれぞれ

F(1/3,1/4) = 2(1/3)(1/4) + 4(1/3)(3/4) +5(2/3)(1/4) + 3(2/3)(3/4) =・・・
G(1/3,1/4) = 2(1/3)(1/4) + 8(1/3)(3/4) +6(2/3)(1/4) + 3(2/3)(3/4) =・・・

となる(・・・の部分の計算を自分で完成させてください!)
なお、グラフはpを横軸に、qを縦軸にとって描いたほうが(すくなくとも私には)わかりやすい(あなたの図は逆になっている)。

均衡は利得の組ではなく、戦略の組で表わすから、このゲームの純粋戦略ナッシュ均衡は(A、E)と(B、D)の2つだ。つまり、(A、E)は、プレイヤー1(縦プレイヤー)が戦略Aを、プレイヤー2(横プレイヤー)が戦略Eをとる、という意味である。(4,8)では何のことだかわからない。

混合戦略がからんでいるときは、プレイヤー1の戦略はAをとる確率pで、プレイヤー2の戦略はDをとる確率qで表されるので、戦略の組も(p,q)で表わされる。したがって、ナッシュ均衡は(1/3,1/4),(0,1),(1,0)の3つである。プレイヤ...続きを読む

Q混合戦略の期待利得の求め方

混合戦略に関する問題で期待利得の求め方なのですが
たとえば戦略が2つの時は、利得は適当に4と6とでも置きまして
戦略1を選ぶ確立をp、戦略2を選ぶ確立を(1-p)で
4*p+6*(1-p)と成りますよね?
戦略2つまでなら理解できるのですが戦略3つ以上となるとどの様な式になるのでしょうか?

数学に疎くて全く分かりません、先に進めず困っています
分かる方教えてください

Aベストアンサー

単に「利得の期待値」を求めるだけです.
つまり個々の戦略に対して「その戦略を選ぶ確率」と「その戦略を選んだときの利得」の積を計算し, それをすべての戦略に対して加えるだけ.

Qナッシュ均衡をわかりやすく説明してください。

最近、ジョン・ナッシュの伝記を読んでいるのですが、
「ナッシュ均衡」がいまいち良くわかりません。
詳しい方、本質をわかりやすく、教えていただけると
幸いです。よろしくお願いします。

Aベストアンサー

パソコンを買うことを例にあげましょう。(なんでもいいのですが)

 皆が、パソコンを買おうとお店に行きます。この場合パソコンの価格は、市場に出ているパソコンの供給量と、パソコンを欲しがる人の需要のバランスで決まります。つまりパソコンが余ると値段が下げないと売れないでしょうし、逆に足りないと少々高くても売れるでしょう。でも、どこかで価格はそれなりに落ち着くことになるだろう。こういう考え方を市場均衡といいます。

 さて、ここである店が激安パソコンを売り始めました。すると皆は、その激安パソコンを買おうとするので、他の店は大弱りです。それで結局、他の店も全部激安パソコンを売り始めました。一度そうなると、今度はそう簡単にはどの店も価格を元の値段には戻せなくなってしまいます。このように、相手の戦略(激安パソコンを売る)に対してお互いが最善を尽くしている(皆、激安パソコンを売っている)状況でつりあっている(身動き取れない)ことをナッシュ均衡と言います。
 ナッシュはこういう状況が起こり得ることを数学的に証明しました。きちんとした証明はゲーム理論や経済学の本等を調べてください。

パソコンを買うことを例にあげましょう。(なんでもいいのですが)

 皆が、パソコンを買おうとお店に行きます。この場合パソコンの価格は、市場に出ているパソコンの供給量と、パソコンを欲しがる人の需要のバランスで決まります。つまりパソコンが余ると値段が下げないと売れないでしょうし、逆に足りないと少々高くても売れるでしょう。でも、どこかで価格はそれなりに落ち着くことになるだろう。こういう考え方を市場均衡といいます。

 さて、ここである店が激安パソコンを売り始めました。すると皆は...続きを読む

Q無限繰り返しゲームについて教えてください

 両者がとりうる戦略はこの2つ。
  企業b
  高価格     低価格
企 (15.15) (0.0)
業 
A (30.0)  (5.5)

 このゲームが無限に繰り返される状況を考える。割引因子δ(0<δ<1)とし、各企業はトリガー戦略をとることと仮定する。トリガー戦略がこの繰り返しゲームのナッシュ均衡となるための、割引因子δの範囲を求めよ。という問題なのですが、教科書やパソコンで調べても全く分かりません。よかったらどなたか教えてください。おねがいします。

Aベストアンサー

問題の雰囲気からしてAが高価格、Bが低価格の場合、
利得は(0、30)だと思います。
(でないと、多分Bは低価格に変更する動機を持たないと思います)
ので、勝手ながら一部書き直して計算しています。ご了承ください。

問題文で、両者がトリガー戦略をとることを仮定しているので、
相手がトリガー戦略をとるものとしてAの立場で考えてみます。
まず、Aもトリガー戦略をとった場合、
n回目までのAの利得の期待値Sは、
S=15+15δ+15δ^2+・・・+15δ^n-1
(δ^nはδのn乗の意味です)
Sを求めるにはδ×SをSから引くと簡単な式に直せます。
その時δ^n=0(δ<1)に注意しましょう。
次にAがいきなり1回目のゲームで低価格に変更した場合の
Aの利得の期待値Tは、
T=30+5δ+5δ^2+・・・+5δ^n-1
Sのときと同様、TからδTを引いてTを求めます。
トリガー戦略をとった方が、利得が大きくなっていれば
トリガー戦略が最適反応といえるので
S>Tとなるようなδが問題の答えです。

Q純粋戦略ナッシュ均衡について

  D    E    F
A(4,4) (0、0) (7,0)
B(0,0) (1,1) (0,0)
C(0,7) (0,0) (6,6)

(プレイヤー1の利得、プレイヤー2の利得)

A,B,Cはプレイヤー1の選択、
D,E,Fはプレイヤー2の選択であり、
プレイヤー1と2が同時に独立に選択する場合の、純粋戦略ナッシュ均衡はどうなるのでしょうか?

何冊かテキストのゲーム理論の部分を読んでみましたが、いまいち純粋戦略ナッシュ均衡とはなんなのか理解できないので、どなたか教えていただけると助かります。
問題には、純粋戦略ナッシュ均衡を全て挙げよと書いてあるのですが、ナッシュ均衡は、相手の選択を所与のものとした場合に、他の選択肢を選んでも、利得が増えることのない選択のことですよね?
一つのゲームにいくつもあるものなのでしょうか?
素人な質問ですみませんが、よろしくおねがいいたします。

Aベストアンサー

質問者さんがおっしゃる通りで正しいです。

Q支配戦略均衡の求め方

この画像の支配戦略均衡はあるのでしょうか?

Aベストアンサー

ありますよ。支配戦略がどういうものか知っているなら、利得表を見れば一目瞭然ではないか!このゲームでは各プレイヤーが選択できる戦略はXとYの2つだが、ある戦略が支配戦略であるとは、相手がどんな戦略を選んでも、その戦略を選択したほうが、他の戦略を選択するより高い利得を得られるなら、それが支配戦略だ。相手がXを選んだら、あなたの最適な戦略は?相手がYを選んだら、あなたの最適な戦略は?その最適な戦略が相手の選ぶ戦略によって変わらなければ、それが支配戦略だ。各プレイヤーに支配戦略があるなら、それを用いるのが、合理的で、支配戦略の組が支配戦略均衡と呼ばれ、それは同時にナッシュ均衡でもある。これだけ説明すれば、このゲームには支配戦略があり、支配戦略がどの戦略の組であるかは直ちにわかるでしょう!

Qプレイヤーが3人のナッシュ均衡

プレイヤーが3人の時のナッシュ均衡はどう求めればいいのでしょう?

例えば、
3人が0か1かを選ぶ同時手番ゲームで、
3人の和が奇数だと全員に利得1
3人の和が偶数だと全員に利得0

このときナッシュ均衡は(0,0,1)(0,1,0)(1,0,0)(1,1,1)でいいのでしょうか?

Aベストアンサー

合ってます。
n人のゲームのナッシュ均衡も定義にしたがって求めれば大丈夫です。

Qベルトラン均衡の求め方がわかりません。

こんにちは! 趣味で経済学を学んでいる者です。テキストを見ながら学習を進めていたのですが、巻末の演習問題で詰まってしまいました。解説が掲載されていないので、皆様の知恵をお借しください!

需要関数 q=34-p/3 企業数は2社、費用関数ci(qi)=6qiで共通とします。 q:市場全体の生産量、p:価格、i:添え字です。

(1)この条件下でのベルトラン均衡の求め方

(2)共同利潤最大化後の各企業の利潤(利潤は2社で折半)

(3)このベルトランの場合、独占価格を維持する結託(カルテル)を可能とする割引因子:∂の最小値

別の質問サイトに投稿したのですが、回答がないためこちらで質問させていただきました。

よろしくお願いします。

Aベストアンサー

(1)はこのベルトラン競争のナッシュ均衡を求める問題。どんなテキストを使っているのか知りませんが、通常テキストでベルトラン競争の例としてあげられている通りの問題で、ナッシュ均衡が何であり、ベルトラン競争がどういうものかわかっていたら、直ちに答えられる問題のはずです。答えは(p1,p2)=(6,6) となります。参考のため、私がOKwaveで最近回答したのがありますから(↓)、それを参考に考えて見てください。
     http://oshiete.goo.ne.jp/qa/7840666.html
(2)は、企業1が独占企業だったら、価格をいくらに設定するか考えればよい。独占企業の価格設定はどのようになされるのか、テキストの独占のところをもう一度復習してみてください。ヒントは、限界収入=限界費用を満たす価格・数量において独占企業の利潤は最大化される、ということです。
(3)は、(1)が静学ゲーム(一回限りの同時手番ゲーム)であったのに対し、動学ゲーム(この場合は無限繰り返しゲーム)であって、(1)のゲームが無限に繰り返されるときどうなるか、という問題です。キーポイントは「トリガー戦略」で、両企業がこの戦略をとると、そのとき成立するサブゲーム完全均衡(の1つ)において、(2)で求めた独占価格が支配することになる、という結果が得られます。つまり、両企業が価格カルテルを結ばなくても、いわば暗黙の了解としてカルテルと同じ結果を得ることになる、ということです。「戦略」、「繰り返しゲーム」、「サブゲーム」、「サブゲーム完全均衡」、「トリガー戦略」が何かということをきちんと理解することが求められます。テキストの該当部分を何度も読んでこれらの概念を理解してから、問題にトライしてください。簡単な(1)、(2)の問題が解けないようでは、(3)の問題を解こうとするのは無理でしょう!

(1)はこのベルトラン競争のナッシュ均衡を求める問題。どんなテキストを使っているのか知りませんが、通常テキストでベルトラン競争の例としてあげられている通りの問題で、ナッシュ均衡が何であり、ベルトラン競争がどういうものかわかっていたら、直ちに答えられる問題のはずです。答えは(p1,p2)=(6,6) となります。参考のため、私がOKwaveで最近回答したのがありますから(↓)、それを参考に考えて見てください。
     http://oshiete.goo.ne.jp/qa/7840666.html
(2)は、企業1が独占企業だったら、価格を...続きを読む

Qナッシュ均衡を求める練習問題について

現在、武藤滋夫氏の著書、「ゲーム理論入門」を呼んでいます。

練習問題でどうしても納得のいかない部分があったので、分かる方がいましたら解説をしていただきたいと思い、質問させていただきました。



練習問題の概要は以下の通りです。


-------------------------------

1.A、B両氏が協力して100万円の儲けを得た。

2.それぞれの取り分は、お互いが欲しいと思う金額(100万円以内)を書いた紙を第三者に提出して決めることにする。

3.もし、両者の希望額の合計が100万円に満たない場合、それぞれは希望額を受け取る。余った金額は福祉団体へ寄付する

4.もし、両者の希望額の合計が100万円を超えた場合、全額福祉団体へ寄付する。

問い)2人はそれぞれどれだけの金額を書けばよいか。この状況を戦略形ゲームとして表現し、純粋戦略でのナッシュ均衡をすべて求めよ。

-----------------------------------


それに対して、僕は以下のように解答しました。



--------------------------------------

Aの書いた金額をx、Bの書いた金額をyとすると、

Aの利得 = x ( x + y <= 100)
      0 ( x + y > 100)
Bの利得 = y (x + y <= 100)
      0 (x + y > 100)
となる。

Bの書いた金額yを固定すると、Aの利得が最大になるのは
x = 100 - y
の時であり、同様にAの書いた金額xを固定すれば、
y = 100 - x

Bの最大の利得である。

つまり、x + y = 100
となる(x, y)の組であれば、A,Bどちらも最適反応戦略であり、ナッシュ均衡である。

---------------------------------------


しかし、本書の解答には、この均衡の他に
(x, y) = (100, 100)
がナッシュ均衡であると書いてあります。

なぜこの組がナッシュ均衡になっているのかがわかりません。

分かる方がいましたら、ぜひ解答をお願いします。

現在、武藤滋夫氏の著書、「ゲーム理論入門」を呼んでいます。

練習問題でどうしても納得のいかない部分があったので、分かる方がいましたら解説をしていただきたいと思い、質問させていただきました。



練習問題の概要は以下の通りです。


-------------------------------

1.A、B両氏が協力して100万円の儲けを得た。

2.それぞれの取り分は、お互いが欲しいと思う金額(100万円以内)を書いた紙を第三者に提出して決めることにする。

3.もし、両者の希望額の合計が100万円に満た...続きを読む

Aベストアンサー

B が 100 であったとしましょう。すると A の最適反応は、0だけではなく0から100までの全てになります(利得は全て変わりません)。Bについても同じなので、結局最適反応の組(ナッシュ均衡)は (100, 100) になります。

Q需要曲線の均衡価格の求め方を教えてください

ある問題でこのように出されました。

D=100-p
S=3p
と書かれていました。また、縦軸は価格で横軸を数量とするとなっています。
問題はグラフを描いて、均衡価格と均衡取引量を求めないさいというものです。

私は数学を2~3年やっていなくて、まったく分かりませんでした。友人は「たぶん、中学2年生レベルの数学でできるよ」と言われたのですが、それでもわからなかったです。

どのように求めればよいのか教えてもらいたいです。答えは自分で頑張って求めてみます。

回答よろしくお願いします。

Aベストアンサー

均衡価格は需要量と供給量が一致する価格ですから
D=Sとなればよいわけですよね。
なら
Dつまり100-pとSつまり3pが等しいという方程式を解けばpが求められるはずです。
次に求めたpを元の式に代入すればD=Sの値つまり均衡取引量が求められるでしょう。


人気Q&Aランキング