ぜひ教えてください。次の問題がわからなくて困っています。
ゲーム理論のトリガー戦略についての問題なのですが、
次の利得表において、
             B
        協調     裏切り    (左:Aの利得、右、Bの利得)
  協調  (20、20) (0、30)
A 裏切り (30、0)  (10、10)

1回目は必ず協調、それ以降、(t-1)回目に相手が裏切れば、t回目以降は両方とも裏切るという無限回繰り返しゲームにおいて、(どちらも協調)が成立する割引因子aを求めよ。
 という問題なのですが、答えは、0.5になるのだそうですが、導出過程がわかりません。どなたか教えていただけませんでしょうか。よろしくお願いします。

A 回答 (1件)

クールノー・ナッシュ均衡は(協調,協調)であることは理解しているでしょうか?


ここで求める割引因子とは協調しているほうが両者にとってより大きな利得が得ら
れる割引率のことです。

Aの行動を考えて見ます。
1回目は『協調』,2回目に『裏切り』とすると,2回目のBの行動はまだ『協調』
です。3回目からBも『裏切り』を選んでくるので,このときの利得は,

20a+30*(a^2)+10*(a^3)+10*(a^4)+.....=P

となります。
次に,AもBもずっと『協調』していたときの利得は,

20a+20*(a^2)+20*(a^3)+20*(a^4)+.....=Q

Q>Pであればよいのですから,これを等比数列の和の公式で計算すると,

a>1/2

となります。このとき両者は無差別になります。
    • good
    • 3

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q無限繰り返しゲームについて教えてください

 両者がとりうる戦略はこの2つ。
  企業b
  高価格     低価格
企 (15.15) (0.0)
業 
A (30.0)  (5.5)

 このゲームが無限に繰り返される状況を考える。割引因子δ(0<δ<1)とし、各企業はトリガー戦略をとることと仮定する。トリガー戦略がこの繰り返しゲームのナッシュ均衡となるための、割引因子δの範囲を求めよ。という問題なのですが、教科書やパソコンで調べても全く分かりません。よかったらどなたか教えてください。おねがいします。

Aベストアンサー

問題の雰囲気からしてAが高価格、Bが低価格の場合、
利得は(0、30)だと思います。
(でないと、多分Bは低価格に変更する動機を持たないと思います)
ので、勝手ながら一部書き直して計算しています。ご了承ください。

問題文で、両者がトリガー戦略をとることを仮定しているので、
相手がトリガー戦略をとるものとしてAの立場で考えてみます。
まず、Aもトリガー戦略をとった場合、
n回目までのAの利得の期待値Sは、
S=15+15δ+15δ^2+・・・+15δ^n-1
(δ^nはδのn乗の意味です)
Sを求めるにはδ×SをSから引くと簡単な式に直せます。
その時δ^n=0(δ<1)に注意しましょう。
次にAがいきなり1回目のゲームで低価格に変更した場合の
Aの利得の期待値Tは、
T=30+5δ+5δ^2+・・・+5δ^n-1
Sのときと同様、TからδTを引いてTを求めます。
トリガー戦略をとった方が、利得が大きくなっていれば
トリガー戦略が最適反応といえるので
S>Tとなるようなδが問題の答えです。

Qゲーム理論? 全く分からず困っています

いつもお世話になっております.

この度は次の問題について質問させていただきます.


企業1と企業2は協調することで共同利潤を極大化し,それを半々にシェアしている.2つの企業は互いに裏切らないように引き金戦略を予告し,牽制し合っている.お互い共同利潤を極大化している場合に各々の利潤はπ/2であるとする.この時以下の問いに答えなさい.
(1)割引因子をδ(0<δ<1)として,両者が無期限に協調した場合の各々の利潤を求めなさい.
(2)企業2はt-1期までは企業1と協調するけれども,t期に裏切ることにより,利潤πを全て獲得しようと考えている.ただし,企業2はいったん自分が裏切ると,その語は企業1が報復として引き金戦略をとることにより,競争の結果利潤がゼロとなることを知っている.このとき,企業2が無期限に協調するか,あるいはt-1期まで協調した後にt期に裏切るか,両者が無差別となる割引因子を求めなさい.

このような問題です.いろいろな図書を調べながら,ずっと考えているのですが(1)(2)ともに全く糸口が見つかりません.そもそもδをどう取り扱っていいのかすらわかりません.お分かりの方がいらっしゃいましたら,ヒントをいただけないでしょうか.何卒よろしくお願いいたします.

いつもお世話になっております.

この度は次の問題について質問させていただきます.


企業1と企業2は協調することで共同利潤を極大化し,それを半々にシェアしている.2つの企業は互いに裏切らないように引き金戦略を予告し,牽制し合っている.お互い共同利潤を極大化している場合に各々の利潤はπ/2であるとする.この時以下の問いに答えなさい.
(1)割引因子をδ(0<δ<1)として,両者が無期限に協調した場合の各々の利潤を求めなさい.
(2)企業2はt-1期までは企業1と協調するけれども,t期に裏切る...続きを読む

Aベストアンサー

無限回の繰り返しゲームで、各期のゲームは、お互い協力すれば利得はπ/2、出し抜けばπ、出し抜かれたり、協力しない場合(競争した場合)利得ゼロという構造ですよね。

(1)について、永久に協力し続ければ、毎回π/2ずつの利得が得られます。
 ここで、1期後の利得π/2の現在の価値は割引因子を乗じて、δ×π/2となり、、2期後はδの二乗×π/2、、、ということで、t期後の利得はδのt乗×π/2になります。
 これの総和が求めるべき値で、無限等比級数の和の公式で求められます。

 (2)は、(1)で求めた値と、出し抜いた際の利得の総和(当期π、次期以降はゼロで計算)が等しくなるようなσを算出すればよいはずです

Q混合戦略ナッシュ均衡について

   D    E
A(2,2)  (4,8)
B(5,6)  (3,3)

という利得表の同時手番ゲームを考える問題についてなのですが、この場合の純粋戦略って(4,8)(5,6)ですよね。
そして混合戦略ナッシュ均衡を含めて考えた時、プレイヤー1と2の最適反応(赤=1、青=2)を図示したのですが以下のようになりました。(プレイヤー1がAを取る確率p、2がDを取る確率q)
下の図で丸を付けた箇所が均衡なのは知っているんですが、この場合答えの表記の仕方はどうなるんでしょうか・・?また、純粋戦略で求めた以外での混合戦略ナッシュ均衡において実現する量プレイヤーの期待利得を求めよ。との問いもあるのですが、だんだんわからなくなってきました・・。お時間のある方どうぞよろしくお願いいたします。

Aベストアンサー

均衡は利得の組ではなく、戦略の組で表わすから、このゲームの純粋戦略ナッシュ均衡は(A、E)と(B、D)の2つだ。つまり、(A、E)は、プレイヤー1(縦プレイヤー)が戦略Aを、プレイヤー2(横プレイヤー)が戦略Eをとる、という意味である。(4,8)では何のことだかわからない。

混合戦略がからんでいるときは、プレイヤー1の戦略はAをとる確率pで、プレイヤー2の戦略はDをとる確率qで表されるので、戦略の組も(p,q)で表わされる。したがって、ナッシュ均衡は(1/3,1/4),(0,1),(1,0)の3つである。プレイヤー1の期待利得関数をF(p,q)で、プレイヤー2の利得関数をG(p,q)で表わすと、

F(p,q) = 2pq +4p(1-q) +5(1-p)q + 3(1-p)(1-q)
G(p,q) = 2pq +8p(1-q) + 6(1-p)q +3(1-p)(1-q)

となるから(なぜ?)、各プレイヤーのナッシュ均衡における期待利得はこの期待利得関数から求められる。たとえば、混合戦略ナッシュ均衡(p,q) = (1/3,1/4)におけるプレイヤー1と2のの期待利得はそれぞれ

F(1/3,1/4) = 2(1/3)(1/4) + 4(1/3)(3/4) +5(2/3)(1/4) + 3(2/3)(3/4) =・・・
G(1/3,1/4) = 2(1/3)(1/4) + 8(1/3)(3/4) +6(2/3)(1/4) + 3(2/3)(3/4) =・・・

となる(・・・の部分の計算を自分で完成させてください!)
なお、グラフはpを横軸に、qを縦軸にとって描いたほうが(すくなくとも私には)わかりやすい(あなたの図は逆になっている)。

均衡は利得の組ではなく、戦略の組で表わすから、このゲームの純粋戦略ナッシュ均衡は(A、E)と(B、D)の2つだ。つまり、(A、E)は、プレイヤー1(縦プレイヤー)が戦略Aを、プレイヤー2(横プレイヤー)が戦略Eをとる、という意味である。(4,8)では何のことだかわからない。

混合戦略がからんでいるときは、プレイヤー1の戦略はAをとる確率pで、プレイヤー2の戦略はDをとる確率qで表されるので、戦略の組も(p,q)で表わされる。したがって、ナッシュ均衡は(1/3,1/4),(0,1),(1,0)の3つである。プレイヤ...続きを読む

Qナッシュ均衡をわかりやすく説明してください。

最近、ジョン・ナッシュの伝記を読んでいるのですが、
「ナッシュ均衡」がいまいち良くわかりません。
詳しい方、本質をわかりやすく、教えていただけると
幸いです。よろしくお願いします。

Aベストアンサー

パソコンを買うことを例にあげましょう。(なんでもいいのですが)

 皆が、パソコンを買おうとお店に行きます。この場合パソコンの価格は、市場に出ているパソコンの供給量と、パソコンを欲しがる人の需要のバランスで決まります。つまりパソコンが余ると値段が下げないと売れないでしょうし、逆に足りないと少々高くても売れるでしょう。でも、どこかで価格はそれなりに落ち着くことになるだろう。こういう考え方を市場均衡といいます。

 さて、ここである店が激安パソコンを売り始めました。すると皆は、その激安パソコンを買おうとするので、他の店は大弱りです。それで結局、他の店も全部激安パソコンを売り始めました。一度そうなると、今度はそう簡単にはどの店も価格を元の値段には戻せなくなってしまいます。このように、相手の戦略(激安パソコンを売る)に対してお互いが最善を尽くしている(皆、激安パソコンを売っている)状況でつりあっている(身動き取れない)ことをナッシュ均衡と言います。
 ナッシュはこういう状況が起こり得ることを数学的に証明しました。きちんとした証明はゲーム理論や経済学の本等を調べてください。

パソコンを買うことを例にあげましょう。(なんでもいいのですが)

 皆が、パソコンを買おうとお店に行きます。この場合パソコンの価格は、市場に出ているパソコンの供給量と、パソコンを欲しがる人の需要のバランスで決まります。つまりパソコンが余ると値段が下げないと売れないでしょうし、逆に足りないと少々高くても売れるでしょう。でも、どこかで価格はそれなりに落ち着くことになるだろう。こういう考え方を市場均衡といいます。

 さて、ここである店が激安パソコンを売り始めました。すると皆は...続きを読む

Qベルトラン均衡の求め方がわかりません。

こんにちは! 趣味で経済学を学んでいる者です。テキストを見ながら学習を進めていたのですが、巻末の演習問題で詰まってしまいました。解説が掲載されていないので、皆様の知恵をお借しください!

需要関数 q=34-p/3 企業数は2社、費用関数ci(qi)=6qiで共通とします。 q:市場全体の生産量、p:価格、i:添え字です。

(1)この条件下でのベルトラン均衡の求め方

(2)共同利潤最大化後の各企業の利潤(利潤は2社で折半)

(3)このベルトランの場合、独占価格を維持する結託(カルテル)を可能とする割引因子:∂の最小値

別の質問サイトに投稿したのですが、回答がないためこちらで質問させていただきました。

よろしくお願いします。

Aベストアンサー

(1)はこのベルトラン競争のナッシュ均衡を求める問題。どんなテキストを使っているのか知りませんが、通常テキストでベルトラン競争の例としてあげられている通りの問題で、ナッシュ均衡が何であり、ベルトラン競争がどういうものかわかっていたら、直ちに答えられる問題のはずです。答えは(p1,p2)=(6,6) となります。参考のため、私がOKwaveで最近回答したのがありますから(↓)、それを参考に考えて見てください。
     http://oshiete.goo.ne.jp/qa/7840666.html
(2)は、企業1が独占企業だったら、価格をいくらに設定するか考えればよい。独占企業の価格設定はどのようになされるのか、テキストの独占のところをもう一度復習してみてください。ヒントは、限界収入=限界費用を満たす価格・数量において独占企業の利潤は最大化される、ということです。
(3)は、(1)が静学ゲーム(一回限りの同時手番ゲーム)であったのに対し、動学ゲーム(この場合は無限繰り返しゲーム)であって、(1)のゲームが無限に繰り返されるときどうなるか、という問題です。キーポイントは「トリガー戦略」で、両企業がこの戦略をとると、そのとき成立するサブゲーム完全均衡(の1つ)において、(2)で求めた独占価格が支配することになる、という結果が得られます。つまり、両企業が価格カルテルを結ばなくても、いわば暗黙の了解としてカルテルと同じ結果を得ることになる、ということです。「戦略」、「繰り返しゲーム」、「サブゲーム」、「サブゲーム完全均衡」、「トリガー戦略」が何かということをきちんと理解することが求められます。テキストの該当部分を何度も読んでこれらの概念を理解してから、問題にトライしてください。簡単な(1)、(2)の問題が解けないようでは、(3)の問題を解こうとするのは無理でしょう!

(1)はこのベルトラン競争のナッシュ均衡を求める問題。どんなテキストを使っているのか知りませんが、通常テキストでベルトラン競争の例としてあげられている通りの問題で、ナッシュ均衡が何であり、ベルトラン競争がどういうものかわかっていたら、直ちに答えられる問題のはずです。答えは(p1,p2)=(6,6) となります。参考のため、私がOKwaveで最近回答したのがありますから(↓)、それを参考に考えて見てください。
     http://oshiete.goo.ne.jp/qa/7840666.html
(2)は、企業1が独占企業だったら、価格を...続きを読む

Q有限回繰り返しゲームについて

初歩的な質問ですみません。

有限回繰り返しゲームにおいてはトリガー戦略をとることはないのですか?
そもそもどうしてトリガー戦略というものがあるのでしょう?

また、3回の繰り返しゲームが行われる場合、3回目のゲームにおいて2回目のゲームの結果を、2回目のゲームにおいて1回目のゲームの結果を、なぜ考慮しなくてもよいのですか?

回答よろしくお願いします。

Aベストアンサー

OkWaveの過去問と回答「合わせてチェックしたい」↓には「トリガー戦略」があります。この利得表を使って説明しましょう。
            B
        協調   裏切り

  協調   20,20  0,30

A
  裏切り  30,0  10,10

この「囚人のジレンマ」ゲームが3回繰り返されるゲームを考える。いまこのゲームをプレーして3回目の初めに達したプレイヤーはこの3回目の段階ゲームをどのようにプレーするだろうか?両プレイヤーが過去にとった行動(アクション)どのようなものであれ―仮にトリガー戦略にしたがって初回(協調、協調)、2回目(協調、協調)と進んできたとしても―3回目には互いに「裏切り」をプレイするのが最適だ。トリガー戦略にしたがって、相手が協調をとったとき、自分が裏切りをとれば、自分の(3回目の段階ゲームの)利得は20ではなく、30を得ることになって大きく得をする。相手はトリガー戦略にしたがって、第4回目以降には裏切りをとりたいと考えるかもしれないが、4回目以降の段階ゲームは仮定により存在しない。同じことは相手も同じように考えるので、結局第3回目には相手も「裏切り」を選択する。よって第3回目の段階ゲームには一回限りのゲームのナッシュ均衡と同じ(裏切り、裏切り)が成立する。では第3回目に(裏切り、裏切り)が成立するなら、第2回目には両プレイヤーはどんな行動をとるのが最適なのだろうか?同じような推論によって(裏切り、裏切り)が両プレイヤーにとって最適であることがわかる。こうして、第2回目も(裏切り、裏切り)が成り立つことがわかるので、これを前提に成立する第1回目も(裏切り、裏切り)が支配することになる。このように3回繰り返しゲーム(あるいはすべての有限繰り返しゲーム)にはトリガー戦略が最適の戦略として成り立つ余地はなく、一回限りのゲームのナッシュ均衡が繰り返される戦略がただ一つの均衡戦略になる。

OkWaveの過去問と回答「合わせてチェックしたい」↓には「トリガー戦略」があります。この利得表を使って説明しましょう。
            B
        協調   裏切り

  協調   20,20  0,30

A
  裏切り  30,0  10,10

この「囚人のジレンマ」ゲームが3回繰り返されるゲームを考える。いまこのゲームをプレーして3回目の初めに達したプレイヤーはこの3回目の段階ゲームをどのようにプレーするだろうか?両プレイヤーが過去にとった行動(アクション)どのようなものであれ―仮にトリ...続きを読む

Q混合戦略の求め方を教えて下さい!(非ゼロ和ゲーム)

A,Bの2人がいる非ゼロ和ゲームにおいて
(A,B)
(ドラマ、ドラマ)=(7,3)
(ドラマ、バラエティ)=(4,6)
(バラエティ、ドラマ)=(5,5)
(バラエティ、バラエティ)=(6,4)
という利得行列があります。
これについて、混合戦略を求めたいのですが、
Aがドラマを選択する確率をp、バラエティを1-p
Bがドラマを選択する確率をq、バラエティを1-q
とすると、

E(A)=7pq+5(1-p)q+4p(1-q)+6(1-p)(1-q)
=7pq+5q-5pq+4p-4pq+6-6q-6p+6pq
=4pq-q-2p+6
=(4p-1)q-2(p-3)

∴0≦p≦1/4

とここまでは分かったのですが、答えをどう出せばいいのかわかりません。
qの範囲も出した方がいいのでしょうか?
そして、このpの範囲は、何の意味があるのでしょうか?

どなたか、教えて下さい!!

Aベストアンサー

大きな間違いをしてしまいました。すみません。

playerAが動かせる変数はpなので、E(A)をpでまとめます。すなわち、
E(A)=(4q-2)p-q+6
で、あとはこれを最大にすることを考えるので
4q-2>0でp=1
4q-2<0でp=0
4q-2=0でp=なんでもいい。∴q=1/2

ということで、
>pもqも1/2になりましたが・・・
あってそうですね。

Q支配戦略均衡の求め方

この画像の支配戦略均衡はあるのでしょうか?

Aベストアンサー

ありますよ。支配戦略がどういうものか知っているなら、利得表を見れば一目瞭然ではないか!このゲームでは各プレイヤーが選択できる戦略はXとYの2つだが、ある戦略が支配戦略であるとは、相手がどんな戦略を選んでも、その戦略を選択したほうが、他の戦略を選択するより高い利得を得られるなら、それが支配戦略だ。相手がXを選んだら、あなたの最適な戦略は?相手がYを選んだら、あなたの最適な戦略は?その最適な戦略が相手の選ぶ戦略によって変わらなければ、それが支配戦略だ。各プレイヤーに支配戦略があるなら、それを用いるのが、合理的で、支配戦略の組が支配戦略均衡と呼ばれ、それは同時にナッシュ均衡でもある。これだけ説明すれば、このゲームには支配戦略があり、支配戦略がどの戦略の組であるかは直ちにわかるでしょう!

Qゲーム理論の問題なのですが・・・

A市は毎年一度、工事を業者 i=1,2,…,n に競争入札で発注する。各業者 i は同時に入札額 bi∈[0,∞)を提出し、最も低い額を入札した業者がその金額で工事を請け負う(同点の場合には等確率でで勝者を決める)。工事を行う費用はどの業者も同じで、3000万円であり、このことは共有知識である。入札額 bi で発注したときの業者 i の利得は bi-3000 である(敗者の利得は0)。

問い 各年の入札を一回限りの同時手番ゲームと見たときの、ナッシュ均衡における各業者の期待    利得を求めよ。

自分はn人だと複雑なので、2人ゲームで具体的に考えてみました。利得は入札が相手プレイヤーに比べて

(1)低いとき→bi-3000
(2)同じとき→1/2(bi-3000)
(3)高いとき→0

と設定できると思うのですが、敗者の利得は0なので入札額の下限は3000万となりますから、結局両プレイヤーが入札する額は3000万となり、これが最適反応であると考えました。そうなると、期待利得は0になるので、これが解かと思ったのですが、いまいちスッキリしません(答えが無いので、あっているかいないのか分からないのです)。

分かる方はヒントでも良いので、是非教えていただけないでしょうか?よろしくお願いいたします。

A市は毎年一度、工事を業者 i=1,2,…,n に競争入札で発注する。各業者 i は同時に入札額 bi∈[0,∞)を提出し、最も低い額を入札した業者がその金額で工事を請け負う(同点の場合には等確率でで勝者を決める)。工事を行う費用はどの業者も同じで、3000万円であり、このことは共有知識である。入札額 bi で発注したときの業者 i の利得は bi-3000 である(敗者の利得は0)。

問い 各年の入札を一回限りの同時手番ゲームと見たときの、ナッシュ均衡における各業者の期待    利得を求めよ。

自分はn人だと複雑なので...続きを読む

Aベストアンサー

ついでに別解を書いておきましょう。戦略の組は、その組から各プレイヤーが自分だけ戦略を変更しても自分の利得が増えないときナッシュ均衡といいますから、各業者が3000(万円)で入札するのがナッシュ均衡である、すなわち、
  (b1,b2,....,bn)=(3000,3000,....,3000)
がナッシュ均衡であることを示すことにしましょう。このとき、各業者の期待利得は(3000-3000)/n=0であることはむろんです。いま、任意の業者iをとり、彼の戦略(入札値)を3000から上の値に変更してみると、もちろん彼の利得はゼロになって増えない。彼の戦略を3000未満の値に変更してみると、彼が落札することになりますが、彼の利得はマイナスになって利得は減ってしまう。この事実はすべての業者にあてはまるので、上の戦略の組はナッシュ均衡だということになります。またそのときの各業者の期待利得は上記のように0です。

ANO1で、ナッシュ均衡における期待利得がいくらになるか書くのを忘れましたが、むろんゼロです。それをここで付け加えておきます。

Q混合戦略の期待利得の求め方

混合戦略に関する問題で期待利得の求め方なのですが
たとえば戦略が2つの時は、利得は適当に4と6とでも置きまして
戦略1を選ぶ確立をp、戦略2を選ぶ確立を(1-p)で
4*p+6*(1-p)と成りますよね?
戦略2つまでなら理解できるのですが戦略3つ以上となるとどの様な式になるのでしょうか?

数学に疎くて全く分かりません、先に進めず困っています
分かる方教えてください

Aベストアンサー

単に「利得の期待値」を求めるだけです.
つまり個々の戦略に対して「その戦略を選ぶ確率」と「その戦略を選んだときの利得」の積を計算し, それをすべての戦略に対して加えるだけ.


このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング