dポイントプレゼントキャンペーン実施中!

とある対戦ゲームについて研究しています。

こちらの動きで相手の動きも変わったり、その時々の情勢で変化する性質があるため、

はっきりとした解を得ることは難しいと考えていますが、傾向を探り、それぞれの状況に応じてよりよい選択をするための基準のようなものを作れたらよいと思っています。


下記は式にしてみたものです。(変数はn1,n2,n3)(0≦n1≦1、0≦n2≦1、0≦n3≦1)

          得点          発生確率
①のパターン   「+3」  「(1-n1)*(1-n2)」
②のパターン   「-1」  「{n1+(1-n1)*n2}*(1-n3)」 
③のパターン   「-2」  「n1/{n1+(1-n1)*(n2)}*n3」
④のパターン   「+5」  「(1-n1)/{n1+(1-n1)*(n2)}*n3」

①~④のいずれかが起こるため「発生確率の総和=1」
それぞれの得点と発生確率を掛けたものを期待得点とします。

n1とn2はプレイヤー2の行動が起こる確率です。
n3はプレイヤー1の行動となります。

n1、n2が変化したときの、①+②+③+④の期待得点を最大化するn3の数値を求めたいと考えています。(プレイヤー1視点からの最適解)

例えば、以下のような分析結果が得られれば嬉しいと考えています。

(得たい分析結果の例)
・n1,n2の数値に関わらずn3≧0.8が必要
・n1はn3に大きく影響するが、n2の数値はそれほど影響しない
・n1、n2の値に比例して、n3に必要な値が大きくなる


なお、数値の統計やデータ等はなく、今後も採取できる見込みはありません。

ご賢察のとおり数学には疎いので、なるべく簡易な表記で教えていただけると助かります。

皆様のお知恵を貸してくださいませ。何卒宜しくお願いいたします。

A 回答 (3件)

間違えた (>_<)



後者は -(4n2+3)/7 かな。
    • good
    • 0

期待値は n3 の一次関数になるので、傾きが 0 のときは n3 によらず、そうでないときは n3=0 か 1 のときに最大になります。



傾きが 0 のときをざっと計算したところ、n1=n2=0 かまたは n1=6/7 のときで、前者の期待値は 3、後者は 2n2/7-3/7 かと思います。

n1+(1-n1)*(n2)=1-(1-n1)(1-n2)=p とでもおいて期待値を n3 の式にまとめれば、自力で解析できるのではないでしょうか。
というか、残念なお知らせのような気が少しします。
    • good
    • 0

③,④の確率は、


③ n1*{n1+(1-n1)*(n2)}*n3
④ (1-n1)*{n1+(1-n1)*(n2)}*n3
でしょうか。(元の式では確率の総和は1にならない)

あとは、エクセルのVBAとかのプログラミング言語を使って、n1,n2,n3を0.01刻みで変化させて計算させてみればいいでしょう。

ちなみに結果は、
n1≦0.85 なら、n3=1
n1>0.85 なら、n3=0
となって、n3はn2に影響しません。

なお、刻み値を0.01にしたので0.85という数値がでてきましたが、刻み値をもっと小さくすればより正確な値が出るかもしれません。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!