質問

アリスとボブはゲームをしています。 BOBには $ M= 4999 $ ホワイトカード、 $ n= 4999 $ greenカードデッキのカードの各順列は等しくおそれがあります。アリスはボブのためのいくつかの規則を設定しました。

  • ボブが白いカードを弾くたびに彼は1つのコインを手に入れ、そうでなければ彼は1つのコインを失います。いつでも(冒頭でも)、ボブはゲームの演奏をやめることができ、彼が持っているコインの数を守ることができます。
  • ゲーム中に、ボブが負のようなコインのバランスを演じる。

ボブが最適に遊ぶ場合、コインボブの予想額は何を持つのでしょうか。

どんな体も私にそれを解決する方法やヒントを与えることができます。

役に立ちましたか?

解決

$ w(a、b)$ $ a $ 正のカードで予想利益を得る $ b $ マイナスカード。その後、 $ w(0,0)= 0 $ $$ w(a、b)=max \ bigl(0、\ tfrac {a} {a + b}(w(a-1、b)+ 1)+ \ tfrac {b} {a + b}(w(w(w(a)。A、B-1) - 1)\ BIGR)。 $$ 確かに、私たちがすぐにゲームを停止すると、利益はゼロです。そうでなければ、確率 $ \ tfrac {a} {a + b} $ 、私たちはポジティブカードを引き出し、確率 $ \ tfrac {b} {a + b} $ 、私たちはネガティブカードを引き出します。

この再発を使用すると、 $ w(4999,4999)$ を計算するのは簡単です。私のラップトップにはそれは2番目以下にかかりました。

ライセンス: CC-BY-SA帰属
所属していません cs.stackexchange
scroll top