質問

私は確率論についてのプログラミング試験の準備をしています、そして私は解決できない質問を通してつまずいた。

バッグを与えられ、いくつかの所与の量のホワイトストーンが含まれています $ w $ といくつかの特定の量のブラックストーン $ B $ では、2人のプレーヤーがバッグからランダムに描画石を均一に描画します。 各プレイヤーのターンの後、ランダムに均一に選択された後、もう一方のプレイヤーは彼らのターンを取ることだけです。白い石が描かれている場合、それを描いたプレーヤー、即座に失われてゲームは終了します。バッグが空になったら、2番目に演奏したプレーヤーが勝ちます。

2番目のプレイヤーが勝ったプレイヤーが勝ちますか?

私はそれが動的なプログラミングの質問であると思いますが、再帰式を把握することはできません。あらゆる助けが大いに感謝されるでしょう。 :)

例入力 $ w $ = 3、 $ b $ = 4、その答えは、私が到着した0.4、0.4が到着した後、ゲームの可能な方法で到着したので、あまり効率的ではありません。

役に立ちましたか?

解決

$ \ pr(w、b)$ で表現しましょう。wenningのwitningの確率と $ w $ ホワイトストーンと $ b $ 残りのブラックストーンと同様に $ \ overline \を書きますP2のターンの確率はP1のターンです。

ゲームの規則から、以下のいずれかのケースがP2のターンで発生する可能性があることがわかります(十分な石が残っていると仮定して):

  1. 白が描かれ、P2が失われます。これは確率 $ w /(w + b)$ です。
  2. 黒は描かれ、白い石は消えます。この確率は $ b /(w + b)\ cdot w /(w + b - 1)$
  3. 黒は描かれ、黒い石は消えます。これが $ b /(w + b)\ cdot(b - 1)/(w + b - 1)$ です。

    P1のターンである場合も同様の場合があります。

    1. 白が描かれ、p2が勝ちます。これは確率 $ w /(w + b)$ です。
    2. 黒は描かれ、白い石は消えます。この確率は $ b /(w + b)\ cdot w /(w + b - 1)$
    3. 黒は描かれ、黒い石は消えます。これが $ b /(w + b)\ cdot(b - 1)/(w + b - 1)$ です。

      現在 $ \ pr $ $ \ overline "> $ \ overline \ pr $ を使用することができます。そしていくつかの簡単な確率論: $$ \ begin {align *} \ PR(w、b)&\ pr(\ text {case 1.2})\ cdot \ overline \ pr(w - 1、b - 1)+ \ pr(\ text {case 1.3})\ cdot \ overline \ PR(W、B - 2)、\\ \ overline \ pr(w、b)&=pr(\ text {case 2.1})+ \ pr(\ text {case 2.2})\ cdot \ pr(w - 1、b - 1)+ \ pr(\テキスト{ケース2.3})\ CDOT \ PR(W、B - 2) \ end {align *} $$ $ \ pr $ の再帰式式を見つけることができることに注意してください(ここでは簡潔にするためにここでは入力しません)。 これらを初期値と結合する $ \ pr(w、b)$ ここで、 $ w + b \ leq 4 $ (事前計算できる可能性がある)は、望ましい確率を見つけるためのアルゴリズム的方法を与えます。

ライセンス: CC-BY-SA帰属
所属していません cs.stackexchange
scroll top