我正在为概率理论准备编程考试,我偶然发现了我无法解决的问题。

给定袋子,它包含一些给定金属的白色石头 $ w $ ,以及一些给定的黑色石头 $ B $ ,两名球员从袋子随机均匀地转动绘图石头。 在每个玩家转弯一块石头后,随机均匀地选择,才会消失,只有那么另一名球员才会轮到他们。如果被绘制了一块白色的石头,那么绘制它的球员,瞬间丢失和游戏结束。如果袋子变空,那些播放的玩家胜利。

玩家的总体概率是什么,谁播放了第二个,胜利?

我假设它是一个动态的编程问题,但我无法弄清楚递归公式。任何帮助将不胜感激。 :)

示例输入 $ w $ = 3, $ b $ = 4,那么答案是,我相信,0.4,我通过手工计算后到达的是游戏的所有可能的方式,所以不太高效。

有帮助吗?

解决方案

让我们表示 $ \ pr(w,b)$ P2获胜的概率给出轮到他们的转弯,并且有 $ w $ 白色石头和 $ b $ 黑色石头剩余且类似于我们编写 $ \ overline \ Pr(w,b)$ 对于P2获胜的可能性,鉴于P1转弯。

从游戏的规则我们得到以下任何一种情况,在P2的转弯中会发生(假设留下足够的石头):

  1. 白色是绘制的,P2丢失。这与概率 $ w /(w + b)$
  2. 黑色被绘制,白色石头消失了。这是 $ b /(w + b)\ cdot w /(w + b-1)$
  3. 黑色被绘制,黑色石头消失了。我们发现这是 $ b /(w + b)\ cdot(b-1)/(w + b-1)$

    如果它是p1转向播放,我们发现类似的情况:

    1. 白色是绘制的,P2胜。这与概率 $ w /(w + b)$
    2. 黑色被绘制,白色石头消失了。这是 $ b /(w + b)\ cdot w /(w + b-1)$
    3. 黑色被绘制,黑色石头消失了。我们发现这是 $ b /(w + b)\ cdot(b-1)/(w + b-1)$ 我们现在可以因子 $ \ pr $ $ \ overline \ pr $ 使用我们的案例差异和一些简单的概率理论: $$ \ begin {align *} \ Pr(w,b)&=pr(\ text {case 1.2})\ cdot \ overline \ pr(w - 1,b-1)+ \ pr(\ text {case 1.3})\ cdot \ overline \ Pr(w,b - 2),\\ \ overline \ pr(w,b)&=pr(\ text {case 2.1})+ \ pr(\ text {case 2.2})\ cdot \ pr(w - 1,b - 1)+ \ pr(\文本{案例2.3})\ cdot \ pr(w,b - 2) \结束{align *} $$ 请注意,我们可以组合这两个方程来查找 $ \ pr $ (我不会在此输入简洁)的递归公式。 耦合这些与初始值 $ \ pr(w,b)$ 其中 $ w + b \ leq 4 $ (可以预先计算)将给我们一种算法的方法来找到所需的概率。

许可以下: CC-BY-SA归因
不隶属于 cs.stackexchange
scroll top