随机元素赢得了基于转向游戏的概率
-
29-09-2020 - |
题
我正在为概率理论准备编程考试,我偶然发现了我无法解决的问题。
给定袋子,它包含一些给定金属的白色石头 $ w $ ,以及一些给定的黑色石头 $ B $ ,两名球员从袋子随机均匀地转动绘图石头。 在每个玩家转弯一块石头后,随机均匀地选择,才会消失,只有那么另一名球员才会轮到他们。如果被绘制了一块白色的石头,那么绘制它的球员,瞬间丢失和游戏结束。如果袋子变空,那些播放的玩家胜利。玩家的总体概率是什么,谁播放了第二个,胜利?
我假设它是一个动态的编程问题,但我无法弄清楚递归公式。任何帮助将不胜感激。 :)
示例输入: $ w $ = 3, $ b $ = 4,那么答案是,我相信,0.4,我通过手工计算后到达的是游戏的所有可能的方式,所以不太高效。
解决方案
让我们表示 $ \ pr(w,b)$ P2获胜的概率给出轮到他们的转弯,并且有 $ w $ 白色石头和 $ b $ 黑色石头剩余且类似于我们编写 $ \ overline \ Pr(w,b)$ 对于P2获胜的可能性,鉴于P1转弯。
从游戏的规则我们得到以下任何一种情况,在P2的转弯中会发生(假设留下足够的石头):
- 白色是绘制的,P2丢失。这与概率 $ w /(w + b)$ 。
- 黑色被绘制,白色石头消失了。这是 $ b /(w + b)\ cdot w /(w + b-1)$ 。
- 黑色被绘制,黑色石头消失了。我们发现这是 $ b /(w + b)\ cdot(b-1)/(w + b-1)$ 。
如果它是p1转向播放,我们发现类似的情况:
- 白色是绘制的,P2胜。这与概率 $ w /(w + b)$ 。
- 黑色被绘制,白色石头消失了。这是 $ b /(w + b)\ cdot w /(w + b-1)$ 。
- 黑色被绘制,黑色石头消失了。我们发现这是 $ b /(w + b)\ cdot(b-1)/(w + b-1)$ 。 我们现在可以因子 $ \ pr $ 和 $ \ overline \ pr $ 使用我们的案例差异和一些简单的概率理论: $$ \ begin {align *} \ Pr(w,b)&=pr(\ text {case 1.2})\ cdot \ overline \ pr(w - 1,b-1)+ \ pr(\ text {case 1.3})\ cdot \ overline \ Pr(w,b - 2),\\ \ overline \ pr(w,b)&=pr(\ text {case 2.1})+ \ pr(\ text {case 2.2})\ cdot \ pr(w - 1,b - 1)+ \ pr(\文本{案例2.3})\ cdot \ pr(w,b - 2) \结束{align *} $$ 请注意,我们可以组合这两个方程来查找 $ \ pr $ (我不会在此输入简洁)的递归公式。 耦合这些与初始值 $ \ pr(w,b)$ 其中 $ w + b \ leq 4 $ (可以预先计算)将给我们一种算法的方法来找到所需的概率。
不隶属于 cs.stackexchange