سؤال

أستعد لامتحان برمجة حول نظرية الاحتمالات وتعثرت عبر سؤال لا يمكنني حله.

إعطاء كيس، يحتوي على بعض كمية معينة من الأحجار البيضاء $ W $ وبعض كمية الأحجار السوداء $ B $ ، يتطلب اثنين من اللاعبين سحب الحجارة بشكل موحد عشوائيا من الحقيبة. بعد أن أدر كل لاعب حجر، تختاره بشكل موحد بشكل عشوائي، يختفي، ثم يقوم اللاعب الآخر بتحويل دورها. إذا تم رسم حجر أبيض، فإن اللاعب الذي قام به، يفقده على الفور انتهت اللعبة. إذا أصبحت الحقيبة فارغة، فإن اللاعب الذي لعب المركز الثاني والفوز.

ما هو الاحتمال الشامل الذي يفوز فيه اللاعب، الذي لعب المرتبة الثانية،

أفترض أنه سؤال برمجة ديناميكي، على الرغم من أنني لا أستطيع معرفة صيغة العودية. سيكون موضع تقدير كبير أي مساعدة. :)

مثال إدخال : $ W $ = 3، $ b $ = 4، ثم الجواب هو، أعتقد، 0.4، الذي وصلت إليه بعد الحوسبة باليد جميع الطرق الممكنة للعبة للذهاب، لذلك ليس فعالا للغاية.

هل كانت مفيدة؟

المحلول

دعنا نشير بواسطة $ \ PR (W، B) $ احتمال الفوز P2 نظرا بدوره وهناك $ w دولار الأحجار البيضاء و $ B $ الحجارة السوداء المتبقية وبالمثل نحن نكتب $ \ overline \ العلاقات العامة (W، B) $ للحصول على احتمال الفوز P2 بالنظر إليه هو منعطف P1.

من قواعد اللعبة، نحصل على أي من الحالات التالية يمكن أن تحدث في بدوره P2 (على افتراض أن ما يكفي من الحجارة يتم تركها):

  1. بيضاء يتم رسمها وخفص P2. يحدث هذا مع احتمال $ w / (w + b) $ .
  2. أسود يتم رسمها وحجر أبيض تختفي. احتمالية هذا هو $ B / (W + B) \ CDOT W / (W + B - 1) $ .
  3. أسود يتم رسمها وحجر أسود تختفي. نجد احتمال أن يكون $ B / (W + B) \ CDOT (B - 1) / (W + B - 1) $ .

    إذا كان دور P1 للعب، نجد حالات مماثلة:

    1. white تم رسمها ويفوز P2. يحدث هذا مع احتمال $ w / (w + b) $ .
    2. أسود يتم رسمها وحجر أبيض تختفي. احتمالية هذا هو $ B / (W + B) \ CDOT W / (W + B - 1) $ .
    3. أسود يتم رسمها وحجر أسود تختفي. نجد احتمال أن يكون $ B / (W + B) \ CDOT (B - 1) / (W + B - 1) $ .

      يمكننا الآن العامل $ \ PR $ و $ \ overline \ PR $ استخدام تمييز قضيتنا وبعض نظرية الاحتمالات البسيطة: $$ \ ابدأ {align *} \ PR (W، B) &=pr (\ text {case 1.2}) \ cdot \ overline \ pr (w - 1، b - 1) + \ pr (\ text {case 1.3}) \ cdot \ overline \ PR (W، B - 2)، \\ \ Overline \ PR (W، B) &=pr (\ text {case 2.1}) + \ pr (\ text {case 2.2}) \ cdot \ pr (w - 1، b - 1) + \ pr (\ نص {case 2.3}) \ CDOT \ PR (W، B - 2) \ نهاية {محاذاة *} $ لاحظ أنه يمكننا الجمع بين هذه المعادلات 2 للعثور على صيغة متكررة ل $ \ PR $ (والتي لن اكتبها هنا للإيجاز). اقتران هذه القيم الأولية $ \ PR (W، B) $ حيث $ w + b \ leq 4 $ (الذي يمكن أن يكون مسبقا) سيعطينا طريقة خوارزمية للعثور على الاحتمال المرغوب فيه.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى cs.stackexchange
scroll top