خوارزمية negamax للعبة 3 في صف واحد على شبكة 3x4 (صفوف x أعمدة)

StackOverflow https://stackoverflow.com/questions/6333798

  •  27-10-2019
  •  | 
  •  

سؤال

أواجه صعوبة في استخدام خوارزمية negamax للعبة 3 في صف واحد على شبكة 3x4 (صفوف x أعمدة). يتم لعبها مثل 4-in-a-row المعروفة جيدًا ، أي يتم إسقاط القطع (ليس مثل TicTacToe). لنسمي اللاعبين R و B. R قاموا بالخطوة الأولى ، حركات B يتم التحكم فيها بواسطة negamax. الحركات المحتملة هي 1 أو 2 أو 3 أو 4. هذا هو الموضع المعني الذي تم الوصول إليه بعد R: التحرك 3 -> B: التحرك 1 -> R: التحرك 3:

Genacodicetagpre

الآن ، من أجل الدفاع ضد الحركة 3 بواسطة R ، يجب على B أن تلعب الحركة 3 نفسها ، لكنها ترفض القيام بذلك. بدلاً من ذلك ، تلعب الحركة 1 وتنتهي اللعبة بعد الخطوة التالية لـ R.

أمضيت اليوم بأكمله أبحث عن خطأ في تطبيق negamax الخاص بي والذي يعمل بشكل مثالي لشبكة 3x3 ، بالمناسبة ، لكنني لم أجد أي خطأ.

ثم بدأت في التفكير: تفسير آخر لسلوك خوارزمية Negamax هو أن B ضاع في جميع الاختلافات بغض النظر عن أي شيء ، بعد أن يبدأ R اللعبة بالحركة 3 على شبكة 3x4.

هل يمكن لأي شخص أن يدحض هذا الاقتراح أو يوجهني إلى إثبات (والذي أفضله ؛-))؟

شكرًا لك RSel

هل كانت مفيدة؟

المحلول

إثبات أن B3 يخسر أيضًا:

B3: R (1،2،4) -> R1 ؛B (1،2،4) -> B2 (يخسر) ، لذلك B1 ؛R (2،4) -> R2 يخسر ، لذلك R4 ؛B (2،4) -> B2 يخسر ، لذلك B4 ؛R يخسر في أي من الخيارين الآن ... لذلك سيخسر R1 مقابل R - لذلك لن يختاره R.

B3: R (1،2،4) -> R2 يخسر منذ B2 ، لذلك لن يختاره R B3: R (1،2،4) -> R4 ؛B2 (إجباري) ؛R2 (قسري) ؛يخسر B في الخطوة التالية لـ R

... لذلك ، يخسر B3 لصالح B بالإضافة إلى B1 ... لذلك فقد B في هذا الموقف.

تحرير : في حالة ما إذا كان أي شخص يتساءل عن خيارات B الأخرى (2،4) في نهاية "B3: R (1،2،4) -> R1 ؛ B (1، 2،4) -> B2 (يخسر) ، لذلك B1 "... فهي ليست ذات صلة ، لأنه بمجرد أن يختار Red R1 ، يوضح هذا السيناريو أن B (الكمبيوتر) يمكنه اختيار B1 والفوز.لا يهم حقًا ما يحدث لخيارات B الأخرى - هذا الاختيار سيفوز ، لذلك لا يمكن لـ Red اختيار R1 وإلا فسيخسر.

نصائح أخرى

إنها في الحقيقة لعبة منتصرة منذ البداية.ويمكن لعبها بسهولة إلى حد ما باليد.سأفترض أن B يتجنب كل الانتصارات ذات الحركة الواحدة لـ R ، وسيحدد الحركات حسب اللون ، والمكان في الشبكة حيث يحدث اللعب. Genacodicetagpre

بالنسبة إلى الخوارزمية الخاصة بك ، سأقترح عليك تعديلها لتفضيل المكاسب على الخسائر ، وتفضل الخسائر البعيدة على الخسائر القريبة.إذا قمت بذلك ، فسوف "تبذل جهدًا أكبر" لتجنب الخسارة الحتمية.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top