خوارزمية negamax للعبة 3 في صف واحد على شبكة 3x4 (صفوف x أعمدة)
سؤال
أواجه صعوبة في استخدام خوارزمية negamax للعبة 3 في صف واحد على شبكة 3x4 (صفوف x أعمدة). يتم لعبها مثل 4-in-a-row المعروفة جيدًا ، أي يتم إسقاط القطع (ليس مثل TicTacToe). لنسمي اللاعبين R و B. R قاموا بالخطوة الأولى ، حركات B يتم التحكم فيها بواسطة negamax. الحركات المحتملة هي 1 أو 2 أو 3 أو 4. هذا هو الموضع المعني الذي تم الوصول إليه بعد R: التحرك 3 -> B: التحرك 1 -> R: التحرك 3:
Genacodicetagpreالآن ، من أجل الدفاع ضد الحركة 3 بواسطة R ، يجب على B أن تلعب الحركة 3 نفسها ، لكنها ترفض القيام بذلك. بدلاً من ذلك ، تلعب الحركة 1 وتنتهي اللعبة بعد الخطوة التالية لـ R.
أمضيت اليوم بأكمله أبحث عن خطأ في تطبيق negamax الخاص بي والذي يعمل بشكل مثالي لشبكة 3x3 ، بالمناسبة ، لكنني لم أجد أي خطأ.
ثم بدأت في التفكير: تفسير آخر لسلوك خوارزمية Negamax هو أن B ضاع في جميع الاختلافات بغض النظر عن أي شيء ، بعد أن يبدأ R اللعبة بالحركة 3 على شبكة 3x4.
هل يمكن لأي شخص أن يدحض هذا الاقتراح أو يوجهني إلى إثبات (والذي أفضله ؛-))؟
شكرًا لك RSel
المحلول
إثبات أن B3 يخسر أيضًا:
B3: R (1،2،4) -> R1 ؛B (1،2،4) -> B2 (يخسر) ، لذلك B1 ؛R (2،4) -> R2 يخسر ، لذلك R4 ؛B (2،4) -> B2 يخسر ، لذلك B4 ؛R يخسر في أي من الخيارين الآن ... لذلك سيخسر R1 مقابل R - لذلك لن يختاره R.
B3: R (1،2،4) -> R2 يخسر منذ B2 ، لذلك لن يختاره R B3: R (1،2،4) -> R4 ؛B2 (إجباري) ؛R2 (قسري) ؛يخسر B في الخطوة التالية لـ R
... لذلك ، يخسر B3 لصالح B بالإضافة إلى B1 ... لذلك فقد B في هذا الموقف.
تحرير : في حالة ما إذا كان أي شخص يتساءل عن خيارات B الأخرى (2،4) في نهاية "B3: R (1،2،4) -> R1 ؛ B (1، 2،4) -> B2 (يخسر) ، لذلك B1 "... فهي ليست ذات صلة ، لأنه بمجرد أن يختار Red R1 ، يوضح هذا السيناريو أن B (الكمبيوتر) يمكنه اختيار B1 والفوز.لا يهم حقًا ما يحدث لخيارات B الأخرى - هذا الاختيار سيفوز ، لذلك لا يمكن لـ Red اختيار R1 وإلا فسيخسر.
نصائح أخرى
إنها في الحقيقة لعبة منتصرة منذ البداية.ويمكن لعبها بسهولة إلى حد ما باليد.سأفترض أن B يتجنب كل الانتصارات ذات الحركة الواحدة لـ R ، وسيحدد الحركات حسب اللون ، والمكان في الشبكة حيث يحدث اللعب. Genacodicetagpre
بالنسبة إلى الخوارزمية الخاصة بك ، سأقترح عليك تعديلها لتفضيل المكاسب على الخسائر ، وتفضل الخسائر البعيدة على الخسائر القريبة.إذا قمت بذلك ، فسوف "تبذل جهدًا أكبر" لتجنب الخسارة الحتمية.