بناء لعبة تكساس هولديم بلعب الذكاء الاصطناعي.. من الصفر [مغلق]

https://stackoverflow.com/questions/506167

21-08-2019
|

سؤال

أنا مهتم ببناء محرك Texas Hold 'Em AI في Java.هذا مشروع طويل الأمد، وأخطط للاستثمار فيه لمدة عامين على الأقل.ما زلت في الكلية، ولم أقم ببناء أي شيء طموح بعد وأرغب في معالجة مشكلة ستثير اهتمامي على المدى الطويل.أنا جديد في مجال الذكاء الاصطناعي.من خلال فصل هياكل البيانات الخاص بي في الكلية، أعرف وحدات البناء الأساسية مثل BFS وDFS، والتتبع العكسي، وDP، والأشجار، والرسوم البيانية، وما إلى ذلك.أنا أتعلم التعبير العادي، وأدرس في SCJP وSCJD وسأقوم قريبًا بأخذ دورة إحصائية (كثيفة).

أسئلة:

-من أين أبدأ؟ما الكتب التي يجب أن أختارها؟ما نوع الذكاء الاصطناعي الذي تعمل عليه برامج لعب البوكر؟ما هو المشروع مفتوح المصدر الذي يمكنني أخذ صفحة منه؟أي موارد جيدة للذكاء الاصطناعي في جافا؟أنا مهتم بتعلم ليسب أيضًا، هل جاثا جيدة؟

المحلول

قد يكون ما يلي مفيدًا:

نصائح أخرى

من المعروف أن الذكاء الاصطناعي في لعبة البوكر يصعب تنفيذه بشكل صحيح لأن البشر يراهنون بشكل لا يمكن التنبؤ به.وعادة ما يتم تقسيمها إلى قسمين.

1) احسب احتمالات فوز يدك.

2) صياغة استراتيجية الرهان على أساس 1.

أوصي بالبدء بقراءة الكثير من الإحصائيات للجزء الأول.قد يبدو الأمر سهلاً للوهلة الأولى، لكنه في الواقع معقد للغاية (وسيؤدي فهمه بشكل خاطئ إلى القضاء على الذكاء الاصطناعي الخاص بك).ثم انتقل إلى الخوارزميات الجينية للجزء الثاني.استراتيجيات الرهان هي في الغالب خوارزميات جينية.إنهم يعدلون أنفسهم بناءً على النجاح والإخفاقات الماضية + بعض العشوائية حتى لا يصبحوا قابلين للتنبؤ.

وكتبت محرك تكساس هولدم بوكر الفيديو في جاوة

وهذا الرمز هو المحرك الأساسي لتكساس هولدم دون الآراء وغيرها

http://github.com/phstc/javapokertexasholdem

وأيضا، مما يتيح الخوارزمية الجينية ضبط أوزان الشبكة العصبية، والذي يحدد منطق القرار. هذا النهج هو مناسب جدا للعبة البوكر AI.

ولقد تقدمت بها منظمة العفو الدولية من هذا القبيل. في البداية، أنا خلقت ~ 1000 لاعبين، الذين لم تعرف كيف تلعب لعبة على الإطلاق. وبناء على حظهم الأولي خلال يديه، وترجيح لياقتهم البدنية وخلق جيل جديد. "العقل المدبر" الجديدة كانوا يلعبون أفضل من الجيل السابق.

وأخيرا، فإن أفضل الأفراد لعبت بشكل جيد للغاية.

كما أوصى بالفعل، الكتاب نظرية البوكر يعد مصدرًا لا يقدر بثمن حقًا للمعلومات للعب اللعبة وكذلك لبناء الذكاء الاصطناعي.ربما يجب عليك شرائه لأنه لا يكلف الكثير.

تقوم مجموعة الأبحاث بجامعة ألبرتا بأحدث ما توصلت إليه التكنولوجيا في الوقت الحالي، على الرغم من ظهور منافسة شديدة بين الحين والآخر.(ليست كل أبحاث البوكر والذكاء الاصطناعي في هذا المجال عامة بسبب إغراء استخدام النتائج في البوكر عبر الإنترنت، على الرغم من أن هذا محظور.)

عليك أولاً أن تقرر نوع لعبة البوكر التي ستتعامل معها أولاً.تم حل لعبة Hold'em للاعبين إلى حد كبير، على الرغم من أن أفضل البشر ما زالوا يخوضون معركة حقيقية مع أفضل الذكاء الاصطناعي المتاح.يتمتع الذكاء الاصطناعي بمزايا رئيسية مقارنة بالبشر من خلال امتلاك ذاكرة غير محدودة لا تشوبها شائبة للأيدي الماضية، وتحليل لا تشوبه شائبة للأنماط بناءً على ذلك، وبما أنها آلات، فإنها لا تميل كما يفعل جميع البشر تقريبًا في بعض الأحيان.

ربما تكون لعبة Hold'em الثابتة هي الأسهل في الاختراق، لذا قد ترغب في البدء بـ Hold'em الثابتة 1-1 ثم تحديد ما تريد القيام به بعد ذلك.

فيما يلي بعض الجوانب التي تغير الإستراتيجية الصحيحة (والذكاء الاصطناعي الخاص بك):

تختلف اللعبة النقدية عن البطولة -فإن عدد اللاعبين يجعل القرارات مختلفة.
Hold'em ليس البوكر الوحيد.أوماها ، عشيق وغيرها موجودة ويلعب على نطاق واسع.
يختلف الحد الثابت عن حد الوعاء ، والذي يختلف عن عدم وجود حد.
للتغلب على الأفضل، عليك تغطية الكثير من الأشياء الدقيقة التي يفكر فيها أفضل اللاعبين عندما يلعبون.للتغلب على لعبة هواة منخفضة المخاطر، لا يهم أي من هذه الأشياء.

إذا قررت الانتقال إلى لعبة Hold'em بلا حدود، فقد ترغب في الاطلاع على سلسلة من ثلاثة كتب هارينجتون على هولدم وكتاب لعبة البوكر بلا حدود - النظرية والتطبيق.بعد أن قرأت عددًا لا بأس به من الكتب عن البوكر، أستطيع أن أقول إن هذه الكتب جنبًا إلى جنب مع نظرية البوكر كافية تمامًا.

وأنا لست متأكدا من اللعبة بالضبط كنت مهتما، ولكن النهج النموذجي لإنشاء نسخة مجردة أصغر بكثير من اللعبة، حل تلك اللعبة الصغيرة، ومن ثم رسم الحالات عبة حقيقية إلى لعبة مجردة لتوليد النصيحة. معظم الدراسات الأكاديمية تخطي تفاصيل هذه العملية لصالح عرض النتائج حول التقارب، والاستغلال، ونتائج المسابقة.

ومع ذلك، هناك بعض قواعد رمز المتاحة للجمهور الذي يقدم التنفيذ الكامل. واحدة من أفضل منها هو الفأل الهيثمي:

http://www.deducer.org/pmwiki/pmwiki. بى؟ ن = Main.ArtificialIntelligencePoker

وهذا هو بوت استراتيجية كاملة أساسي يستخدم مسرحية وهمية لتحسين استراتيجية لعبة مجردة. انها نقطة انطلاق جيدة لأنها واضحة إلى حد ما، كاملة، ويمثل العرض الجيد للنهج عبة مجردة.

إذا كنت مهتما في تطوير لعبة البوكر AI، أود أن أقترح قراءة كل شيء من عام 2007، وعلى من مجموعة لعبة البوكر UA والطلاب اللاعب Tuomas Sandholm ل:

http://www.cs.cmu.edu/~sandholm/

http://poker.cs.ualberta.ca/publications.html

وكتبت هولدم AI في بلدي الجامعي. لم يكن المتقدمة بشكل خاص، وأنا استخدم آلة Q-القيمة التي اجتاز عدد من الدول والقيم Q محدثة لكل دولة.

ولقد وجدت جامعة مشروع AI بوكر ألبرتا مصدرا قيما للمعلومات لتجنب المزالق.

وكما ملصق واحد فوق الدول، فإن الخطوة الأولى هي مسمار في بضع قواعد لعبة البوكر يمكن تحديدها - واحد على واحد لعبة البوكر يمكن تطويرها برمجيا

وشرك واحد أنا سقطت لم يكن بناء في reconfigurability في وقت مبكر. على سبيل المثال أن تكون قادرة على تبديل درجة من التعلم / اللعب.

وأود أن تكون مهتمة لسماع كيف تحصل على قطرة لي stevekeogh الإلكتروني في gmail.com

وفقط إضافة إلى الروابط أعلاه، واحدة من الامور الهامة لتنفيذ سيكون HTTP: // EN .wikipedia.org / ويكي / Kelly_criterion التي سوف تساعد على معرفة الحجم الأمثل من الرهانات نظرا للخلاف المتوقع في سلسلة من الرهانات. مع البشر يمكن أن تكون هناك أخطاء في الحكم على خلاف، ولكن إذا كان برنامج AI الخاص بك يمكن أن يبصق على بعض الصعاب تطبيع المتوقع استنادا مهما كانت الخوارزمية ثم أن هذه التقنية التحجيم الرهان الذي يوازن من المخاطر ومكافأة للمقامر ميزة أن يكون حلا رخيصة جيدة .

واحد نتيجة مثيرة للاهتمام لقد سمعت أنه إذا قمت بتقييد الخيارات الرهان أضعاف، ومراجعة والكل في، يمكنك كتابة منظمة العفو الدولية أن يفوز واحد على وهم مع احتمال لا يقل عن 49٪، وبنسبة 49.5٪ إذا انها (IIRC) <م> لا الذهاب أولا.

وأنا لا أعرف أن هذا AI هو أسهل في الكتابة أن واحدا الذي لا يعرف كم للمراهنة، لكنه غذاء للفكر: اختيار مبالغ الرهان تمثل سوى 1.5٪ من احتمال فوز

مرخصة بموجب: CC-BY-SA مع الإسناد

لا تنتمي إلى StackOverflow