سؤال

أنا أسأل هذا أكاديميا ، أريد أن أسأل بصوت عال سؤال مهم جدا ويكون المجتمع في محاولة الإجابة عليه.هل يمكننا بناء نظام يولد مشهد للعب على الحي مجهولة المصدر مجموعة غرف الدردشة الفيديو التي يمكن قراءة النص كتبته في هذا الرد مع chatbot?

يعيش الفيديو على الإنترنت غالبا ما تكون ضبابية منخفضة القرار.واحد لا يمكن أن تجعل من الكثير من التفاصيل في المشهد من بعيد الحزب.المشاهد يمكن أن تكون المقدمة مع البرمجيات الحديثة الأدوات التي تبدو حقيقية جدا عندما لا تتحرك.مما يجعلها تتحرك بشكل واقعي هو قطعة كبيرة من برامج المحاكاة.

الوجوه يمكن أن تكون المقدمة في 24 لقطة في الثانية من خلال مجموعة من 24 أنظمة قادرة على 1 إطار في الثانية.الفيديو ثم يكون 1 تأخر الثاني من النقطة التي تم اتخاذ قرار على النحو الذي تعبيرات الوجه لتوليد.هذه تعابير الوجه و جيلهم هو المشكلة الرئيسية.الجلد الواقعية شرط هو حل المشكلة عن طريق الرسومات المجتمع.

تعابير الوجه وقد تم تصنيفها من قبل العديد من الباحثين.كما أنها يمكن أن تكون المقدمة, وقد ثبت في الحديث رسومات الحاسوب الأدب.يمكننا أن نفعل لهم إذا يمكننا أن نعرف تلك التي هي مناسبة لحالة معينة.

Chatbots قد تم في استخدام لعدة عقود.توجد الآن تماما "الذكية" خلال البرامج التي سوف تقرأ ما هو طلب الرد بطريقة معقولة.دائما كان هذا مع النص ، ولكن النص-برنامج قارئ الكلام في الإنسان العش صوت و برامج التعرف على الكلام هو الحصول على أفضل في كل عام.

ما أقترحه هو أنه ينبغي أن تكون بدائية إلى ربط كل من هذه الأجزاء المتباينة من برامج التنمية وخلق بعض مدهش حقا تورينج-اختبار الخافق.

هذا البرنامج يمكن أن تدخل الفضاء الافتراضي وعرض بيئة واقعية كما لو كان على كاميرا ويب مثل غيرهم من المشاركين.يمكن أن يشاهد تعابير الوجه و يمكن الاستماع إلى الكلام ويمكن قراءة النص.ومن ثم يمكن أن تخلق استجابة إما اكتب أو أقول مرة أخرى إلى المجموعة.اختيار ما يستجيب مع مشكلة صعبة ولا حتى معظم البشر تتقن.يمكن أن نحصل عليه قريبا مع الكثير من العمل.

اختبار تورينج عن إثبات أن التواصل هو الإنسان ، ولكن 'دليل' فقط بمعنى أنها جيدة بما يكفي لخداع الإنسان القضاة.إذا كان الإنسان القضاة ببساطة الجميع ، وأنها ليس من المرجح أن تطبيق صارم إجراء رسمي.التخمين أو الوقوع في خدعة جيدة بما يكفي.

هل تعتقد أننا يمكن أن تفعل هذا ؟

هو هذه الخطة معيبة ؟ هل هناك الأخلاقية المترتبة على خداع متوسط المشاهد في هذا الطريق ؟ يمكننا أن نجعل الملايين من الدولارات عن طريق توليد الشخصية الذكية مساعدين ؟

هل كانت مفيدة؟

المحلول

هناك بالفعل البحوث الجارية في هذا المجال.الرقمية الآلهة تم استخدامها مع بعض النجاح.بعض النقاط الرئيسية:

  • أجهزة الكمبيوتر الحديثة يمكن أن تجعل مقنعة الإنسان يواجه في الوقت الحقيقي, لا مشكلة.وضعت للتو في متوسطة gfx بطاقة نموذج جيد والانتهاء من ذلك.(انظر الفجر, على سبيل المثال).

  • الحالية صوت الجيل يمكن أن تنتج برامج بطلاقة النص و انها قادرة على نطقه بشكل صحيح.انها لا تزال رتابة قليلا لأن المتكلم لا العواطف.(انظر هذه المادة).

  • هناك أبحاث جعل آلات "يشعر".أقول "يشعر" لأنه في الأساس مجرد برنامج صغير مع اثنين من المتغيرات ("الغضب" ، "الخوف" و "الجوع" و "الملل", "الحزن", ...) و مجموعة معقدة من القواعد التي تؤثر على هذه المتغيرات.(انظر مقالة ويكيبيديا لمزيد من التفاصيل).

المشكلة الرئيسية الآن هي أننا لا نعرف ما هي المشاعر.هم فقط كميات من الجزيئات العائمة في أجزاء معينة من الدماغ ؟ إذا كان الأمر كذلك ، والتي الجزيئات في أي جزء من الدماغ ؟ علماء الأعصاب اليوم في محاولة للتنبؤ الدولة العقل من خلال النظر في مترو الأنفاق الصور.أن أفهم ما يعنيه هذا هو التشبيه:أنها محاولة تخمين ما البشرية حتى قبل النظر في توزيع الضوء على الأرض من القمر بعيونهم المجردة.

لذلك نحن لا نفهم ما هي المشاعر.العقبة التالية هي أن المشاعر لا تعني شيئا من دون سياق.فإنه من السهل أن تكتب البرنامج الذي يشعر "بالحزن" فقط عن طريق وضع قيمة المتغير sadness إلى 1.0.ولكن هذا من شأنه أن يشعر غريب إذا كان هناك أي سبب.لذا يجب أن يكون البرنامج قادرا على متابعة المحادثة ، بناء الصورة الذهنية منها (ما هي الناس يتحدثون عن و كيف يشعرون الآن) ثم ضبط الحالة النفسية الخاصة التالية القواعد الحالية من كل مجموعة.

هل تعرف كيف يشعر عندما تنضم إلى مجموعة جديدة للمرة الأولى ومحاولة الحصول على قبضة على ما يجري و كيف يجب أن تتصرف.هذا هو مهمة صعبة بالنسبة للبشر وحتى أكثر من ذلك البرنامج.

هناك مقال "Können wir eine زيله simulieren?" (جمان فقط ولكن إخراج ترجمة جوجل هو جيد جدا.)

نصائح أخرى

ونحن لا يمكن تمرير النص التقليدي القائم تورينج اختبار. إضافة الفيديو على رأس هو غير ذي صلة.

وأنا لا أتفق مع وجود لسؤالك هنا، لكني أشعر أنه من الضروري أن نشير إلى أن لديك يساء فهمها بشدة ما وجهة اختبار تورينج هو. عليها أن تفعل مع تبدو وكأنها إنسان، أو السبر وكأنه واحد لا شيء.

في الواقع، أكثر الاختبارات المقترحة تنطوي على تأخر الوقت محطة المبرقة، لذلك ليس هناك نقل اقل قدر من المعلومات ممكن ما وراء الاتصال الفعلي الذي هو تحت الاختبار.

وأنا أكره لكسر فقاعة الخاص بك، ولكن الجيل الحالي من chatbots، وحتى الجيش الإسلامي للإنقاذ الأكثر تقدما في المختبر لم تقترب حتى من الضرب اختبار تورينج. يصبح من الواضح بسرعة أن ليس هناك شخص حقيقي هناك.

والمشكلة الكبرى ليست لتقديم مظهر (المرئية أو الصوتية)، فمن لتقديم المعلومات الاستخباراتية والعواطف.

وماذا يوحي لك هو الواجهة الأمامية لالحقيقي شريك. ولكن ماذا عن نهاية الظهر؟

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top