NLP تصنيف الجمل / الفقرة مضحكة

https://stackoverflow.com/questions/548951

23-08-2019
|

سؤال

هل هناك طريقة لتصنيف جملة / فقرة معينة مضحكة. هناك عدد قليل جدا من المؤشرات حيث يجب أن يذهب المرء إلى أبعد من ذلك.

المحلول

هناك بحث في هذا، يطلق عليه الفكاهة الحسابية. وبعد إنها منطقة متعددة التخصصات تستغرق عناصر من اللغويات الحاسوبية والنفسية والذكاء الاصطناعي، وتعلم الآلات وما إلى ذلك. إنهم يحاولون معرفة ما الذي يجعل القصص أو النكات مضحكة (مثل الاتصال غير المتوقع، أو باستخدام موضوع من المحرمات بطريقة مفاجئة إلخ) وتطبيقه على النص (إما لتوليد قصة مضحكة أو لقياس "Funniness" للنص).

هناك كتب والمقالات حول هذا الموضوع (على سبيل المثال غريم ريتشي).

نصائح أخرى

نعم، يجب عليك استخدام Training Corpora لبناء نموذج تنبئي قادر على اكتشاف جمل مضحكة. في بعض الأحيان يعرف هذا باسم "تحليل المعنويات" في الأدب. إلقاء نظرة على هذه المقالة حول تحليل المعفاة مع Lingpipe.

إذا كنت تستطيع استخدام Java، يمكنك استخدام مكتبةها (انظر مصفوفة الترخيص). لقد وجدت أنه مفيد جدا، وليس بالضبط في نفس السياق منك.

الطريقة الوحيدة لسحب هذا إيقافها هي الحصول على بضعة آلاف من الناس (لن يفعل القرود، آسف) للنظر من خلال الآلاف من الجمل / القصص المضحكة، ومعدلتها، ثم بناء نوع من نظام الخبراء / الشبكة العصبية من هو - هي. بالنظر إلى النطاق المشكلات وعقلة ذلك (شيء مضحك لشخص واحد قد لا يكون مضحكا - حتى هجومية - إلى أخرى)، أود أن أقول إنها مهمة مستحيلة.

يمكنك استخدام نفس التقنية مثل مرشحات البريد المزعج. بدلا من البريد العشوائي / غير الرسائل غير المرغوب فيها، يمكنك تصنيفها على مضحك / غير مضحك. انظر إلى الطبقات البايس ساذجة لمزيد من المعلومات.

http://en.wikipedia.org/wiki/naive_bayesian_classification.

حاول ايضا الفكاهة الحسابية @ باحث جوجل إذا كنت جادا في الدخول في الحقل. تم ذكر تحليل المعنويات أيضا، انظر ويكيبيديا على ذلك.

بالطبع، هذا كل هذا يتوقف على ما هو نطاقك وأهدافك ...

مرخصة بموجب: CC-BY-SA مع الإسناد

لا تنتمي إلى StackOverflow