كيف يمكنني تكييف محرك التوصية الخاص بي مع يبدأ البرد؟

https://stackoverflow.com/questions/1992508

22-09-2019
|

سؤال

أشعر بالفضول ، ما هي الأساليب / الأساليب للتغلب على مشكلة "البدء البارد" حيث يدخل مستخدم جديد أو عنصر النظام ، نظرًا لعدم وجود معلومات حول هذا الكيان الجديد ، فإن تقديم التوصية يمثل مشكلة.

أستطيع أن أفكر في القيام ببعض التوصية القائمة على التنبؤ (مثل الجنس والجنسية وما إلى ذلك).

المحلول

ربما هناك أوقات لا ينبغي أن تقدم فيها توصية؟ يجب أن تتأهل "البيانات غير الكافية" كواحدة من تلك الأوقات.

أنا فقط لا أرى كيف أن توصيات التنبؤ بناءً على "الجنس والجنسية وما إلى ذلك" سوف تصل إلى أكثر من القوالب النمطية.

IIRC ، قامت أماكن مثل Amazon ببناء قواعد البيانات الخاصة بهم لفترة من الوقت قبل طرح التوصيات. إنه ليس نوع الشيء الذي تريد أن تخطئه ؛ هناك الكثير من القصص حول التوصيات غير المناسبة بناءً على بيانات غير كافية.

نصائح أخرى

يمكنك بدء تشغيل نظام التوصية.

هناك نوعان من أنظمة التوصية ؛ التصفية التعاونية والقائمة على المحتوى. تستخدم الأنظمة القائمة على المحتوى بيانات التعريف حول الأشياء التي توصي بها. السؤال هو إذن ما هي بيانات التعريف المهمة؟ النهج الثاني هو التصفية التعاونية التي لا تهتم ببيانات التعريف ، فهي تستخدم فقط ما فعله الناس أو قالوا حول عنصر لتقديم توصية. مع التصفية التعاونية ، لا داعي للقلق بشأن المصطلحات في بيانات التعريف المهمة. في الواقع ، لا تحتاج إلى أي بيانات ميتا لتقديم التوصية. المشكلة في التصفية التعاونية هي أنك تحتاج إلى بيانات. قبل أن يكون لديك بيانات كافية يمكنك استخدام التوصيات المستندة إلى المحتوى. يمكنك تقديم توصيات تعتمد على كلتا الطريقتين ، وفي البداية لديها 100 ٪ قائمة على المحتوى ، ثم عند بدء المزيد من البيانات في الاختلاط في التصفية التعاونية. هذه هي الطريقة التي استخدمتها في الماضي.

هناك تقنية شائعة أخرى تتمثل في التعامل مع الجزء القائم على المحتوى كمشكلة بحث بسيطة. لقد وضعت فقط بيانات التعريف كنص أو نص من المستند ثم فهرس المستندات الخاصة بك. يمكنك القيام بذلك مع Lucene & Solr دون كتابة أي رمز.

إذا كنت تريد أن تعرف كيف يعمل التصفية التعاونية الأساسية ، تحقق من الفصل 2 من "برمجة الذكاء الجماعي" بقلم توبي سيجاران

العمل على هذه المشكلة بنفسي ، ولكن هذه الورقة من Microsoft على آلات Boltzmann تبدو جديرة بالاهتمام: http://research.microsoft.com/pubs/81783/gunawardana09__unified_approac_build_hybrid_recom_system.pdf

لقد تم طرح هذا عدة مرات من قبل (بطبيعة الحال ، لا يمكنني العثور على هذه الأسئلة الآن:/، لكن الاستنتاج العام كان من الأفضل تجنب مثل هذه التوصيات. في أجزاء مختلفة من نفس الأسماء تنتمي إلى جنسين مختلفين ، وهكذا ...

من الواضح أن التوصيات القائمة على "مستخدمين مماثلون ..." يجب أن تنتظر. يمكنك إعطاء كوبونات أو حوافز أخرى لمسح المجيبين إذا كنت ملتزمًا تمامًا بالقيام بالتنبؤات بناءً على تشابه المستخدم.

هناك طريقتان أخريان لبدء محرك التوصية البارد.

بناء نموذج بنفسك.
احصل على الموردين لملء المعلومات الرئيسية إلى نموذج هيكل عظمي. (قد تتطلب أيضًا حوافز $.)

الكثير من المزالق المحتملة في كل هذه ، والتي من المنطقي للغاية أن نذكر.

كما قد تتوقع ، لا يوجد غداء مجاني هنا. لكن فكر في الأمر بهذه الطريقة: محركات التوصية ليست خطة عمل. أنها تعزز خطة العمل فقط.

هناك ثلاثة أشياء مطلوبة لمعالجة مشكلة البدء البارد:

يجب أن تكون البيانات موضحة بحيث يكون لديك العديد من الميزات المختلفة (مع بيانات المنتج ، يكون المصطلح المستخدم لـ "الميزة" غالبًا "جوانب التصنيف"). إذا لم تقم بتعريف البيانات بشكل صحيح كما هو الحال في الباب ، فسيظل محرك التوصية "باردًا" لأنه لا يحتوي على أي شيء لتصنيف التوصيات.
الأهم من ذلك: تحتاج إلى حلقة ربح المستخدم الذي يمكن للمستخدمين من خلاله مراجعة التوصيات اقتراحات محرك التخصيص. على سبيل المثال ، نعم/لا زر لـ "هل كان هذا الاقتراح مفيدًا؟" إذا كانت قائمة انتظار مراجعة للمشاركين في مجموعة بيانات تدريب واحدة (أي مجموعة بيانات التدريب "التوصية") لمجموعة بيانات تدريب أخرى (أي لا توصي بمجموعة بيانات التدريب).
لا ينبغي أبدًا اعتبار النموذج المستخدم للاقتراحات (التوصية/لا يوصي) توصية واحدة تناسب الجميع. بالإضافة إلى تصنيف المنتج أو الخدمة لاقتراح العميل ، كيف تصنف الشركة كل عميل محدد يهم أيضًا. إذا كان العمل بشكل صحيح ، ينبغي للمرء أن يتوقع أن يحصل العملاء الذين لديهم ميزات مختلفة على اقتراحات مختلفة لـ (التوصية/لا يوصي) في موقف معين. هذا من شأنه أن يكون جزء "التخصيص" من محركات التخصيص.

مرخصة بموجب: CC-BY-SA مع الإسناد

لا تنتمي إلى StackOverflow