خوارزميات البحث عن الاشياء المستخدم يود بناء على المستخدمين الآخرين يحب

StackOverflow https://stackoverflow.com/questions/1602302

سؤال

أنا أفكر في كتابة التطبيق في تصنيف الأفلام في HTPC بناء على ما أفراد الأسرة مثل.

أنا لا أعرف إحصاءات أو منظمة العفو الدولية ، ولكن الاشياء هنا يبدو العصير جدا.أنا لا أعرف من أين أبدأ القيام به.

هنا هو ما كنت ترغب في تحقيقه:

  1. يؤلف مجموعة من عينات من كل المستخدمين يحب, تصنيف كل عينة سمة على حدة.على سبيل المثال, ربما يحب المستخدم الأفلام الغربية الكثير ، لذلك الغربية النوع سوف تحمل المزيد من الوزن لهذا المستخدم (على سبيل سمات أخرى مثل الفاعلة ، مدير ، إلخ).

  2. يمكن للمستخدم الحصول على اقتراحات على أساس يحب من المستخدمين الآخرين.على سبيل المثال إذا كان المستخدم أ و ب مثل سبيلبرغ (اتصال بين المستخدمين) ، ب المستخدم يحب باتمان يبدأ ، ولكن المستخدم يحتقر كاتي هولمز ، تزن الفيلم المستخدم وفقا لذلك (مرة أخرى ، كل سمة على حدة ، على سبيل المثال ، ربما لا المستخدم مثل أفلام الحركة كثيرا حتى تحقيق تصنيف أسفل قليلا ، ومنذ كاتي هولمز ليس النجم الرئيسي ، لا تأخذ ذلك بعين الاعتبار بقدر غيرها من الصفات).

في الأساس, مقارنة مجموعات من المستخدم مماثلة إلى مجموعات من "المستخدم ب" ، و يأتي مع التصنيف المستخدم أ.

لدي الخام فكرة عن كيفية تنفيذ هذا, ولكن أنا متأكد من بعض العقول النيرة قد فكرت بالفعل من الآن أفضل حل حاليا...أي اقتراحات ؟

في الحقيقة بعد بحث سريع ، يبدو بايزي تصفية العمل.إذا كان الأمر كذلك ، هل سيكون هذا أفضل النهج ؟ سيكون بسيطة مثل مجرد "تطبيع" فيلم البيانات والتدريب المصنف لكل مستخدم ، ثم تصنيف كل الفيلم ؟

إذا كان لديك اقتراح يتضمن بعض الدماغ ذوبان المفاهيم (أنا لست من ذوي الخبرة في هذه المواضيع خصوصا في منظمة العفو الدولية) ، وأنا أقدر إذا تضمنت أيضا قائمة من بعض الأساسيات بالنسبة لي أن البحوث قبل الغوص في لحمي الأشياء.

وذلك بفضل!

هل كانت مفيدة؟

المحلول

هناك بعض الخوارزميات التي هي جيدة لذلك:

ARTMAP:المجموعات عبر احتمال ضد بعضها البعض (هذا ليس سريع ولكن أفضل شيء بالنسبة لمشكلتك المنظمة البحرية الدولية)

ARTMAP يحمل مجموعة من الصفات المشتركة و يحدد احتمالات simliarity عن طريق النسب.ARTMAP

الرياح درجة الحرارة:هذا يفصل من ناقلات المسافة التي كانت من بعضهم البعض الرياح درجة الحرارة:ويكيبيديا

PCA:سوف منفصلة متوسط كل القيم من varing بت.هذا هو ما كنت تستخدم للقيام كشف الوجه والخلفية الطرح في رؤية الكمبيوتر.PCA

نصائح أخرى

هذا هو مماثل هذا السؤال حيث OP يريد بناء نظام التوصية.باختصار ، نحن يتم منحك مجموعة من بيانات التدريب تتكون من المستخدمين التقييم إلى أفلام (1-5 تصنيف النجوم على سبيل المثال) و مجموعة من السمات لكل فيلم (السنة, النوع, الجهات الفاعلة, ..).نحن نريد أن نبني المزكي بحيث خرج عن الغيب الأفلام تقييم ممكن.لذا يعد المعهد البيانات تبدو مثل:

user movie   year   genre   ...    | rating
---------------------------------------------
  1    1     2006   action         |    5
  3    2     2008   drama          |    3.5
  ...

و غير مصنفة فيلم X:

10    20     2009   drama   ?

نحن نريد أن التنبؤ التصنيف.أفعل هذا من أجل كل الغيب الأفلام ثم الفرز حسب توقع تصنيف الفيلم وإخراج أفضل 10 يعطيك توصية النظام.

أبسط النهج هو استخدام k-أقرب الجيران الخوارزمية.بين تصنيف الأفلام البحث عن "الأقرب" منها إلى فيلم X و الجمع بين التقييم لإنتاج التنبؤ.هذا النهج لديه ميزة كونها بسيطة جدا وسهلة التنفيذ من الصفر.

أخرى أكثر تطورا وجود نهج.على سبيل المثال يمكنك بناء شجرة القرار, تناسب مجموعة من قواعد بيانات التدريب.يمكنك أيضا استخدام النظرية الافتراضية والشبكات, الشبكات العصبية الاصطناعية, المتجهات آلات, من بين العديد من الآخرين...الذهاب من خلال كل من هذه لن تكون سهلة بالنسبة لشخص دون الخلفية المناسبة.ما زلت أتوقع أن يكون باستخدام أداة خارجية/المكتبة.الآن يبدو أن يكون على دراية النظرية الافتراضية والشبكات بسيطة ساذجة bayes صافي, يمكن أن تكون في الواقع قوية جدا.ميزة واحدة هي أنه يسمح التنبؤ في ظل فقدان البيانات.

الفكرة الرئيسية أن تكون إلى حد ما في نفسه ؛ تأخذ إدخال البيانات لديك ، القطار النموذج ، ثم استخدامها للتنبؤ فئة من الحالات الجديدة.

إذا كنت تريد أن تلعب حولها مع خوارزميات مختلفة في بديهية بسيطة الحزمة التي لا تتطلب برمجة, أقترح عليك أن نلقي نظرة على Weka (my 1st الاختيار) ، البرتقال, أو RapidMiner.الجزء الأكثر صعوبة في إعداد البيانات بالشكل المطلوب.بقية سهلا كما هو اختيار ما خوارزمية وتطبيق ذلك (كل في عدد قليل من النقرات!)

أعتقد لشخص لا تبحث الخوض في الكثير من التفاصيل ، أنصح الذهاب مع أقرب الجيران الطريقة كما هي بديهية وسهلة التنفيذ..لا يزال خيار استخدام Weka (أو واحدة من الأدوات الأخرى) تستحق النظر في.

K-أقرب جار الخوارزمية قد يكون الحق في زقاق الخاص بك.

تحقق من بعض من عمل الفرق الكبرى عن نيتفليكس الجائزة.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top