سؤال

أنا أبحث عن مكتبة بيثون التي تصف تصفية Bayesian SPAM. نظرت إلى علامات الدموية و OpenBayes، ولكن يبدو أن كلاهما غير محمول (قد أكون مخطئا).

هل يمكن لأي شخص أن يقترح مكتبة Python جيدة (أو عباءة، شائعة LISP، حتى روبي) التي تنفذ تصفية Bayesian SPAM؟

شكرا مقدما.

توضيح: أنا فعلا أبحث عن Bayesian SPAM المصنف وليس بالضرورة مرشح البريد العشوائي. أريد فقط تدريبه باستخدام بعض البيانات وأخبرني لاحقا ما إذا كانت بعض البيانات المعطاة هي البريد المزعج. آسف لأي ارتباك.

هل كانت مفيدة؟

المحلول

هل تريد تصفية البريد المزعج أو تصنيف البيض؟

بالنسبة لتصنيف Bayesian، هناك عدد من وحدات بيثون. كنت الآن مراجعة مؤخرا البرتقالي التي تبدو مؤثرة جدا. ص لديه عدد من وحدات البيئي. يمكنك استخدام زن أن هوك في ص

نصائح أخرى

يحاول القس. وبعد إنها وحدة تصفية البريد العشوائي.

Redisbayes تبدو جيدة بالنسبة لي:

http://pypi.python.org/pypi/redisbayes/0.1.3.

في تجربتي، تعد Redis إضافة رائعة إلى مكدسك ويمكن أن تساعد في معالجة البيانات بسرعات سريعة في Blazing مقارنة مع MySQL أو POADGRESQL أو أي RDBMS الأخرى.

import redis, redisbayes
rb = redisbayes.RedisBayes(redis=redis.Redis())

rb.train('good', 'sunshine drugs love sex lobster sloth')
rb.train('bad', 'fear death horror government zombie god')

assert rb.classify('sloths are so cute i love them') == 'good'
assert rb.classify('i fear god and love the government') == 'bad'

print rb.score('i fear god and love the government')

rb.untrain('good', 'sunshine drugs love sex lobster sloth')
rb.untrain('bad', 'fear death horror government zombie god')

نأمل أن يساعد قليلا.

حاول استخدام bogofilter., أنا لست متأكدا من كيفية استخدامه من بيثون. يتم دمج Bogofilter مع العديد من أنظمة البريد، مما يعني سهولة الاتصالات النسبية.

علام شجاع يكون الحفاظ عليها، وهي ناضجة (أي أنها تعمل دون الحاجة إلى الحصول على بيانات جديدة طوال الوقت). سوف تفعل بسهولة ما تريد. لاحظ أن العلامات التجارية الشائعة فضفاضة فقط Bayesian (يستخدم الجمع بين تشي تربيع)، ولكن من المفترض أن تكون بعد أي نوع من التصنيف القائم على الرمز الإحصائي، وليس شيئا بيازيا على وجه التحديد.

وحدة في مجموعة أدوات اللغة الطبيعية بيثون (NLTK)؟ nltk.classify.naivebayes.

تنصل: أعرف هراء كل شيء عن تصنيف بايزيا، ساذج أو دنيوي.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top