質問

いPythonの図書館なベイジアンSpamフィルタリングご本人の了解のもと、掲載していSpamBayesとOpenBayesが、そうするとピアツェンツァのドゥオーモ(Iが悪い)。

誰でもできるので提案もPythonはClojure、Common Lispでも、Ruby)ライブラリを実装するベイジアンSpamフィルタリング?

よろしくお願いします。

解明:私は実際に見 ベイジアンSpam分級機 というわけではありません迷惑メールフィルターていただきたいと思い電車を使って一部のデータとかしてくれたんですけどるかどうか指定されたデータはスパムと見なされます。まず現場は混乱していた。

役に立ちましたか?

解決

あなたがスパムフィルタやベイズ分類をしたいですか?

ベイズ分類のためのPythonモジュールの数があります。私は最近、非常に印象的に見えるオレンジを見直しました。 Rは、ベイジアンモジュールの数を有しています。あなたはRにフックする RPY に使用することができます。

他のヒント

牧師をお試しください。これは、スパムフィルタリングモジュールです。

RedisBayesは、私にはよさそうだ。

http://pypi.python.org/pypi/redisbayes/0.1.3する

私の経験ではRedisのは、あなたのスタックに素晴らしい付加であるとMySQL、PostgreSQLやその他のRDBMSに比べて速い速度を燃えるのプロセスデータを助けることができます。

import redis, redisbayes
rb = redisbayes.RedisBayes(redis=redis.Redis())

rb.train('good', 'sunshine drugs love sex lobster sloth')
rb.train('bad', 'fear death horror government zombie god')

assert rb.classify('sloths are so cute i love them') == 'good'
assert rb.classify('i fear god and love the government') == 'bad'

print rb.score('i fear god and love the government')

rb.untrain('good', 'sunshine drugs love sex lobster sloth')
rb.untrain('bad', 'fear death horror government zombie god')

ビットに役立ちます願っています。

bogofilterのに使用してみてください、私はそれは、Pythonから利用できるかどうかはわかりません。 bogofilterのは、インターフェースの相対的な使いやすさを意味し、多くのメールシステムと統合されます。

SpamBayesする を維持し、かつ成熟している(すなわち、それは新しいを持ってすることなく動作します)すべての時間を解放します。それは簡単にあなたがやりたいだろう。 (それはカイ二乗組み合わせを使用しています)SpamBayesだけ緩くベイズであることに注意してください、しかし、おそらくあなたは、むしろ、具体的ベイズ何かよりも統計的トークンベースの分類、のいずれかの並べ替え後にしている。

モジュールはPythonの自然言語ツールキット(nltk)は簡単なベイズ分類: nltk.classify.naivebayes.

免責事項: 知っていナメのすべてベイズ分類、素朴たいですか?

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top