我想知道是否有任何良好且干净的面向对象编程(OOP)实现用于垃圾邮件和文本分类的贝叶斯过滤?这仅用于学习目的。

有帮助吗?

解决方案

我绝对推荐 韦卡 这是一个 开源数据挖掘软件 用Java编写:

Weka 是用于数据挖掘任务的机器学习算法的集合。这些算法可以直接应用于数据集,也可以从您自己的 Java 代码中调用。Weka 包含用于数据预处理、分类、回归、聚类、关联规则和可视化的工具。它也非常适合开发新的机器学习方案。

如上所述,它附带了一堆不同的分类器,例如 支持向量机, , C4.5, 、朴素贝叶斯(当然)等等(参见 API文档)。请注意,已知许多分类器具有 比朴素贝叶斯的性能好得多 在垃圾邮件检测或文本分类领域。

此外,Weka 还为您带来了一个非常 强大的图形用户界面

其他提示

查看第 6 章 集体智慧编程

下面是贝叶斯过滤的 C# 实现: C# 的朴素贝叶斯垃圾邮件过滤器 (托管在 CodeProject 上)。

n贝叶斯 - CodePlex 上托管的另一个 C# 实现

法语,但您应该能够找到下载链接:)PHP 朴素贝叶斯过滤器

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top