给出我可能有一个以下列形式编写的ARFF文件:

@relation spamOrNot
@attribute body String
@attribute result {spam, notspam}
"free money now!", spam
"hi meet me at 10", notspam
.

和我要跑到这是为了训练一个天真的贝叶斯分类器在Weka上。如何创建一个测试集,以便此培训的分类器能够进行预测?谢谢。

有帮助吗?

解决方案

有许多数据存储库,您可以在其中找到垃圾邮件和非垃圾邮件示例(来自现实生活)。然后,拿起垃圾邮件/非垃圾邮件邮件的正文,并制作类似的ARFF文件(但是这次它将使用适当的标签测试ARFF文件)(用于垃圾邮件机构的垃圾邮件和非垃圾邮件机构的垃圾邮件)。使用您的培训ARFF文件,您将获得分类器模型。保存该模型。然后在Weka Explorer分类选项卡上,选择单选按钮“测试集”,然后选择测试集(但它将具有标签)。然后加载培训模型,右键单击它,然后选择重新评估测试集。你完成了。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top