1. 我想尝试C5.0算法中R中的k折交叉验证,

以下是我使用的代码。有人可以建议我也可以包括k折吗?

classifi_c5.0 <-c5.0(target〜。,data = triending_data_smoted,trails = 500,control = c5.0control(mincases = mincases_count,noglobalpruning = false)))))

  1. 是否需要对随机森林进行K折交叉验证?
有帮助吗?

解决方案

我想说的是,在这里不必要交叉验证,因为数据的多个分区和变量已经隐含在随机森林中。但是,保持与训练集不同的测试集仍然是一个好习惯。这主要是因为您可能会引入随机森林的变化,以改善整体测试集的性能,从而引入随机森林试图克服的偏见。因此,如果您仅保留了一部分数据,并判断RF的最终性能仅在预测步骤中设置为“扣留”,那就很好。

许可以下: CC-BY-SA归因
scroll top