-
16-10-2019 - |
题
- 我想尝试C5.0算法中R中的k折交叉验证,
以下是我使用的代码。有人可以建议我也可以包括k折吗?
classifi_c5.0 <-c5.0(target〜。,data = triending_data_smoted,trails = 500,control = c5.0control(mincases = mincases_count,noglobalpruning = false)))))
- 是否需要对随机森林进行K折交叉验证?
解决方案
我想说的是,在这里不必要交叉验证,因为数据的多个分区和变量已经隐含在随机森林中。但是,保持与训练集不同的测试集仍然是一个好习惯。这主要是因为您可能会引入随机森林的变化,以改善整体测试集的性能,从而引入随机森林试图克服的偏见。因此,如果您仅保留了一部分数据,并判断RF的最终性能仅在预测步骤中设置为“扣留”,那就很好。