質問

  1. c5.0アルゴリズムのrでk-fold Cross検証を試してみたいと思います。

以下は私が使用するコードです。誰かが私にK-foldを含めるにはどうすればよいですか?

classifi_c5.0 <-c5.0(ターゲット〜。、、、 data = training_data_smoted、trails = 500、control = c5.0control(mincases_count、noglobalpruning = false)))

  1. ランダムフォレストに対してK-fold Cross検証を行う必要がありますか?
役に立ちましたか?

解決

データと変数の複数の分割はランダムフォレストではすでに暗黙的であるため、ここでは相互検証は不要です。しかし、トレーニングセットとは異なるテストセットを保持することは、まだ良い習慣です。これは主に、ランダムフォレストに変化を導入してテストセット全体のパフォーマンスを向上させ、それによってランダムフォレストが克服しようとしているバイアスを導入する可能性があるためです。したがって、データの一部を差し控えて、予測ステップでのみ差し控えられたセットのRFの最終パフォーマンスを判断した場合、それは問題ありません。

ライセンス: CC-BY-SA帰属
所属していません datascience.stackexchange
scroll top