Xgboostモデルを再トレーニングする代わりに微調整できますか?
-
16-10-2019 - |
質問
xgboostライブラリを使用しています。私のシステムは毎晩Cronjobを実行し、データベースからデータを引き出し、モデルをトレーニングします。ただし、モデルの再トレーニングを何度も削除し、データベースにある新しいデータで微調整したいと思います。 SklearnのImplmantation(http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.gradientboostingclassifier.html)warm_startオプションを使用できますが、xgboostはどうですか?
解決
XgboostのPythonラッパーの現在のバージョンでは、列車機能でファイル名または既存のXgboostモデル(クラスブースター)を指定できることがわかります。
他のヒント
Xgboostは、データセット全体にアクセスできると仮定して最適な分割を行うことに注意する必要があります。そのため、再トレーニングではなく更新することで予測力を失う可能性があります(もちろん、これは減少した計算コストに見合うかもしれません)。
これに関する興味深い議論を参照してください xgboost github問題
所属していません datascience.stackexchange