私のGBMモデルが過剰に適合しているかどうかを判断する方法は?
-
30-10-2019 - |
質問
以下は、RのIRISデータセットを使用したH2O勾配ブーストマシンモデルの簡略化された例です。このモデルは、sepalの長さを予測するように訓練されています。
この例は、0.93のR2値を生成しますが、これは非現実的と思われます。これらが実際に現実的な結果であるか、単にモデルの過剰適合かを評価するにはどうすればよいですか?
library(datasets)
library(h2o)
# Get the iris dataset
df <- iris
# Convert to h2o
df.hex <- as.h2o(df)
# Initiate h2o
h2o.init()
# Train GBM model
gbm_model <- h2o.gbm(x = 2:5, y = 1, df.hex,
ntrees=100, max_depth=4, learn_rate=0.1)
# Check Accuracy
perf_gbm <- h2o.performance(gbm_model)
rsq_gbm <- h2o.r2(perf_gbm)
---------->
> rsq_gbm
[1] 0.9312635
正しい解決策はありません
所属していません datascience.stackexchange