質問

以下は、RのIRISデータセットを使用したH2O勾配ブーストマシンモデルの簡略化された例です。このモデルは、sepalの長さを予測するように訓練されています。

この例は、0.93のR2値を生成しますが、これは非現実的と思われます。これらが実際に現実的な結果であるか、単にモデルの過剰適合かを評価するにはどうすればよいですか?

library(datasets)
library(h2o)

# Get the iris dataset
df <- iris

# Convert to h2o
df.hex <- as.h2o(df)

# Initiate h2o
h2o.init()

# Train GBM model
gbm_model <- h2o.gbm(x = 2:5, y = 1, df.hex, 
                     ntrees=100, max_depth=4, learn_rate=0.1)

# Check Accuracy
perf_gbm <- h2o.performance(gbm_model) 
rsq_gbm <- h2o.r2(perf_gbm)

---------->

> rsq_gbm
[1] 0.9312635

正しい解決策はありません

ライセンス: CC-BY-SA帰属
所属していません datascience.stackexchange
scroll top