Избегайте итераций при расчете средней точности модели
-
16-10-2019 - |
Вопрос
Я вписываю модель в Р.
- использовать
createFolds
метод создания несколькихk
складывается из набора данных - Проверкайте складки, повторяя следующее на каждой итерации:
train
модель на складках K-1predict
результаты для I-th Poll- Рассчитайте точность прогноза
- Средняя точность
Есть ли у r функция, которая делает складки сам по себе, повторяет настройку/прогнозы модели и дает среднюю точность обратно?
Решение
Да, вы можете сделать все это, используя карету (http://caret.r-forge.r-project.org/training.html) пакет в R. Например,
fitControl <- trainControl(## 10-fold CV
method = "repeatedcv",
number = 10,
## repeated ten times
repeats = 10)
gbmFit1 <- train(Class ~ ., data = training,
method = "gbm",
trControl = fitControl,
## This last option is actually one
## for gbm() that passes through
verbose = FALSE)
gbmFit1
который даст выход
Stochastic Gradient Boosting
157 samples
60 predictors
2 classes: 'M', 'R'
No pre-processing
Resampling: Cross-Validated (10 fold, repeated 10 times)
Summary of sample sizes: 142, 142, 140, 142, 142, 141, ...
Resampling results across tuning parameters:
interaction.depth n.trees Accuracy Kappa Accuracy SD Kappa SD
1 50 0.8 0.5 0.1 0.2
1 100 0.8 0.6 0.1 0.2
1 200 0.8 0.6 0.09 0.2
2 50 0.8 0.6 0.1 0.2
2 100 0.8 0.6 0.09 0.2
2 200 0.8 0.6 0.1 0.2
3 50 0.8 0.6 0.09 0.2
3 100 0.8 0.6 0.09 0.2
3 200 0.8 0.6 0.08 0.2
Tuning parameter 'shrinkage' was held constant at a value of 0.1
Accuracy was used to select the optimal model using the largest value.
The final values used for the model were n.trees = 150, interaction.depth = 3
and shrinkage = 0.1.
CARET также предлагает много других вариантов, поэтому должна соответствовать вашим потребностям.
Не связан с datascience.stackexchange