Избегайте итераций при расчете средней точности модели

https://datascience.stackexchange.com/questions/921

16-10-2019
|

Вопрос

Я вписываю модель в Р.

использовать createFolds метод создания нескольких k складывается из набора данных
Проверкайте складки, повторяя следующее на каждой итерации:
- train модель на складках K-1
- predict результаты для I-th Poll
- Рассчитайте точность прогноза
Средняя точность

Есть ли у r функция, которая делает складки сам по себе, повторяет настройку/прогнозы модели и дает среднюю точность обратно?

Решение

Да, вы можете сделать все это, используя карету (http://caret.r-forge.r-project.org/training.html) пакет в R. Например,

fitControl <- trainControl(## 10-fold CV
                           method = "repeatedcv",
                           number = 10,
                           ## repeated ten times
                           repeats = 10)

gbmFit1 <- train(Class ~ ., data = training,
                 method = "gbm",
                 trControl = fitControl,
                ## This last option is actually one
                ## for gbm() that passes through
                verbose = FALSE)
gbmFit1

который даст выход

Stochastic Gradient Boosting 

157 samples
 60 predictors
  2 classes: 'M', 'R' 

No pre-processing
Resampling: Cross-Validated (10 fold, repeated 10 times) 

Summary of sample sizes: 142, 142, 140, 142, 142, 141, ... 

Resampling results across tuning parameters:

  interaction.depth  n.trees  Accuracy  Kappa  Accuracy SD  Kappa SD
  1                  50       0.8       0.5    0.1          0.2     
  1                  100      0.8       0.6    0.1          0.2     
  1                  200      0.8       0.6    0.09         0.2     
  2                  50       0.8       0.6    0.1          0.2     
  2                  100      0.8       0.6    0.09         0.2     
  2                  200      0.8       0.6    0.1          0.2     
  3                  50       0.8       0.6    0.09         0.2     
  3                  100      0.8       0.6    0.09         0.2     
  3                  200      0.8       0.6    0.08         0.2     

Tuning parameter 'shrinkage' was held constant at a value of 0.1
Accuracy was used to select the optimal model using  the largest value.
The final values used for the model were n.trees = 150, interaction.depth = 3     
and shrinkage = 0.1.

CARET также предлагает много других вариантов, поэтому должна соответствовать вашим потребностям.

Лицензировано под: CC-BY-SA с атрибуция

Не связан с datascience.stackexchange