Как определить пользовательскую методологию повторной выборки

https://datascience.stackexchange.com/questions/717

16-10-2019
|

Вопрос

Я использую экспериментальный дизайн для проверки надежности различных методов классификации, и теперь я ищу правильное определение такой дизайна.

Я создаю различные подмножества полного набора данных, отрезав несколько образцов. Каждое подмножество создается независимо относительно других. Затем я запускаю каждый метод классификации в каждом подмножестве. Наконец, я оцениваю точность каждого метода как сколько классификаций на подмножествах согласуется с классификацией на полном наборе данных. Например:

Classification-full     1    2    3    2    1    1    2

Classification-subset1  1    2         2    3    1   
Classification-subset2       2    3         1    1    2
...

Accuracy                1    1    1    1  0.5    1    1

Есть ли правильное имя для этой методологии? Я думал, что это может оказаться под начальная загрузка Но я не уверен в этом.

Решение

Случайная субботняя диплома кажется подходящей, начальная загрузка является немного более общей, но также правильной.

Вот некоторые ссылки и синонимы: http://www.frank-dieterle.com/phd/2_4_3.html

Лицензировано под: CC-BY-SA с атрибуция

Не связан с datascience.stackexchange