Bootstrap ou division de données de division au hasard pour réduire la variance?
-
31-10-2019 - |
Question
Si j'ai 10 000 échantillons de formation, que dois-je faire:
Bootstrap et former 10 classificateurs dessus, puis agréger
Ou
Divisez au hasard l'ensemble de données en 10 parties et entraînez 10 classificateurs sur eux, puis en agrégeant. Lequel sera le meilleur?
La 2ème méthode réduira-t-elle la variance et sera-t-elle meilleure que la 1ère méthode
Pas de solution correcte
Licencié sous: CC-BY-SA avec attribution
Non affilié à datascience.stackexchange