カスタムの再サンプリング方法を定義する方法

https://datascience.stackexchange.com/questions/717

16-10-2019
|

質問

私は実験設計を使用して、さまざまな分類方法の堅牢性をテストしていますが、今ではそのような設計の正しい定義を探しています。

いくつかのサンプルを削減することにより、完全なデータセットのさまざまなサブセットを作成しています。各サブセットは、他のサブセットに関して独立して作成されます。次に、各サブセットで各分類方法を実行します。最後に、各メソッドの精度は、完全なデータセットの分類と一致しているサブセット上の分類の数として推定します。例えば：

Classification-full     1    2    3    2    1    1    2

Classification-subset1  1    2         2    3    1   
Classification-subset2       2    3         1    1    2
...

Accuracy                1    1    1    1  0.5    1    1

この方法論に正しい名前はありますか？私はそれが下がる可能性があると思ったブートストラップしかし、これについてはわかりません。

解決

ランダムサブサンプリングは適切と思われますが、ブートストラップはもう少し一般的ですが、正しいです。

ここにいくつかの参照と同義語があります： http://www.frank-dieterle.com/phd/2_4_3.html

ライセンス： CC-BY-SA と帰属

所属していません datascience.stackexchange