有一个数据挖掘竞赛网站称为 numer.ai.

据推测,网站后面是对冲基金,它利用人们发送的预测。在第100名首位之内的人们不断赚钱,直到揭示下一个数据集并重置竞赛。

我不明白的是,像Kaggle这样的网站避免使用公共和私人排行榜过度适应。私人排行榜仅在比赛结束时才揭示,直到那时才获得奖品。

Numerai说 规则 它使用相同的方法。引用:

如果模特过度贴上公共排行榜,并且在私人排行榜上表现不佳,那么这些用户将受到惩罚,可能会消除所有收益。这劝阻过度拟合。

通过应用“惩罚”是什么意思?我知道有人通过不断播放公共排行榜在该网站上赚钱。这是否意味着,如果他不撤回比特币,他就有失去自己赚钱的危险,以防万一他过于适应?

有帮助吗?

解决方案

我在 评论部分 他们的博客:

公共得分排行榜上列出的收益是潜在的奖金。实际的奖金由私人评分排行榜确定。在撤回时和发布新数据集时,将向您透露您的实际奖金。

许可以下: CC-BY-SA归因
scroll top