Frage

Es gibt eine Data Mining -Wettbewerbswebsite mit dem Namen Numer.ai.

Vermutlich befindet sich hinter der Website ein Hedgefonds, der die Vorhersagen nutzt, die die Leute senden. Menschen an den 100. Top -Orten verdienen kontinuierlich Geld, bis der nächste Datensatz enthüllt und der Wettbewerb zurückgesetzt wird.

Was ich nicht verstehe ist, dass Websites wie Kaggle eine Überanpassung durch eine Öffentlichkeit und eine private Rangliste vermeiden. Die private Rangliste wird erst am Ende des Wettbewerbs enthüllt und nur dann Preise vergeben.

Numera sagt unter Regeln dass es den gleichen Ansatz verwendet. Zitieren:

Wenn Modelle die öffentliche Rangliste überwinden und in der privaten Rangliste schlecht abschneiden, unterliegen diese Benutzer, die möglicherweise alle Gewinne auszuradieren. Dies entmutigt die Überanpassung.

Was meinen sie mit "Strafen" an, die angewendet werden? Ich kenne jemanden, der auf dieser Website Geld verdient, indem er ständig die öffentliche Rangliste spielt. Bedeutet dies, dass er, wenn er seinen Bitcoin nicht zurückzieht, in Gefahr ist, das zu verlieren, was er verdient hat, falls er überpassend ist?

War es hilfreich?

Lösung

Ich fand die Antwort in der Kommentarbereich ihres Blogs:

Das in der öffentliche Rangliste aufgeführte Einkommen ist potenzielle Gewinne. Die tatsächlichen Gewinne werden durch die Rangliste der Privatstoffe festgelegt. Zum Zeitpunkt des Rückzugs und wenn neue Datensätze veröffentlicht werden, werden Ihnen Ihre tatsächlichen Gewinne bekannt gegeben.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit datascience.stackexchange
scroll top