Frage

Was ist der Unterschied in R in Xgboost zwischen Binär: Logistisch und Reg: Logistic? Ist es nur in Bewertungsmetrik?

Wenn ja, wie ist RMSE in der Binärklassifizierung mit der Fehlerrate verglichen? Ist die Beziehung zwischen den Metriken mehr oder weniger monotonisch, sollte die Ausgabe des Einstellens auf eine Metrik zwischen diesen beiden Ansätzen nicht signifikant unterschiedlich sein?

War es hilfreich?

Lösung

Es gibt keinen Unterschied im Algorithmus, sie sind gleich. Wenn Sie verwenden reg:logistic Die Standardbewertungsmetrik ist rmse, aber Sie können diesen Parameter ändern.

Das error rate und die rmse kann abhängig von der Verteilung Ihrer Ausgabe als die unterscheiden, wie die error rate Verwendet ein Limit von 0,5 $, wenn Sie die Ausgangswerte auf 0 $ oder $ 1 $ konzentrieren. Es ist viel kleiner als rmse, Obwohl seine korrelierte Metrik das Modell sehr unterschiedlich sein kann, hängt die Anwendung von Ihrem Problem ab.

Die Bewertung der Leistung logistischer Regressionsmodelle ist üblich, um AUC, Logloss, Genauigkeit, Pseudo-$ r^2 $ und zu berechnen und einige andere.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit datascience.stackexchange
scroll top