Come posso sostituire i valori anomali con il massimo valore non più lungo?
-
02-11-2019 - |
Domanda
Sto facendo un rilevamento univariato outlier in Python. Quando rilevo i valori anomali per una variabile, so che il valore dovrebbe essere qualunque sia il valore non più esaltato (cioè il massimo se non ci fossero valori anomali).
Come posso imputare questo valore in Python o Sklearn? Immagino di poter rimuovere i valori, ottenere il massimo, sostituire i valori anomali e riportarli indietro. Ma sperando che ci sia già una funzione per questo.
Secondo, è una cattiva idea? Vedo gli altri rimuovere completamente il outlier o sostituire con la media o la mediana. Mi chiedo se il mio approccio è sbagliato.
Nessuna soluzione corretta
Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a datascience.stackexchange