Domanda

Sto facendo un rilevamento univariato outlier in Python. Quando rilevo i valori anomali per una variabile, so che il valore dovrebbe essere qualunque sia il valore non più esaltato (cioè il massimo se non ci fossero valori anomali).

Come posso imputare questo valore in Python o Sklearn? Immagino di poter rimuovere i valori, ottenere il massimo, sostituire i valori anomali e riportarli indietro. Ma sperando che ci sia già una funzione per questo.

Secondo, è una cattiva idea? Vedo gli altri rimuovere completamente il outlier o sostituire con la media o la mediana. Mi chiedo se il mio approccio è sbagliato.

Nessuna soluzione corretta

Autorizzato sotto: CC-BY-SA insieme a attribuzione
scroll top