Cosa succede quando si hanno le colonne fortemente correlati in un insieme di dati
-
22-10-2019 - |
Domanda
faccio una regression model
. E mi chiedevo che cosa sarebbe la conseguenza se abbiamo due o più colonne Highly correlated
del set di dati? è che qualcosa che può diminuire l'accuratezza del modello?
Rispondere a questa domanda sarebbe aiutare a decidere come trattare con essa. PCA
sarebbe l'opzione migliore qui?
Soluzione
Avendo caratteristiche altamente correlati è un tipo di ridondanza nelle caratteristiche. E sì, effettua un modello di regressione, se si hanno caratteristiche altamente correlati. Un bel spiegazione è data qui .
PCA è una scelta bello quando si tratta di riduzione di dimensionalità.
Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a datascience.stackexchange