Domanda

faccio una regression model. E mi chiedevo che cosa sarebbe la conseguenza se abbiamo due o più colonne Highly correlated del set di dati? è che qualcosa che può diminuire l'accuratezza del modello? Rispondere a questa domanda sarebbe aiutare a decidere come trattare con essa. PCA sarebbe l'opzione migliore qui?

È stato utile?

Soluzione

Avendo caratteristiche altamente correlati è un tipo di ridondanza nelle caratteristiche. E sì, effettua un modello di regressione, se si hanno caratteristiche altamente correlati. Un bel spiegazione è data qui .

PCA è una scelta bello quando si tratta di riduzione di dimensionalità.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
scroll top