Question

Je suis en train de faire un regression model. Et je me demandais ce qui serait la conséquence si nous avons deux ou plusieurs colonnes de Highly correlated dans l'ensemble de données? est que quelque chose qui peut diminuer la précision du modèle? Pour répondre à cette question contribuerait à décider comment traiter avec elle. PCA serait la meilleure option ici?

Était-ce utile?

La solution

ayant des caractéristiques fortement corrélées est un type de redondance dans les dispositifs. Et oui, il effectue un modèle de régression si vous avez des caractéristiques fortement corrélées. Une explication très belle est donnée

scroll top