Qu'est-ce qui se passe quand vous avez des colonnes dans un très corrélées ensemble de données
-
22-10-2019 - |
Question
Je suis en train de faire un regression model
. Et je me demandais ce qui serait la conséquence si nous avons deux ou plusieurs colonnes de Highly correlated
dans l'ensemble de données? est que quelque chose qui peut diminuer la précision du modèle?
Pour répondre à cette question contribuerait à décider comment traiter avec elle. PCA
serait la meilleure option ici?
La solution
ayant des caractéristiques fortement corrélées est un type de redondance dans les dispositifs. Et oui, il effectue un modèle de régression si vous avez des caractéristiques fortement corrélées. Une explication très belle est donnée
Licencié sous: CC-BY-SA avec attribution
Non affilié à datascience.stackexchange