Précision du train vs précision de test vs matrice de confusion
-
31-10-2019 - |
Question
Après avoir développé mon modèle prédictif en utilisant une forêt aléatoire, j'obtiens les mesures suivantes:
Train Accuracy :: 0.9764634601043997
Test Accuracy :: 0.7933284397683713
Confusion matrix [[28292 1474]
[ 6128 889]]
Ce sont les résultats de ce code:
training_features, test_features, training_target, test_target, = train_test_split(df.drop(['bad_loans'], axis=1),
df['target'],
test_size = .3,
random_state=12)
clf = RandomForestClassifier()
trained_model = clf.fit(training_features, training_target)
trained_model.fit(training_features, training_target)
predictions = trained_model.predict(test_features)
Train Accuracy: accuracy_score(training_target, trained_model.predict(training_features))
Test Accuracy: accuracy_score(test_target, predictions)
Confusion Matrix: confusion_matrix(test_target, predictions)
Cependant, je suis un peu confus pour interpréter et expliquer ces valeurs.
Qu'est-ce que ces 3 mesures me disent exactement sur mon modèle?
Merci!
Pas de solution correcte
Licencié sous: CC-BY-SA avec attribution
Non affilié à datascience.stackexchange