Précision du train vs précision de test vs matrice de confusion

https://datascience.stackexchange.com/questions/28426

31-10-2019
|

Question

Après avoir développé mon modèle prédictif en utilisant une forêt aléatoire, j'obtiens les mesures suivantes:

        Train Accuracy ::  0.9764634601043997
        Test Accuracy  ::  0.7933284397683713
         Confusion matrix  [[28292  1474]
                            [ 6128   889]]

Ce sont les résultats de ce code:

  training_features, test_features, training_target, test_target, = train_test_split(df.drop(['bad_loans'], axis=1),
                                                  df['target'],
                                                  test_size = .3,
                                                  random_state=12)
clf = RandomForestClassifier()
trained_model = clf.fit(training_features, training_target)
trained_model.fit(training_features, training_target)
predictions = trained_model.predict(test_features)      

Train Accuracy: accuracy_score(training_target, trained_model.predict(training_features))
Test Accuracy: accuracy_score(test_target, predictions)
Confusion Matrix: confusion_matrix(test_target, predictions)

Cependant, je suis un peu confus pour interpréter et expliquer ces valeurs.

Qu'est-ce que ces 3 mesures me disent exactement sur mon modèle?

Merci!

Pas de solution correcte

Licencié sous: CC-BY-SA avec attribution

Non affilié à datascience.stackexchange