wie man aus den Testdaten eine neue Klasse erstellt
Frage
Ich habe eine Liste von Konten als Datensatz und muss mithilfe vieler Funktionen die Konten gruppieren, die auf denselben Benutzer verweisen.
Ich denke darüber nach, maschinelles Lernen zu verwenden (aber ich bin neu in diesem Bereich), da ich die Gruppe jedes Kontos für den Trainingsdatensatz kenne.
ex von Trainingsdaten:
account-id Feature1 Feature2 class(Group)
1 T1 P4 Gr1
2 T2 P4 Gr1
3 T3 P2 Gr2
Das Problem liegt beim Testen von Daten und beim Eintreffen eines neuen Kontos für eine neue Gruppe, die zuvor im Trainingssatz nicht gelernt wurde.
Beispiel der Testdaten:
account-id Feature1 Feature2
4 T5 P5
5 T6 P5
6 T3 P2
Die Gruppen der Testdaten sollten wie folgt sein:
account-id Feature1 Feature2 class(Group)
4 T5 P5 Gr3
5 T6 P5 Gr3
6 T3 P2 Gr2
Die Konten 4 und 5 befinden sich in einer neuen Gruppe (Gr3), die zuvor in den Trainingsdaten nicht gelernt wurde.
Meine Frage ist, wie kann ich die neuen Daten unter einer neuen Klasse gruppieren, die zuvor in der Lernphase nicht definiert wurde?Und mit welchem Algorithmus kann ich dieses Problem lösen?
Lösung
Ich denke, Sie müssen darüber lesen Online lernen, Es bezieht sich auf das Lernen, wenn ständig neue Daten hinzugefügt werden.In diesen Fällen benötigen Sie einen Algorithmus, der sich selbst aktualisieren kann, wenn neue Daten eintreffen (d. h.es muss sich nicht von Grund auf neu berechnen).Mit anderen Worten, schrittweise.
Es gibt inkrementelle Versionen für Support Vector Machines (SVMs) und für neuronale Netze.Außerdem können Bayes'sche Netzwerke inkrementell arbeiten.