Frage

Ich habe eine Liste von Konten als Datensatz und muss mithilfe vieler Funktionen die Konten gruppieren, die auf denselben Benutzer verweisen.

Ich denke darüber nach, maschinelles Lernen zu verwenden (aber ich bin neu in diesem Bereich), da ich die Gruppe jedes Kontos für den Trainingsdatensatz kenne.
ex von Trainingsdaten:

account-id   Feature1    Feature2    class(Group)
1            T1          P4          Gr1
2            T2          P4          Gr1
3            T3          P2          Gr2

Das Problem liegt beim Testen von Daten und beim Eintreffen eines neuen Kontos für eine neue Gruppe, die zuvor im Trainingssatz nicht gelernt wurde.
Beispiel der Testdaten:

account-id   Feature1   Feature2
4             T5         P5
5             T6         P5
6             T3         P2

Die Gruppen der Testdaten sollten wie folgt sein:

account-id   Feature1   Feature2   class(Group)
4             T5         P5         Gr3
5             T6         P5         Gr3
6             T3         P2         Gr2

Die Konten 4 und 5 befinden sich in einer neuen Gruppe (Gr3), die zuvor in den Trainingsdaten nicht gelernt wurde.

Meine Frage ist, wie kann ich die neuen Daten unter einer neuen Klasse gruppieren, die zuvor in der Lernphase nicht definiert wurde?Und mit welchem ​​Algorithmus kann ich dieses Problem lösen?

War es hilfreich?

Lösung

Ich denke, Sie müssen darüber lesen Online lernen, Es bezieht sich auf das Lernen, wenn ständig neue Daten hinzugefügt werden.In diesen Fällen benötigen Sie einen Algorithmus, der sich selbst aktualisieren kann, wenn neue Daten eintreffen (d. h.es muss sich nicht von Grund auf neu berechnen).Mit anderen Worten, schrittweise.

Es gibt inkrementelle Versionen für Support Vector Machines (SVMs) und für neuronale Netze.Außerdem können Bayes'sche Netzwerke inkrementell arbeiten.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit datascience.stackexchange
scroll top