comment faire nouvelle classe à partir des données de test
Question
J'ai une liste de comptes comme jeu de données et je dois regrouper les comptes qui font référence au même utilisateur en utilisant de nombreuses fonctions.
Je pense à l'apprentissage de la machine à utiliser (mais je suis nouveau dans ce domaine), parce que je sais que le groupe de chaque compte pour l'ensemble des données de formation.
ex des données de formation:
account-id Feature1 Feature2 class(Group)
1 T1 P4 Gr1
2 T2 P4 Gr1
3 T3 P2 Gr2
Le problème est dans le test des données et lorsqu'un nouveau compte arriver à un nouveau groupe de ne pas appris avant dans l'ensemble de la formation.
ex des données test:
account-id Feature1 Feature2
4 T5 P5
5 T6 P5
6 T3 P2
Les groupes des données d'essai devrait être comme suit:
account-id Feature1 Feature2 class(Group)
4 T5 P5 Gr3
5 T6 P5 Gr3
6 T3 P2 Gr2
Les comptes 4 et 5 sont dans un nouveau groupe (Gr3) qui n'est pas appris avant dans les données de formation.
Ma question est de savoir comment le groupe pourrais-je les nouvelles données dans le cadre d'une nouvelle classe qui ne sont pas définis avant dans la phase d'apprentissage? et quel algorithme puis-je utiliser pour résoudre ce problème?
La solution
Je pense que vous devez lire apprentissage en ligne , il se réfère à l'apprentissage lorsque de nouvelles données constamment ajouté. Dans ces cas, vous avez besoin d'un algorithme qui peut se mettre à jour en tant que de nouvelles données arrivent (à savoir qu'il n'a pas besoin de se recalcule à partir de zéro). En d'autres termes, progressivement .
Il existe des versions supplémentaires pour les machines à vecteurs de support (SVM) et de réseaux de neurones pour. En outre, les réseaux bayésiens peuvent être au travail progressivement.