Domanda

Ho una lista di account come set di dati e ho bisogno di raggruppare i conti che fanno riferimento allo stesso utente con molte caratteristiche.

Sto pensando ad imparare l'uso della macchina (ma io sono nuovo in questo settore), perché so che il gruppo di ogni considerazione per il set di dati di training.
ex dei dati di allenamento:

account-id   Feature1    Feature2    class(Group)
1            T1          P4          Gr1
2            T2          P4          Gr1
3            T3          P2          Gr2

Il problema è nella sperimentazione dei dati e quando un nuovo account arrivano per un nuovo gruppo non ha imparato prima che nel training set.
ex di dati sulla sperimentazione:

account-id   Feature1   Feature2
4             T5         P5
5             T6         P5
6             T3         P2

I gruppi di dati di test deve essere il seguente:

account-id   Feature1   Feature2   class(Group)
4             T5         P5         Gr3
5             T6         P5         Gr3
6             T3         P2         Gr2

I conti 4 e 5 si trovano in un nuovo gruppo (Gr3), che non si impara prima nei dati di addestramento.

La mia domanda è come potrebbe gruppo I nuovi dati sotto una nuova classe che non è definito prima nella fase di apprendimento? e quale algoritmo posso usare per risolvere questo problema?

È stato utile?

Soluzione

Credo che hai bisogno di leggere su in linea di apprendimento , si riferisce ad imparare quando nuovi dati è costantemente aggiunto. In questi casi è necessario un algoritmo in grado di aggiornare se stesso come arrivano nuovi dati (vale a dire che non ha bisogno di ricalcolare stessa da zero). In altre parole, in modo incrementale .

Ci sono versioni incrementali per support vector machines (SVM) e per le reti neurali. Inoltre, le reti Bayesiane può essere fatto per il lavoro in modo incrementale.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
scroll top