Pregunta

Tengo una lista de cuentas como conjunto de datos y necesito agrupar las cuentas que se refieren al mismo usuario utilizando muchas funciones.

Estoy pensando en usar el aprendizaje automático (pero soy nuevo en este dominio), porque conozco el grupo de cada cuenta para el conjunto de datos de capacitación.
Ej de datos de capacitación:

account-id   Feature1    Feature2    class(Group)
1            T1          P4          Gr1
2            T2          P4          Gr1
3            T3          P2          Gr2

El problema está en la prueba de datos y cuando una nueva cuenta llega a un nuevo grupo que no se aprendió antes en el conjunto de capacitación.
Ej de datos de prueba:

account-id   Feature1   Feature2
4             T5         P5
5             T6         P5
6             T3         P2

Los grupos de los datos de prueba deben ser los siguientes:

account-id   Feature1   Feature2   class(Group)
4             T5         P5         Gr3
5             T6         P5         Gr3
6             T3         P2         Gr2

Las cuentas 4 y 5 están en un nuevo grupo (GR3) que no se aprende antes en los datos de capacitación.

Mi pregunta es ¿cómo podría agrupar los nuevos datos bajo una nueva clase que no se define antes en la fase de aprendizaje? ¿Y qué algoritmo puedo usar para resolver este problema?

¿Fue útil?

Solución

Creo que necesitas leer sobre Aprender en línea, se refiere al aprendizaje cuando se agregan constantemente nuevos datos. En estos casos, necesita un algoritmo que pueda actualizarse a medida que llegan los nuevos datos (es decir, no necesita recalcularse desde cero). En otras palabras, incrementalmente.

Existen versiones incrementales para las máquinas de vectores de soporte (SVM) y para las redes neuronales. Además, se pueden hacer que las redes bayesianas funcionen de forma incremental.

Licenciado bajo: CC-BY-SA con atribución
scroll top