¿Cómo adapto mi motor de recomendación a arranques en frío?

https://stackoverflow.com/questions/1992508

22-09-2019
|

Pregunta

Tengo curiosidad por saber cuáles son los métodos/enfoques para superar el problema del "arranque en frío" en el que cuando un nuevo usuario o un elemento ingresa al sistema, debido a la falta de información sobre esta nueva entidad, hacer recomendaciones es un problema.

Se me ocurre hacer alguna recomendación basada en predicciones (como género, nacionalidad, etc.).

Solución

Tal vez hay veces que simplemente no debe hacer una recomendación? "Datos insuficientes" debe calificar como uno de esos momentos.

Yo simplemente no ver cómo las recomendaciones de predicción en base a "género, nacionalidad y así sucesivamente" ascenderán a más de estereotipos.

IIRC, lugares como Amazon construyó sus bases de datos por un tiempo antes de implementar las recomendaciones. No es el tipo de cosa que usted quiere conseguir equivocado; hay un montón de historias que hay sobre recomendaciones inadecuadas basadas en datos insuficientes.

Otros consejos

Puede iniciar en frío un sistema de recomendación.

Hay dos tipos de sistemas de recomendación;Filtrado colaborativo y basado en contenidos.Los sistemas basados en contenido utilizan metadatos sobre las cosas que recomiendas.La pregunta es entonces ¿qué metadatos son importantes?El segundo enfoque es el filtrado colaborativo al que no le importan los metadatos, simplemente utiliza lo que la gente hizo o dijo sobre un elemento para hacer una recomendación.Con el filtrado colaborativo no tiene que preocuparse por qué términos de los metadatos son importantes.De hecho, no necesita ningún metadato para hacer la recomendación.El problema con el filtrado colaborativo es que necesitas datos.Antes de tener suficientes datos, puede utilizar recomendaciones basadas en contenido.Puede proporcionar recomendaciones que se basen en ambos métodos y, al principio, estar 100% basadas en el contenido y luego, a medida que obtenga más datos, comenzar a mezclarlos en un filtrado colaborativo.Ese es el método que he usado en el pasado.

Otra técnica común es tratar la parte basada en contenido como un simple problema de búsqueda.Simplemente ingresa metadatos como texto o cuerpo de su documento y luego indexa sus documentos.Puedes hacer esto con Lucene y Solr sin escribir ningún código.

Si desea saber cómo funciona el filtrado colaborativo básico, consulte el Capítulo 2 de "Programación de la inteligencia colectiva" de Toby Segaran.

Trabajo sobre este problema por mí mismo, pero este artículo de Microsoft en las máquinas de Boltzmann parece que vale la pena: http : //research.microsoft.com/pubs/81783/gunawardana09__unified_approac_build_hybrid_recom_system.pdf

Esto ha sido preguntó varias veces antes (naturalmente, no puedo encontrar esas preguntas ahora: /, pero la conclusión general fue que es mejor evitar este tipo de recomendaciones en varias partes de la worls mismos nombres pertenecen a diferentes sexos, y así sucesivamente. ...

Las recomendaciones basadas en "usuarios similares le gusta ..." claramente debe esperar. Se puede dar cupones u otros incentivos a los encuestados si está absolutamente comprometido a hacer predicciones basándose en la similitud de usuario.

Hay otras dos maneras de arranque en frío un motor de recomendación.

Construir un modelo de sí mismo.
Haga que sus proveedores para rellenar la información clave para un modelo de esqueleto. (También se puede requerir $ incentivos.)

Muchos de los peligros potenciales en todos ellos, que son demasiado sentido común de mención.

Como era de esperar, no hay almuerzo gratis aquí. Pero pensar en ello de esta manera: los motores de recomendación no son un plan de negocios. Se limitan a mejorar el plan de negocios.

Hay tres cosas que se necesitan para hacer frente al problema de arranque en frío:

Los datos debe haber sido perfilado de tal manera que usted tiene muchas características diferentes (con los datos del producto el término usado para 'característica' es a menudo '' facetas de clasificación). Si no perfilar adecuadamente los datos, ya que viene en la puerta, su motor de recomendación permanecerá 'frío', ya que no tiene nada con que para clasificar las recomendaciones.
Lo más importante: Es necesario un bucle de realimentación de usuario con la que los usuarios pueden revisar las recomendaciones sugerencias del motor de personalización. Por ejemplo, sí / no botón por 'era esta sugerencia de ayuda?' debe Cola una revisión de los participantes en una formación de datos (es decir, el 'Recomendar' formación de datos) a otro conjunto de datos de entrenamiento (es decir, no recomendamos formación de datos).
El modelo utilizado para (Recomendar / no recomendamos) sugerencias no deben ser considerados como una talla única para todos recomendación. Además de clasificar el producto o servicio para sugerir a un cliente, cómo los clasifica firmes cada cliente específico también importa. Si funciona correctamente, se debe esperar que los clientes con diferentes características obtendrán diferentes sugerencias para (recomendado / No recomiendo) en una situación dada. Eso haría la parte 'personalización' de los motores de personalización.

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow