Comment puis-je adapter mon moteur de recommandation pour les démarrages à froid?

https://stackoverflow.com/questions/1992508

22-09-2019
|

Question

Je suis curieux de savoir quelles sont les méthodes / approches pour surmonter le problème « démarrage à froid » où lorsqu'un nouvel utilisateur ou un élément entre dans le système, en raison du manque d'informations sur cette nouvelle entité, la recommandation faisant est un problème.

Je peux penser à faire une recommandation basée sur la prévision (comme le sexe, la nationalité, etc.).

La solution

Peut-être il y a des moments que vous ne devriez pas simplement faire une recommandation? « Données insuffisantes » devraient se qualifier comme l'un de ces temps.

Je ne vois pas comment les recommandations de prédiction fondées sur « le sexe, la nationalité et ainsi de suite » totaliseront plus de stéréotypes.

IIRC, des endroits comme Amazon construit leurs bases de données pendant un certain temps avant de déployer des recommandations. Ce n'est pas le genre de chose que vous voulez vous méprenez pas; il y a beaucoup d'histoires là-bas sur les recommandations inappropriées fondées sur des données insuffisantes.

Autres conseils

Vous pouvez démarrer à froid un système de recommandation.

Il existe deux types de systèmes de recommandation; filtrage collaboratif et basé sur le contenu. Les systèmes à base de contenu utilisent des méta-données sur les choses que vous recommandez. La question est alors ce méta-données est important? La deuxième approche est le filtrage collaboratif qui ne se soucie pas des méta-données, il utilise juste ce que les gens ont fait ou dit au sujet d'un point de faire une recommandation. Avec le filtrage collaboratif vous n'avez pas à vous soucier de ce que les termes dans les méta-données sont importantes. En fait, vous ne avez pas besoin de méta-données pour faire la recommandation. Le problème avec le filtrage collaboratif est que vous avez besoin de données. Avant que vous avez suffisamment de données, vous pouvez utiliser des recommandations basées sur le contenu. Vous pouvez fournir des recommandations fondées sur les méthodes, et au début ont 100% à base de contenu, alors que vous obtenez plus de données commencent à se mélanger dans le filtrage collaboratif basé. Telle est la méthode que je l'ai utilisé dans le passé.

Une autre technique courante consiste à traiter la partie basée sur le contenu comme un problème de recherche. Vous venez de mettre dans les méta-données comme le texte ou le corps de votre document puis indexer vos documents. Vous pouvez le faire avec Lucene et Solr sans écrire de code.

Si vous voulez savoir comment fonctionne le filtrage collaboratif de base, consultez le chapitre 2 du « Programmation intelligence collective » par Toby Segaran

Travailler sur ce problème moi-même, mais cet article de Microsoft sur des machines de Boltzmann semble utile: http : //research.microsoft.com/pubs/81783/gunawardana09__unified_approac_build_hybrid_recom_system.pdf

Il a été demandé à plusieurs reprises avant (naturellement, je ne trouve pas ces questions maintenant: /, mais la conclusion générale était il est préférable d'éviter de telles recommandations dans différentes parties des worls mêmes noms appartiennent à différents sexes, et ainsi de suite. ...

Recommandations fondées sur des « utilisateurs similaires aimé ... » doit clairement attendre. Vous pouvez donner des coupons ou d'autres incitatifs pour les répondants au sondage si vous êtes absolument à faire des prédictions basé sur la similarité des utilisateurs.

Il existe deux autres façons de démarrage à froid d'un moteur de recommandation.

Construire un modèle vous-même.
Obtenir vos fournisseurs pour remplir les informations clés à un modèle de squelette. (Peut également exiger des incitations $.)

Beaucoup de pièges potentiels dans tous ces, qui sont trop bon sens pour parler.

Comme on pouvait s'y attendre, il n'y a pas de repas gratuit ici. Mais pensez-y de cette façon: les moteurs de recommandation ne sont pas un plan d'affaires. Ils améliorent simplement le plan d'affaires.

Il y a trois choses nécessaires pour résoudre le problème de démarrage à froid:

Les données doivent avoir été profilée de telle sorte que vous avez de nombreuses caractéristiques différentes (avec des données produit le terme utilisé pour « caractéristique » est souvent « facettes de classification »). Si vous ne le faites pas correctement les données de profil comme il vient dans la porte, votre moteur de recommandation reste « froid » car il n'a rien qui servent à classer les recommandations.
LE PLUS IMPORTANT: Vous avez besoin d'une boucle de rétroaction d'utilisateur avec lequel les utilisateurs peuvent passer en revue les recommandations des suggestions du moteur de personnalisation. Par exemple, Oui / Non bouton « Cette suggestion était utile? » devrait la file d'attente un examen des participants dans un jeu de données de formation (à savoir le jeu de données de formation « Recommander ») à un autre ensemble de données de formation (à savoir ne recommandons pas de formation ensemble de données).
Le modèle utilisé pour (Recommander / NE PAS Recommander) suggestions ne doit jamais être considéré comme un one-size-fits-all recommandation. En plus de classer le produit ou service à proposer à un client, comment l'entreprise classe compte chaque client spécifique aussi. Si fonctionne correctement, il faut attendre que les clients avec des caractéristiques différentes auront différentes suggestions pour (Recommander / NE PAS Recommander) dans une situation donnée. Ce serait la partie 'personnalisation' des moteurs de personnalisation.

Licencié sous: CC-BY-SA avec attribution

Non affilié à StackOverflow