Como faço para adaptar meu mecanismo de recomendação ao frio?

https://stackoverflow.com/questions/1992508

22-09-2019
|

Pergunta

Estou curioso para saber quais são os métodos / abordagens para superar o problema de "início do frio", onde quando um novo usuário ou um item entra no sistema, devido à falta de informações sobre essa nova entidade, fazer recomendação é um problema.

Posso pensar em fazer alguma recomendação baseada em previsão (como gênero, nacionalidade e assim por diante).

Solução

Talvez haja momentos em que você simplesmente não deve fazer uma recomendação? "Dados insuficientes" devem se qualificar como um desses tempos.

Só não vejo como as recomendações de previsão com base em "gênero, nacionalidade e assim por diante" equivalem a mais do que estereótipos.

IIRC, lugares como a Amazon criaram seus bancos de dados por um tempo antes de lançar recomendações. Não é o tipo de coisa que você quer errar; Existem muitas histórias por aí sobre recomendações inadequadas com base em dados insuficientes.

Outras dicas

Você pode iniciar um sistema de recomendação a frio.

Existem dois tipos de sistemas de recomendação; filtragem colaborativa e baseada em conteúdo. Os sistemas baseados em conteúdo usam meta -dados sobre as coisas que você recomenda. A questão é então o que os meta -dados são importantes? A segunda abordagem é a filtragem colaborativa que não se importa com os meta -dados, apenas usa o que as pessoas fizeram ou disseram sobre um item para fazer uma recomendação. Com a filtragem colaborativa, você não precisa se preocupar com quais termos nos meta -dados são importantes. Na verdade, você não precisa de meta -dados para fazer a recomendação. O problema com a filtragem colaborativa é que você precisa de dados. Antes de ter dados suficientes, você pode usar recomendações baseadas em conteúdo. Você pode fornecer recomendações baseadas nos dois métodos e, no início, possui 100% baseado em conteúdo e, à medida que você obtém mais dados, comece a misturar na filtragem colaborativa baseada em filtragem. Esse é o método que usei no passado.

Outra técnica comum é tratar a parte baseada em conteúdo como um problema de pesquisa simples. Você acabou de colocar os meta -dados como o texto ou o corpo do seu documento e depois indexar seus documentos. Você pode fazer isso com o Lucene & Solr sem escrever nenhum código.

Se você quiser saber como funciona a filtragem colaborativa básica, confira o Capítulo 2 de "Programação Collective Intelligence", de Toby Segaran

Trabalhando nesse problema, mas este artigo da Microsoft em Boltzmann Machines parece valer a pena: http://research.microsoft.com/pubs/81783/gunawardana09__unified_approac_build_hybrid_recom_system.pdf

Isso já foi perguntado várias vezes antes (naturalmente, não consigo encontrar essas perguntas agora:/, mas a conclusão geral era melhor evitar essas recomendações. Em várias partes dos mesmos nomes, os mesmos nomes pertencem a diferentes sexos, e assim por diante ...

As recomendações com base em "usuários semelhantes gostaram ..." claramente devem esperar. Você pode fornecer cupons ou outros incentivos para pesquisar os entrevistados se estiver absolutamente comprometido em fazer previsões com base na similaridade do usuário.

Existem outras duas maneiras de iniciar frio um mecanismo de recomendação.

Construa você mesmo.
Faça com que seus fornecedores preencham informações importantes em um modelo de esqueleto. (Também pode exigir $ incentivos.)

Muitas armadilhas em potencial em tudo isso, que são senso comum demais para mencionar.

Como você pode esperar, não há almoço grátis aqui. Mas pense desta maneira: os motores de recomendação não são um plano de negócios. Eles apenas aprimoram o plano de negócios.

Há três coisas necessárias para resolver o problema de início frio:

Os dados devem ter sido perfilados de modo que você tenha muitos recursos diferentes (com dados do produto, o termo usado para 'recurso' geralmente é 'facetas de classificação'). Se você não perfil adequadamente os dados do perfil, pois eles vieram pela porta, seu mecanismo de recomendação permanecerá 'frio', pois não tem nada com o qual classificar as recomendações.
Mais importante: você precisa de um loop de alimentação de uso com o qual os usuários podem revisar as recomendações as sugestões do mecanismo de personalização. Por exemplo, o botão sim/não para 'essa sugestão foi útil?' deve fila uma revisão dos participantes de um conjunto de dados de treinamento (ou seja, o conjunto de dados de treinamento 'Recomendar') para outro conjunto de dados de treinamento (ou seja, não recomenda o conjunto de dados de treinamento).
O modelo usado para (recomendar/não recomendar) sugestões nunca deve ser considerado uma recomendação de tamanho único. Além de classificar o produto ou serviço para sugerir a um cliente, como a empresa também classifica cada cliente específico. Se funcionar corretamente, deve -se esperar que os clientes com recursos diferentes obtenham sugestões diferentes para (recomendar/não recomendar) em uma determinada situação. Isso faria a parte de 'personalização' dos motores de personalização.

Licenciado em: CC-BY-SA com atribuição

Não afiliado a StackOverflow