Pergunta

Eu gostaria de ter um trending marcas no meu site de acordo com pesquisas feitas usuários. O problema que eu não estou vendo uma solução simples para é como extrair facilmente os termos importantes fora de uma cadeia de pesquisa. Por exemplo, muitos usuários podem procurar por "visual studio" com finalidades diferentes. Por exemplo, "visual studio 2010", "teste de unidade visual studio", "Visual formas estúdio da web componentes". Naqueles 3 pesquisas, "visual studio" está tendendo. Como pode um aviso algoritmo que desde que "visual studio" na maioria dos casos vai ser misturado com muitas outras palavras?

Obrigado!

Foi útil?

Solução

  1. dividir cada consulta de pesquisa em uma matriz de palavras isoladas.
  2. calcular a distância entre as palavras (quanto mais perto, melhor => maior valor)
  3. Adicione esta palavra distância para cada wordpair em todas as consultas.

Os wordpairs com os valores mais elevados são as suas "marcas de tendências".

Outras dicas

Tenha um olhar neste projeto codeplex

http://www.codeplex.com/TheTagCloud

Inclui uma função que você pode passar um arquivo HTML como entrada e irá retornar uma nuvem de tags.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top