Comment trouver les étiquettes de tendance dans une longue chaîne de recherche

StackOverflow https://stackoverflow.com/questions/1631949

  •  06-07-2019
  •  | 
  •  

Question

Je souhaite que les tags de tendances de mon site Web soient en fonction des recherches effectuées par les utilisateurs. Le problème pour lequel je ne vois pas de solution simple est de savoir comment extraire facilement les termes importants d'une chaîne de recherche. Par exemple, de nombreux utilisateurs peuvent rechercher "Visual Studio". à des fins différentes. Par exemple, "Visual Studio 2010", "Test d'unités Visual Studio", "Composants de formulaires Web Visual Studio". Dans ces 3 recherches, "Visual Studio". est tendance. Comment un algorithme peut-il remarquer que depuis "Visual Studio"? dans la plupart des cas sera mélangé avec beaucoup d'autres mots?

Merci!

Était-ce utile?

La solution

  1. divisez chaque requête de recherche en un tableau de mots simples.
  2. calcule la distance entre les mots (le plus proche, le mieux = > la valeur la plus élevée)
  3. ajoutez cette distance de mot pour chaque paire de mots dans toutes les requêtes.

Les paires de mots avec les valeurs les plus élevées sont vos "balises de tendance".

Autres conseils

Découvrez ce projet de codeplex

http://www.codeplex.com/TheTagCloud

Inclut une fonction à laquelle vous pouvez passer un fichier HTML en tant qu'entrée et renverra un nuage de tags.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top