Comment trouver les étiquettes de tendance dans une longue chaîne de recherche
Question
Je souhaite que les tags de tendances de mon site Web soient en fonction des recherches effectuées par les utilisateurs. Le problème pour lequel je ne vois pas de solution simple est de savoir comment extraire facilement les termes importants d'une chaîne de recherche. Par exemple, de nombreux utilisateurs peuvent rechercher "Visual Studio". à des fins différentes. Par exemple, "Visual Studio 2010", "Test d'unités Visual Studio", "Composants de formulaires Web Visual Studio". Dans ces 3 recherches, "Visual Studio". est tendance. Comment un algorithme peut-il remarquer que depuis "Visual Studio"? dans la plupart des cas sera mélangé avec beaucoup d'autres mots?
Merci!
La solution
- divisez chaque requête de recherche en un tableau de mots simples.
- calcule la distance entre les mots (le plus proche, le mieux = > la valeur la plus élevée)
- ajoutez cette distance de mot pour chaque paire de mots dans toutes les requêtes.
Les paires de mots avec les valeurs les plus élevées sont vos "balises de tendance".
Autres conseils
Découvrez ce projet de codeplex
http://www.codeplex.com/TheTagCloud
Inclut une fonction à laquelle vous pouvez passer un fichier HTML en tant qu'entrée et renverra un nuage de tags.