根据用户的搜索结果,我希望在我的网站上有一个趋势标签。我没有看到一个简单的解决方案的问题是如何轻松地从搜索字符串中提取重要的术语。例如,许多用户可能会搜索“视觉工作室”。用途不同。例如,“visual studio 2010”,“visual studio unit testing”,“visual studio web forms components”。在这3次搜索中,“视觉工作室”指的是“视觉工作室”。趋势。算法怎么能注意到,因为“视觉工作室”在大多数情况下会与其他许多词混在一起?

谢谢!

有帮助吗?

解决方案

  1. 将每个搜索查询拆分为单个单词数组。
  2. 计算单词之间的距离(更近,更好=>更高的值)
  3. 在所有查询中为每个wordpair添加此单词距离。
  4. 值较高的wordpairs是您的“趋势标记”。

其他提示

看看这个codeplex项目

http://www.codeplex.com/TheTagCloud

包含一个可以将html文件作为输入传递并返回标签云的函数。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top