Как найти тренды в длинной строке поиска
Вопрос
Я бы хотел, чтобы на моем веб-сайте были теги с трендами в соответствии с результатами поиска, выполненного пользователями. Проблема, которую я не вижу в простом решении, состоит в том, как легко извлечь важные термины из строки поиска. Например, многие пользователи могут искать «визуальную студию» с разными целями. Например, «визуальная студия 2010», «визуальное тестирование студийного модуля», «компоненты веб-форм Visual Studio». В этих 3 поисках "визуальная студия" в тренде. Как алгоритм может заметить, что, поскольку " visual studio " в большинстве случаев будет смешиваться со многими другими словами?
Спасибо!
Решение
Пары слов с более высокими значениями являются вашими "трендовыми тегами".
Другие советы
Посмотрите на этот проект codeplex
http://www.codeplex.com/TheTagCloud
Включает функцию, в которую вы можете передавать html-файл в качестве входных данных и возвращать облако тегов.