Вопрос

Я бы хотел, чтобы на моем веб-сайте были теги с трендами в соответствии с результатами поиска, выполненного пользователями. Проблема, которую я не вижу в простом решении, состоит в том, как легко извлечь важные термины из строки поиска. Например, многие пользователи могут искать «визуальную студию» с разными целями. Например, «визуальная студия 2010», «визуальное тестирование студийного модуля», «компоненты веб-форм Visual Studio». В этих 3 поисках "визуальная студия" в тренде. Как алгоритм может заметить, что, поскольку " visual studio " в большинстве случаев будет смешиваться со многими другими словами?

Спасибо!

Это было полезно?

Решение

<Ол>
  • разбить каждый поисковый запрос на массив из отдельных слов.
  • вычислить расстояние между словами (чем ближе, тем лучше = > чем выше значение)
  • добавьте это расстояние для каждой пары слов во всех запросах.
  • Пары слов с более высокими значениями являются вашими "трендовыми тегами".

    Другие советы

    Посмотрите на этот проект codeplex

    http://www.codeplex.com/TheTagCloud

    Включает функцию, в которую вы можете передавать html-файл в качестве входных данных и возвращать облако тегов.

    Лицензировано под: CC-BY-SA с атрибуция
    Не связан с StackOverflow
    scroll top