Какой лучше & # 8220; под ключ & # 8221; Алгоритм [закрыто]

StackOverflow https://stackoverflow.com/questions/226485

  •  03-07-2019
  •  | 
  •  

Вопрос

Мне нужен хороший алгоритм для проекта, над которым я работаю. Было предложено посмотреть на Портера Стеммера. Когда я проверил страницу на портере «Портер», то обнаружил, что она устарела в пользу «Снежка». парадигматический.

Мне нужен хороший стеммер, но я не могу тратить значительное время на реализацию (или оптимизацию) своего собственного. Каков наилучший «готовый» свободно распространяемый стеммер? Есть ли несвободные стеммеры по доступной цене? Или лучше всего делать ставку на Snowball?

Это было полезно?

Решение

Porter2 - это тот, с кем я решил пойти. Казалось, что портер-стеммер был стандартом, но когда я нашел страницу автора, он порекомендовал «Снежок (Porter2)». парадигматический. На этой странице есть ссылка на порт C.

Другие советы

Это действительно зависит от того, как вы планируете его применять. Набор инструментов для естественного языка ( http://nltk.sourceforge.net ) имеет ряд реализованных инструментов, которые должен быть в состоянии справиться с большинством приложений. Я предпочитаю Морфи стеммер.

Конечно, он доступен в Python, поэтому, если вы работаете с другим языком, вы всегда можете просмотреть код, чтобы подобрать алгоритм и перенести его на свой язык. Python хорошо читается.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top