我正在尝试实施搬运工算法,但是我很难理解这一点

步骤1C

(*v*) Y -> I                    happy        ->  happi
                                sky          ->  sky

这不是我们想做的相反,为什么算法会将Y转换为I。

对于此处的完整算法 http://tartarus.org/~martin/porterstemmer/def.txt

谢谢

有帮助吗?

解决方案

搬运工和其他 茎算法 不要总是返回单词;他们回来了 单词词干. 。目标是相关单词应具有相同的词干。只要“幸福”,“幸福”和“快乐地”都减少到同一词干,那么您的Stemmer即使词干不是一个真实的词,您的Stemmer也在完成工作。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top