我知道dbsight允许同义词和停用词进行搜索,但这样做也会处理动词的屈折形式,例如对于'游泳'它应该找到游泳,游泳,游泳,游泳和游泳

DBSight Wiki上的链接: http://wiki.dbsight.com/index。 PHP?标题= User_dictionary

有帮助吗?

解决方案 2

Lucene带有一个名为“Lucene SnowBall stemmer”的干扰器( http://lucene.apache.org/java/2_4_0/api/contrib-snowball/index.html )。事实证明,DBsight将其公开为名为SnowBall的分析器 - [语言] ,例如SnowBall - 英语,SnowBall - 法语等。

其他提示

您正在寻找的行为可以使用词形还原来实现。我不知道现有的Lucene分析仪可以做到这一点。 Basis Tech的Lucene软件包确实是词形还原,但不是免费的,我不知道它是否适用dbsight。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top