哪种lucene分析仪可以用来正确处理日文?它应该能够处理汉字,平假名,片假名,罗马字及其任何组合。

有帮助吗?

解决方案

我在搜索自己的目的时找到了 lucene-gosen

他们的例子看起来相当不错,但我想这是需要进行大量测试的事情。我也担心他们的向后兼容性政策(或者说完全缺乏一个。)

其他提示

您应该查看 CJK 包位于Lucene的贡献区域。有一个分析器和一个标记器,专门用于处理中文,日文和韩文。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top