什么lucene分析仪可用于处理日文文本?
-
06-07-2019 - |
题
哪种lucene分析仪可以用来正确处理日文?它应该能够处理汉字,平假名,片假名,罗马字及其任何组合。
解决方案
我在搜索自己的目的时找到了 lucene-gosen :
他们的例子看起来相当不错,但我想这是需要进行大量测试的事情。我也担心他们的向后兼容性政策(或者说完全缺乏一个。)
其他提示
您应该查看 CJK 包位于Lucene的贡献区域。有一个分析器和一个标记器,专门用于处理中文,日文和韩文。
不隶属于 StackOverflow