什么lucene分析仪可用于处理日文文本？

https://stackoverflow.com/questions/1625000

06-07-2019
|

题

哪种lucene分析仪可以用来正确处理日文？它应该能够处理汉字，平假名，片假名，罗马字及其任何组合。

解决方案

我在搜索自己的目的时找到了 lucene-gosen ：

他们的例子看起来相当不错，但我想这是需要进行大量测试的事情。我也担心他们的向后兼容性政策（或者说完全缺乏一个。）

其他提示

您应该查看 CJK 包位于Lucene的贡献区域。有一个分析器和一个标记器，专门用于处理中文，日文和韩文。

许可以下： CC-BY-SA 和归因

不隶属于 StackOverflow