문제

는 루씬 분석기를 처리하기 위해 사용될 수있 일본어 텍스트를 제대로?그것은 처리할 수 있어야 한자,히라가나,로마,그리고 그들의 조합이다.

도움이 되었습니까?

해결책

내가 발견 루씬-gosen 을 하는 동안 이 검색에 대한 나의 자신의 목적:

들의 예를 보인다 꽤 괜찮은데 그것의 종류의 것은 필요한 광범위한 테스트합니다.나는에 대한 걱정도 그들의 backwards-compatibility 사항(또는 오히려 완벽한 부족의 하나입니다.)

다른 팁

당신은 아마 보 CJK 패키지에서 contrib 지역의 루씬.있는 분석과 토을 위해 특별히 다루고,중국어,일본어,한국어로 제공하고 있습니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top