Solr에서 ODT 파일 색인 생성 및 액세스
문제
MY SOLR_HOME 디렉토리에 저장된 ODT 파일 내의 콘텐츠를 게시, 색인 및 검색 할 수 있습니까?
아래의 언급 된 페이지를 이해하고 적용하고 스키마에 본문 필드를 포함 시켰습니다.
해결책
Apache Tika를 사용하여 콘텐츠를 추출하고 Solr
로 보내십시오.Tika tika = new Tika();
InputStream fileInputStream = new FileInputStream("d:\\fileName.odt");
Metadata metadata = new Metadata();
metadata.set(Metadata.RESOURCE_NAME_KEY, "fileName.odt");
String content = tika.parseToString(fileInputStream, metadata);
.
optify ExtractingRequestHandler
을 사용할 수도 있습니다.다른 팁
Apache Tika가 필요했습니다. Apache Tika 다운로드
제휴하지 않습니다 StackOverflow