Индексирование и доступ к файлам ODT в Solr
Вопрос
Как я могу опубликовать, индекс и поиск контента в файле ODT, хранящийся в моем каталоге Solr_home?
Я попробовал понять и применять указанные ниже страницы и включил поле тела в схеме:
Индексирование текста и файлов HTML
Решение
Используйте Apache Tika для извлечения содержимого и отправить его на Solr
Tika tika = new Tika();
InputStream fileInputStream = new FileInputStream("d:\\fileName.odt");
Metadata metadata = new Metadata();
metadata.set(Metadata.RESOURCE_NAME_KEY, "fileName.odt");
String content = tika.parseToString(fileInputStream, metadata);
.
В качестве альтернативы вы также можете использовать ExtastryCrequestHesthandler
Другие советы
Apache Tika требовался.Нашел его в Apache Tika Скачать
Не связан с StackOverflow