Индексирование PDF с номерами страниц с SOLR
-
28-09-2019 - |
Вопрос
Я индексирую PDFS с SOLR, используя ExtastryCrequestHandhandler. Я хотел бы отобразить номер страницы вместе с хитами в документе, например, «термин foo
был найден в bar.pdf
На страницах 2, 3 и 5. "
Можно ли включить номера страниц в результате запроса в таком случае?
Решение
Это потребует некоторых усилий по развитию, но вы могли бы достичь этого, индексируя каждую страницу каждого документа в качестве отдельного документа Solr, а затем использовать Полевой рухнул Для группировки разных страниц ударяется для каждого документа.
Обратите внимание, что для этого вам нужна ночная, рушанка поля не реализована в любой выпущенной версии Solr.
Также обратите внимание: падение поля реализовано в версии Solr 3.3. Отказ Ожидается больше обновлений в следующей большой версии ( Solr 4.0)