Question

J'indexation des fichiers PDF avec Solr en utilisant le ExtractingRequestHandler. Je voudrais afficher le numéro de page avec succès dans un document, par exemple "Terme foo a été trouvé dans bar.pdf sur les pages 2, 3 et 5."

Est-il possible d'inclure les numéros de page dans le résultat de la requête comme ça?

Était-ce utile?

La solution

Il faudrait un certain effort de développement, mais vous pouvez y parvenir en indexant chaque page de chaque document comme séparé le document Solr, et puis utilisez champ l'effondrement de regrouper les différents nombre de visites pour chaque document.

Notez que vous avez besoin d'une nuit pour cela, le terrain effondrement ne sont pas mis en œuvre dans une version Solr actuellement publié.

A noter également: Champ Collapsing est mis en œuvre dans la version Solr 3.3 . Plus de mises à jour sont attendus dans la prochaine version grand ( Solr 4.0 )

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top