Pregunta

Lo que la mejor manera de indexar documentos PDF? ¿Debo indexarlos mediante la conversión de documentos en formato pdf a txt o hay una mejor manera de indexar ficheros PDF?

¿Fue útil?

Solución

Si se asume que está hablando Solr: ver el ExtractingRequestHandler

.
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top