Pergunta

What the best way to index pdf documents? Should I index them by converting pdf documents to txt or there is a better way to index pdf files?

Foi útil?

Solução

Assuming you're talking about solr: see the ExtractingRequestHandler.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top