Como configurar o Apache Tika com Apache Solr 1.4.1

https://stackoverflow.com/questions/3863906

solr
solrnet
solr-cell
apache-tika

27-09-2019
|

Pergunta

Quero indexar um grande número de documentos em PDF.

Encontrei uma referência mostrando que isso poderia ser feito usando o Apache Tika, mas infelizmente não consigo encontrar nenhuma referência que descreva que eu poderia configurar o Apache Tika no Solr 1.4.1.

Uma vez configurado, eu o configurei, como posso enviar documentos para o Solr diretamente sem usar o CURL?

Estou usando o Solrnet para indexação.

Solução

Ver ExtractingRequestHandler

Outras dicas

Suporte para ExtractingRequestHandler em Solrnet ainda não está completo. Você pode terminar de implementá -lo ou contorná -lo e criar suas próprias httpwebrequests.

Licenciado em: CC-BY-SA com atribuição

Não afiliado a StackOverflow