Pergunta

Quero indexar um grande número de documentos em PDF.

Encontrei uma referência mostrando que isso poderia ser feito usando o Apache Tika, mas infelizmente não consigo encontrar nenhuma referência que descreva que eu poderia configurar o Apache Tika no Solr 1.4.1.

Uma vez configurado, eu o configurei, como posso enviar documentos para o Solr diretamente sem usar o CURL?

Estou usando o Solrnet para indexação.

Foi útil?

Solução

Outras dicas

Suporte para ExtractingRequestHandler em Solrnet ainda não está completo. Você pode terminar de implementá -lo ou contorná -lo e criar suas próprias httpwebrequests.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top