Come configurare Apache Tika con Apache Solr 1.4.1
-
27-09-2019 - |
Domanda
Voglio indice di un gran numero di documenti pdf.
Ho trovato un riferimento che mostra che potrebbe essere fatto utilizzando Apache Tika ma purtroppo non riesco a trovare alcun riferimento che descrive ho potuto configurare Apache Tika in Solr 1.4.1.
Una volta configurato io ce l'ho configurato, come posso inviare documenti a Solr direttamente senza utilizzare ricciolo?
Sto usando solrnet per l'indicizzazione.
Soluzione
Altri suggerimenti
Il supporto per ExtractingRequestHandler in SolrNet non è ancora completa. O si può finire lo attua, né il lavoro intorno ad esso e la loro artigianalità HttpWebRequests.
Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow