Domanda

Voglio indice di un gran numero di documenti pdf.

Ho trovato un riferimento che mostra che potrebbe essere fatto utilizzando Apache Tika ma purtroppo non riesco a trovare alcun riferimento che descrive ho potuto configurare Apache Tika in Solr 1.4.1.

Una volta configurato io ce l'ho configurato, come posso inviare documenti a Solr direttamente senza utilizzare ricciolo?

Sto usando solrnet per l'indicizzazione.

È stato utile?

Altri suggerimenti

Il supporto per ExtractingRequestHandler in SolrNet non è ancora completa. O si può finire lo attua, né il lavoro intorno ad esso e la loro artigianalità HttpWebRequests.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top