Frage

Ich mag eine große Anzahl von PDF-Dokumenten zu indexieren.

Ich habe eine Referenz gefunden zeigen, dass es Apache Tika getan werden könnte verwenden, aber leider kann ich keinen Hinweis finden, dass ich konfigurieren könnte Apache Tika in Solr beschreibt 1.4.1.

Nach der Konfiguration Ich habe es so konfiguriert, wie kann ich Dokumente Solr senden direkt ohne curl mit?

Ich bin mit solrnet für die Indizierung.

War es hilfreich?

Andere Tipps

Unterstützung für ExtractingRequestHandler in SolrNet ist noch nicht vollständig. Sie können entweder beenden implementieren oder Arbeit um ihn herum und Ihre eigenen HttpWebRequests Handwerk.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top