Domanda

Quello che il modo migliore per indicizzare i documenti pdf? Dovrei indicizzarli tramite la conversione di documenti in formato pdf a txt o c'è un modo migliore per indicizzare i file PDF?

È stato utile?

Soluzione

Supponendo che si sta parlando di solr: vedi la ExtractingRequestHandler

.
Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top