Indicizzazione e accesso ai file ODT in SOLR
Domanda
Come posso pubblicare, indicizzare e cercare contenuti all'interno di un file ODT memorizzato nella mia directory SOLR_HOME?
Ho provato la comprensione e l'applicazione delle pagine seguenti e hanno incluso un campo corporeo nello schema:
Soluzione
Usa Apache Tika per estrarre il contenuto e inviarlo a solr
Tika tika = new Tika();
InputStream fileInputStream = new FileInputStream("d:\\fileName.odt");
Metadata metadata = new Metadata();
metadata.set(Metadata.RESOURCE_NAME_KEY, "fileName.odt");
String content = tika.parseToString(fileInputStream, metadata);
.
In alternativa puoi anche usare estractingrequesthandler
Altri suggerimenti
Apache TIKA è stato richiesto.Trovato a Apache tika download
Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow