Domanda
ho visto questo link: http://www.lucidimagination.com/Community / Sentire-from-the-esperti / articoli / Content-estrazione-Tika Quello che ho ottenuto è un testo puro senza qualsiasi stile da Tika per Solr effettuare la ricerca. E 'possibile avere il testo con il suo stile da Solr? In altre parole, abbiamo bisogno di mostrare il testo con il suo stile originale dopo ricercate dai solr.
Soluzione
Se ci pensate, ciò che è "stile originale" in un file PDF? Quali componenti del "stile" vuoi tenere?
Non è solo di carattere e peso, è tratto, riempimento, angolo, il percorso, la grafica, il monitoraggio, la trasparenza, trasformazioni e altro ancora. Se hai tutto questo, come è possibile visualizzarlo nella vostra UI / Web?
Non si può realmente riprodurre lo stile originale alcun modo altro che visualizzare il PDF originale. Ecco, questo è il modo in cui la gente di solito lo fanno, se vogliono la formattazione originale.
In caso contrario, basta utilizzare il puro testo.