Question

Je l'ai vu ce lien: http://www.lucidimagination.com/Community / Hear-de-la-experts / articles / Content-Extraction-Tika Ce que je suis arrivé est du texte pur, sans aucun style de Tika pour Solr effectuer la recherche. Est-il possible d'avoir le texte avec son style de Solr? En d'autres termes, nous devons montrer du texte avec son style original après recherché par solr.

Était-ce utile?

La solution

Si vous pensez à ce sujet, ce qui est « style original » dans un pdf? Quels sont les composants du « style » voulez-vous garder?

Il est non seulement la police et de poids, il est temps, remplissage, angle, chemin, graphiques, de suivi, la transparence, les transformations et plus encore. Si vous avez tout cela, comment présenteriez-vous dans votre interface utilisateur / Web?

Vous ne pouvez pas reproduire vraiment le style d'origine toute autre manière que l'affichage du PDF d'origine. Donc, c'est la façon dont on le font habituellement s'ils veulent le format d'origine.

Dans le cas contraire, ils suffit d'utiliser le texte pur.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top