Вопрос

Я видел эту ссылку:http://www.lucidimagination.com/community/hear-from-the-experts/articles/content-extraction-tika.То, что я получил, это чистый текст без какого-либо стиля от Tika для Solr для поиска. Можно ли иметь текст со своим стилем от Solr? Другими словами, нам нужно показать текст с его оригинальным стилем после поиска Solr.

Это было полезно?

Решение

Если вы думаете об этом, что такое «оригинальный стиль» в PDF? Какие компоненты «стиля» вы хотите сохранить?

Это не просто шрифт и вес, это инсульт, заполнение, угол, путь, графика, отслеживание, прозрачность, трансформации и многое другое. Если вы все это получили, как бы вы поставили его в вашем интерфейсе?

Вы не можете реплицировать оригинальный стиль в любой момент, кроме отображения оригинального PDF. Так вот так, как люди обычно делают это, если они хотят оригинальное форматирование.

В противном случае они просто используют чистый текст.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top