Solr Tika, текст со стилем
-
09-10-2019 - |
Вопрос
Я видел эту ссылку:http://www.lucidimagination.com/community/hear-from-the-experts/articles/content-extraction-tika.То, что я получил, это чистый текст без какого-либо стиля от Tika для Solr для поиска. Можно ли иметь текст со своим стилем от Solr? Другими словами, нам нужно показать текст с его оригинальным стилем после поиска Solr.
Решение
Если вы думаете об этом, что такое «оригинальный стиль» в PDF? Какие компоненты «стиля» вы хотите сохранить?
Это не просто шрифт и вес, это инсульт, заполнение, угол, путь, графика, отслеживание, прозрачность, трансформации и многое другое. Если вы все это получили, как бы вы поставили его в вашем интерфейсе?
Вы не можете реплицировать оригинальный стиль в любой момент, кроме отображения оригинального PDF. Так вот так, как люди обычно делают это, если они хотят оригинальное форматирование.
В противном случае они просто используют чистый текст.