Конвертировать PDF в HTML [закрыто]
-
12-09-2019 - |
Вопрос
Как лучше всего конвертировать PDF-документы для просмотра в браузере в формате HTML?На сайте есть несколько PDF-документов, и посетитель может нажать «Просмотреть как HTML», и это должно быть просмотрено на экране как HTML-файл.
Стандартный веб-сайт под управлением PHP, Linux, Apache.
Решение
pdftohtml работает нормально:быстрый, стабильный, но результат HTML в лучшем случае уродливый.Я использовал его в течение довольно долгого времени для веб-сайта, на котором размещено множество резюме вакансий.
Однако это хорошее решение для извлечения текстового контента.
я бы дал API-интерфейс писца попытка
или API документов приложений Google.Google отлично справляется с отображением и конвертацией PDF-файлов.
Другие советы
Рассматривали ли вы возможность хранения данных PDF в базе данных, а затем динамическое создание страницы PDF или html в зависимости от того, что выбирают посетители?
Если у вас есть доступ к командной строке у вашего хостинг-провайдера, внутри пакета poppler_utils есть утилита pdftohtml.
http://poppler.freedesktop.org/
Выглядит довольно просто в использовании, я не вызывал его изнутри PHP, но он должен работать.
Если вы готовы вызывать Java из PHP, вы можете посмотреть http://www.jpedal.org/html_index.php