Вопрос

Как лучше всего конвертировать PDF-документы для просмотра в браузере в формате HTML?На сайте есть несколько PDF-документов, и посетитель может нажать «Просмотреть как HTML», и это должно быть просмотрено на экране как HTML-файл.

Стандартный веб-сайт под управлением PHP, Linux, Apache.

Это было полезно?

Решение

pdftohtml работает нормально:быстрый, стабильный, но результат HTML в лучшем случае уродливый.Я использовал его в течение довольно долгого времени для веб-сайта, на котором размещено множество резюме вакансий.

Однако это хорошее решение для извлечения текстового контента.

я бы дал API-интерфейс писца попытка

или API документов приложений Google.Google отлично справляется с отображением и конвертацией PDF-файлов.

Другие советы

Рассматривали ли вы возможность хранения данных PDF в базе данных, а затем динамическое создание страницы PDF или html в зависимости от того, что выбирают посетители?

Если у вас есть доступ к командной строке у вашего хостинг-провайдера, внутри пакета poppler_utils есть утилита pdftohtml.

http://poppler.freedesktop.org/

Выглядит довольно просто в использовании, я не вызывал его изнутри PHP, но он должен работать.

Если вы готовы вызывать Java из PHP, вы можете посмотреть http://www.jpedal.org/html_index.php

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top