Как конвертировать PDF документы в HTML файлы?
-
06-07-2019 - |
Вопрос
Должен оставаться в формате, выглядит почти так же, как оригинал.
Решение
Несколько примеров:
На этой странице обсуждается, как используйте программное обеспечение pdftohtml для конвертации в Ubuntu.
На этой странице перечислены условно-бесплатные программы (возможно, Windows ) который преобразует PDF в различные форматы MS, включая htm .
Я даже нашел пару видео (видео от Google и одно на www.break.com). Я не смотрел на них, потому что думаю, что они просто опишут, как использовать какое-то программное обеспечение.
Это явно неудовлетворительно, если вы хотите знать, как это сделать самостоятельно.
Я думаю, что PDF начинался как сжатый файл postscript, но в наши дни, вероятно, он будет содержать изображения (например, отсканированные документы). Р>
Если это так, не ищите текст, вы можете извлечь изображения и создать HTML-страницы для отображения изображений. Это должно как минимум позволить вам сохранить форматирование.
По крайней мере, вы можете делать снимки экрана на страницах PDF для создания изображений. Грубо, я знаю, но это сработало бы, был ли PDF постскриптум или изображения.