Как конвертировать PDF документы в HTML файлы?

StackOverflow https://stackoverflow.com/questions/1414599

  •  06-07-2019
  •  | 
  •  

Вопрос

Должен оставаться в формате, выглядит почти так же, как оригинал.

Это было полезно?

Решение

Несколько примеров:

На этой странице обсуждается, как используйте программное обеспечение pdftohtml для конвертации в Ubuntu.

На этой странице перечислены условно-бесплатные программы (возможно, Windows ) который преобразует PDF в различные форматы MS, включая htm .

Я даже нашел пару видео (видео от Google и одно на www.break.com). Я не смотрел на них, потому что думаю, что они просто опишут, как использовать какое-то программное обеспечение.

Это явно неудовлетворительно, если вы хотите знать, как это сделать самостоятельно.

Я думаю, что PDF начинался как сжатый файл postscript, но в наши дни, вероятно, он будет содержать изображения (например, отсканированные документы).

Если это так, не ищите текст, вы можете извлечь изображения и создать HTML-страницы для отображения изображений. Это должно как минимум позволить вам сохранить форматирование.

По крайней мере, вы можете делать снимки экрана на страницах PDF для создания изображений. Грубо, я знаю, но это сработало бы, был ли PDF постскриптум или изображения.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top