Como converter documentos pdf para arquivos html?
-
06-07-2019 - |
Pergunta
Deve permanecer formato, parece quase o mesmo que o original.
Solução
Um par de exemplos:
discute essa página how para software uso chamado pdftohtml para converter no Ubuntu.
listas Esta página shareware (provavelmente o Windows ) que converte PDF para vários formatos de MS, incluindo htm .
Eu mesmo encontrei um par de vídeos (um vídeo do Google e um no www.break.com). Eu não olhar para eles porque acho que só vou descrever como usar alguns softwares.
Estas são, obviamente, insatisfatória, se você quiser saber como fazê-lo sozinho.
Eu acho PDF começou como um arquivo compactado 'PostScript', mas estes dias provavelmente contêm imagens (de documentos digitalizados, por exemplo).
Se for esse o caso, não se preocupe em procurar texto, você pode extrair as imagens e criar páginas HTML para exibir as imagens. Isto deve pelo menos permitir-lhe preservar a formatação.
No mínimo, você poderia de captura de tela as páginas em PDF para criar as imagens. Crude, eu sei, mas ele iria trabalhar se o PDF foi PostScript ou imagens.