Conversione da PDF a HTML [chiusa]
-
12-09-2019 - |
Domanda
Qual è la soluzione migliore per convertire i documenti PDF per essere visualizzato nel browser in formato HTML? Il sito ha diversi documenti in formato PDF e il visitatore può fare clic su Visualizza come HTML e questo dovrebbe essere visto sullo schermo come un file HTML.
sito web standard di PHP in esecuzione, Linux, Apache.
Soluzione
pdftohtml funziona bene: veloce, stabile, ma il risultato è brutto html al meglio. L'ho usato per un bel po 'di tempo per un sito web che ha molti curriculum.
Si tratta di una buona soluzione per l'estrazione di contenuti testuali però.
Vorrei dare il Scribd API una prova
o il documento di Google Apps API. Google fa un grande lavoro una visualizzazione e conversione di file PDF
Altri suggerimenti
Avete preso in considerazione la conservazione dei dati in formato PDF in un database e poi o dinamicamente la creazione del PDF o pagina html seconda di ciò che i visitatori selezionare?
Se si dispone di accesso alla linea di comando al vostro fornitore di hosting, v'è un'utility chiamata pdftohtml all'interno della confezione poppler_utils.
http://poppler.freedesktop.org/
appare abbastanza facile da usare, non hanno chiamato dall'interno di PHP, ma dovrebbe funzionare.
Se siete disposti a chiamare Java da PHP si potrebbe avere uno sguardo a http: //www.jpedal .org / html_index.php