Pregunta

¿Cuál es la mejor solución para convertir documentos PDF para ser vistos en el navegador como HTML? El sitio cuenta con varios documentos PDF y el visitante puede hacer clic en Ver como HTML y esto debe ser visto en la pantalla como un archivo HTML.

página web estándar de PHP en funcionamiento, Linux, Apache.

¿Fue útil?

Solución

pdftohtml funciona bien: rápido, estable, pero el resultado es feo html en el mejor. Lo he usado durante bastante tiempo para un sitio web que tiene muchas hojas de vida de trabajo.

Es una buena solución para extraer el contenido textual sin embargo.

Le daría al Scribd API intentarlo

o el documento de aplicaciones API de Google. Google hace un gran trabajo y que muestran una conversión de archivos PDF

Otros consejos

Ha considerado mantener los datos PDF en una base de datos y luego crear de forma dinámica el archivo PDF o la página HTML en función de lo que seleccione los visitantes?

Si usted tiene acceso a la línea de comandos a su proveedor de alojamiento, hay una utilidad llamada pdftohtml interior del envase poppler_utils.

http://poppler.freedesktop.org/

Parece muy fácil de usar, no lo han llamado desde el interior de PHP, pero debería funcionar.

Si usted está preparado para llamar a Java desde PHP que podría echar un vistazo a http: //www.jpedal .org / html_index.php

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top