Pregunta

¿Hay alguna manera de extraer los hipervínculos de .doc. Tengo montón de hipervínculos en el doc que necesito para la importación en mi base de datos.

He intentado convertir doc a HTML, pero los hipervínculos no se transfieren.

Regardz, Mladen

¿Fue útil?

Solución 3

he hecho lo siguiente. He abierto el archivo .doc con officeXP, luego publicada como un blog y después de eso me he ahorrado ese blog en forma de página Web filtrada. Eso le da buen HTML que se puede analizar con facilidad.

Otros consejos

Hemos tenido un problema similar y terminó usando un tercer componente parte llamada Aspose.Words. Lo puedes encontrar aquí: http://www.aspose.com

Está disponible para .NET y Java.

Usted podría intentar importar el archivo a OpenOffice y ver si se transfieren los hipervínculos. OpenDocument es simplemente un archivo ZIP con el interior XML, muy fácil de analizar una vez que tienes la caída de ella.

Me di cuenta que es algunos meses después de su pregunta inicial, sin embargo, también puede extraer los hipervínculos en un archivo .doc a través a través de la automatización de Word. Hay objetos de hipervínculo en la API que se puede extraer fácilmente.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top