Pregunta

Estoy intentando crear un programa que lee un archivo .docx y lo publica contenido a un blog / foro para uso personal. Por fin he descubierto la manera de utilizar libcurl que hacer (lo que pensé) fue la parte más difícil del programa. Ahora sólo tengo que leer el archivo .docx, pero han sido objeto de un obstáculo. Parece que no puedo encontrar ninguna documentación sobre cómo hacer esto. ¿Alguna idea?

¿Fue útil?

Solución

La forma más sencilla es utilizar Word para hacer esto. Tiene limitaciones en la concesión de licencias.

La pregunta lo que la creación , abrir e imprimir un archivo de Word de C ++ tiene algunas buenas referencias.

Editar

De acuerdo con estas preguntas / respuestas pueden descomprimir el archivo Open XML y procesar directamente el archivo XML:

Si utiliza .NET hay más (C #) para leer las preguntas:

Otros consejos

Si desea permanecer en el mundo de código abierto, OpenOffice 3 debería ser capaz de procesar archivos .docx. Hay un proyecto para implementar un API para muchos idiomas, no se sabe muy bien cómo completa y compleja que sea.

Hay una guión en PHP que se puede convertir de .docx en texto sin formato. Es decir, si usted no está asustado de que todos los documentos están en ruso). Eso podría ser otra opción (provocando el script php con una llamada al sistema y analizar los resultados de un archivo)

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top