Domanda

Sto cercando di creare un programma che legge un file .docx e messaggi è contenuto a un blog / forum per uso personale. Finalmente ho capito come utilizzare libcurl fare (quello che ho pensato) era la parte più difficile del programma. Ora non mi resta che leggere il file .docx, ma sono venuto sotto un intoppo. Io non riesco a trovare alcuna documentazione su come fare questo. Tutte le idee?

È stato utile?

Soluzione

Il modo più semplice è quello di utilizzare Word per fare questo. Ha limitazioni sulle licenze.

La domanda SO creazione, l'apertura e la stampa di un file di word da C ++ ha alcune buone referenze.

Modifica

Secondo queste domande / risposte possono decomprimere il file Open XML ed elaborare direttamente il file XML:

Se si utilizza .NET ci sono più (C #) domande per leggere:

Altri suggerimenti

Se si vuole rimanere sul mondo open-source, OpenOffice 3 dovrebbe essere in grado di elaborare i file .docx. C'è un progetto per implementare un'API per molte lingue, io non so davvero come completo o complessa che sia.

C'è un scritto in PHP che in grado di convertire da docx in testo normale. Cioè, se non hai paura che tutti i documenti sono in russo). Questo potrebbe essere un'altra opzione (innescando lo script php con una chiamata di sistema e l'analisi dei risultati di un file)

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top