Domanda

Usando C # come devo fare per estrarre titoli sottotitoli e paragrafi da un documento docx.

Sto pensando di farlo attraverso VSTO ma conosco il modello di oggetti parola. Conosco solo il modello a oggetti di Excel.

Dovrei prendere l'approccio unzip + linq to XML?

Usando VSTO ho potuto creare un componente aggiuntivo che poteva essere usato per modificare l'applicazione in cui avrei convertito in e da docx.

qualcuno ha precedenti esperienze con questo tipo di cose? qualsiasi vantaggio sarà molto apprezzato.

È stato utile?

Soluzione

Personalmente prenderei l'approccio unzip + LINQ2XML. (Puoi decomprimere usando il supporto integrato nel framework o se si utilizza una versione precedente è possibile utilizzare la libreria zip fornita da icsharpcode.net

Preferirei questo approccio perché per qualcosa di così semplice preferirei di no dipende da VSTO. In questo modo l'utente finale non ha nemmeno bisogno di installare Office. (E non ci sono altri problemi di licenza ... di cui non conosco i dettagli).

Solo la mia opinione.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top