Usando C # como eu devo ir sobre como extrair títulos legendas e parágrafos de um documento docx

StackOverflow https://stackoverflow.com/questions/434203

Pergunta

Usando C # como eu devo ir sobre como extrair títulos legendas e parágrafos de um documento docx.

Estou pensando em fazer isso através VSTO mas sei conhecer o modelo de objeto palavra. Eu sou apenas familiarizado com o modelo de objeto do Excel.

Devo tomar a + linq unzip a abordagem XML?

Usando VSTO eu poderia construir um suplemento que pode ser usado para editar a aplicação onde eu iria converter de e para docx.

alguém tem experiências anteriores com esse tipo de coisa? alguma pista será muito apreciada.

Foi útil?

Solução

Pessoalmente eu tomar a abordagem + LINQ2XML descompactação. (Você pode descompactar usando o suporte embutido no quadro ou se você estiver usando uma versão antiga que você pode usar a biblioteca zip fornecido pelo icsharpcode.net

Eu tomaria esta abordagem, porque para algo tão simples como isto eu não prefiro dependem VSTO. Desta forma, o usuário final não precisa mesmo de ter o Office instalado. (E não há outros problemas de licença ... que eu não sei os detalhes).

Apenas a minha opinião.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top