Usando C # como eu devo ir sobre como extrair títulos legendas e parágrafos de um documento docx
-
10-07-2019 - |
Pergunta
Usando C # como eu devo ir sobre como extrair títulos legendas e parágrafos de um documento docx.
Estou pensando em fazer isso através VSTO mas sei conhecer o modelo de objeto palavra. Eu sou apenas familiarizado com o modelo de objeto do Excel.
Devo tomar a + linq unzip a abordagem XML?
Usando VSTO eu poderia construir um suplemento que pode ser usado para editar a aplicação onde eu iria converter de e para docx.
alguém tem experiências anteriores com esse tipo de coisa? alguma pista será muito apreciada.
Solução
Pessoalmente eu tomar a abordagem + LINQ2XML descompactação. (Você pode descompactar usando o suporte embutido no quadro ou se você estiver usando uma versão antiga que você pode usar a biblioteca zip fornecido pelo icsharpcode.net
Eu tomaria esta abordagem, porque para algo tão simples como isto eu não prefiro dependem VSTO. Desta forma, o usuário final não precisa mesmo de ter o Office instalado. (E não há outros problemas de licença ... que eu não sei os detalhes).
Apenas a minha opinião.