Mit C #, wie soll ich mich über Titel Untertitel und Absätze aus einem docx-Dokument zu extrahieren

StackOverflow https://stackoverflow.com/questions/434203

Frage

C #, wie soll ich gehen über Titel Untertitel und Absätze aus einem docx-Dokument zu extrahieren.

Ich denke, dies durch VSTO zu tun, aber weiß das Wort Objektmodell kennen. Ich bin nur mit dem Excel-Objektmodell vertraut.

Sollte nehme ich die unzip + Linq to XML Ansatz?

Mit VSTO ich kann einen AddIn bauen, die verwendet werden könnten, um die Anwendung zu bearbeiten, wo ich zu und von docx umwandeln würde.

hat jemand frühere Erfahrungen mit dieser Art der Sache? alle Leitungen werden sehr geschätzt.

War es hilfreich?

Lösung

Persönlich würde nehme ich die unzip + LINQ2XML Ansatz. (Sie können mit Hilfe der integrierten Unterstützung entpacken im Rahmen oder wenn Sie eine alte Version verwenden, können Sie die Zip-Bibliothek von icsharpcode.net bereitgestellt verwenden

Ich würde diesen Ansatz, weil für etwas so einfache wie diese würde ich eher nicht hängen von VSTO. Auf diese Weise der Endbenutzer nicht einmal haben braucht Office installiert. (Und es gibt keine anderen Lizenzprobleme ... von denen ich weiß nicht, die Details).

Nur meine Meinung.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top