Frage

Suchen Sie serverseitige Anwendung zu entwickeln, die Dokumente verarbeitet. Die Quelldokumente sind meist MS-Word 2003, 2007, das heißt, die MS-Version von Docx. Möchten Sie die Server-Anwendung in der Lage sein sowohl auf Linux oder Windows zu laufen. Will wissen, was das beste Werkzeug oder Bibliothek zum Lesen und MS-Word-Dateien unter Linux zu schreiben. Kompatibilität ist die wichtigste Überlegung. Muß die Formatierung inklusive Tabellen Quelldokument erhalten.

Ich habe eine Art ähnlicher Position gesehen hier aber es war spezifisch für python. Mir ist es egal, welche Sprache oder Bibliotheken so lange verwendet werden, wie sie für Windows und Linux zur Verfügung stehen.
muss nicht benötigen MS-Word die Word-Dateien lesen.
Ich bin mir bewusst, Open Office, aber bin auf der Suche nach einer Lösung, die ein hohes Maß an Kompatibilität mit MS-Word-Dateien hat. Auch kam gerade über diese Lösung, die sieht vielversprechend aus. Aspose. com Jeder hatte keine Erfahrung Aspose.Words für Java oder ähnliche 3rd-Party-Pakete mit? Es sieht vielversprechend aus, aber es ist teuer bei über $ 2K für ein OEM-Abonnement. Dass gesagt, wenn es wie in der Werbung gibt sie immer noch die beste Lösung da draußen sein kann.

Dank Es gibt bisher ein paar Vorschläge, aber nichts gegeben, die würde paßt die Rechnung (oder das Budget).

War es hilfreich?

Lösung

Haben Sie darüber nachgedacht, b2xtranslator mit binärer .doc konvertieren .docx. (Unter Linux, würden Sie es in Mono laufen müssen)

Sie könnten dann POI verwenden oder docx4j die docx zu manipulieren. Keine Lösung, wenn Sie benötigen als .doc speichern aber (es sei denn, Sie OO für dieses Bit verwenden)

Andere Tipps

Ok, ich werde einen anderen gehen auf eine Antwort haben; -)

Was ist mit unaconv

Es kann konvertieren jedes Dokument Openoffice zu jedem Dokument lesen kann Open Office schreiben kann. Sie sollten die in der Lage zu verwenden, um sowohl von MS-Word-Dokumente / zu konvertieren (vorausgesetzt, sie sind nicht übermäßig kompliziert, die ich offen Büro gefunden haben, können nicht sehr gut umgehen).

Die einzige Einschränkung ist, dass Sie mit einer Instanz von Openoffice läuft auf dem Linux-Server für unoconv zu interact haben müssen.

Mono hat vor kurzer Unterstützung für die System.IO.Packaging .net Klasse erworben, die ein gewisses Maß an Manipulation von docx-Dateien ermöglicht. Wenn die Art der Sache, die Sie tun möchten, ist Hinzufügen / Entfernen Ressourcen und recurse über den Text, es ist wahrscheinlich das Richtige.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top