希望开发处理文档的服务器端应用程序。源文档主要是 MS-Word 2003、2007,即MS 版本的 Docx。希望服务器应用程序能够在linux或windows上运行。想知道在linux下读写MS-Word文件最好的工具或库是什么。兼容性是最重要的考虑因素。必须保留源文档格式,包括表格。

我看过一个类似的帖子 这里 但它是特定于 python 的。我不在乎使用什么语言或库,只要它们适用于 Windows 和 Linux 即可。
一定不 需要 MS-Word 来读取 Word 文件。
我了解 Open Office,但正在寻找与 MS-Word 文件高度兼容的解决方案。也刚刚遇到了这个看起来很有前途的解决方案。 aspose.com有人有使用 Aspose.Words for Java 或类似的第 3 方软件包的经验吗?它看起来很有前途,但 OEM 订阅的价格超过 2000 美元。也就是说,如果它按照广告宣传的那样交付,它可能仍然是最好的解决方案。

谢谢,有几个建议,但到目前为止什么都不适合法案(或预算)。

有帮助吗?

解决方案

您是否考虑过使用 b2xtranslator 将二进制 .doc 转换为 .docx。(在 Linux 上,您必须在 Mono 中运行它)

然后,您可以使用 POI 或 docx4j 来操作 docx。如果您需要另存为 .doc,这不是一个解决方案(除非您使用 OO)

其他提示

好的,我会再次尝试回答;-)

使用怎么样 纳康夫

它可以将任何 OpenOffice 可以读取的文档转换为任何 OpenOffice 可以写入的文档。您应该能够使用它来将两者转换为 MS-Word 文档(只要它们不是太复杂,我发现开放式办公室无法很好地处理)。

唯一需要注意的是,您需要在 Linux 服务器上运行一个 OpenOffice 实例,以便 unoconv 与之交互。

Mono 最近获得了对 system.io.packaging .net 类的支持,该类允许对 docx 文件进行某种程度的操作。如果您想要做的事情是添加/删除资源并递归文本,那么这可能是正确的事情。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top