是否可以在不使用COM对象的情况下在Python中读取和写入Word(2003和2007)文件?
我知道我可以:

f = open('c:\file.doc', "w")
f.write(text)
f.close()

但Word会将其读取为HTML文件而非本机.doc文件。

有帮助吗?

解决方案

我会查看 IronPython ,它本质上可以访问Windows / office API,因为它在.NET运行时运行

其他提示

请参阅 python-docx ,其官方文档可用这里

这对我来说非常有效。

如果你只读什么,那就是最简单使用linux soffice命令将其转换为文本,然后将文本加载到python中:

doc(本例中为Word 2003)和docx(Word 2007)是不同的格式,后者通常只是xml和图像文件的存档。我想可以通过操作这些xml文件的内容来写入docx文件。但是,我没有看到如何在没有某种类型的COM组件接口的情况下读取和写入doc文件。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top