Frage

Ist es möglich, Wort (2003 und 2007) -Dateien in Python lesen und schreiben, ohne ein COM-Objekt zu verwenden?
Ich weiß, dass ich kann:

f = open('c:\file.doc', "w")
f.write(text)
f.close()

aber Word wird es als HTML-Datei nicht eine native DOC-Datei lesen.

War es hilfreich?

Lösung

ich in aussehen würde Ironpython, die an sich den Zugriff auf Windows / Office-APIs hat, weil es auf .NET-Runtime läuft .

Andere Tipps

Siehe python-docx , seine offizielle Dokumentation ist hier .

Das hat sehr gut für mich gearbeitet.

Wenn Sie nur das, was zu lesen, es ist einfachste den linux soffice Befehl zu verwenden, um es zu Text konvertieren und dann den Text in python laden:

doc (Word 2003 in diesem Fall) und docx (Word 2007) sind verschiedene Formate, wobei letzteres in der Regel nur ein Archiv von XML und Bilddateien. Ich könnte mir vorstellen, dass es sehr wohl möglich ist, Dateien zu schreiben, um docx durch den Inhalt dieser XML-Dateien zu manipulieren. Allerdings sehe ich nicht, wie auf eine doc-Datei ohne irgendeine Art von COM-Komponente Schnittstelle lesen und schreiben konnte.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top