PythonでのMS Wordファイルの読み取り/書き込み
-
06-07-2019 - |
質問
COMオブジェクトを使用せずにPythonでWord(2003および2007)ファイルを読み書きできますか?
私はできることを知っています:
f = open('c:\file.doc', "w")
f.write(text)
f.close()
ただし、Wordはネイティブの.docファイルではなくHTMLファイルとして読み取ります。
解決
IronPython を調べます。これは.NETランタイムで実行されるため、本質的にWindows / Office APIにアクセスできます。 。
他のヒント
python-docx を参照してください。公式ドキュメントはこちら。
これは私にとって非常にうまくいった。
読みたいものだけなら、最も簡単の場合、linux sofficeコマンドを使用してテキストに変換し、テキストをPythonにロードします。
doc(この場合はWord 2003)とdocx(Word 2007)は異なる形式です。後者は通常、xmlファイルと画像ファイルの単なるアーカイブです。これらのxmlファイルの内容を操作することにより、docxファイルに書き込むことは非常に可能であると思います。ただし、ある種のCOMコンポーネントインターフェイスなしでドキュメントファイルを読み書きする方法はわかりません。
所属していません StackOverflow