문제

COM 객체를 사용하지 않고 Python에서 Word (2003 및 2007) 파일을 읽고 쓸 수 있습니까?
나는 내가 할 수 있다는 것을 알고있다 :

f = open('c:\file.doc', "w")
f.write(text)
f.close()

그러나 Word는이를 기본 .doc 파일이 아닌 HTML 파일로 읽습니다.

도움이 되었습니까?

해결책

나는 조사 할 것이다 Ironpython .NET 런타임에서 실행되기 때문에 본질적으로 Windows/Office API에 액세스 할 수 있습니다.

다른 팁

보다 Python-docx, 공식 문서를 사용할 수 있습니다 여기.

이것은 나를 위해 매우 잘 작동했습니다.

읽을 내용 만 있으면 가장 간단합니다 Linux Soffice 명령을 사용하여 텍스트로 변환 한 다음 텍스트를 Python에로드합니다.

Doc (이 경우 Word 2003) 및 Docx (Word 2007)는 다른 형식이며, 후자는 일반적으로 XML 및 이미지 파일의 아카이브 일뿐입니다. 해당 XML 파일의 내용을 조작하여 DOCX 파일에 작성하는 것이 매우 가능하다고 생각합니다. 그러나 일부 유형의 COM 구성 요소 인터페이스없이 DOC 파일을 읽고 쓸 수있는 방법을 알 수 없습니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top