문제

최근에 .docx 파일의 기본 구조에 대해 배웠습니다 (특별한 구조화 된 zip 아카이브). 그러나 DOCX는 문서처럼 형성되지 않습니다.

DOC 파일은 어떻게 작동합니까? 파일 형식, 구조 등은 무엇입니까?

도움이 되었습니까?

해결책

Binary .doc 파일의 전체 형식은 다음과 같습니다. 이 PDF 에서 (.doc에 대한 Wikipedia 기사)

다른 팁

귀하의 질문에 대한 직접적인 답은 아니지만 Joel Spolsky의 기사를 읽는 것이 좋습니다. Microsoft Office 파일 형식이 왜 그렇게 복잡합니까? (및 일부 해결 방법). 그것은 .doc 형식이 실제로 얼마나 복잡한 지에 대한 통찰력을 줄 것입니다. Joel은 또한 .doc 형식이 구성된 내용에 대한 매우 기본적인 개요를 제공합니다.

Excel 97-2003 파일은 Ole Compound Documents이며, 이는 본질적으로 단일 파일 내부의 파일 시스템입니다. 이것들을 알아 내기 위해 다른 9 페이지 사양을 읽어야 할 정도로 충분히 복잡합니다. 그리고 이러한“사양”은 우리가 전통적으로 사양으로 생각하는 것보다 C 데이터 구조와 비슷합니다. 전체 계층 적 파일 시스템입니다.

(인용문은 Excel 파일을 말하지만 Word Docs에도 적용됩니다). 유익한 기사와 .docx 및 ODF 파일이 외부 관점에서 검사 할 때 훨씬 더 논리적으로 구성되고 설계된 이유를 이해하는 데 도움이됩니다.

MS Word Doc 형식의 기본 아이디어는 Kibbee가 이미 작성한 것처럼 기본적으로 메모리 덤프 인 Ole Compund 문서입니다. 그것은 매우 복잡하고 복잡한 문서를 저장하는 방법이지만, 신청 단어를 실제로 파헤친 적이 있다면 비즈니스 환경에서 그것을 사용했다면 좋은 점이있을 것입니다. 사무실 시리즈의 다른 프로그램과 어떻게 통합되는지에 대한 느낌.

일반적으로 OLE Compund 문서는 모든 종류의 데이터를 하나의 파일에 넣을 수 있으며 응용 프로그램이 설치되지 않은 데이터를 어느 정도 처리 할 수있는 매우 확장 가능한 구조입니다. 예를 들어, 방정식 개체 (MS 방정식 편집기에서)를 문서에 삽입하면 파일 내부의 파일과 같은 하위 객체로 저장되지만이 개체는 방정식 편집기에 필요한 데이터 만 포함하지 않습니다. 편집하고 렌더링하려면 일반 비트 맵 (또는 metafile, 아마도) 표현이 저장되어 있으므로 방정식 편집기가 설치되지 않은 컴퓨터에 편집되지는 않지만 표시 할 수 있습니다.

이것은 , 어떻게 다른 사람들이 이미 연결 한 사양을 읽어야합니다.)

그래도 파일로 작업 할 수있는 쉬운 방법을 원한다면 단어가 설치된 Windows 컴퓨터에서 소프트웨어가 실행되는지 확인한 다음 COM/OLE 자동화를 사용하여 문서를 열고 조작하십시오. 그렇다면 파일 형식에 대해 걱정할 필요가 없습니다.

Doc은 Word 문서의 이진 형식입니다. Microsoft Office Word 97-2007 이진 파일 형식 사양 [*.doc 문서.

.doc 형식은 매우 복잡합니다. 대부분의 Microsoft 형식과 마찬가지로 버전과 레거시 지원 간의 변화의 오랜 역사를 반영합니다. 그들은 얼마 전에 출판 했으므로, 당신이 그것을보고 싶다면 (및 기타 프리 오피스 2007 형식), 여기서 자신을 두드리십시오.

Microsoft Word의 .doc이 있고 일반 텍스트 .doc가 있습니다. 독점적 인 Microsoft 형식에 대해 궁금해하는 것 같습니다.

에서 위키 백과:

DOC 형식은 Microsoft Office Word 형식에 따라 다릅니다. 최대 97 개의 단어 버전은 97에서 2003 년 사이에 Microsoft Word 버전과 다른 형식을 사용했습니다.

Word 2007이 아니 었습니다 .docx, 포장 된 파일이지만 반드시 .zip 아카이브는 아닙니다. 구조화 된 XML 문서입니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top