我最近学到的有关基本结构。word文件(这是一个专门的结构zip).然而,模板是不能格式化的像个医生。

如何做一个医生的文件的工作?是什么文件的格式结构,等等?

有帮助吗?

解决方案

二进制.doc文件的完整格式记录在 this pdf from( the关于.doc的维基百科文章

其他提示

这不是你问题的直接答案,但我强烈建议阅读Joel Spolsky的文章为什么Microsoft Office文件格式如此复杂? (以及一些解决方法)。它将让您深入了解.doc格式的复杂程度 - 以及原因。 Joel还给出了.doc格式包含的基本概述:

  

你看,Excel 97-2003文件是OLE复合文档,本质上是文件   单个文件中的系统。这些都非常复杂,你必须阅读   另外9页的规格来解决这个问题。而这些“规格”看起来更像是C数据   结构比我们传统上认为的规范。这是一个完整的分层文件   系统

(引用引用Excel文件,但它也适用于Word文档)。信息性文章,有助于理解为什么.docx和ODF文件在从外部角度进行检查时的结构和设计更加逻辑性。

背后的基本思想的MS Word文档格式是OLE、复合文件,作为Kibbee已经写入,基本上是一个存储场。这是一个非常复杂和令人费解的方式储存文件,但是如果你曾经真的挖到应用程序的话你就会知道多么疯狂的许多特点,如果你用它在企业设置只有一个良好的感觉,它是如何与其他程序在办公室的系列。

在一般情况下,OLE、复合文件是非常可扩展的结构,允许你要的东西所有种类的数据纳入一个文件,甚至某种程度上处理数据没有安装应用程序。例如,如果插入一个方程的对象(从MS式编辑)进入一个文件,它被储存作为一个分目的就像是一个文件内的文件,但这个目的并不只是包含所需数据的方程式编辑来编辑和渲染,它也有一个通用的位图(或文件,也许)表示的储存,所以它可以显示,虽然没有编辑、一台机器上没有式编辑器安装。

这是的 为什么, , 如何 你有读取的规范的其他人有联系已经)

如果你想出的最容易的方法的工作文件,虽然,请确保您的软件运行的Windows的机器字装,然后使用COM/OLE自动化,以开放和操作的文件。你不必担心文件的格式。

Doc是word文档的二进制格式 - 这里是 Microsoft Office Word 97-2007二进制文件格式规范[* .doc] 文档。

.doc格式非常复杂。与大多数Microsoft格式一样,它反映了版本和旧版支持之间的长期变化历史。他们不久前发布了它,所以如果你想查看它(和其他Office 2007之前的格式),在这里敲门自己

有Microsoft Word的.doc,然后是纯文本.doc。听起来你对微软的专有格式感到疑惑。

来自维基百科

  

DOC格式因Microsoft Office Word格式而异。最高97的Word版本在97和2003之间使用了与Microsoft Word版本不同的格式。

直到Word 2007, .docx ,虽然是打包文件,但是不一定是.zip存档。它是一个结构化的XML文档。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top