我使用谷歌文档,并使用微软Office创建我们使用一些模板。点击 将得到的HTML是脂肪和难看,在谷歌每DOC限制的500KB使得一些清理强制性的。 我能找到多余的“风格”属性,并将其移动到一些CSS类,最多余的类名称重命名为较短的,这使我保存原始大小的大约50%。结果 你知道一些现有的工具/脚本/ lib目录可能为我做这个痛苦的工作,或者至少帮我写这个神奇的工具?

提前感谢!

编辑:我给一个尝试既整齐,demoronizer和“手动重写”:点击 - 输入:140KB点击 - Tidy'ed:110KB点击 - Demoronized:135KB

所以我最喜欢的答案将是“改写了!”

谢谢!

有帮助吗?

解决方案

MS-厅提出蹩脚HTML,周期。你花费的时间从原来的文本重建HTML不是试图通过雷区走的更好。

我做了几个宏,做一些搜索/替换功能的Word做喜欢的段落绕到<p>标签之类的东西基本的东西,然后再重新标记从头开始整个事情。

其他提示

您可以尝试整洁它会清理很多东西。

不评论它的名字,我可以提到 demoronizer ,该作者描述为:

  

... Perl程序可以从这个网站校正因产生的,或与Microsoft应用程序编辑了许多错误和不兼容的HTML下载。

因人而异。

我最喜欢的事业,现在实际上是的Windows Live作家 - 它剥离出来的垃圾的Word文档文件的一个整洁的工作。有些人可能不同意,但我经常用它!

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top