質問

Googleドキュメントを使用しており、使用しているテンプレートの一部はMS-Officeを使用して作成されました。
結果のHTMLは太くて見苦しく、Googleのドキュメントあたり500 KBの制限により、一部のクリーンアップが必須になります。 冗長な<!> quot; style <!> quot;を見つけることができました。属性をいくつかのCSSクラスに移動し、最も冗長なクラス名を短い名前に変更します。これにより、元のサイズの約50%を節約できます。
私にとってこの苦痛な仕事をすることができる既存のツール/スクリプト/ライブラリを知っていますか、少なくともこの魔法のツールを書くのを助けますか?

事前に感謝します!

編集:きちんとデモロナイザーと<!> quot; manual rewrite <!> quot ;:
-入力:140Kb
-片付け:110Kb
-デモンストレーション:135Kb

だから私のお気に入りの答えは<!> quot; rewrite it!<!> quot;

ありがとう!

役に立ちましたか?

解決

MS-Officeは、くだらないHTMLを作成します。元のテキストからHTMLを再構築することに時間を費やす方が、その地雷原を歩き回るよりも優れています。

Wordでいくつかの検索/置換機能を実行するいくつかのマクロを作成して、<p>タグを段落やそのようなものにラップするなどの基本的なことを行ってから、全体をゼロから再マークアップします。

他のヒント

tidy を試してみると、多くのものがクリーンアップされます。

その名前についてコメントせずに、著者が次のように説明しているデモロナイザーに言及することができます。 :

  

...このサイトからダウンロード可能なPerlプログラム。Microsoftアプリケーションによって生成または編集されたHTMLの多数のエラーと非互換性を修正します。

YMMV。

現在、私のお気に入りのユーティリティの1つは実際にはWindows Live Writerです。Wordのdocファイルからごみを取り除くというきちんとした仕事をしています。意見が合わない人もいるかもしれませんが、私はかなり頻繁に使用しています!

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top