Frage

Ich habe ziemlich groß Dokument im HTML-Format, das von Microsoft Word erzeugt. Es ist soooo chaotisch und voll von aufgeblähten Dinge (wie unknow Tag, unknow Namespace etc und andere aufgeblähte Dinge)

gibt es eine Möglichkeit, es in einfachem HTML sytax zu konvertieren?

War es hilfreich?

Lösung

Versuchen Sie HTML Tidy . Ich höre es funktioniert ganz gut auf HTML erzeugt von MS Word (auf jeden Fall zumindest bis zu Word 2000, aber wahrscheinlich auf neuere Versionen auch).

Andere Tipps

Das ist nicht wirklich eine Programmierung Frage, aber (zumindest die letzten Versionen) Word „Webseite, gefiltert“ speichern kann, das Office-spezifischen Tags und Eigenschaften und läßt nur die Tags, die für das Dokument entfernt zu sein in einem Web-Browser gerendert. Also, wenn Sie Word haben, können Sie versuchen, es mit dem HTML-Dokument zu öffnen und es in diesem Format speichern.

Sie suchen wahrscheinlich für HTML Tidy , die Adapter in recht hat viel jede Sprache gibt. Es hat Optionen Microsoft Word HTML-Ausgabe zu bereinigen (und vielen anderen Eigenschaften).

Cleanup HTML Online-Tool Wort HTML aufzuräumen

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top