Microsoft html doc aufzuräumen?
Frage
Ich habe ziemlich groß Dokument im HTML-Format, das von Microsoft Word erzeugt. Es ist soooo chaotisch und voll von aufgeblähten Dinge (wie unknow Tag, unknow Namespace etc und andere aufgeblähte Dinge)
gibt es eine Möglichkeit, es in einfachem HTML sytax zu konvertieren?
Lösung
Versuchen Sie HTML Tidy . Ich höre es funktioniert ganz gut auf HTML erzeugt von MS Word (auf jeden Fall zumindest bis zu Word 2000, aber wahrscheinlich auf neuere Versionen auch).
Andere Tipps
Das ist nicht wirklich eine Programmierung Frage, aber (zumindest die letzten Versionen) Word „Webseite, gefiltert“ speichern kann, das Office-spezifischen Tags und Eigenschaften und läßt nur die Tags, die für das Dokument entfernt zu sein in einem Web-Browser gerendert. Also, wenn Sie Word haben, können Sie versuchen, es mit dem HTML-Dokument zu öffnen und es in diesem Format speichern.
Sie suchen wahrscheinlich für HTML Tidy , die Adapter in recht hat viel jede Sprache gibt. Es hat Optionen Microsoft Word HTML-Ausgabe zu bereinigen (und vielen anderen Eigenschaften).
Cleanup HTML Online-Tool Wort HTML aufzuräumen