java parse html + css, und konvertieren Sie die Ausgabe an verschiedene lang
-
20-08-2019 - |
Frage
ich brauche, um zu verstehen, html + css-Dateien und konvertieren Sie es in etwas wie rtf layot in java jetzt verstehe ich, ich brauche allerdings etwas html-parser, aber was muss ich tun ?wie kann ich implementieren html-css-Converter ?ist es allerdings etwas patern oder Methode für solche jobs?
Lösung
Ich würde Folgendes tun:
- Bei der ersten Verwendung JTidy konvertieren HTML um gültigen XHTML
- Anwenden einer XSLT-Transformation, in RTF konvertieren mit einem XML-Bibliothek wie Saxon oder Xerces
Hinweis:obwohl ich nicht finden Sie eine xsl-Datei für die Konvertierung direkt ich bin sicher, es ist überall
Andere Tipps
Sie sollten überprüfen, HTMLEditorKit.Es bietet einige Unterstützung für die CSS-Darstellung.Es ist auch eine RTFEditorKit für das schreiben, obwohl es nicht ganz zuverlässig (zuletzt habe ich überprüft, vor einigen Jahren).
Gibt es einen Grund, warum Sie müssen verwenden Sie Java, anstatt nur das laden der HTML in Word (oder einen anderen editor) und speichern als RTF?Überprüfen Sie auch diese W3C-link.
Es ist der Die Fliegende Untertasse Projekt lassen Sie die XHTML Rendern von PDF.Vielleicht könnte verwendet werden, anstatt RTF, oder Sie die resultierende PDF-Datei umgewandelt werden kann, um RTF?