Frage

Ich habe einen Java-String mit SGML, so etwas wie dieses ...

<misspell></misspell><plain>I</plain> <plain>know</plain> <plain>you</plain> <suggestion>ducky</suggestion> <plain>suck</plain> <plain>and</plain> <plain>I</plain> <plain>rocky</plain> <plain>rock</plain>

Wie analysiere ich es zum Beispiel bekommen sagen Sie den Text innerhalb <suggestion> </suggestion>so als „Ducky“ out ??

zu bekommen

Will javax.swing.text.html.parser.Parse kann eine Hilfe sein? oder kann ich nur Parse-HTML-Dokumente mit ihm?

War es hilfreich?

Lösung

Die Zeichenfolge, die Sie zeigen, ist nicht HTML, aber es könnte von ein XML-Parser analysiert werden .

Die SAX API ist Teil der JDK und AFAIK meisten XML-Parser es implementieren.

Andere Tipps

versuchen, einen HTML-Parser, sie sind (notgedrungen) ganz verzeiht mißgebildeter Markup und HTML ist von Natur aus auf Basis von SGML.

z. http://htmlparser.sourceforge.net/

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top