Domanda

Ho una stringa Java con SGML, qualcosa di simile ...

<misspell></misspell><plain>I</plain> <plain>know</plain> <plain>you</plain> <suggestion>ducky</suggestion> <plain>suck</plain> <plain>and</plain> <plain>I</plain> <plain>rocky</plain> <plain>rock</plain>

Come faccio a analizzarlo per ottenere per esempio dire il testo all'interno <suggestion> </suggestion>so da ottenere "Ducky" fuori ??

Will javax.swing.text.html.parser.Parse può essere di alcun aiuto? o posso solo documenti HTML parse con esso?

È stato utile?

Soluzione

La stringa si mostra non è HTML, ma potrebbe essere analizzato da un parser XML .

Il SAX API fa parte della maggior parte dei parser XML JDK e AFAIK implementarlo.

Altri suggerimenti

provare un parser HTML, essi sono (per necessità) abbastanza indulgente di markup malformati e HTML è per sua natura in base a SGML.

es. http://htmlparser.sourceforge.net/

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top