Question

J'ai un String Java avec SGML, quelque chose comme ça ...

<misspell></misspell><plain>I</plain> <plain>know</plain> <plain>you</plain> <suggestion>ducky</suggestion> <plain>suck</plain> <plain>and</plain> <plain>I</plain> <plain>rocky</plain> <plain>rock</plain>

Comment puis-je parse pour obtenir, par exemple, dire le texte à l'intérieur <suggestion> </suggestion>so pour obtenir « Ducky » out ??

Will javax.swing.text.html.parser.Parse peut être d'aucune aide? ou je ne peux parse documents HTML avec elle?

Était-ce utile?

La solution

La chaîne que vous présentez est pas le HTML, mais il pourrait être analysé par un analyseur XML .

Le API SAX fait partie des JDK et la plupart afaik parseurs XML mettre en œuvre.

Autres conseils

essayez un analyseur html, ils sont (par nécessité) pardonner assez de balisage malformé et html est par nature basée sur SGML.

par exemple. http://htmlparser.sourceforge.net/

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top