Pregunta

Tengo una cadena de Java con SGML, algo como esto ...

<misspell></misspell><plain>I</plain> <plain>know</plain> <plain>you</plain> <suggestion>ducky</suggestion> <plain>suck</plain> <plain>and</plain> <plain>I</plain> <plain>rocky</plain> <plain>rock</plain>

¿Cómo puedo analizarlo para obtener, por ejemplo, dicen que el texto dentro <suggestion> </suggestion>so de obtener "patito" fuera ??

Will javax.swing.text.html.parser.Parse puede ser de alguna ayuda? o puedo sólo documentos HTML de análisis sintáctico con ella?

¿Fue útil?

Solución

La cadena que mostrar no es HTML, pero podría ser analizado por un analizador XML .

El SAX API es parte de la mayoría de los analizadores XML JDK y que yo sepa ponerlo en práctica.

Otros consejos

probar un analizador de HTML, que son (por necesidad) bastante indulgente con marcado mal formado y HTML es, por naturaleza, basado en SGML.

por ejemplo. http://htmlparser.sourceforge.net/

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top