我有一个带有SGML的Java字符串,类似的东西...

<misspell></misspell><plain>I</plain> <plain>know</plain> <plain>you</plain> <suggestion>ducky</suggestion> <plain>suck</plain> <plain>and</plain> <plain>I</plain> <plain>rocky</plain> <plain>rock</plain>

我该如何解析以便说明里面的文字 <suggestion> </suggestion>为了“鸭子”出去吗?

javax.swing.text.html.parser.parse可以有任何帮助吗?还是我只能用它来解析HTML文档?

有帮助吗?

解决方案

您显示的字符串不是HTML,但可以通过 XML解析器.

萨克斯API 是JDK和AFAIK的一部分,大多数XML解析器实现它。

其他提示

尝试使用HTML解析器,(必要)非常宽容地标记,而HTML本质上是基于SGML的。

例如 http://htmlparser.sourceforge.net/

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top