Вопрос

У меня есть строка Java с SGML, что -то вроде этого ...

<misspell></misspell><plain>I</plain> <plain>know</plain> <plain>you</plain> <suggestion>ducky</suggestion> <plain>suck</plain> <plain>and</plain> <plain>I</plain> <plain>rocky</plain> <plain>rock</plain>

Как мне проанализировать, например, сказать текст внутри <suggestion> </suggestion>чтобы вытащить "Dacky" ??

Будет ли javax.swing.text.html.parser.parse может помочь? Или я могу проанализировать только HTML -документы с ним?

Это было полезно?

Решение

Строка, которую вы показываете, не HTML, но она может быть проанализирована XML -анализатор.

А Sax API является частью JDK и AFAIK, большинство анализаторов XML реализуют его.

Другие советы

Попробуйте HTML -анализатор, они (по необходимости) довольно прощают необработанную наценку, а HTML по своей природе на основе SGML.

например http://htmlparser.sourceforge.net/

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top