سؤال
لدي سلسلة Java مع SGML ، شيء من هذا القبيل ...
<misspell></misspell><plain>I</plain> <plain>know</plain> <plain>you</plain> <suggestion>ducky</suggestion> <plain>suck</plain> <plain>and</plain> <plain>I</plain> <plain>rocky</plain> <plain>rock</plain>
كيف يمكنني تحليلها للحصول على النص على سبيل المثال <suggestion> </suggestion>
حتى للحصول على "Ducky" ؟؟
هل يمكن أن يكون javax.swing.text.html.parser.parse أي مساعدة؟ أو لا يمكنني سوى تحليل مستندات HTML معها؟
نصائح أخرى
جرب محلل HTML ، فهي (بالضرورة) تسامح تمامًا من العلامات المشوهة و HTML بطبيعتها تستند إلى SGML.
على سبيل المثال http://htmlparser.sourceforge.net/
لا تنتمي إلى StackOverflow