أي من محلات جافا HTML جيدة؟

سؤال

كنت أستخدم كوبرا حتى الآن بسبب سهولة الأمر ، لكن للأسف ، واجهت بعض المشكلات مع بعض حالات الاختبار. هل يقترح أي شخص مكتبة مجربة واختبارها؟

لقد جربت كوبرا بنيت في واحد و htmlcleaner دون أي حظ.

المحلول

Mozilla HTML Parser تبدو مثيرة للاهتمام إلى حد ما. بحكم التعريف ، من المفترض أن يكون جيدًا مثل محرك Gecko نفسه ، والذي من المحتمل أن يغطي احتياجاتك.

نصائح أخرى

TagSoup أمر رائع حقًا عند التعامل مع HTML/XHTML crappy.

أريحا (و nekohtml) هي جيدة أيضا لتحليل HTML غير صالحة.

Tagsoup و Jericho: حاول واختبار. Nekohtml: ردود الفعل من مصدر موثوق به.

ألق نظرة على سكسونية (لا ، أنا لست متورطًا في أي طريقة مع المنتج ، مجرد مستخدم راضٍ).

الإجابة على العنوان - السؤال العام والتعليقات لا يتكون

jtidy (http://jtidy.sourceforge.net/) هو منفذ Dave Raggett HTMLTIDY. إنه مفيد للغاية على الرغم من أنني أعتقد أن التنمية ربما تباطأ/توقف.

أقترح محلل المدقق, ، بناءً على خوارزمية تحليل HTML5. (Mozilla تعمل حاليًا على استبدال محلل HTML الخاص به بهذا.)

مرخصة بموجب: CC-BY-SA مع الإسناد

لا تنتمي إلى StackOverflow