سؤال

وأنا أحاول أن تفعل XHTML DOM تحليل مع JTidy، ويبدو أن مهمة الحدس إلى حد ما. على وجه الخصوص، هناك طريقة لتحليل HTML:

Node Tidy.parse(Reader, Writer)

وللحصول على تلك العقدة، وأفترض، وأنا يجب أن تستخدم

Node Node.findBody(TagTable)

وأين يجب أن أحصل على سبيل المثال من أن TagTable؟ (محمي منشئ، وأنا لا يمكن العثور على مصنع لإنتاجه.)

وأنا استخدم JTidy 8.0 لقطة.

هل كانت مفيدة؟

المحلول

ولقد وجدت هناك <م> كثير أبسط طريقة لاستخراج الجسم:

tidy = new Tidy();
tidy.setXHTML(true);
tidy.setPrintBodyOnly(true);

وبعد ذلك استخدام مرتبة على الزوج قارئ الكاتب.

وبسيط كما ينبغي أن يكون.

نصائح أخرى

هل يمكن استخدام الأسلوب parseDOM بدلا من ذلك، التي من شأنها أن تعطيك org.w3c.dom.Document مرة أخرى:

Document document = Tidy.parseDOM(reader, writer);
Node body = document.getElementsByTagName("body").item(0);
مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top