سؤال

أنا أقرأ المستندات الكبيرة التي أحتاج منها فقط 5٪، هل يمكنني القيام بما يلي باستخدام HTTPClient 4؟

  1. طلب الصفحة (الحصول على أو النشر)
  2. قراءة الاستجابة كدفق
  3. إطعامها في محلل HTML المستندة إلى SAX "على الطاير"
  4. عند اكتشاف بعض علامة HTML - إنهاء الدفق

يرجى ملاحظة أن HTTPClient v. 4 مطلوب - لا أستطيع استخدام v. 3

هل كانت مفيدة؟

المحلول

بفضل KEN من قائمة بريد Hert Here هي الإجابة

استخدم طريقة GetContent # HetContent ()، والتي ترجع
java.io.inputstream، وتمرير ذلك إلى محلل HTML المستندة إلى SAX.

http://hc.apache.org/httpcomponents-client/tutorial/html/fundamentals.html#d4e122.

عندما ترى العلامة التي تحتاجها، قم بإنهاء الطلب عبر استدعاء أسلوب HttpurireQuest # إحباط ().

http://hc.apache.org/httpcomponents-client/tutorial/html/fundamentament.html#d4e285.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top