سؤال

أحاول تحليل صفحة ويب، لكن عندما أرغب في الحصول على نص من النص في الصفحة.JSOUP الحصول على وثيقة خاطئة عندما استدعاء jsoup.parse () و jsoup.connect (). الحصول على ().

هذه هي قطعة من صفحة الويب والرمز الخاص بي.Doc Var لديه دوم خاطئ.

giveacodicetagpre.

النتيجة المتغيرة Doc1 هي:

giveacodicetagpre.

هل فعلت شيئا خاطئا؟

هل كانت مفيدة؟

المحلول

إذا كنت تشير إلى علامات و فقط JSOUP التفاف شظيتك داخل قذيفة مستند مناسب.

ابتداء من XML الخاص بك:

giveacodicetagpre.

يحتوي على متداخلة

- هذا ليس ستقيد HTML & JSOUP صالح لك.يتم شرح الفقرات التعشيش بالتفصيل هنا - باختصار - فهي مغلقة تلقائية، مما يؤدي إلى تختلف دومك عن ما توقعته.

النظر في تحويل الجزء الخارجي

في ويجب أن تكون على ما يرام.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top