لماذا JSOUP تحليل خطأ رمز HTML الخاص بي؟
-
13-12-2019 - |
سؤال
أحاول تحليل صفحة ويب، لكن عندما أرغب في الحصول على نص من النص في الصفحة.JSOUP الحصول على وثيقة خاطئة عندما استدعاء jsoup.parse () و jsoup.connect (). الحصول على ().
هذه هي قطعة من صفحة الويب والرمز الخاص بي.Doc Var لديه دوم خاطئ.
giveacodicetagpre.النتيجة المتغيرة Doc1 هي:
giveacodicetagpre.هل فعلت شيئا خاطئا؟
المحلول
إذا كنت تشير إلى علامات و فقط JSOUP التفاف شظيتك داخل قذيفة مستند مناسب.
ابتداء من XML الخاص بك:
giveacodicetagpre.يحتوي على متداخلة
- هذا ليس ستقيد HTML & JSOUP صالح لك.يتم شرح الفقرات التعشيش بالتفصيل هنا - باختصار - فهي مغلقة تلقائية، مما يؤدي إلى تختلف دومك عن ما توقعته.
النظر في تحويل الجزء الخارجي
في ويجب أن تكون على ما يرام.
لا تنتمي إلى StackOverflow