سؤال

أنا أبحث عن مكتبة .NET يمكنها إنشاء شجرة Xml نظيفة، ومن الأفضل System.Xml.XmlDocument، من تعليمات HTML البرمجية غير الصالحة.أي.يجب أن تبذل قصارى جهدها في التخمينات والإصلاحات والاستبدالات التي تقوم بها المتصفحات عند مواجهة هذا الموقف، وإنشاء XmlDocument وهمي.يجب أيضًا أن تتم صيانة المكتبة جيدًا.:)

أدرك أن هذا كثير (أكثر من اللازم؟) لأطلبه، وسأكون ممتنًا لأي خيوط مفيدة.يبدو أن هناك عددًا لا بأس به من تطبيقات هذا لـ Java، لكنني أفضل عدم إنشاء الارتباطات الخاصة بي.لقد وجدت حتى الآن بالنسبة لـ .NET http://www.majestic12.co.uk/projects/html_parser.php و http://users.rcn.com/creitzel/tidy.html#dotnet, ، و http://sourceforge.net/projects/tidyfornet .

لم أقم بإنشاء أو اختبار أي من هذه العناصر حتى الآن، ولكن من المستندات (المتناثرة) والتحديثات النادرة لا يبدو أن لديهم ما أبحث عنه.فما هي التوصيات التي لديك، سواء من بين هذه الاختيارات، أو من تجربتك السابقة.

هل كانت مفيدة؟

المحلول

ال حزمة أجيليتي HTML تم تقييمه بدرجة عالية.سيقوم بالتأكيد بالتحليل/أفضل تخمين وما إلى ذلك.

النموذج مشابه بشكل مقصود لـ XmlDocument، بما في ذلك SelectNodes وما إلى ذلك للاستعلام.

إذا كنت بحاجة إلى إخراج XHTML، فهناك ملف OptionOutputAsXml علَم؛أفترض أن تعيين هذا على صحيح والاتصال Save النتائج في XHTML.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top