نوعا من إزالة الروابط الداخلية من ملفات XML ويكيبيديا؟
سؤال
إذا قمت بتحميل ويكيبيديا مقالب XML، هل هناك أي طريقة لإزالة جميع الروابط الداخلية من داخل ملف XML؟
والشكر
المحلول
وشيء واحد يمكن أن تفعله، إذا كنت استيرادها في ويكي المحلي، هو استيراد جميع الملفات التي تريد، ثم استخدام الروبوت (على سبيل المثال. <وأ href = "http://pywikipediabot.sourceforge.net/ "يختلط =" نوفولو noreferrer "> pywikipediabot هي سهلة الاستخدام) للتخلص من جميع الروابط الداخلية.
نصائح أخرى
وتقع مقالب قاعدة بيانات ويكيبيديا والمعلومات حول استخدامها هنا: ويكيبيديا: قاعدة بيانات تحميل أ >. يجب القيام بذلك بدلا من كتابة السيناريو لكشط ويكيبيديا.
وأود أن محاولة استخدام XSLT لتحويل ملف XML في ملف XML آخر.
هل يمكن القيام بعملية بحث واستبدال في محرر النصوص المفضل لديك، لتحل محل [[و]] مع أي شيء.
لا تنتمي إلى StackOverflow