تكوين LucidWorks يشمل المسارات للزحف إلى أنواع معينة من الملفات فقط
-
12-12-2019 - |
سؤال
أحاول تكوين مصدر بيانات الويب LucidWorks لفهرسة أنواع ملفات معينة فقط.ومع ذلك، عندما قمت بتعيين تضمين المسارات ل .*\.html
للزحف إلى ملفات .html فقط (كمثال مبسط)، سينتهي الأمر بفهرسة مجلد المستوى الأعلى فقط. عمق الزحف تم ضبطه على -1
وعندما أغادر تضمين المسارات فارغًا، فإنه يزحف إلى الشجرة الفرعية بأكملها كما هو متوقع.
لقد نظرت إلى وثائقهم ل إنشاء مصدر بيانات ويب, ، ولل استخدام التعبيرات العادية, ، ولا يمكن العثور على سبب لذلك .*\.html
لن تنجح، منذ ذلك الحين .*
يجب أن تتطابق مع أي حرف.
المحلول
بينما كنت أصحح السؤال، خطرت لي فكرة وهو الحل الصحيح.أنشرها هنا للأجيال القادمة.
المحتوى الذي يتم الزحف إليه عبارة عن مشاركة ملف، لذا فهو يعتمد على قائمة دليل خادم الويب، والتي تمت تصفيتها لأنه لا يحتوي على ملحق .html.لذلك ببساطة إضافة .*/
إلى تضمين المسارات إصلاح المشكلة.