تكوين LucidWorks يشمل المسارات للزحف إلى أنواع معينة من الملفات فقط

StackOverflow https://stackoverflow.com//questions/12691190

  •  12-12-2019
  •  | 
  •  

سؤال

أحاول تكوين مصدر بيانات الويب LucidWorks لفهرسة أنواع ملفات معينة فقط.ومع ذلك، عندما قمت بتعيين تضمين المسارات ل .*\.html للزحف إلى ملفات .html فقط (كمثال مبسط)، سينتهي الأمر بفهرسة مجلد المستوى الأعلى فقط. عمق الزحف تم ضبطه على -1 وعندما أغادر تضمين المسارات فارغًا، فإنه يزحف إلى الشجرة الفرعية بأكملها كما هو متوقع.

لقد نظرت إلى وثائقهم ل إنشاء مصدر بيانات ويب, ، ولل استخدام التعبيرات العادية, ، ولا يمكن العثور على سبب لذلك .*\.html لن تنجح، منذ ذلك الحين .* يجب أن تتطابق مع أي حرف.

هل كانت مفيدة؟

المحلول

بينما كنت أصحح السؤال، خطرت لي فكرة وهو الحل الصحيح.أنشرها هنا للأجيال القادمة.


المحتوى الذي يتم الزحف إليه عبارة عن مشاركة ملف، لذا فهو يعتمد على قائمة دليل خادم الويب، والتي تمت تصفيتها لأنه لا يحتوي على ملحق .html.لذلك ببساطة إضافة .*/ إلى تضمين المسارات إصلاح المشكلة.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top