سؤال

غالبًا ما يتعين علي العمل مع مواقع الويب القديمة الهشة التي تنكسر بطرق غير متوقعة عند تحديث المنطق أو التكوين.

ليس لدي الوقت أو المعرفة بالنظام اللازم لإنشاء أ السيلينيوم النصي. علاوة على ذلك ، لا أريد التحقق من حالة استخدام محددة - أريد التحقق من كل رابط وصفحة على الموقع.

أرغب في إنشاء اختبار نظام تلقائي سيقوم بالعنكبوت من خلال موقع والتحقق من الروابط والتعطل المكسور. من الناحية المثالية ، سيكون هناك أداة يمكنني استخدامها لتحقيق ذلك. يجب أن يكون لأكبر عدد ممكن من الميزات التالية ، بترتيب تنازلي للأولوية:

  • نشأ عبر البرنامج النصي
  • لا يتطلب التفاعل البشري
  • يتبع جميع الروابط بما في ذلك علامات المرساة والروابط لملفات CSS و JS
  • ينتج سجل لجميع 404s و 500s وما إلى ذلك.
  • يمكن نشرها محليًا لفحص المواقع على الإنترانت
  • يدعم مصادقة ملفات تعريف الارتباط/النموذج
  • مصدر مجاني/مفتوح

هناك العديد من الحلول الجزئية هناك ، مثل اللياقة, Firefox's Linkchecker و مدقق ارتباط W3C, ، لكن لا أحد منهم يفعل كل ما أحتاجه.

أرغب في استخدام هذا الاختبار مع المشاريع باستخدام مجموعة من التقنيات والمنصات ، وبالتالي كلما كان الحل أفضل كلما كان ذلك أفضل.

أدرك أن هذا ليس بديلاً عن اختبار النظام المناسب ، ولكن سيكون من المفيد للغاية أن كان لدي طريقة مريحة وأتمتة للتحقق من عدم كسر أي جزء من الموقع بشكل واضح.

هل كانت مفيدة؟

المحلول

أنا أستعمل رابط Xenu Sleuth لهذا النوع من الأشياء. تحقق بسرعة من عدم وجود ارتباطات ميتة وما إلى ذلك على A/أي موقع. ما عليك سوى توجيهه إلى أي URI وسيقوم بجميع الروابط على هذا الموقع.

نزهة من الموقع:

يتحقق رابط Xenu Sleuth (TM) من مواقع الويب للحصول على روابط مكسورة. يتم التحقق من الارتباط على الروابط "العادية" ، الصور ، الإطارات ، المكونات الإضافية ، الخلفيات ، خرائط الصور المحلية ، أوراق الأنماط ، البرامج النصية والتطبيقات Java. يعرض قائمة عناوين URL محدثة باستمرار والتي يمكنك فرزها وفقًا لمعايير مختلفة. يمكن إنتاج تقرير في أي وقت.

يفي بكل متطلباتك بصرف النظر عن كونك قابلاً للنص لأنه تطبيق Windows يتطلب بدءًا يدويًا.

نصائح أخرى

نحن نستخدم ونحب حقًا LinkChecker:

http://wummel.github.io/linkchecker/

إنه مفتوح المصدر ، بيثون ، سطر القيادة ، قابل للنشر داخليًا ، ويخرج إلى مجموعة متنوعة من التنسيقات. كان المطور مفيدًا للغاية عندما اتصلنا به في القضايا.

لدينا برنامج نصي Ruby الذي يستفسر عن قاعدة بياناتنا للمواقع الداخلية ، وبدء تشغيل LinkChecker مع المعلمات المناسبة لكل موقع ، وتوصيف XML الذي يمنحنا LinkChecker إنشاء تقرير خطأ مخصص لكل موقع في CMS لدينا.

أي جزء من قائمتك لا يلتقي مدقق ارتباط W3C؟ سيكون هذا هو الشخص الذي سأستخدمه.

بدلاً عن ذلك، نسيج قطني طويل (قائم على بيثون) هي لغة صغيرة مثيرة للاهتمام لهذا النوع من الأشياء. لديها وحدة مدقق الارتباط لكنني لا أعتقد أنه يعمل بشكل متكرر ، لذلك هذا ليس جيدًا للعنصار. ولكن يمكنك تعديله إذا كنت مرتاحًا لذلك. وقد أكون مخطئًا ، قد يكون هناك خيار متكرر. يستحق التدقيق ، على أي حال.

قد ترغب في محاولة استخدام WGET لهذا الغرض. يمكن أن يعتنق موقعًا بما في ذلك "متطلبات الصفحة" (ملفات IE) ويمكن تكوينه لتسجيل أخطاء. لا أعرف ما إذا كان سيكون لها معلومات كافية لك ولكنها مجانية ومتاحة على Windows (Cygwin) وكذلك UNIX.

شون هو برنامج تجاري يبدو أنه يفعل ما تريد (لم تستخدمه).

إذا كنت في حذائك ، فربما أكتب هذا النوع من العنكبوت بنفسي ...

لست متأكدًا من أنه يدعم مصادقة النموذج ولكنه سيتعامل مع ملفات تعريف الارتباط إذا تمكنت CheckBot سوف تفعل كل شيء في قائمتك. لقد استخدمت كخطوة في عملية الإنشاء قبل التحقق من عدم كسر أي شيء على الموقع. هناك مثال الإخراج على الموقع.

لقد أحببت دائما Linklint للتحقق من الروابط على الموقع. ومع ذلك ، لا أعتقد أنه يفي بجميع معاييرك ، وخاصة الجوانب التي قد تعتمد على JavaScript. أعتقد أيضًا أنه سيغيب عن الصور التي تسمى من داخل CSS.

ولكن لإنشاء جميع المراسي ، فإنه يعمل بشكل رائع.

محاولة نوعا ما. إنه ليس مجانيًا ، ولكن يبدو أنه يفعل كل ما تحتاجه وأكثر من ذلك.

بدلاً عن ذلك، PowerMapper من نفس الشركة لديها نهج مماثل ولكن يتراوح بينها. سوف يمنحك هذا الأخير معلومات أقل حول التحسين التفصيلي لصفحاتك ، ولكن لا يزال يحدد أي روابط مكسورة ، إلخ.

إخلاء المسئولية: لدي مصلحة مالية في الشركة التي تصنع هذه المنتجات.

محاولة http://www.thelinkchecker.com إنه تطبيق عبر الإنترنت يتحقق من عدد الروابط الصادرة ، ورتبة الصفحة ، ومرساة ، وعدد الروابط الصادرة. أعتقد أن هذا هو الحل الذي تحتاجه.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top