إزالة الملفات التي تم تحميلها من Google عندما ينتهي صلاحية العنصر

StackOverflow https://stackoverflow.com/questions/2304959

  •  21-09-2019
  •  | 
  •  

سؤال

نحن نستخدم خدمة Google CSE (محرك البحث المخصص) لفهرسة المحتوى على موقعنا. تم تصميم الموقع من صفحات PHP التي يتم تجميعها في معظمها مع ملفات تشمل ، ولكن هناك بعض الصفحات الديناميكية التي تسحب المعلومات من قاعدة بيانات إلى قالب صفحة واحدة (إصدارات جديدة على سبيل المثال). المشكلة التي لدينا هي أنه يمكنني تعيين تاريخ انتهاء الصلاحية على المحتوى في قاعدة البيانات ، لذا قل "المعرف = 2" سيؤدي إلى عرض "انتهت صلاحية هذا المحتوى". ومع ذلك ، إذا كان لدى ID 2 PDF تم تحميله المرفق به ، يبقى ملف PDF في فهرس البحث.

أعلم أنه يمكنني كتابة برنامج نصي للتنظيف وتشغيله cron الذي ينظر إلى DB ، ويجد محتوى منتهي الصلاحية ، والتحقق لمعرفة ما إذا كانت أي ملفات تم تحميلها قد تم إرفاقها وإما إعادة تسمية أو تزيلها ، ولكن يجب أن يكون هناك حل أفضل (آمل أن يكون هناك حل أفضل (آمل ).

واسمحوا لي أن أعرف إذا كنت قد واجهت هذا في الماضي ، وما تقترحه.

شكرا.

هل كانت مفيدة؟

المحلول 2

ما انتهى بنا الأمر هو ربط البرنامج النصي للتحقق إلى البرنامج النصي للتحميل الذي بمجرد الانتهاء من التحميل الحالي ، كانت الملفات القديمة "غير مرتبطة" وتم حذف سجلات DB.

بالنسبة لنا ، يعمل هذا لأنه نوع من موقف "إضافة واحد/إزالة واحد" حيث نريد أن يظهر عدد محدد من العناصر في ترتيب متداول.

نصائح أخرى

للأسف ، لا توجد طريقة لإعطائك إجابة مباشرة في هذا الوقت: ليس لدينا أي معرفة بكيفية "إرفاق" PDF الخاص بك على صفحاتك أو كيفية تنظيم ديسيبل الخاص بك.

أفضل حل هو إنشاء ملف robots.txt الملف الذي يحظر عناوين URL لملفات PDF معينة التي تريد إزالتها. ستقوم Google بإسقاطهم من الفهرس في ممره التالي (عادة في حوالي ساعة).

http://www.robotstxt.org/

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top