هل هناك طريقة لمنع GoogleBOT من فهرسة أجزاء معينة من الصفحة؟

StackOverflow https://stackoverflow.com/questions/1497445

سؤال

هل من الممكن التوجيهات القابلة للتغيب عن جوجل إلى حد ما أنه سوف يتجاهل جزء من الصفحة، ومع ذلك لا يزال مؤشر الباقي؟

هناك بضعة قضية مختلفة صادفناها والتي سيساعدها هذا، مثل:

  • RSS Feed / News Ticker-Type Type على صفحة عرض محتوى من مصدر خارجي
  • المستخدمين الذين يدخلون الهاتف الاتصال إلخ. التفاصيل الذين يريدون منهم مرئيا على الموقع ولكنهم يفضلون عدم وجود جوجل

أنا أدرك أنه يمكن معالجة كل من أعلاه عبر تقنيات أخرى (مثل كتابة المحتوى مع JavaScript)، لكنني أتساءل عما إذا كان أي شخص يعرف ما إذا كان هناك خيار أنظف متاح بالفعل من Google؟

لقد قمت بعمل بعض الحفر على هذا واترك googleon و googleoff كذا, ، ولكن يبدو أن هذه حصرية لأجهزة البحث Google.

هل يعرف أحد إذا كان هناك مجموعة مماثلة من العلامات التي ستتزوها googlebot؟

يحرر: فقط للتوضيح، لا أريد أن أذهب إلى أسفل المسار الخطير للتخداخ / خدمة محتوى مختلف إلى Google، وهذا هو السبب في أنني أتطلع إلى معرفة ما إذا كانت هناك طريقة "شرعية" لتحقيق ما أود أن إفعلها هنا.

هل كانت مفيدة؟

المحلول

ما تسأل عنه، لا يمكن فعله حقا، تأخذ Google إما الصفحة بأكملها، أو لا أحد منها.

يمكنك القيام ببعض الحيل متستر على الرغم من إدراج جزء الصفحة التي لا تريد فهرستها في iFrame واستخدم Robots.txt لطرح Google ألا فهرسة iFrame.

نصائح أخرى

باختصار لا - إلا إذا كنت تستخدم الإفاخاء مع تثبيط Google.

يرجى التحقق من الوثائق الرسمية من هنا

http://code.google.com/apis/searchappliance/documentation/46/admin_crawl/preparing.html.

انتقل إلى القسم "باستثناء النص غير المرغوب فيه من الفهرس"

<!--googleoff: index-->
here will be skipped
<!--googleon: index-->

وجدت موردا مفيدا لاستخدام محتوى مكرر معين وليس السماح بالفهرس عن طريق محرك البحث لمثل هذا المحتوى.

<p>This is normal (X)HTML content that will be indexed by Google.</p>

<!--googleoff: index-->

<p>This (X)HTML content will NOT be indexed by Google.</p>

<!--googleon: index>

في الخادم الخاص بك اكتشاف BOT البحث عن طريق IP باستخدام PHP أو ASP. ثم قم بتغذية عناوين IP التي تندرج في تلك القائمة إصدار الصفحة التي ترغب في فهرستها. في هذا الإصدار الصديق لمحرك البحث من صفحتك استخدام علامة الارتباط الكنسي لتحديد محرك البحث إصدار الصفحة التي لا تريد أن يتم فهرستها.

وبهذه الطريقة سيتم فهرسة الصفحة التي تريد أن تكون المحتوى الذي تريد أن تكون فهرس من خلال العنوان فقط بينما سيتم فهرسة المحتوى الوحيد الذي ترغب في فهرسته. لن تحصل هذه الطريقة على حظرها بواسطة محركات البحث وهي آمنة تماما.

نعم بالتأكيد يمكنك إيقاف Google من فهرسة بعض أجزاء موقع الويب الخاص بك عن طريق إنشاء Robots.txt مخصص واكتب الأجزاء التي لا تريد فهرسها مثل WPADMINS أو منشور أو صفحة معينة حتى تتمكن من القيام بذلك بسهولة عن طريق إنشاء هذه الروبوتات بسهولة. ملف TXT. قبل إنشاء التحقق من موقعك Robots.txt على سبيل المثال www.yoursite.com/robots.txt.

جميع محركات البحث إما فهرس أو تجاهل الصفحة بأكملها. الطريقة الممكنة الوحيدة لتنفيذ ما تريده هو:

(أ) لديك إصدارات مختلفة من نفس الصفحة

(ب) اكتشاف المتصفح المستخدم

(ج) إذا كان محرك بحث، تخدم الإصدار الثاني من صفحتك.

هذا الرابط قد تكون مفيدة.

هناك علامات تيا لروبوتات، وهناك أيضا Robots.txt، يمكنك من خلالها تقييد الوصول إلى أدلة معينة.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top