القضبان:اكتشاف عناوين IP الخاصة بالروبوتات للتغلب على أصوات التقصير

StackOverflow https://stackoverflow.com//questions/10669496

سؤال

لدي تطبيق يسجل نقرات المستخدمين.المشكلة هي أن هذه النقرات يتم دفعها عبر تويتر، مما يؤدي إلى اختصار كل رابط مع t.co.ولهذا السبب، يبدو أن تويتر قد وصل إلى الرابط ما بين 7 إلى 15 مرة من عناوين IP مختلفة، ربما للقيام بأشياء مثل التسجيل والحماية من الرسائل الاقتحامية (SPAM).تكمن المشكلة في أن هذا يسجل ما بين 7 إلى 15 "نقرة" على تطبيقي والتي لم تأتي من مستخدمين فعليين.

أتساءل عما إذا كانت هناك طريقة لاكتشاف ما إذا كانت الزيارة قادمة من مستخدم فعلي أم أنها مجرد عنوان URL أو شيء من هذا القبيل من روبوت أو عنكبوت.

الطريقة الوحيدة التي بدا أنها قد تنجح هي استخدام http://www.projecthoneypot.org/ واجهة برمجة التطبيقات لمعرفة ما إذا كانت عناوين IP التي تصل إلى موقعي تأتي من برامج الروبوت المعروفة.لقد وجدت جوهرة للمساعدة (http://cl.ly/GlT8) ولكني ظللت أتلقى خطأ NET DNS أثناء محاولة استخدامها.

أنا جديد من الأفكار.سوف نقدر حقا أي مساعدة!

هل كانت مفيدة؟

المحلول

يجب أن يحدد تويتر موقعه User-Agent: رأس http بشكل صحيح حتى تتمكن من تصفية تلك العناصر.يمكن تزوير هذا بالطبع لكنها البداية.

يمكنك الحصول على الرأس في القضبان باستخدام request.headers["User-Agent"].

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top