Rieles: Detección de IPS BOT para moverse por adelantado.

https://stackoverflow.com//questions/10669496

12-12-2019
|

Pregunta

Tengo una aplicación que registra clics por los usuarios.El problema es que estos clics están siendo empujados a través de Twitter, lo que acorta cada enlace individual con T.co.Debido a esto, Twitter parece afectar el vínculo entre 7-15 veces desde diferentes IP, probablemente para hacer cosas como la protección de la tala y el spam.El problema es que este registra 7-15 "clics" en mi aplicación que no vino de los usuarios reales.

Me pregunto si hay una manera de detectar si una visita proviene de un usuario real o simplemente está siendo curvado o algo de la clase de un bot o araña.

El único método que parecía haber trabajado estaba usando http://www.projecthoneypot.org/ API API para ver si la IPS que golpea a mi sitio viene de los bots conocidos.Encontré una gema para ayudar (http://cl.ly/glt8), pero seguí recibiendo un error de DNS neto mientras intentaba usarlo.

Estoy recién salido de las ideas.Realmente apreciaría cualquier asistencia!

Solución

Twitter debe establecer su encabezado HTTP de User-Agent: para que pueda filtrarlos.Esto se puede forjar, por supuesto, pero es un comienzo.

Puede obtener el encabezado en rieles con request.headers["User-Agent"].

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow