Rieles: Detección de IPS BOT para moverse por adelantado.
-
12-12-2019 - |
Pregunta
Tengo una aplicación que registra clics por los usuarios.El problema es que estos clics están siendo empujados a través de Twitter, lo que acorta cada enlace individual con T.co.Debido a esto, Twitter parece afectar el vínculo entre 7-15 veces desde diferentes IP, probablemente para hacer cosas como la protección de la tala y el spam.El problema es que este registra 7-15 "clics" en mi aplicación que no vino de los usuarios reales.
Me pregunto si hay una manera de detectar si una visita proviene de un usuario real o simplemente está siendo curvado o algo de la clase de un bot o araña.
El único método que parecía haber trabajado estaba usando http://www.projecthoneypot.org/ API API para ver si la IPS que golpea a mi sitio viene de los bots conocidos.Encontré una gema para ayudar (http://cl.ly/glt8), pero seguí recibiendo un error de DNS neto mientras intentaba usarlo.
Estoy recién salido de las ideas.Realmente apreciaría cualquier asistencia!
Solución
Twitter debe establecer su encabezado HTTP de User-Agent:
para que pueda filtrarlos.Esto se puede forjar, por supuesto, pero es un comienzo.
Puede obtener el encabezado en rieles con request.headers["User-Agent"]
.