Pregunta

Tengo una aplicación que registra clics por los usuarios.El problema es que estos clics están siendo empujados a través de Twitter, lo que acorta cada enlace individual con T.co.Debido a esto, Twitter parece afectar el vínculo entre 7-15 veces desde diferentes IP, probablemente para hacer cosas como la protección de la tala y el spam.El problema es que este registra 7-15 "clics" en mi aplicación que no vino de los usuarios reales.

Me pregunto si hay una manera de detectar si una visita proviene de un usuario real o simplemente está siendo curvado o algo de la clase de un bot o araña.

El único método que parecía haber trabajado estaba usando http://www.projecthoneypot.org/ API API para ver si la IPS que golpea a mi sitio viene de los bots conocidos.Encontré una gema para ayudar (http://cl.ly/glt8), pero seguí recibiendo un error de DNS neto mientras intentaba usarlo.

Estoy recién salido de las ideas.Realmente apreciaría cualquier asistencia!

¿Fue útil?

Solución

Twitter debe establecer su encabezado HTTP de User-Agent: para que pueda filtrarlos.Esto se puede forjar, por supuesto, pero es un comienzo.

Puede obtener el encabezado en rieles con request.headers["User-Agent"].

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top