El robot de Google está rastreando mi sitio y entrar en calificaciones en mi sistema de clasificación

StackOverflow https://stackoverflow.com/questions/3978499

  •  09-10-2019
  •  | 
  •  

Pregunta

Mi sistema de clasificación permite a los usuarios anónimos para añadir notas, pero rastreador de Google es de calificación cosas.

¿Cómo puedo estar seguro de que el robot de Google no va a seguir el enlace?

¿Fue útil?

Solución

No se debe aceptar una petición GET para cualquier acción que modifique los datos (con derecho a voto, la edición de un poste, etc.). Su votación debe hacerse a través de una petición POST, lo que no llevará a cabo el robot de Google.

Más información en este post SO: ¿Cuándo se usa POST y cuándo se utiliza GET?

Otros consejos

Utilice un robots.txt para señalar los vínculos que los robots no deben seguir. Por ejemplo, poner el siguiente en http://example.com/robots.txt

User-Agent: *
Disallow: /vote.php

Puede leer más sobre robots.txt aquí: http://www.robotstxt.org/

Google y cualquier otro robot de buen comportamiento van a leer y seguir las instrucciones en el archivo robots.txt.

Si también tiene problemas con los robots no seguir esas direcciones tendrá que código de alguna lógica para bloquear los robots, o al menos para disminuir su impacto. Puede, por ejemplo, registro de la cantidad de votos que consiguió con una dirección IP en un determinado tiempo y califican marco de bloque por encima de ese nivel. Otra solución puede ser para permitir sólo los mensajes, y también tienen cierta lógica JS (o similar) para bloquear los robots de spam, pero eso es mucho más trabajo que robots.txt tiempo por lo que sólo poner en él si se convierte en un problema.

También puede bloquear los malos-robots de comportarse en su totalidad mediante el bloqueo de sus direcciones IP en su servidor web. Hay algunas listas de malas-comportarse los robots por ahí puede probar si usted prefiere la solución de bloqueo.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top