Pregunta

Me gustaría detectar automáticamente Google y otros rastreadores e iniciar sesión en mi sitio web ASP.NET. ¿Alguien ha encontrado una manera confiable de hacer esto? La parte de inicio de sesión es fácil, sin embargo, detectarlos de manera confiable es el verdadero problema.

Saludos.

¿Fue útil?

Solución

Mira el agente de usuario. Debería ser googlebot. Una forma más confiable es hacer una búsqueda inversa de la dirección IP. Te dirá si es un robot de Google o no. Yo usaría ambos métodos. PERO NOTA: disminuirá la velocidad de su sitio ya que realizará una búsqueda inversa para cada visitante.

http://www.google.com /support/webmasters/bin/answer.py?hl=es&answer=80553

Otros consejos

Esto parece una muy mala idea por varias razones, entre ellas la de que Google almacenará en caché copias de sus páginas, de modo que incluso si no me autentico en su sitio, podré ver el contenido de páginas web y otros documentos servidos desde detrás de la parte protegida de su sitio web.

En cuanto a la detección de rastreadores web, no confiaría en ningún agente de usuario. Probablemente podría compilar una lista de direcciones IP de las que se originan los rastreadores, pero tan pronto como Google agregue otra dirección IP, negará el acceso del rastreador.

Hacer una búsqueda DNS inversa en cada solicitud para garantizar que el dominio del visitante sea googlebot.com como se sugiere en Verificar Googlebot podría ser un gran éxito si su sitio está ocupado.

No necesita realizar una búsqueda inversa en cada solicitud. Caché los resultados de la búsqueda inversa. Acabo de revisar mis registros y veo largas ejecuciones de Googlebot procedentes de la misma IP. Ese comportamiento no está garantizado, pero en cualquier caso el almacenamiento en caché debería ser una buena estrategia.

Puede dirigir fácilmente a Google para que indexe, pero no almacene en caché las páginas de su sitio utilizando la metaetiqueta noarchive. De esa forma, obtendrá los beneficios de poder realizar búsquedas sin exponer su contenido.

Consulte esta página en Google Webmaster central para obtener más información

http://www.google.com /support/webmasters/bin/answer.py?hl=es&answer=156412

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top