Pergunta

Estou tentando monitorar hits de página genuínos. Aqui está o que meu site faz. Eu tenho um diretório de artigos onde as pessoas podem publicar artigos. Quando o artigo é publicado, eles são pagos, dependendo da quantidade de usuários exclusivos, visitam suas páginas. Portanto, os acertos de página são importantes. Aqui está o problema que estou enfrentando.

O que eu preciso:

  • Não quero rastrear hits de página por pequenos mecanismos de pesquisa ou robôs.
  • Gostaria que os 4 principais mecanismos de pesquisa surfassem no meu site, porque posso monitorá -los por endereço IP e não contar a visita como uma página. Isso não pode ser feito para os bots de spam, porque eles fazem um bom trabalho de aprovação como um mecanismo de busca humano ou grande verdadeiro.

Problemas:

  • Existem bots de spam na internet que não honram o arquivo robot.txt
  • Existem bots que tentam fingir ser um usuário humano real. Manipulando o agente do usuário e outras coisas no cabeçalho.
  • O desempenho pode sofrer sempre verificando o banco de dados para obter bons endereços IP
  • Um ser humano pode ignorar a captha apenas para permitir que seu robô visualize minhas páginas

Soluções possíveis:

  • Requer um captcha em todas as páginas. Se o captcha passar. Em seguida, registre o endereço IP como bom ou envie um cookie na máquina de usuários indicando que eles passaram.
  • Permita todos os principais mecanismos de pesquisa endereço IP, para que eles não sejam apresentados com um captcha
  • Compre um software de detecção de bot
  • Exigir que o espectador passe um captca a cada 7 dias

Obter visualizações precisas de página humana é fundamental para que este site funcione corretamente. Vocês têm outras idéias

Foi útil?

Solução

Você poderia simplesmente deixar isso para Google Analytics. Ele faz um trabalho muito bom resolvendo o tipo de problema que você está tentando resolver e é gratuito.

Outras dicas

Você tem um motivo para não usar um serviço ou solução existente?

Se você deseja apenas monitorar os acertos de página, configure o Google Analytics ou um serviço semelhante no seu site e eles farão um trabalho melhor para filtrar o ruído do que uma solução enrolada à mão poderia.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top