我正在尝试监控真实的页面点击率。这就是我的网站所做的。我有一个文章目录,人们可以在其中发布文章。当他们的文章发布时,他们会根据访问其页面的唯一用户数量获得报酬。所以页面点击量很重要。这是我面临的问题。

我需要的:

  • 我不想跟踪小型搜索引擎或机器人的页面点击量。
  • 我希望四大搜索引擎都能浏览我的网站,因为我可以通过 IP 地址监控它们,而不会将它们的访问算作页面点击。对于垃圾邮件机器人来说这是无法做到的,因为它们在伪装成真人或主要搜索引擎方面做得很好。

问题:

  • 互联网上有垃圾邮件机器人不符合robot.txt文件
  • 有些机器人试图冒充真正的人类用户。通过操纵用户代理和标头中的其他内容。
  • 始终检查数据库是否有良好的 IP 地址可能会影响性能
  • 人类可以绕过验证码,只允许他们的机器人查看我的页面

可能的解决方案:

  • 每个页面都需要验证码。如果验证码通过。然后将 IP 地址记录为良好,或者在用户计算机上提交一个 cookie,表明他们通过了。
  • 允许所有主要搜索引擎 IP 地址,因此它们不会出现验证码
  • 购买机器人检测软件
  • 要求查看者每 7 天通过一次验证码

获得准确的人工页面浏览量对于该网站的正常运行至关重要。你们还有其他想法吗

有帮助吗?

解决方案

你可以把它留给 谷歌分析. 。它可以很好地解决您想要解决的问题,而且是免费的。

其他提示

您有理由不使用现有的服务或解决方案吗?

如果您只想监控页面点击量,请在您的网站上设置 Google Analytics 或类似服务,它们会比手动解决方案更好地过滤噪音。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top