我必须经常与脆弱的遗产网站,打破在意想不到的方式,在逻辑或配置进行更新。

我没有时间或知识的系统需要创建一个 脚本。此外,我不想要检查一个特定的使用情况-我想验证每一个链接和网页的网站上。

我想创建一个自动化的系统测试,这将蜘蛛通过一个网站和检查断开链接和崩溃。理想情况下,会有一个工具,我可以用来实现这一点。它应该有尽可能多的以下特点,降序排列优先顺序为:

  • 引发通过剧本
  • 不需要人的互动
  • 下所有的锚链接,包括标签和链接CSS和js文件
  • 生产记录所有发现了404,500多等。
  • 可以部署在当地检查站点的内联网上
  • 支持cookie/形式基于身份验证
  • 免费/开源

有许多局部解决方案,就像 FitNesse, Firefox的LinkCheckerW3C的链接检查, 但他们没有我需要的一切。

我想利用这个试验项目使用一系列技术和平台,使更多的便携式的解决方案的更好。

我意识到这不能代替适当的系统测试,但是它将是非常有用的,如果我有一个方便和自动化方式的核实,没有任何部分网站被明显打破。

有帮助吗?

解决方案

我用 Xenu的链接猎犬 对于这样的事情。迅速检查没有deadlinks等。在一/任何地点。只是一点在任何URI就蜘蛛所有链接在该网站上。

Desription从网站:

Xenu的链接侦探(TM)检查网 网站为残破的联系。链接 核查是在"正常" 链接、图像、框架,插件, 背景、本地的图像地图、风格 床单、脚本和爪哇的小应用程序。它的 显示一个不断更新的名单 网址可以通过不同 标准。报告可以产生 任何时间。

它符合所有你要求除了正在编写脚本,因为它是windows的应用程序,需要手动开始。

其他提示

我们使用真的很喜欢Linkchecker:

http://wummel.github.io/linkchecker/

它的开放源,蟒蛇,命令行、境内部署,并且输出到各种各样的格式。开发商已经非常有帮助时,我们已经与他联系与的问题。

我们有红宝石的脚本,查询数据库的内部网站,开LinkChecker用适当的参数的每个网站,并分析XML,LinkChecker为我们提供了创建一个自定义的错误报告的每个网站在我们CMS。

什么部份你的清单并W3C的链接检查不满足吗?这将是一个我会使用。

或者, 斜纹 (蟒蛇的基础)是一个有趣的小语言对于这种事情。它有一个 链接检查模块 但我不认为它递归工作,所以,不是那么好对蜘蛛爬行.但是你可以修改它如果你舒服。我可能是错的,有可能被递归的选择。值得检查,无论如何。

你也许想尝试使用wget这一点。它可以蜘蛛网站,包括"网页的必要条件"(即文件),并可配置到日志的错误。我不知道它是否会有足够的信息,但它是免费的并可以在Windows(cygwin)以及unix。

盈石 是一个商业计划,似乎要做的,你想要什么(没有使用)。

如果我是你,我可能会写这种类的蜘蛛自己...

我不确定,它支持形式的认证,但它将处理的饼干,如果你能得到它会在网站上否则我认为 Checkbot 将尽一切都在你名单。我作为一个步骤,在建立过程之前检查,没有什么破在一个网站。这里有一个 例输出 在网站上。

我一直很喜欢 linklint 检查链接在一个网站。然而,我不认为这符合所有标准,特别是方面,可以JavaScript依赖。我还觉得它会错过的图像,从内部CSS。

但是蜘蛛爬行所有锚,它的伟大工程。

尝试 SortSite.它不是免费的,但似乎要做的一切你需要和更多。

或者, PowerMapper 从同一公司有一个类似但不同的方法。后一会给你下的有关信息的详细优化的网页,但仍然会确定的任何中断的链接,等等。

免责声明:我有一个金融公司感兴趣,使得这些产品。

尝试 http://www.thelinkchecker.com 它是一个网上应用程序,检查的数量出链接,网页排名,锚点、数量的出的链接。我认为这是解决方案需要。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top