我一直在研究关于无头的浏览器提供的,直到新的和现HtmlUnit正在使用很广泛。我们是否有任何替代HtmlUnit与可能的优势相比HtmlUnit?

感谢 Nayn

有帮助吗?

解决方案 4

我要使用Selenium给我使用的情况下,因为它提供了我使用从它会在现实世界相比,呈现的HtmlUnit真正的浏览器,不走样。 我打算用Selenium2具有的webdriver集成和提供了巨大的API和冷却修复。 谢谢 Nayn

其他提示

据我所知,HtmlUnit`是最有力的模拟浏览器。

什么是你用它发出?

您还可以使用许多其他库来实现此目的。

  • 如果您需要抓取 xml 基础数据,请使用 整洁.
  • 如果您需要从 HTML 中抓取特定数据,您可以使用 汤普.

我使用 jsoup - 它比任何其他 API 都要快得多。

的webdriver与虚拟帧缓冲器是唯一的真正的替代。其优点是,它使用一个真正的浏览器;的缺点是,它是一种痛苦的设置,并且所述API是要差得多。

我利用其作为一个无头的浏览器,通过夸脱的蟒蛇绑定: http://www.riverbankcomputing.co.uk/static/Docs/PyQt4/html/qtwebkit.html

其是呈现发动机使用的铬和野生动物园,并且非常灵活。

我的一个原因选择在HtmlUnit是便于设立:

sudo apt-get install python-qt4

我还建议硒。该大特点是,你可以创建一个打开一个浏览器页面,你可以看到发生了什么,在每一步的客户端。此外,自动化测试创建宏是另一个很好的功能。 但是,如果你需要从报废网页一些的HtmlUnit信息比硒更好。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top