我想使用 沃特, ,主持 Heroku.

Google的 使AJAX应用程序可爬网的完整规范 建议使用 htmlunit... 看 如何创建HTML快照? 点#3。

HTMLUNIT是仅Java的无头浏览器仿真器;不幸的是,Jruby在Heroku上不是一个选择。因此,据我所知,htmlunit被排除在外。

如果您有兴趣,我还有另一个有关HTMLUNIT作为Google App Engine托管的服务的问题...使Ajax应用程序可爬网?如何在Google App Engine上构建简单的Web服务以生产HTML快照? ...仍在等待一个经过验证的示例/答案。

有帮助吗?

解决方案

否。您需要一个完整的桌面环境来运行watir。 Heroku没有为您提供。

您可以使用诸如Amazon EC2之类的服务

其他提示

是的你可以

将watir与phantomjs一起使用,这是无头的

browser = Watir::Browser.new :phantomjs

要在Heroku上使用Phantomjs,您需要使用 Heroku Phantomjs Build Pack

Troelskin的答案是不正确的。有一些方法可以通过Watir运行“无头”浏览器,而Watir不需要“完整的桌面环境”。话虽如此,我不知道哪种方法可能适合Heroku。

其他“无头”自动化选项(如果您使用的Ruby)以及(可选的)Nokogiri机械化。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top