您可以在Heroku上部署Watir来生成HTML快照吗?如果是这样,怎么样?
-
02-10-2019 - |
题
Google的 使AJAX应用程序可爬网的完整规范 建议使用 htmlunit... 看 如何创建HTML快照? 点#3。
HTMLUNIT是仅Java的无头浏览器仿真器;不幸的是,Jruby在Heroku上不是一个选择。因此,据我所知,htmlunit被排除在外。
如果您有兴趣,我还有另一个有关HTMLUNIT作为Google App Engine托管的服务的问题...使Ajax应用程序可爬网?如何在Google App Engine上构建简单的Web服务以生产HTML快照? ...仍在等待一个经过验证的示例/答案。
解决方案
否。您需要一个完整的桌面环境来运行watir。 Heroku没有为您提供。
您可以使用诸如Amazon EC2之类的服务
其他提示
是的你可以
将watir与phantomjs一起使用,这是无头的
browser = Watir::Browser.new :phantomjs
要在Heroku上使用Phantomjs,您需要使用 Heroku Phantomjs Build Pack
Troelskin的答案是不正确的。有一些方法可以通过Watir运行“无头”浏览器,而Watir不需要“完整的桌面环境”。话虽如此,我不知道哪种方法可能适合Heroku。
其他“无头”自动化选项(如果您使用的Ruby)以及(可选的)Nokogiri机械化。
不隶属于 StackOverflow