目前,我正在使用CyberNeko在试图抓住信息,我想从一个网站。然而,我相信在网站检查的用户代理/浏览器的版本,保持从刚刚抓住的url内容。

我知道的使用htmlunit改变浏览器的版本,但不知道如果我可以去关于这种使用CyberNeko.

任何人都不会知道如果这是可能做到这样的事情?

有帮助吗?

解决方案

我从来没有使用CyberNeko,但我认为这只是一个HTML分析器,即我不认为你能用它来问题HTTP请求的和实际上 下载 该网页。

它可能是事实,HTTP发出的请求CyberNeko丢失的各种标题,如用户代理头。一个简单的方法来确保HTTP请求看起来像一个请求发自浏览器是使用异常的,而不是CyberNeko以下载的网页。有一些例子可代码 在这里,.

一旦你成功下载的页,使用CyberNeko解析出位你感兴趣。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top