Pregunta

He estado investigando acerca de los navegadores disponibles sin cabeza hasta la fecha y encontré HtmlUnit siendo utilizado muy ampliamente. ¿Tenemos alguna alternativa a HtmlUnit con una posible ventaja en comparación con HtmlUnit?

Gracias Nayn

¿Fue útil?

Solución 4

Voy a utilizar selenio para mi caso de uso, ya que me ofrece de utilizar el navegador real y sin desviarse de lo que haría en el mundo real, en comparación con HtmlUnit. Tengo la intención de utilizar Selenium2 que tiene la integración WebDriver y ofrece grandes principios activos y de enfriar correcciones. Gracias Nayn

Otros consejos

Por lo que yo sé, HtmlUnit` es el navegador más potente sin cabeza.

¿Qué eres problemas con ella?

Hay muchas otras bibliotecas que se pueden utilizar para esto.

  • Si necesita bases de datos XML raspadura usar JTidy .
  • Si necesita datos específicos raspadura de HTML que puede utilizar Jsoup .

Bueno, yo uso jsoup -. Que es bastante mucho más rápido que cualquier otra API

WebDriver con un uso de este dispositivo virtual es la única alternativa real. La ventaja es que utiliza un navegador real; la desventaja es que es más de un dolor de configurar, y la API es mucho más pobre.

Yo uso WebKit como navegador sin cabeza, a través de enlaces Python de Qt: http://www.riverbankcomputing.co.uk/static/Docs/PyQt4/html/qtwebkit.html

Webkit es el motor de procesamiento utilizado por Chrome y Safari, y es muy flexible.

Una de mis razones para elegir lo más HtmlUnit era más fácil establecimiento de:

sudo apt-get install python-qt4

también recomendaría selenio. La gran característica es que puede crear un cliente que abre una página del navegador que se puede ver lo que está pasando en cada paso. Por otra parte, la creación de macros para pruebas automatizadas es otra característica bueno. Sin embargo, si es necesario desechar alguna información de la página web HtmlUnit es mejor que el selenio.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top