Domanda

Sono stato alla ricerca sui browser senza testa a disposizione fino ad oggi e ha trovato HtmlUnit utilizzato abbastanza ampiamente. Abbiamo qualche alternativa al HtmlUnit con possibile vantaggio rispetto a HtmlUnit?

Grazie Nayn

È stato utile?

Soluzione 4

Ho intenzione di utilizzare selenio per il mio caso uso, dal momento che mi offre di utilizzare il vero e proprio browser e nessuna deviazione da quello che avrebbe reso nel mondo reale rispetto a HtmlUnit. Ho in programma di utilizzare Selenium2 che ha l'integrazione WebDriver e offre grandi API e raffreddare correzioni. Grazie Nayn

Altri suggerimenti

Per quanto ne so, HtmlUnit` è il più potente browser senza testa.

Che cosa sei problemi con esso?

Ci sono molte altre librerie che è possibile utilizzare per questo.

  • Se avete bisogno di dati base raschiare xml utilizzare JTidy .
  • Se avete bisogno di dati raschiare specifici da HTML è possibile utilizzare Jsoup .

Beh, io uso jsoup -. È più o meno velocemente di qualsiasi altro API

WebDriver con un framebuffer virtuale è l'unica vera alternativa. Il vantaggio è che usa un vero browser; lo svantaggio è che è più di un dolore da configurare, e l'API è molto più povera.

Io uso WebKit come un browser senza testa, attraverso il binding Python di Qt: http://www.riverbankcomputing.co.uk/static/Docs/PyQt4/html/qtwebkit.html

Webkit è il motore di rendering utilizzato da Chrome e Safari, ed è molto flessibile.

Una delle mie ragioni per scegliere sopra HtmlUnit era facilità di creazione:

sudo apt-get install python-qt4

consiglierei anche selenio. La grande caratteristica è che si può creare un client che si apre una pagina del browser che si può vedere cosa sta succedendo ad ogni passo. Inoltre, la creazione di macro per test automatizzati è un'altra caratteristica buona. Tuttavia, se avete bisogno di rottamare alcune informazioni dalla pagina web HtmlUnit è meglio di selenio.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top