Frage

Ich lese große Dokumente, aus denen ich nur Top 5% benötigen, kann ich folgende mit Httpclient 4?

Sie
  1. Fordern Sie die Seite (get oder post)
  2. Lese-Antwort als Stream
  3. Ziehen sie in SAX-basierten HTML-Parser "on the fly"
  4. Wenn bestimmte HTML-Tag erkannt wird - beenden Sie den Strom

Bitte beachten Sie, dass Httpclient v 4 erforderlich ist. - Ich nicht v verwenden kann 3

.
War es hilfreich?

Lösung

Dank Ken von Httpclient-Mail-Liste hier ist die Antwort

  

Mit dem HttpEntity # getContent ()   Verfahren, die eine
zurück   java.io.InputStream, und übergeben, das zu   Ihr SAX-basierte HTML-Parser.

     

http://hc.apache.org/httpcomponents -Client / tutorial / html / fundamentals.html # d4e122

     

Wenn Sie sehen, den Tag, das Sie benötigen,   beendet die Anforderung über den Aufruf des   HttpUriRequest # abbrechen () -Methode.

     

http://hc.apache.org/httpcomponents -Client / tutorial / html / fundamentals.html # d4e285

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top