Das Lesen und endet Strom in Httpclient 4
-
18-09-2019 - |
Frage
Ich lese große Dokumente, aus denen ich nur Top 5% benötigen, kann ich folgende mit Httpclient 4?
Sie- Fordern Sie die Seite (get oder post)
- Lese-Antwort als Stream
- Ziehen sie in SAX-basierten HTML-Parser "on the fly"
- Wenn bestimmte HTML-Tag erkannt wird - beenden Sie den Strom
Bitte beachten Sie, dass Httpclient v 4 erforderlich ist. - Ich nicht v verwenden kann 3
.Lösung
Dank Ken von Httpclient-Mail-Liste hier ist die Antwort
Mit dem HttpEntity # getContent () Verfahren, die eine
zurück java.io.InputStream, und übergeben, das zu Ihr SAX-basierte HTML-Parser.http://hc.apache.org/httpcomponents -Client / tutorial / html / fundamentals.html # d4e122
Wenn Sie sehen, den Tag, das Sie benötigen, beendet die Anforderung über den Aufruf des HttpUriRequest # abbrechen () -Methode.
http://hc.apache.org/httpcomponents -Client / tutorial / html / fundamentals.html # d4e285
Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow