HttpClient 4 でのストリームの読み取りと終了

https://stackoverflow.com/questions/1289629

18-09-2019
|

質問

上位 5% のみが必要な大きなドキュメントを読んでいます。HttpClient 4 で次のことを実行できますか?

ページをリクエストする (取得または投稿)
応答をストリームとして読み取る
それを「その場で」SAX ベースの HTML パーサーにフィードします。
特定の HTML タグが検出された場合 - ストリームを終了します

HttpClient v.4 は必須です - v は使用できません。3

解決

のHttpClientメールリストからケンのおかげで、ここでの答えです。

HttpEntity＃のgetContent（）を使用して、
を返すメソッド、   java.io.InputStreamを、およびにそれを渡すと、   あなたのSAXベースのHTMLパーサます。

http://hc.apache.org/httpcomponents -client /チュートリアル/ HTML / fundamentals.html＃d4e122する

あなたが必要なタグが表示されたら、   呼び出しを経由して要求を終了   HttpUriRequest＃（）メソッドを中止します。

http://hc.apache.org/httpcomponents -client /チュートリアル/ HTML / fundamentals.html＃d4e285する

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow