HttpClient 4 でのストリームの読み取りと終了
-
18-09-2019 - |
質問
上位 5% のみが必要な大きなドキュメントを読んでいます。HttpClient 4 で次のことを実行できますか?
- ページをリクエストする (取得または投稿)
- 応答をストリームとして読み取る
- それを「その場で」SAX ベースの HTML パーサーにフィードします。
- 特定の HTML タグが検出された場合 - ストリームを終了します
HttpClient v.4 は必須です - v は使用できません。3
解決
のHttpClientメールリストからケンのおかげで、ここでの答えです。
HttpEntity#のgetContent()を使用して、
を返すメソッド、 java.io.InputStreamを、およびにそれを渡すと、 あなたのSAXベースのHTMLパーサます。http://hc.apache.org/httpcomponents -client /チュートリアル/ HTML / fundamentals.html#d4e122する
あなたが必要なタグが表示されたら、 呼び出しを経由して要求を終了 HttpUriRequest#()メソッドを中止します。
http://hc.apache.org/httpcomponents -client /チュートリアル/ HTML / fundamentals.html#d4e285する
所属していません StackOverflow