質問

上位 5% のみが必要な大きなドキュメントを読んでいます。HttpClient 4 で次のことを実行できますか?

  1. ページをリクエストする (取得または投稿)
  2. 応答をストリームとして読み取る
  3. それを「その場で」SAX ベースの HTML パーサーにフィードします。
  4. 特定の HTML タグが検出された場合 - ストリームを終了します

HttpClient v.4 は必須です - v は使用できません。3

役に立ちましたか?

解決

のHttpClientメールリストからケンのおかげで、ここでの答えです。

  

HttpEntity#のgetContent()を使用して、   
を返すメソッド、   java.io.InputStreamを、およびにそれを渡すと、   あなたのSAXベースのHTMLパーサます。

     

http://hc.apache.org/httpcomponents -client /チュートリアル/ HTML / fundamentals.html#d4e122する

     

あなたが必要なタグが表示されたら、   呼び出しを経由して要求を終了   HttpUriRequest#()メソッドを中止します。

     

http://hc.apache.org/httpcomponents -client /チュートリアル/ HTML / fundamentals.html#d4e285する

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top