質問

どのようにWebページのコンテンツの本文を取得する?...私は身体内の他のすべてのタグを削除する必要があります... bodyタグからテキストのみを取得したい。

いずれかが私を助けることができますか? 事前のおかげで....

正しい解決策はありません

他のヒント

まずbodyタグが配置されている文字列のどの位置を見つけます。そして、NSStringのメソッドを使用して終了タグの後に開始タグとすべての前に、すべてを削除します。

その後、ここにあなたの体の内容からHTMLタグを除去する方法は次のとおりです。

http://www.objectpark.net/StrippingHTML.htmlする

あなたはNSURLConnectionを経由して電話をかけるときは、

あなたはNSURLRequestで設定したURLからNSMutableDataの形式でASCIIテキストデータを受け取ります。

そこから、他のすべてのタグを削除し、文字列だけのためにそれを解析する必要があります。おそらく、前の回答で述べたツールを使用します。

あなたがロードし、表示するためのUIWebViewを使用している場合は、

あなたは、その便利なメソッドstringByEvaluatingJavaScriptFromStringを使用することができます。

NSString *jsString = @"document.getElementsByTagName('body')[0].innerHTML;";
NSString *contentOfBody = [myWebView stringByEvaluatingJavaScriptFromString:jsString];

これは、Webビューでトリックを行う必要があります。私はjavescriptでほんの少しオフになる場合もありますが、私は私のアプリでこれと同じ方法を使用して、それが見事に機能します。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top