Вопрос

Как получить основную часть контента с веб-страницы?...я хочу получить только текст из тега body, все остальные теги в теле должны быть удалены...

Может кто-нибудь мне помочь?Заранее спасибо....

Нет правильного решения

Другие советы

Сначала выясните, в какой позиции в строке расположены теги тела.Затем удалите все перед открывающим тегом и все после закрывающего тега, используя методы NSString.

После этого вот как можно удалить HTML-теги из содержимого вашего тела:

http://www.objectpark.net/StrippingHTML.html

Когда вы совершаете вызов через NSURLConnection, вы получаете текстовые данные ASCII в форме NSMutableData с URL-адреса, который вы установили в NSURLRequest.

После этого вам придется проанализировать его только по строкам, удалив все остальные теги.Возможно, используя инструменты, упомянутые в предыдущем ответе.

Если вы используете UIWebView для загрузки и отображения, вы можете использовать его удобный метод. stringByEvaluatingJavaScriptFromString.

NSString *jsString = @"document.getElementsByTagName('body')[0].innerHTML;";
NSString *contentOfBody = [myWebView stringByEvaluatingJavaScriptFromString:jsString];

Это должно помочь в веб-представлении.Примечание. Возможно, я немного не согласен с javascript, но я использую тот же метод в своем приложении, и он прекрасно работает.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top