Вопрос
Как получить основную часть контента с веб-страницы?...я хочу получить только текст из тега body, все остальные теги в теле должны быть удалены...
Может кто-нибудь мне помочь?Заранее спасибо....
Нет правильного решения
Другие советы
Сначала выясните, в какой позиции в строке расположены теги тела.Затем удалите все перед открывающим тегом и все после закрывающего тега, используя методы NSString.
После этого вот как можно удалить HTML-теги из содержимого вашего тела:
Когда вы совершаете вызов через NSURLConnection, вы получаете текстовые данные ASCII в форме NSMutableData с URL-адреса, который вы установили в NSURLRequest.
После этого вам придется проанализировать его только по строкам, удалив все остальные теги.Возможно, используя инструменты, упомянутые в предыдущем ответе.
Если вы используете UIWebView для загрузки и отображения, вы можете использовать его удобный метод. stringByEvaluatingJavaScriptFromString
.
NSString *jsString = @"document.getElementsByTagName('body')[0].innerHTML;";
NSString *contentOfBody = [myWebView stringByEvaluatingJavaScriptFromString:jsString];
Это должно помочь в веб-представлении.Примечание. Возможно, я немного не согласен с javascript, но я использую тот же метод в своем приложении, и он прекрасно работает.