문제

웹페이지에서 콘텐츠 본문을 가져오는 방법?...body 태그에서 텍스트만 가져오고 싶습니다. body의 다른 모든 태그는 제거해야 합니다...

누구든지 나를 도와줄 수 있나요?미리 감사드립니다....

올바른 솔루션이 없습니다

다른 팁

먼저 문자열에서 body 태그가 어느 위치에 있는지 알아보세요.그런 다음 NSString 메서드를 사용하여 여는 태그 앞의 모든 항목과 닫는 태그 뒤의 모든 항목을 제거합니다.

그런 다음 본문 콘텐츠에서 HTML 태그를 제거하는 방법은 다음과 같습니다.

http://www.objectpark.net/StrippingHTML.html

nsurlConnection을 통해 호출하면 nsurlRequest에서 설정 한 URL에서 nsmutabledata 형식으로 ASCII 텍스트 데이터를받습니다.

거기에서 다른 모든 태그를 제거하고 문자열 만 구문 분석해야합니다. 아마도 이전 답변에 언급 된 도구를 사용합니다.

UIWebView를 사용하여로드 및 디스플레이를 사용하는 경우 편리한 방법을 사용할 수 있습니다. stringByEvaluatingJavaScriptFromString.

NSString *jsString = @"document.getElementsByTagName('body')[0].innerHTML;";
NSString *contentOfBody = [myWebView stringByEvaluatingJavaScriptFromString:jsString];

이것은 웹보기에서 트릭을 수행해야합니다. 참고 나는 Javescript에서 약간 떨어질 수 있지만 앱에서 동일한 방법을 사용하여 아름답게 작동합니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top