Pregunta

Cómo conseguir el cuerpo de los contenidos de la página web? ... quiero obtener sólo el texto de la etiqueta del cuerpo todas las otras etiquetas en el cuerpo deben ser quite ...

Puede alguien ayudarme? Gracias de antemano ....

No hay solución correcta

Otros consejos

En primer lugar averiguar cuál es la posición en la cadena de las etiquetas del cuerpo se encuentran. A continuación, retire todo antes de la etiqueta de apertura y todo después de la etiqueta de cierre utilizando métodos NSString.

Después de eso, aquí es cómo tira las etiquetas HTML de su contenido del cuerpo:

http://www.objectpark.net/StrippingHTML.html

Cuando se hace una llamada a través de NSURLConnection que recibirá los datos de texto ASCII en forma de NSMutableData desde la URL que ha establecido en NSURLRequest.

A partir de ahí tendrá que analizarlo por sólo las cadenas, la eliminación de todas las otras etiquetas. Tal vez el uso de las herramientas mencionadas en la respuesta anterior.

Si estás usando un UIWebView a cargar y mostrar que usted podría utilizar su método práctico stringByEvaluatingJavaScriptFromString.

NSString *jsString = @"document.getElementsByTagName('body')[0].innerHTML;";
NSString *contentOfBody = [myWebView stringByEvaluatingJavaScriptFromString:jsString];

Esto debería hacer el truco en una vista Web. Tenga en cuenta que podría ser un poco más pequeña con la javescript, pero yo uso este mismo método en mi aplicación y funciona muy bien.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top