如何从网页获取内容?...我想只从body标签中获取文本中的所有其他标签应删除...
任何人都可以帮助我吗? 提前谢谢....
答案 0 :(得分:1)
首先找出body标签所在字符串中的位置。然后使用NSString方法删除开始标记之前的所有内容以及结束标记之后的所有内容。
之后,这里是如何从您的正文内容中删除HTML标记:
答案 1 :(得分:1)
当您通过NSURLConnection进行呼叫时,您将从NSURLRequest中设置的URL中以NSMutableData的形式接收ASCII文本数据。
从那里你必须解析它只是字符串,删除所有其他标签。也许使用上一个答案中提到的工具。
答案 2 :(得分:0)
如果您正在使用UIWebView进行加载和显示,则可以使用其方便的方法stringByEvaluatingJavaScriptFromString
。
NSString *jsString = @"document.getElementsByTagName('body')[0].innerHTML;";
NSString *contentOfBody = [myWebView stringByEvaluatingJavaScriptFromString:jsString];
这应该可以在Web视图中实现。注意我的javescript可能有点偏差,但我在我的应用程序中使用了相同的方法,它的工作效果非常好。