WebPage问题

时间:2009-05-30 05:29:50

标签: iphone

如何从网页获取内容?...我想只从body标签中获取文本中的所有其他标签应删除...

任何人都可以帮助我吗? 提前谢谢....

3 个答案:

答案 0 :(得分:1)

首先找出body标签所在字符串中的位置。然后使用NSString方法删除开始标记之前的所有内容以及结束标记之后的所有内容。

之后,这里是如何从您的正文内容中删除HTML标记:

http://www.objectpark.net/StrippingHTML.html

答案 1 :(得分:1)

当您通过NSURLConnection进行呼叫时,您将从NSURLRequest中设置的URL中以NSMutableData的形式接收ASCII文本数据。

从那里你必须解析它只是字符串,删除所有其他标签。也许使用上一个答案中提到的工具。

答案 2 :(得分:0)

如果您正在使用UIWebView进行加载和显示,则可以使用其方便的方法stringByEvaluatingJavaScriptFromString

NSString *jsString = @"document.getElementsByTagName('body')[0].innerHTML;";
NSString *contentOfBody = [myWebView stringByEvaluatingJavaScriptFromString:jsString];

这应该可以在Web视图中实现。注意我的javescript可能有点偏差,但我在我的应用程序中使用了相同的方法,它的工作效果非常好。