从网址获取主要内容

时间:2015-02-22 15:47:35

标签: ios nsstring

我正在尝试构建像Pocket或Instapaper这样的iOS应用程序。所以,我需要从URL获取数据并删除它的HTML。我创建了下面的代码来执行此操作。

NSURL *url = [NSURL URLWithString:self.link];
NSString *webData= [NSString stringWithContentsOfURL:url];

NSLog(@"webData is: %@", webData);

NSString *finalhtmlstring = [NSString stringWithFormat:@"%@", webData];
finalhtmlstring = [finalhtmlstring stringByConvertingHTMLToPlainText];

NSLog(@"FinalHTMLString is: %@", finalhtmlstring);

我如何获取页面正文?我无法在NSString@"<body>"之间获得@"</body>",因为有些网站会在<body>代码中添加属性。

1 个答案:

答案 0 :(得分:1)

这听起来像解析XML或HTML页面。

幸运的是,像Hpple这样的开源库可以帮助您轻松地从包装器中获取内容。

使用Objective-C对象很好地包装libxml2

以下是关于如何使用此库的tutorial