我正在尝试构建像Pocket或Instapaper这样的iOS应用程序。所以,我需要从URL获取数据并删除它的HTML。我创建了下面的代码来执行此操作。
NSURL *url = [NSURL URLWithString:self.link];
NSString *webData= [NSString stringWithContentsOfURL:url];
NSLog(@"webData is: %@", webData);
NSString *finalhtmlstring = [NSString stringWithFormat:@"%@", webData];
finalhtmlstring = [finalhtmlstring stringByConvertingHTMLToPlainText];
NSLog(@"FinalHTMLString is: %@", finalhtmlstring);
我如何获取页面正文?我无法在NSString
和@"<body>"
之间获得@"</body>"
,因为有些网站会在<body>
代码中添加属性。