使用IPhone SDK获取HTML页面的特定部分?

时间:2012-11-22 09:51:25

标签: iphone html objective-c ios xcode

在我的应用中,我有一些网页的网址&我希望通过识别html标签来获得该URL(其html页面)中的特定部分/部分。

例如,我希望根据html源代码获得<div id="content"> to </div>部分。 这样我就可以将它保存在另一个文件中。

e.g。我的网址是

1) http://www.makepartsfast.com/2012/09/4337/more-3d-printing-in-metals-ex-one-introduces-the-m-flex-3d-printing-system/

2) http://www.windpowerengineering.com/policy/new-study-shows-the-benefits-of-wind-energy-in-kansas/

3) http://www.windpowerengineering.com/design/mechanical/bearings/podcast-for-windtech-2012-generator-maintenance/

所有这些网址都会打开文章html页面。但我想只显示HTML页面的主要内容

我还通过以下代码成功获取了一些URL。

我的代码:

NSString *originalString = [NSString stringWithContentsOfURL:[NSURL URLWithString:@"http://www.windpowerengineering.com/uncategorized/how-superfinishing-boosts-component-reliability/"] encoding:NSUTF8StringEncoding error:nil];

NSScanner *scanner = [NSScanner scannerWithString:originalString];
    NSString *extractedString = nil;


    [scanner scanUpToString:@"<div id=\"content\">" intoString:nil];
    [scanner scanString:@"<div id=\"content\">" intoString:nil];



    [scanner scanUpToString:@"<div style=\"clear:both;\">" intoString:&extractedString];


    if (extractedString) 
    {
        // string was extracted
        NSLog(@"%@", extractedString);
    }   

但是,不同的网页可能包含多个<div style=\"clear:both;\">标记。因此,当该方法遇到该标记时,它显示我只显示该标记之前的内容。

建议现在,我想要计算所有<div>标记并尝试从该HTML页面获取所有主要内容。但我很困惑这样做。

我该怎么做?

帮助我!!

谢谢..

1 个答案:

答案 0 :(得分:0)

我使用过AFFeedParsing方法。因为所有文章都是Feed。你在

上找到了示例代码
  1. cocoacontrols