如何获取网站的HTML并使用NSXMLParser解析它

时间:2014-08-29 18:55:41

标签: ios afnetworking nsxmlparser

我正在尝试从网站解析XML(例如" http://www.kick-girl.com/?cat=3")

我可以使用以下方式轻松获取XML:

 NSURL *url = [NSURL URLWithString:@"http://www.kick-girl.com/?cat=3"];
 NSLog(@"%@", [NSString stringWithContentsOfURL:url encoding:NSUTF8StringEncoding error:nil]);

然而,当我尝试使用NSXMLParser时,它根本不起作用。我已经尝试将字符串转换为数据

NSString *s = [NSString stringWithContentsOfURL:url encoding:NSUTF8StringEncoding error:nil];
NSData *d = [s dataUsingEncoding:NSUTF8Encoding];
NSXMLParser *xmlparser = [NSXMLParser alloc] initWithData:d];
xmlparser.delegate = self;
[xmlparser parse];

它仍然不起作用。不会调用NSXMLParserDelegate方法。 e.g。

- (void)parser:didStartElement:namespaceURI:qualifiedName:attributes:

我也尝试过使用AFnetworking来查看是否有帮助

NSURLRequest *request = [NSURLRequest requestWithURL:url];

AFHTTPRequestOperation *requestOp = [[AFHTTPRequestOperation alloc] initWithRequest:request];

requestOp.responseSerializer = [AFXMLParserResponseSerializer serializer];
[requestOp.responseSerializer setAcceptableContentTypes:[NSSet setWithObjects:@"application/xml", @"text/xml", @"text/html", nil]];
[requestOp setCompletionBlockWithSuccess:^(AFHTTPRequestOperation *operation, id responseObject) {
    NSXMLParser *xmlparser = responseObject;

    xmlparser.delegate = self; 
    [xmlparser parse]; //Delegate methods are not called for some reason...
} failure:^(AFHTTPRequestOperation *operation, NSError *error) {
    NSLog(@"OOPS: %@", error);
}];
[requestOp start];

我不明白这是什么问题。

我从-parser得到一个解析错误:parserErrorOccurred:

Error Domain=NSXMLParserErrorDomain Code=65 "The operation couldn’t be completed. (NSXMLParserErrorDomain error 65.)" UserInfo=0x8da6ce0 {NSXMLParserErrorLineNumber=2, NSXMLParserErrorColumn=17, NSXMLParserErrorMessage=attributes construct error

}

我该如何解决这个问题?

1 个答案:

答案 0 :(得分:0)

显然,我从网页上获取的XML并不完美,并且有一些奇怪的东西。虽然在浏览xml时,Web浏览器非常宽容,但nsxmlparser非常严格。

为了防止这些奇怪的东西出来,我只需要一个我想要的部分的子串,然后删除空格,如新行回车和制表符。并做了一些字符串操作以确保标签实际上是平衡的。