请有人向我展示一个使用libxml解析一些HTML的简单示例。
#import <libxml2/libxml/HTMLparser.h>
NSString *html = @"<ul>"
"<li><input type=\"image\" name=\"input1\" value=\"string1value\" /></li>"
"<li><input type=\"image\" name=\"input2\" value=\"string2value\" /></li>"
"</ul>"
"<span class=\"spantext\"><b>Hello World 1</b></span>"
"<span class=\"spantext\"><b>Hello World 2</b></span>";
1)假设我要解析名称为= input2的输入值。
应输出“string2value”。
2)假设我想解析每个span = spantext标签的内部内容。
应输出:“Hello World 1”和“Hello World 2”。
答案 0 :(得分:19)
我使用Ben Reeves'HTML Parser来实现我想要的目标:
NSError *error = nil;
NSString *html =
@"<ul>"
"<li><input type='image' name='input1' value='string1value' /></li>"
"<li><input type='image' name='input2' value='string2value' /></li>"
"</ul>"
"<span class='spantext'><b>Hello World 1</b></span>"
"<span class='spantext'><b>Hello World 2</b></span>";
HTMLParser *parser = [[HTMLParser alloc] initWithString:html error:&error];
if (error) {
NSLog(@"Error: %@", error);
return;
}
HTMLNode *bodyNode = [parser body];
NSArray *inputNodes = [bodyNode findChildTags:@"input"];
for (HTMLNode *inputNode in inputNodes) {
if ([[inputNode getAttributeNamed:@"name"] isEqualToString:@"input2"]) {
NSLog(@"%@", [inputNode getAttributeNamed:@"value"]); //Answer to first question
}
}
NSArray *spanNodes = [bodyNode findChildTags:@"span"];
for (HTMLNode *spanNode in spanNodes) {
if ([[spanNode getAttributeNamed:@"class"] isEqualToString:@"spantext"]) {
NSLog(@"%@", [spanNode allContents]); //Answer to second question
}
}
[parser release];
答案 1 :(得分:1)
正如弗拉基米尔所说,第二点重要的是用内容替换rawContents。 rawContents将打印完整的原始文本节点,即:
<span class='spantext'><b>Hello World 1</b></span>