当我使用NSXMLParser解析html文件时。我无法避免html文件中的空白。
例如
<html> <body><p>sample text. This is sample text </p></body></html>
在找到的字符函数中我也得到了空格。我不想要html标签内的空白区域。但我想要p标签中的空格和新行字符(也是h1,div等)。任何解决方案。
答案 0 :(得分:0)
如果您需要HTML标记中没有有用的信息,那么在解析时只需忽略它。
您可以单独解析<p>,<div>
个标记,这将自行删除空格。
例如
- (void)parser:(NSXMLParser *)parser didStartElement:(NSString *)elementName
namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qualifiedName
attributes:(NSDictionary *)attributeDict {
if([elementName isEqualToString:@"HTML"])
{
NSLog(@"ignore");
}