如何将html文档视为字符串

时间:2013-07-18 04:25:58

标签: html ios uiwebview

我在我的应用中使用网络视图显示htm个文件,我希望能够对应用中的文件进行一些分析。例如,如果该文件是2009年的足球赛程,那么我想计算文件中“w”的数量,以获得该赛季的总胜利数。有任何想法吗? 我的意思是“htm”文件。

2 个答案:

答案 0 :(得分:0)

对你来说可能很有帮助

你可以从网页视图中获取html字符串。

 NSString *currentURL = [theWebView stringByEvaluatingJavaScriptFromString:@"document.getElementsByTagName('title')[0].innerHTML;"];

答案 1 :(得分:0)

您可以通过使用NSScanner类

解析html来实现
- (NSString *)flattenHTML:(NSString *)html {

    NSScanner *theScanner;
    NSString *text = nil;
    theScanner = [NSScanner scannerWithString:html];

    while ([theScanner isAtEnd] == NO) {

        [theScanner scanUpToString:@"<" intoString:NULL] ; 

        [theScanner scanUpToString:@">" intoString:&text] ;

        html = [html stringByReplacingOccurrencesOfString:[NSString stringWithFormat:@"%@>", text] withString:@""];
    }
    //
    html = [html stringByTrimmingCharactersInSet:[NSCharacterSet whitespaceAndNewlineCharacterSet]];

    return html;
}