在iOS中处理复杂的HTML

时间:2014-12-21 15:30:30

标签: html ios parsing hpple

如何在iOS中解析带有hpple的许多子标签的复杂html。我找不到任何关于这个库的好的和复杂的教程或任何好的文档。通过简单的解析,没有任何问题。 html的例子是:

<div class="post shortcuts_item focus" id="post_243273">
<div class="published">today in 21:03</div>
<h1 class="title">
    <a href="http://example.ru/post/243273/" class="post_title">Some simple title text here</a>
</h1>

<div class="hubs">
    <a href="http://example.ru/hub/internet_regulation/" class="hub">Simple text 1</a><span class="profiled_hub" title="Profile 1">*</span>, 
    <a href="http://example.ru/hub/business-laws/" class="hub">Simple text 2</a><span class="profiled_hub" title="Profile 2">*</span>, 
    <a href="http://example.ru/hub/vkontakte/" class="hub">Simple text 3</a><span class="profiled_hub" title="Profile 3">*</span>, 
    <a href="http://example.ru/hub/social_networks/" class="hub">Simple text 4</a><span class="profiled_hub" title="Profile 4">*</span>, 
    <a href="http://example.ru/hub/facebook/" class="hub">Simple text 5</a><span class="profiled_hub" title="Profile 5">*</span>
</div>
<div class="content html_format">
    <img src="//example.org/files/aa9/f6c/8a0/aa9f6c8a049e405c9f72bf10ee3a2e9f.png"><br>
    <br>
    Simple but very long text with link tag  <a href="http://example.ru/post/243273/#blahblah">Simple link...</a>
    <div class="buttons">
        <a href="http://example.ru/post/243273/#habracut">Read more...</a>
    </div>
    <div class="clear"></div>   
</div>
</div>

问题是如何通过一次运行获取A内的所有class="hubs"个标签。我怎么能这样做?

1 个答案:

答案 0 :(得分:1)

您可以使用//搜索语法搜索HTML中的任何位置,然后使用@class='xxx'语法搜索特定类的标记。因此,您可以搜索//a[@class='hub']//div[@class='hubs']/a

TFHpple *parser = [TFHpple hppleWithHTMLData:data];
NSArray *nodes = [parser searchWithXPathQuery:@"//a[@class='hub']"];
for (TFHppleElement *element in nodes) {
    NSString *href = [element attributes][@"href"];
    NSString *content = [element content];
    NSLog(@"%@ -> %@", href, content);
}

请参阅Ray Wenderlich网站上的How to Parse HTML on iOS