我需要提取网站的详细内容,同时保留该部门的所有格式。我想提取的部分是:
...
<div class="detailContent"><p>
<P dir=ltr><STRONG>Hinweis</strong>: Auf ... </p>
</div>
...
我目前的解决方案是使用libxml2和xpath中的HTMLParser来查找节点并遍历所有节点以重建这段HTML。这是一个漫长而复杂的代码。
我只是想知道是否有更简单的解决方案来提取部分HTML?
感谢。
答案 0 :(得分:2)
简单的Javascript解决方案:document.getElementsByClassName("detailContent")
将其与UIWebView对运行Javascript的支持相结合,您可能会有一个更简洁的解决方案。