Question

我需要提取网站的详细内容，同时保留该部门的所有格式。我想提取的部分是：

...
<div class="detailContent"><p>
<P dir=ltr><STRONG>Hinweis</strong>: Auf ... </p>
</div> 
...

我目前的解决方案是使用libxml2和xpath中的HTMLParser来查找节点并遍历所有节点以重建这段HTML。这是一个漫长而复杂的代码。

我只是想知道是否有更简单的解决方案来提取部分HTML？

感谢。

Answer 1

简单的Javascript解决方案：document.getElementsByClassName("detailContent")

将其与UIWebView对运行Javascript的支持相结合，您可能会有一个更简洁的解决方案。