HtmlAgilityPack获取呈现的HTML

时间:2013-12-05 07:19:18

标签: html html-agility-pack awesomium html-generation

我正在使用HTMLAgilityPack,我希望文档以网站上显示的方式显示。 意味着如果html元素具有可见性:display:none,我不希望在我的文档中使用该节点。

我有办法排除这样的节点有可见:无或隐藏??

e.g。

<div class="changeodlabel" style="display:none;"><span class="default">Should not be in document html</span></div>
<div class="changeodlabel" ><span class="default">Should be in document html</span></div>

1 个答案:

答案 0 :(得分:2)

Html Agility Pack没有关于CSS和Javascript的含义的概念,因此它只是解析HTML并让你决定如何处理它。如果您希望在抓取内容之前对页面进行全面评估,则需要更高级的HTML解析器。我想起了Awesonium。或者你可以包装PhantomJS(查看the ChutzPah sources to see how that can be done)。