我正在使用HTMLAgilityPack,我希望文档以网站上显示的方式显示。 意味着如果html元素具有可见性:display:none,我不希望在我的文档中使用该节点。
我有办法排除这样的节点有可见:无或隐藏??
e.g。
<div class="changeodlabel" style="display:none;"><span class="default">Should not be in document html</span></div>
<div class="changeodlabel" ><span class="default">Should be in document html</span></div>
答案 0 :(得分:2)
Html Agility Pack没有关于CSS和Javascript的含义的概念,因此它只是解析HTML并让你决定如何处理它。如果您希望在抓取内容之前对页面进行全面评估,则需要更高级的HTML解析器。我想起了Awesonium。或者你可以包装PhantomJS(查看the ChutzPah sources to see how that can be done)。