网页刮不使用浏览器控件?

时间:2016-08-18 19:19:01

标签: c# vb.net html-agility-pack

我有一个SharePoint网站,我目前有一个使用VB编写并使用Web浏览器控件的webscrape工具。它的速度令人难以置信,我希望更新它。我们可以使用一些工具包(如HTMLAgilityPack)将文档加载到DOM中,只使用html元素粘贴/单击按钮而不必加载实际的网页来处理它吗?

1 个答案:

答案 0 :(得分:0)

一种可能的解决方案是使用名为selenium web driver的Nuget包。这个软件包的功能是控制你的浏览器(IE,Firefox,Safari,Chrome等),它就像一个Web浏览器控件。在某些情况下,使用selenium可能与Web浏览器控件一样慢。您提到使用HTML敏捷包等软件包;这可行,但你错了,事实是它仍然会加载页面;你只是没有看到它。

以下是有关如何使用selenium

的链接