Hows Mozenda Screen Scraper编码?

时间:2010-12-05 18:57:17

标签: screen-scraping web-crawler web-scraping

我想知道Mozenda Screen Scraper是如何编码的?

http://www.mozenda.com/screen-scraper

我展示了一个浏览器,用户可以在其中选择要废弃的字段,并从中创建一个抓取脚本。

抓取脚本生成部分对我来说很清楚,我想知道它是否记录了用户在浏览器中执行的用户操作。

我想用C#做类似的事情。

3 个答案:

答案 0 :(得分:2)

我猜他们在后端运行类似iMacros的东西。我甚至在他们的一些截图中注意到了iMacros浏览器图标; - )

如果你想在C#中编写类似的东西, IE webbrowser control 是最好的起点!

答案 1 :(得分:2)

@ yc08m,我可以肯定地说他们没有使用iMacros。它全部用自己的专有代码编码。

答案 2 :(得分:2)

我意识到这是一篇非常过时的帖子,但他们似乎非常依赖XPath,所以首先你需要将页面加载到一个可以查询的对象中。我建议使用像Html Agility pack这样的东西来实现这个目标。