我想知道Mozenda Screen Scraper是如何编码的?
http://www.mozenda.com/screen-scraper
我展示了一个浏览器,用户可以在其中选择要废弃的字段,并从中创建一个抓取脚本。
抓取脚本生成部分对我来说很清楚,我想知道它是否记录了用户在浏览器中执行的用户操作。
我想用C#做类似的事情。
答案 0 :(得分:2)
我猜他们在后端运行类似iMacros的东西。我甚至在他们的一些截图中注意到了iMacros浏览器图标; - )
如果你想在C#中编写类似的东西, IE webbrowser control 是最好的起点!
答案 1 :(得分:2)
@ yc08m,我可以肯定地说他们没有使用iMacros。它全部用自己的专有代码编码。
答案 2 :(得分:2)
我意识到这是一篇非常过时的帖子,但他们似乎非常依赖XPath,所以首先你需要将页面加载到一个可以查询的对象中。我建议使用像Html Agility pack这样的东西来实现这个目标。