有谁能告诉我什么是最好的网页浏览器自动化框架/库?任务是打开Web浏览器页面,登录,执行一些长搜索,并将收集的信息保存到Excel。现在我在C#中使用IE引用,但在工作中我只能使用IE8。如果我已将其升级到IE9,但目标站点上的某些脚本开始处理错误。
我尝试使用awesomium,但据我所知,我无法借助它来解析页面。是否有任何变体以高速执行此操作? libs的大小 - 无所谓。
如果有任何与Scala兼容的解决方案,那就太棒了。
答案 0 :(得分:0)
正如om-nom-nom已经暗示的那样,你最好的选择可能是像selenium webdriver这样的webdriver实现。它有c#和java的绑定,可以使用IE,FF,Chrome,phantomjs(如果你想要无头的话很棒)和其他人。
请注意,直接使用webdriver收集信息可能不是最佳选择,尤其是在网站内容快速变化的情况下。在这种情况下,使用webdriver保存html页面源可能会很有用,然后切换到一些更高效的静态内容库,如JSoup。