我目前正在使用Selenium Webdriver,它运行良好,但它不是我想要的。我不喜欢Selenium Webdriver的事实是它运行一个真正的浏览器会话(我知道有一些方法可以在后台运行它)。是否还有其他使用xpath进行网页抓取的库?
答案 0 :(得分:1)
最好的框架是Scrapy。它有很多好东西,比如中间件,管道,蜘蛛。您可以单独使用它,也可以使用其他库,如Selenium,请求,代理等... 如果你想使用Selenium - PyVirtualDisplay将帮助你隐藏浏览器窗口