所以......我得到了这个网站,我试着去抓,但据我所知,缺乏支持 机械化.js,以及需要启用javascript浏览器的存根站点 不是很好的混合...
我正在寻找有关如何做到这一点的想法......
答案 0 :(得分:0)
根据您的需要,您可以使用webkit来解析页面,这将允许您在执行javascript后获取最终的html。然后你可以使用任何像样的html解析器,例如beautifulsoup来完成剩下的工作。
答案 1 :(得分:0)
使用JavaScript我将Chickenfoot用于简单网站,Webkit用于更复杂的网站。