需要使用Mechanize + BeautifulSoup(Python)启用Javascript的抓取网站

时间:2010-11-06 17:24:37

标签: javascript python screen-scraping mechanize

所以......我得到了这个网站,我试着去抓,但据我所知,缺乏支持 机械化.js,以及需要启用javascript浏览器的存根站点 不是很好的混合...

我正在寻找有关如何做到这一点的想法......

网址:https://members.iracing.com/membersite/login.jsp

2 个答案:

答案 0 :(得分:0)

根据您的需要,您可以使用webkit来解析页面,这将允许您在执行javascript后获取最终的html。然后你可以使用任何像样的html解析器,例如beautifulsoup来完成剩下的工作。

答案 1 :(得分:0)

使用JavaScript我将Chickenfoot用于简单网站,Webkit用于更复杂的网站。